当前位置：首页 > news >正文

ASR-LLM-TTS 实时语音对话助手:语音识别、大模型对话、声音生成

news 2025/4/4 7:28:54

参考：https://blog.csdn.net/weixin_42357472/article/details/137020794

asr：funasr-SenseVoiceSmall 离线
llm：deepseek 在线api
tts：edge-tts 在线api


import pyaudio
import wave
import threading
import numpy as np
import time
from queue import Queue
import webrtcvad
import os
import threading
import requests
import json
from funasr import AutoModel
import pygame
import edge_tts
import asyncio
from time import sleep
import langid
from langdetect import detect
import re
from pypinyin import pinyin, Style
from modelscope.pipelines import pipeline
from openai import OpenAI# --

http://www.mrgr.cn/news/80540.html

相关文章：

算法题（7）：n进制乘法表

kubeadm_k8s_v1.31高可用部署教程

DATA-HUB 安装与启动：

vertx idea快速使用

Qt WORD/PDF（二）使用 QtPdfium库实现 PDF操作、打印等

生产环境迁移——harbor篇

VCU--新能源汽车VCU电控开发

linux ibus rime 中文输入法，快速设置为：默认简体（****)

[创业之路-198]：华为的成立发展与新中国的建立与发展路径的相似性比较

Windows系统VSCode 搭建ESP-IDF环境

【Vue.js 3.0】provide 、inject 函数详解

单步调试Android Framework——App冷启动

SAM大模型实践（一）

HCIA-Access V2.5_4_1_1路由协议基础_IP路由表

车牌识别之二：车牌OCR识别(包含全部免费的数据集、源码和模型下载）

Chinese-Clip实现以文搜图和以图搜图

Qt WORD/PDF（四）使用 QAxObject 对 Word 替换（QWidget）

使用 DeepSpeed 微调 OPT 基础语言模型

【并发容器】ConcurrentLinkedQueue：优雅地实现非阻塞式线程安全队列