当前位置：首页 > news >正文

python 语音识别方案对比

news 2025/2/9 2:06:55

目录

一、语音识别

二、代码实践

2.1 使用vosk三方库

2.2 使用SpeechRecognition

2.3 使用Whisper

一、语音识别

今天识别了别人做的这个app，觉得虽然是个日记app 但是用来学英语也挺好的，能进行语音识别，然后矫正语法，自己说的时候，实在不知道怎么说可以先乱说，然后后续矫正，在把这个不会的点学起来。然后我就研究了下语音识别的技术方案。

语音识别（Speech Recognition）是一种将人类语音转换为可理解的文本或指令的技术。它的核心原理是通过对声音信号进行捕捉、特征提取和模式匹配，将语音信号映射到相应的文字或指令上。常见的语音识别应用包括：

语音助手：如苹果的Siri、谷歌助手、小度等，可根据语音指令执行任务，回答问题。
智能家居控制：通过语音

http://www.mrgr.cn/news/89913.html

相关文章：

快速在wsl上部署学习使用c++轻量化服务器-学习笔记

JVM与Java体系结构

STM32CubeMX6.13.0打开后不显示界面，但是任务管理器显示该程序正在运行

ORB-SLAM2源码学习：Initializer.cc(13): Initializer::ReconstructF用F矩阵恢复R，t及三维点

windows 极速安装 Linux （Ubuntu）-- 无需虚拟机

ChatGPT 写作系列

AI大模型零基础学习（1）：大模型使用篇

JavaScript 复习

Linux ftrace 内核跟踪入门

【算法】动态规划专题⑦ —— 多重背包问题 + 二进制分解优化 python

#渗透测试#批量漏洞挖掘#微商城系统 goods SQL注入漏洞

C++ Primer 成员访问运算符

快速在wsl上部署学习使用c++轻量化服务器-学习笔记

【自开发工具介绍】SQLSERVER的ImpDp和ExpDp工具演示04

私有化部署DeepSeek并SpringBoot集成使用（附UI界面使用教程-支持语音、图片）

C++ Primer 递增和递减运算符

120，【4】攻防世界 web Confusion1（jinja2）

介绍10个比较优秀好用的Qt相关的开源库

音频进阶学习十二——Z变换一（Z变换、收敛域、性质与定理）

[论文阅读] Knowledge Fusion of Large Language Models

图解BWT(Burrows-Wheeler Transform) 算法

DeepSeek与人工智能的结合：探索搜索技术的未来

Linux之安装docker

学习数据结构（6）单链表OJ

机器学习中常用的评价指标