当前位置: 首页 > news >正文

python 语音识别方案对比

目录

一、语音识别

二、代码实践

2.1 使用vosk三方库

2.2 使用SpeechRecognition

2.3 使用Whisper


一、语音识别

今天识别了别人做的这个app,觉得虽然是个日记app 但是用来学英语也挺好的,能进行语音识别,然后矫正语法,自己说的时候 ,实在不知道怎么说可以先乱说,然后后续矫正,在把这个不会的点学起来。然后我就研究了下语音识别的技术方案。

语音识别(Speech Recognition)是一种将人类语音转换为可理解的文本或指令的技术。它的核心原理是通过对声音信号进行捕捉、特征提取和模式匹配,将语音信号映射到相应的文字或指令上。常见的语音识别应用包括:

  1. 语音助手:如苹果的Siri、谷歌助手、小度等,可根据语音指令执行任务,回答问题。
  2. 智能家居控制:通过语音

http://www.mrgr.cn/news/89913.html

相关文章:

  • 快速在wsl上部署学习使用c++轻量化服务器-学习笔记
  • JVM与Java体系结构
  • STM32CubeMX6.13.0打开后不显示界面,但是任务管理器显示该程序正在运行
  • ORB-SLAM2源码学习:Initializer.cc(13): Initializer::ReconstructF用F矩阵恢复R,t及三维点
  • windows 极速安装 Linux (Ubuntu)-- 无需虚拟机
  • ChatGPT 写作系列
  • AI大模型零基础学习(1):大模型使用篇
  • JavaScript 复习
  • Linux ftrace 内核跟踪入门
  • 【算法】动态规划专题⑦ —— 多重背包问题 + 二进制分解优化 python
  • #渗透测试#批量漏洞挖掘#微商城系统 goods SQL注入漏洞
  • C++ Primer 成员访问运算符
  • 快速在wsl上部署学习使用c++轻量化服务器-学习笔记
  • 【自开发工具介绍】SQLSERVER的ImpDp和ExpDp工具演示04
  • 私有化部署DeepSeek并SpringBoot集成使用(附UI界面使用教程-支持语音、图片)
  • C++ Primer 递增和递减运算符
  • 120,【4】 攻防世界 web Confusion1(jinja2)
  • 介绍10个比较优秀好用的Qt相关的开源库
  • 音频进阶学习十二——Z变换一(Z变换、收敛域、性质与定理)
  • [论文阅读] Knowledge Fusion of Large Language Models
  • 图解BWT(Burrows-Wheeler Transform) 算法
  • DeepSeek与人工智能的结合:探索搜索技术的未来
  • Linux之安装docker
  • 学习数据结构(6)单链表OJ
  • 机器学习中常用的评价指标
  • Vue(4)