当前位置: 首页 > news >正文

语音合成(自然、非自然)

1.环境

Python 3.10.14

2.完成代码

2.1简陋版


import pyttsx3# 初始化tts引擎
engine = pyttsx3.init()# 设置语音速度
rate = engine.getProperty('rate')
engine.setProperty('rate', rate - 50)# 设置语音音量
volume = engine.getProperty('volume')
engine.setProperty('volume', volume + 0.5)if __name__ == '__main__':engine.say("我的包子很好吃,你想吃吗")engine.runAndWait()engine.stop()

2.2惊艳版(目前仅支持在Linux操作系统上使用,暂不支持Windows及Mac使用)

text = '待合成文本'
model_id = 'damo/speech_sambert-hifigan_tts_zh-cn_16k'
sambert_hifigan_tts = pipeline(task=Tasks.text_to_speech, model=model_id)
output = sambert_hifigan_tts(input=text, voice='zhitian_emo')
wav = output[OutputKeys.OUTPUT_WAV]
with open('output.wav', 'wb') as f:f.write(wav)

3.效果

传不了语音,语音效果还是蛮不错的
在这里插入图片描述

4.问题

1.在Linux上运行的效果很好,普通的能跑的版本效果不行
2.模型可去模型资源网站搜索下载(也可私信)


http://www.mrgr.cn/news/34081.html

相关文章:

  • C语言数据结构与算法--简单实现队列的入队和出队
  • C++:线程(thread)的创建、调用及销毁
  • HTTP 客户端怎么向 Spring Cloud Sleuth 传输跟踪 ID
  • EN 1335-2办公家具.办公椅.第2部分:安全要求
  • 力扣.15 三数之和 three-sum
  • 机器情绪及抑郁症算法
  • doris的be节点buff/cache 持续增大问题
  • 神经网络(一):神经网络入门
  • 【C语言进阶】第四节:自定义类型详解
  • LDO选型
  • HarmonyOS---权限和http/Axios网络请求
  • JMeter(需要补充请在留言区发给我,谢谢)
  • docker部署Stirling-PDF
  • es高级查询——多字段聚合
  • 75、Python之函数式编程:生成器的核心方法及更多使用场景
  • 文科生学pytorch——一些概念的解释
  • layui upload.render 设置文件名
  • 基于Python+SQLServer实现(界面)书店销售管理管理子系统
  • 关于在vue2中给el-input框的placeholder加样式
  • CPLD 工程师面试题
  • AI美女占领小红书,卷翻真人女网红
  • HTML5简介的水果蔬菜在线商城网站源码系列模板3
  • Oracle数据库高级技术解析与实战案例
  • 【AIGC】ChatGPT提示词助力高效文献处理、公文撰写、会议纪要与视频总结
  • 详解运行时安全检测神器:Falco
  • [leetcode]70_单词搜索