本篇内容介绍了“Python第三方库gTTs/pyttsx3/speech怎么使用”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!
Python文字转语音(调研&成品函数)
由于项目需要, 我需要将文字转换为语音, 那么第一步就要进行调研
什么是语音合成技术?
语音合成(text to speech),简称TTS。是将文字转化为语音的一种技术,是让计算机模拟人类的嘴巴,通过不同的音色说出想表达的内容, 是人机对话的一部分。
TTS可以通过神经网络的设计,把文字智能地转化为自然语音流。极大的方便了视障患者的使用, 也提升了文本的可读性。TTS应用包括语音驱动的硬件以及声音敏感系统,并常与声音识别程序一起使用。
现在许多厂家都推出了自己的语音合成服务或API, 大家也可以去自行查看, 本文仅做了python环境下语音合成第三方库的调研
如何用代码实现?
如前文所述, 虽然市面上产品繁多, 但是作为一个开发者, 我想要一款免费的, 可代码调试的工具, 经过查找材料, 我找到了gTTs库、pyttsx3库、speech库都能满足我的需求, 来做个横向对比, 可以让大家少走弯路。
第三方库名称 | 需要联网 | 支持中英文 | 支持日语 | 可调节语速 | 像人声程度 |
---|---|---|---|---|---|
ggts | √ | √ | √ | X | 很像导航 |
pyttsx3 | X | √ | X | √ | 适合读小说 |
speech | X | √ | X | X | 很像快一点的导航 |
gTTS库
gTTS库 (Google Text-to-Speech) : 用于与 Google Translate 的文本转语音 API 进行交互。将语音mp3数据写入文件
优点 : 支持包括中英日文在内的多种语言, 有谷歌翻译API的加持, 人声蛮好听
缺点 : 不支持语速调节, 每次使用必须科学上网, 不能单机使用
在语音播放功能, 我们选用了两种方法
第一种是playsound库自动播放音频(不可调播放进度)
第二种是os库调用系统自带播放器(可调节进度)
请看playsound库播放 & GTTS库转文字函数
# 函数功能: 用gtts库阅读文本,保存为.mp3文件后, 用系统内置的浏览器阅读出来, 打开mp3文件, 函数执行结束(播放方式为os库)
def gtts_os_debug(text,mp3_filepath,language):#参数说明:参数1是朗读的文字,参数2是保存路径,参数3是数字{0英文,1中文,2日语}
#大成功,可惜的是os调用自带播放器, 实际上只执行了"打开mp3"的操作, 它并不会在音频播报完后再进行下一条语句
from gtts import gTTS
import os
# 已知zh-tw版本违和感较高,所以我们用zh-CN来进行后续工作
if int(language) ==0 :
s = gTTS(text=text, lang='en', tld='com')
# s = gTTS(text=text, lang='en', tld='co.uk')#我比较喜欢美音,但是如果你喜欢英国口音可以尝试这个
elif int(language) ==1 :
s = gTTS(text=text, lang='zh-CN')
elif int(language) ==2 :
s = gTTS(text=text, lang='ja')
try:
s.save(mp3_filepath)
except:
os.remove(mp3_filepath)
print(mp3_filepath,"文件已经存在,但是没有关系!已经删掉了")
s.save(mp3_filepath)
print(mp3_filepath,"保存成功")
os.system(mp3_filepath)#调用系统自带的播放器播放MP3
gtts_os_debug(text="I'm gtts library,from google Artificial Intelligence & Google Translate.",mp3_filepath="gtts英文测试.mp3",language=0)
gtts_os_debug(text="我是gtts库, 你想听听我的声音吗",mp3_filepath="gtts中文测试.mp3",language=1)
gtts_os_debug(text="真
版权声明:除特别声明外,本站所有文章皆是本站原创,转载请以超链接形式注明出处!