实战合成语音文本TTSwindows(接口转换语音文本合成)「语音合成工具tts」

(此处已添加书籍卡片,请到今日头条客户端查看)本篇目录(大约需要花费3分钟):1、背景2、实践3、反思一下4、转换方法实现5、重新尝试总结,1、背景今天要做一个文本转语音接口,研究了一天TTSs,不想使用花钱的接口,不想放弃,尝试了python使用pyttsx3方式实现在windows上实验还可以,但是linux上的结果不尽人意,特别不满意。
所以今天写下感受。
最终先使用了讯飞的语音合成api,先完成接口开发,后面有时间再研究其他的方式2、实现过程首先就是查找资料并实现pyttsx3是Python中的文本到语音转换库。
与其他库不同,它可以脱机工作,并且与Python 2和3兼容实现步骤如下:第一步:安装库(centos 、debian 需要还安装 espeak,ffmpeg,否则转换时会报错)pip3 install pyttsx3第二步实现的代码:import pyttsx3engine = pyttsx3.init() # object creation""" 把语音存储到文件 """engine.save_to_file("Hello World!!!",'~/abc.mp3')"""更改速率"""rate = engine.getProperty('rate') # getting details of current speaking rateprint (rate) #printing current voice rateengine.setProperty('rate', 125) # setting up new voice rate"""更改音量"""volume = engine.getProperty('volume') #getting to know current volume level (min=0 and max=1)print (volume) #printing current volume levelengine.setProperty('volume',1.0) # setting up volume level between 0 and 1"""更改声音"""voices = engine.getProperty('voices') #得到当前voices的详情#engine.setProperty('voice', voices[0].id) #改变下标,可以更换vocie,转换男声和女声#engine.setProperty('voice', 'zh') #linux 转换中文,使用此voive,同时支持英文engine.setProperty('voice', voices[1].id) #改变下标,可以更换vocieengine.say("Hello World!")engine.say('My current speaking rate is ' + str(rate))engine.runAndWait()engine.stop()以上内容转自:https://www.jianshu.com/p/1a5f5d450c12在windows上和linux上都能实现,但是linux上的voice和windows的不一样,导致转出的效果差别很大。
最终linux服务器上不是很满意。
因为没有现成的windows服务器,暂时放弃了这种方案。
3、反思一下为什么会出现windows上和linux上的不同,我去查找了官网,发现了一段话,翻译过来就是 Windows上使用的是sapi5语音合成引擎,Mac OS X上是nsspeech合成器,eSpeak 其他平台上使用,即,linux上使用的espeak。
4、转换方法实现为了完成目前的接口开发,我使用了讯飞语音合成,新用户(企业用户)一年有50万的免费使用,那么我先使用讯飞的api实现接口。
昨天发了个微头条,发现很多人对这个感兴趣,所以就总结下,发下自己的感受。
5、重新尝试总结这次进行了tts的尝试,没有成功使用pyttsx3实现我的接口开发,但是收获了很多。
比如发现了一个网站可以免费的转换,也发现了微软接口的一个实现。
如果大家感兴趣的,可以在评论区留言“666”,我下期分享下自己找到的资料。
实战合成语音文本TTSwindows(接口转换语音文本合成)
(图片来源网络,侵删)

联系我们

在线咨询:点击这里给我发消息