基于微软语音合成技术开发的免费在线的文字转语音工具

基于微软语音合成技术开发的免费在线的文字转语音工具

前言说明

目前市面上的文字转语音项目还是挺多的,不过很多转换后都达不到我们理想的效果,唯独一款良心且好用的应该当属微软旗下的语言认知服务了,不过需要认证万事达或者visa信用卡,这一步就难倒了很多国内用户了,因为我们大家就算有信用卡也多半是国内的,所以很多人都为之头疼,基于以上残酷的事实所以我们开发了一款在线免费使用的在线文字转语音工具供大家使用!

基于微软语音合成技术开发的免费在线的文字转语音工具插图
在线的文字转语音工具

源码下载

免注册使用版,调用的官方接口,所以可以免费使用,但接口不是很稳定,注册版是独立的key,主要区别就这个,所以自己看需要哪一个!

功能说明

目前开发的功能是采用官方的TTS接口,功能上和azure官网的基本一致,该有的功能都有,就比如:语言选择、全功能人物、发音语气、音速调节、音调调节等等,而且也支持SSML高级功能,这个功能可以说是最强的存在,支持多人配音,不管是用来为自己的剪辑视频配音还是门店的大促销配音亦或是为小说配音,都是强大的存在!

常用事件

这里我们会单独写一篇微软文字转语音(语音合成)常用事件的处理说明,如:停顿说明、多音字处理,请点击下面按钮查看详细的说明和解释

微软文字转语音常用事件处理

我们新增了一个批量停顿,默认会在”。?!;“自动添加停顿,停顿时间可选

如何使用

基本使用:

一般文本模式很简单,文字打上去或复制后粘贴上去,然后设置各个参数,先点击“试听播放”等待预加载,预加载完成后,按钮就会变为“立即下载”,然后下载即可,没什么难的。

高级模式:

文本转语音SSML模式,大家可以点击文本转语音工具页的SSML选项看看,然后我们依葫芦画瓢即可,默认的是单人模式,看默认的就好,下面看看如何使用多人模式,多人模式同样可设置各个选项,不过是以代码的格式,就比如(可复制进SSML里试听):

单人样本参考

<speak xmlns="http://www.w3.org/2001/10/synthesis" xmlns:mstts="http://www.w3.org/2001/mstts" xmlns:emo="http://www.w3.org/2009/10/emotionml" version="1.0" xml:lang="en-US">
	<voice name="zh-CN-YunyangNeural">
		<mstts:express-as style="narration-professional">
			<prosody rate="24%" pitch="0%"> 就在云韵脸颊苍白略微变淡时,萧炎却是陡然收回目光,眼中那一霎的柔软在顷刻间消失殆尽,取备代之的,是极其浓郁的狠厉与杀意,他早就说过,没有任何人能够阻止他击杀云山,即便这人,是与他关系颇为复杂的云韵!</prosody>
		</mstts:express-as>
	</voice>
</speak>

 

多人样本参考

<speak xmlns="http://www.w3.org/2001/10/synthesis" xmlns:mstts="http://www.w3.org/2001/mstts" xmlns:emo="http://www.w3.org/2009/10/emotionml" version="1.0" xml:lang="en-US">
	<voice name="zh-CN-YunyangNeural">
		<mstts:express-as style="narration-professional">
			<prosody rate="24%" pitch="0%"> 就在云韵脸颊苍白略微变淡时,萧炎却是陡然收回目光,眼中那一霎的柔软在顷刻间消失殆尽,取备代之的,是极其浓郁的狠厉与杀意,他早就说过,没有任何人能够阻止他击杀云山,即便这人,是与他关系颇为复杂的云韵!</prosody>
		</mstts:express-as>
	</voice>
	<voice name="zh-CN-YunfengNeural">
		<mstts:express-as style="cheerful">
			<prosody rate="7%" pitch="0%"> “云韵,萧家的血债,必须有人来尝还!”</prosody>
		</mstts:express-as>
	</voice>
	<voice name="zh-CN-XiaoshuangNeural">
		<mstts:express-as style="chat">
			<prosody rate="7%" pitch="0%"> 淡漠的声音轻轻的从萧炎嘴中吐出,旋即飘飘荡荡的在广场之上响起。</prosody>
		</mstts:express-as>
	</voice>
</speak>

参数说明

  • oice name=”zh-HK-HiuMaanNeural” (zh-HK-HiuMaanNeural表示发音人)可参考《语音合成》或官网说明
  • prosody rate=”49%” pitch=”0%”(rate表示语速,pitch表示音调)
  • mstts:express-as style=”serious”(serious表示发语气)

其他说明

停顿:在需要停顿的地方加上“<break time=”2000ms” />”也就是2秒,如:

本工具由3 6 0模板吧采用微软语音合成项目开发的<break time="2000ms" />专业收费版文本转语音工具,本工具广泛用于新媒体运营,其中SSML为高级模式,支持多人配音

多音字:在需要改变文字的的地方加上“<phoneme alphabet=”sapi” ph=”shan 4″>单</phoneme>”shan 四声,如:

隋朝末年,<phoneme alphabet="sapi" ph="shan 4">单</phoneme>雄信参加瓦岗起义,跟随魏公李密,授左武候大将军,参加偃师之战。兵败归降王世充,授大将军。对抗唐军进攻,险些杀害秦王李世民。

语言语音

不同的国家或地区有不同的语音(发音人),这个可以自定义添加,源码都是开源的,如果需要添加更多不同国家或地区的语言或发音人,自己添加就好了,这里我只写大陆和特别地区的发音,完整的还是需要结合官网查看,官网写得更详细,参考现有的矩阵结合官网说明语音支持

大陆地区:

编号 代码 人物 性别 版本
1 zh-CN-XiaoxiaoNeural 晓晓 正式版
2 zh-CN-YunyangNeural 云扬 正式版
3 zh-CN-XiaochenNeural 晓辰 正式版
4 zh-CN-XiaohanNeural 晓涵 正式版
5 zh-CN-XiaomoNeural 晓墨 正式版
6 zh-CN-XiaoqiuNeural 晓秋 正式版
7 zh-CN-XiaoruiNeural 晓睿 正式版
8 zh-CN-XiaoshuangNeural 晓双 正式版
9 zh-CN-XiaoxuanNeural 晓萱 正式版
10 zh-CN-XiaoyanNeural 晓颜 正式版
11 zh-CN-XiaoyouNeural 晓悠 正式版
12 zh-CN-YunxiNeural 云希 正式版
13 zh-CN-YunyeNeural 云野 正式版
14 zh-CN-XiaomengNeural 晓梦 预览版
15 zh-CN-XiaoyiNeural 晓伊 预览版
16 zh-CN-XiaozhenNeural 晓甄 预览版
17 zh-CN-YunfengNeural 云枫 预览版
18 zh-CN-YunhaoNeural 云皓 预览版
19 zh-CN-YunjianNeural 云健 预览版
20 zh-CN-YunxiaNeural 云夏 预览版
21 zh-CN-YunzeNeural 云泽 预览版

香港地区:

编号 代码 人物 性别 版本
1 zh-HK-HiuMaanNeural 曉曼 正式版
2 zh-HK-HiuGaaiNeural 曉佳 正式版
3 zh-HK-WanLungNeural 雲龍 正式版

台湾地区:

编号 代码 人物 性别 版本
1 zh-TW-HsiaoChenNeural 曉臻 正式版
2 zh-TW-HsiaoYuNeural 曉雨 正式版
3 zh-TW-YunJheNeural 雲哲 正式版

 

特别注意:预览版声音只在美国东部、西欧和东南亚这三个区域提供。

说话风格

DavisNeural、JaneNeural、JasonNeural、NancyNeural 和 TonyNeural 的愤怒、欢快、兴奋、友好、充满希望、悲伤、大喊大叫、惊恐、不友好和低语风格只在美国东部、西欧和东南亚这三个服务区域提供。 若要了解如何配置和调整神经网络声音风格和角色,请参阅语音合成标记语言

风格 说明
advertisement-upbeat 用兴奋和精力充沛的语气推广产品或服务。
affectionate 以较高的音调和音量表达温暖而亲切的语气。 说话者处于吸引听众注意力的状态。 说话者的个性往往是讨喜的。
angry 表达生气和厌恶的语气。
assistant 以热情而轻松的语气对数字助理讲话。
calm 以沉着冷静的态度说话。 语气、音调和韵律与其他语音类型相比要统一得多。
chat 表达轻松随意的语气。
cheerful 表达积极愉快的语气。
customerservice 以友好热情的语气为客户提供支持。
depressed 调低音调和音量来表达忧郁、沮丧的语气。
disgruntled 表达轻蔑和抱怨的语气。 这种情绪的语音表现出不悦和蔑视。
embarrassed 在说话者感到不舒适时表达不确定、犹豫的语气。
empathetic 表达关心和理解。
envious 当你渴望别人拥有的东西时,表达一种钦佩的语气。
excited 表达乐观和充满希望的语气。 似乎发生了一些美好的事情,说话人对此非常满意。
fearful 以较高的音调、较高的音量和较快的语速来表达恐惧、紧张的语气。 说话人处于紧张和不安的状态。
friendly 表达一种愉快、怡人且温暖的语气。 听起来很真诚且满怀关切。
gentle 以较低的音调和音量表达温和、礼貌和愉快的语气。
hopeful 表达一种温暖且渴望的语气。 听起来像是会有好事发生在说话人身上。
lyrical 以优美又带感伤的方式表达情感。
narration-professional 以专业、客观的语气朗读内容。
narration-relaxed 为内容阅读表达一种舒缓而悦耳的语气。
newscast 以正式专业的语气叙述新闻。
newscast-casual 以通用、随意的语气发布一般新闻。
newscast-formal 以正式、自信和权威的语气发布新闻。
poetry-reading 在读诗时表达出带情感和节奏的语气。
sad 表达悲伤语气。
serious 表达严肃和命令的语气。 说话者的声音通常比较僵硬,节奏也不那么轻松。
shouting 就像从遥远的地方说话或在外面说话,但能让自己清楚地听到
sports-commentary 用轻松有趣的语气播报体育赛事。
sports-commentary-excited 用快速且充满活力的语气播报体育赛事精彩瞬间。
whispering 说话非常柔和,发出的声音小且温柔
terrified 表达一种非常害怕的语气,语速快且声音颤抖。 听起来说话人处于不稳定的疯狂状态。
unfriendly 表达一种冷淡无情的语气。

试听所有人物发音效果:语音库

视频演示

  • 视频文件太大,可到阿里网盘在线查看https://www.aliyundrive.com/s/34yBxtw72r3

在线使用

点击“文本转语音”即可在线使用文字转语音功能,如有疑问可加入交流群反馈,我们也会一直不定时更新维护,另外模板吧也推出了语音转文本工具,大家可在在线工具栏出找到!

© 版权声明
THE END
喜欢就支持一下吧
点赞10 分享