基于微软语音合成技术开发的免费在线的文字转语音工具

前言说明

目前市面上的文字转语音项目还是挺多的，不过很多转换后都达不到我们理想的效果，唯独一款良心且好用的应该当属微软旗下的语言认知服务了，不过需要认证万事达或者visa信用卡，这一步就难倒了很多国内用户了，因为我们大家就算有信用卡也多半是国内的，所以很多人都为之头疼，基于以上残酷的事实所以我们开发了一款在线免费使用的在线文字转语音工具供大家使用！

基于微软语音合成技术开发的免费在线的文字转语音工具插图 — 在线的文字转语音工具

源码下载

文本转语音源码（API合成版）：微软TTS文本转语音(语音合成)项目前端+接口源代码-360模板吧 (360mb.net)
文本转语音源码（SDK合成版）：在线文本转语音工具(微软版)-360模板吧 (360mb.net)

免注册使用版，调用的官方接口，所以可以免费使用，但接口不是很稳定，注册版是独立的key，主要区别就这个，所以自己看需要哪一个！

功能说明

目前开发的功能是采用官方的TTS接口，功能上和azure官网的基本一致，该有的功能都有，就比如：语言选择、全功能人物、发音语气、音速调节、音调调节等等，而且也支持SSML高级功能，这个功能可以说是最强的存在，支持多人配音，不管是用来为自己的剪辑视频配音还是门店的大促销配音亦或是为小说配音，都是强大的存在！

常用事件

这里我们会单独写一篇微软文字转语音（语音合成）常用事件的处理说明，如：停顿说明、多音字处理，请点击下面按钮查看详细的说明和解释

微软文字转语音常用事件处理

我们新增了一个批量停顿，默认会在”。？！；“自动添加停顿，停顿时间可选

如何使用

基本使用：

一般文本模式很简单，文字打上去或复制后粘贴上去，然后设置各个参数，先点击“试听播放”等待预加载，预加载完成后，按钮就会变为“立即下载”，然后下载即可，没什么难的。

高级模式：

文本转语音SSML模式，大家可以点击文本转语音工具页的SSML选项看看，然后我们依葫芦画瓢即可，默认的是单人模式，看默认的就好，下面看看如何使用多人模式，多人模式同样可设置各个选项，不过是以代码的格式，就比如（可复制进SSML里试听）：

单人样本参考

<speak xmlns="http://www.w3.org/2001/10/synthesis" xmlns:mstts="http://www.w3.org/2001/mstts" xmlns:emo="http://www.w3.org/2009/10/emotionml" version="1.0" xml:lang="en-US">
	<voice name="zh-CN-YunyangNeural">
		<mstts:express-as style="narration-professional">
			<prosody rate="24%" pitch="0%"> 就在云韵脸颊苍白略微变淡时，萧炎却是陡然收回目光，眼中那一霎的柔软在顷刻间消失殆尽，取备代之的，是极其浓郁的狠厉与杀意，他早就说过，没有任何人能够阻止他击杀云山，即便这人，是与他关系颇为复杂的云韵！</prosody>
		</mstts:express-as>
	</voice>
</speak>

多人样本参考

<speak xmlns="http://www.w3.org/2001/10/synthesis" xmlns:mstts="http://www.w3.org/2001/mstts" xmlns:emo="http://www.w3.org/2009/10/emotionml" version="1.0" xml:lang="en-US">
	<voice name="zh-CN-YunyangNeural">
		<mstts:express-as style="narration-professional">
			<prosody rate="24%" pitch="0%"> 就在云韵脸颊苍白略微变淡时，萧炎却是陡然收回目光，眼中那一霎的柔软在顷刻间消失殆尽，取备代之的，是极其浓郁的狠厉与杀意，他早就说过，没有任何人能够阻止他击杀云山，即便这人，是与他关系颇为复杂的云韵！</prosody>
		</mstts:express-as>
	</voice>
	<voice name="zh-CN-YunfengNeural">
		<mstts:express-as style="cheerful">
			<prosody rate="7%" pitch="0%"> “云韵，萧家的血债，必须有人来尝还！”</prosody>
		</mstts:express-as>
	</voice>
	<voice name="zh-CN-XiaoshuangNeural">
		<mstts:express-as style="chat">
			<prosody rate="7%" pitch="0%"> 淡漠的声音轻轻的从萧炎嘴中吐出，旋即飘飘荡荡的在广场之上响起。</prosody>
		</mstts:express-as>
	</voice>
</speak>

参数说明

oice name=”zh-HK-HiuMaanNeural” （zh-HK-HiuMaanNeural表示发音人）可参考《语音合成》或官网说明
prosody rate=”49%” pitch=”0%”（rate表示语速，pitch表示音调）
mstts:express-as style=”serious”（serious表示发语气）

其他说明

停顿：在需要停顿的地方加上“<break time=”2000ms” />”也就是2秒，如：

本工具由3 6 0模板吧采用微软语音合成项目开发的<break time="2000ms" />专业收费版文本转语音工具，本工具广泛用于新媒体运营，其中SSML为高级模式，支持多人配音

多音字：在需要改变文字的的地方加上“<phoneme alphabet=”sapi” ph=”shan 4″>单</phoneme>”shan 四声，如：

隋朝末年，<phoneme alphabet="sapi" ph="shan 4">单</phoneme>雄信参加瓦岗起义，跟随魏公李密，授左武候大将军，参加偃师之战。兵败归降王世充，授大将军。对抗唐军进攻，险些杀害秦王李世民。

语言语音

不同的国家或地区有不同的语音（发音人），这个可以自定义添加，源码都是开源的，如果需要添加更多不同国家或地区的语言或发音人，自己添加就好了，这里我只写大陆和特别地区的发音，完整的还是需要结合官网查看，官网写得更详细，参考现有的矩阵结合官网说明语音支持。

大陆地区：

编号	代码	人物	性别	版本
1	zh-CN-XiaoxiaoNeural	晓晓	女	正式版
2	zh-CN-YunyangNeural	云扬	男	正式版
3	zh-CN-XiaochenNeural	晓辰	女	正式版
4	zh-CN-XiaohanNeural	晓涵	女	正式版
5	zh-CN-XiaomoNeural	晓墨	女	正式版
6	zh-CN-XiaoqiuNeural	晓秋	女	正式版
7	zh-CN-XiaoruiNeural	晓睿	女	正式版
8	zh-CN-XiaoshuangNeural	晓双	女	正式版
9	zh-CN-XiaoxuanNeural	晓萱	女	正式版
10	zh-CN-XiaoyanNeural	晓颜	女	正式版
11	zh-CN-XiaoyouNeural	晓悠	女	正式版
12	zh-CN-YunxiNeural	云希	男	正式版
13	zh-CN-YunyeNeural	云野	男	正式版
14	zh-CN-XiaomengNeural	晓梦	男	预览版
15	zh-CN-XiaoyiNeural	晓伊	女	预览版
16	zh-CN-XiaozhenNeural	晓甄	女	预览版
17	zh-CN-YunfengNeural	云枫	男	预览版
18	zh-CN-YunhaoNeural	云皓	男	预览版
19	zh-CN-YunjianNeural	云健	男	预览版
20	zh-CN-YunxiaNeural	云夏	女	预览版
21	zh-CN-YunzeNeural	云泽	男	预览版

香港地区：

编号	代码	人物	性别	版本
1	zh-HK-HiuMaanNeural	曉曼	女	正式版
2	zh-HK-HiuGaaiNeural	曉佳	女	正式版
3	zh-HK-WanLungNeural	雲龍	男	正式版

台湾地区：

编号	代码	人物	性别	版本
1	zh-TW-HsiaoChenNeural	曉臻	女	正式版
2	zh-TW-HsiaoYuNeural	曉雨	女	正式版
3	zh-TW-YunJheNeural	雲哲	男	正式版

特别注意：预览版声音只在美国东部、西欧和东南亚这三个区域提供。

说话风格

DavisNeural、JaneNeural、JasonNeural、NancyNeural 和 TonyNeural 的愤怒、欢快、兴奋、友好、充满希望、悲伤、大喊大叫、惊恐、不友好和低语风格只在美国东部、西欧和东南亚这三个服务区域提供。若要了解如何配置和调整神经网络声音风格和角色，请参阅语音合成标记语言。

风格	说明
advertisement-upbeat	用兴奋和精力充沛的语气推广产品或服务。
affectionate	以较高的音调和音量表达温暖而亲切的语气。说话者处于吸引听众注意力的状态。说话者的个性往往是讨喜的。
angry	表达生气和厌恶的语气。
assistant	以热情而轻松的语气对数字助理讲话。
calm	以沉着冷静的态度说话。语气、音调和韵律与其他语音类型相比要统一得多。
chat	表达轻松随意的语气。
cheerful	表达积极愉快的语气。
customerservice	以友好热情的语气为客户提供支持。
depressed	调低音调和音量来表达忧郁、沮丧的语气。
disgruntled	表达轻蔑和抱怨的语气。这种情绪的语音表现出不悦和蔑视。
embarrassed	在说话者感到不舒适时表达不确定、犹豫的语气。
empathetic	表达关心和理解。
envious	当你渴望别人拥有的东西时，表达一种钦佩的语气。
excited	表达乐观和充满希望的语气。似乎发生了一些美好的事情，说话人对此非常满意。
fearful	以较高的音调、较高的音量和较快的语速来表达恐惧、紧张的语气。说话人处于紧张和不安的状态。
friendly	表达一种愉快、怡人且温暖的语气。听起来很真诚且满怀关切。
gentle	以较低的音调和音量表达温和、礼貌和愉快的语气。
hopeful	表达一种温暖且渴望的语气。听起来像是会有好事发生在说话人身上。
lyrical	以优美又带感伤的方式表达情感。
narration-professional	以专业、客观的语气朗读内容。
narration-relaxed	为内容阅读表达一种舒缓而悦耳的语气。
newscast	以正式专业的语气叙述新闻。
newscast-casual	以通用、随意的语气发布一般新闻。
newscast-formal	以正式、自信和权威的语气发布新闻。
poetry-reading	在读诗时表达出带情感和节奏的语气。
sad	表达悲伤语气。
serious	表达严肃和命令的语气。说话者的声音通常比较僵硬，节奏也不那么轻松。
shouting	就像从遥远的地方说话或在外面说话，但能让自己清楚地听到
sports-commentary	用轻松有趣的语气播报体育赛事。
sports-commentary-excited	用快速且充满活力的语气播报体育赛事精彩瞬间。
whispering	说话非常柔和，发出的声音小且温柔
terrified	表达一种非常害怕的语气，语速快且声音颤抖。听起来说话人处于不稳定的疯狂状态。
unfriendly	表达一种冷淡无情的语气。

试听所有人物发音效果：语音库

视频演示

视频文件太大，可到阿里网盘在线查看https://www.aliyundrive.com/s/34yBxtw72r3

在线使用

点击“文本转语音”即可在线使用文字转语音功能，如有疑问可加入交流群反馈，我们也会一直不定时更新维护，另外模板吧也推出了语音转文本工具，大家可在在线工具栏出找到！