源码介绍

基于微软语音合成SDK构建的JavaScript文本转语音和语音转文本项目，前端我采用的是当下流行的Bootstrap V4，本版本和功能和官网几乎一致，相对于《微软文字转语音网页源码》更加强大，目前你该功能已上线在线工具并且是免费使用的。

特色功能

微软的语音项目可以说是地表最强的存在，完全听不出Ai的感觉，在如今这个自媒体时代，很多人都在做抖音剪辑或其他平台的视频剪辑，但是又觉得自己的声音不好听或是没有专业的录音设备，那么文本转语音就能帮你解决一切难题！

文本转语音（textToSpeech）

采用微软认知TTS语音合成引擎技术开发，可以将文字转换为堪比真人发声的Ai语音，支持多种语音转换，可调节语速、音调以及可阅读情感等，本工具广泛用于新媒体运营，支持试听也可转换成的语音下载到本。

逼真的合成语音：实现与人声的语调和情感匹配的流畅、发音自然的文本转语音。
可自定义文本讲述者语音：创建反映品牌形象的独特 AI 语音生成器。
细化的文本转语音控件：通过轻松地调整语速、音调、发音和停顿等，为你的方案优化语音输出。
多国语言支持：跨 129 种语言和变体的 330 多种神经网络声音吸引全球受众。

语音转文本（speechToText）

将可听语音转录成可读的、可搜索的文本，使口述音频可操作，快速准确地将音频转录为超过 100 种语言和变体中的文本。对模型进行自定义设置以提高特定于域的术语的准确性。通过对转录文本或启用操作启用搜索或分析，从语音音频中获得更多价值，所有这些操作均以首选编程语言提供。

高质量听录：使用先进的语音识别获取准确的音频转文本听录。
可自定义模型：将特定单词添加到基本词汇或构建自己的语音转文本模型。
灵活的部署：在任意位置（在云中或容器边缘）运行语音转文本。
生产就绪：访问跨 Microsoft 产品支持语音识别的同一可靠技术。

常规参数

语言语音

不同的国家或地区有不同的语音（发音人），这里我只写大陆和特别地区的发音，完整的还是需要结合官网查看，官网写得更详细，参考现有的矩阵结合官网说明语音支持。

大陆地区：

编号	代码	人物	性别	版本
1	zh-CN-XiaoxiaoNeural	晓晓	女	正式版
2	zh-CN-YunyangNeural	云扬	男	正式版
3	zh-CN-XiaochenNeural	晓辰	女	正式版
4	zh-CN-XiaohanNeural	晓涵	女	正式版
5	zh-CN-XiaomoNeural	晓墨	女	正式版
6	zh-CN-XiaoqiuNeural	晓秋	女	正式版
7	zh-CN-XiaoruiNeural	晓睿	女	正式版
8	zh-CN-XiaoshuangNeural	晓双	女	正式版
9	zh-CN-XiaoxuanNeural	晓萱	女	正式版
10	zh-CN-XiaoyanNeural	晓颜	女	正式版
11	zh-CN-XiaoyouNeural	晓悠	女	正式版
12	zh-CN-YunxiNeural	云希	男	正式版
13	zh-CN-YunyeNeural	云野	男	正式版
14	zh-CN-XiaomengNeural	晓梦	男	预览版
15	zh-CN-XiaoyiNeural	晓伊	女	预览版
16	zh-CN-XiaozhenNeural	晓甄	女	预览版
17	zh-CN-YunfengNeural	云枫	男	预览版
18	zh-CN-YunhaoNeural	云皓	男	预览版
19	zh-CN-YunjianNeural	云健	男	预览版
20	zh-CN-YunxiaNeural	云夏	女	预览版
21	zh-CN-YunzeNeural	云泽	男	预览版

香港地区：

编号	代码	人物	性别	版本
1	zh-HK-HiuMaanNeural	曉曼	女	正式版
2	zh-HK-HiuGaaiNeural	曉佳	女	正式版
3	zh-HK-WanLungNeural	雲龍	男	正式版

台湾地区：

编号	代码	人物	性别	版本
1	zh-TW-HsiaoChenNeural	曉臻	女	正式版
2	zh-TW-HsiaoYuNeural	曉雨	女	正式版
3	zh-TW-YunJheNeural	雲哲	男	正式版

特别注意：预览版声音只在美国东部、西欧和东南亚这三个区域提供。

说话风格

DavisNeural、JaneNeural、JasonNeural、NancyNeural 和 TonyNeural 的愤怒、欢快、兴奋、友好、充满希望、悲伤、大喊大叫、惊恐、不友好和低语风格只在美国东部、西欧和东南亚这三个服务区域提供。若要了解如何配置和调整神经网络声音风格和角色，请参阅语音合成标记语言。

风格	说明
style=”advertisement-upbeat”	用兴奋和精力充沛的语气推广产品或服务。
style=”affectionate”	以较高的音调和音量表达温暖而亲切的语气。说话者处于吸引听众注意力的状态。说话者的个性往往是讨喜的。
style=”angry”	表达生气和厌恶的语气。
style=”assistant”	以热情而轻松的语气对数字助理讲话。
style=”calm”	以沉着冷静的态度说话。语气、音调和韵律与其他语音类型相比要统一得多。
style=”chat”	表达轻松随意的语气。
style=”cheerful”	表达积极愉快的语气。
style=”customerservice”	以友好热情的语气为客户提供支持。
style=”depressed”	调低音调和音量来表达忧郁、沮丧的语气。
style=”disgruntled”	表达轻蔑和抱怨的语气。这种情绪的语音表现出不悦和蔑视。
style=”embarrassed”	在说话者感到不舒适时表达不确定、犹豫的语气。
style=”empathetic”	表达关心和理解。
style=”envious”	当你渴望别人拥有的东西时，表达一种钦佩的语气。
style=”excited”	表达乐观和充满希望的语气。似乎发生了一些美好的事情，说话人对此非常满意。
style=”fearful”	以较高的音调、较高的音量和较快的语速来表达恐惧、紧张的语气。说话人处于紧张和不安的状态。
style=”friendly”	表达一种愉快、怡人且温暖的语气。听起来很真诚且满怀关切。
style=”gentle”	以较低的音调和音量表达温和、礼貌和愉快的语气。
style=”hopeful”	表达一种温暖且渴望的语气。听起来像是会有好事发生在说话人身上。
style=”lyrical”	以优美又带感伤的方式表达情感。
style=”narration-professional”	以专业、客观的语气朗读内容。
style=”narration-relaxed”	为内容阅读表达一种舒缓而悦耳的语气。
style=”newscast”	以正式专业的语气叙述新闻。
style=”newscast-casual”	以通用、随意的语气发布一般新闻。
style=”newscast-formal”	以正式、自信和权威的语气发布新闻。
style=”poetry-reading”	在读诗时表达出带情感和节奏的语气。
style=”sad”	表达悲伤语气。
style=”serious”	表达严肃和命令的语气。说话者的声音通常比较僵硬，节奏也不那么轻松。
style=”shouting”	就像从遥远的地方说话或在外面说话，但能让自己清楚地听到
style=”sports-commentary”	用轻松有趣的语气播报体育赛事。
style=”sports-commentary-excited”	用快速且充满活力的语气播报体育赛事精彩瞬间。
style=”whispering”	说话非常柔和，发出的声音小且温柔
style=”terrified”	表达一种非常害怕的语气，语速快且声音颤抖。听起来说话人处于不稳定的疯狂状态。
style=”unfriendly”	表达一种冷淡无情的语气。