微软开放对其神​​经文本语音转换AI的访问权限
更新时间:2021-02-04 14:37:34

微软正在开放对名为“自定义神经语音”的文本语音转换AI的访问权限,该技术允许开发人员创建自定义合成语音。该技术是Azure人工智能服务(称为Speech)的一部分。公司可以将该技术用于诸如语音驱动的智能助手和设备,聊天机器人,在线学习以及阅读有声读物或新闻之类的事情。他们必须先申请Microsoft的访问权限并获得Microsoft的批准,然后才能利用Custom Neural Voice。

微软开放对其神​​经文本语音转换AI的访问权限

微软表示,该技术可以提供比其他许多文本到语音服务更自然的声音。自定义语音使用一组声音或音素来创建语音字体。自定义神经语音使用多个神经网络来尝试确保韵律(每个音素的音调和持续时间)和发音正确。这有助于AI正确模仿演员的声音或使用逼真的合成声音。

包括AT&T和华纳兄弟在内的多家公司已经在使用这项技术。他们最近在达拉斯的AT&T体验店安装了一个系统,人们可以在此与Bugs Bunny进行互动。通过结合使用Custom Neural Voice,增强现实和5G,Bug可以与客户实时聊天并在商店中移动,以帮助他们找到隐藏的金色胡萝卜。

目前为Bug配音的演员Eric Bauza在Microsoft的帮助下录制了2,000多个行和短语,以创建语音字体。Warner Bros.和Microsoft共同创建了一种自定义声音,以利用角色的个性和变形。Duolingo还使用“自定义神经语音”创建了古怪的字符来帮助人们学习新语言,而Progressive为其Flo聊天机器人争夺了这项技术。