近日来自 MIT Technology Review的消息透露,微软正研究一项新的语音翻译技术。该技术可以让软件学习人的声音,然后用类似的声音输出另一种语言。目前该工具还处于初级阶段,能够将文本翻译成另一种语言说出来。
这项技术工作流程大概是这样的:首先程序需要识别说话者所使用的语言;然后将这些语言转换;最后再一次性的翻译,并使用另一种语言输出。该程序甚至可以保留个人声音的特点,也使得它输出的声音不再是自动合成的效果。
在现阶段,使用前大概需要 1 小左右的训练时间,以让其辨别每个人声音中的细微差别。此外,该项目已经能够支持包括普通话在内的 26 种语言,微软亚洲研究院的一个团队也正在加强其语音识别功能。
该技术看起来与 Google 在一年前发布的 Conversation mode in Google Translate类似,成熟后可以开发成多种产品,例如即使口译工具,语言学习工具等等。只不过我们可能还要等待较长的一段时间。
下面的视频是微软研究院在一次活动上对该技术的讲解和 Demo 演示。iOS 用户若不能正常观看,可以点开 这里试试。