能把英语音频翻译出来的软件 英语语音翻译器


能把英语音频翻译出来的软件 英语语音翻译器


(映维网Nweon 2022年02月24日)Facebook、Instagram、WhatsApp和VR社交平台Horizon的母公司Meta日前宣布了一个雄心勃勃的全新AI研究项目:创建一个适用于“世界每个人”的通用语言翻译器 。Meta首席执行官马克·扎克伯格表示:“用任何语言来与任何人交流的能力是一种梦寐以求的超能力,而人工智能将在我们的有生之年实现这一点 。”
Meta日前举办了一个名为“Meta AI: Inside the Lab”的人工智能实验室揭秘活动 。除了演示人工智能团队所取得的最新突破外,Meta同时希望进一步说明人工智能将如何赋能公司的元宇宙未来 。
对于前述的通用语言翻译器计划,Meta撰文进行了详细的介绍,下面是映维网的具体整理:
对于母语为英文、中文或西班牙文等的不同人士,今天的应用程序和网络工具似乎已经提供了我们所需要的翻译技术 。但目前依然数十亿人排除在外,他们无法轻松访问互联网的信息,同时无法用母语与大多数网络世界联系 。今天的机器翻译(Machine Translation;MT)系统正在迅速进化,但它们严重依赖于从大量文本数据中学习,所以通常不适用于低资源语言(即缺乏训练数据的语言),以及没有标准化写作系统的语言 。
消除语言障碍将是一项意义深远的工作:它将能帮助数十亿人以自己的母语或首选语言获取网络海洋的信息 。机器翻译的进步不仅会帮助不懂当今主导互联网的语言的人士,它们将从根本上改变人们联系和分享想法的方式 。
请想象一下,操着不同语言的人士能够通过电话、手表或眼镜实时相互交流,或者能够自由以自己喜欢的语言访问网络的多媒体内容 。在不久的将来,当虚拟现实和增强现实等新兴技术将数字世界和物理世界结合在一起时,翻译工具将能帮助你与任何人交流,并在任何地方进行日常活动,例如举办读书俱乐部或合作开展工作项目等等 。
所以,Meta AI日前宣布了一项旨在构建支持世界大多数语言的机器翻译工具的长期努力 。这包括两个新项目:
第一个是No Language Left Behind(不落下任何语言) 。团队正在构建一个可以从较少示例语言中学习的全新高级人工智能模型,并将其用于实现数百种语言的专家级翻译,例如阿斯图里安语,卢甘达语和乌尔都语 。第二个是Universal Speech Translator(通用语言翻译) 。团队正在设计新的方法来实时将一种语言的语音翻译成另一种语言,从而支持没有标准书写系统的语言,以及既有书面语言又有口头语言的语言 。
要为全世界所有人提供真正通用的翻译工具需要大量的努力 。但Meta认为,这里描述的一切是向前迈出的重要一步 。团队进一步指出,未来将分享开源相关的代码和模型细节 。通过借助社区的力量,我们将能更接近实现这一重要目标 。
1. 翻译每一种语言的挑战
当今的人工智能翻译系统并不是为了服务于世界各地使用的数千种语言,同时不是为了提供实时的语音到语音翻译 。为了真正服务于每一个人,机器翻译研究业界需要克服三个重要挑战:
我们需要获取更多语言的更多训练数据,并找到利用现有数据的新方法,从而克服数据匮乏的问题 。我们需要克服随着模型向服务更多语言的方向发展而出现的建模挑战 。我们需要找到新的方法来评估和改进结果 。
数据匮乏依然是跨更多语言扩展翻译工具的最大障碍之一 。文本翻译的机器翻译系统通常依赖于从数百万个句子的注释数据中学习 。所以,能够进行高质量翻译的机器翻译系统目前只为少数主导网络的语言开发 。扩展到其他语言意味着为缺少网络存在感的语言寻找一种获取和使用训练示例的方法 。

推荐阅读