要知道其中原因 , 首先我们来了解下谷歌耳机的历史 。 谷歌去年推出了无线耳机Pixel Buds , 此前该公司曾大肆宣传过这款产品 , 称其是一款革命性的工具 , 支持实时翻译功能 。 只要轻敲Pixel Buds , 说“帮我说” , 它就会打开你手机上的谷歌翻译应用 。 现在 , Pixel手机也同样支持这个功能 。
【中国AI同传遭质疑之时 谷歌实时翻译也被吐槽了】接着 , 你可以说出句子 , 谷歌翻译会在手机上将其翻译成目标语言 , 并进行转录 , 然后读出来 。 理论上 , 谷歌的新技术甚至会让口译翻译们担心丢掉工作 。 这款产品在舞台上的实时翻译演示获得了巨大成功 , 但当其开始发货时 , 人们对其似乎产生了怀疑:翻译的质量没有达到公众的预期 。
科技网站Tech Insider用十种不同的语言对实时翻译功能进行了测试 。 它成功地翻译了些基本问题 , 比如“最近的医院在哪里” , 但当句子变得更复杂 , 或者说话人有口音时 , 翻译就会出现错误 。 评论员们得出的结论是 , 实时翻译似乎有点儿“欺骗嫌疑” , Google Assistant需要努力理解对它说出的话 。
消费技术资深分析师丹尼尔·格里森(Daniel Gleeson)说:“掌握自然语言是非常困难的 。 对于谷歌来说 , 这将是个巨大的成就 , 而他们实现这个目标的那一天 , 可以自豪地大声说出来 。 ”或许有些人可能会说 , 这可能也是Pixel Buds支持页面更新的信息被隐藏起来的原因 。
谷歌的问题不在于翻译过程本身 , 事实上 , 该公司在过去几年始终在提升其翻译应用水平 。 2016年 , 谷歌将其谷歌翻译转换为基于深度学习的人工智能(AI)驱动系统 。 在此之前 , 该工具将每个单独的单词分别翻译 , 并应用语言学规则使句子在语法上保持正确 , 从而导致了我们非常熟悉的、支离破碎的翻译效果 。 另一方面 , 神经网络则将句子作为一个整体来考虑 , 并根据之前训练过的大量文本数据来猜测正确的输出结果 。 通过机器学习 , 这些系统能够考虑句子的上下文 , 从而提供更准确的翻译 。
整合机器学习是Google Brain团队的任务 , 该团队是谷歌专门致力于深度学习研发的部门 。 Google Brain还将神经网络应用到另一个工具上 , 这是实时翻译的关键 , 但这似乎也导致其容易在语音识别上犯错 。 实际上 , Google Assistant经过了数小时的语音培训 , 它会使用机器学习工具来识别模式 , 并最终正确地识别出被要求翻译的内容 。
那么 , 如果谷歌在某种程度上成功地将神经网络应用到文本-文本的翻译中 , 为什么Google Assistant仍然不能使用相同的技术精准地进行语音识别呢?剑桥大学自然语言处理研究人员马西基·霍瓦特(Matic Horvat)说 , 这一切都归结于用来训练神经网络的数据集 。
霍瓦特说:“系统能够适应它们所得到的训练数据集 。 当你把它介绍给它从未听过的东西时 , 语音识别的质量就会下降 。 例如 , 如果你的训练数据集是会话语音 , 那么在繁忙的环境中识别语音效果就不会太好 。 ”
干扰是任何致力于提高语音识别技术的计算机科学家的克星 。 去年 , 谷歌通过其数字新闻创新基金会向伦敦初创企业Trint投资1.5亿欧元 , 该公司在自动语音转录方面处于领先地位 , 尽管其算法与谷歌不同 。 然而 , Trint的算法在处理基本的干扰问题上并没有表现得更好 。
推荐阅读
- 1年10箭18星,北斗卫星导航系统建设的中国速度!
- 中国加油武汉加油手抄报简单漂亮字少 中国加油武汉加油手抄报简单漂亮字少画法
- 中国加油武汉加油手抄报三年级 中国加油武汉加油手抄报三年级画法
- 中国加油手抄报内容 中国加油手抄报内容画法
- 中国加油!武汉加油手抄报 中国加油!武汉加油手抄报画法
- 中国加油手抄报白衣天使 中国加油手抄报白衣天使画法
- 迷你世界是中国的吗
- 中国科学家在量子通信领域取得新突破
- 遭遇雷电正确的做法 雷雨天气时正确的做法是
- 建设5G,中国必须抢得先机