alexa语音助手,内置Alexa语音助手

怎么看待如今的语音助手?

alexa语音助手,内置Alexa语音助手


在许多的科幻电影中,机器人被描述的与人类无异:无论是其外观,还是其说法方式,都看不出与人类的差别,甚至产生一段“人机恋” 。不过就现阶段而言,机器人尚未发展到这种程度,特别是若要机器人与人类产生恋情,声音与交流将是非常关键的一环 。为了让语音助手的发声更像人类,从而能进一步提升这类产品对消费者的吸引力,众多巨头都做了很多努力,希望让语音助手的发声更自然,也更口语化,就像你在与真人交流那样,从而为消费者带来更真实、更贴近生活的语音助手 。
谷歌用机器学习优化语音助手谷歌近期就发布了全新的AI语音合成器,一个名为“Cloud Text-to-Speech”的服务,能让语音助手听起来更自然更口语化,服务于需要语音合成服务的开发者或企业,无论是应用、网页还是虚拟助理均可使用 。其特别之处在于,“Cloud Text-to-Speech”通过谷歌旗下人工智能子公司DeepMind开发的WaveNet来驱动 。
据了解,DeepMind的AI语音合成技术是目前行业最先进、最可实现的技术之一:大部分语音合成器(包括Siri)都使用了“连接合成”技术——程序会储存单个音节,然后再将其组合到一起,形成单词和句子,虽然这种方法近年来不断进步,但听起来还是非常呆板生硬 。相比之下,WaveNet使用了机器学习来从头生成语音 。
实际上,WaveNet分析了一个巨大人类语音数据库的波形,并以每秒2.4万个样本的速度对其重新创建,从而能让我们感受到一些微妙的变化,包括口音和唇音等 。它之前已经被整合到Google Assistant中(尽管只支持英文和日文),现在则拥有了更多选择 。谷歌表示,新服务可提供12种语言的32种不同声音能力,而且用户可以定制高音和语速等细节 。
微软苹果等也要让语音助手像人类据了解,微软同样利用机器学习等技术让Cortana声音更接近人类:Cortana会根据用户当前对话情景进行情感分析,从而控制自己的语音和语调,产生相应语气 。此外,Cortana更像人也与其声音来源(Jen Taylor,为《光环》游戏Cortana配音)有关,“就闲聊部分,全部都是Jen Taylor的声音;其他部分将由其他声音混合使用” 。
苹果在iOS 11发布时这样评价SIri,“它很自然!一点都不像机器人!”这是因为和过去相比,siri说话时会在句子间加入更多的停顿,更多的长音,更轻快的语调变化,因此它将会比过去更流畅,更像“人”;此外在学会一门新语言的过程中,Siri团队试图找到每一个音所有的说法,比如连读、轻读、重音、长音、升调、降调等等 。
亚马逊Alexa拥有比较明显的机器人口音,为此亚马逊升级过语音合成标记语言标签,希望能为Alexa带来低声说话,停顿,咒骂,以及整语音的速度、音量和声调等,从而能听上去不那么像是机器人 。三星在中文版Bixby 2.0发布会上也强调,Bixby “能听会看懂你心”,是一款真正“会说人话”的语音助手 。语音助手的竞争很激烈在人机交互方面,语音助手正在引领AI为主导的下一代人机交互时代,引发了众多科技公司的竞逐:国内的百度搜狗科大讯飞,以及国外的微软谷歌苹果亚马逊等公司都非常重视语音交互技术,试图让语音交互变得更为实用,从而能争夺新时代下的超级入口 。
据媒体报道,Spotify也正测试其语音助手,将让消费领域的语音助手之争变得更加激烈 。科技公司也瞄准了语音助手在企业领域的前景 。前段时间,IBM正式发布了沃森助手(Watson Assistant),可以置于多种平台,如汽车、酒店或家电等 。据IBM称,Watson是一个企业助理,旨在帮助企业提高他们的消费者体验 。

推荐阅读