“双十一”第11年 AI定义网购新玩法( 二 )


据赵昆介绍, 对话机器人精通英语、法语、泰语、西班牙语、阿拉伯语等11种语言, 两周就能学一门新外语 。
“今年, 对话机器人新学了阿拉伯语、法语和繁体中文, 并且推出了马来语—英语、泰语—英语等混合语言问答功能 。 ”赵昆说, “混合语言问答的情况在马来西亚等地很常见, 在当地的客服场景中, 大部分用户用英语咨询, 少数用户用马来语咨询, 并且常有英语、马来语混用 。 对话机器人不仅要同时理解这两种语言, 还必须理解复杂的语言混用情况, 并给出相应的回答 。 ”
不过, 它使用的并不是机器翻译技术, 而是一种自然语言处理技术跨语言学习(Cross-lingual Learning) 。 “小语种缺乏大规模训练语料, 很难通过过去的机器学习技术习得, 跨语言学习能够克服资源匮乏的瓶颈 。 ”赵昆解释说, 跨语言学习是一种多语言的自然语言处理技术, 它通过语言之间的知识迁移, 借助中文、英文等语料资源充足的语言, 帮助算法模型提升理解小语种的能力, 从而快速拓展机器人的多语种支持功能 。 借助跨语言学习技术, 对话机器人还能掌握更多语言, 甚至包括土耳其语、乌尔都语等小语种 。
【“双十一”第11年 AI定义网购新玩法】“通俗地说, 语言是符号, 不同的语言是不同的符号系统 。 想象语言所指的每个事物/知识都对应一个确定的身份标识, 后者在不同的语言中被不同的符号所代表, 或者说, 不同语言所用的符号映射到同一个语义空间 。 跨语言学习做的是帮助机器理解语言所指的身份标识, 并借助资源丰富的语言去学习资源匮乏的语言 。 ”赵昆进一步解释 。
他表示, 基于语言之间的交叉映射关系, 对机器来说, 在资源匮乏的情况下, 通过将多种语言混合, 学习语言间的共性, 反而能比学习单一语言效果更好 。 2017年对话机器人初次在海外落地, 用6个月学会了印尼语, 又用6个月在智能客服岗位上达成堪比中文机器人的解决能力, 而现在, 多语机器人新学一门语言的时间已经缩短到两周 。
声纹识别开启语音购元年
今年“双十一”, 语音购物千呼万唤始出来:消费者只要对天猫精灵说出想要购买的商品, 就能直接下单;如果开通了“声纹支付”功能, 还可以直接语音付款 。
“语音购元年”, 听起来科技感十足, 据报道, 已有数百万人体验了语音购物, 其中超过半数的用户是首次尝试 。 声纹识别技术采用基于深度网络的注意力嵌入式模型, 通过网络结构的参数设计, 模拟了基于人耳感知的频谱特征, 可以在一定程度上消除同一人在不同场景发音下的频谱特征差异干扰, 显著提升远场交互下的声纹识别性能 。
说话就能付钱, 如何确保安全?阿里巴巴人工智能实验室语音技术首席科学家聂再清介绍, 作为首个达到商用级别的声纹识别技术智能音箱, 天猫精灵的声纹识别率已达99%, 这是它支持声纹支付功能的基础, 在支付级应用下, 用户只要通过3次不超过10秒的交互语音, 声纹识别技术就可以准确刻画用户的鲁棒性声纹特征, 实现超过99%的识别准确度 。
不仅如此, 运用中文识别的自然语言理解算法, 语音设备可以准确定位消费者需要购买的商品, 以平台大数据为基础, 依托声纹推荐能力, 为消费者进行个性化推荐 。 “在语音购场景, 天猫精灵基于注意力记忆网络可以自主学习各个行业导购员的经验, 并结合用户特点呈现最优的导购流程, 成为最懂用户和最懂行业的智能导购员 。 ”聂再清说 。
此外, 今年“双十一”, 消费者还可以体验AR试妆产品, AR试妆通过标准化工具拿到彩妆色号、材质等数字信息, 通过AI+AR技术让用户看到同样商品在自己脸上呈现出的不同效果 。 通过高效实时的精准人脸识别技术, 即便在人脸晃动和大角度偏转时, 都能有很好的稳定性表现, 以毫秒级别画出商品在用户脸上的逼真效果 。 新玩法背后是新技术 。 在屡屡刷新的成交额、令人瞠目的商业数字之外, 不断突破的技术正贴地而行 。

推荐阅读