70岁的图灵测试已经是老古董了?( 二 )


也正因此 , 从应用的角度出发 , 让计算机放弃自己的优势去模拟人类确实完全没有必要 。
更重要的是 , 图灵测试仅考虑了文本交流的情况 , 而没有考虑到现在的人工智能已经能够使用各种传感器 , 能够从视觉、听觉、触觉等多角度来感受外部世界 。
【70岁的图灵测试已经是老古董了?】通过图灵测试已不是现在的研究重点
毫无疑义的是 , 人工智能对人类社会的影响已超越了图灵测试的范畴 , 人工智能研究的目标早已不再局限于AI与人类的区别 , 而是如何发挥机器的速度和信息搜索优势 , 代替人类完成工作或改善人们的日常生活 。
用图灵测试来检验今天的人工智能水平 , 还有些局限不能忽略 , 如图灵测试没有详细的标准 , 也没有固定的问答模式 , 一套流程提问和判断非常主观 , 缺乏严谨的标准 , 并不科学 。
那么 , 这是否意味着图灵测试已经过时?
事实并非如此 , 即便图灵测试已不能完全证实人工智能的进步程度 , 但一个优秀的人工智能应该能够通过图灵测试 。 有研究者指出 , 图灵测试的巧妙在于它没有直接去定义什么是“智能” , 而是将“能否思考”这个抽象的问题 , 引入了一个更精准 , 也看似更实用的场景 。
从这个角度看 , 图灵测试不能称为过时 , 只不过是现代人工智能研究不应该把通过图灵测试作为重点 。 普拉萨德亦指出 , 尽管没有考虑到人工智能日益增强的收集数据能力和计算能力 , 图灵测试仍然是聊天机器人和数字助理常用的基准 。
人工智能需要建立一套全新衡量标准
普拉萨德认为 , 应该创造新的智能评估方式 , 适用于评估一般类型的智能机器 。 新的测试应该弄明白人工智能是如何表现出类似人的智能特征的 , 包括语言能力、自我监督和具备“常识” 。 此外 , 测试范围还应该包括人工智能在多大程度上改善了人们的日常生活 。
中国工程院院士、清华大学信息学院院长戴琼海教授也曾在公开演讲中指出 , 人工智能发展非常快 , 已经取代了人类以往常用的大部分工具 。 但是 , 这种取代能不能做得更好 , 需要做一套测试 。
即便是与图灵测试捆绑最深的人工智能对话系统 , 其研究者也在呼唤对图灵测试进行改进 。
前微软全球执行副总裁、微软亚洲研究院院长沈向洋还在微软任职时提出 , 图灵测试已难不倒像微软小冰这样的情感型人工智能产品 。 鉴于今天的人工智能技术环境 , 计算机学术界有必要对图灵测试进行修正和升级 , 是时候讨论难度更高的“超图灵测试”了 。
普拉萨德强调 , 新的衡量标准应该体现出机器在效率上的优势 , 比如计算、搜索、代人完成任务等 , 综合评价人工智能给人类带来的帮助 , 而不是执迷于消除人工智能和人的区别 。 他认为 , 人工智能只有具备更广泛的学习能力 , 才能成为处理大量任务方面的专家 , 针对特定任务所表现出的智能并不能代表人工智能真正的能力 。
随着人工智能技术的进步和更多被应用到现实生活中 , 人们一边对人工智能改善自己生活有了更多的期待 , 一边又对人工智能的使用甚至滥用提高了警惕 。

推荐阅读