在人工智能的定义上也有这种“相互鄙视” 。 业外人士常常嘲笑人工智能专家们吹牛甚至说谎:“就你们做的那个东西还算有智能?”;而业内人士则认为外行们在自曝无知:“人工智能就是我们说的这个意思, 你们不了解就别乱说!”双方都理直气壮 。 刘易斯·卡罗尔在《爱丽丝镜中奇遇记》中描述了一个矮胖子Humpty Dumpty, 他曾自得地宣称“当我用一个词的时候, 它总是正好表达我要表达的意思, 既不多也不少 。 ”这种人在很多争论的双方都能见到, 他们总觉得自己是在使用某词的“正确的意思”, 而很少考虑为什么对方不这么看 。
其实在和定义有关的对抗中, “造反”(违反或修改定义)和“镇压”(确立和维护定义)都具有合理性, 而最后就是“成王败寇” 。 这样说不是简单地各打五十大板以示公平, 而是说对一个具体的“违规”的赏罚最后实际上是双方角力的结果, 没有一方有天然的正确性 。 “尊重传统”和“与时俱进”都有个限度问题 。
聊天机器不会“聊天”
虽然上面的话像是常识, 但若依此考量在自然语言理解方面的工作, 仍能看出不少问题来 。 在早期“基于规则”的方案中, 大多是想通过给每个词下定义来掌握其意义, 尽管很多定义是隐含的, 即是通过系统对有关词汇的处理体现的 。 这类方案的问题是很多词极难定义, 即使在字典里也往往是罗列了其若干不同意义, 而没有说怎么在具体情境下消除歧义 。 近年来这个领域转向依赖于统计各个词汇的具体使用方式, 因此不再要求事先给出定义 。 这样做更加简单实用, 但词汇的“定义”其实还在, 只是表现为该词汇在所用的训练数据集中的统计特征 。
从应用的角度来看, 这种做法对很多产品来说已经足够好 。 以机器翻译为例, 如果只是要将旅游者“附近有中餐馆吗?”之类的句子译成不同的语言, 我们大可以认为每个句子有一个特定的意义, 而翻译程序只是需要把这个意义在其它语言中表达出来就是了 。 但对另外一些应用来说, 字句的意义不再是固定的, 而是随时间、地点等而变 。 这就超出统计方案的能力范围了(即使加上条件概率也远远不够) 。 从根本上说, 应该把字句的意义看成可变的, 而“定义”(包括统计性的)只是其中相对稳定和基本的成分 。
与此相关的是对话的生成和理解 。 现在的“聊天机器人”都是基于统计学习的, 其目标是“听上去像人”, 所以在产生每句话时的设计目标是“大部分人在这种情况下会说什么” 。 我不否认我们都有“为了聊天而聊天”的时候, 但这毕竟不是对话的主要功能 。 在绝大多数时候, 我们的对话都是服务于某些特定目的 。 由于每个具体的对话在原则上都是独一无二的, 往往要求对语言的创造性使用, 包括在一定程度上突破字词的定义 。 如果你知道你的对话对象所说的永远是老生常谈, 你得多无聊才要把这个对话进行下去啊 。 所以说即使现在的聊天程序确实有市场, 它们也不代表对话的典型情境 。
真人与聊天机器人(绿色)的对话(截图来自网络)
新理论该怎么为概念命名
科学概念的定义和日常词语的定义相比又有更多的要求 。 尤其一个科学理论的核心概念需要严格和确定, 并对整个理论的发展提供基础和导向 。 一个新理论往往是以若干新概念为标志的 。 为一个新概念命名时无非是两个办法, 一个是造个新词, 而另一个是改造一个老词 。 在两种情况下都需要用一个定义来界定这个词(以及其命名的概念)在这个理论中的意义 。 这两个办法各有麻烦:新词容易让人不知所云, 而老词容易让人望文生义, 所以为新概念挑个恰当的名字绝不是个容易的事 。
推荐阅读
- 近年没有革命性创新 日本科技能靠飞行汽车翻身吗
- win11更新完黑屏
- 微信头像不更新怎么办
- Win8.1补丁更新VirtuaBox虚拟机出现错误的解决办法
- 新洲区属于哪个市
- 新乡学院四育人体系包括哪几方面
- 新鲜薄荷如何食用
- 适合新手做的小生意小城市 适合新手做的小生意
- 泰剧46天周几更新
- 新经济包含哪些产业