AI 聊天机器人经历了一个学习过程,这使得它们的实施过程更加复杂和耗时 。由于不使用预定义的结构,AI 聊天机器人引导的对话不太可预测 。当聊天机器人被错误地教授某些东西时,它需要一段时间才能“忘记”并学习正确的行为 。
聊天机器人架构
自然语言处理引擎(NLP Engine)
引擎是核心组件,可以在任何给定时间解释用户所说的话,并将语言转换为系统可以进一步处理的结构化输入 。即使聊天机器人是特定于域的,它也需要包含和利用大量信息 。而NLP 引擎对此有所帮助 。
它包含先进的机器学习算法来识别用户的意图,并进一步将它们与机器人支持的可用意图列表进行匹配 。可以理解为有两个组成部分:
意图分类器(Intent Classifier):意图分类器根据用户的输入识别其含义,并将其与聊天机器人支持的意图之一联系起来 。
实体提取器(Entity Extractor):实体提取器从用户的查询中提取关键信息 。
知识库
这是回答用户问题的关键部分 。问答系统解释问题并从知识库中给出相关答案 。它可以手动训练或自我训练 。
手动训练涉及领域专家创建常见用户查询列表并映射其答案 。这有助于机器人快速确定重要问题的答案 。
自动化训练涉及将公司的文件(如政策文件和其他问答类型的文件)提交给机器人,并要求其进行自我训练 。引擎从这些文档中提供了一系列问题和答案,然后机器人可以自信地回答 。
数据存储
数据存储只是针对以前交互的数据,以提供给 NLP 引擎,以便机器人在聊天期间保留一些上下文 。这对于记住有关用户的知识以进行进一步交互尤其重要 。
自然语言处理
聊天机器人中的自然语言处理找到了一种将用户的语音或文本转换为结构化数据的方法 。然后用于选择相关答案 。自然语言处理包括以下步骤;
标记化(Tokenization):NLP 将一系列单词分成具有语言代表性的标记或片段,在应用程序中具有不同的值 。
情感分析(Sentiment Analysis):它会研究和学习用户的体验,并在必要时将对话转给人类 。规范化(Normalization):该程序模型处理文本以找出符合用户请求和预期含义中的印刷错误和常见拼写错误 。命名实体识别(Named Entity Recognition):聊天机器人的程序模型寻找不同类别的词,类似于特定产品的名称、用户的地址或姓名,以需要的信息为准 。依赖解析(Dependency Parsing):聊天机器人搜索用户文本中的主语、动词、宾语、常用短语和名词,以发现用户想要传达的相关短语 。
行业实例
谷歌的Meena(“米娜”音译)
Meena 是一种端到端的神经会话模型,它可以学习对给定的会话上下文做出明智的响应 。训练目标是最小化困惑度,即预测不确定的下一个标记(在本例中为对话中的下一个单词) 。
其核心是 Evolved Transformer seq2seq 架构,这是一种通过进化神经架构搜索发现的 Transformer 架构,以改善困惑度 。在 Google 的 AI 博客中了解更多信息 。
更多信息
https://ai.googleblog.com/2020/01/towards-conversational-agent-that-can.html
Replika
Replika 由 Eugenia Kuyda 创立,其想法是创建一个私人人工智能,通过提供有用的对话来帮助您表达和记录自己 。这是一个您可以安全地分享您的想法、感受、信念、经历、记忆、梦想的空间——您的“私人感知世界” 。
从本质上讲,Replika 是一个聊天机器人,在与您交谈时,它会逐渐学会模仿您,直到成为您为止 。
微软的 Tay
Tay 是一款人工智能聊天机器人,最初由微软公司于 2016 年 3 月 23 日通过 Twitter 发布;当机器人开始通过其 Twitter 帐户发布煽动性和攻击性的推文时,它引起了争议,导致微软在推出后仅 16 小时就关闭了该服务 。从那以后,它被视为关于用户交互如何破坏聊天机器人的研究案例 。
推荐阅读
- 超市的挂面如何选购?各类营养挂面的真相
- 大型宠物犬排名大全 最大的狗品种
- 分手挽留文本 分手时挽留的话
- 给自己加油打气的句子分享
- 桂阳郡是现在的什么地方
- 如何将表格中姓名相同的数据对齐
- 找工作的网站 找工作的网站
- 怎么做宝宝的营养早餐
- 怎样好好教孩子
- 飞机头烫与不烫的区别