企业正在学习应该关注的问题:
1)数据的多样性 , 包括适当人群的代表性 。
2)在创建算法的过程中确保不同的经验、观点和思维 。
【AI寒冬将至?行业大咖呼吁重启AI再出发】3)数据质量优先于数量 。 这些都是非常重要的 , 特别是随着偏见的引入 , 对AI的信任和信心数据都在下降 。 例如 , 在土耳其语中属于中性的语言 , 谷歌翻译中的AI模型在将其翻译成英语时却错误地预测了性别 。
此外 , 癌症识别AI在图像识别训练时只使用皮肤白皙的人照片 。 从上面的计算机视觉例子中 , 乔伊?布拉马维尼(Joy Buolamwini)测试了这些AI技术 , 并意识到它们在识别男性VS女性或浅色VS深色皮肤方面更有效 。 识别男性的错误率低至1% , 而识别深色皮肤女性的错误率则高达35% 。 这些问题的发生是因为没有使用多样化的数据进行培训 。
班尼特承认:“AI的概念很简单 , 但通过获取越来越多的真实世界数据 , 算法会变得越来越聪明 , 然而要解释这些决策却变得极其困难 。 数据可能会不断变化 , AI模型需要进行过滤 , 以防止错误的标签 , 比如将非洲人贴上大猩猩的标签 , 或者将熊猫误认为长臂猿 。 企业依靠错误的数据来做出决策 , 将导致更加糟糕的结果 。 ”
幸运的是 , 由于AI的狭义存在 , 很少有公司会根据今天的数据做出重大商业决策 。 从我们所看到的情况来看 , 大多数解决方案主要是产品推荐和个性化营销沟通 。 由此得出的任何错误结论都不会对社会造成太大影响 , 至少目前如此 。 使用数据来进行业务决策并不新鲜 , 但发生变化的是使用结构化和非结构化数据的数量和组合正呈指数级增长 。 AI使我们能够持续性地使用来自他们源头的数据 , 并更快地获得洞察力 。 对于具有处理来自不同数据源的数据和结构能力的企业来说 , 这意味着巨大的机会 。
然而 , 对于其他企业来说 , 大量的数据可能代表着一种风险 , 因为不同的来源和格式使得转换信息变得更加困难 。 这些信息来自电子邮件、系统日志、网页、客户记录、文档、幻灯片、非正式聊天、社交网络以及图像和视频更丰富的媒体 。 数据转换仍然是开发干净数据集和有效模型的绊脚石 。
偏见比我们意识到的更普遍
许多商业模型都存在偏见 , 以最小化风险评估和优化目标机会 , 虽然它们可能产生有利可图的商业结果 。 但众所周知 , 它们会导致意想不到的后果 , 导致个人伤害 , 加大经济差距 。 保险公司可能会利用位置信息或信用评分数据向较贫穷的客户发放更高的保费 。 银行可能会批准信用评分较低的贷款申请 , 尽管这些人已经负债累累 , 可能无法负担更高的贷款利率 。
由于AI的引入不仅会使现有的偏见永久存在 , 而且这些学习模型的结果可能会推广到加深经济和社会鸿沟的程度 , 因此围绕着偏见的谨慎程度也越来越高 。 在当前情况下 , 偏见出现在类似“替代性制裁的惩罚性罪犯管理分析”(Correctional Offender Management Profiling for Alternative Sanctions , 简称COMPAS)的算法中 。
COMPAS是由名为Northpointe的公司创建的 , 目的旨在评估审前听证中被告犯罪行为的风险 , 并作出预测 。 COMPAS初步研究中使用的问题类型足以显示 , 无意中对待黑人的偏见会在系统中延续 。 在没有公共标准可用的情况下 , Northpointe得以自己创建公平的定义 , 并在没有第三方评估的情况下开发了一种算法 。 这篇文章证明:一个流行的算法在预测犯罪方面并不比随机的人更好 。
推荐阅读
- 新型飞行机器人像果蝇一样敏捷
- 日企将进行无人出租车试验 计划2020年投入运营
- 女性想要减掉肚子肥肉,就要进行暖宫驱寒补阳
- 女性想要减肥成功,便可进行科学减肥
- 父亲节送给老父亲最好的十大礼物 送爸爸十大礼物排行
- 雪中悍刀行迅雷下载 悍刀雪中行txt完整版
- 补银行卡可以补回以前的卡号吗 补办银行卡需要多久
- 行驶证拍不到排气怎么知道改装
- 工贸行业可燃性粉尘作业场所,工贸行业可燃性粉尘作业场所工艺设施防爆
- Win8如何使用命令行配置IP地址