AI预测的2018年世界杯为什么不靠谱?( 二 )


错误
正如我们在2018年世界杯上所观察到的 , 没有任何一个预测排名领先的球队进入了半决赛 , 更不用说总决赛了 。 根据世界杯的实际结果和预测 , 模型的根均方误差(RMSE)和平均绝对误差(MAE)计算如下:
RMSE:8.052
MAE:6.468
这两个指标显示了模型的错误 , 以及它在总体上能够准确预测团队排名的程度 。 RMSE和MAE的值都很高 , 这使得模型不可靠 , 尽管团队使用了16个特性和大数据集(收集了过去4届世界杯的数据) , 人工智能机器学习(特别是随机森林)仍然无法可靠地预测结果 。 在本届世界杯上 , 俄罗斯、日本和伊朗的表现明显好于预期 , 而另一方面 , 德国未能晋级 。
为什么人工智能会失败?
在人工智能和机器学习中 , 有适当的数据进行训练和建模是非常重要的 。 但是在这种情况下 , 尽管有适当的数据、相对较大的数据、好的算法和正确的参数 , 训练模型仍表现欠佳 。 这种失败的原因在于 , 我们所预测事物的性质 。
国际足联世界杯就像任何其他基于人类的事件一样 , 在比赛前((不只是16分钟))和比赛期间(至少90分钟)都依赖于太多的因素 , 这就是众所周知的混淆变量(confounding variables) 。 为了正确地预测结果 , 应该模拟每一场比赛的每一分钟 。 每个状态的结果取决于前面的状态 。 这也被称为马尔可夫链过程(Markov Chain Process) 。
一个不正确的模拟状态很容易导致比赛行进中状态的不可靠结果 。
【AI预测的2018年世界杯为什么不靠谱?】除了内部因素外 , 足球比赛的结果也可能受到一些外部因素的影响 , 比如不公平的裁判、天气、政治状况、球员的个人问题等等 。 这些重要的特征通常很难被测量和收集 。 此外 , 总有一些探索的机会和不确定性 。 例如 , 出现一个关键性错误或一个乌龙球 , 这是不容易预测的 。 简单地说 , 像国际足联世界杯或人类活动这样的随机和动态的环境是当今人工智能技术无法很好地发挥作用的领域 。 这是一个很好的例子 , 我们必须关注人工智能在类似的动态领域中的适用性 。 另外 , 由于有一个非常复杂的数据结构 , 对于任何潜在的偏见来说 , 对经过训练的模型进行审查是非常困难的 。 人工智能中存在的偏见会导致对某一特定群体的歧视性决定 。 将这种预测系统作为唯一标准的决策者可能会给个人和公司带来巨大的影响 。 建议政府和企业只把人工智能作为一个用于随机和动态环境预测的辅助决策平台 。

推荐阅读