北京时间2022年7月8日晚上22:30 , 鄂维南院士在2022年的国际数学家大会上作一小时大会报告(plenary talk) 。今天我们带来鄂老师演讲内容的分享 。鄂老师首先分享了他对机器学习数学本质的理解(函数逼近、概率分布的逼近与采样、Bellman方程的求解);然后介绍了机器学习模型的逼近误差、泛化性质以及训练等方面的数学理论;最后介绍如何利用机器学习来求解困难的科学计算和科学问题,即AI for science 。文章作者Hertz 。
机器学习问题的数学本质
众所周知 , 机器学习的发展,已经彻底改变了人们对人工智能的认识 。机器学习有很多令人叹为观止的成就,例如:
· 比人类更准确地识别图片:利用一组有标记的图片,机器学习算法可以准确地识别图片的类别:
Cifar-10 问题:把图片分成十个类别
来源:https://www.cs.toronto.edu/~kriz/cifar.html
· Alphago下围棋打败人类:完全由机器学习实现下围棋的算法:
参考:https://www.bbc.com/news/technology-35761246
· 产生人脸图片 , 达到以假乱真的效果:
参考:https://arxiv.org/pdf/1710.10196v3.pdf
机器学习还有很多其他的应用 。在日常生活中,人们甚至常常使用了机器学习所提供的服务而不自知,例如:我们的邮件系统里的垃圾邮件过滤、我们的车和手机里的语音识别、我们手机里的指纹解锁……
所有这些了不起的成就,本质上 , 却是成功求解了一些经典的数学问题 。
?
对于图像分类问题,我们感兴趣的其实是函数
:
: 图像→类别
函数
把图像映射到该图像所属的类别 。我们知道
在训练集上的取值,想由此找到对函数
的一个足够好的逼近 。
一般而言,监督学习(supervised learning)问题,本质都是想基于一个有限的训练集S,给出目标函数的一个高效逼近 。
?
对于人脸生成问题,其本质是逼近并采样一个未知的概率分布 。在这一问题中,“人脸”是随机变量 , 而我们不知道它的概率分布 。然而,我们有“人脸”的样本:数量巨大的人脸照片 。我们便利用这些样本,近似得到“人脸”的概率分布 , 并由此产生新的样本(即生成人脸) 。
一般而言,无监督学习本质就是利用有限样本 , 逼近并采样问题背后未知的概率分布 。
?
对于下围棋的Alphago来说,如果给定了对手的策略,围棋的动力学是一个动态规划问题的解 。其最优策略满足Bellman方程 。因而Alphago的本质便是求解Bellman方程 。
一般而言,强化学习本质上就是求解马尔可夫过程的最优策略 。
推荐阅读
- 刑事犯罪找律师多少钱 犯罪后找律师怎么收费
- 大学生返乡社会实践注册后怎么报名参加
- 乐平市律师费一般怎么算,乐清律师收费标准
- 无锡春节免费景点怎么取消预约
- 海马s5有定速巡航吗 海马s5定速巡航怎么使用说明
- 如何制作长图 朋友圈长图片怎么制作
- 斯巴鲁有定速巡航吗 斯巴鲁有定速巡航吗怎么用
- 乐游无锡平台怎么预约春节免费景点2023
- 乐游无锡平台免费景点怎么看有没有预约成功
- 乐游无锡平台预约的春节免费景点怎么取消