数据挖掘的十大经典算法,什么是数据挖掘论文( 三 )


数据挖掘的前端是数据收集,清洗和处理等,和大数据有关,都涉及数据仓库等内容,但机器学习并不关心这些,也就是说数据这种原材料对机器学习来说应该要事先准备好了,机器学习更加注重学习问题,努力像人类一样学习知识,理解世界 。它们最大的区别是:数据挖掘注重挖掘数据中的规律和知识,但不关心数据为什么会产生这些规律和知识,也就说你只看到表象,并不知道本质原因 。
【数据挖掘的十大经典算法,什么是数据挖掘论文】而机器学习恰恰相反,机器学习更加注重学习数据的生成机制,即数据究竟由什么概率模型生成的 。有时机器学习也叫统计学习就是这个原因 。数据的生成机制出来了,那么数据中的规律自然而然就知道了 。正是因为机器学习注重数据的生成机制学习,产生大量的研究内容,发展出核机器,极大似然估计,最大熵模型,最大后验估计,期望最大化算法,高斯过程,概率图模型,变分推理等工具 。

推荐阅读