数据挖掘技术学习,一文看懂数据挖掘( 三 )


这其中他虽然不懂数据仓库 , 但是简单的Excel就足以胜任高达6万个样本的数据处理;他虽然不懂专业的展示展现技能 , 但是只要他自己看的懂就行了 , 这就无需什么展示展现;前面说过 , 统计技能是应该掌握的 , 这对个人的迷你项目很重要;他虽然不懂编程 , 但是专业挖掘工具和挖掘技能足够让他操练的;这样在迷你项目中 , 一个懂得挖掘技能和市场营销业务能力的人就可以圆满完成了 , 甚至在一个数据源中根据业务需求可以无穷无尽的挖掘不同的项目思路 , 试问就是这个迷你项目 , 单纯的一个数据仓库专家、单纯的一个程序员、单纯的一个展示展现技师、甚至单纯的一个挖掘技术专家 , 都是无法胜任的) 。
这从另一个方面也说明了为什么沟通能力的重要 , 这些个完全不同的专业领域 , 想要有效有机地整合在一起进行数据挖掘项目实践 , 你说没有好的沟通能力行吗?数据挖掘能力只能在项目实践的熔炉中提升、升华 , 所以跟着项目学挖掘是最有效的捷径 。国外学习挖掘的人都是一开始跟着老板做项目 , 刚开始不懂不要紧 , 越不懂越知道应该学什么 , 才能学得越快越有效果 。
我不知道国内的数据挖掘学生是怎样学的 , 但是从网上的一些论坛看 , 很多都是纸上谈兵 , 这样很浪费时间 , 很没有效率 。另外现在国内关于数据挖掘的概念都很混乱 , 很多BI只是局限在报表的展示和简单的统计分析 , 却也号称是数据挖掘;另一方面 , 国内真正规模化实施数据挖掘的行业是屈指可数(银行、保险公司、移动通讯) , 其他行业的应用就只能算是小规模的 , 比如很多大学都有些相关的挖掘课题、挖掘项目 , 但都比较分散 , 而且都是处于摸索阶段 , 但是我相信数据挖掘在中国一定是好的前景 , 因为这是历史发展的必然 。
人工智能这么火 , 数据挖掘和机器学习有什么区别?

数据挖掘技术学习,一文看懂数据挖掘


工作后 , 我首先知道的概念是数据挖掘 , 而不是机器学习 。因此我想数据挖掘这个概念更加广泛 , 属于工程应用范畴 。5年前 , 我单位谈的都是数据挖掘 , 也举办这类竞赛 , 我们也掌握了数据挖掘的应用软件和数据挖掘标准流程 , 比如sas , clementine等数据挖掘平台 。这些平台多数基于图形化操作 , 应用门槛较低 。最近两年才开始谈机器学习 , 深度学习和人工智能等概念 。
从我工作经历来讲 , 数据挖掘是比较大众化的说法 , 单位业务部门都知道这个概念 , 而机器学习属于专业化的说法 , 现在业务部门还不清楚机器学习究竟是什么 。其实很难严格去区分两者的关系 , 看看最权威的数据挖掘和机器学习的教材 , 你会发现它们大部分都是重复的 。既然是两个名称 , 那么它们的侧重点应该是不一样的 。我的理解是数据挖掘的后端与机器学习的前端重复 , 机器学习的后端与深度学习的前端重复 。
数据挖掘的前端是数据收集 , 清洗和处理等 , 和大数据有关 , 都涉及数据仓库等内容 , 但机器学习并不关心这些 , 也就是说数据这种原材料对机器学习来说应该要事先准备好了 , 机器学习更加注重学习问题 , 努力像人类一样学习知识 , 理解世界 。它们最大的区别是:数据挖掘注重挖掘数据中的规律和知识 , 但不关心数据为什么会产生这些规律和知识 , 也就说你只看到表象 , 并不知道本质原因 。

推荐阅读