数据挖掘技术学习,一文看懂数据挖掘

大数据和数据挖掘的区别?

数据挖掘技术学习,一文看懂数据挖掘


数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程 。数据挖掘流程:定义问题:清晰地定义出业务问题 , 确定数据挖掘的目的 。数据准备:数据准备包括:选择数据–在大型数据库和数据仓库目标中 提取数据挖掘的目标数据集;数据预处理–进行数据再加工 , 包括检查数据的完整性及数据的一致性、去噪声 , 填补丢失的域 , 删除无效数据等 。
数据挖掘:根据数据功能的类型和和数据的特点选择相应的算法 , 在净化和转换过的数据集上进行数据挖掘 。结果分析:对数据挖掘的结果进行解释和评价 , 转换成为能够最终被用户理解的知识 。数据挖掘的技术 , 可粗分为:统计方法、机器学习方法、神经网络方法和数据库方法 。统计方法 , 可细分为:回归分析(多元回归、自回归等)、判别分析(贝叶斯判别、CBR、遗传算法、贝叶斯信念网络等 。
从零开始 , 如何学习数据挖掘?
数据挖掘技术学习,一文看懂数据挖掘


这个问题思考了很久 , 作为过来人谈一谈 , 建议在看我这篇回答之前先去了解一下数据挖掘的概念和定义 。在学习数据挖掘之前你应该明白几点:数据挖掘目前在中国的尚未流行开 , 犹如屠龙之技 。数据初期的准备通常占整个数据挖掘项目工作量的70%左右 。数据挖掘本身融合了统计学、数据库和机器学习等学科 , 并不是新的技术 。数据挖掘技术更适合业务人员学习(相比技术人员学习业务来的更高效)数据挖掘适用于传统的BI(报表、OLAP等)无法支持的领域 。
数据挖掘项目通常需要重复一些毫无技术含量的工作 。如果你阅读了以上内容觉得可以接受 , 那么继续往下看 。学习一门技术要和行业靠拢 , 没有行业背景的技术如空中楼阁 。技术尤其是计算机领域的技术发展是宽泛且快速更替的(十年前做网页设计都能成立公司) , 一般人没有这个精力和时间全方位的掌握所有技术细节 。但是技术在结合行业之后就能够独当一面了 , 一方面有利于抓住用户痛点和刚性需求 , 另一方面能够累计行业经验 , 使用互联网思维跨界让你更容易取得成功 。
不要在学习技术时想要面面俱到 , 这样会失去你的核心竞争力 。一、目前国内的数据挖掘人员工作领域大致可分为三类 。1)数据分析师:在拥有行业数据的电商、金融、电信、咨询等行业里做业务咨询 , 商务智能 , 出分析报告 。2)数据挖掘工程师:在多媒体、电商、搜索、社交等大数据相关行业里做机器学习算法实现和分析 。3)科学研究方向:在高校、科研单位、企业研究院等高大上科研机构研究新算法效率改进及未来应用 。
二、说说各工作领域需要掌握的技能 。(1).数据分析师需要有深厚的数理统计基础 , 但是对程序开发能力不做要求 。需要熟练使用主流的数据挖掘(或统计分析)工具如SAS)、SPSS、EXCEL、BI工具等 。需要对与所在行业有关的一切核心数据有深入的理解 , 以及一定的数据敏感性培养 。经典图书推荐:《概率论与数理统计》、《统计学》推荐David Freedman版、《业务建模与数据挖掘》、《数据挖掘导论》、《SAS编程与数据挖掘商业案例》、《Clementine数据挖掘方法及应用 》、《Excel 2007 VBA参考大全》、《IBM SPSS Statistics 19 Statistical Procedures Companion》等(2).数据挖掘工程师需要理解主流机器学习算法的原理和应用 。

推荐阅读