大数据挖掘技术,对大数据挖掘的理解

大数据和数据挖掘的区别?

大数据挖掘技术,对大数据挖掘的理解


数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程 。数据挖掘流程:定义问题:清晰地定义出业务问题,确定数据挖掘的目的 。数据准备:数据准备包括:选择数据–在大型数据库和数据仓库目标中 提取数据挖掘的目标数据集;数据预处理–进行数据再加工,包括检查数据的完整性及数据的一致性、去噪声,填补丢失的域,删除无效数据等 。
【大数据挖掘技术,对大数据挖掘的理解】数据挖掘:根据数据功能的类型和和数据的特点选择相应的算法,在净化和转换过的数据集上进行数据挖掘 。结果分析:对数据挖掘的结果进行解释和评价,转换成为能够最终被用户理解的知识 。数据挖掘的技术,可粗分为:统计方法、机器学习方法、神经网络方法和数据库方法 。统计方法,可细分为:回归分析(多元回归、自回归等)、判别分析(贝叶斯判别、CBR、遗传算法、贝叶斯信念网络等 。

    推荐阅读