大数据、数据分析和数据挖掘的区别是什么?
对于很多人来讲 , 这几个概念经常分不清 , 我当初入门的时候也一样 , 只不过那时候没有大数据的概念 , 作为一个数据分析从业者 , 其实并不需要关注这些名字直接的本质区别 , 只要明白一件事 , 数据最终是为了决策服务 。鉴于大家对此还是有些好奇 , 这里我大概说说我的理解 , 希望和各位有所交流 , 不足之处还望大家指正 。先看看数据分析与数据挖掘的区别:首先要搞懂 , 什么是数据 , 什么是信息 , 这两者本质的区别就是数据是存在的 , 不用人脑 , 而信息是需要人脑进行处理 , 上面意思呢?比如你装修完了房子 , 打算开始买家具 , 那么第一件事就是用尺子量房屋各处的长度和宽度 , 这些都是可以主观的看到的 , 客观存在的 , 这就是数据 , 而信息则不同 , 例如你要去买沙发 , 你会说 , 我们放5米的沙发刚好 , 4米的有些短 , 看着不大气 , 6米的太大了 , 看着不美观 , 那这种就属于信息 , 是需要人们经过大脑去判断的 , 属于主观 , 判断的依据就是数据(客观存在) 。
其次 , 数据分析是对客观存在的已知的数据 , 通过各类维度的分析 , 得出一个结论 , 例如我们发现用户注册量下降:可以从:区域上看 , 某区域的注册量下降了x%渠道方面 , 搜索引擎带来的注册了下降了X%年龄来看 , 20岁~30岁的注册量下降了X%等等 , 这样不同的业务类型去看过去一段时间发展的趋势来做结论判断 。数据挖掘则更注重洞察数据本身的关系 , 从而获得一些非显型的结论 , 这是我们从数据分析中无法得到了 , 例如关联分析可以知道啤酒与尿布的关系、决策树可以知道你购买的概率、聚类分析可以知道你和谁类似 , 等等 , 重在从各个维度去发现数据之间的内在联系因此两者的目的不一样 , 数据分析是有明确的分析群体 , 就是对群体进行各个维度的拆、分、组合 , 来找到问题的所在 , 而数据发挖掘的目标群体是不确定的 , 需要我们更多是是从数据的内在联系上去分析 , 从而结合业务、用户、数据进行更多的洞察解读 。
举个例子来理解一下:比如一个分析师一直单身 , 想去找一个女朋友 , 他可以很迅速的知道这个女孩的身高、收入、学历等 , 但无法从这些数据中获知这个女孩是不是适合自己、她的性格如何 , 这时我们就需要从一些日常行为的数据进行推断 , 一种是主观的推断 , 我觉得、我估计、我认为 , 不可能在一起另一种是客观 主观的推断 , 比如整合微博数据(可以知道微博的内容、发送行为、关注的领域等) , 和自己的行为进行数据挖掘 , 来看看数据内在的匹配度有多高 , 这时候 , 你会说 , 我们在一起的概率有90% , 从而建立信心 , 开始行动.....当然统计学上讲 , 100%的概率都未必发生 , 0%的概率都未必不发生 , 这只是小概率事件 , 不要让这个成为你脱单的绊脚石 。
推荐阅读
- 监控摄像机的功能,十大监控摄像头品牌排行榜
- Linux内核版本介绍与查询,安卓6.0 linux内核版本
- Android历史版本,android历史重大版本
- 腾讯联通大王卡怎么申请 联通腾讯大王卡申请官网
- 腾讯大王卡移动卡可以办吗 移动大王卡和花卡哪个好
- 电信19元大王卡怎么样 19元电信王卡套餐
- 三星老款翻盖手机大全 联想翻盖手机大全老款
- 十大自由度超高的手游 盘点那些自由度超高
- 扁平比大小会影响什么
- 2020世界手机排行榜前十名 手机十大品牌排行榜