如何建立数据分析模型「大数据建模一般有哪些步骤呢」( 六 )


2、ER模型向关系模型的转化
ER模型是概念模型的表示 。要使计算机能处理模型中的信息,首先必须将它转化为具体的DBMS能处理的数据模型 。ER模型可以向现有的各种数据模型转换,而目前市场上的DBMS大部分是基于关系数据模型的, ER模型向关系数据模型的转换方法
关系模型的逻辑结构是一系列关系模式(表)的集合 。将ER模型转化为关系模式主要需解决的问题是:如何用关系表达实体集以及实体集间的联系 。
ER模型向关系模型转换的一般规则和步骤:
(1)将每一个实体集转换为一个关系模式,实体集的属性转换成关系的属性,实体集的码即对应关系的码 。
(2)将每个联系集转换成关系模式 。对于给定的联系R,由它所转换的关系具有以下属性:
联系R单独的属性都转换为该关系的属性;
联系R涉及到的每个实体集的码属性(集)转换为该关系的属性 。转换后关系的码有以下几种情况:
· 若联系R为1∶1联系,则每个相关实体的码均可作为关系的候选码;
· 若联系R为1∶ n联系,则关系的码为n端实体的码;
· 若联系R为m∶ n联系,则关系的码为相关实体码的集合 。
有时,联系本身的一些属性也必须是结果关系的码属性 。
(3)根据具体情况,把具有相同码的多个关系模式合并成一个关系模式 。
如何建立数据分析的思维框架曾经有人问过我,什么是数据分析思维?如果分析思维是一种结构化的体现,那么数据分析思维在它的基础上再加一个准则:
不是我觉得,而是数据证明
这是一道分水岭,“我觉得”是一种直觉化经验化的思维,工作不可能处处依赖自己的直觉,公司发展更不可能依赖于此 。数据证明则是数据分析的最直接体现,它依托于数据导向型的思维,而不是技巧,前者是指导,后者只是应用 。
作为个人,应该如何建立数据分析思维呢?
建立你的指标体系
在我们谈论指标之前,先将时间倒推几十年,现代管理学之父彼得·德鲁克说过一句很经典的话:
如果你不能衡量它,那么你就不能有效增长它 。
所谓衡量,就是需要统一标准来定义和评价业务 。这个标准就是指标 。假设隔壁老王开了一家水果铺子,你问他每天生意怎么样,他可以回答卖的不错,很好,最近不景气 。这些都是很虚的词,因为他认为卖的不错也许是卖了 50 个,而你认为的卖的不错,是卖了 100。
这就是“我觉得”造成的认知陷阱 。将案例放到公司时,会遇到更多的问题:若有一位运营和你说,产品表现不错,因为每天都有很多人评价和称赞,还给你看了几个截图 。而另外一位运营说,产品有些问题,推的活动商品卖的不好,你应该相信谁呢?
其实谁都很难相信,这些众口异词的判断都是因为缺乏数据分析思维造成的 。
老王想要描述生意,他应该使用销量,这就是他的指标,互联网想要描述产品,也应该使用活跃率、使用率、转化率等指标 。
如果你不能用指标描述业务,那么你就不能有效增长它 。
了解和使用指标是数据分析思维的第一步,接下来你需要建立指标体系,孤立的指标发挥不出数据的价值 。和分析思维一样,指标也能结构化,也应该用结构化 。
我们看一下互联网的产品,一个用户从开始使用到离开,都会经历这些环节步骤 。电商APP还是内容平台,都是雷同的 。想一想,你会需要用到哪些指标?
而下面这张图,解释了什么是指标化,这就是有无数据分析思维的差异,也是典型的数据化运营,有空可以再深入讲这块 。

推荐阅读