mysql必知必会pdf,SQL必知必会( 三 )


掌握一门优秀的编程语言,可以让数据分析师事半功倍,升职加薪,迎娶白富美 。这里有两条支线,学习R语言或Python 。速成只要学习一条,以后再补上另外一门 。R的优点是统计学家编写的,缺点也是统计学家编写 。如果是各类统计函数的调用,绘图,分析的前验性论证,R无疑有优势 。但是大数据量的处理力有不逮,学习曲线比较陡峭 。
Python则是万能的胶水语言,适用性强,可以将各类分析的过程脚本化 。Pandas,sklearn等各包也已经追平R 。如果学习R,建议看《R语言实战》,照着书本打一遍代码,一星期绰绰有余 。另外还有一本《统计学》,偏知识理论,可以复习前面的统计学知识 。R学习和熟悉各种包 。知道描述性统计的函数 。掌握DataFrame 。
如果时间有余 。可以再去学习ggplot2 。Python拥有很多分支,我们专注数据分析这块,入门可以学习《深入浅出Python》 。需要学会条件判断,字典,切片,循环,迭代,自定义函数等 。知道数据领域最经典的包Pandas Numpy 。在速成后的很长一段时间,我们都要做调包侠 。这两门语言最好安装IDE,R语言我建议用RStudio,Python我建议用 Anaconda 。
都是数据分析的利器 。Mac自带Python2.7,但现在Python 3已经比几年前成熟,而且没有编码问题 。各类教程也足够多,不要抱成守旧了 。Win的电脑,安装Python会有环境变量的问题,是个大坑(R的中文编码也是天坑) 。到这里,刚刚好是七周 。如果还需要第八周 ,则是把上面的巩固和融会贯通,毕竟速成是以转岗或拿offer为目的 。
零基础如何入门数据分析?

mysql必知必会pdf,SQL必知必会


零基础入门数据分析,建议先从Excel开始,因为Excel是数据分析最常用的工具,功能强大,入门容易 。从Excel开始Excel需要学习的有3点,Excel公式、数据透视表和Excel图表 。1、Excel公式2、数据透视表3、Excel图表学习一些SQL基础接着建议学习MySQL,因为数据分析跟数据打交道,懂点sql知识还是很有必要的 。
懂点统计学理论很有必要统计学是必须的,不懂统计学根本算不上数据分析师,具体内容有:统计学基础、参数估计、假设检验、方差分析、线性回归、时间序列、聚类分析、主成分分析及因子分析等 。SPSS分析工具除了Excel,推荐SPSS,使用广泛,容易上手 。因为统计学很有些分析方法通过Excel就可以搞定;有些不行,必须通过其他工具才能搞定,例如多元线性回归、聚类分析、主成分分析及因子分析,都需要用到SPSS 。
在掌握了统计学的基础上,在学习SPSS是很容易的,因为SPSS只是一个工具而已 。编程学习(可选)另外,有精力的话,懂点编程也是必须的,因为用Excel做数据分析,少量数据(大约几十万甚至百万)没有问题,但是再大一点的数据通过程序来程序会更高效 。1、Python/RPython和R都可以,R在数据分析方面更加强大,也更成熟,但是想往机器学习方向发展的话,Python还是主流语言,推荐学习Python 。
如何系统的学习数据可视化?
mysql必知必会pdf,SQL必知必会


数据可视化不是一个单独存在的概念,是数据分析流程上的闪光点 。作为数据分析的最后一环,可视化是对数据进行解读和展示,让繁杂的数据用更加直观的图表状态展示出来,是一种传达数据分析结果的手段 。很多时候,将数据进行可视化处理可能比前面的数据分析更重要 。经过了漫长的分析过程后,如何将数据更好的呈现出来变成了数据分析师们要考虑的点 。

推荐阅读