Raydata,raydata( 二 )


这里送三条金句:一个业务没有指标 , 则不能增长和分析好的指标应该是比率或比例好的分析应该对比或关联 。举一个例子:我告诉你一家超市今天有1000人的客流量 , 你会怎么分析?这1000人的数量 , 和附件其他超市比是多是少?(对比)这1000人的数量比昨天多还是少?(对比)1000人有多少产生了实际购买?(转化比例)路过超市 , 超市外的人流是多少?(转化比例)这是一个快速搭建分析框架的方法 。
如果只看1000人 , 是看不出分析不出任何结果 。第四周:数据库学习Excel对十万条以内的数据处理起来一点不虚 , 但是资深的数据分析师还是笑摸狗头 , Too Young Too Sample , 爷搞得都是百万数据 。要百万数据 , 就得上数据库 。SQL是数据分析师的核心技能之一 。有些公司并不给数据库权限 , 需要分析师写邮件提需求 , 这非常不好 。
数据分析师经常有各类假设需要验证 , 很多时候写十几行SQL就能得到的答案 , 还得麻烦其他部门导出数据 。SQL学习不需要买书 , W3C学习就行了 , SQL 教程 。大多数互联网公司都是MySQL , 我也建议学 , 性价比最高 。作为数据分析师 , 只要懂Select相关 , 增删改、约束、索引、数据库范式全部略过 。你的公司心得多大才会给你写权限 。
了解where , group by , order by , having , like , count , sum , min , max , distinct , if , join , left join , limit , and和or的逻辑 , 时间转换函数等即可 。你看 , 和Excel的函数都差不多 。如果时间充裕 , 则学习row_number , substr , convert , contact等 。
和Excel一样 , 学会搜索解决问题 。不同引擎的函数也会有差异 , 例如Presto和phpMyAdmin 。期间你不需要考虑优化和写法丑陋 , 查询几秒和几分钟对数据分析师没区别 , 跑数据时喝杯咖啡呗 , 以后你跑个SVM都能去吃饭了 。网上搜索SQL相关的练习题 , 刷一遍就行 。也能自己下载数据库管理工具 , 找些数据练习 。
我用的是Sequel Pro 。第五周:统计知识学习统计学是数据分析的基础之一 。统计知识会要求我们以另一个角度看待数据 。当你知道AB两组的差异用平均值看是多傻的事情 , 你的分析技巧也会显著提高 。这一周努力掌握描述性统计 , 包括均值、中位数、标准差、方差、概率、假设检验、显著性、总体和抽样等概念 。详细的数学推导不用细看 , 谁让我们是速成呢 , 只要看到数据 , 知道不能怎么样 , 而是应该这样分析即可 。
Excel中有一个分析工具库 , 简单强大 。对列1的各名词做到了解 。如果是多变量多样本 , 学会各种检验 。《统计数字会撒谎》休闲读物 , 有趣的案例可以让我们避免很多数据陷阱 。深入浅出统计学 (豆瓣)还是经典的HeadFirst系列 , 适应它一贯的啰嗦吧 。多说一句 , 老板和非分析师不会有兴趣知道背后的统计学原理 , 通常要的是分析后的是与否 , 二元答案 。
不要告诉他们P值什么的 , 告诉他们活动有效果 , 或者没效果 。第六周:业务学习(用户行为、产品、运营)这一周需要了解业务 。对于数据分析师来说 , 业务的了解比数据方法论更重要 。当然很遗憾 , 业务学习没有捷径 。我举一个数据沙龙上的例子 , 一家O2O配送公司发现在重庆地区 , 外卖员的送货效率低于其他城市 , 导致用户的好评率降低 。

推荐阅读