核心是以一种精细驱动的思维
优点:适合处理大数据,数据量越大其优越性越大
分析导向示例
用户统计维度:性别、年龄、学历用户行为维度:注册用户、用户偏好、用户兴趣、用户流失消费维度:消费金额、消费频率、消费水平商品维度:商品品类、商品品牌、商品属性应用
注:这里的学院是总称
仅从上面数据来看,女生录取人数是男生的两倍,可以得出该学院都是女多男少,但是从下面的详细数据来看,法学院的男生录取人数比女生人数多,但是由于其申请的男生多,从而拉低了男生的录取率,因此并不能从总录取男女人数而得出所有学院都是男少女多,这就是辛普森悖论。
缺点:容易产生辛普森悖论(可通过钻取的方法避免)
一种启发性思考驱动的思维
常用流程:假设-验证-判断,如,假设…成立,则…;假设…不成立,则…。
优点:当没有直观数据或者线索能分析时,以假设先行的方式进行推导,这是一个论证的过程。
应用
1.对数据进行加工的思维
2.常用方法有线性加权、反比例、取对数
- 线性加权:按照重要程度给予权重值 - 反比例:使数据收敛到0-1 - log:让数字减小3.优点:目标驱动性强
4.举例
线性加权
解读:Uvalue为都给一样的权重,UvaluePro则是按照实际情况对不同数据指标给予其重要程度值,即权重。
反比例计算用户忠诚度
解读:反比例函数使其收敛于0-1,再根据数据指标在实际业务中的重要程度给予权重
log计算热度精益数据分析一书中指出好的数据指标,一定是比例或比率;好的数据分析,一定会用到对比。
是一种挖掘数据规律的思考方式
对比方案
竞争对手对比类别对比特征与属性对比时间同比环比转化对比前后变化对比案例:孤数不证
好奇心,要有探索欲和批判性思维(尤其是对待业务指标时)
啤酒与尿布的故事生活中的练习
生活中的练习