目录
解决问题回归分类不同的数据类型及处理方法数据收集步骤1.数据预处理2.回归系数的解释3.遗漏变量导致的内生性的解决判定:
4.保证核心变量,控制变量5.解释回归系数4种模型的回归系数的解释虚拟变量
6.判断解释异方差异方差存在的问题解决异方差的问题异方差的假设检验假设检验结果解决异方差先写这一句:操作
7. 多重共线性问题检验多重共线性判定多重共线性解决多重共线性
8.逐步回归分析完全多重共线性的错误解决
一个例子——奶粉代码分析结果拟合优度R^2 很低【不用管——解释性回归】
解决问题
X和Y的相关性
回归分类
不同的数据类型及处理方法
数据收集
步骤
1.数据预处理
excel stata
2.回归系数的解释
3.遗漏变量导致的内生性的解决
判定:
4.保证核心变量,控制变量
5.解释回归系数
一般要取对数
4种模型的回归系数的解释
虚拟变量
定性变量转化 为虚拟变量
解释
6.判断解释异方差
异方差存在的问题
解决异方差的问题
用stata 残差图
异方差的假设检验
一般不用这个
一般用这个 怀特检验
假设检验结果
解决异方差
先写这一句:
操作
7. 多重共线性问题
检验多重共线性
判定多重共线性
VIM > 10 就有
解决多重共线性
剔除多重共线性自变量
8.逐步回归分析
#1 #2 取 0.05 0.01 0.1
完全多重共线性的错误解决
一个例子——奶粉
stata 计算
代码
clear
cls
import excel
"课堂中讲解的奶粉数据.xlsx", sheet("Sheet1") firstrow
summarize 团购价元 评价量 商品毛重kg
tabulate 配方
,gen(A
)
tabulate 奶源产地
,gen(B
)
tabulate 国产或进口
,gen(C
)
tabulate 适用年龄岁
,gen(D
)
tabulate 包装单位
,gen(E
)
tabulate 分类
,gen(F
)
tabulate 段位
,gen(G
)
regress 评价量 团购价元 商品毛重kg
est store m1
reg2docx m1 using m1
.docx
, replace
regress 评价量 团购价元 商品毛重kg A1 A2 A3 B1 B2 B3 B4 B5 B6 B7 B8 B9 C1 C2 D1 D2 D3 D4 D5 E1 E2 E3 E4 F1 F2 G1 G2 G3 G4
est store m2
reg2docx m2 using m2
.docx
, replace
regress 评价量 团购价元 商品毛重kg
, b
regress 评价量 团购价元 商品毛重kg A1 A2 A3 B1 B2 B3 B4 B5 B6 B7 B8 B9 C1 C2 D1 D2 D3 D4 D5 E1 E2 E3 E4 F1 F2 G1 G2 G3 G4
rvfplot
graph export a1
.png
,replace
rvpplot 团购价元
graph export a2
.png
,replace
summarize 评价量
,d
kdensity 评价量
graph export a3
.png
,replace
estat hettest
,rhs iid
estat imtest
,white
regress 评价量 团购价元 商品毛重kg A1 A2 A3 B1 B2 B3 B4 B5 B6 B7 B8 B9 C1 C2 D1 D2 D3 D4 D5 E1 E2 E3 E4 F1 F2 G1 G2 G3 G4
, r
est store m3
reg2docx m3 using m3
.docx
, replace
estat vif
stepwise reg 评价量 团购价元 商品毛重kg A1 A3 B1 B2 B3 B4 B5 B6 B7 B9 C1 D1 D2 D3 D4 E1 E2 E3 F1 G1 G2 G3
, r
pe(0.05)
stepwise reg 评价量 团购价元 商品毛重kg A1 A3 B1 B2 B3 B4 B5 B6 B7 B9 C1 D1 D2 D3 D4 E1 E2 E3 F1 G1 G2 G3
, r
pr(0.05)
generate lny
= log(评价量
)
generate price_square
= 团购价元
^2
generate interaction_term
= 团购价元
*商品毛重kg
rename 团购价元 price
分析结果
拟合优度R^2 很低【不用管——解释性回归】
讨论写一写,直接放进去