一、命令

1
2
3
4
5
6
7
** 变量相关性,相关性小于 0.6
corr x1 x2 x3 x4 x5 x6
pwcorr x1 x2 x3 x4 x5 x6

** 多重共线性
coldiag2 x1 x2 x3 x4 x5 x6 //条件数30
collin x1 x2 x3 x4 x5 x6 //VIF值10,条件数30

  ‍

  在实证分析中,需要检验相关性和共线性的变量有核心解释变量、其他解释变量(控制变量)。

  corrpwcorr 计算出来变量间的相关系数,如果其绝对值都小于0.3,则一般认为不存在相关性,或认为相关性很低。

  也可以使用回归的的方法计算出 VIF 值(出自陈强老师的《高级计量经济学(第二版)》第九章):

  image.png

  image.png

  ‍

二、示例

  以下使用美国女性工资的数据,使用 webuse 命令调用即可。

(⚠️注意:不同设备的显示字体不同,可能会出现字符错位的现象。将错位的文本复制到其他文本编辑器 / Stata do 文件编辑器中,可以解决此问题。)  ‍

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
** 调用女性工资数据
webuse womenwk, clear

** 考察年龄、教育程度、婚姻和12岁以下孩子数量之间的相关性
corr age education married children

** 考察年龄、教育程度、婚姻和12岁以下孩子数量之间的多重共线性
collin age education married children

********************* 结果展示 *********************
// 相关性
· corr age education married children
| age educat~n married children
-------------+------------------------------------
age | 1.0000
education | 0.2377 1.0000
married | 0.3459 0.2768 1.0000
children | 0.0343 -0.0344 -0.1052 1.0000

// 多重共线性
· collin age education married children
Collinearity Diagnostics

SQRT R-
Variable VIF VIF Tolerance Squared
----------------------------------------------------
age 1.17 1.08 0.8533 0.1467
education 1.11 1.05 0.9002 0.0998
married 1.21 1.10 0.8285 0.1715
children 1.02 1.01 0.9830 0.0170
----------------------------------------------------
Mean VIF 1.13

Cond
Eigenval Index
---------------------------------
1 4.3149 1.0000
2 0.4305 3.1659
3 0.1966 4.6848
4 0.0382 10.6266
5 0.0197 14.7850
---------------------------------
Condition Number 14.7850
Eigenvalues & Cond Index computed from scaled raw sscp (w/ intercept)
Det(correlation matrix) 0.7792

  ‍