数据清洗|Stata计算收入不平等指标
使用 egen_inequal
包提供的 inequal
函数可以方便快捷地测算各分组样本的多个收入不平等指标。假设在一个面板数据中,要计算分年份、分区县的基尼系数,可以使用下面的命令:
1 | ** 安装 inequal 函数: 仅首次使用前需要安装 |
使用 inequal
函数可以对分组后的样本计算多种收入不平等指数,但是在计算时,需要注意:
- 分组变量(例如上面的
year
、cid
)必须是数值型变量,否则所有样本的计算结果为缺失值.
- 收入小于等于 0 的样本不会纳入计算,因此计算结果为缺失值
.
对于分组变量的变量类型问题,可以使用 destring
或者
encode
命令,将分组变量转换为数值型变量;对于收入不大于 0
的样本计算出的结果是缺失值的问题,使用区县编码 cid
和年份
year
分组计算出的分年份、分地区的基尼系数后,每一组内样本的取值都是相同的,因此可以使用
ereplace
命令配合mean
函数补充,填充效果为使用本年份、本地区其他人的基尼系数取值替换掉基尼系数取值为缺失值的样本取值。
1 | ** 组合命令 |
当然,inequal
函数也可以计算其他不平等指标,只需要修改上述命令中 index()
部分即可:
1 | ** code function |
相关链接:
转载请联系作者,并注明文章来源 https://fgzfgz.github.io
评论