一、样本删除、保留

1
2
drop if jianyan==0     //删除jianyan取值为0的样本
keep if jianyan==1 //保留jianyan取值为1的样本

  分层随机抽样:

1
2
根据city分层随机抽样20%的样本
sample 20, by(city)

二、_n 和 _N 用法

1
2
3
4
5
6
7
** _n 表示样本排序号
gen n=_n
** 先按x排序,再生成排序号
by x,sort: gen n=_n

** _N 表示总样本量
gen N=_N

  相关链接:_n 和_N 的定义、例示和 Stata 应用 - 知乎 (zhihu.com)