在较新的 Stata 上打开旧版的数据,可能会因中文字符编码问题导致乱码。

可以将待转码的数据复制到一个转码文件夹中,使用以下命令对数据进行转码:

1
2
3
4
5
6
** 解决旧版stata数据中文乱码问题,星号表示通配符
clear
cd "C:\Users\Desktop\转码" // 新建一个转码文件夹,然后修改自己的路径
unicode encoding set gb18030
unicode analyze *
unicode translate *, invalid

如果上述操作无法解决乱码问题,可以考虑将通配符改为具体的文件名。

例如:

1
2
3
4
5
clear
cd "C:\Users\Desktop\转码" // 新建一个转码文件夹,然后修改自己的路径
unicode encoding set gb18030
unicode analyze 流动人口数据个人问卷2018.dta // 文件名根据自己的数据进行调整
unicode translate 流动人口数据个人问卷2018.dta, invalid // 文件名根据自己的数据进行调整

转码后结果如下:

相关链接:

  stata 乱码解决方案说明 - 简书 (jianshu.com)Stata15:一次性转码,解决中文乱码问题 - 知乎 (zhihu.com)Stata 中文乱码顽疾解决方法 (360doc.com)


  以下数据转码命令来自计量经济圈的分享,不能保证可以解决问题。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
*******以下是 do 文档的方式***** 
unicode analyze *.do
unicode encoding set gbk
unicode translate *.do
*******以下是 dta 文档的方式*****
clear
unicode encoding set GB2312
unicode analyze *.dta
unicode encoding set gbk
unicode translate *.dta

****** CFPS数据库乱码解决 ********
cd "C:\Users\hp\Desktop\CFPS_2016_child_dta"
unicode analyze cfps2016child_201709.dta
unicode encoding set gb18030
unicode translate cfps2016child_201709.dta
use "cfps2016child_201709.dta",clear

*对变量名、变量标签、字符型变量取值转码
foreach v of varlist _all {
* 对字符型变量取值进行转码
local type: type `v' //将变量的类型放入宏 type 中
if index("`type'", "str") { //如果变量是字符型变量,使用 ustrfrom() 函数进行转码
replace `v' = ustrfrom(`v', "gb18030", 1)
}
* 对变量标签进行转码
local lbl: var label `v' //将变量的标签放入宏 lbl 中
local lbl = ustrfrom("`lbl'", "gb18030", 1) //使用 ustrfrom()函数对`lbl'转码
label var `v' `"`lbl'"' //将转码后的字符串作为变量的标签
* 对变量名进行转码
local newname = ustrfrom(`"`v'"', "gb18030", 1) //使用 ustrfrom()函数将变量名字符串进 行转码
rename `v' `newname' //将转码后的字符串重命名为变量名
}
*引用源自:以上(循环)命令截取自爬虫俱乐部腾讯课堂

****** CLDS数据库乱码解决 ********
cd "C:\Users\hp\Desktop\CLDS\CLDS2012"
unicode analyze CLDS2012househould.dta /*替换 CLDS2012househould.dta 即可*/
unicode encoding set gb18030
unicode translate CLDS2012househould.dta
use "CLDS2012househould.dta",clear /*检查是否完成*/

**********标签解决****************
label save using cldslabel.do, replace
*引用其中的 cldslabel.do 即可