数据清洗专题视频|CFPS隔代照料问题的讨论
视频目录
附件:
【附件】录屏与随手记内容下载链接:https://pan.baidu.com/s/1qema_mVZ-W3FmmgB4hyu9A?pwd=8ui5
数据清洗专题视频|使用公开数据库测算家庭规模
视频合集
附件:
录屏、数据的部分变量、do文件,下载链接:链接:https://pan.baidu.com/s/1NPmzfPcl_jHVLAy28szuWw?pwd=wnrc
12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364/* 使用公开数据库测算家庭规模\成员数量日期:2023年1月3日类型:1. 已汇报 —— CFPS 2. 长数据 —— CHFS 3. 宽数据 —— CSS CFPS - 中国家庭动态追踪调查 北京大学CSS - 中国社会状况综合调查 中国社会科学院CHFS - 中国家庭金融调查 西南财经大学 */* 什么是家庭成员?* 1. 有经济往来的成员 (eg:共享收入&共担支出)* 2. 同住成员 (同吃/同住——是否一年内同住3\6个月以上)* 3. 户籍成员* 4. 家庭主事人/户主认定的家庭成员* 5. ......cd &qu ...
数据清洗专题视频|使用逐年气象数据生成面板数据
视频合集
附件:
录屏文件与do文件下载链接:https://pan.baidu.com/s/1MqhgojKIbuwRSQ2ngLNEog?pwd=9sro
1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556/* Do File Note: 逐年气象数据转化为Stata格式的面板数据 1. 数据导入 —— CSV/xlsx-->DTA —— import; 2. 数据接驳 —— append; 3. 数据匹配 —— merge 。 */cd "C:/Users/wugan/Desktop/20230101-气象数据合并"** 1. 数据导入、数据接驳*** 1.1 数据——风速/日照/降水/湿度global sheet "风速 日照 降水 湿度"foreach s of global sheet { // 数据导入 forvalues y=2000/2 ...
《2030年可持续发展议程》各项可持续发展目标和具体目标全球指标框架
联合国《2030 年可持续发展议程》各项可持续发展目标和具体目标全球指标框架:
百度网盘下载链接,提取码: f7yr
联合国官网
可持续发展目标:
No Poverty:在世界各地消除一切形式的贫困
Zero Hunger:消除饥饿,实现粮食安全、改善营养和促进可持续农业
Good Health and Wellbeing:确保各年龄段人群的健康生活方式,促进他们的福祉
Quality Education:确保包容和公平的优质教育,让全民终身享有学习机会
Gender Equality:实现性别平等,增强所有妇女和女童的权能
Clean Water and Sanitation:为所有人提供水和环境卫生并对其进行可持续管理
Affordable and Clean Energy:确保人人获得负担得起的、可靠和可持续的现代能源
Decent Work and Economic Growth:促进持久、包容和可持续经济增长,促进充分的生产性就业和人人获得体面工作
Industry, Innovation and Infrastructure:建造具备抵御灾害能力的基础设施,促进具有 ...
实证|显著性相关
相关链接:注意⚠️:本文为相关链接的收藏合集,链接内容非本人原创文章。
1. 显著性的含义君泉计量 - 抛弃p值?经济显著性与统计显著性
2. 不显著怎么办?刘西川阅读写作课 - 不显著,怎么办?
知乎 - 自变量因变量的线性关系不显著怎么办?
连享会 - 加入控制变量后结果悲催了!
知乎 - Stata面板数据结果不显著该怎么办?
连享会 - 0.0005:估计系数太小怎么办?
3. 调整显著性OneStata - OneClick 5.0 较大的更新与显著的进步(显著性调整神器)
OneStata - ChatGPT-对回归结果不显著的几点建议
模型|广义倾向得分匹配 (Generalized Propensity Score Matching, GPSM)
相关链接:注意⚠️:本文为相关链接的收藏合集,链接内容非本人原创文章。
[计量经济圈] 广义PSM,连续政策变量因果识别的不二利器
[计量经济圈] 广义倾向得分匹配GPSM实证数据, 代码和相关解读结果公开!
[知乎] GPSM拓展|严重偏态处理变量在广义倾向得分中的处理
[知乎] 政策评估方法引荐|广义倾向得分匹配(GPSM)
[中国工业经济] “减碳”政策制约了中国企业出口吗
[The Stata Journal] A Stata package for the estimation of the dose–response function through adjustment for the generalized propensity score
[MPRA] Estimating the dose-response function through the GLM approach
[The Stata Journal] Estimating the dose–response function through a generalized linear model appr ...
实证|机制分析
相关链接:注意⚠️:本文为相关链接的收藏合集,链接内容非本人原创文章。
1. 机制分析概述计量经济圈 - 又被拒稿了!机制检验除了中介效应还有其他方法吗?
计量经济圈 - 实证机制分析那些事,机制分析什么鬼?
计量经济圈 - 关于影响机制的分析思路和实操策略, 我们能够做的就只有这么多了!
计量经济圈 - 一文彻底弄懂调节(交互)效应, 中介(机制)效应, 控制(混淆)变量等内容
计量经济圈 - 实证研究中是用理论框架还是概念框架呢? 这次弄懂区别
2. 中介效应CNKI - 心理科学进展: 中介效应分析:方法和模型发展 by 温忠麟、叶宝娟
计量经济圈 - 操作讲解中介效应机制分析:原理, 程序, Bootstrap方法及其应用
计量经济圈 - 我最近看到AER, JPE文章, 人家用的就是类似中介效应三步走方法
计量经济圈 - 在机制分析中必须是正向的中间影响路径吗?负向的影响路径可以吗?
连享会 - Stata+R:一文读懂中介效应
连享会 - Stata:中介效应分析新命令-sgmediation2
计量经济圈 - 中介效应检验流程, 示意图公布, 不再畏惧中介分析
3. 因果 ...
模型|分位数回归 (Quantile Regression, QR)
相关链接:注意⚠️:本文为相关链接的收藏合集,链接内容非本人原创文章。
Prof. Koenker - Quantile Regression
连享会 - 分位数回归及Stata实现
连享会(知乎) - 分位数回归及Stata实现
连享会 - qregplot:分位数回归图示
连享会 - Stata:无条件分位数回归及应用
ResearchGate - Quantile regression in R: a vignette by Roger Koenker
计量经济圈 - 广义分位数回归和分位数处理效应, 用数据, 代码和code进行操作
计量经济圈 - 无条件分位数回归: 文献综述与应用实例
计量经济圈 - 广义分位数回归是什么, 新的前沿因果推断方法介绍!
实证|异质性分析
相关链接:注意⚠️:本文为相关链接的收藏合集,链接内容非本人原创文章。
1. 异质性分析的含义与原理连享会 - DID最新进展:异质性处理条件下的双向固定效应DID估计量 (TWFEDD)
知乎 - 学术苑:异质性效应问题
连享会 - 异质性分析!异质性分析!
2. 异质性分析方法2.1 汇总文章连享会 - Stata:异质性稳健DID估计量方法汇总
2.2 异质性分析模型连享会 - 异质性分析:系数平滑可变模型
连享会 - Stata因果推断:hettreatreg-用OLS估计异质性处理效应
2.3 交互项与分组回归计量经济圈 - 交互项有什么用?为啥要做异质性分析?
计量经济圈 - 异质性分析用来检验中间传导机制, 分组回归或交互项就可以完成机制分析
计量经济圈 - 交互项与分组回归的区别是什么? 异质性分析
2.4 分位数回归- 待更新 -
2.5 异质性处理效应计量经济圈 - AER文的数据和代码可下载供复制结果! 双重差分法和异质性处理效应分析范文
3. 论文与代码计量经济圈 - 中文顶刊上关于零工经济的研究, 思路和方法借鉴的是这篇金融TOP刊文章?
实证|工具变量相关
相关链接:注意⚠️:本文为相关链接的收藏合集,链接内容非本人原创文章。
君泉计量 - IV 估计:工具变量不外生时也可以用!
连享会 - Stata:testex-控制函数法中排他性约束的检验和应对
君泉计量 - 论文复现:装模做样的IV
社科学术汇 - 工具变量估计:假设、陷阱和指南
Sangmin S. Oh - Plausibly Exogenous Galore (外文期刊上的工具变量列表)
近似外生工具变量文献.xlsx
实证|稳健性检验
实证分析的结果,是基于数据本身的分析,可以把这个过程理解成一个计算器,它本身并没有实际意义,是需要结合专业背景与现实才有意义,而很多因素都会影响到计量结果,例如样本的数量、数据的分布、变量的选择、变量的取值、变量的定义、有没有用对实证模型、实证模型用对了但设置有没有问题…..
因此,要通过一些手段,排除可能造成计算器算出的结果扭曲实际因果关系的可能性。
简而言之,稳健性检验有三种方法:
更换/调整数据:
通常通过变更样本实现,例如添加样本、删减样本、分样本回归
部分论文通过更换数据集实现
更换/调整变量:
变更核心解释变量或被解释变量的定义
调整其他解释变量:即更换、添加、删除部分控制变量实现
有的论文会通过加入和不加入其他解释变量来进行验证
更换/调整模型:对回归的方法或参数进行调整。例如,更换工具变量法估计的命令,通过不同的模型来验证结果的可靠性。在截面数据中,一些论文也会采取主回归考虑内生性、稳健性检验不考虑内生性的做法。
(原文链接:Link 1、Link 2)
相关链接:注意⚠️:本文为相关链接的收藏合集,链接内容非本人原创文章。
知乎 - 连玉君: 稳健性检验 ...
数据清洗|比较两个变量取值是否相同
方法一:在数据清洗过程中,有时需要检查两个变量的取值是否相等。使用下述命令可以进行检验。当 a、b 两个变量完全相同时,Stata 的结果窗口将会显示红色的“OK”;当 a、b 两个变量不相同时,结果窗口则会显示蓝色的“not ok”字样。
123456if a==b {dis in red "ok"}else if a!=b {dis in blue "not ok"}
上述命令仅在满足以下条件时才会显示“OK”字样:
两个变量的所有取值完全相同
变量格式相同
方法二:对于数值型变量,也可以考虑通过减运算,来比较两个变量的取值。例如:
12gen gap = a - btab gap
只要观察 tab 的结果,即可知道有多少样本的 a、b 变量的取值不同。
更多关于两个变量的大小关系,可以查看:
1.2 Stata 的IF条件用法 - 知乎 (zhihu.com)
当然,对于数值型变量也可以使用 diff 函数来检验。
参考资料:如何判断两个变量是否相等? - Stata专版 - 经管之家(原人大经 ...
CMDS数据使用注意事项
中国流动人口动态监测调查数据 (CMDS) 是社会科学领域被广泛使用的公开数据之一,目前公开的数据到2018年。
点击这个链接,可以申请CMDS数据:数据申请 (chinaldrk.org.cn)
然而,一些朋友使用的 CMDS 数据,是从公众号获取、闲鱼等平台购买或者经管之家购买的,使用 CMDS 数据时需要注意以下几点:
CMDS 不是追踪调查数据,每年的调查数据都是重新抽样的;
使用非官方获取的 2018 年数据,可能存在问题
这里重点说第二点问题,即非官方获取的 2018 年数据存在的问题。
1. 数据年份错误 一些非官方获取的 2018 年数据,数据其实是2017年的数据。典型问题是样本总量,2017 年的样本总量是169,899个样本,一些公众号/卖家将2017年数据修改文件名、删除部分变量后,以 2018 年数据的名义售卖。
因此,在使用非官方数据 (特别是2018年) 时,需要特别注意样本量问题。如下图,某公众号宣称的2018年CMDS数据,实际是169899样本的2017年数据(CSV格式的表格,第一行为表头,即变量名)。
乱码 ...
公开数据库的地理位置信息相关问题
现在社会科学研究中,常用的数据库包括了CFPS、CLDS、CHFS、CMDS、CGSS、CSS、CHNS、CHARLS等,一些研究中需要一些区县或地级市的数据与微观数据进行匹配,但多数调查因保护受访者隐私的需要,没有公布地理位置信息。
下面是一些关于公开数据中城市、区县地理信息公开情况的讨论。
数据采集|如何搜集中国各级行政区的宏观数据
原文链接
各级行政区的数据:
全国和省级行政区的宏观数据:①国家统计局;②全国各种统计年鉴;③各省的统计年鉴
地级市的宏观数据:①国家统计局官网会统计部分重点城市的月度、季度、年度检测数据与统计数据;②《城市统计年鉴》,③各省统计年鉴,④各地级市统计年鉴
县级市:①《城市统计年鉴》,②各省统计年鉴,③各地级市统计年鉴
区、县宏观数据:①各省统计年鉴,②各地级市统计年鉴
乡镇级数据可用度不高(指标很少),不建议找,行政村级的统计数据基本上没有,如果有需要可以考虑去乡镇、村所在的区/县的统计部门申请(有的可以通过依申请公开流程申请,详见所在县人民政府网站)。
先找统计局的数据,再来找统计年鉴的数据,最后考虑第三方数据网站、数据平台的数据。
统计局会权威、官方,更重要的是会根据抽样调查和各种普查数据对已发布的数据进行修正、更新。
统计年鉴的数据权威且来自官方,但不会定期修正已发布数据。
第三方数据往往收费,且许多数据来源不唯一、不够可靠,多数第三方数据库的数据虽然全,但数据来源标注不够清晰,很多数据甚至没有明确来源,部分数据与官方发布的数据可能有较大出入,慎用。
注意:
所有国家统计局统计 ...
模型|断点回归 (Regression Discontinuity, RD)
相关链接:注意⚠️:本文为相关链接的收藏合集,链接内容非本人原创文章。
数量经济学 - 2023最新必读的断点RD教程及复现网站(附代码+案例应用)
连享会 - Stata:pzms-RDD和RKD的最优模型选择
连享会 - 倒U型+RDD:利用断点回归检验 U 形关系
数量经济学 - 断点回归经典案例:民主党当选对该选区联邦支出影响
君泉计量 - RDD-断点回归:实践指南
数量经济学 - Stata: 不可不知的4种断点回归 (RDD) 中的平滑性检验方法
软件|zotero中文论文参考文献信息作者姓氏和名字分离的问题
使用 Zotero Connector 插件保存知网论文时,作者的姓氏和名字会被分开,在引用时会出现只有姓氏的情况。
修改【CNKI.js】文件或者选择合适的 CSL 引用格式,可以解决此问题。
修改【CNKI.js】文件,新加入的中文文献,作者的姓氏和名字会被合并,显示在作者的姓氏中,已有的文献不会做修改。
优点:简单
缺点:zotero重装、多端同步后可能出错,使得新加入的文献再次出现只有姓氏的问题。
使用合适的 CSL 引用格式,不论新加入的还是已有的文献,都不会有问题
优点:以前的文献不用重新导入
缺点:CSL 的格式如果不符合自己投稿期刊的需求,修改比较麻烦。
方法一:修改【CNKI.js】文件
具体操作如下:
1. 找到文件存放位置:打开【首选项—高级—文件和文件夹】,点击【打开数据文件夹】
2. 打开文件夹后,在【zotero—translators】文件夹中,找到【CNKI.js】文件,使用文本编辑器或者其他可以打开 js 文件的编辑器打开。(我使用的是VS code,需要输入字母【i】后才可以编辑。)
3. 搜索【Chinese ...
数据清洗专题视频|CFPS/CLDS/CMDS等公开数据库的数据清洗
视频合集
附件:
录屏文件和do文件下载链接:https://pan.baidu.com/s/1LNlyOOa5LPzinmYT2dbm4Q?pwd=mb2i
1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162636465666768697071727374757677787980818283848586878889909192939495969798991001011021031041051061071081091101111121131141151161171181191201211221231241251261271281291301311321331341351361371381391401411421431441451461471481491501511521531541551561571581591601611621631641651661671681691701711721731741 ...
模型|合成控制法 (Synthetic Control Method, SCM)
相关链接:注意⚠️:本文为相关链接的收藏合集,链接内容非本人原创文章。
1. 合成控制法概述[连享会] 合成控制法简介
[连享会] Stata:合成控制法介绍-synth2
[计量经济圈] 广义合成控制法gsynth, 基于交互固定效应的因果推断
[公共视野与定量方法] 合成控制法:一种架空历史的思维方式
[计量经济圈] 合成控制法创始人如何用SCM做实证呢?这些规定动作一个都不能少!
2. 代码与软件实现[Xu Yiqing] gsynth: Generalized Synthetic Control Method
[连享会] 合成控制法 (Synthetic Control Method) 及 Stata实现
[连享会] Stata:合成控制法-synth-命令无法加载-plugin-的解决办法
[连享会] Synth_Runner命令:合成控制法高效实现
[连享会] Stata:合成控制法的预测区间-scpi
[计量经济圈] 分享一篇使用合成控制法SCM进行实证研究的文章的代码
[数量经济学] 一文读懂合成控制法 (Synthetic Control Method)操作及Stat ...
资源分享|农业经济类书籍
下载链接链接: 百度网盘下载链接
提取码: sc8a
书籍清单
T. W. Schultz (西奥多 W. 舒尔茨), 《 Transforming Traditional Agriculture (改造传统农业)》,中文版与英文版
黄宗智,《明清以来的乡村社会经济变迁》,含《华北的小农经济与社会变迁》与《长江三角洲小农家庭与乡村发展》分卷
费孝通,《江村经济》 & 《 Peasant Life in China :A Field Study of Country Life in the Yangtze Valley 》,中文版与英文版
Frank Ellis (弗克兰 · 艾利思),《 Peasant Economics:Farm Households in Agrarian Development (农民经济学:农民家庭农业和农业发展) 》, 英文版
A. V. Chayanov (恰亚诺夫),《 The Theory of the Peasant Economy (农民经济组织) 》, 中文版与英文版
速水佑次郎,弗农·拉坦,《农业发展:国际前景》,中文版
《农业发展 ...