微观|第3章:消费者理论
【内容速查与目录】
【笔记下载】
一、效用与效用论
(一)效用的概念
效用是指商品满足人的欲望的能力评价,即消费者在消费商品时所感受到的满足程度。
(二)基数效用论与序数效用论
效用可分为基数效用和序数效用:
基数效用论:
假设效用可以用基数数字来测量人们消费商品所获取的主观上的满足程度;
使用"边际效用法分析";
均衡条件下满足:\(MU_i / P_i
=\lambda\)
序数效用论:
认为效用是无法以数字来测量的,只能根据满足程度的大小按顺序排列;
使用"无差异曲线"作为分析工具;
均衡条件下满足:$ MRS _ { XY } = { MU_ Y } = { P_ Y } \(,其中\) MRS _ { XY } $
是边际替代率(两种商品消费数量的替代关系)
二、基数效用论(边际效用分析)
(一)边际效用
1. 定义
边际效用:消费者在一定时间内增加一单位商品的消费所得到的效用量的增量。
定义总效用为:\(TU=f(Q)\),那么边际效用为:\(MU=\frac {dTU(Q)} {dQ}\)
2. 边际效用递减规律
在一定时间内,在其他商品 ...
微观|第2章:均衡价格理论(局部均衡)
【内容速查与目录】
【笔记下载】
一、需求理论与供给理论
(一)需求理论
1. 需求量与需求定理
需求量:在给定价格水平下,愿意并能够购买的该商品数量。
需求定理:其他因素不变时,需求量随价格反方向变动。
2. 需求与影响因素
需求:消费者在一定时期内在各种可能的价格水平下愿意而且能够购买的该商品数量。==>
有效需求:有购买意愿且有支付能力
需求的影响因素:
该商品的价格
消费者收入
其他相关商品价格
消费者偏好
预期的未来价格
3. 需求函数与需求曲线
需求函数:\(Q_d=f(p_d,p_o,I,p_e,p_r)\)
\(p_d\):该商品的价格
\(p_o\):其他相关商品价格
\(I\):消费者收入
\(p_e\):消费者预期未来价格
\(p_r\):消费者偏好
4. 需求/需求量的变动
需求的变动:非价格因素(\(p_0,I,p_e,p_r\))导致的变动,体现为需求曲线的水平移动,如
\(D_1\) 曲线移动至 \(D_2\) 或者 \(D_3\)。
需求量的变动:该商品价格变化导致的变化,体现为点在需求曲线 ...
微观|第1章:绪论
【内容速查与目录】
【笔记下载】
一、什么是经济学
(一)经济学的定义
经济学是研究人们为了对付稀缺性而如何做出选择的一门社会科学。
微观经济学又称为价格理论,以单个经济单位(家庭、企业和单个产品市场)为考察对象,运用个量分析方法,研究单个经济单位的经济行为以及相应的经济变量如何决定,分析的是资源配置问题。
宏观经济学又称为国民收入决定理论,以整个国民经济活动作为考察对象,运用总量分
析方法,研究资源利用问题以及用什么政策改善资源的利用。
1. 稀缺
经济学所说的稀缺是指在给定的时间内,相对于人的需求(欲望)而言,经济资源的供给总是不足的。一方面,人类对经济物品的欲望是无限的;另一方面,用来满足人类欲望的经济物品是有限的。因此,现实生活中便存在着资源的有限性和人类欲望与需求的无限性之间的矛盾。
2. 资源的有效配置
资源的稀缺性决定了任何一个经济社会都必须采用一定的方式对资源进行有效的配置,以实现资源的最优利用。从资源稀缺性的角度出发,经济学的研究对象或者说研究任务是:研究人们如何进行选择来使稀缺的或有限的资源生产各种商品和服务并把它们分配给不同的社会成员提供消费 ...
《微观经济学》内容速查与笔记目录
参考高鸿业《西方经济学(微观部分)》
均衡条件或最优条件(帕累托最优):
要素配置最优条件:\({MRTS}_{LK}^X =
{MRTS}_{LK}^Y\)
商品交换最优条件:\({MRS}_{XY}^A =
{MRS}_{XY}^B\)(消费者 A 与 B 之间不再进行交换)
生产与交换的均衡:\({MRS}_{XY}={MRT}_{XY}\)(其中 \({MRS}_{XY}={MRS}_{XY}^A =
{MRS}_{XY}^B\))
MRS:Marginal Rate of Substitution
MRS:边际替代率,无差异曲线斜率(消费理论)\(\to\) 商品消费数量的替代关系
\({MRS}_{XY} = - \frac {\Delta Y} {\Delta
X} = \frac {MU_X} {MU_Y} =\frac {P_X } {P_Y}\)
MRTS:Marginal Rate of Technical Substitution
MRTS:边际技术替代率,等产量线斜率(生产理论)\(\to\) 投入要素的替代关系
\({MRTS}_{LK} = - ...
资源分享|经济学笔记
Markdown 格式
简介
Markdown 格式的笔记是个人主页的发布版本,在思源笔记的桌面版 app
中整理,导出为 markdown
格式,并对部分表格和图片做了调整。其中部分内容涉及到思源笔记内的双向链接,在
markdown 中无法跳转。
更新日期:2023 年 7 月 1
日
更新内容:(与 PDF 格式相比)
优化公式显示格式;
调整网址链接;
设置网络图床;
优化 Markdown 的图片显示比例,将 markdown 语法的图片插入方式调整为
html 方式
下载链接
微观经济学(Markdown Version)
下载链接:百度网盘
提取码:y41h
宏观经济学(Markdown Version)
下载链接:百度网盘
提取码:8q7i
打开方式
推荐使用 Typora、Mweb
pro等专业的Markdown编辑器打开。笔记内含有大量 LaTex
公式、表格、部署在图床上的图片与网页代码,使用其他编辑器或阅读器打开可能无法正确显示笔记内容。
PDF 格式
简介
本笔记使用「思源笔记」桌面端整理。为方便大家使用,下面提供 PDF
格式的笔记,导出基准字 ...
实证|工具变量
工具变量需要满足两个条件:
相关性:\(Cov(D_i, Z_i) \ne
0\),即工具变量 \(Z\)
与核心解释变量 \(D\) 相关
外生性:\(Cov(\eta_i, Z_i) =
0\),即工具变量与 \(Z\)
与包含混杂因素 \(A\) 的残差项 \(\eta\) 不相关,其中 \(\eta_i = A^{'}_i \gamma +v_i\)。( 工具变量的外部有效性 )
可以参考赵西亮老师的《基本有用的计量经济学》,里面的有相无环图很好的解释了工具变量的原理。
相关性一般比较好证明,实证检验工具变量Z与核心解释变量D的关系即可。
那么,如何检验外生性?
回答:工具变量Z只通过核心解释变量D影响Y,而不能直接影响Y
相关问题:
工具变量的外生性检验:
在一些情况下,工具变量的外生性可以使用以下方式检验:(出处:赵西亮《基本有用的计量经济学》第7章)
工具变量相关扩展:
连享会 -
IV:可以用内生变量的滞后项做工具变量吗?
连享会 -
IV的标准动作:工具变量法实用指南
连享 ...
实证|双重差分 (DID) 的四个假设
从理论上来说,满足严格的DID的各种假设后,使用DID是可以消除内生性的。遗漏变量对政策前后的影响通过“共同趋势检验”来完成。
要保证 DID 的估计结果是真是的因果关系,需要了解在政策研究中,满足
DID 的四个假设(以下内容来自赵西亮老师的《基本有用的计量经济学》)
1. 共同趋势假设
也就是说,未控制的变量不会对政策实施结果产生影响
2. 共同区间假设
3. 外生性假设
也就是说,控制的协变量不会影响政策的实施(相关质疑:中国的政策试点,跟经济发展水平、其他政策有巨大的关系,很多政策并不是随机的)
4.
政策影响无溢出效应与交互影响(SUVTA)
也就是说,试点政策仅能影响试点城市,对没有试点的地方没有影响
在上面四条假设的前提下,DID做出来的结果才是真实的政策影响结果。
遗漏变量对政策影响前后是否有不同影响,就是第一个假设“共同趋势假设”的问题。
为解决遗漏变量的问题,可以通过以下两个方法解决:
进行共同趋势检验,排除共同趋势的影响
尽可能多的加入变量,以控制遗漏变量。
赵西亮老师在《 ...
数据清洗|数据匹配的组合命令
将部分在家庭成员数据中计算好的变量,匹配到家庭数据中,由于一个家庭可能有多个家庭成员,而一个家庭成员仅可能在一个家庭中,因此使用
1:m 匹配数据,并且要在匹配后,每个家庭仅留一条数据。
12345678** 1:m 匹配use "家庭数据", clearmerge 1:m FID using "成员数据.dta"drop if _merge==2drop _merge** 去除重复样本——每个家庭仅保留一条信息duplicates drop FID, force
补充内容:
merge
命令用法
merge 与 duplicates 命令组合使用的综合案例:视频、笔记与代码
数据清洗|样本等分组
1. xtile 命令
使用 xtile 命令,可以对某一个变量数进行等分组。
dis_inc 表示可支配收入,inc_group
表示按照可支配收入分组,生成的收入组变量,取值是
1-5,1 为低收入组 (20%),2
为中低收入组 (20%),3 为中等收入组 (20%),4
为中高收入组 (20%),5 为高收入组 (20%)。
12** 样本等分组(按样本数量分组), n(5) 表示将样本等分为 5 份xtile inc_group = dis_inc, n(5)
2. 组内样本等分组
先按照城乡、省份分组,然后每一组样本根据可支配收入,分为低收入组、中等偏下收入组、中等收入组、中等偏上收入组、高收入组等五组。
12345678910111213141516// 生成收入组别变量typegen inc_group=.//分城乡、分省份划分五个收入组: CX表示城乡识别码(1=城市,2=乡村),dis_inc表示人均可支配收入forvalues j=1/2 { egen p0_`j'=min(dis_inc) if CX==`j',by(pcode) ...
数据清洗|样本计数
12345678910111213** 根据X1分类,生成每组样本数by X1: gen X2=_N //包含缺失值by X1: gen X2=_N if X1!=. //排除缺失值** count函数: 表达式exp计算结果不是缺失值的样本数egen newvar = count(exp), by(varlist)** total 函数: 表达式exp计算结果的样本数gen count=1egen count_num = total(exp), by(varlist)** seq 函数: 循环计数,生成数列 (每个数字计数两次,范围3~4,重复计数: 3,3,4,4, | 3,3,4,4, | 3,……)egen list=seq(), from(3) to(4) block(2) by(varlist)
数据清洗|计算同侪效应
在实证研究中,我们常会遇到一些关于同侪效应的研究,即同一组内其他样本的行为或状态可能会影响受访者的行为与状态。一些研究也将其称为同伴效应或伙伴效应。
衡量同侪效应的常见方式是组内其他样本的均值。其基本计算原理如下:
假设某一组内共有 \(m\)
个样本,对于受访者 \(i\) ,其同侪效应
\(X_p\) (组内其他样本均值)
可以表示为:
\[
\begin {align}
X_p= \frac {\sum _{j \ne i} X_j} {m-1}
= \frac {\sum _{j =1}^n X_j \ - \ X_i} {m-1}
\end{align}
\]
因此,对于全体样本分出的每一组样本,我们可以分为三个步骤计算:
计算组内样本数量 \(m\)
计算组内所有样本变量 \(X\)
的取值之和
代入上式计算同侪效应 \(X_p\)
1234** 使用 count 和 total 函数:egen count_num=count(X), by(CID) // 分组计算变量 X 的非缺失值样本数量egen X_total=total(X), by(CID) ...
数据清洗|Stata 数据乱码问题
在较新的 Stata
上打开旧版的数据,可能会因中文字符编码问题导致乱码。
可以将待转码的数据复制到一个转码文件夹中,使用以下命令对数据进行转码:
123456** 解决旧版stata数据中文乱码问题,星号表示通配符clearcd "C:\Users\Desktop\转码" // 新建一个转码文件夹,然后修改自己的路径unicode encoding set gb18030unicode analyze *unicode translate *, invalid
如果上述操作无法解决乱码问题,可以考虑将通配符改为具体的文件名。
例如:
12345clearcd "C:\Users\Desktop\转码" // 新建一个转码文件夹,然后修改自己的路径unicode encoding set gb18030unicode analyze 流动人口数据个人问卷2018.dta // 文件名根据自己的数据进行调整unicode translate 流动人口数据个人问卷2018.dta, invalid // 文件名根据自己的数据进行 ...
数据清洗|其他样本管理
一、样本删除、保留
12drop if jianyan==0 //删除jianyan取值为0的样本keep if jianyan==1 //保留jianyan取值为1的样本
分层随机抽样:
12根据city分层随机抽样20%的样本sample 20, by(city)
二、_n 和 _N 用法
1234567** _n 表示样本排序号gen n=_n** 先按x排序,再生成排序号by x,sort: gen n=_n** _N 表示总样本量gen N=_N
相关链接:_n
和_N 的定义、例示和 Stata 应用 - 知乎 (zhihu.com)
数据清洗|缩尾与截尾
在调查数据中,常常会遇到有极端值的情况,缩尾和结尾是两种最普遍的处理极端值的做法。以1%和99%双侧缩尾/截尾为例:
缩尾:将大于99%分位数的取值,替换为99%分位数取值;将小于1%分位数的取值,替换为1%分位数取值。
截尾:将大于99%分位数或小于1%分位数的取值,替换为缺失值。
使用缩尾还是截尾,应根据数据情况和研究的具体问题选择。
一、基本语法
1234567winsor2 varlist [if] [in], [suffix(string) replace trim cuts(# #) by(groupvar) label]/* Note: suffix(string) 表示缩尾和截尾后生成新变量的后缀,默认是"_w"(缩尾)和"_tr"(截尾); replace 表示不生成新变量,缩尾或截尾后的数值替换当前变量数值; trim 表示截尾,不添加该 option,则默认是缩尾; cut(# #) 表示缩尾或截尾的百分位数; by(groupvar) 表示分组 ...
数据清洗|字符型变量运算
配套视频、笔记与代码
一、字符简单运算
1234** 生成文本型变量gen var1="" //""表示缺失值** 文本型变量值替换replace X1="" if X1=="NA" //文本运算需要加英文引号
二、文本匹配
123** 字符条件匹配replace CITY_ID=1 if V2=="北京"replace CITY_ID=1 if strmatch(V2,"*北京*") //括号内变量名表示匹配的变量,星号"*"表示通配符
三、文本提取
文本提取命令有 substr 和 usubstr
,两个用法基本一致。但 substr 需要考虑编码,一个中文字符占
3 个英文字符,usubstr 则不需要考虑编码问题。
123456789** 将地址前两个中文字符提取为省份名称gen province =substr(address,1,6) //提取2个中文字符: 从第1位开始提取,提取6位,一个中文字符占3个英文字符 ...
数据清洗|变量名、标签、排序、删除、保留
配套视频、笔记与代码
一、变量名、标签
1. 变量重命名
123456** 单个变量:A1 --> X1rename A1 X1** 组变量rename (A1 A2 A3) (X1 X2 X3)rename Var* V* // 任意字符通配符rename Var# =new // 单个数字通配符: 0-9之间
2. 标签
12345678910111213141516** 查看标签d // describe 简写label dir // 查看值标签列表label list X // 值标签与变量取值对应关系** 变量标签label variable select "选择变量"label var select "选择变量" //上一条命令的简写** 值标签// 移除值标签label drop lblname // 数据层面: 删除 lblname 值标签label values varlist // 变量层面: 删除 varlist 的值标签// 添加值标签label define lblname # ...
数据清洗|变量滞后与提前
在面板数据中,如果当年数据存在缺失值,在下一年数据不是缺失值的情况下,使用下一年的数据补充。
1234567891011// "F."表示提前一期数据,"L."表示滞后一期数据xtset id year gen y1=F.yreplace y=y1 if y==.drop y1// 效果和上面的相同sort id yeargen y2=ybysort id: replace y=y[_n+1] if missing(y)drop y2
将数据滞后一期:
123456xtset id year gen y1=L.y// 效果和上面的相同xtset id year gen y_1=y[_n-1]
将数据滞后 2 期:
1gen y_2=y[_n-2]
实证|为什么使用PSM消除样本选择偏差?
要理解为什么用 psm 消除样本的选择偏误,先要理解 psm
的原理。
在研究一种干预措施的效果时,理想状态是进行随机化实验,也就是控制其他所有条件都相同,仅有是否采取干预措施这一点不同,这样就可以通过比较随机化实验中干预组与对照组的差异,了解干预措施的效果,为排除个体差异,通常使用干预组与对照组的效果的平均值差异来衡量,也就是许多实证研究中许多研究计算的平均处理效应。
然而,随机化实验往往在医学、生物学等领域更为常见,在经济学相关研究中,经济发展情况、社会制度、文化差异等各方面的不同之处决定了不能随意指定两类样本进行比较,以衡量干预措施的效果。更多的情况是干预措施的效果会受到两组样本之间其他差异的影响,这种情况下,无法准确判断两组之间的差异是不是由这一干预措施带来的,也就是无法准确判断干预措施与结果差异之间的“因果关系”。
因此,为了可以更准确估计来自干预措施的影响,更准确地识别这种“因果关系”,回归的方式最早被应用,常见的是线性回归。然而,使用回归方法判断的是两个变量之间的统计关系,在需要满足
CIA(条件独立性假设)或
CMI(条件均值独立性假设)的条件下,该统计 ...
实证|取对数问题
一、什么时候应该取对数?
满足以下两个条件之一,可以考虑取对数:
被解释变量 Y 与核心解释变量 X 数据的数量级差距很大,例如 Y
取值普遍小于 10,X 的取值一般在 100~1000 之间分布,就可以考虑对 X
取对数,也可以更改 X 的单位;
某个变量取值差异极大,例如家庭的工资收入,最低的为 0,普遍为 2~4
万,最高有上百万,这种情况下为避免极端值的影响,可以考虑取对数,同时为了避免工资收入为
0 的家庭取对数后为缺失值(因为对 0 取对数没有意义),可以 +1
元后再取对对数,可以在避免对收入数据造成较大影响的情况下,保留工资收入为
0 的样本。
但是,取对数的变量不应该有负数。如果一个变量取负数是合理的,取对数会造成样本的选择性偏差。例如可能由于经营企业等亏损,家庭总收入可能小于
0,这是合理的,如果取对数,会造成使用家庭总收入的对数值进行计量时,家庭总收入小于
0 的样本被忽略。
二、如何解释取对数后的偏回归系数?
伍德里奇的《计量经济学导论》第二章,“对于线性模型中取对数后,如何解释片回归系数”这一问题做了很详细的说明。
在线性回归中, ...
数据清洗|变量生成与替换
配套视频、笔记与代码
一、gen 和 replace 用法
1. 基础用法
123456789** 变量生成、数值替换gen jianyan=. //e.g. 生成一个所有数值都是空缺值“.”的变量replace jianyan=1 //将 jianyan 变量的所有数值都替换为 1** 或者可以写作:gen jianyan=1** 分组累计求和: 根据pcode分组,对CF_gini累计求和sort pcode CF_giniby pcode: gen CF_gini_sum=sum(CF_gini)
2. 常见运算函数
12345678910111213141516171819202122232425** 四则运算、对数、指数、幂运算replace X=X+1 // 加法replace X=X-1 // 减法replace X=X*3 // 乘法replace X=X/3 // 除法replace X=ln(X) // 自然对数replace X=log10(X) // 以10为底的对数replace X=log ...