刘泽云《计量经济学实验教程》笔记

第一章 Stata基本操作与第二章描述性统计分析

数据导入时，先将数据整理为Excel，再复制到Stata数据编辑器里保存
命令的形式：order varlist [if] [in] [weight] [,option]
命令用do-file文件写，保存后可供后续修改

命令：

summarize 显示变量各值的观测数、均值、标准差、最大最小值
corr 算相关系数
scatter 画散点图
rename 修改变量名（rename a b:把a改成b）
label 给变量加标签说明（label var code “省代码”:给code变量附加省代码这个标签）
sort 将数据从小到大排列
append 合并相同变量的数据文件（当前打开了一个数据文件，用append using "xxx.dta"合并另一个，输入append using后直接点菜单的文件-文件名，再选择即可）
merge 合并含新变量的数据文件（merge [varlist] using filename [filename…]，varlist是两数据集中共有的变量）
要对不同数据集中的标识变量分别进行sort操作（第一个sort后要保存）：
use c:\data\wateroutput, clear
sort year
save c:\data\wateroutput, replace
use c:\data\waterinput, clear
sort year
merge year using c:\data\wateroutput
save c:\data\waternew, replace
drop 删除（drop x：删除变量x；drop in 1：删除第一个观测值）
generate 生成变量（例如 generate z = y^2 +y/3）
replace 替代原变量的值（例如 replace x = x/1000）
reshape long varlist,i(varlist) j(varlist)将数据由横排改为纵排
reshape wide varlist,i(varlist) j(varlist)将数据由纵排改为横排（如各省份在两年的GDP，表示年份的变量为year，年份各值竖向排列称纵排，作为变量横向排列称横排，i来标志，j来区分）
生成选择性变量：
generate t = 0 if year == 2006
replace t = 1 if year == 2007
按条件画散点图：
scatter y x if year == 2006
scatter y x if year == 2007
tab 显示变量各值的频数、单独比例、累积比例
定性-定性
【例】考察不同性别个体受教育程度的分布差异并做卡方检验（判断两类个体是否有显著差异，p值小则有显著差异）
tab gender schlevel,row chi2
定性-定量
tabstat wage ,by(gender) statistics(mean sd max min)：显示不同性别的工资的均值、标准差、最大最小值

第三章简单回归分析与第四章多元回归分析：估计和推断

reg y x：y对x回归
reg y x if x <= 30：类上，只用x不大于30的数据回归
predict yhat：生成最新回归的因变量的拟合值，名为yhat
predict uhat，residual：生成最新回归的残差，名为uhat
reg y x1 x2…：y对x1,x2…回归
test a b c…：对a,b,c做F检验，原假设是对应各斜率系数均为0
test (a=2)(b=1)(c=0)：对a,b,c做F检验，检验具体的值

第五章多元回归分析：应用

tab x,generate(x)：根据x生成一组虚拟变量，按照x取值从小到大确定虚拟变量的值
接上，可紧接着把生成的一组虚拟变量去掉一个跑回归，用来比较各组差异，如：
reg y x2 x3 x4

第六章异方差性

同方差性意味着误差的平方的期望是常数。BP检验的原理是让残差的平方对各自变量回归并做总体F检验，若拒绝原假设，则模型存在异方差；怀特检验的原理是让残差的平方对各自变量的单独项、交叉项、平方项的组合或原模型的拟合值及其平方的组合回归并做总体F检验，若拒绝原假设，则模型存在异方差。

命令：

reg y a b c,robust：得到稳健性统计量，可认为结果不受异方差性影响
whitetst：做怀特检验（新机上打findit white test再搜索whitetst再安装即可用）

第七章时间序列数据的基本回归分析（略）

第八章面板数据模型

reshape long varlist,i(varlist) j(varlist)：同16，其中i后为个体标识变量，j后为时期标识变量
iis id：将变量id定义为个体表示变量；tis year：将变量year定义为时期标识变量；
之后 xtreg y x1 x2…,fe 表示用固定效应模型跑对应回归（最后改为",re"则为用随机效应模型跑回归），回归结果最后的F检验若不通过（拒绝原假设），则说明固定效应ai和自变量相关，应该用固定效应模型
上述命令用去均值法，对两期面板数据可用差分法：
tsset year
reg D.(y x1 x2 x3),noconstant
判断是否应该用固定效应模型的豪斯曼检验：
iis id
tis year
xtreg y x1 x2,fe
est store fixed
xtreg y x1 x2,re
hausman fixed
若拒绝原假设，则应用固定效应模型

第九章工具变量估计与两阶段最小二乘法

安装ivreg2
ssc install ivreg2, replace
ssc install ranktest, replace
ivreg2 y (q = z1 z2) x1 x2,endog(q) 表示z1,z2为工具变量“修复”内生解释变量q后回归的结果（可以用一个或多个工具变量）
结果中：
weak identification test原假设是工具变量与内生解释变量相关性小（F>10则拒绝原假设）
Sargon statistic原假设是工具变量是外生的（仅在工具变量数量大于内生解释变量数量时有意义）
Endogeneity test原假设是内生解释变量确实是内生的

刘泽云《计量经济学实验教程》笔记

第一章 Stata基本操作与第二章描述性统计分析

第三章简单回归分析与第四章多元回归分析：估计和推断

第五章多元回归分析：应用

第六章异方差性

第七章时间序列数据的基本回归分析（略）

第八章面板数据模型

第九章工具变量估计与两阶段最小二乘法

第十章限值因变量模型（略）

猜你喜欢

刘泽云《计量经济学实验教程》笔记

第一章 Stata基本操作 与 第二章 描述性统计分析

第三章 简单回归分析 与 第四章 多元回归分析：估计和推断

第五章 多元回归分析：应用

第六章 异方差性

第七章 时间序列数据的基本回归分析（略）

第八章 面板数据模型

第九章 工具变量估计与两阶段最小二乘法

第十章 限值因变量模型（略）

猜你喜欢

第一章 Stata基本操作与第二章描述性统计分析

第三章简单回归分析与第四章多元回归分析：估计和推断

第五章多元回归分析：应用

第六章异方差性

第七章时间序列数据的基本回归分析（略）

第八章面板数据模型

第九章工具变量估计与两阶段最小二乘法

第十章限值因变量模型（略）