刘泽云《计量经济学实验教程》笔记

第一章 Stata基本操作 与 第二章 描述性统计分析

  1. 数据导入时,先将数据整理为Excel,再复制到Stata数据编辑器里保存
  2. 命令的形式:order varlist [if] [in] [weight] [,option]
  3. 命令用do-file文件写,保存后可供后续修改

命令:

  1. summarize 显示变量各值的观测数、均值、标准差、最大最小值
  2. corr 算相关系数
  3. scatter 画散点图
  4. rename 修改变量名(rename a b:把a改成b)
  5. label 给变量加标签说明(label var code “省代码”:给code变量附加省代码这个标签)
  6. sort 将数据从小到大排列
  7. append 合并相同变量的数据文件(当前打开了一个数据文件,用append using "xxx.dta"合并另一个,输入append using后直接点菜单的文件-文件名,再选择即可)
  8. merge 合并含新变量的数据文件(merge [varlist] using filename [filename…],varlist是两数据集中共有的变量)
    要对不同数据集中的标识变量分别进行sort操作(第一个sort后要保存):
    use c:\data\wateroutput, clear
    sort year
    save c:\data\wateroutput, replace
    use c:\data\waterinput, clear
    sort year
    merge year using c:\data\wateroutput
    save c:\data\waternew, replace
  9. drop 删除(drop x:删除变量x;drop in 1:删除第一个观测值)
  10. generate 生成变量(例如 generate z = y^2 +y/3)
  11. replace 替代原变量的值(例如 replace x = x/1000)
  12. reshape long varlist,i(varlist) j(varlist)将数据由横排改为纵排
  13. reshape wide varlist,i(varlist) j(varlist)将数据由纵排改为横排(如各省份在两年的GDP,表示年份的变量为year,年份各值竖向排列称纵排,作为变量横向排列称横排,i来标志,j来区分)
  14. 生成选择性变量:
    generate t = 0 if year == 2006
    replace t = 1 if year == 2007
  15. 按条件画散点图:
    scatter y x if year == 2006
    scatter y x if year == 2007
  16. tab 显示变量各值的频数、单独比例、累积比例
  17. 定性-定性
    【例】考察不同性别个体受教育程度的分布差异并做卡方检验(判断两类个体是否有显著差异,p值小则有显著差异)
    tab gender schlevel,row chi2
  18. 定性-定量
    tabstat wage ,by(gender) statistics(mean sd max min):显示不同性别的工资的均值、标准差、最大最小值

第三章 简单回归分析 与 第四章 多元回归分析:估计和推断

  1. reg y x:y对x回归
  2. reg y x if x <= 30:类上,只用x不大于30的数据回归
  3. predict yhat:生成最新回归的因变量的拟合值,名为yhat
  4. predict uhat,residual:生成最新回归的残差,名为uhat
  5. reg y x1 x2…:y对x1,x2…回归
  6. test a b c…:对a,b,c做F检验,原假设是对应各斜率系数均为0
  7. test (a=2)(b=1)(c=0):对a,b,c做F检验,检验具体的值

第五章 多元回归分析:应用

  1. tab x,generate(x):根据x生成一组虚拟变量,按照x取值从小到大确定虚拟变量的值
  2. 接上,可紧接着把生成的一组虚拟变量去掉一个跑回归,用来比较各组差异,如:
    reg y x2 x3 x4

第六章 异方差性

  1. 同方差性意味着误差的平方的期望是常数。BP检验的原理是让残差的平方对各自变量回归并做总体F检验,若拒绝原假设,则模型存在异方差;怀特检验的原理是让残差的平方对各自变量的单独项、交叉项、平方项的组合或原模型的拟合值及其平方的组合回归并做总体F检验,若拒绝原假设,则模型存在异方差。

命令:

  1. reg y a b c,robust:得到稳健性统计量,可认为结果不受异方差性影响
  2. whitetst:做怀特检验(新机上打findit white test再搜索whitetst再安装即可用)

第七章 时间序列数据的基本回归分析(略)

第八章 面板数据模型

  1. reshape long varlist,i(varlist) j(varlist):同16,其中i后为个体标识变量,j后为时期标识变量
  2. iis id:将变量id定义为个体表示变量;tis year:将变量year定义为时期标识变量;
    之后 xtreg y x1 x2…,fe 表示用固定效应模型跑对应回归(最后改为",re"则为用随机效应模型跑回归),回归结果最后的F检验若不通过(拒绝原假设),则说明固定效应ai和自变量相关,应该用固定效应模型
  3. 上述命令用去均值法,对两期面板数据可用差分法:
    tsset year
    reg D.(y x1 x2 x3),noconstant
  4. 判断是否应该用固定效应模型的豪斯曼检验:
    iis id
    tis year
    xtreg y x1 x2,fe
    est store fixed
    xtreg y x1 x2,re
    hausman fixed
    若拒绝原假设,则应用固定效应模型

第九章 工具变量估计与两阶段最小二乘法

  1. 安装ivreg2
    ssc install ivreg2, replace
    ssc install ranktest, replace
  2. ivreg2 y (q = z1 z2) x1 x2,endog(q) 表示z1,z2为工具变量“修复”内生解释变量q后回归的结果(可以用一个或多个工具变量)
    结果中:
    weak identification test原假设是工具变量与内生解释变量相关性小(F>10则拒绝原假设)
    Sargon statistic原假设是工具变量是外生的(仅在工具变量数量大于内生解释变量数量时有意义)
    Endogeneity test原假设是内生解释变量确实是内生的

第十章 限值因变量模型(略)

猜你喜欢

转载自blog.csdn.net/weixin_51674826/article/details/121321107