合成制御法とは一体何ですか?因果推論の最先端の方法へのガイド

合成制御法とは一体何ですか?因果推論の最先端の方法へのガイド

計量経済学の経済界に補償された貢献をすることができ、測定に関連することができます

Eメール:[email protected]

計量経済学サークル方法論のすべてのdoファイル、マイクロデータベース、およびさまざまなソフトウェアがコミュニティに配置されています。交換と訪問のための因果推論研究グループへようこそ。完全なdoファイルとデータセットが必要な場合は、取得方法を参照してください。記事の後にそれ。

合成制御法とは一体何ですか?因果推論の最先端の方法へのガイド

本日、私たちの「因果推論研究グループ」は、計量経済学界の友人のために、より頻繁に使用される因果推論法「合成制御法」(SCM)を推奨します。私たちが耳にする最も一般的な例は、1989年にカリフォルニアで実施された禁煙法案であり、法案がたばこの消費を減らすかどうかを見極めることを望んでいます。この禁煙法案はカリフォルニア州内でのみ政策効果があるため、ここの実験グループにはカリフォルニア州という1人のメンバーしかいないため、従来のDID法はそれほど簡単には使用できません。

このような問題に対して、早急に因果関係を知りたいと考え、総合的な管理手法が登場し、急速に推進されました。SCMの基本的な考え方は、禁煙法案を実施していない他の38州の加重平均を使用して「カリフォルニア」を合成し、実際のカリフォルニアと1989年の禁煙法案の後にカリフォルニアを合成した。効果。

合成制御法では、いくつかの重要な変数がより重要であるため、それらを個別に言及する価値があります。以下は、カリフォルニア州の1989年の禁煙が州の紙巻たばこ消費量(販売)に与える影響を制御するために喫煙データセットを使用した総合的な制御方法です。

シンセシグセールビール(1984(1)1988)lnincome retprice age15to24 cigsale(1988)cigsale(1980)cigsale(1975)、trunit(3)trperiod(1989)fig replace keep(resout)

上記のプログラムのいくつかの変数の説明
1.従属変数y:cigsale(1人あたりの紙巻たばこの販売、パック/年;
2.独立変数x:ビール(1人あたりのビール消費量)、lnincome(1人あたりのGDP)、retprice(紙巻たばこの小売)価格)、age15to24(15〜24歳の人口の割合)、cigsale(1988)、cigsale(1980)、cigsale(1975)は、1988年、1980年、および1975年の1人当たりの紙巻たばこの販売です
。3.trunit(3):当社の方針
Impact Group(California)、3 =データのカリフォルニア; 4.trperiod(1989):1989年に喫煙禁止法が実施されました;
5.fig:複合制御チャートを表示します。

6.keep(resout):最終的な合成結果をディレクトリに出力します

SCM回帰後に生成された結果データを表示します。このことから、カリフォルニアの1人当たりの合成紙巻たばこの消費量は、特定の重量係数による他の対照州の1人当たりの紙巻たばこの消費量の組み合わせであることがわかります。コロラド州とポリシーの影響を受ける州(カリフォルニア)は、ポリシーの開始前に特性変数xに比較的近いため、コロラド州によって与えられる重みは0.285(最大)であることがわかります。コロラド州を表す方が多いです。政策のように、グループ内のカリフォルニアに影響を与えます。

注:基本的に、ポリシーを実装する前にSCMが最適な重み係数を検索するプロセスでは、実際には、以前によく使用した「マッチング」方法を使用します。最適な重みを見つけるプロセスでは、| Y1t(処理済み)-W * Yit(scm)|距離を作成し、予測プロセス中に予測値を最小平均二乗誤差(MSPE)として表示するのと同じです。

合成制御法とは一体何ですか?因果推論の最先端の方法へのガイド

合成制御法を使用しない場合は、カリフォルニア州と他の州の1人当たりの紙巻たばこの消費量の時間傾向グラフを比較してみましょう(他の州の値は平均値です)。明らかに、1989年に禁煙法案が導入される前は、両者の間に大きなギャップがありましたが、現時点では、無騒音の原因と影響を特定することは不可能です。したがって、1989年以前は、対照群と政策影響群の間にほとんど差がないことを確認するためのマッチング方法を使用して、その後の政策効果を明確に判断できるようにする必要があります。

合成制御法とは一体何ですか?因果推論の最先端の方法へのガイド

以下は、私たちが最も懸念している写真です。彼は、ポリシーの実装前に、合成されたカリフォルニアでの1人あたりの紙巻たばこの消費量が、カリフォルニアでの実際の1人あたりの紙巻たばこの消費量とほぼ完全に一致することを最も直感的に教えてくれます。1989年に政策が実施される前に、合成されたカリフォルニアと実際のカリフォルニアの1人当たりの紙巻たばこの消費量がより一貫していた場合、1989年以降の2つの間の相違は、政策効果の発現を意味します。

この図は、1989年の禁煙後、カリフォルニア州の実際の1人当たりの紙巻たばこの消費量がカリフォルニア州の合成1人当たりの紙巻たばこの消費量よりもはるかに少なく、時間の経過とともに継続的に拡大する傾向があることを明確に示しています。これは、カリフォルニアでの喫煙禁止が実際に一人当たりの紙巻たばこの消費に大きな抑制を及ぼしたことを意味します。

合成制御法とは一体何ですか?因果推論の最先端の方法へのガイド

上記のプログラムはscmを完全には表示しません。さらに、xperiodとnestedの2つの新しいオプションを追加しましょう。これら2つのオプションの詳細な使用法については、以下にリストします。

synth cigsale beer lnincome retprice age15to24 cigsale(1988)cigsale(1980)cigsale(1975)、trunit(3)trperiod(1989)xperiod(1980(1)1988)ネスト

上記のプログラムのいくつかの新しい変数の解釈
1.xperiod(1980(1)1988):説明変数beer、lnincome、retprice、age15to24を1980、1981、... 1988の平均値として取ります;
2。ネスト:ネスト、長い計算を犠牲にして、最適な適合を見つけるのに役立ちます

SCMプロセスでは、コントロールグループ、独立変数、予測に使用された年など、多くの重要な情報を知ることができるため、以下の結果がより重要になります。

合成制御法とは一体何ですか?因果推論の最先端の方法へのガイド

次の図は、私たちが行ったプラセボテストです。これらの39州(カリフォルニアを含む)のそれぞれに対してSCMを実行し、ポリシー処理効果(実際の1人あたりのたばこ消費量から合計たばこ消費量を差し引いたもの)を取得します。この写真の黄色い線は、カリフォルニアが政策影響力グループとして得た政策効果です。図から、1989年以前は、実際のシグセールと合成されたシグセールはほぼ同じであったことがわかります(ギャップは約0でした)。

しかし、1989年以前に他の38州を政策影響グループとして使用したギャップについては、カリフォルニアを政策影響グループとして使用しなかったギャップは小さく、カリフォルニアを政策影響グループとして使用したギャップは、1989年以降明らかに減少傾向にあります。政策効果があるかどうかを考えさせなければならないので、プラセボテストは私たちのカリフォルニアの禁煙法案が効果的であることを意味します。

合成制御法とは一体何ですか?因果推論の最先端の方法へのガイド

1970年から1989年(政策効果が現れる前)の期間、他の38州が政策影響グループと見なされたとき、得られたMSPEは、カリフォルニアが政策影響グループであったときに得られたMSPEの20倍でした。 「外れ値」と呼ばれるものが排除されました。その時点で、それほど乱雑に見えない次のポリシー効果トレンドチャートが得られます。しかし、この黄色い線は珍しい。1989年に政策が導入される前は、合成統制グループと政策効果影響グループはほぼ同じであり、政策が導入された後、両者は下降傾向にあり、カリフォルニアの禁煙政策政府の公布は確かに一人当たりの紙巻たばこの消費を抑制しました。

合成制御法とは一体何ですか?因果推論の最先端の方法へのガイド

**安慰剂检验的程序-------------

forval i=1/39{

qui synth cigsale retprice cigsale(1988) cigsale(1980) cigsale(1975), ///

xperiod(1980(1)1988) trunit(`i') trperiod(1989) keep(synth_`i', replace)

}       //对所有39个州分别进行SCM(把39个州分别作为政策影响组)

forval i=1/39{

use synth_`i', clear

rename _time years

gen tr_effect_`i' = _Y_treated - _Y_synthetic

keep years tr_effect_`i'

drop if missing(years)

save synth_`i', replace

}               //得到SCM的政策效应

use synth_1, clear

forval i=2/39{

qui merge 1:1 years using synth_`i', nogenerate

}                    //把所有39个政策效应合并起来

local lp

forval i=1/39 {

  local lp `lp' line tr_effect_`i' years, lcolor(gs12) ||

  twoway `lp' || line tr_effect_3 years,  lcolor(orange) legend(off)   xline(1989, lpattern(dash))

}                        //直接画图就好

①私は計量経済学サークルコミュニティのメンバーではありません。この記事の完全なdoファイルとデータが必要な場合は、最初に計量経済学サークルコミュニティに参加し、連絡して入手してください。

②計量経済学コミュニティの友達のグループです。この記事の完全なdoファイルとデータが必要な場合は、この記事を友達のサークルに転送し、公式アカウントの舞台裏に連絡して入手してください。

因果推論研究チームは権利を留保します

おすすめ

転載: blog.51cto.com/15057855/2679985