こんにちは。
現役エンジニアの”はやぶさ”@Cpp_Learningです。仕事でもプライベートでも機械学習で色々やってます。
今回は因果推論入門におすすめの本を紹介します。
Contents
因果推論とは
ある変数がその他の変数にどれだけ影響を与えるかを推定する手法を因果推論と呼びます。
例えば「変数xが変数yに影響を与えている」という因果関係は下図で表現できます。
この関係図のことを因果ダイヤグラムと呼びます(※下記メモ参照)。このような変数yに直接的に影響を与える変数(変数間の”矢印の有無”や”影響の大きさ”)を推定したいときに、因果推論が役立ちます。
構造分析の本ではパス図、統計とかベイズの本ではグラフィカルモデルと説明している印象がありますが、厳密な定義については分りません(申し訳ない)。
因果推論の難しさ
データ分析を勉強した人の中には、変数同士の相関から下図の関係性(因果)を把握できると思った人がいるかも(?)
相関についての詳細な説明は割愛しますが、xとyの散布図が下図のような場合、相関係数:r(-1~1の範囲をとる)が0.9などの大きな値となり、xとyに強い正の相関があるといえます。
ただし上図は横軸x, 縦軸yですが、軸を入れ替えても相関係数は大きく、yとxに強い正の相関があることになります。
つまり「変数xが変数yに影響を与えているのか」・「変数yが変数xに影響を与えているのか」という矢印の向き(原因⇒結果の因果関係)について、相関からは把握できません。
と思うかもしれませんが、下図のケースでも相関係数が大きくなります。
つまりxとyに強い相関があるけど因果はないデータが存在します。
って思いますよね。下図のようなケースでも、疑似相関などによって、因果関係があるように見えているだけで、実際には因果関係が存在しないデータもあります。
他にも「こんなデータに要注意」といったデータの本質や「見かけの因果に対処する手法」などの正しい技術活用について、今から紹介する本でしっかり学んでおくと良いと思います。
因果推論入門におすすめの本3選
以降から因果推論を勉強したい人にオススメの本を3冊紹介します。
分析者のためのデータ解釈学入門 -データの本質をとらえる技術-
タイトルに因果推論の文字はありませんが、データの本質をとらえる技術に因果推論が含まれています。全ページ オールカラー!イラスト多めの丁寧な説明により、データ解釈について体系的に学べます。
効果検証入門 -正しい比較のための因果推論/計量経済学の基礎-
ある広告を見た人(集団A)と見てない人(集団B)で売り上げにどれだけ違いがあるのか知りたいとき、本当に知りたいのは売り上げの差ではなく、広告の効果のハズです。では『どうすれば広告の効果を正しく検証できるか?広告(変数z)と売り上げ(変数y)に因果関係はあるのか?』という疑問に対し、こんな技術で解決できる…などの具体例を交えて、様々な技術を紹介している良書です。
つくりながら学ぶ! Pythonによる因果分析 -因果推論・因果探索の実践入門-
Pythonで因果推論・因果探索を実践したい人にオススメの本です。この本については、以下の記事で詳しく紹介しているので、ぜひ読んでみて下さい。
まとめ -【データ解析】因果推論入門におすすめの本3選-
因果推論入門の本を3冊紹介しました。どれも素敵な本なので、ぜひ読んでみてください。
というのが気になるフクロウがいるかもしれないので、回答すると…
著者のマインドや本のコンセプトなどにより、用語や説明の仕方、割愛している内容に違いがあるので、複数の本を読み比べて、知識を補間するのが良いと考えています。
ある分野を学ぶときには、複数の参考書を読み比べることで理解が深まる(自論)
素敵な本に出会えると嬉しいし、人に紹介したくなりますね。