データ分析においては散布図を用いたり、相関分析を行い、2変数の関係性に着目することがあります。しかし、表面的なデータだけを見て、2変数の関係に因果関係があると推測してしまうと誤った意思決定を行う可能性があります。
本記事では、因果関係と相関関係の違い、因果関係があると錯覚する疑似相関について解説していきます。
「デキる社員の100のコンピテンシー」では、マインドセットとスキルセットに分けて、どのような時代、どのような場所においても通用するコンピテンシーを紹介しています。
マインドセットでは、仕事に対する考え方や信念、価値観などの、思考や行動の基盤となる心の持ち方を解説しています。また、スキルセットについては、仕事を遂行するために必要な能力・技術を解説しています。
因果関係と相関関係の違い
データを見ていると2つの事象に相関関係が見られることがあります。相関関係とは、一つの値が変化するともう一方の値も変化するという関係です。一方で、これは必ずしも因果関係があるというわけではありません。因果関係とは、ある事象(原因)が、別の事象(結果)を引き起こす関係を指します。
因果関係の例
原因 | 結果 |
---|---|
雨が降る | 地面が濡れる |
勉強時間が増える | テストの点数が上がる |
運動量が増える | 体重が減る |
睡眠時間が増える | 集中力が向上する |
広告宣伝費を増やす | 売上が上がる |
このように因果関係では、一方の事象がもう一方の事象を引き起こす直接的な原因になっていることを指します。一方で、相関関係は、原因と結果の関係が双方向になったり、間接的な関係になったりしています。
相関関係の例
事象A | 事象B | 注意点 |
---|---|---|
アイスクリームの売上が上がる | 水難事故の発生件数が増える | 気温の上昇が要因では? |
チョコレートの消費量が多い国 | ノーベル賞受賞者数が多い | 国の経済力、教育水準が要因では? |
消防車の出動台数が多い | 火災の被害額が大きくなる | 火災の規模が要因では? |
ニワトリの飼育数が多い | 卵の価格が安くなる | 直接的な要因ではないのでは? |
ブーツの販売数が増える | インフルエンザが流行する | 気温の低下が要因では? |
データ分析を行う際は、因果関係と相関関係を明確に区別する必要があります。相関関係しかないのに、因果関係があると誤解してしまうことを疑似相関といいます。
疑似相関とは
2つの事象に直接的な関連がないのに、見えない第三の要因によって、因果関係があるように推測してしまうことを疑似相関と言います。AとBの間に因果関係があるように見えるが、実際はCという第三の要因によって、AとBの相関関係が引き起こされているという場合です。
たとえば、アイスクリームの売上の増加と溺水事故件数の増加傾向が一致しているデータを見ると、因果関係があるように見えます。因果関係があるとすると、次のような理由が思い浮かびますが、いずれもしっくりきません。
- アイスクリームを食べると溺れやすくなる?
- 溺れた後はアイスクリームを食べたい?
つまり、この2つの事象には因果関係がなく、気温という第三の要因によってそれぞれが同時に引き起こされ、相関があるように見えるのです。
- 気温が上がるとアイスクリームが売れる
- 気温が上がると海やプールで泳ぐ人が増える
このように二つのデータの間に相関関係があるとしても因果関係があるというわけではないということに注意が必要です。数字だけを見て評価するのではなく、2つの関係が論理的に整合するかを検証しましょう。
まとめ
因果関係を追及することは重要なことですが、表面的なデータだけを見て判断することは危険です。事象に対して「なぜ?」を問いかけ、考察することによって真の原因を考察することを心がけましょう。
「デキる社員の100のコンピテンシー」では、マインドセットとスキルセットに分けて、どのような時代、どのような場所においても通用するコンピテンシーを紹介しています。
マインドセットでは、仕事に対する考え方や信念、価値観などの、思考や行動の基盤となる心の持ち方を解説しています。また、スキルセットについては、仕事を遂行するために必要な能力・技術を解説しています。
コメント