2017年6月28日水曜日

データの質、因果関係と相関関係

 先日たまたま、テレビで健康番組を見ました。

 よく書いていると思いますが、「テレビの健康番組は話半分で見ることが望ましい」と、この度もやはり強く思いました。


 その番組では、

『ある病気の人が少ない順に都道府県をランク付けしたところ、一位のところでは実は、○○がよく食べられていた。

 だからその病気には○○が効く』

と主張していました。

 そして学者さんが出てきてコメントし、

『○○には、▲▲という成分が多く含まれている。それがその病気に有効なのだ』

と結論づけされていました。


 しかし、こういった話には、注意を払う必要があります。


 まず、そのデータが有効かどうか、を気にするべきです。

 その病気の人が少ないといっても、各都道府県は人口が違うのですから、「人口何万人あたりの―」と、「各都道府県ごとの、その病気になる人の割合」を出さなければなりません

 しかしその番組では、それについての言及はありませんでした。

 また、どうやって、何人を対象に調査をしたか、もとても大事です。

「どうやって」とは、医療機関と食品販売業者のデータを集計したのか、アンケートをとった結果の集計なのか、などの手法の違いのことです。

 また、データは調査数が多いほど正確になります。

 このような調査の仕方の違いで、データの結果が大きく変わってくる場合もあるのです。

 しかしこういった点も、その番組では言及されていませんでした。


 そして仮に、データが有効なものだとして…、

 たしかに、その病気の人の数と、○○という食品の消費量には、「相関関係がある」のかもしれません。

 しかし、「○○を食べるとその病気になりにくい」という因果関係がある」かは、他の要因を調べないとわからないはずなのです。

 例えば…、他の食品で同じように相関関係があるものはないのか。その都道府県の住人の運動や睡眠時間はどうなのか。その他の社会的習慣も、その病気には関係しているかもしれません。

 このように、どの要素に明らかな「因果関係があるか」は、その時点ではまだわからないはずなのです。


 そして学者さんですが…、

「○○に含まれる▲▲が、その病気に有効である可能性があります」と発言していたのに、「○○に含まれる▲▲が、その病気に有効である」だけがテロップで表示され、誇張されていました。

「可能性がある」って言っていたのに、省かれていたのです(苦笑)。

 まともな学者ならば、「相関関係」と「因果関係」には大きな違いがあること、「仮説(可能性がある、という段階の説)」と「確かな事実」には大きな違いがあることはわかっているはずなのですが、編集により、ご本人の意図が曲げられてしまったようです。


 ちょっと難しい話だったかもしれませんが要は…、

「テレビの健康番組は、わかりやすさと面白さを視聴者に提供するために、正確さに欠けることを言う場合がある(というよりも、その場合が多い、と僕は思います)」

ということです。

 そこにご注意の上、話半分の「エンターテインメント」だと思って見るのが良いのではないでしょうか。

0 件のコメント:

コメントを投稿

*コメントをいただけると大変嬉しいです。ただし、一般公開に不適切だと思えるコメントは削除させていただきますので、あらかじめご了承ください