2016年9月29日木曜日

生存率―統計データの理解―

「40歳でX病にかかった人は、5年後生存率が60パーセントだ」という統計があったとします。

 ここで、「5年後に60パーセントの人しか生きていないのだから、X病にかかったら長生きできない」と思う方も多いかもしれません。

 しかし実は、単純にもそうとも言い切れないのです。


 さて、そのデータは、過去に40歳でX病にかかった人10名の統計によるものだとします。

 そして、

Aさんは3年、Bさんは3年、Cさんは4年、Dさんは4年、Eさんは20年、Fさんは20年、Gさんは20年、Hさんは30年、Iさんは40年、Jさんは40年、生きたとします。


 さて、このデータから計算すると、確かに「5年後生存率は60パーセント」になります。

 しかし生のデータを見ると、その印象は、ずいぶん変わるのではないでしょうか。

 たとえば、以下のような見方もできます。

「100パーセントの人が3年以上生き、80パーセントの人が4年以上生き、60パーセントの人が20年以上生き、20パーセントの人は40年生きる」

「40パーセントの人は余命5年以内だが、そうでない60パーセントの人は余命20年以上だ」

「平均余命を計算すると(全部足して10人で割る)、18.4年だ」

「最も多いのは、余命20年の人だ」

などです。


 このように、統計データというのは、見方によってずいぶん印象が変わります。

 そもそもこの場合、サンプルが10人ではまだ少ないと思います。100人、1000人と調査をして、ようやくその傾向がはっきりしてくるのではないでしょうか。

 統計データは、「5年後生存率」などの要約部分でなく、生のデータを直接見られれば、より正確な判断ができます。

 また、データを供給する側が、「自分に都合のよい印象を与えるための要約をする」ことも多くあるようです。

 人体には個人差が大きく、医学にもわからないことがたくさんあります。

 ですから、「こういうデータがある」と見聞きした場合は、「本当にそうなのか」と一度疑ってみた方がよいと、僕は思います。

 ちなみに、それは医学に関する情報だけでなく、あらゆる情報に対しても、です。

0 件のコメント:

コメントを投稿

*コメントをいただけると大変嬉しいです。ただし、一般公開に不適切だと思えるコメントは削除させていただきますので、あらかじめご了承ください