【統計】君、本当に情報リテラシーありますか?

データ分析・統計・数学

あなたの統計リテラシーをチェック!

問題

これから挙げる4つの例をみて,
・データの信ぴょう性はどうか?
・この人の主張は妥当か?

などを判断してみてください。

第1問

第2問

第3問

第4問

答え合わせ!

”データの集め方”に落とし穴

①「駅前の100人に聞いてみた!」

このアンケートの問題点
  • 「駅前」で調査を実施 → サンプル(標本)に偏りが出る可能性
  • 100人に聞いた → 結果が偶然である可能性
  • 女性が質問している → 心理的効果で「必要」が余計に多くなっているかも
アンケート参加者が偏っている可能性大

駅前はいろんな人がいるから、偏りは無いはず…!

と、思う人がいるかもしれません。
でも、よく考えてみてください。

家に引きこもりがちな人の意見は?
時間帯や曜日によって利用者層も変わる?

などと考えると、調査の対象となる人に偏りが出ている可能性が出てきます。

「日本人はどう思っているのか?」を知りたければ、
・年代
・性別
・職業 …
などを考慮して、まんべんなく標本を集めてくる必要がありますよね。

サンプルサイズが小さい

このアンケートのサンプルサイズは「100人」です。
100人調べただけで「全てが分かった」と考えてはいけません。

今回はたまたま「必要」と答える人が多く集まっただけという可能性もあります

今回の場合「必要」は「不要」の2倍あるため、逆転する可能性はあまりなさそうですが、このアンケートをもって

日本人の10人に6人はクオータ制が必要だという意見を持っています。

と結論付けるのはまだ早いです。

100人というサンプルサイズでは「誤差」が大きくなります
なので100人アンケートで出た「○○%が…」という数字自体にはあまりこだわらないようにすべきです。

「サンプル数」と「サンプルサイズ」は違う!

一般の人でよく、

「サンプル数は○○人で…」

という人がおられますが、厳密にいうと言葉の選択が間違っています
正確には、「サンプルサイズが○○人で…」と言うのが正解です。

「サンプル数」と「サンプルサイズ」の違い:

サンプル数:標本調査を行った回数のこと。
サンプルサイズ:1回の標本調査で調べた個体の数のこと。

心理的効果で回答がゆがむ可能性

この調査では「女性がアンケートを募っている」としましょう。

するとアンケート参加者の中には

女性の目の前で「クオータ制不要」とは答えにくいなあ…。

と思ってしまう人もいるかもしれませんよね。

このように心理的な影響のせいで、本心の回答が得られないことも起こりえます。

他のケースも見てみましょう。

例えば「○○内閣に反対ー!」など反政府運動をしている側で、「あなたは○○内閣を支持しますか?」というアンケートをしたらどうなるでしょうか?

なんとなく想像つきますよね。
反政府運動をしている場所には内閣不支持の人が多くいます。
さらに、本心は「どちらでもない」の立場なのに、反政府運動を見かけたことで、”なんとなく不支持”に傾く可能性も考えられます。

このように、人の心理状態によっても回答が変わりうるんだ、ということを頭に入れておきましょう。

”わずかな差”に落とし穴

②「統計的に有意な差がありました」

この分析結果の問題点
  • サンプルサイズが多すぎる(9981人) → 無意味な,わずかな差である可能性
大量に人を集めれば「統計的に有意な差」は出やすい

統計的に有意な差がある」とはどういうことかというと、
「(あるグループ間の平均値などの)差が誤差によって生じたとは考えにくい」ということです。

ここで注目してほしいのは「誤差」というキーワードです。

サンプルサイズが小さい場合、「真の数字」と「データから得た数字」にはかなりの差があってもおかしくありません。
つまり、サンプルサイズが小さいと誤差が大きくなります

一方サンプルサイズが大きい場合、「真の数字」と「データから得た数字」はかなり近くなります。
つまり、サンプルサイズが大きいと誤差が小さくなります

ということは、サンプルサイズを大きくすれば

実験では、グループAとBの間に「0.00001」の差が出ました。サンプルサイズは10,000と大きいので、この差は誤差のせいではない。よって「統計的に有意な差」があります。

と主張できてしまいます。

確かにこの人の言っていることは正しいですが、医療的に意味のある差なのかは疑問です。

統計的に有意な差」という言葉を見たら、「現実的に有意な差」なのかをチェックしましょう。

「因果関係」「相関関係」の勘違い

③ 「早起きな人は年収が高い」

上司の発言の問題点
  • 「だから君も早起きすべきだ!」 → ”相関関係=因果関係”と思い込んでいる
因果関係が逆?

相関関係をすぐに因果関係と結びつけてしまう人はとても多いです。

「早起きな人ほど年収が高い」というデータが事実だとしても、「早起きすれば年収が高くなる」ことは保証できません。

なぜなら「年収が高いから早起き」かもしれないからです。

年収が高い → 仕事が多い → 早起きしないと仕事が終わらない
という論理も成り立ちますよね。

このように、逆の因果関係を考えていない人が非常に多いです。
なので、第4問も同じく「相関関係と因果関係」に関する話題にしてみました。

④「学力が高い人は朝食を毎日食べる」

母親の発言の問題点
  • 「朝ごはんを食べれば頭が良くなる」 → ”相関関係=因果関係”と思い込んでいる
第3の要因を無視している

この母親は、「高い学力の要因」を「朝食を毎日食べること」だと思っています。

しかし「たくさんの問題を解く」「良い先生に教わる」など、「朝食を毎日食べること」よりも強い「第3の要因」が存在します。

もちろん「毎日朝食を食べること」で学力が伸びる可能性も否定できませんが、より精度の高い説明ができるものがあるならそちらを採用すべきですよね。

さらに、このケースは第3問で紹介した「逆の因果関係を無視している」にあてはまります。

例えば、
頭がいい → 親のしつけがきちんとしている → 朝食を毎日食べる習慣がついている
という論理も成り立ちますよね。

念のため言っておきますが、僕は毎日朝食を食べることを否定したいわけではありません。「毎日朝食を食べる」ことと「学力の向上」をすぐに結びつけるのは間違い、ということを主張しています。


というわけで、以上です。
つい、世の中であふれる情報をうのみにしていませんでしたか?

特に、客観的なデータが入っている情報を見ると人は信じやすい傾向にあります。
ここで述べたポイントを参考に、脱・情報弱者していきましょう!

記事への意見・感想はコチラ