アンケート、真に受けてばかりではトンデモないことに...... 必要なのは読解力だ!

建築予定地やご希望の地域の工務店へ一括無料資料請求

   内閣支持率や国民生活に関する統計調査、商品・サービスの「顧客満足度」とか「人気ランキング」など、わたしたちは毎日のようにさまざまな調査やアンケート結果の報告に囲まれている。

   本書「データ・リテラシーの鍛え方 『思い込み』で社会が歪む」によると、それらには統計や調査手法のワナがあり、見分け方を知らずにただ真に受けてばかりいると、とんでもない誤解することになるという。とくに現代のネット社会では、誤解がウソの言説となってひとり歩きしがち。昨今はいろいろな「リテラシー」の備えが求められるが、「データ・リテラシー」は、そのランキングの上位にランクされるに違いなさそうだ。

「データ・リテラシーの鍛え方 『思い込み』で社会が歪む」(田村秀著) イースト・プレス
  • 毎月勤労統計に関する不正はリテラシーが疑われる問題
    毎月勤労統計に関する不正はリテラシーが疑われる問題
  • 毎月勤労統計に関する不正はリテラシーが疑われる問題

危機的な状況

   2019年1月、厚生労働省の毎月勤労統計に関する不正問題が発覚し、世間を大いに騒がせた。データが不適切に算出され、これを基に計算された失業保険をめぐって2000万人が追加支給の対象になったものだ。メディアで連日にわたり大きく報道され、国民はこうした統計に対する不信感を募らせた。

   毎月勤労統計調査は、500人以上の事業所についてはすべてを対象に、それ以下の場合は無作為抽出(ランダムサンプリング)によって対象を選び、給与などの状況を調べるもの。ところが、東京都では500人以上の事業の調査で、すべてではなく3分の1の無作為抽出によって行われ、無作為抽出の場合に行われるべき復元もなされず実態より少ない数値が公表された。

   この問題について著者の田村秀(しげる)さんは「霞が関全体にデータの扱いに関する理解や活用する能力が欠けているという組織的な問題があると私は考えます」ときっぱり。田村さんは、東京大学工学卒業後に自治省に入省、香川県、三重県で課長を務めた経験を持つ行政のエキスパート。現在は、長野県立大学グローバルマネジメント学部教授で、『ランキングの罠』『データの罠』など統計や調査についての著書が数々ある。「世界一精度が高い」ともいわれた日本の国レベルの統計で、職員や官庁全体のリテラシーが疑われる問題が発覚。田村さんは「データ・リテラシーに関して危機的な状況となっているというのが、今の日本の実情」と憂い、本書執筆にいたったという。

理想的なアンケートとは?

   ネット時代を迎えてからはとくに、世間にはありとあらゆるタイプのアンケートの結果があふれている。データ・リテラシーを養うためには、理想的なアンケートとはどのようなものであるかということをしっかり理解することが基本という。同時に、実際にはさまざまな制約から必ずしも理想的なアンケートが実施されていない現実を認識することもまた基本の一つだ。

   アンケートは本来、対象の人のすべて(母集団)をカバーしなければならないが、多くの場合は母集団の数が多くその実行は現実的ではない。全数調査が不可能な場合は、母集団から対象者を無作為抽出で選ぶサンプル調査を実施するのが理想的とされる。国の世論調査や自治体の住民アンケートでは、基本的に住民基本台帳や選挙人名簿を基に対象者を無作為抽出で選んでいる。無作為といっても「手当たり次第」ではなく「だれでも選ばれる確率が同一」になるようにしなければならない。

   テレビ番組などで、街を行く100人きました―という類のアンケート結果が紹介されることがあるが、こちらは手当たり次第であって無作為抽出ではない。

   無作為抽出で行われた調査では、サンプル数100で誤差±10%、400で±5%、2500±2、1万で±1%―ということになり、いずれも信頼水準は95%、つまり、95%の確率で誤差の範囲におさまるということ。無作為抽出による400のサンプルから得られた内閣支持率が50%だった場合、実際の国民全体の支持率は45~55%の間に収まる。そして、この範囲からはみ出す確率が5%あるということだ。

テレビの100人アンケートは論外...

   内閣支持率は、新聞やテレビ、通信社が同時期に実施し、それらを見比べると、数パーセント程度の違いがある。だいたいどのメディアも、RDD(Random Digit Dialing=乱数番号法、無作為番号法)と呼ばれる電話番号による無作為抽出方法などで実施。メディアの論調が内閣支持率調査などの世論調査の結果に影響を与えているといわれることがあり、そう考えている人も少なくないようだが、無作為抽出方法による調査の性質から「基本的に論調が影響することはない」という。

   「時々誤差の範囲とは言いがたい開きになることもあるが、各新聞社のトーンの違いだけで説明することは難しい」と著者は加えて述べている。

   すべての調査が住民基本台帳や選挙人名簿を使った無作為抽出で実施できれば、それがベストといえるが、住民基本台帳の閲覧は公益性の高い調査以外では法律で禁じられている。プライバシー保護意識が高まったことや、閲覧が犯罪に使われた事件があったことなどから法改正された結果だ。そのため、民間の調査機関で実施されているアンケート調査の大部分は、無作為抽出にはなっておらず、この点について「留意する必要がある」と著者。データ・リテラシーを高めるうえで押さえておくべきポイントという。

   本書ではほかに、「話にならない『テレビの100人アンケート』」を批評、江戸時代にさかのぼり「ランキングが好きな日本人の国民性」の解明に挑戦したり、近年、新年度の入社シーズンに取りざたされることが多い「若者はなぜ3年で辞めるのか?」という話題について、統計情報からは、一面的な見方の可能性があることを指摘する。また「『伊勢崎市は4人に1人が外国人』という誤報の真相」に迫るパートなど多彩なテーマが盛り込まれている。

「データ・リテラシーの鍛え方」
田村秀著
イースト・プレス
税別860円

姉妹サイト