数字、データに強くなるには?...見やすく「可視化する」が重要スキルに

全国の工務店を掲載し、最も多くの地域密着型工務店を紹介しています

   データを正しく理解し、正確に情報を伝えることの重要性が高まっている。本書「データ思考入門」(講談社現代新書)は、データをわかりやすく、見やすく視覚的に表現する「データ可視化」とそのための考え方を教える本だ。

「データ思考入門」(荻原和樹著)講談社現代新書

   著者の荻原和樹さんは、東洋経済新報社でデータ可視化を活用した報道コンテンツを幅広く制作し、その後スマートニュースのメディア研究所を経て、現在はGoogleで報道機関のジャーナリスト向けにデジタルスキルなどのトレーニングを行う仕事をしている。

新型コロナで痛感したデータの可視化の重要性

   データの可視化の重要性は、新型コロナウイルスの感染拡大時に痛感したという。

   厚生労働省は感染症の流行初期から、ウェブサイトで陽性者数などを公開していた。しかし、日ごとに数字の表が発表されるだけで、一切の「可視化」が行われていない状態だった。

   そのため、このデータはほとんど注目されず、報道でもほぼ活用されていなかった。断片的な速報がほとんどで、「今どのような状況か」「全体の傾向はどうなっているのか」は、捉えにくかったという。

   荻原さんは、データを可視化することを思いつき、ウェブメディア「東洋経済オンライン」で、新型コロナのデータを一覧できるダッシュボード(複数のグラフや地図を一元化して見られるツール)をつくった。

   テレビ局や国内外からの問い合わせが相次ぎ、新型コロナに関する2020年の報道コンテンツで最も多くSNSでシェアされたという。

   わかりやすく見やすいデータ可視化をするためには、まずデータの定義や集計範囲などを理解することが不可欠だ。読むべき部分は、調査の範囲、更新タイミングなど多岐にわたる。最終的には、データが現実世界で何を意味するか腹落ちするまで読み込むことが大切だという。

   2つ以上のデータを組み合わせる際には、良くも悪くもユーザーに因果を強く示唆することに注意しなければならない。また、相関関係と因果関係の違いにも注意が求められる。相関関係は2つのデータが数字上で連動していること、因果関係は2つのデータに「原因」と「結果」という関係が成立している状態を指す。この混同に、注意しなければならない。

ポイントは「データを絞る」「数字のメタファーを考える」「コンセプトを設定する」

   いよいよデータの意味や内容を踏まえて、視覚表現に落とし込むことを、「データの編集」と呼んでいる。表現したい内容に合わせてデータの項目を取捨選択したり、集計したり、他のデータと組み合わせて、適切なグラフや表現に変換していく作業だ。

   その際、重要なのは、「データを絞る」ことだという。新型コロナウイルス感染症を例に説明している。厚生労働省は、流行初期に7つのデータを毎日発表していた。

   そのうち、ふだん報道されていたのは、PCR検査実施人数、陽性者数、重症者数の3つだった。どれだけ多くのデータを見せるかは手段でしかなく、「見せるデータそれ自体が少なくても、そこから得られる示唆や考察の総量を最大化することを目的とすべき」と書いている。

   次に、「数字のメタファーを考える」ことを挙げている。数字から逆算できる意味や暗示のことだ。たとえば、新型コロナ感染状況のデータは「その地域での感染危険度」だけではなく、「国や地域の感染対策がどのくらい成功しているか」を示す指標としても使われている。

   さらに、「コンセプトを設定する」ことも必要だ。データを通じて、ユーザーに何をしてほしいかを表すことだ。先に紹介した、新型コロナのデータを一覧できるダッシュボードのコンセプトは、「冷静にデータを吟味して現状を把握できること」だった。

   そのコンセプトにしたがって、デザインの基本テーマは、可能な限り「煽り」を廃し、冷静にデータの確認ができるようにフラットな配色にしたそうだ。濃い赤や黄色といった危険色(警告色)は使わず、ダークモードの配色をベースとして中立的なイメージを与える青緑色を基本にした。

   それと同時に、速報性、独自性、データの解釈といった要素は捨てたという。そのため、必要な改良とその優先順位を明確にする作業が楽になったという。

   すでに公開されて広く知られているデータからでも面白いデータ可視化は可能だ、と説明している。日頃から興味深いデータを頭の中の「引き出し」にストックすることで、ニュースを目にした際や新しい可視化方法を知った際に組み合わせることができる。

データの可視化で、炎上や誤解を避ける

   この後、実際にデータを編集する実践編となる。まず、データの「軸」を考える。あらゆるデータは純粋な数字の羅列ではなく、分類したり時系列に並べたりすることができる。これらの分類や時系列を、荻原さんは「軸」と呼んでいる。

   データの可視化とは、この軸を「縦の位置」「横の位置」「サイズ(棒の長さ、円の大きさ)「色」「奥行き(3Dで表現する場合)」「動き(アニメーションで表現する場合)」といった視覚表現に変換する行為だという。

   レストランの売り上げデータを例に説明している。バブルチャートを使うと、顧客年齢と購入単価、業態、売上高までが一覧できるグラフをつくれることに驚いた。地図やネットワーク構造のデータも分解すれば、軸に置き換えることが可能だ。

   データのデザイン法、可視化の改良法、炎上や誤解を避ける方法などの項目も参考になるだろう。

   荻原さんは、「現代は歴史上最もデータ可視化が作りやすい時代であり、作り続けることで思わぬ『味方』が見つかることもある」と書いている。

   報道ばかりではなく、マーケティングや営業など、幅広くビジネスの領域でも使えるテクニックが披露されている。プログラムや数式になじみのない人でも理解しやすいように書かれているので、文系の人にもお勧めだ。(渡辺淳悦)

「データ思考入門」
荻原和樹著
講談社現代新書 990円(税込)

姉妹サイト