米国で「ロボット記者」増加 データを解析して記事を自動生成

建築予定地やご希望の地域の工務店へ一括無料資料請求

   野球の試合結果や株式相場、不動産価格といったデータを基に、記事を自動的につくり出すコンピューターソフトウエアが開発され、米メディアの間で利用が広まっている。

   記者より短時間かつ大量に記事を生成できるのが魅力で、文章の質も悪くないと評判だ。最近ではソフトを改良して、ツイッター上での発言とそれに対する反応をまとめ、記事化する実験も進んでいる。

同じデータを基に顧客に応じた多彩な記事をつくる

フォーブスの記事執筆者名は「ナラティブ・サイエンス」となっている
フォーブスの記事執筆者名は「ナラティブ・サイエンス」となっている

   米シカゴのIT企業、ナラティブ・サイエンス社は大手誌「フォーブス」など米メディアに記事を配信する。だが、専門記者を抱える通信社ではない。同社が開発したソフトが記事を生成しているのだ。

   例えばフォーブスに提供している金融記事では、米有力企業の直近の決算内容や過去の業績、市場の動き、アナリストの予測といったデータをソフトが解析し、文章化されている。その際にフォーブス独自の記事スタイルやトーン、内容の方向性といった情報をソフトに与えれば、「フォーブスらしい」記事がつくられる流れだ。上場企業ごとに決算記事を書くとなれば人員も時間も必要だが、自動化されたシステムを使えば「大量生産」が可能となる。文体も「ビジネスリポートにする」「読み物にする」「短く要約」と変えられるうえ、顧客媒体独特の表現スタイルをソフトに指示できるため、基礎となるデータが同じでも顧客に応じて多彩な記事を提供できる。

   肝心の記事内容も、「ピューリッツァー賞が取れるほどの文章力ではないが、記事としては全く支障なし」というのが欧米メディアの評価だ。もともとナラティブ社は、米ノースウェスタン大学ジャーナリズムスクールと情報工学の共同プロジェクトから始まった。同社のスチュアート・フランケル最高経営責任者(CEO)によると、現在では金融やスポーツ記事のほか、全米400に上る不動産市場の市況サマリーをまとめ、業界専門メディアに販売しているという。

   最近では、ツイッター上の投稿内容を分析して記事化するシステム開発に着手。米ウォールストリートジャーナル電子版のブログ「オールシングスD」は2012年2月16日付の記事では、当時米大統領選の共和党候補だったニュート・ギングリッチ氏のツイートと、他のツイッターユーザーがギングリッチ氏に関してつぶやいた内容を解析し、記事にまとめたものを紹介した。

毎月1万5000本の記事を生成

   米オートメーテッド・インサイツ社は主に、スポーツ関連の記事を自動生成している。同社の場合、100万を超えるウェブサイトのコンテンツを参照し、20億もの統計データを蓄積するデータベースを駆使して大リーグや全米大学バスケットボールなど人気スポーツ記事を配信する。今日では、毎月1万5000本もの記事を生成しているという。

   ツイッターとも連動。データ解析によって、人気スポーツのチームや選手をリスト化し、関連情報をリアルタイムで提供するサービスだ。例えばリストの中からシアトル・マリナーズのイチロー選手を選んでフォローすると、イチロー選手が出場する試合すべての打席の結果が即時にツイッターのタイムライン上に表示される。

   ナラティブ社やオートメーテッド社のように、膨大なデータをソフトで分析して記事化する仕組みを、欧米メディアは「ロボット記者」などと注目している。大量のデータを短時間で分析するのは、人力では難しい。分野やメディアによっては執筆スピードや記事の本数を優先し、「読み手が感動する文章力」という条件は二の次になることもあるだろう。「いずれはロボット記者が主流になるのでは」との声も聞こえてきそうだ。

   英有力紙「タイムズ」の日曜版「サンデー・タイムズ」2012年5月20日の記事では、米大学教授の話を引用し、ロボット記者が人間に及ばない点として「さまざまな事実とアイデアを組み合わせて調査報道としてまとめあげること」とした。数値データに頼らず、市民の生の声や感情を丹念に拾って表現するような記事は、現時点でロボット記者には書けないだろう。だが既に、大手メディアがロボット記者への「発注」を増やしているのは事実。ソフトが進化すれば、優れた調査報道すら手がける「全自動メディア」が登場するかもしれない。

姉妹サイト