グーグルやヤフーといった大手IT企業が、ウェブサイトの内容を要約するアプリケーションを開発している会社を高額で買収するケースが相次いでいる。
これまで、情報をまとめて意味づけしたり、文章を書いたりすることを機械的に行うことは難しく、記者に代表されるような「人力」でしか行うことができないとされてきたが、少しずつ状況は変わりつつある。
買収金額は30億円以上
IT専門ニュースサイトのテッククランチ(TechCrunch)やロイター通信が2013年4月25日に報じたところによると、グーグルは事前言語処理ソフトを専門とするベンチャー企業「Wavii」を買収した。買収金額は3000万ドル(約30億円)以上にのぼるという。アップルもiPhoneなどに搭載された音声アシスタント機能「Siri」の強化を狙って買収を試みたが、グーグルが競り勝った。
これに先立つ3月25日には、ヤフーがニュース要約アプリ「Summly」を買収すると発表したばかり。Summlyは、英国人のニック・ダロイシオさんが16歳の時に開発したことでも知られ、こちらも買収額は3000万ドルと伝えられている。
では、これらのアプリは、どの程度「すごい」のか。
例えばWaviiの場合、ツイッターやフェイスブックのアカウントとひもづけて使用する。記者は航空関係の話題を扱うことが多いからか、「国家運輸安全委員会」(NTSB)や「ボーイング」といった単語が「おすすめ」の候補として表示される。
「おすすめ」を設定すると、Waviiのトップページには利用者の関心に応じたニュースの項目が表示される。特に特徴的なのが、表示されるニュースのリード文が機械的に要約されていることだ。
記事の複数のパラグラフの内容を分析して、自動的に文章を生成
例えばトップページの一番上に表示されている文章は、
「国家運輸安全委員会(NTSB)は今日、787のバッテリーが過熱する確率の計算方法について、ボーイング社幹部が同委員会に対して不完全な情報を提供していたことを明らかにした」
というもの。通常のニュースサイトであれば「見出し」にあたる部分だ。この文章をクリックすると記事全文が読めるのだが、リンク先の記事の最初の段落には「航空事故調査官」とあるだけで、NTSBという固有名詞は見あたらない。サイトが、配信を受けた記事の複数のパラグラフの内容を分析して、自動的に文章を生成していることがわかる。
利用者はニュースの内容について、「いいね!」「驚いた」「怒ってる」「愛してる」「疑わしい」という5つの感情を表現できる仕掛けもあり、利用者同士で内容について議論ができる。
04年に日本語版でもサービスが始まった「グーグルニュース」は、数多くあるニュース記事を自動的に価値判断してレイアウトしたとして脚光を浴びた。Waviiの仕組みがさらに改良されば、「長文の発表記事から自動的に短い記事が生成される」という時代も遠くなさそうだ。