米ツイッター社が、利用者の過去のツイート(つぶやき内容)を英IT業者に販売している。業者は、ツイートを分析してマーケティングなどに活用したい顧客に向けて、必要な情報を抜き出すサービスを始めた。
現在では、全世界で1日に3億件を超えるツイートが飛び交う。これまでに蓄積された「ビッグデータ」を商売道具とするツイッター社には、批判的な意見も上がっている。
過去のツイートは消滅せず、すべて記録が残っている
英データシフト社は2012年2月28日、ツイッター社から2010年1月以降2年分のツイート内容の提供を受け、それに基づいた「データセット」の販売を開始した。
ツイッター社の3月21日の公式発表では、頻繁にツイートを投稿する「アクティブユーザー」の数は1億4000万人に達し、1日3億4000万ものツイートが流れる。これまでに膨大な量が蓄積され、今も連日増え続けるツイートの中には、生の声ならではの有益な情報も少なくないだろう。
しかし、この「ビッグデータ」から必要情報だけを掘り起こすのは容易ではない。そこでデータシフト社が、ツイッター社からアクセスを許された過去の大量のツイートをベースに、顧客が欲しがる情報をフィルタリングして絞り込む。ある商品やサービスについて「肯定派」「否定派」のツイートに区分けしたり、「ファッション」「食」「金融」といったテーマごとに分類したりして提供するのだ。
ユーザーの過去のツイートは消滅しているわけではなく、すべて記録が残っている。個人レベルでも「トプシー(Topsy)」のような検索サービスや特定のアプリを使って、過去にさかのぼってツイートを探すのは可能だが、相当の時間と労力を覚悟しなければならない。有益な情報だけを効率よく抽出できるかも不透明だ。
最近は企業も、ビッグデータの活用に注目している。例えば小売業では、顧客にポイントカードを登録してもらう際に年齢や性別、住所を記入してもらい、そこから顧客ごとの購入履歴をためていく。集まった膨大なデータを解析するなかで、ある商品をどんな人が購入しているか特徴を把握する。ツイッターの場合はツイートそのものがビッグデータを形作るが、これはツイッター社自ら収集したというよりも、投稿者がツイートして「集まって来た」もの。ツイートを利用する権利はどうなっているのだろうか。