国会図書館で出版物テキストデータの実験

建築予定地やご希望の地域の工務店へ一括無料資料請求

   国立国会図書館は、出版物のテキストデータの作成および検索に関する技術面での実証実験を実施する。2010年7月20日、実験に参加する出版社や印刷会社の募集を開始した。

   データの作成実験では、参加企業からデジタル出版データを提供してもらい、そこからテキストデータを抽出して汎用フォーマット化するのが目的。国会図書館総務部企画課に聞くと、従来決まったフォーマットがないため、実験を通してどのような形で汎用化できるか、調査を含めて検証するという。

   検索の実験では、これまで本のタイトルや著者名といった限定的な検索方法しかなかったが、全文データから検索できるようになった場合にどのような検索の可能性が広がるかを調べるとのことだ。

   協力企業の応募の締め切りは8月31日。10月から11年1月にかけて実証実験のシステムを構築して、3月までに実験を実施、結果を取りまとめる予定。

姉妹サイト