京都大学と放送大学の合同研究グループは2016年12年6日、講演や講義の音声から自動的に字幕をつけるシステムを開発したと発表した。
テレビやインターネットで配信される放送大学の講義は、これまで人手で書き起こしていたが、効率的に早く作製できるうえ、ほかの分野でも手話に頼ることが多い聴覚障害者への情報提供が飛躍的に進むことが期待される。
人手で書き起こすより3分の1の時間で
京都大学が12月6日付で発表した資料によると、障害者差別解消法が2016年度から施行され、放送大学のオンライン授業では聴覚障害者のために手話通訳や字幕の付与が求められているが、現在、字幕がついているのは半数ほど。人手や予算が課題になっている。研究グループは、コンピューターの音声認識システムの学習機能を高め、大規模な講義・講演データや教科書、テキストから専門用語を登録、おおむね90%の認識率で講師の音声からリアルタイムに字幕を作ることに成功した。
このシステムを使うと、従来の人手による製作より、時間が3分の1に短縮される。研究リーダーの河原達也・京都大学教授は、発表資料の中で、「講演や講義に字幕をつけることは、聴覚障害者への情報の保障だけでなく、理解を深める効果があると考えています。今後、放送大学以外のさまざまな教育コンテンツに字幕をつけることを展開していきたい」と語っている。
この研究成果は、2016年12月2日に情報処理学会アクセシビリティ研究会で報告された。