草なぎ剛の「なぎ」の漢字も文字化けしない! 漢字6万字「国際規格化」のインパクト

富士フイルムが開発した糖の吸収を抑えるサプリが500円+税で

   パソコン(PC)で人名や地名を入力する際、特殊な漢字で該当する文字が見つからなかった経験はないだろうか。

   情報処理推進機構(IPA)は2010年9月から、行政で用いられる人名漢字など約6万字の漢字を整備する「文字情報基盤整備事業」を進め、その国際規格化が完了したと17年12月25日に発表した。IPAに取材し、詳しく聞いた。

  • IPAの発表資料より、文字情報基盤の概念図
    IPAの発表資料より、文字情報基盤の概念図
  • IPAの発表資料より、文字情報基盤の概念図

「渡辺さん」の「辺」にはいろいろな文字がある

   文字情報基盤とは何か。IPAの発表資料では「辺」という文字を例に取っている(画像参照)。「渡辺さん」「田辺さん」のように、人名に使われる「辺」の文字は実際には多種類だが、私たちが普段接する常用漢字2136文字の中には「辺」しか含まれていない。一方、「実用上の情報交換の必要性から、出現頻度等を元に文字を選定」した「JIS X 0213漢字」が常用漢字を含め1万50文字あり、新聞記事やウェブサイトに掲載する情報、一般向け公文書など広く使われる。この範囲だと「辺」のほかに「邉」「邊」が加わる。だがここまででも「範囲外」の文字がいくつもあるのは、記事中の画像で示されている通りだ。

   文字情報基盤とは、こうしたくくりとして最も範囲が広く、「戸籍のオンライン手続に使用することを目的として整理した文字」も含めて合計5万8861文字ある。ただし「JIS X 0213」から外れたおよそ4万8800字は、「個人のアイデンティティーに関わる文字」ではあるが用途は限定的だ。そのためコンピューター用に標準的に提供されている文字セットに含まれておらず、使い手が自力で作成、追加する「外字」となる。

   自治体では住民票や戸籍の人名の漢字を正確に表記させるため、外字をつくることがある。だが同じ文字を別の自治体が作字した場合、自治体ごとに異なる文字コードを登録していたため一貫性がなく、自治体を超えてコンピューター上の文書で外字を「共有」できなかった。コードが違うため、相手のところでは「文字化け」してしまうのだ。

   IPAは経済産業省などと2010年から、漢字5万8861文字について統一した文字コードに基づくフォントや、文字情報基盤の整備を進めてきた。ありとあらゆる漢字というわけではなく、戸籍、住民票に必要となる文字が対象だ。整備が完了した文字は「IPAmj明朝フォント」として、IPAのウェブサイトからダウンロードし使用できる。最新版は16年4月に公開されたものだ。

姉妹サイト