C:F Diary

はてなダイアリーで書いていた記事です。更新はしません

パソコンで打てる字が増える

Yahoo!ニュースより
https://news.yahoo.co.jp/pickup/6266071

情報処理推進機構IPA)は12月25日、データで扱える漢字として約6万文字の国際規格化が完了したと発表した。これにより、複数の規格に依存していた常用外の漢字を、統一的な文字コードで扱えるようになる。これまで一貫的なデータのやりとりが難しかった人名用の異体字をカバーし、電子行政用のシステム構築や運用効率、利便性が大きく向上することが期待されるという。
日本では、1978年に約6000種の文字コードを初めて策定した。しかし6000種では人名や地名の表記には不足していたため、工業規格、戸籍の電算化、住民台帳それぞれの立場で独立に文字種の拡張が進んでいった。
個別に拡張が進むことで相互運用が難しくなることを懸念し、経済産業省は02年に戸籍や住民基本台帳などで必要となる文字の調査を開始、09年に約6万文字という調査結果を得た。これら6万文字の文字コードやデータベースなどの開発をIPAが進め、17年12月22日に発行された、文字コードの国際規格である「ISO/IEC 10646」の最新版に反映されたという。漢字の統一規格化の調査から完了まで、15年間に渡る事業となった。
IPAでは、国際規格化に合わせた「IPAmj明朝フォント」やMJ文字情報一覧表などのバージョンアップを順次実施していくという。

今まではパソコンで打つことができなかった漢字も打てるようになるってことか。調査から完了まで15年かかったっていうくらいだから、文字をデータ化するのって大変なことなんですね。中国で使われているような漢字も打てるのかな? まあ、日常で使うことはないだろうけど。…というか、漢字が6万もあったのに驚きですよ。せいぜい5000字くらいだと思ってたよ。

画像を詳しく見てみると、IPAmj明朝フォントは58861文字あり、その中に戸籍統一文字と呼ばれる文字が55271字。さらにその中に多くの住民が氏名に使う漢字が19563文字、さらにさらにその中に出現頻度などを元に選定されたJIS X 0213漢字が10050字、さらにさらにさらにその中に常用漢字が2136文字。僕が普段見るのは、JIS X 0213漢字くらいまでかな。画像では「辺」という漢字の異体字を紹介していますが、見たことがない漢字の方が多い。やっぱこれ中国で使われている文字じゃないか?