Moji_Johoの公開レビュー(PRI 259)に含まれない文字

  • PRI 259を逆方向から見てみるエントリ。
  • Moji_JohoのIVS登録は、原則として「文字情報基盤が対象としている(MJ番号の振られている)すべての漢字をIVS対応アプリで利用可能とする」ことを目指していると思われる。言い換えると、MJ番号の振られている文字のうち、CJK統合漢字に含まれるか提案中のもの以外は、ほとんどすべてが今回のリストに含まれている。例外は、下図の32文字。以下、これらのグリフ(今回のエントリに含まれるすべての図において黄色地で示す)がリストから外された理由を考えてみる。


  • 下図は、諸橋大漢和の重複文字。大漢和で(部首違いで)区別されていることを典拠として戸籍統一文字に入ったと思われるもの。今回の登録では、1つの基底文字に「見た目で区別できない複数のグリフ」あるいは「部首の異なるグリフ」をぶら下げることはしていないようだ。ただし、基底文字の部首を区別できる「朣(U+6723)」と「膧(U+81A7)」のようなケースでは、Hanyo-Denshiでは共通だった識別子をわざわざ分離して、見た目では区別できないグリフを登録しようとしている(http://blogs.adobe.com/CCJKType/2013/12/pri-259.html)。


  • 下図は、文字情報基盤のMJ文字情報一覧表において「UCS対応カテゴリー」欄に「B」と記されているもの。この「カテゴリーB」は「既存の符号位置との統合の可否に付き、結論が出ていないもの。文字情報基盤事業及び情報規格調査会SC2専門委員会としての結論が出次第、UCSへの新規符号化提案もしくはIVSのMJ_Collectionへの追加登録を行う予定」(http://mojikiban.ipa.go.jp/1313.html)の文字。


  • 下図は、IPAmj明朝の実装字形に平成明朝とのズレがあるためにIVSのシェアを見送ったと思われる例。今後字形を修正した上で登録するのだろうか。戸籍統一文字の239770は、平成明朝の形もソースと違っているので、IPAmj明朝の字形を修正するとしたら、どちらに合わせるのかという問題もある。


  • 下図は、IPAmj明朝の実装字形がソースである住基ネット統一文字における区別を反映していないために登録を見送ったと思われる例。今後字形を修正した上で登録するのだろうか。


  • 下図のMJ057449とMJ028027は、単純になぜリストに含まれていないのかわからない。MJ057449の「UCS対応カテゴリー」は「A4」(文字情報基盤整備事業において個別に確認したもの)となっているが、「B」なのかなという気もする。


  • 12画の「御」(MJ029032)と11画の「御」(MJ011324)のうち11画のほうがリストに含まれていないのは、見た目で区別が付かないからだと思うが、12画のMJ029032(要するに普通の「御」)を平成明朝のJA2470(要するに普通の「御」)とのシェアではなく新規に登録しようとしている理由がわからない。


  • 下図のMJ060383がリストに含まれていないのは、MJ015994と見た目で区別が付かないからだと思うが、そもそもソースである住基ネット統一文字のC0BFとB494が何を区別したかったのだかわからない。