いろんな日本語EUCについてのまとめ

  • 日本語EUCEUC-JP)にはいろいろあって頭がこんがらがってきたので、サルにもわかるように(つまり、自分があとから見て理解できるように)まとめてみた*1。まず、EUC-JPにはどんな種類があるのだろうということで、わたしの環境で実装例を確認できるものをピックアップしてみた。下図のうちeucJP-openとIANAのEUC-JPについては身近な実装例を思いつかなかったが、これを外すわけにはいかないだろうと思って入れておいた。


  • EUC-JPのレパートリをまとめたのが、下図。eucJP-openには上図に示したようなバリエーションがあるが、レパートリは共通。「JIS X 0208の国際基準版・漢字用8ビット符号 + JIS X 0201片仮名」については、これを一言で表現できる呼称を思いつかないので、以下の図では仮に「TextEdit」と表記する。


  • 下図は、各EUC-JPのレパートリと符号空間の関係を示したもの。黄色地と紫地はIBM拡張文字ブロックであり、レパートリは同じだが並びに互換性はない。いずれもIBM拡張文字のうちJIS X 0208またはJIS X 0212に含まれないもののみをこのブロックに収録している。IBM-33722(Safariが採用しているEUC-JP)におけるJIS X 0212用の領域は、IBM拡張文字をサポートするために必要な文字のみを含む。


  • 以下の図は、各EUC-JPの符号表のうち、比べてみたくなりそうな部分を適当に拾ったもの*2















*1:でも、間違っているかもしれない。特にIBM-eucJPのあたりがあやしい。

*2:けっこう手動で作っていたりするので、間違いがあったら教えてください。