いろんな日本語EUCについてのまとめ
- 日本語EUC(EUC-JP)にはいろいろあって頭がこんがらがってきたので、サルにもわかるように(つまり、自分があとから見て理解できるように)まとめてみた*1。まず、EUC-JPにはどんな種類があるのだろうということで、わたしの環境で実装例を確認できるものをピックアップしてみた。下図のうちeucJP-openとIANAのEUC-JPについては身近な実装例を思いつかなかったが、これを外すわけにはいかないだろうと思って入れておいた。
- 各EUC-JPのレパートリをまとめたのが、下図。eucJP-openには上図に示したようなバリエーションがあるが、レパートリは共通。「JIS X 0208の国際基準版・漢字用8ビット符号 + JIS X 0201片仮名」については、これを一言で表現できる呼称を思いつかないので、以下の図では仮に「TextEdit」と表記する。
- 下図は、各EUC-JPのレパートリと符号空間の関係を示したもの。黄色地と紫地はIBM拡張文字ブロックであり、レパートリは同じだが並びに互換性はない。いずれもIBM拡張文字のうちJIS X 0208またはJIS X 0212に含まれないもののみをこのブロックに収録している。IBM-33722(Safariが採用しているEUC-JP)におけるJIS X 0212用の領域は、IBM拡張文字をサポートするために必要な文字のみを含む。