日本ソースのCJK統合漢字拡張F2候補・その1

前回のエントリの情報入りバージョン。はてなの文字数制限があるので、数日に分けてアップする予定。読みの情報は、文字情報基盤の文字情報一覧表Ver.002.02による。 JMJ番号 文字画像 戸籍統一 住基統一 類似文字 字書典拠 読み JMJ-056823 000240 講談社新…

漢字はどこまで増えるのか

戸籍統一文字・住基ネット統一文字のうち、日本がISO/IEC 10646のCJK統合漢字拡張F2に提案している1290字のリスト。要するに、前回のエントリで示した拡張F1の候補より優先順位の低いもの。F1候補・F2候補は、出現頻度の違いで振り分けられているようだ。今…

日本がCJK統合漢字拡張F1に提案中の518字

日本が拡張F1に提案中の漢字のリスト。拡張F1はまだ最初の段階なので、今後出入りのある可能性がある。 このリストを見て「誤字じゃん」と言う人もいるかもしれないが、2013年現在、UCSに入っていない戸籍統一文字・住基ネット統一文字・登記固有文字のうち…

文字鏡ソースの文字のその後

今昔文字鏡をソースとして2001年に日本からISO/IEC 10646に提案された文字(1028字)のうち、拡張Cにも拡張Eにも入らなかったもの(264字)について、主に自分用に軽くメモ。3つのグループに分けて表にした(文字画像は文字鏡フォント)。それぞれの事情につ…

CJK統合漢字拡張EのJKソース415字

ISO/IEC 10646:2014、Unicode 7.0で規格化される予定の、CJK統合漢字拡張E。そのうち日本ソースのものを表にしてみた*1。 「漢字の国際提案の歴史を図にしてみた」で述べたように、今昔文字鏡をソースとする国字集合が拡張Cに提案され、そのうち後回しにされ…

「闘」の旧字体をめぐって

改定前の常用漢字表では、「闘」の旧字体(康熙別掲字)がつぶれていて、字体が判別できない。この字を、JIS X 0213は下図のような例示字体で収録した。そして改定常用漢字表も、おそらくそれに倣っている。以下、「どうしてこれがこれになるの?」という素…

漢字の国際提案の歴史を図にしてみた

2001年以降に日本が国際提案した漢字について、どのような経緯で規格化されたか、規格化されようとしているのかを、おおざっぱな図にしてみた。細かいことを言い出すとキリがないので、それは言わない方向で。下図、グレー地はドラフト段階のもの。 2001年に…

なんたら統一文字の面積比の正確な図

戸籍統一文字、住基ネット統一文字、登記統一文字に含まれる漢字の数について、面積比が正確になるように図を描いてみた*1。 法務省が戸籍のオンライン手続きのために整理した文字集合が、戸籍統一文字。この戸籍統一文字を拡張した文字集合が登記統一文字で…

CJK統合漢字拡張CのJKソース367字

CJK統合漢字拡張Cのうち日本が提案したもの(JKソース)の367字はどのような基準で選ばれたのだろうというのが気になっていて、(その疑問が解消されていないまま)とりあえず表にしてみた。 この表には戸籍統一文字番号や住基ネット統一文字番号も入れるつ…

石井茂吉はおっぱいの夢を見るか

この「雌」の字、IPAmj明朝では区別してるんだけど、どこが違うかわかる? んー。無理に違いを探すなら、右上のあたりですかねー。 確かに、右側の「雌」のほうが、おっぱいが小さい。 おっぱい? 字源的にそうなんですか? いや、ノリでそう呼んでみただけ…

iPhone間のメールで@i.softbank.jp発のUTF-8が化けるようになった(直りました)

この項6月20日追記。twitterでこのエントリのURLを添えて孫社長と宮川CTOに対応をお願いしたところ、わずか2日で対応していただきました(https://twitter.com/miyakawa11/status/347614628685180928)。ありがとうございます! Appleのサポートコミュニティ…

JIS X 0213:2004の「解説」に突っ込んでみる

IVS本に突っ込んでいたら、その記述の元となっているJIS X 0213の「解説」の誤りらしきものを発見、というパターン。3つたまったので、まとめてメモしておく。 3.1.2 この規格の2000年版、JIS X 0208及びUCSに同一の字形があった815字 「これら815字のうち5…

IPAmj明朝の住基グリフ汚染

半年くらい前にツイートした件なのだけれど、より詳しい情報も含めてまとめておく。発端は@tree3yamaさんの、この発言。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(…

Windows 8のIVS実装についてのまとめ

関連するエントリのインデックス。タイトルだけでは中身がわかりにくかったりするので、こういう形でまとめておくことにした。基本的に、説明は上から順に読んでいただくのがいいかと。 説明(対話形式) MS122とは何か(昔のグリフで出ています) Vistaにお…

Windows 8のIVS実装一覧表(画像版)

ちょっと前にHTML版の一覧表を掲載したが、今回はWindows 8以外の環境でも見られる画像版。 コンパクトに納めるために、IVSの識別子(CID)は省略。また、MS明朝・MSゴシック・メイリオ共通の122字をMS明朝で示し、メイリオだけがサポートしている5字を末尾…

もし田村ゆかりがメイリオの実装に突っ込んだら

前回の「Windows 8のIVS実装一覧表」を見てて思ったんですけど、これ見よがしに色を付けて強調されてる例がありますよね。 ああ、メイリオだけがサポートしている(MS明朝・MSゴシックがサポートしていない)IVSね。 これって、どこから来た字なんですか? …

Windows 8のIVS実装一覧表

Windows 8のMS明朝・MSゴシックは122字、メイリオは127字のIVSをサポートしている。以下、その一覧表。 この表はIVSを含むソースを作成してCSSでフォントを指定したものなので、Windows 8以外の環境では、もちろんそれなりにしか見えない。ピンク地は、MS明…

人生がときめくWindows 8のIVS実装

皆さんこんにちは、片づけコンサルタントのこんまり先生です。 いきなりの個人名詐称……。 今日は、Windows 8のIVS実装について説明するわよ。 「わよ」? 最初に結論を言っちゃうと、Windows 8のMS明朝・MSゴシックがIVSでサポートしているのは、MS122から「…

俺のMS明朝がこんなに可愛いわけがない

この前、「VistaのMS明朝が200字以上も漢字の字形を変更してるのは何なの?」っていう話が出たので、今回はそのあたりを見てみようか。 JIS X 0213:2004が変更した168字以外にも、かなりの数の漢字をいじってるってことですよね。 うん。Vistaっていうと、表…

昔のグリフで出ています

今日はWindows 8のMS明朝における122字のIVS実装について説明しようと思ってたんだけど……。 気が変わったんですか? 話が長くなりそうなんで、詳しいことは後日に回して、今回は説明のカギになる「MS122」という文字集合に焦点を絞って語ってみようかと。 「…

IVS本へのツッコミ・まとめ

『Unicode IVS/IVD入門』(田丸健三郎、小林龍生)の非公式正誤表のようなもの*1。第1章と第2章はWindows 8の話なので、見ていない箇所もある。間違いの量に興味がある方は、最初から読まずに、第4章(時系列的にはこれが最初のエントリ)あたりからどうぞ。…

IVS本へのツッコミ・第2章まで

カバー われわれ日本語の処理にかかわるわるIT技術者にとって 「かかわるわる」→「かかわる」。 はじめに われわれ日本語の処理にかかわるわるIT技術者にとって 「かかわるわる」→「かかわる」。 p.12 (文字情報基盤整備事業の説明として)具体的には、図2-…

815文字の計算方法とリスト

JIS X 0213:2004の「解説」における「3.1 印刷標準字体及び簡易慣用字体とこの規格の文字との関係」に「この規格の2000年版、JIS X 0208及びUCSに同一の字形があった815字」というのが出てきて、「何だよそれ」と思って計算してみたので、自分用にメモ。 表…

IVS本へのツッコミ・第5章編

『Unicode IVS/IVD入門』(田丸健三郎、小林龍生)のなかでは、この章は比較的ラク(突っ込みどころが少ない)かと思っていたら、そんなことなかった*1。 pp.141-142 人名用漢字の文字数として常用漢字までカウントしている。 戸籍法・戸籍法施行規則におけ…

この「邉」を作ったのは誰だぁ!!

『Unicode IVS/IVD入門』(田丸健三郎、小林龍生)のなかで、目玉がWindows 8のIVS対応を紹介している第2章だとするなら、背骨といえるのが、IVSという枠組み自体について解説している第5章だよね。 たとえがしっくりきませんが、こだわらずに先に進みましょ…

IVS本へのツッコミ・第3章編

最後まで続ける気力があるかどうかわからないままはじめた『Unicode IVS/IVD入門』(田丸健三郎、小林龍生)への突っ込みシリーズだが、今回、第3章についてまとめたことで、ゴールが見えたかなというかんじ*1。 p.58 3.2.2 文字について 「3.2.2」→「3.1.2…

先生怒らないからリュウミンは手を挙げなさい

IVSファンの皆さん、こんにちは。 いえ、ぜんぜんファンとかじゃないですから。 『Unicode IVS/IVD入門』(田丸健三郎、小林龍生)の目玉と言えるのが、表2-7の「Windows 8におけるJIS X 0208:1990字形と異体字セレクター」だよね。 そうなんですか? Micros…

IVS本へのツッコミ・付録の「文字コード表」編

『Unicode IVS/IVD入門』(田丸健三郎、小林龍生)へのツッコミ第2弾。この本は、巻末に付録として2つの文字コード表を掲載しており、ページ数では全体の約半分に及ぶのだが、これらの表にもいろいろ問題があるように思う。 「USC」が215回出現 2つの文字コ…

『Unicode IVS/IVD入門』へのツッコミ・第4章編

『Unicode IVS/IVD入門』(田丸健三郎、小林龍生)を読んでいたら、いくつか気になる点があったので、まとめてみることにした。とりあえず、第4章(37ページ分)だけ。時間と気力があれば、今後、他も追加していくかも*1。組版上の突っ込みは(ひどい例以外…

セミナーでMicrosoftの人に質問するためのアンチョコ

Windows 8のIVSサポートについて、セミナーでMicrosoftの人に質問するための想定問答集(PDF)をtwitterで公開しつつ更新中(http://dl.dropbox.com/u/50939295/NAOI/MS_IVS_Q.pdf)。 Microsoftの人になりきって大いに語っているが、内容は「わたしの想像」…