2013-01-01から1年間の記事一覧

Moji_Johoの公開レビュー(PRI 259)に含まれない文字

PRI 259を逆方向から見てみるエントリ。 Moji_JohoのIVS登録は、原則として「文字情報基盤が対象としている(MJ番号の振られている)すべての漢字をIVS対応アプリで利用可能とする」ことを目指していると思われる。言い換えると、MJ番号の振られている文字の…

爆発するIPAmj明朝

IPAmj明朝を含むPDFを、iOSのメールアプリやiBooksで表示すると、特定のグリフが爆発する。 爆発前というか、爆発しない環境での表示は、こんなかんじ。 爆発するグリフをOTMaster Lightというツールで見てみた。爆発していた。 「Gridfit」のチェックを外し…

文字情報基盤のIVS登録

文字情報基盤のIVS登録(公開レビューはPRI 259)について検討したいのだけれど、その前に、前提となる基本的なことについて、ざっとおさらい。 文字情報基盤は汎用電子の後継プロジェクトだが、汎用電子が戸籍統一文字・住基ネット統一文字・登記統一文字を…

Mavericksの絵文字バリエーション・シーケンス

Mavericksでは、文字ビューアの「絵文字」から一部の絵文字を入力すると、「これは絵文字ですよ」ということを示す符号(U+FE0F)が自動的に付加されるようになった。また、文字ビューアの「矢印」「囲み文字」「象形文字」「標識/標準記号」などから一部の…

CJK統合漢字拡張Fがヤバイ

日本がCJK統合漢字拡張F1/F2に提案している文字には、すでにUCSに入っている漢字と見分けがつかない例がいくつもある。これらは、提案書*1に「Similar and Variation」として既存の文字の符号位置が記載されているものの一部であり、つまり、似ている漢字の…

i.softbank.jpから送信した絵文字のフォールバック

SoftBank iPhoneのメールアプリで@i.softbank.jpアドレスから絵文字入りのメールを送信すると、charset=Shift_JISになる*1。このため、SoftBank絵文字との対応関係を持たない絵文字は、すべて比較的意味合いの似た絵文字または「〓」に置き換えられる。この…

絵文字が表示されない状況について改めてまとめてみる

絵文字の送受信に関しては、送り手と受け手の環境やメールアドレスの組み合わせによって結果が異なってくることに加え、文字ごとにキャリアの変換テーブルの影響を受けるため、その全容を記述するのは難しい。そこで今回は、「変換テーブルの影響」はバッサ…

iPhone間の新しい文字化け「兄化け」

iPhone間の新しい文字化けパターンが発見されたのでメモ*1。この少なくとも3つのダメな仕様が重なって発生する文字化けは、発見者によって「兄化け」と命名された*2。 「兄化け」は、兄がSoftBankまたはauのiPhoneでメッセージアプリを、妹がiPhoneのメール…

ドコモのUnicode絵文字対応表3(ケータイをソースとしないUnicode絵文字)

前々回と前回の続き。日本のキャリアの絵文字をソースとしないUnicode絵文字について。iPhoneでは、これらの絵文字はすべて他の絵文字と区別なく、絵文字パネルから入力できる。 現在のところ、ドコモのサーバはこれらを一律に(UTF-8からShift_JISに変換す…

ドコモのUnicode絵文字対応表2(iモード絵文字にないケータイ絵文字)

前回のエントリの続き。ケータイ絵文字をソースとするUnicode絵文字のうち、(Unicodeの対応表で)iモード絵文字との対応を持たないもの。 このうち一部の文字はiモード絵文字に変換されるが、それらはいずれもフォールバックであり、n対1変換となっている*1…

ドコモのUnicode絵文字対応表1(iモード絵文字にあるもの)

(たぶん)ドコモiPhoneの登場にともなって、ドコモのサーバがUnicode絵文字に対応した。ドコモのケータイ宛にcharset=UTF-8でUnicode絵文字を送ると、ドコモのサーバがドコモのShift_JISに変換する。 どのような変換テーブルを用いているのか、確認した結果…

iOS 7のメールアプリの絵文字トラブルまとめ

この項10月28日追記。iOS 7.0.3でSoftBank iPhoneのメールアプリの仕様が修正された。iOS 7.0.3にアップデートした場合、いちばん下の図(au→SoftBank)における2つの豆腐は、絵文字で表示される。 iOS 7のメールアプリでは(原因の多くはサーバ側にあるのだ…

ドコモiPhoneのspモードメールで送受信できない文字

ドコモiPhoneのメールアプリでdocomo.ne.jpアドレスを使用している場合、相手の環境にかかわらず送信も受信もできない文字が存在する*1。絵文字以外については、BMP(Unicodeの0面)外の文字がダメっぽい(下図)。たとえば「しかる」は「叱る」ではなく(改…

ドコモiPhoneのspモードにおける絵文字の送受信

ドコモiPhoneのメールアプリで@docomo.ne.jpを使った場合の絵文字について調べてみた*1。細かい話はいろいろあるし、すべての組み合わせについて検証したわけではないが、おおまかに言えば、下図のようなかんじだと思う。 送られてきた絵文字の表示について…

iOS 7にしたら送信したメッセージが化けるようになった(直りました)

この項10月28日追記。iOS 7.0.3でSoftBank iPhoneのメールアプリの仕様が修正された。 「iOS 7にしてから文字化けするようになった」という話には、知る限りにおいて2つのパターンがある。1つ目は「SoftBank iPhoneで受信したメールの絵文字が表示されない」…

iOS 7のメールで「目がハート」が「狼」に化ける(直りました)

この項10月28日追記。iOS 7.0.3でSoftBank iPhoneのメールアプリの仕様が修正され、charset=Shift_JISのSoftBank絵文字が表示されるようになった。 昨日のエントリの続き。iOS 6のSoftBank iPhoneでは、メールアプリはShift_JISのSoftBank絵文字(下図、黄色…

iOS 7の@i.softbank.jpアドレスで絵文字が表示できない(直りました)

この項10月28日追記。iOS 7.0.3でSoftBank iPhoneのメールアプリの仕様が修正され、charset=Shift_JISのSoftBank絵文字が表示されるようになった。 iOS 7のメールアプリで@i.softbank.jpアドレスを使用している場合、受信したメールに含まれる絵文字が表示さ…

日本ソースのCJK統合漢字拡張F1候補・その2

JMJ番号 文字画像 戸籍統一 住基統一 類似文字 字書典拠 読み JMJ-059738 J+B386 JMJ-059739 J+B387 カ JMJ-057815 175430 講談社新大字典 ハン・ボン・ヘン・まがき JMJ-057810 175320 ゆずりは JMJ-014692 J+B3BE 大漢和辞典 レキ・かいばおけ・くぬぎ JMJ…

日本ソースのCJK統合漢字拡張F1候補・その1

JMJ番号 文字画像 戸籍統一 住基統一 類似文字 字書典拠 読み JMJ-059293 J+AD00 えだなし JMJ-056820 000200 角川大字源国字一覧 えだおろし JMJ-059294 J+AD04 たか JMJ-056821 000220 講談社新大字典 バン・マン JMJ-059296 J+AD0E JMJ-059297 J+AD11 𫝁 …

iOS 7の絵文字バリエーション・シーケンス

iOS 7では、ある種の絵文字を入力したとき、「これは絵文字ですよ」ということを示す符号(U+FE0F)が自動的にくっつくようになった。 これまで、「♥」のように絵文字と普通の文字が同じ符号位置を共有している例では、環境によってカラー絵文字で表示された…

IPAmj明朝がサポートしていないIVS

IPAmj明朝はHanyo-Denshiの2010-11-14版のIVDをサポートしているが、表示できないIVSが2つ存在する。以下、どういう事情でこうなっているのかについてメモ。 表示できないIVSの1つ目は、「凞」を基底文字とする「51DE E0105」(JB1908)。 汎用電子は、戸籍…

CJK拡張F1/F2候補とIVS

日本がCJK統合漢字拡張F1や拡張F2に提案中の文字を眺めていたら、すでにHonyo-DenshiのIVDに含まれている(IVSで表現できる)例が目についたので、識別子(平成明朝ID)をキーとしてチェックしてみたところ、全部で29字あった。 これらが手違いで提案に含ま…

日本ソースのCJK統合漢字拡張F2候補・その5

JMJ番号 文字画像 戸籍統一 住基統一 類似文字 字書典拠 読み JMJ-058668 385370 角川大字源国字一覧 もく JMJ-058670 386070 講談社新大字典 ト・ツ・きくいむし JMJ-058671 386200 講談社新大字典 ケツ・ケチ・ち JMJ-058672 386240 講談社新大字典 ジク・…

日本ソースのCJK統合漢字拡張F2候補・その4

JMJ番号 文字画像 戸籍統一 住基統一 類似文字 字書典拠 読み JMJ-059953 J+B688 大漢和辞典 ケン・みがく JMJ-042858 272180 大漢和辞典 ケン・ゲン JMJ-059954 J+B68F JMJ-059955 J+B690 JMJ-058198 273950 講談社新大字典 コウ・カイ・カツ・カチ JMJ-059…

日本ソースのCJK統合漢字拡張F2候補・その3

JMJ番号 文字画像 戸籍統一 住基統一 類似文字 字書典拠 読み JMJ-013841 166840 栝 講談社新大字典 テン JMJ-057726 166830 講談社新大字典 レイ・ライ JMJ-057740 168330 講談社新大字典 ゲチ・ケツ JMJ-057739 168320 講談社新大字典 ゲチ・ケツ JMJ-0597…

日本ソースのCJK統合漢字拡張F2候補・その2

JMJ番号 文字画像 戸籍統一 住基統一 類似文字 字書典拠 読み JMJ-059486 J+AFDB JMJ-057295 070930 角川大字源国字一覧 いと・とおさん JMJ-057298 072610 角川大字源国字一覧 おやま JMJ-057299 072670 講談社新大字典 イ・おどす JMJ-059489 J+AFF3 JMJ-0…

日本ソースのCJK統合漢字拡張F2候補・その1

前回のエントリの情報入りバージョン。はてなの文字数制限があるので、数日に分けてアップする予定。読みの情報は、文字情報基盤の文字情報一覧表Ver.002.02による。 JMJ番号 文字画像 戸籍統一 住基統一 類似文字 字書典拠 読み JMJ-056823 000240 講談社新…

漢字はどこまで増えるのか

戸籍統一文字・住基ネット統一文字のうち、日本がISO/IEC 10646のCJK統合漢字拡張F2に提案している1290字のリスト。要するに、前回のエントリで示した拡張F1の候補より優先順位の低いもの。F1候補・F2候補は、出現頻度の違いで振り分けられているようだ。今…

日本がCJK統合漢字拡張F1に提案中の518字

日本が拡張F1に提案中の漢字のリスト。拡張F1はまだ最初の段階なので、今後出入りのある可能性がある。 このリストを見て「誤字じゃん」と言う人もいるかもしれないが、2013年現在、UCSに入っていない戸籍統一文字・住基ネット統一文字・登記固有文字のうち…

文字鏡ソースの文字のその後

今昔文字鏡をソースとして2001年に日本からISO/IEC 10646に提案された文字(1028字)のうち、拡張Cにも拡張Eにも入らなかったもの(264字)について、主に自分用に軽くメモ。3つのグループに分けて表にした(文字画像は文字鏡フォント)。それぞれの事情につ…