2006-01-01から1年間の記事一覧

MS書体の字形変更でダメージを受けるのは誰か

Windows Vistaにおける字形の変更が話題となっているが、これをInDesign CS2などが提供しているグリフ置換機能と結びつけた論点はまだ出ていない気がするので、軽くメモ。 Windows(Unicode)は、しんにょうの点の数を区別しない体系である。だからこそWindo…

Unicodeにマルバツのバツはあるのか

以前のエントリ(ヒラギノでは全角でデザインされていない文字)で、わたしは以下のように書いた。 たとえば「○か×か」というテキストをヒラギノで表示した際、「×」だけが小さく見えて困惑したといった経験を、多くのMac OS Xユーザが持っていると思う。こ…

Mac OS Xの★(U+2605 BLACK STAR)はどんな状況で小さくなるのか

2ch(http://pc7.2ch.net/test/read.cgi/mac/1160702287/614)で仕入れたネタを、少し発展させてみる。以前のエントリ(Mac OS Xでは欧文フォントで小さく表示されることのある文字)では、「Mac OS Xでは★(U+2605 BLACK STAR)はMshtakanというアルメニア…

Mac OS XのJIS X 0213:2004サポート

JIS X 0213:2004では、「表外漢字UCS互換の文字」として以下の10文字が追加された。 Mac OS Xは、JIS X 0213の(符号化方法ではなく)レパートリを採用しているのだから、この10文字についても「JIS X 0213:2004の規格票が発行される以前から対応済み」と言…

Windows Vistaのjp90タグにおける「喩」の問題

Microsoftのサイト(JIS X 0213:2004 対応と新日本語フォント「メイリオ」について)から入手できる資料には、Windows VistaのMSゴシックおよびMS明朝について、以下のような記述がある。 字形セットとしては、Windows XPで利用可能だった122文字のJIS90字形…

リムネット(RIMNET)のメール・アドレスにUTF-8のメールが届かない件

以前、リムネットのアドレス宛のメール(charset=UTF-8)でおもしろい文字化け(やぎさん郵便(Apple Mail版))が見られた。そこで、検証のために再度UTF-8のメールを送ったところ、これが届かない。charset=ISO-2022-JPのメールなら届くので、おそらくサー…

表外漢字字体表のヒゲ政策がダメな理由

明朝体の筆押さえ(ヒゲ)には、「分」や「公」などの上部の「八」に付くものと「父」や「延」などの右払いに付くものがある。 以下、便宜的に前者を「ハチヒゲ」、後者を「チチヒゲ」と呼ぶ。図は写研の本蘭明朝、ヒゲありモード。 多くの書体あるいはシス…

Mac OS Xでは欧文フォントで小さく表示されることのある文字

ブラウザなどで「○」や「■」が小さく見えたり、三点リーダの位置がずれたりして困惑した経験を、多くのMac OS Xユーザが持っていると思う。これは前回のエントリ(ヒラギノでは全角でデザインされていない文字)で書いた話と似ているが、原因は別で、アプリ…

ヒラギノでは全角でデザインされていない文字

たとえば「○か×か」というテキストをヒラギノで表示した際、「×」だけが小さく見えて困惑したといった経験を、多くのMac OS Xユーザが持っていると思う。これは、ヒラギノがU+00D7 MULTIPLICATION SIGN(乗算記号)をプロポーショナルでデザインしているため…

私用面(Private Use Plane)用の豆腐がかっこいい件

Unicodeでは、Plane 15(U+F0000..U+FFFFF)とPlane 16(U+100000..U+10FFFF)が私用面(Private Use Plane)である。 私用面の文字、たとえばU+F0000「󰀀」やU+100000「􀀀」は、egbridge Universalの文字パレットやSafariでは「バツ印の入った豆腐」として表…

やぎさん郵便(Apple Mail版)

白やぎさんがお手紙書いた。*1 白やぎさんのお手紙化けた。*2 仕方がないからお返事書いた。*3 黒やぎさんのお返事化けた。*4 *1:Apple Mailの謎の仕様により、「まるいち」は不正なISO-2022-JPで送信される。詳しくはこちら。 *2:Apple Mailは自分が作成し…

Tigerの文字パレットの「Shift-JIS (X0208)」について

Mac OS X 10.4の文字パレットで「表示:コード表>その他のエンコーディング>Shift-JIS (X0208)」とする。括弧内に「0208」と表記してあること、そして表の中からシステム外字領域を消している(下の画像で罫線素片と漢字の間)ことから、「Shift-JIS (X020…

Tigerの文字パレットに軽く突っ込んでみる

Mac OS X 10.4の文字パレットで「表示:コード表>その他のエンコーディング>X0213 面区点」とし、たとえば1-03-16の文字をクリックすると、文字の情報として「Shift JIS (X0208):0030」と表示される。 「0030」ではなく「30」だと思うのだが、わたしは何…

Apple Mailのテキストエンコーディングの細かい話

先日のエントリ(Apple Mailにおけるテキストエンコーディングの優先順位)の続き。Apple Mailは、日本語環境においては、送信しようとしているメールに含まれる文字の種類によってcharsetを決定するが、やや複雑なのが、仮名や漢字が出現しないケースである…

Apple Mailでオーバーラインを送信しようとするとエラーになる

Apple Mail(2.1)の標準テキスト・モードにおいて、テキストエンコーディング「自動」でU+203E OVERLINEを送信しようとすると、次のようなアラートが表示される。 このメッセージは、手動で不適切なcharsetを指定したときに表示されるものであり、テキスト…

Apple Mailにおけるテキストエンコーディングの優先順位

以前のエントリで以下のように書いたが、ちょっと訂正。 Apple Mail(バージョン2.1(752/752.2)で確認)は、日本語環境においては、送信しようとしているメールに含まれる文字の種類によって、US-ASCII>ISO-2022-JP>CP932>UTF-8の優先順位でcharsetを決…

SafariがEUC-JPのページでバックスラッシュを表示できない

SafariがEUC-JPのページにおいて、バックスラッシュであるはずの0x5cを円記号として表示してしまうことについては以前に指摘した。今回、この問題を回避するために数値文字参照を使ってバックスラッシュを表現しようとしたところ、新たな問題を発見。「&#x00…

Apple Mailで円記号がバックスラッシュに化けて見える件

「Mac Mail ¥マーク 文字化け」で検索して来訪された方がいたので、(今から書いても遅いとは思うけど)その話を。 JIS X 0208:1997が規定しているRFC 1468符号化表現(ISO-2022-JP)は、ISO/IEC 646 IRV(国際基準版)に切り替えるエスケープ・シーケンス…

WindowsとMacでUnicodeマッピングが違う文字

JIS X 0208の範囲内の文字を対象に、WindowsとMacでUnicodeマッピングが違うものをリストアップしてみた。 Windows側のマッピングの文字(U+FF5E FULLWIDTH TILDEなど)がMac環境のテキストに紛れ込んだ場合、目で見て違いを判別するのは難しいため、予期せ…

Safariの「日本語(Shift JIS X0213)」って何?

Safari(テスト環境は2.0.4)でテキストエンコーディングを「日本語(Shift JIS X0213)」としても、「日本語(Shift JIS)」と変わらない気がするのだが、わたしは何か勘違いしているのだろうか。 上の画像がSafari。「日本語(Shift JIS)」の範囲外の文字…

Safariはなぜ「IBM拡張文字」を表示しないのだろう

Mac OS Xでは、Apple Mail(Mail.app)でもテキストエディット(TextEdit.app)でも、「日本語(Shift JIS)」という表記はJIS X 0208:1997のシフト符号化表現(IANAに登録されているShift_JIS)を指している。Apple製のアプリではないJedit Xでも同様である…

「Apple Mailで返信したら文字化けしていると言われた」といったケースのありがちなパターン

Outlook Express(やOutlook)は、「HTMLメールの空行には必ずスペース(文字実体参照で表現されたU+A2C0 NO-BREAK SPACE)を入れる」ことになっているようだ(http://discussions.info.apple.co.jp/WebX?14@295.j3PUb3D8DGy.16@.f012fb9/56)。 HTMLにおけ…

Apple Mailがcharset=CP932のメールを送信する理由がわからない

Apple Mailの送信するCP932について細かい文句を書いた後でこういうことを言うのもなんだが、そもそもcharset=CP932のメールを送信する意味ってあるのだろうか。 Apple Mailでは新規メッセージを送信する際、メニューの「テキストエンコーディング」から「日…

Apple Mailが送信する謎のハイブリッドCP932について

Apple MailがMacJapanese(90pv)のシステム外字を「ISO-2022-JPもどき」で符号化し、送信することについては、以前に指摘した。今回は、Apple MailがMacJapaneseのシステム外字を「CP932もどき」で符号化し、送信することについて。 符号化のルール自体は単…

Mac OS XのUnicode to CP932変換テーブルは、なぜMicrosoftのものと違うのだろう

前回書いたように、Apple Mailはcharset=CP932の場合、いわゆるハシゴ高(U+9AD9)を0xEEE0で符号化する。また、テキストエディットを使用してテキスト書類を「日本語(Windows,DOS)」形式で保存した場合も、同様の結果となる。 CP932では、ハシゴ高は「NE…

Apple Mailでハシゴ高が「釵」に化ける件

Apple Mail(バージョン2.1(752/752.2)で確認)は、日本語環境においては、送信しようとしているメールに含まれる文字の種類によって、US-ASCII>ISO-2022-JP>CP932>UTF-8の優先順位でcharsetを決定しているようだ(CP932というcharsetはIANAに登録され…

Apple MailのISO-2022-JP-90pv(適当に命名)について

丸付き数字に関するApple Mailの奇妙な挙動については以前に触れたことがある。そこでは、Apple Mailが丸付き数字を「ISO-2022-JPもどき」で符号化すると書いた。この記述自体は間違いではない。 が、わたしがそこで「ISO-2022-JPもどき」と書いたとき、Wind…

Apple Mailの下書きフォルダはcharsetの確認には使わないほうがいい

Mac OS X 10.4のApple Mailでは、標準テキストのメールは、下書きフォルダではhtml形式で保持される。メール本文中の行頭のスペースは、html化される際、U+00a0 NO-BREAK SPACEに置き換えられる。 NO-BREAK SPACEはISO-2022-JPには含まれていないので、行頭…

0x5cの表示に関するMac OS X版Firefoxの謎な仕様

Shift_JISの0x5cは円記号であり、EUC-JPおよびUTF-8の0x5cはバックスラッシュである。 しかし、Mac OS X版のFirefox(1.5.0.4で確認)は、Shift_JIS、EUC-JP、UTF-8のいずれのページであっても、0x5cを円記号として表示することもあれば、バックスラッシュと…

0x5cの表示に関するSafariの謎な仕様

Shift_JISの0x5cは円記号であり、EUC-JPおよびUTF-8の0x5cはバックスラッシュである。 SafariがShift_JISのページの0x5cをバックスラッシュとして表示するようになったのは、たぶんPanther以降(Safari 1.2以降)だが、なぜこのような仕様にしたのか、わたし…