2006-01-01から1年間の記事一覧
Windows Vistaにおける字形の変更が話題となっているが、これをInDesign CS2などが提供しているグリフ置換機能と結びつけた論点はまだ出ていない気がするので、軽くメモ。 Windows(Unicode)は、しんにょうの点の数を区別しない体系である。だからこそWindo…
以前のエントリ(ヒラギノでは全角でデザインされていない文字)で、わたしは以下のように書いた。 たとえば「○か×か」というテキストをヒラギノで表示した際、「×」だけが小さく見えて困惑したといった経験を、多くのMac OS Xユーザが持っていると思う。こ…
2ch(http://pc7.2ch.net/test/read.cgi/mac/1160702287/614)で仕入れたネタを、少し発展させてみる。以前のエントリ(Mac OS Xでは欧文フォントで小さく表示されることのある文字)では、「Mac OS Xでは★(U+2605 BLACK STAR)はMshtakanというアルメニア…
JIS X 0213:2004では、「表外漢字UCS互換の文字」として以下の10文字が追加された。 Mac OS Xは、JIS X 0213の(符号化方法ではなく)レパートリを採用しているのだから、この10文字についても「JIS X 0213:2004の規格票が発行される以前から対応済み」と言…
Microsoftのサイト(JIS X 0213:2004 対応と新日本語フォント「メイリオ」について)から入手できる資料には、Windows VistaのMSゴシックおよびMS明朝について、以下のような記述がある。 字形セットとしては、Windows XPで利用可能だった122文字のJIS90字形…
以前、リムネットのアドレス宛のメール(charset=UTF-8)でおもしろい文字化け(やぎさん郵便(Apple Mail版))が見られた。そこで、検証のために再度UTF-8のメールを送ったところ、これが届かない。charset=ISO-2022-JPのメールなら届くので、おそらくサー…
明朝体の筆押さえ(ヒゲ)には、「分」や「公」などの上部の「八」に付くものと「父」や「延」などの右払いに付くものがある。 以下、便宜的に前者を「ハチヒゲ」、後者を「チチヒゲ」と呼ぶ。図は写研の本蘭明朝、ヒゲありモード。 多くの書体あるいはシス…
ブラウザなどで「○」や「■」が小さく見えたり、三点リーダの位置がずれたりして困惑した経験を、多くのMac OS Xユーザが持っていると思う。これは前回のエントリ(ヒラギノでは全角でデザインされていない文字)で書いた話と似ているが、原因は別で、アプリ…
たとえば「○か×か」というテキストをヒラギノで表示した際、「×」だけが小さく見えて困惑したといった経験を、多くのMac OS Xユーザが持っていると思う。これは、ヒラギノがU+00D7 MULTIPLICATION SIGN(乗算記号)をプロポーショナルでデザインしているため…
Unicodeでは、Plane 15(U+F0000..U+FFFFF)とPlane 16(U+100000..U+10FFFF)が私用面(Private Use Plane)である。 私用面の文字、たとえばU+F0000「」やU+100000「」は、egbridge Universalの文字パレットやSafariでは「バツ印の入った豆腐」として表…
白やぎさんがお手紙書いた。*1 白やぎさんのお手紙化けた。*2 仕方がないからお返事書いた。*3 黒やぎさんのお返事化けた。*4 *1:Apple Mailの謎の仕様により、「まるいち」は不正なISO-2022-JPで送信される。詳しくはこちら。 *2:Apple Mailは自分が作成し…
Mac OS X 10.4の文字パレットで「表示:コード表>その他のエンコーディング>Shift-JIS (X0208)」とする。括弧内に「0208」と表記してあること、そして表の中からシステム外字領域を消している(下の画像で罫線素片と漢字の間)ことから、「Shift-JIS (X020…
Mac OS X 10.4の文字パレットで「表示:コード表>その他のエンコーディング>X0213 面区点」とし、たとえば1-03-16の文字をクリックすると、文字の情報として「Shift JIS (X0208):0030」と表示される。 「0030」ではなく「30」だと思うのだが、わたしは何…
先日のエントリ(Apple Mailにおけるテキストエンコーディングの優先順位)の続き。Apple Mailは、日本語環境においては、送信しようとしているメールに含まれる文字の種類によってcharsetを決定するが、やや複雑なのが、仮名や漢字が出現しないケースである…
Apple Mail(2.1)の標準テキスト・モードにおいて、テキストエンコーディング「自動」でU+203E OVERLINEを送信しようとすると、次のようなアラートが表示される。 このメッセージは、手動で不適切なcharsetを指定したときに表示されるものであり、テキスト…
以前のエントリで以下のように書いたが、ちょっと訂正。 Apple Mail(バージョン2.1(752/752.2)で確認)は、日本語環境においては、送信しようとしているメールに含まれる文字の種類によって、US-ASCII>ISO-2022-JP>CP932>UTF-8の優先順位でcharsetを決…
SafariがEUC-JPのページにおいて、バックスラッシュであるはずの0x5cを円記号として表示してしまうことについては以前に指摘した。今回、この問題を回避するために数値文字参照を使ってバックスラッシュを表現しようとしたところ、新たな問題を発見。「�…
「Mac Mail ¥マーク 文字化け」で検索して来訪された方がいたので、(今から書いても遅いとは思うけど)その話を。 JIS X 0208:1997が規定しているRFC 1468符号化表現(ISO-2022-JP)は、ISO/IEC 646 IRV(国際基準版)に切り替えるエスケープ・シーケンス…
JIS X 0208の範囲内の文字を対象に、WindowsとMacでUnicodeマッピングが違うものをリストアップしてみた。 Windows側のマッピングの文字(U+FF5E FULLWIDTH TILDEなど)がMac環境のテキストに紛れ込んだ場合、目で見て違いを判別するのは難しいため、予期せ…
Safari(テスト環境は2.0.4)でテキストエンコーディングを「日本語(Shift JIS X0213)」としても、「日本語(Shift JIS)」と変わらない気がするのだが、わたしは何か勘違いしているのだろうか。 上の画像がSafari。「日本語(Shift JIS)」の範囲外の文字…
Mac OS Xでは、Apple Mail(Mail.app)でもテキストエディット(TextEdit.app)でも、「日本語(Shift JIS)」という表記はJIS X 0208:1997のシフト符号化表現(IANAに登録されているShift_JIS)を指している。Apple製のアプリではないJedit Xでも同様である…
Outlook Express(やOutlook)は、「HTMLメールの空行には必ずスペース(文字実体参照で表現されたU+A2C0 NO-BREAK SPACE)を入れる」ことになっているようだ(http://discussions.info.apple.co.jp/WebX?14@295.j3PUb3D8DGy.16@.f012fb9/56)。 HTMLにおけ…
Apple Mailの送信するCP932について細かい文句を書いた後でこういうことを言うのもなんだが、そもそもcharset=CP932のメールを送信する意味ってあるのだろうか。 Apple Mailでは新規メッセージを送信する際、メニューの「テキストエンコーディング」から「日…
Apple MailがMacJapanese(90pv)のシステム外字を「ISO-2022-JPもどき」で符号化し、送信することについては、以前に指摘した。今回は、Apple MailがMacJapaneseのシステム外字を「CP932もどき」で符号化し、送信することについて。 符号化のルール自体は単…
前回書いたように、Apple Mailはcharset=CP932の場合、いわゆるハシゴ高(U+9AD9)を0xEEE0で符号化する。また、テキストエディットを使用してテキスト書類を「日本語(Windows,DOS)」形式で保存した場合も、同様の結果となる。 CP932では、ハシゴ高は「NE…
Apple Mail(バージョン2.1(752/752.2)で確認)は、日本語環境においては、送信しようとしているメールに含まれる文字の種類によって、US-ASCII>ISO-2022-JP>CP932>UTF-8の優先順位でcharsetを決定しているようだ(CP932というcharsetはIANAに登録され…
丸付き数字に関するApple Mailの奇妙な挙動については以前に触れたことがある。そこでは、Apple Mailが丸付き数字を「ISO-2022-JPもどき」で符号化すると書いた。この記述自体は間違いではない。 が、わたしがそこで「ISO-2022-JPもどき」と書いたとき、Wind…
Mac OS X 10.4のApple Mailでは、標準テキストのメールは、下書きフォルダではhtml形式で保持される。メール本文中の行頭のスペースは、html化される際、U+00a0 NO-BREAK SPACEに置き換えられる。 NO-BREAK SPACEはISO-2022-JPには含まれていないので、行頭…
Shift_JISの0x5cは円記号であり、EUC-JPおよびUTF-8の0x5cはバックスラッシュである。 しかし、Mac OS X版のFirefox(1.5.0.4で確認)は、Shift_JIS、EUC-JP、UTF-8のいずれのページであっても、0x5cを円記号として表示することもあれば、バックスラッシュと…
Shift_JISの0x5cは円記号であり、EUC-JPおよびUTF-8の0x5cはバックスラッシュである。 SafariがShift_JISのページの0x5cをバックスラッシュとして表示するようになったのは、たぶんPanther以降(Safari 1.2以降)だが、なぜこのような仕様にしたのか、わたし…