2008-01-01から1年間の記事一覧

InDesignの「CIDベースの文字組みを使用」と括弧類(まとめ)

今回のエントリは、「CIDベースの文字組みを使用」に関する話題のなかでの括弧類の総集編であり、各論へのインデックスでもある。*1 「CIDベースの文字組みを使用」のオン/オフによる文字クラスの変化を記述しようとするとき、グリフ置換を考慮すると、CID…

日本語が消滅する日

「日本語が亡びるとき」って吉目木晴彦氏の論文のタイトルじゃなかったっけと思って資料を引っ張り出してみたら、そっちは「日本語が消滅する日」だった。懐しいものを発掘した記念に、心温まる冒頭のセンテンスを引用しておく。*1 現在のコンピュータの基本…

山括弧と仏語引用符と不等号の混乱

日本語組版で用いる山括弧、フランス語の引用符、そして不等号の形は、よく似ている。フランス語の引用符を含めて「山括弧」と呼ぶこともあるが、このエントリでは、日本語組版で用いる(シングルとダブルの)山括弧のみを「山括弧」と呼ぶこととする。また…

非標準的な縦組み用の引用符

Adobe-Japan1-2以前の時代から、CID+8275以降に8つ(4組)の引用符らしきグリフが存在する(下図)。 並びからすると下図のようなかんじだが、まあ、これはないだろう。 たぶん下図のように、手動で入力して縦組みに使うためのグリフなのだと思われる。InDes…

InDesignの「CIDベースの文字組みを使用」とシングル引用符

下図は、Adobe-Japan1におけるシングル引用符用のすべてのグリフを整理したもの。まず、起こしと受けでグリフが異なるグループ(上)と共通のグループ(下)に大別し、次にプロポーショナル、イタリック、全角、半角に分類した。黄色地は横組み(地の幅はグ…

Unicodeのアポストロフィとシングル引用符

Unicodeには、3つのアポストロフィがある(下図)。このうちU+02BC MODIFIER LETTER APOSTROPHEは、Adobe-Japan1-5以降のcmapを採用しているフォントでのみ利用できる。 U+0027 APOSTROPHEは、ASCIIにおける文字名とあいまいなセマンティクスを、そのまま継…

Illustrator CS3における二重引用符の問題

Illustrator CS3で新規に作成したドキュメントに二重引用符(U+201C、U+021D)を入力した場合、文字クラスが「括弧類」ではなく「欧文用文字」となる。下図はリュウミンProで各種の括弧を入力したもの。二重引用符以外の括弧では、文字クラスは「括弧類」で…

InDesignにおけるシングル引用符の縦組み

前回のエントリで取り上げた二重引用符の問題すべてを、シングル引用符は共有している。加えてシングル引用符には「UnicodeとCIDの2対1マッピング」という要素があり、事態をさらに複雑にしている。 リュウミンProのようにAdobe-Japan1-4以前のcmapを採用し…

InDesignで引用符はなぜ呪われているのか

前回のエントリでも触れたが、InDesignにはプロポーショナル(やイタリックや半角)の引用符を縦組みにするとグリフが正しく回転しないという、よく知られた問題が存在する(下図)。今回は、この問題について詳しく見てみようと思う。 InDesignは、「ある文…

Adobe-Japan1とInDesignの二重引用符

似たようなグリフが数多く入っているAdobe-Japan1のなかでも、二重引用符の仲間はかなり多く、InDesignの字形パネルなどを見ただけでは、その全容を把握するのが難しい。たとえば下図では26のグリフが表示されている。これだけでもややこしいが、実際はもっ…

「CIDベースの文字組みを使用」と省略記号

前回は、InDesignの「CIDベースの文字組みを使用」に関する挙動において、Unicodeの「基本ラテン」ブロックの文字のなかでは「$」と「%」が例外的な存在であることを見た。そこで今回は、他の前置省略記号、後置省略記号について検討してみようと思う。 下図…

InDesignの「CIDベースの文字組みを使用」とは何か

InDesign CS2以降には、「環境設定:組版」に「CIDベースの文字組みを使用」というオプションがある。が、わたしはこれが何だったのか定期的にわからなくなって調べ直すハメになるので、今回はややしつこくメモしてみることとした。ヘルプには、輝かしい火星…

「Unicode Technical Standard #37」の改訂案

2chプログラム板「文字コード総合スレ part3」より。異体字データベースについて規定している「Unicode Technical Standard #37」の改訂案(Proposed Update)が出ている件。 866 :デフォルトの名無しさん:2008/10/16(木) 22:26:47 http://www.unicode.org…

Adobe-Japan1-5の漢字とメイリオの漢字

以前のエントリ(メイリオは補助漢字をサポートしていない)では、「メイリオのグリフセットは、漢字に限定すればAdobe-Japan1-5と同じ」と述べた。今回はその補足として、漢字におけるAdobe-Japan1-5のCIDとメイリオのGIDの対応関係をメモしておく(下図、A…

「JIS X 0212とAdobe-Japan1-4の微妙な違い」の例示字形入りの図を作ってみた

mashabowさん(しろもじメモランダム)の「Adobe-Japan1-4 で追加されたグリフと JIS X 0212 規格票との微妙な字形差」というエントリが興味深い。 どなたか気が向いた方、作ってください>< 作ってみた。mashabowさんが作成された表をもとに、例示字形の画…

メイリオのギリシア文字とキリル文字

JIS X 0208に含まれるギリシア文字(06区01点〜24点、33点〜56点)とキリル文字(07区01点〜33点、49点〜81点)について、規格上は「全角」あるいは「プロポーショナル」という属性は(ラテン文字と同様)定められていない。 Adobe-Japan1では、これらの文字…

CJKV Information Processing, Second Edition

Ken Lundeさんの『CJKV Information Processing』(河豚本)の改訂版が12月に出版されるとのこと(http://oreilly.com/catalog/9780596514471/)。 CJKV Information Processing, the unsurpassed source of information on processing text in Chinese, Jap…

メイリオにはどんな文字が入っているのか

前回のエントリでは、メイリオに含まれる漢字集合がAdobe-Japan1-5のそれと一致することを述べた。今回はメイリオに含まれる全グリフを対象として、それがAdobe-Japan1-5にも含まれるかどうかを確認してみた。 結果。ひとつひとつのグリフについてきちんと見…

メイリオは補助漢字をサポートしていない

周知のことなのかもしれないが、わたしは今日まで知らなかった。MS明朝およびMSゴシックが補助漢字(JIS X 0212)をサポートしているのに対して、メイリオのグリフセットは、漢字に限定すればAdobe-Japan1-5と同じであり、補助漢字のレパートリをカバーする…

メイリオの漢字の並び順

メイリオに含まれる漢字のグリフを、Mac OS Xの文字パレットでGID(グリフID)順に表示したのが、下図。先頭は「日」で、その後に「大年国」と続く。 「メイリオでは漢字を使用頻度順に収録することで描画時間の短縮化を図っている」というような話を、以前…

Unicodeに丸付き数字はいくつまであるのか

丸付き数字は、JIS X 0208には含まれず、CP932やMacJapaneseには1から20まで入っている……というあたりまではすぐにわかるが、それ以外の文字セットについては、即答できる人は少ないのではないか。答えは下図のとおり。 Stdフォント(Adobe-Japan1-3)なら0…

InDesign CS3における漢字の表現方法の優先順位

InDesign CS3で字形パネルのダブルクリックによって漢字を入力したとき、そのグリフは文字コード的にどのような扱いになるのか。 入力されるグリフが、フォント内部のcmapテーブルでUnicodeの符号位置と直接対応付けられている場合。そのグリフはUnicodeの符…

miで行われているUnicode正規化について

さきほどのエントリの補足。文字列をmiにペーストした際に行われているUnicode正規化がNFCだという点について。 下図右下のウインドウは、miで1行目の「オリジナル:」以降(これを「文字列A」と呼ぶ)をコピーし、2行目の「ペースト後:」以降にペーストし…

miにペーストした互換漢字が化ける件

あさうすさん(実験る〜む)の『「テキストエディット」 vs「mi」』について。まだ考えのまとまっていない部分もあるが、以下、現時点でわかっている点についてだけ。 文字列をコピーしてmi 2.1.8b4にペーストした場合、その文字列に対してNFCのUnicode正規…

InDesignで字形パネルから入力したグリフの属性

InDesign CS2で、たとえばU+73CA「珊」を入力し、字形パレットのダブルクリックでCID+7691(木册)に置換した上でInDesignタグとして書き出すと、となる。一方、InDesign CS3 5.0.3で同じ操作をすると、となる。いつからこうなったのだろう? InDesign CS3で…

メイリオの「簾」

メイリオは、U+7C3E「簾」の'jp90'グリフに、韓国ソースのCJK互換漢字U+F9A6を対応させている。わたしの知る限り(といっても、Windowsのことは何も知らないが)、このようなフォントは他にはない。下図水色地は、U+7C3E「簾」の'jp04'グリフ、ピンク地は'jp…

Mailの改行位置がバラバラな理由

(Tiger以降の)Mailは、送信するメッセージに1行70バイト前後で改行を入れる仕様となっている。この改行は、受信側がformat=flowedに対応していない場合に顕在化する。 ちゃんと調べたわけではないが、format=flowedに対応していない環境はけっこう多い気が…

LeopardのMailにおける送信済みメッセージの文字化け

LeopardのMailでは、送信したメッセージが、(送信先では化けていないのに)送信済みメールボックス内で文字化けしていることがある。 この現象は、基本的には「X-Apple-Encoding-Hintというフィールド」に書いた「下書きメールボックスの文字化け」と同じ理…

「Unicodeに入った漢字」と「まだUnicodeにない漢字」

Acrobat 9に付属するKozMinPr6-Regular 6.004は、最新のcmap(「CMapのバージョンの違い」を参照)を採用しており、Unicode 5.1で追加された7文字の漢字が、新たにUnicodeの符号位置と対応付けられている(下図)。 これら7文字はもともとAdobe-Japan1をソー…

Acrobat 9でIVSを書き出してみた

Acrobat 9のフォームフィールドに、KozMinPr6N-RegularでU+845Bの「葛」を入力後、異体字パレット(と仮に呼んでおく)で「匕」形の「葛」に置換したのが、下図。 この状態で、Acrobat 9 Proの「フォーム」メニューから「フォームデータを管理>データを書き…