「UTS #37: Ideographic Variation Database」改訂案の公開レビュー

  • 異体字データベースについて規定している「UTS #37」の改訂案については、以前のエントリで触れたことがあるが、その後、改訂案の内容に変更が加えられ、公開レビューが始まっている(http://www.unicode.org/review/#pri128)。引用したテキストのうち黄色地の部分は、前の版(Revision 3)との違い。

IVSes are subject to the usual rules for variation sequences: unregistered IVSes (which are not in the database) should not be used in text interchange, and registered IVSes should be used only to restrict the rendering of their unified ideograph to the glyphic subset associated with the IVS in the database. Furthermore, variation selectors are default ignorable. This implies that registrants must should ensure that the glyphic subset associated with an IVS is indeed a subset of the glyphs which are acceptable for the base character alone. Stated another way, the shapes in the glyphic subset of an IVS should be unifiable with the base character of that IVS. One possible way to determine this is to consider the unification rules for Han ideographs; see Unicode, section 12.1 Han, and ISO 10646, annex S.

  • 「must」から「should」への変更が、すべてを語っている気がする。以前のエントリで引用した「デフォルトの名無しさん」の指摘どおり、ということだろう*1

*1:件のエントリでわたしが「微妙」と書いた主な理由が、この「must」を含む文の存在。追加分の「Stated another way」で始まる文の「should」も、以前の改訂案では「must」だった。