1999-11-11
| XEmacs 21.2.19 UTF-2000 Version 0.11 (志紀) における変更点
|
- 文字属性として coded-charset の名前を用いた場合、常に coded-charset
に正規化するようにした
[TODO] coded-charset は別空間に置く
- 関数 put-char-attribute で coded-charset
もしくはその名前に値を設定した時、その coded-charset
の変換表にも反映するようにした
- 関数 define-char を新設した
- define-char 形式の文字定義 file: utf-2000/u00000-C0.el,
utf-2000/u00020-Basic-Latin.el, utf-2000/u00080-C1.el,
utf-2000/u000A0-Latin-1-Supplement.el,
utf-2000/u00180-Latin-Extended-B.el,
utf-2000/u00100-Latin-Extended-A.el,
utf-2000/u00250-IPA-Extensions.el,
utf-2000/u002B0-Spacing-Modifier-Letters.el,
utf-2000/u00300-Combining-Diacritical-Marks.el,
utf-2000/u00370-Greek.el を追加した
[邪悪系] ラテン・ギリシア文字系で fullwidth/halfwidth
を区別した設定にした(簡単な program で unify
することもできます)。これに伴い大量の『代替名称』を導入した
(^_^;;;。
これらは私的領域の文字 ID を与えられる
- utf-2000/ccs-iso8859-2.el, utf-2000/ccs-iso8859-3.el,
utf-2000/ccs-iso8859-4.el, utf-2000/ccs-iso8859-9.el を削除した
- Mule-IPA に関してn高橋さんの定義を用いるようにした(UCS
に含まれない部分に関する文字定義 file はまだ作成していない)
- SPLIT_CHAR での cell の発生を抑制した(つもり)
(文字定義を持たない文字に関しては依然として cell
ができる
(文字定義を与えた方が効率が良くなれば文字定義を行うだろう
という教育的効果があるかも(^_^;;;))
1999-11-15
| XEmacs 21.2.19 UTF-2000 Version 0.12 (柏原) における変更点
|
- 文字定義が存在しない文字の encode に関する問題を修正した
- 文字結合に関する表 Vcharacter_composition_table を追加した
(文字属性 `->decomposition' の逆を記述する。文字属性
`->decomposition' の値から作成する)。
また、これに伴い、関数 get-composite-char (LIST) を追加した。
LIST に対応する結合文字が存在すればその文字を返す関数である。
LIST の要素は、文字、UCS-4 の文字符号、``symbolic
character''(後述)の名前 (symbol) である
- これに伴い "symbolic character" を導入する。これは symbol
で表現され、通常の符号表現を持たない『文字のようなもの』で、
主に結合文字を表現するために用いる。例えば `circle'
を使って `(circle ?1)' で丸の中に1が入った文字を表現できる。
現在の実装では内部的には負の文字番号を持つ(UCS-4
の範囲外の値になる)
[TODO] 任意の "symbolic character" を定義・利用できるようにする
(SGML/XML の実体参照のように利用できると良いかも)
- 異体字に関する表 Vcharacter_variant_table
を追加した。またこれを参照するための関数 char-variants
(CHARACTER) を追加した。これは文字の異体字の list を返す
- coded-charset `ethiopic-ucs' を新設した。これにより、CCL
を使わずにエチオピア(ゲーズ)文字が表示できるようになった
- coded-charset `lao' を新設した。intlfonts-1.2 等にある Mule-Lao
font を入れていれば UCS
のラオ文字を表示できる
(しかし、文字結合ができる訳ではないので
ラオ語が扱えるようになった訳ではない)
- put-char-attribute/define-char で GR
表現の符号化文字集合の符号位置を受理するようにした(内部的には
GL 表現に正規化される)
- M-x what-char-definition [CR]
で現在位置の文字定義を表示できるようにした。この他文字定義 file
の開発用 utility を含んだ utf-2000/char-db-util.el を追加した
(あんまりちゃんとしてませんが)
[TODO] ucs-conv の what-character を置き換える
- 文字定義 file utf-2000/u00400-Cyrillic.el,
utf-2000/u00530-Armenian.el, utf-2000/u00590-Hebrew.el,
utf-2000/u00600-Arabic.el, utf-2000/u00700-Syriac.el,
utf-2000/u00780-Thaana.el, utf-2000/u00900-Devanagari.el,
utf-2000/u00980-Bengali.el, utf-2000/u00A00-Gurmukhi.el,
utf-2000/u00A80-Gujarati.el, utf-2000/u00B00-Oriya.el,
utf-2000/u00B80-Tamil.el, utf-2000/u00C00-Telugu.el,
utf-2000/u00C80-Kannada.el, utf-2000/u00D00-Malayalam.el,
utf-2000/u00D80-Sinhala.el, utf-2000/u00E00-Thai.el,
utf-2000/u00E80-Lao.el, utf-2000/u00F00-Tibetan.el,
utf-2000/u01000-Myanmar.el, utf-2000/u010A0-Georgian.el,
utf-2000/u01100-Hangul-Jamo.el, utf-2000/u01200-Ethiopic.el,
utf-2000/u013A0-Cherokee.el, utf-2000/u01400-Canadian.el,
utf-2000/u01680-Ogham.el, utf-2000/u016A0-Runic.el,
utf-2000/u01780-Khmer.el, utf-2000/u01800-Mongolian.el,
utf-2000/u01E00-Latin-Extended-Additional.el,
utf-2000/u01F00-Greek-Extended.el,
utf-2000/u02000-General-Punctuation.el,
utf-2000/u02070-Superscripts.el, utf-2000/u02080-Subscripts.el,
utf-2000/u020A0-Currency-Symbols.el,
utf-2000/u020D0-Combining-Diacritical-Marks-for-Symbols.el
utf-2000/u02100-Letterlike-Symbols.el,
utf-2000/u02150-Number-Forms.el, utf-2000/u02190-Arrows.el,
utf-2000/u02200-Mathematical-Operators.el,
utf-2000/u02300-Miscellaneous-Technical.el,
utf-2000/u02400-Control-Pictures.el, utf-2000/u02440-OCR.el,
utf-2000/u02460-Enclosed-Alphanumerics.el,
utf-2000/u02500-Box-Drawing.el, utf-2000/u02580-Block-Elements.el,
utf-2000/u025A0-Geometric-Shapes.el,
utf-2000/u02600-Miscellaneous-Symbols.el,
utf-2000/u02700-Dingbats.el, utf-2000/u02800-Braille-Patterns.el,
utf-2000/u02E00-CJK-Radical-Supplement.el,
utf-2000/u02F00-Kangxi-Radicals.el,
utf-2000/u02FF0-Ideographic-Description-Characters.el,
utf-2000/u03000-CJK-Symbols-and-Punctuation.el,
utf-2000/u03040-Hiragana.el, utf-2000/u030A0-Katakana.el,
utf-2000/u03100-Bopomofo.el,
utf-2000/u03130-Hangul-Compatibility-Jamo.el,
utf-2000/u03190-Kanbun.el, utf-2000/u031A0-Extended-Bopomofo.el,
utf-2000/u03200-Enclosed-CJK-Letters-and-Months.el,
utf-2000/u03300-CJK-Compatibility.el を追加した
- coded-charset `latin-viscii' の情報を
utf-2000/u00020-Basic-Latin.el,
utf-2000/u000A0-Latin-1-Supplement.el,
utf-2000/u00100-Latin-Extended-A.el,
utf-2000/u00180-Latin-Extended-B.el に merge した。これに伴い、
utf-2000/ccs-viscii.el を廃止した
- bytecomp.el で file に非 Latin-1 文字が存在する時、comment
中の非 Latin-1 文字を無視して coding-system を反対するようにした
(comment を削除するという大技を使っているので心配;
きっともっと良い方法があるに違いない(とマーチンも書いていた
(^_^;))。
また、raw-text で符号化する時、`byte-compile-dynamic'
と `byte-compile-dynamic-docstrings'
を利用できるようにした(つもり)
;; 本当にうまくいっているのか自信無し(^_^;;;
2000-01-20
| XEmacs 21.2.27 UTF-2000 Version 0.13 (高井田)
|
- 諸橋大漢和辞典収録文字 (ideograph-daikanwa) を追加した
- e-漢字 大漢和 をとりあえず使えるようにした
- 自己言及問題を回避すべく、mule/mule-conf.el を新設した
- utf-2000/ccs-jisx0201-latin.el
を削除した(変換表形式の coded-charset 定義を完全撤廃した)
- 文字定義 file utf-2000/Ideograph-R001-One.el 〜
utf-2000/Ideograph-R214-Flute.el および
utf-2000/u0A000-Yi-Syllables.el,
utf-2000/u0AC00-Hangul-Syllables.el,
utf-2000/u0FB00-Alphabetic-Presentation-Forms.el,
utf-2000/u0FB50-Arabic-Presentation-Forms-A.el,
utf-2000/u0FE20-Combining-Half-Marks.el,
utf-2000/u0FE30-CJK-Compatibility-Forms.el,
utf-2000/u0FE50-Small-Form-Variants.el,
utf-2000/u0FE70-Arabic-Presentation-Forms-B.el,
utf-2000/u0FF00-Halfwidth-and-Fullwidth-Forms.el,
utf-2000/u0FFF0-Specials.el を追加した
- string-to-number が 16 進数をちゃんと変換できない bug の修正
- coded-charset `hiragana-jisx0208', `katakana-jisx0208' の廃止
- coded-charset `japanese-jisx0208-1990' の新設
- 今昔文字鏡フォント用 coded-charset
の新設(但し、実際に利用するための設定はまだ行っていない)
- coded-charset `katakana-jisx0201' の builtin-support の廃止
- UCS-4 私用領域における XEmacs-UCS 互換領域の builtin-support
の廃止
- japanese-jisx0213-1, japanese-jisx0213-2
の新設(上述の漢字定義にはこれらの定義も入っているので
(フォントが利用可能な)他の coded-charset
に収録された文字は、新 JIS の font が無くても表示可能)
- XEmacs 21.2.27 に sync up した(つもり)
|
---|
2000-02-01
| XEmacs 21.2.27 UTF-2000 Version 0.14 (河内堅上)
|
- 文字定義における coded-charset の code-point
の表現を変更し、記憶容量を少し節約した
- 今昔文字鏡用の font 用の定義を dump
した (これにより、上記の削減分を食い潰した(^_^;;;)
- やっぱり builtin-character などの解釈時に一時 cell
が発生しないようにした
- 内部的な coded-charset の code-point の上限を 4 byte
かつ表現可能な整数の上限に制限した
- 3, 4 byte の coded-charset を定義可能にした
- UCS-4 を表現する coded-charset `ucs' を追加した
- 組込み関数 decode-char を追加した
- what-char-definition 等での文字定義表示における code-point
の表示法を変更した
|
---|
|
---|
|
---|