[ CHISE Top ]
XEmacs UTF-2000
[m17n.org]
[
京都大学 人文科学研究所 附属 漢字情報研究センター
]
現在の最新版は
XEmacs UTF-2000 0.19 (郡山)
です。
XEmacs UTF-2000 について
XEmacs UTF-2000 は、文字を文字属性の集合で表現することにより
文字符号に依存せずに文字を処理することを目指した「UTF-2000
モデル」の XEmacs に基づく実装です。
XEmacs UTF-2000 は「
UTF-2000 プロジェクト
」において開発していましたが、
「UTF-2000 プロジェクト」が実質的に「
CHISE Project
」に受け継がれて以来、XEmacs UTF-2000 の開発は
CHISE Project の一部となっています。
XEmacs UTF-2000 Archives
How to install XEmacs UTF-2000
Mailing List
XEmacs UTF-2000 に関する議論等は UTF-2000 mailing list で行っています。
XEmacs UTF-2000 の開発に参加したい方、XEmacs UTF-2000
使ってみたい方、XEmacs UTF-2000 についての質問・要望、その他
XEmacs UTF-2000 に関する議論に参加したい方をお待ちしています。
UTF-2000 mailing list に参加希望の方は
utf-2000-ctl@m17n.org
宛に
subscribe あなたの名前
の一行を書いた mail をお送りください。
その後、確認の mail を届きますので、その mail の中にある
confirm PASSWORD あなたの名前
の1行を本文にして返事を送ってください。
XEmacs UTF-2000
XEmacs UTF-2000 0.19 (郡山) における変更点
- 文字属性を
外部文字データベースから要求時に遅延読み込みする機能を実装した。
現在の実装は XEmacs の `database' 機能に基づいており、Berkeley
DB Version 3 での動作を確認している。これにより IA32
アーキテクチャで実行形式の大きさが従来約 30
MB (文字定義数約7万字) だったのが約 16 MB (文字定義数約10万字)
となる
- これに伴い
- 関数 mount-char-attribute-table
- 関数 save-char-attribute-table
- 関数 load-char-attribute-table
- 関数 reset-char-attribute-table
- 関数 close-char-attribute-table
を追加した。
- coded-charset `chinese-big5-eten', `chinese-big5-cdp',
`chinese-big5-pua', `chinese-big5-eten-a', `chinese-big5-eten-b' を
追加した
- coded-charset `japanese-jisx0213-1' で `japanese-jisx0208-1990' を継
承するようにした
- 次の UTF-8 系 coding-system を追加した:
- utf-8-mcs
- 独自の写像を採用し、Unicode に含まれない文字を Unicode
外の UCS 外字領域に割り当てる(従来の utf-8 と同等)
- utf-8-mcs-er
- 独自の写像を採用し、Unicode
に含まれない文字を実体参照形式で表現する
- utf-8-gb
- GB に基づく mapping を採用し、Unicode に含まれない文字を
Unicode 外の UCS 外字領域に割り当てる
- utf-8-gb-er
- GB に基づく mapping を採用し、Unicode
に含まれない文字を実体参照形式で表現する
- utf-8-cns
- CNS に基づく mapping を採用し、Unicode
に含まれない文字を Unicode 外の UCS 外字領域に割り当てる
- utf-8-cns-er
- CNS に基づく mapping を採用し、Unicode
に含まれない文字を実体参照形式で表現する
- utf-8-big5
- Big5 に基づく mapping を採用し、Unicode
に含まれない文字を Unicode 外の UCS 外字領域に割り当てる
- utf-8-big5-er
- Big5 に基づく mapping を採用し、Unicode
に含まれない文字を実体参照形式で表現する
- utf-8-jis
- JIS に基づく mapping を採用し、Unicode
に含まれない文字を Unicode 外の UCS 外字領域に割り当てる
- utf-8-jis-er
- JIS に基づく mapping を採用し、Unicode
に含まれない文字を実体参照形式で表現する
- utf-8-ks
- KS に基づく mapping を採用し、Unicode に含まれない文字を
Unicode 外の UCS 外字領域に割り当てる
- utf-8-ks-er
- KS に基づく mapping を採用し、Unicode
に含まれない文字を実体参照形式で表現する
また、utf-8 を alias とし、既定値では utf-8-mcs を指すものとした
(将来的には language-environment に応じて既定値を変えることを考慮
している)
また、aliast `utf-8-er' を新設し、既定値では utf-8-mcs-er を指す。
- 次の Big5 系 coding-system を追加した:
- big5-er
- Big5 にない文字を実体参照形式で表現する
- big5-eten
- Big5-ETEN
- big5-eten-er
- Big5-ETEN にない文字を実体参照形式で表現する
また、big5 は ETEN 拡張を含まないものであることを明確化した。
- 実体参照形式の表現や優先度を指定する変数
coded-charset-entity-reference-alist を追加
- 文字属性データベースの追加・修正など
Sample Images
Resource
参考文献
Links
[戻る]
Last modified: Sat Nov 23 23:09:13 JST 2002
閲覧者数: 2002年7月15日以降、のべ
人