文字定義の更新(文字定義数 68549)
@@ -476,8 +550,246 @@ Last modified: Fri Jun 7 14:19:52 JST 2002
display engine 中の従来型 Mule に依存した code をこれで書き換えた。
これにより、文字 → coded-charset と code-point の対への分解処理が何
度も行われるのを避けた。
+ 2001-01
+ |
+ | 通商産業省 工業技術院 が 独立行政法人
+ 産業技術総合研究所に改組する
+ |
---|
2001-03
+ | 第5回 多言語情報処理シンポジウム (m17n2001: the Fifth
+ International Symposium on Multilingual Information
+ Processing and Open Source Software)
+ が開催される。守岡、CHISE Project 構想を発表
+ |
---|
2001-03
+ |
+ | 独立行政法人 産業技術総合研究所
+ 電子技術総合研究所、
+ 産業技術総合研究所
+ 中の1組織として再編され、110 年の歴史に幕をおろす
+ (多分、この時、Mule lab がなくなったはず)
+ |
---|
2001-11-21
+ | 守岡 知彦と Christian Wittern,
+
+ 未踏シンポジウムat京都 で CHISE Project に関して発表する
+ |
---|
2002-01-01
+ | XEmacs 21.2.44 (Thalia) UTF-2000 Version 0.18 (大和小泉) を release
+ |
+
+ - 文字属性関連機能と char-table 関連機能の実装を統合した
+
- ISO/IEC 10646-2:2001 の SMP (0群1面) および SIP (0群2面)
+ のサポート開始
+
- GT サポートの開始
+
-
+ CHINA3
+ 外字サポートの開始
+
- CBETA 外字サポートの開始
+
- 台湾 中央研究院の
+ CDP 外字および「漢字庫」サポートの開始
+
- ucs-cns, ucs-jis, ucs-cns を新設した
+
- `ideograph-daikanwa' が大漢和修訂第2版を表すことを明確化し、
+ それとは別に大漢和修訂版を表す `ideograph-daikanwa-2' を新設した
+
- 権利関係の問題から文字鏡関連機能を分離した
+
- 漢字の部品の結合構造に関するデータ形式を定義し、データを追加し始めた
+
- その他文字データベースの追加・修正・変更
+
- 既に定義された coded-charset を継承した coded-charset
+ を定義できるようにした。このため、関数 make-charset の property
+ として
+
+ - 'mother
+
- 親 coded-charset を指定する
+
- 'code-min
+
- 親 coded-charset での code-point の下限を指定する
+
- 'code-max
+
- 親 coded-charset での code-point の上限を指定する
+
- 'code-offset
+
- 親 coded-charset での code-point に対する offset を示す
+
- 'conversion
+
- 親 coded-charset での code-point に対する変換を指定する
+
+ を追加した
+ - 関数 encode-char を追加した
+
- Big5 系 coding-system で使用する coded-charset
+ を指定できるようにした(関数 make-charset の第3引数の
+ property 'charset-g1 で Big5 系 coded-charset を指定する)
-
+ |
---|
2002-02-15
+ | 守岡 知彦と Christian Wittern,
+ 未踏シンポジウム臨海 で CHISE Project に関して発表する
+ |
---|
2002-05-29
+ | 守岡 知彦と Christian Wittern,
+ LinuxWorld Expo/Tokyo 2002 の .org Pavilion の IPA のブース
+
+ で CHISE Project に関して発表
+ |
---|
2002-06-28 〜 29
+ | 守岡 知彦と Christian Wittern,
+
+ ITX2002 Summer 「スーパークリエイタの世界」
+ に出展
+ |
---|
2002-08-21
+ | XEmacs 21.2.46 (Urania) UTF-2000 Version 0.19 (郡山) を
+ release
+ |
+
+ - 文字属性を
+ 外部文字データベースから要求時に遅延読み込みする機能を実装した。
+ 現在の実装は XEmacs の `database' 機能に基づいており、Berkeley
+ DB Version 3 での動作を確認している。これにより IA32
+ アーキテクチャで実行形式の大きさが従来約 30
+ MB (文字定義数約7万字) だったのが約 16 MB (文字定義数約10万字)
+ となる
+
- これに伴い
+
+ - 関数 mount-char-attribute-table
+
- 関数 save-char-attribute-table
+
- 関数 load-char-attribute-table
+
- 関数 reset-char-attribute-table
+
- 関数 close-char-attribute-table
+
+ を追加した。
+ - coded-charset `chinese-big5-eten', `chinese-big5-cdp',
+ `chinese-big5-pua', `chinese-big5-eten-a', `chinese-big5-eten-b' を
+ 追加した
+
- coded-charset `japanese-jisx0213-1' で `japanese-jisx0208-1990' を継
+ 承するようにした
+
- 次の UTF-8 系 coding-system を追加した:
+
+ - utf-8-mcs
+
- 独自の写像を採用し、Unicode に含まれない文字を Unicode
+ 外の UCS 外字領域に割り当てる(従来の utf-8 と同等)
+
- utf-8-mcs-er
+
- 独自の写像を採用し、Unicode
+ に含まれない文字を実体参照形式で表現する
+
- utf-8-gb
+
- GB に基づく mapping を採用し、Unicode に含まれない文字を
+ Unicode 外の UCS 外字領域に割り当てる
+
- utf-8-gb-er
+
- GB に基づく mapping を採用し、Unicode
+ に含まれない文字を実体参照形式で表現する
+
- utf-8-cns
+
- CNS に基づく mapping を採用し、Unicode
+ に含まれない文字を Unicode 外の UCS 外字領域に割り当てる
+
- utf-8-cns-er
+
- CNS に基づく mapping を採用し、Unicode
+ に含まれない文字を実体参照形式で表現する
+
- utf-8-big5
+
- Big5 に基づく mapping を採用し、Unicode
+ に含まれない文字を Unicode 外の UCS 外字領域に割り当てる
+
- utf-8-big5-er
+
- Big5 に基づく mapping を採用し、Unicode
+ に含まれない文字を実体参照形式で表現する
+
- utf-8-jis
+
- JIS に基づく mapping を採用し、Unicode
+ に含まれない文字を Unicode 外の UCS 外字領域に割り当てる
+
- utf-8-jis-er
+
- JIS に基づく mapping を採用し、Unicode
+ に含まれない文字を実体参照形式で表現する
+
- utf-8-ks
+
- KS に基づく mapping を採用し、Unicode に含まれない文字を
+ Unicode 外の UCS 外字領域に割り当てる
+
- utf-8-ks-er
+
- KS に基づく mapping を採用し、Unicode
+ に含まれない文字を実体参照形式で表現する
+
+
+ また、utf-8 を alias とし、既定値では utf-8-mcs を指すものとした
+ (将来的には language-environment に応じて既定値を変えることを考慮
+ している)
+
+ また、aliast `utf-8-er' を新設し、既定値では utf-8-mcs-er を指す。
+ - 次の Big5 系 coding-system を追加した:
+
+ - big5-er
+
- Big5 にない文字を実体参照形式で表現する
+
- big5-eten
+
- Big5-ETEN
+
- big5-eten-er
+
- Big5-ETEN にない文字を実体参照形式で表現する
+
+
+ また、big5 は ETEN 拡張を含まないものであることを明確化した。
+ - 実体参照形式の表現や優先度を指定する変数
+ coded-charset-entity-reference-alist を追加
+
- 文字属性データベースの追加・修正など
+
+ |
---|
2002-09-19
+ | 守岡知彦、
+ Linux Conference 2002
+ で発表
+ |
---|
2002-09-20
+ | 守岡知彦と
+
+ Christian Wittern, 大阪市立大学で開催された
+ PNC Annual Conference and Joint Meetings 2002
+ で発表
+ |
---|
2002-12-06
+ | 上地 宏一、京都大学
+ 人文科学研究所の研究班『漢字情報基礎論研究会』で
+ 「漢字フォント自動生成サーバ“影 KAGE”」システムに関して講演
+
+ 師 茂樹、
+ 大阪外国語大学
+ 『多言語同時処理』プロジェクト(第1回研究会)で
+ 『「ユニコードとは何か」から「Unicode4.0」まで』
+ と
+ 『CHISEプロジェクトが提案する新しい文字のモデル』
+ という題目で講演
+ |
---|
2002-12-07
+ |
+ 漢字文献情報処理研究会第5回大会で、
+ CHISEプロジェクトの特別セッションが行われた
+ |
---|
2002-12-26
+ | XEmacs 21.4.10 (Military Intelligence) UTF-2000 Version 0.20 (奈良)
+ を release
+ |
+
+ - case 関連機能を文字属性データベース機能に基づいて再実装し、
+ 情報を統合した
+
- UTF-16 系 coding-system を定義できるようにした
+
- JIS X 0208 の共通部分を表す coded-charset ‘=jis-x0208’
+ を導入し、 ‘japanese-jisx0208-1978’,
+ ‘japanese-jisx0208’ および ‘japanese-jisx0208-1990’
+ はこれを継承するようにした
+
- coded-charset ‘ucs-gb’ および文字属性 ‘=>ucs-gb’
+ を追加し、 coding-system ‘utf-8-gb’ および
+ ‘utf-8-gb-er’ でこれらを用いるようにした
+
- 文字属性 ‘->ucs’ を廃止した
+
- portable dumper に対応した
+
- 関数 encode-char に optional 引数 ‘defined-only’ を追加した
+
- 関数 reset-charset-mapping-table を追加した
+
- 関数 char-ref= および関数 char-spec= に optional 引数
+ ‘tester’ を追加した
+
- 対話的関数 reset-charset-mapping-table を廃止した
+
- GT 2000 漢字構成要素を表す coded-charset ‘ideograph-gt-k’
+ および、これのフォント用 coded-charset ‘ideograph-gt-pj-k1’
+ および ‘ideograph-gt-pj-k2’ を追加した
+
- JIS X 0213 用、KS X 1001 用および GT 2000
+ 漢字構成要素用の実体参照用設定を追加した
+
- 文字属性データベースの追加・修正など
+
+ |
---|
2003-11-04
+ | XEmacs CHISE Version 0.21 (平城山)
+ を release
+ |
+
+ - libchise のサポート
+
- 幾つかの CCS を C ではなく lisp で定義するようにした
+
- CCS 名の命名規則の変更
+
- word-combining-categories の廃止および
+ word-separating-categories の修正
+
- UTF-8 などの coding-system での decode 時の文字結合処理の bug を
+ 修正
+ (Mac OS X において、file-name-coding-system を utf-8-jis
+ 等に設定することで 「ヒラギノ」といった
+ 文字結合を必要とするファイル名を正しく扱うことができるようになった)
+
- 文字素性データベースの追加・修正など
+
|
---|