|
|
|
|
|
計算機は文字そのものは扱えない |
|
文字に対応する番号を割り当てる |
|
この割り当て規則を「文字符号」と呼ぶ |
|
文字そのものは送信できない |
|
送信者と受信者で同じ規則を共有する |
|
『文字化け』との戦い |
|
そもそも文字って何? |
|
|
|
|
|
|
とにかく文字を計算機で扱えるようになった |
|
いろんな処理の基盤を提供した |
|
作成、加工、転送等が比較的容易 |
|
情報化社会の基盤技術 |
|
|
|
|
|
他の文字圏に対する優位性 |
|
文字化けしにくい |
|
十分な表現力 |
|
処理の容易な文字表現 |
|
技術の蓄積 |
|
さまざまな情報の電子化に成功 |
|
|
|
|
|
|
各符号位置の意味の定義を文字符号が引き受ける |
|
文字符号の作成、変更、普及のためのコストが甚大 |
|
文字符号にない文字や適合しない文字を扱うのが困難 |
|
|
|
|
|
|
|
|
章 |
|
節 |
|
文 |
|
句 |
|
語 |
|
字 |
|
字、行、段、頁など見かけ上の単位も |
|
|
|
|
漢字における部首や旁(意符、音符)など |
|
ハングルにおける字母と音節 |
|
タイ文字やラオ文字等における音節(子音)字と母音字の結合 |
|
インド系諸文字における複雑な結合 |
|
ラテン文字におけるアクセント記号の付加 |
|
etc… |
|
|
|
|
|
文字の属性(意味)を扱うための技術 |
|
従来の符号化文字も利用可能 |
|
(符号化)文字以外の情報と符号化文字の格差を減らす |
|
|
|
|
|
|
|
XEmacs を基に実装 |
|
文字属性の集合で表現される文字オブジェクトで文字を表現する |
|
約7万字分の文字定義データベースを内蔵(再定義可能) |
|
|
|
|
|
効率化のためのモデル・実装の開発 |
|
データベース・サーバーの利用 |
|
データベースの分散化 |
|
文字定義の交換用表現の開発 |
|
文字画像等の表現法 |
|
インターネット等での実証実験 |
|