This file documents tm, a MIME package for GNU Emacs.
GNU Emacs で MIME を楽しむための package である `tm' について説明しま す。
tm は GNU Emacs で MIME を楽しむための package です。tm を使うと、
個別の項目については以下を御参照下さい:
tm で使われている用語について解説します。
ここでは 0 から 127 の整数を指す。
0 から 127 の整数の列で表現できるような data を ``7bit の data'' と呼 ぶ。
また、0 から 31 および 127 で表現される制御文字と 32 で表現される空白
と 33 から 126 で表現される図形文字からなる文字列のことを ``7bit の文
字列'' と呼ぶ(これは
伝統的な Internet の
しかし、7bit であればどんな data でも良いとはいえない。なぜなら、1行
の長さがあまりに長いと、MTA はその message を転送することができないか
らである。ちなみに、
ここでは 0 から 255 の整数を指す。
0 から 255 の整数の列で表現できるような data を ``8bit の data'' と呼 ぶ。
また、0 から 31, 127 および 128 から 159 で表現される制御文字と 32 で
表現される空白と 33 から 126 と 160 から 255 で表現される図形文字から
なる文字列のことを ``8bit の文字列'' と呼ぶ(これは
伝統的な Internet の
しかし、最近では 8bit の文字列をそのまま通すことができる MTA も登場し てきたので、そのまま送ることができる場合も増えてきた。
しかし、8bit であればどんな data でも良いとはいえない。なぜなら、1行
の長さがあまりに長いと、MTA はその message を転送することができないか
らである。ちなみに、
また、こうした理由から、1行が 999 byte 以上の行が存在する可能性のある
data は
ちなみに、7bit で表現できる data は 8bit でも表現できる。よって、 ``8bit'' と言った場合、1行が 998 byte 以下の任意の data を指すことが ある。
33 から 126 の範囲の 1 byte からなる
図形文字集合。
32 から 127 の範囲の 1 byte からなる 図形文字集合。ISO 8859 シリーズはその一種。
33 から 126 の範囲の 2 byte からなる
図形文字集合。
アメリカ連邦で使われる文字を符号化した 94
文字集合。A-Z, a-z の Latin 文字と数字、幾つかの記号からなる。
『64 進数』という意味で、3 byte の data を 0 から 63 の数を表す
この 65 種類の文字は ASCII と EBCDIC の共通部分から選ばれており、
Internet 以外の network を経由する場合でも安全に転送できるように設計さ
れている。
任意の byte 列を
また、行の構造があっても、999 byte 以上からなる行がある場合も binary
と呼ぶことにする。
ちなみに、
中国大陸でられている簡体字で表記される中国語を表現するための
台湾や香港で用いられている主に繁体字で表記される中国語を表現するための
cf.
台湾や香港で用いられている主に繁体字で表記される中国語を表現するための
図形文字集合。台湾の標準。現在、94×94 の面が第1面から第7面まである。
文字と byte 列と1対1に対応付ける曖昧でない規則の集合。
与えられた図形文字集合に含まれてい
ない文字の符号化のために用いる手法。
Content の表示の仕方や file 名を表現するための field.
歴史的には RFC 1049 で Content-Type field が提案されている。但し、ここ
では type と subtype の区別はない。しかし、文法的には MIME parser は
RFC 1049 に基づく message を未知の content-type を持った message とし
て parse できるだろう。
Content-Type field は
例えば、
content-type のない part は
ここでは `Emacs' で FSF が配布している GNU Emacs を指し、`emacs' で
GNU Emacs の変種の総称とする。
header における非
Internet mail を他の記事にまるごと入れる方法。
例えば、記事を転送したりするのに用いる。
韓国語を表現するための
RFC 1557 で定義されている。
cf.
Internet で file を転送するための protocol の1つ。RFC 959 で定義され
ている。
中国大陸で用いられている簡体字で表記される中国語を表すための 94×94 文字集合。中国の国家標準。
これは GB における基本集である。
中国語のための補助図形文字集合。中
国の国家標準。
図形文字からなる 符号化文字集合。
中国大陸で用いられている簡体字で表記される中国語を表現するための
RFC 1842, 1843 で定義されている。
符号化文字集合の構造と符号拡張法を定めた
国際標準。
これを用いて複数の図形文字集合を組
合せて 7bit ないし
中国語を表現するための
中国語を表現するための
Emacs/mule では利用可能である。
日本語を表現するための
古い
RFC 1468 で定義されている。
iso-2022-jp を拡張した
RFC 1554 で定義されている。
韓国語を表現するための
各国で共通に使える最小限度の図形文字集
合を定めたもの。94 文字集合の1つ。
ISO 646 IRV(国際基準版)を元に幾つかの文字は各国で違う文字を割当るこ
とを許していて、幾つかの変種が存在する。
西欧諸語で用いられる拡張 Latin 文字や記号からなる 96 文字集合。
西欧諸語などを表現するための
東欧諸語で用いられる拡張 Latin 文字や記号からなる 96 文字集合。
東欧諸語を表現するための
キリル文字や記号からなる 96 文字集合。
キリル文字を表現するための
ギリシア文字や記号からなる 96 文字集合。
ギリシア語を表現するための
RFC 1947 で定義されている。
CCITT が登録した、中国大陸で用いられている簡体字で表記される中国語を表
現するための94×94 文字集合。
元は
日本語を表すために作られた94×94 文字集
合。日本の国家標準。JIS X0208-1978 ともいう。
日本語を表すために作られた94×94 文字集
合。日本の国家標準。1978 年版、1983 年版、1990 年版があるが、
Internet では 1983 年版がもっとも良く使われている。
JIS X0208 は記号、数字、ローマ字、ひらがな、カタカナ、ギリシャ文字、キ
リル文字、罫線素、第1水準、第2水準の漢字が含まれる。但し、1983 年版
の一部の記号と罫線素は 1978 年版にはない。また、一部の漢字の字形が
1983 年版では変更され、また、第1水準と第2水準が入れ替わっていたりす
る。このため、1978 年版と 1983 年版は異なる文字集合として扱われる。
1990 年の改定では 1983 年版に対する追加が行われた。このため、1990 年版
を指示する場合は前に更新シーケンス (ESC 02/06 4/0) を用いる。
また、1997 年に改定版が出版される予定。(字形の変更は行われないので文
字集合としては 1990 年版と同一である)
ロシヤ語等で用いられるキリル文字を表現するための
RFC 1489 で定義されている。
韓国語を表すための 94×94 文字集合。
韓国の国家標準。
type は標準では
ここでは、text/plain などの type/subtype の組をしばしば
media type は、RFC 2046 で定義されているものに加えて、登録することもで
きる。現在、登録されているものは MEDIA
TYPES で参照できる。
また、type もしくは subtype に、前に `x-' を付けた
ここでは
伝統的な
tm で特定の種類の data を再生したとき実際にその処理を行なう program.
Emacs Lisp で書かれた
RFC 2045 は冒頭で次のように述べている:
STD 11, RFC 822 は、US-ASCII message header に関して非常に詳細に規定し
た message 表現 protocol を定義している。しかし、それは単に flat な
US-ASCII text のみに留まり、message の内容や message body に関する規定
はなされていない。Multipurpose Internet Mail Extensions, あるいは MIME
と総称される、この一連の文書は、以下の事を可能とするために message の
形式を再定義した:
半田 剣一氏らが作った、多言語された GNU
現在、MULE の機能を Emacs に merge する作業が行われており、alpha 版
が存在する。
その他、XEmacs に merge したものも存在する。
このため、現在では多言語 Emacs は、元々の MULE を含めて3種類あること
になる。
そこで、ここでは、多言語 Emacs の総称を
1つの
現在、定義されている
これは伝統的な
RFC 1847 で定義された
RFC 1847 で定義された
Phil Zimmermann 氏が作成した公開鍵暗号処理系の1つ。
伝統的な PGP では
山本 和彦 氏が提案した
PGP-kazu は
application/pgp の part では PGP の
PGP-kazu では MUA は PGP のと MIME のという2つの encapsulation を知ら
なければならない。また、application/pgp part を parse するためには、ま
ず、pgp の処理を行わなければならないので、parse 処理が複雑になる。
また、Internet では今後
Michael Elkins 氏が提案した
RFC 1847 に基き、MIME の multipart に
よる
PGP/MIME では
Internet では今後
`=' や制御文字や 128 以上の文字などは `=AF' のように `=' の後に続く 16
進数で表現する。このため、
しかしながら、EBCDIC には存在しない文字を利用する場合、EBCDIC を利用し
ている network では安全に転送することができず、Base64 に比べて安全性は
低い。
Base64
binary
cn-gb, gb2312
cn-big5, big5
CNS 11643-1992
Coded character set(符号化文字集合), Character code(文字符号)
Code extension(符号拡張)
Content-Disposition field
Content-Type field
``Content-Type'' ``:''
Emacs
encoded-word
encapsulation
euc-kr
FTP
GB 2312-1980
GB 8565.2-1988
Graphic character set(図形文字集合)
hz-gb2312
ISO 2022
iso-2022-cn
iso-2022-cn-ext
iso-2022-jp
iso-2022-jp-2
iso-2022-kr
ISO 646
ISO 8859-1
iso-8859-1
ISO 8859-2
iso-8859-2
ISO 8859-3
ISO 8859-4
ISO 8859-5
iso-8859-5
ISO 8859-6
ISO 8859-7
iso-8859-7
ISO 8859-8
ISO 8859-9
ISO-IR-165, CCITT Extended GB
JIS X0201
JIS C6226-1978
JIS X0208
JIS X0212-1990
koi8-r
KS C5601-1987
media type
message
message/rfc822
method
MIME
MIME charset
MTA
MUA
MULE
Multipart
multipart/alternative
multipart/digest
multipart/encrypted
multipart/mixed
multipart/parallel
multipart/signed
PGP
PGP-kazu
PGP/MIME
Quoted-Printable
RFC 821
RFC 822