e40194a68cac40dc09e2005ab37a2035d38210dd
[elisp/gnus.git-] / texi / emacs-mime.texi
1 \input texinfo                  @c -*-texinfo-*-
2
3 @setfilename emacs-mime
4 @settitle Emacs MIME Manual
5 @synindex fn cp
6 @synindex vr cp
7 @synindex pg cp
8 @c @direntry
9 @c * Emacs MIME: (emacs-mime).   The MIME de/composition library.
10 @c @end direntry
11 @iftex
12 @finalout
13 @end iftex
14 @setchapternewpage odd
15
16 @ifinfo
17
18 This file documents the Emacs MIME interface functionality.
19
20 Copyright (C) 1998,99 Free Software Foundation, Inc.
21
22 Permission is granted to make and distribute verbatim copies of
23 this manual provided the copyright notice and this permission notice
24 are preserved on all copies.
25
26 @ignore
27 Permission is granted to process this file through Tex and print the
28 results, provided the printed document carries copying permission
29 notice identical to this one except for the removal of this paragraph
30 (this paragraph not being relevant to the printed manual).
31
32 @end ignore
33 Permission is granted to copy and distribute modified versions of this
34 manual under the conditions for verbatim copying, provided also that the
35 entire resulting derived work is distributed under the terms of a
36 permission notice identical to this one.
37
38 Permission is granted to copy and distribute translations of this manual
39 into another language, under the above conditions for modified versions.
40 @end ifinfo
41
42 @tex
43
44 @titlepage
45 @title Emacs MIME Manual
46
47 @author by Lars Magne Ingebrigtsen
48 @page
49
50 @vskip 0pt plus 1filll
51 Copyright @copyright{} 1998,99 Free Software Foundation, Inc.
52
53 Permission is granted to make and distribute verbatim copies of
54 this manual provided the copyright notice and this permission notice
55 are preserved on all copies.
56
57 Permission is granted to copy and distribute modified versions of this
58 manual under the conditions for verbatim copying, provided that the
59 entire resulting derived work is distributed under the terms of a
60 permission notice identical to this one.
61
62 Permission is granted to copy and distribute translations of this manual
63 into another language, under the above conditions for modified versions.
64
65 @end titlepage
66 @page
67
68 @end tex
69
70 @node Top
71 @top Emacs MIME
72
73 This manual documents the libraries used to compose and display
74 @sc{mime} messages.
75
76 This is not a manual meant for users; it's a manual directed at people
77 who want to write functions and commands that manipulate @sc{mime}
78 elements.
79
80 @sc{mime} is short for @dfn{Multipurpose Internet Mail Extensions}.
81 This standard is documented in a number of RFCs; mainly RFC2045 (Format
82 of Internet Message Bodies), RFC2046 (Media Types), RFC2047 (Message
83 Header Extensions for Non-ASCII Text), RFC2048 (Registration
84 Procedures), RFC2049 (Conformance Criteria and Examples).  It is highly
85 recommended that anyone who intends writing @sc{mime}-compliant software
86 read at least RFC2045 and RFC2047.
87
88 @menu
89 * Interface Functions::   An abstraction over the basic functions.
90 * Basic Functions::       Utility and basic parsing functions.
91 * Decoding and Viewing::  A framework for decoding and viewing.
92 * Composing::             MML; a language for describing MIME parts.
93 * Standards::             A summary of RFCs and working documents used.
94 * Index::                 Function and variable index.
95 @end menu
96
97
98 @node Interface Functions
99 @chapter Interface Functions
100 @cindex interface functions
101 @cindex mail-parse
102
103 The @code{mail-parse} library is an abstraction over the actual
104 low-level libraries that are described in the next chapter.
105
106 Standards change, and so programs have to change to fit in the new
107 mold.  For instance, RFC2045 describes a syntax for the
108 @code{Content-Type} header that only allows ASCII characters in the
109 parameter list.  RFC2231 expands on RFC2045 syntax to provide a scheme
110 for continuation headers and non-ASCII characters.
111
112 The traditional way to deal with this is just to update the library
113 functions to parse the new syntax.  However, this is sometimes the wrong
114 thing to do.  In some instances it may be vital to be able to understand
115 both the old syntax as well as the new syntax, and if there is only one
116 library, one must choose between the old version of the library and the
117 new version of the library.
118
119 The Emacs MIME library takes a different tack.  It defines a series of
120 low-level libraries (@file{rfc2047.el}, @file{rfc2231.el} and so on)
121 that parses strictly according to the corresponding standard.  However,
122 normal programs would not use the functions provided by these libraries
123 directly, but instead use the functions provided by the
124 @code{mail-parse} library.  The functions in this library are just
125 aliases to the corresponding functions in the latest low-level
126 libraries.  Using this scheme, programs get a consistent interface they
127 can use, and library developers are free to create write code that
128 handles new standards.
129
130 The following functions are defined by this library:
131
132 @table @code
133 @item mail-header-parse-content-type
134 @findex mail-header-parse-content-type
135 Parse a @code{Content-Type} header and return a list on the following
136 format:
137
138 @lisp
139 ("type/subtype"
140  (attribute1 . value1)
141  (attribute2 . value2)
142  ...)
143 @end lisp
144
145 Here's an example:
146
147 @example
148 (mail-header-parse-content-type
149  "image/gif; name=\"b980912.gif\"")
150 @result{} ("image/gif" (name . "b980912.gif"))
151 @end example
152
153 @item mail-header-parse-content-disposition
154 @findex mail-header-parse-content-disposition
155 Parse a @code{Content-Disposition} header and return a list on the same
156 format as the function above.
157
158 @item mail-content-type-get
159 @findex mail-content-type-get
160 Takes two parameters---a list on the format above, and an attribute.
161 Returns the value of the attribute.
162
163 @example
164 (mail-content-type-get
165  '("image/gif" (name . "b980912.gif")) 'name)
166 @result{} "b980912.gif"
167 @end example
168
169 @item mail-header-encode-parameter
170 @findex mail-header-encode-parameter
171 Takes a parameter string and returns an encoded version of the string.
172 This is used for parameters in headers like @code{Content-Type} and
173 @code{Content-Disposition}.
174
175 @item mail-header-remove-comments
176 @findex mail-header-remove-comments
177 Return a comment-free version of a header.
178
179 @example
180 (mail-header-remove-comments
181  "Gnus/5.070027 (Pterodactyl Gnus v0.27) (Finnish Landrace)")
182 @result{} "Gnus/5.070027  "
183 @end example
184
185 @item mail-header-remove-whitespace
186 @findex mail-header-remove-whitespace
187 Remove linear white space from a header.  Space inside quoted strings
188 and comments is preserved.
189
190 @example
191 (mail-header-remove-whitespace
192  "image/gif; name=\"Name with spaces\"")
193 @result{} "image/gif;name=\"Name with spaces\""
194 @end example
195
196 @item mail-header-get-comment
197 @findex mail-header-get-comment
198 Return the last comment in a header.
199
200 @example
201 (mail-header-get-comment
202  "Gnus/5.070027 (Pterodactyl Gnus v0.27) (Finnish Landrace)")
203 @result{} "Finnish Landrace"
204 @end example
205
206 @item mail-header-parse-address
207 @findex mail-header-parse-address
208 Parse an address and return a list containing the mailbox and the
209 plaintext name.
210
211 @example
212 (mail-header-parse-address
213  "Hrvoje Niksic <hniksic@@srce.hr>")
214 @result{} ("hniksic@@srce.hr" . "Hrvoje Niksic")
215 @end example
216
217 @item mail-header-parse-addresses
218 @findex mail-header-parse-addresses
219 Parse a string with list of addresses and return a list of elements like
220 the one described above.
221
222 @example
223 (mail-header-parse-addresses
224  "Hrvoje Niksic <hniksic@@srce.hr>, Steinar Bang <sb@@metis.no>")
225 @result{} (("hniksic@@srce.hr" . "Hrvoje Niksic")
226      ("sb@@metis.no" . "Steinar Bang"))
227 @end example
228
229 @item mail-header-parse-date
230 @findex mail-header-parse-date
231 Parse a date string and return an Emacs time structure.
232
233 @item mail-narrow-to-head
234 @findex mail-narrow-to-head
235 Narrow the buffer to the header section of the buffer.  Point is placed
236 at the beginning of the narrowed buffer.
237
238 @item mail-header-narrow-to-field
239 @findex mail-header-narrow-to-field
240 Narrow the buffer to the header under point.
241
242 @item mail-encode-encoded-word-region
243 @findex mail-encode-encoded-word-region
244 Encode the non-ASCII words in the region.  For instance,
245 @samp{Naïve} is encoded as @samp{=?iso-8859-1?q?Na=EFve?=}.
246
247 @item mail-encode-encoded-word-buffer
248 @findex mail-encode-encoded-word-buffer
249 Encode the non-ASCII words in the current buffer.  This function is
250 meant to be called narrowed to the headers of a message.
251
252 @item mail-encode-encoded-word-string
253 @findex mail-encode-encoded-word-string
254 Encode the words that need encoding in a string, and return the result.
255
256 @example
257 (mail-encode-encoded-word-string
258  "This is naïve, baby")
259 @result{} "This is =?iso-8859-1?q?na=EFve,?= baby"
260 @end example
261
262 @item mail-decode-encoded-word-region
263 @findex mail-decode-encoded-word-region
264 Decode the encoded words in the region.
265
266 @item mail-decode-encoded-word-string
267 @findex mail-decode-encoded-word-string
268 Decode the encoded words in the string and return the result.
269
270 @example
271 (mail-decode-encoded-word-string
272  "This is =?iso-8859-1?q?na=EFve,?= baby")
273 @result{} "This is naïve, baby"
274 @end example
275
276 @end table
277
278 Currently, @code{mail-parse} is an abstraction over @code{ietf-drums},
279 @code{rfc2047}, @code{rfc2045} and @code{rfc2231}.  These are documented
280 in the subsequent sections.
281
282
283
284 @node Basic Functions
285 @chapter Basic Functions
286
287 This chapter describes the basic, ground-level functions for parsing and
288 handling.  Covered here is parsing @code{From} lines, removing comments
289 from header lines, decoding encoded words, parsing date headers and so
290 on.  High-level functionality is dealt with in the next chapter
291 (@pxref{Decoding and Viewing}).
292
293 @menu
294 * rfc2045::      Encoding @code{Content-Type} headers.
295 * rfc2231::      Parsing @code{Content-Type} headers.
296 * ietf-drums::   Handling mail headers defined by RFC822bis.
297 * rfc2047::      En/decoding encoded words in headers.
298 * time-date::    Functions for parsing dates and manipulating time.
299 * qp::           Quoted-Printable en/decoding.
300 * base64::       Base64 en/decoding.
301 * binhex::       Binhex decoding.
302 * uudecode::     Uuencode decoding.
303 * rfc1843::      Decoding HZ-encoded text.
304 * mailcap::      How parts are displayed is specified by the @file{.mailcap} file
305 @end menu
306
307
308 @node rfc2045
309 @section rfc2045
310
311 RFC2045 is the ``main'' @sc{mime} document, and as such, one would
312 imagine that there would be a lot to implement.  But there isn't, since
313 most of the implementation details are delegated to the subsequent
314 RFCs.
315
316 So @file{rfc2045.el} has only a single function:
317
318 @table @code
319 @item rfc2045-encode-string
320 @findex rfc2045-encode-string
321 Takes a parameter and a value and returns a @samp{PARAM=VALUE} string.
322 @var{value} will be quoted if there are non-safe characters in it.
323 @end table
324
325
326 @node rfc2231
327 @section rfc2231
328
329 RFC2231 defines a syntax for the @code{Content-Type} and
330 @code{Content-Disposition} headers.  Its snappy name is @dfn{MIME
331 Parameter Value and Encoded Word Extensions: Character Sets, Languages,
332 and Continuations}.
333
334 In short, these headers look something like this:
335
336 @example
337 Content-Type: application/x-stuff;
338  title*0*=us-ascii'en'This%20is%20even%20more%20;
339  title*1*=%2A%2A%2Afun%2A%2A%2A%20;
340  title*2="isn't it!"
341 @end example
342
343 They usually aren't this bad, though.
344
345 The following functions are defined by this library:
346
347 @table @code
348 @item rfc2231-parse-string
349 @findex rfc2231-parse-string
350 Parse a @code{Content-Type} header and return a list describing its
351 elements.
352
353 @example
354 (rfc2231-parse-string
355  "application/x-stuff;
356  title*0*=us-ascii'en'This%20is%20even%20more%20;
357  title*1*=%2A%2A%2Afun%2A%2A%2A%20;
358  title*2=\"isn't it!\"")
359 @result{} ("application/x-stuff"
360     (title . "This is even more ***fun*** isn't it!"))
361 @end example
362
363 @item rfc2231-get-value
364 @findex rfc2231-get-value
365 Takes one of the lists on the format above and returns
366 the value of the specified attribute.
367
368 @item rfc2231-encode-string
369 @findex rfc2231-encode-string
370 Encode a parameter in headers likes @code{Content-Type} and
371 @code{Content-Disposition}.
372
373 @end table
374
375
376 @node ietf-drums
377 @section ietf-drums
378
379 @dfn{drums} is an IETF working group that is working on the replacement
380 for RFC822.
381
382 The functions provided by this library include:
383
384 @table @code
385 @item ietf-drums-remove-comments
386 @findex ietf-drums-remove-comments
387 Remove the comments from the argument and return the results.
388
389 @item ietf-drums-remove-whitespace
390 @findex ietf-drums-remove-whitespace
391 Remove linear white space from the string and return the results.
392 Spaces inside quoted strings and comments are left untouched.
393
394 @item ietf-drums-get-comment
395 @findex ietf-drums-get-comment
396 Return the last most comment from the string.
397
398 @item ietf-drums-parse-address
399 @findex ietf-drums-parse-address
400 Parse an address string and return a list that contains the mailbox and
401 the plain text name.
402
403 @item ietf-drums-parse-addresses
404 @findex ietf-drums-parse-addresses
405 Parse a string that contains any number of comma-separated addresses and
406 return a list that contains mailbox/plain text pairs.
407
408 @item ietf-drums-parse-date
409 @findex ietf-drums-parse-date
410 Parse a date string and return an Emacs time structure.
411
412 @item ietf-drums-narrow-to-header
413 @findex ietf-drums-narrow-to-header
414 Narrow the buffer to the header section of the current buffer.
415
416 @end table
417
418
419 @node rfc2047
420 @section rfc2047
421
422 RFC2047 (Message Header Extensions for Non-ASCII Text) specifies how
423 non-ASCII text in headers are to be encoded.  This is actually rather
424 complicated, so a number of variables are necessary to tweak what this
425 library does.
426
427 The following variables are tweakable:
428
429 @table @code
430 @item rfc2047-default-charset
431 @vindex rfc2047-default-charset
432 Characters in this charset should not be decoded by this library.
433 This defaults to @code{iso-8859-1}.
434
435 @item rfc2047-header-encoding-list
436 @vindex rfc2047-header-encoding-list
437 This is an alist of header / encoding-type pairs.  Its main purpose is
438 to prevent encoding of certain headers.
439
440 The keys can either be header regexps, or @code{t}.
441
442 The values can be either @code{nil}, in which case the header(s) in
443 question won't be encoded, or @code{mime}, which means that they will be
444 encoded.
445
446 @item rfc2047-charset-encoding-alist
447 @vindex rfc2047-charset-encoding-alist
448 RFC2047 specifies two forms of encoding---@code{Q} (a
449 Quoted-Printable-like encoding) and @code{B} (base64).  This alist
450 specifies which charset should use which encoding.
451
452 @item rfc2047-encoding-function-alist
453 @vindex rfc2047-encoding-function-alist
454 This is an alist of encoding / function pairs.  The encodings are
455 @code{Q}, @code{B} and @code{nil}.
456
457 @item rfc2047-q-encoding-alist
458 @vindex rfc2047-q-encoding-alist
459 The @code{Q} encoding isn't quite the same for all headers.  Some
460 headers allow a narrower range of characters, and that is what this
461 variable is for.  It's an alist of header regexps / allowable character
462 ranges.
463
464 @item rfc2047-encoded-word-regexp
465 @vindex rfc2047-encoded-word-regexp
466 When decoding words, this library looks for matches to this regexp.
467
468 @end table
469
470 Those were the variables, and these are this functions:
471
472 @table @code
473 @item rfc2047-narrow-to-field
474 @findex rfc2047-narrow-to-field
475 Narrow the buffer to the header on the current line.
476
477 @item rfc2047-encode-message-header
478 @findex rfc2047-encode-message-header
479 Should be called narrowed to the header of a message.  Encodes according
480 to @code{rfc2047-header-encoding-alist}.
481
482 @item rfc2047-encode-region
483 @findex rfc2047-encode-region
484 Encodes all encodable words in the region specified.
485
486 @item rfc2047-encode-string
487 @findex rfc2047-encode-string
488 Encode a string and return the results.
489
490 @item rfc2047-decode-region
491 @findex rfc2047-decode-region
492 Decode the encoded words in the region.
493
494 @item rfc2047-decode-string
495 @findex rfc2047-decode-string
496 Decode a string and return the results.
497
498 @end table
499
500
501 @node time-date
502 @section time-date
503
504 While not really a part of the @sc{mime} library, it is convenient to
505 document this library here.  It deals with parsing @code{Date} headers
506 and manipulating time.  (Not by using tesseracts, though, I'm sorry to
507 say.)
508
509 These functions convert between five formats: A date string, an Emacs
510 time structure, a decoded time list, a second number, and a day number.
511
512 The functions have quite self-explanatory names, so the following just
513 gives an overview of which functions are available.
514
515 @example
516 (parse-time-string "Sat Sep 12 12:21:54 1998 +0200")
517 @result{} (54 21 12 12 9 1998 6 nil 7200)
518
519 (date-to-time "Sat Sep 12 12:21:54 1998 +0200")
520 @result{} (13818 19266)
521
522 (time-to-seconds '(13818 19266))
523 @result{} 905595714.0
524
525 (seconds-to-time 905595714.0)
526 @result{} (13818 19266 0)
527
528 (time-to-day '(13818 19266))
529 @result{} 729644
530
531 (days-to-time 729644)
532 @result{} (961933 65536)
533
534 (time-since '(13818 19266))
535 @result{} (0 430)
536
537 (time-less-p '(13818 19266) '(13818 19145))
538 @result{} nil
539
540 (subtract-time '(13818 19266) '(13818 19145))
541 @result{} (0 121)
542
543 (days-between "Sat Sep 12 12:21:54 1998 +0200"
544               "Sat Sep 07 12:21:54 1998 +0200")
545 @result{} 5
546
547 (date-leap-year-p 2000)
548 @result{} t
549
550 (time-to-day-in-year '(13818 19266))
551 @result{} 255
552
553 @end example
554
555 And finally, we have @code{safe-date-to-time}, which does the same as
556 @code{date-to-time}, but returns a zero time if the date is
557 syntactically malformed.
558
559
560
561 @node qp
562 @section qp
563
564 This library deals with decoding and encoding Quoted-Printable text.
565
566 Very briefly explained, qp encoding means translating all 8-bit
567 characters (and lots of control characters) into things that look like
568 @samp{=EF}; that is, an equal sign followed by the byte encoded as a hex
569 string.
570
571 The following functions are defined by the library:
572
573 @table @code
574 @item quoted-printable-decode-region
575 @findex quoted-printable-decode-region
576 QP-decode all the encoded text in the specified region.
577
578 @item quoted-printable-decode-string
579 @findex quoted-printable-decode-string
580 Decode the QP-encoded text in a string and return the results.
581
582 @item quoted-printable-encode-region
583 @findex quoted-printable-encode-region
584 QP-encode all the encodable characters in the specified region.  The third
585 optional parameter @var{fold} specifies whether to fold long lines.
586 (Long here means 72.)
587
588 @item quoted-printable-encode-string
589 @findex quoted-printable-encode-string
590 QP-encode all the encodable characters in a string and return the
591 results.
592
593 @end table
594
595
596 @node base64
597 @section base64
598 @cindex base64
599
600 Base64 is an encoding that encodes three bytes into four characters,
601 thereby increasing the size by about 33%.  The alphabet used for
602 encoding is very resistant to mangling during transit.
603
604 The following functions are defined by this library:
605
606 @table @code
607 @item base64-encode-region
608 @findex base64-encode-region
609 base64 encode the selected region.  Return the length of the encoded
610 text.  Optional third argument @var{no-line-break} means do not break
611 long lines into shorter lines.
612
613 @item base64-encode-string
614 @findex base64-encode-string
615 base64 encode a string and return the result.
616
617 @item base64-decode-region
618 @findex base64-decode-region
619 base64 decode the selected region.  Return the length of the decoded
620 text.  If the region can't be decoded, return @code{nil} and don't
621 modify the buffer.
622
623 @item base64-decode-string
624 @findex base64-decode-string
625 base64 decode a string and return the result.  If the string can't be
626 decoded, @code{nil} is returned.
627
628 @end table
629
630
631 @node binhex
632 @section binhex
633 @cindex binhex
634 @cindex Apple
635 @cindex Macintosh
636
637 @code{binhex} is an encoding that originated in Macintosh environments.
638 The following function is supplied to deal with these:
639
640 @table @code
641 @item binhex-decode-region
642 @findex binhex-decode-region
643 Decode the encoded text in the region.  If given a third parameter, only
644 decode the @code{binhex} header and return the filename.
645
646 @end table
647
648
649 @node uudecode
650 @section uudecode
651 @cindex uuencode
652 @cindex uudecode
653
654 @code{uuencode} is probably still the most popular encoding of binaries
655 used on Usenet, although @code{base64} rules the mail world.
656
657 The following function is supplied by this package:
658
659 @table @code
660 @item uudecode-decode-region
661 @findex uudecode-decode-region
662 Decode the text in the region.
663 @end table
664
665
666 @node rfc1843
667 @section rfc1843
668 @cindex rfc1843
669 @cindex HZ
670 @cindex Chinese
671
672 RFC1843 deals with mixing Chinese and ASCII characters in messages.  In
673 essence, RFC1843 switches between ASCII and Chinese by doing this:
674
675 @example
676 This sentence is in ASCII.
677 The next sentence is in GB.~@{<:Ky2;S@{#,NpJ)l6HK!#~@}Bye.
678 @end example
679
680 Simple enough, and widely used in China.
681
682 The following functions are available to handle this encoding:
683
684 @table @code
685 @item rfc1843-decode-region
686 Decode HZ-encoded text in the region.
687
688 @item rfc1843-decode-string
689 Decode a HZ-encoded string and return the result.
690
691 @end table
692
693
694 @node mailcap
695 @section mailcap
696
697 The @file{~/.mailcap} file is parsed by most @sc{mime}-aware message
698 handlers and describes how elements are supposed to be displayed.
699 Here's an example file:
700
701 @example
702 image/*; gimp -8 %s
703 audio/wav; wavplayer %s
704 @end example
705
706 This says that all image files should be displayed with @samp{xv}, and
707 that realaudio files should be played by @samp{rvplayer}.
708
709 The @code{mailcap} library parses this file, and provides functions for
710 matching types.
711
712 @table @code
713 @item mailcap-mime-data
714 @vindex mailcap-mime-data
715 This variable is an alist of alists containing backup viewing rules.
716
717 @end table
718
719 Interface functions:
720
721 @table @code
722 @item mailcap-parse-mailcaps
723 @findex mailcap-parse-mailcaps
724 Parse the @code{~/.mailcap} file.
725
726 @item mailcap-mime-info
727 Takes a @sc{mime} type as its argument and returns the matching viewer.
728
729 @end table
730
731
732
733
734 @node Decoding and Viewing
735 @chapter Decoding and Viewing
736
737 This chapter deals with decoding and viewing @sc{mime} messages on a
738 higher level.
739
740 The main idea is to first analyze a @sc{mime} article, and then allow
741 other programs to do things based on the list of @dfn{handles} that are
742 returned as a result of this analysis.
743
744 @menu
745 * Dissection::  Analyzing a @sc{mime} message.
746 * Handles::     Handle manipulations.
747 * Display::     Displaying handles.
748 @end menu
749
750
751 @node Dissection
752 @section Dissection
753
754 The @code{mm-dissect-buffer} is the function responsible for dissecting
755 a @sc{mime} article.  If given a multipart message, it will recursively
756 descend the message, following the structure, and return a tree of
757 @sc{mime} handles that describes the structure of the message.
758
759
760 @node Handles
761 @section Handles
762
763 A @sc{mime} handle is a list that fully describes a @sc{mime}
764 component.
765
766 The following macros can be used to access elements in a handle:
767
768 @table @code
769 @item mm-handle-buffer
770 @findex mm-handle-buffer
771 Return the buffer that holds the contents of the undecoded @sc{mime}
772 part.
773
774 @item mm-handle-type
775 @findex mm-handle-type
776 Return the parsed @code{Content-Type} of the part.
777
778 @item mm-handle-encoding
779 @findex mm-handle-encoding
780 Return the @code{Content-Transfer-Encoding} of the part.
781
782 @item mm-handle-undisplayer
783 @findex mm-handle-undisplayer
784 Return the object that can be used to remove the displayed part (if it
785 has been displayed).
786
787 @item mm-handle-set-undisplayer
788 @findex mm-handle-set-undisplayer
789 Set the undisplayer object.
790
791 @item mm-handle-disposition
792 @findex mm-handle-disposition
793 Return the parsed @code{Content-Disposition} of the part.
794
795 @item mm-handle-disposition
796 @findex mm-handle-disposition
797 Return the description of the part.
798
799 @item mm-get-content-id
800 Returns the handle(s) referred to by @code{Content-ID}.
801
802 @end table
803
804
805 @node Display
806 @section Display
807
808 Functions for displaying, removing and saving.
809
810 @table @code
811 @item mm-display-part
812 @findex mm-display-part
813 Display the part.
814
815 @item mm-remove-part
816 @findex mm-remove-part
817 Remove the part (if it has been displayed).
818
819 @item mm-inlinable-p
820 @findex mm-inlinable-p
821 Say whether a @sc{mime} type can be displayed inline.
822
823 @item mm-automatic-display-p
824 @findex mm-automatic-display-p
825 Say whether a @sc{mime} type should be displayed automatically.
826
827 @item mm-destroy-part
828 @findex mm-destroy-part
829 Free all resources occupied by a part.
830
831 @item mm-save-part
832 @findex mm-save-part
833 Offer to save the part in a file.
834
835 @item mm-pipe-part
836 @findex mm-pipe-part
837 Offer to pipe the part to some process.
838
839 @item mm-interactively-view-part
840 @findex mm-interactively-view-part
841 Prompt for a mailcap method to use to view the part.
842
843 @end table
844
845
846 @node Composing
847 @chapter Composing
848 @cindex Composing
849 @cindex MIME Composing
850 @cindex MML
851 @cindex MIME Meta Language
852
853 Creating a @sc{mime} message is boring and non-trivial.  Therefore, a
854 library called @code{mml} has been defined that parses a language called
855 MML (@sc{mime} Meta Language) and generates @sc{mime} messages.
856
857 @findex mml-generate-mime
858 The main interface function is @code{mml-generate-mime}.  It will
859 examine the contents of the current (narrowed-to) buffer and return a
860 string containing the @sc{mime} message.
861
862 @menu
863 * Simple MML Example::             An example MML document.
864 * MML Definition::                 All valid MML elements.
865 * Advanced MML Example::           Another example MML document.
866 * Conversion::                     Going from @sc{mime} to MML and vice versa.
867 @end menu
868
869
870 @node Simple MML Example
871 @section Simple MML Example
872
873 Here's a simple @samp{multipart/alternative}:
874
875 @example
876 <#multipart type=alternative>
877 This is a plain text part.
878 <#part type=text/enriched>
879 <center>This is a centered enriched part</center>
880 <#/multipart>
881 @end example
882
883 After running this through @code{mml-generate-mime}, we get this:
884
885 @example
886 Content-Type: multipart/alternative; boundary="=-=-="
887
888
889 --=-=-=
890
891
892 This is a plain text part.
893
894 --=-=-=
895 Content-Type: text/enriched
896
897
898 <center>This is a centered enriched part</center>
899
900 --=-=-=--
901 @end example
902
903
904 @node MML Definition
905 @section MML Definition
906
907 The MML language is very simple.  It looks a bit like an SGML
908 application, but it's not.
909
910 The main concept of MML is the @dfn{part}.  Each part can be of a
911 different type or use a different charset.  The way to delineate a part
912 is with a @samp{<#part ...>} tag.  Multipart parts can be introduced
913 with the @samp{<#multipart ...>} tag.  Parts are ended by the
914 @samp{<#/part>} or @samp{<#/multipart>} tags.  Parts started with the
915 @samp{<#part ...>} tags are also closed by the next open tag.
916
917 There's also the @samp{<#external ...>} tag.  These introduce
918 @samp{external/message-body} parts.
919
920 Each tag can contain zero or more parameters on the form
921 @samp{parameter=value}.  The values may be enclosed in quotation marks,
922 but that's not necessary unless the value contains white space.  So
923 @samp{filename=/home/user/#hello$^yes} is perfectly valid.
924
925 The following parameters have meaning in MML; parameters that have no
926 meaning are ignored.  The MML parameter names are the same as the
927 @sc{mime} parameter names; the things in the parentheses say which
928 header it will be used in.
929
930 @table @samp
931 @item type
932 The @sc{mime} type of the part (@code{Content-Type}).
933
934 @item filename
935 Use the contents of the file in the body of the part
936 (@code{Content-Disposition}).
937
938 @item charset
939 The contents of the body of the part are to be encoded in the character
940 set speficied (@code{Content-Type}).
941
942 @item name
943 Might be used to suggest a file name if the part is to be saved
944 to a file (@code{Content-Type}).
945
946 @item disposition
947 Valid values are @samp{inline} and @samp{attachment}
948 (@code{Content-Disposition}).
949
950 @item encoding
951 Valid values are @samp{7bit}, @samp{8bit}, @samp{quoted-printable} and
952 @samp{base64} (@code{Content-Transfer-Encoding}).
953
954 @item description
955 A description of the part (@code{Content-Description}).
956
957 @item creation-date
958 RFC822 date when the part was created (@code{Content-Disposition}).
959
960 @item modification-date
961 RFC822 date when the part was modified (@code{Content-Disposition}).
962
963 @item read-date
964 RFC822 date when the part was read (@code{Content-Disposition}).
965
966 @item size
967 The size (in octets) of the part (@code{Content-Disposition}).
968
969 @end table
970
971 Parameters for @samp{application/octet-stream}:
972
973 @table @samp
974 @item type
975 Type of the part; informal---meant for human readers
976 (@code{Content-Type}).
977 @end table
978
979 Parameters for @samp{message/external-body}:
980
981 @table @samp
982 @item access-type
983 A word indicating the supported access mechanism by which the file may
984 be obtained.  Values include @samp{ftp}, @samp{anon-ftp}, @samp{tftp},
985 @samp{localfile}, and @samp{mailserver}.  (@code{Content-Type}.)
986
987 @item expiration
988 The RFC822 date after which the file may no longer be fetched.
989 (@code{Content-Type}.)
990
991 @item size
992 The size (in octets) of the file.  (@code{Content-Type}.)
993
994 @item permission
995 Valid values are @samp{read} and @samp{read-write}
996 (@code{Content-Type}).
997
998 @end table
999
1000
1001 @node Advanced MML Example
1002 @section Advanced MML Example
1003
1004 Here's a complex multipart message.  It's a @samp{multipart/mixed} that
1005 contains many parts, one of which is a @samp{multipart/alternative}.
1006
1007 @example
1008 <#multipart type=mixed>
1009 <#part type=image/jpeg filename=~/rms.jpg disposition=inline>
1010 <#multipart type=alternative>
1011 This is a plain text part.
1012 <#part type=text/enriched name=enriched.txt>
1013 <center>This is a centered enriched part</center>
1014 <#/multipart>
1015 This is a new plain text part.
1016 <#part disposition=attachment>
1017 This plain text part is an attachment.
1018 <#/multipart>
1019 @end example
1020
1021 And this is the resulting @sc{mime} message:
1022
1023 @example
1024 Content-Type: multipart/mixed; boundary="=-=-="
1025
1026
1027 --=-=-=
1028
1029
1030
1031 --=-=-=
1032 Content-Type: image/jpeg;
1033  filename="~/rms.jpg"
1034 Content-Disposition: inline;
1035  filename="~/rms.jpg"
1036 Content-Transfer-Encoding: base64
1037
1038 /9j/4AAQSkZJRgABAQAAAQABAAD/2wBDAAgGBgcGBQgHBwcJCQgKDBQNDAsLDBkSEw8UHRof
1039 Hh0aHBwgJC4nICIsIxwcKDcpLDAxNDQ0Hyc5PTgyPC4zNDL/wAALCAAwADABAREA/8QAHwAA
1040 AQUBAQEBAQEAAAAAAAAAAAECAwQFBgcICQoL/8QAtRAAAgEDAwIEAwUFBAQAAAF9AQIDAAQR
1041 BRIhMUEGE1FhByJxFDKBkaEII0KxwRVS0fAkM2JyggkKFhcYGRolJicoKSo0NTY3ODk6Q0RF
1042 RkdISUpTVFVWV1hZWmNkZWZnaGlqc3R1dnd4eXqDhIWGh4iJipKTlJWWl5iZmqKjpKWmp6ip
1043 qrKztLW2t7i5usLDxMXGx8jJytLT1NXW19jZ2uHi4+Tl5ufo6erx8vP09fb3+Pn6/9oACAEB
1044 AAA/AO/rifFHjldNuGsrDa0qcSSHkA+gHrXKw+LtWLrMb+RgTyhbr+HSug07xNqV9fQtZrNI
1045 AyiaE/NuBPOOOP0rvRNE880KOC8TbXXGCv1FPqjrF4LDR7u5L7SkTFT/ALWOP1xXgTuXfc7E
1046 sx6nua6rwp4IvvEM8chCxWxOdzn7wz6V9AaB4S07w9p5itow0rDLSY5Pt9K43xO66P4xs71m
1047 2QXiGCbA4yOVJ9+1aYORkdK434lyNH4ahCnG66VT9Nj15JFbPdX0MS43M4VQf5/yr2vSpLnw
1048 5ZW8dlCZ8KFXjOPX0/mK6rSPEGt3Angu44fNEReHYNvIH3TzXDeKNO8RX+kSX2ouZkicTIOc
1049 L+g7E810ulFjpVtv3bwgB3HJyK5L4quY/C9sVxk3ij/xx6850u7t1mtp/wDlpEw3An3Jr3Dw
1050 34gsbWza4nBlhC5LDsaW6+IFgupQyCF3iHH7gA7c9R9ay7zx6t7aX9jHC4smhfBkGCvHGfrm
1051 tLQ7hbnRrV1GPkAP1x1/Hr+Ncr8Vzjwrbf8AX6v/AKA9eQRyYlQk8Yx9K6XTNbkgia2ciSIn
1052 7p5Ga9Atte0LTLKO6it4i7dVRFJDcZ4PvXN+JvEMF9bILVGXJLSZ4zkjivRPDaeX4b08HOTC
1053 pOffmua+KkbS+GLVUGT9tT/0B68eeIpIFYjB70+OOVXyoOM9+M1eaWeCLzHPyHGO/NVWvJJm
1054 jQ8KGH1NfQWhXSXmh2c8eArRLwO3HSv/2Q==
1055
1056 --=-=-=
1057 Content-Type: multipart/alternative; boundary="==-=-="
1058
1059
1060 --==-=-=
1061
1062
1063 This is a plain text part.
1064
1065 --==-=-=
1066 Content-Type: text/enriched;
1067  name="enriched.txt"
1068
1069
1070 <center>This is a centered enriched part</center>
1071
1072 --==-=-=--
1073
1074 --=-=-=
1075
1076 This is a new plain text part.
1077
1078 --=-=-=
1079 Content-Disposition: attachment
1080
1081
1082 This plain text part is an attachment.
1083
1084 --=-=-=--
1085 @end example
1086
1087
1088 @node Conversion
1089 @section Conversion
1090
1091 @findex mime-to-mml
1092 A (multipart) @sc{mime} message can be converted to MML with the
1093 @code{mime-to-mml} function.  It works on the message in the current
1094 buffer, and substitutes MML markup for @sc{mime} boundaries.
1095 Non-textual parts do not have their contents in the buffer, but instead
1096 have the contents in separate buffers that are referred to from the MML
1097 tags.
1098
1099 @findex mml-to-mime
1100 An MML message can be converted back to @sc{mime} by the
1101 @code{mml-to-mime} function.
1102
1103 These functions are in certain senses ``lossy''---you will not get back
1104 an identical message if you run @sc{mime-to-mml} and then
1105 @sc{mml-to-mime}.  Not only will trivial things like the order of the
1106 headers differ, but the contents of the headers may also be different.
1107 For instance, the original message may use base64 encoding on text,
1108 while @sc{mml-to-mime} may decide to use quoted-printable encoding, and
1109 so on.
1110
1111 In essence, however, these two functions should be the inverse of each
1112 other.  The resulting contents of the message should remain equivalent,
1113 if not identical.
1114
1115
1116 @node Standards
1117 @chapter Standards
1118
1119 The Emacs @sc{mime} library implements handling of various elements
1120 according to a (somewhat) large number of RFCs, drafts and standards
1121 documents.  This chapter lists the relevant ones.  They can all be
1122 fetched from @samp{http://www.stud.ifi.uio.no/~larsi/notes/}.
1123
1124 @table @dfn
1125 @item RFC822
1126 @itemx STD11
1127 Standard for the Format of ARPA Internet Text Messages.
1128
1129 @item RFC1036
1130 Standard for Interchange of USENET Messages
1131
1132 @item RFC2045
1133 Format of Internet Message Bodies
1134
1135 @item RFC2046
1136 Media Types
1137
1138 @item RFC2047
1139 Message Header Extensions for Non-ASCII Text
1140
1141 @item RFC2048
1142 Registration Procedures
1143
1144 @item RFC2049
1145 Conformance Criteria and Examples
1146
1147 @item RFC2231
1148 MIME Parameter Value and Encoded Word Extensions: Character Sets,
1149 Languages, and Continuations
1150
1151 @item RFC1843
1152 HZ - A Data Format for Exchanging Files of Arbitrarily Mixed Chinese and
1153 ASCII characters
1154
1155 @item draft-ietf-drums-msg-fmt-05.txt
1156 Draft for the successor of RFC822
1157
1158 @item RFC2112
1159 The MIME Multipart/Related Content-type
1160
1161 @item RFC1892
1162 The Multipart/Report Content Type for the Reporting of Mail System
1163 Administrative Messages
1164
1165 @item RFC2183
1166 Communicating Presentation Information in Internet Messages: The
1167 Content-Disposition Header Field
1168
1169 @end table
1170
1171
1172 @node Index
1173 @chapter Index
1174 @printindex cp
1175
1176 @summarycontents
1177 @contents
1178 @bye
1179
1180 @c End: