tm 7.52.1.
[elisp/tm.git] / tm-parse.el
1 ;;;
2 ;;; tm-parse.el --- MIME message parser
3 ;;;
4 ;;; Copyright (C) 1995 Free Software Foundation, Inc.
5 ;;; Copyright (C) 1994 .. 1996 MORIOKA Tomohiko
6 ;;;
7 ;;; Author: MORIOKA Tomohiko <morioka@jaist.ac.jp>
8 ;;; Version:
9 ;;;     $Id: tm-parse.el,v 7.8 1996/04/20 12:17:27 morioka Exp $
10 ;;; Keywords: mail, news, MIME, multimedia
11 ;;;
12 ;;; This file is part of tm (Tools for MIME).
13 ;;;
14 ;;; This program is free software; you can redistribute it and/or
15 ;;; modify it under the terms of the GNU General Public License as
16 ;;; published by the Free Software Foundation; either version 2, or
17 ;;; (at your option) any later version.
18 ;;;
19 ;;; This program is distributed in the hope that it will be useful,
20 ;;; but WITHOUT ANY WARRANTY; without even the implied warranty of
21 ;;; MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
22 ;;; General Public License for more details.
23 ;;;
24 ;;; You should have received a copy of the GNU General Public License
25 ;;; along with This program.  If not, write to the Free Software
26 ;;; Foundation, 675 Mass Ave, Cambridge, MA 02139, USA.
27 ;;;
28 ;;; Code:
29
30 (require 'tl-822)
31 (require 'tl-misc)
32 (require 'tm-def)
33
34
35 ;;; @ field parser
36 ;;;
37
38 (defconst mime::parameter-regexp
39   (concat "^[ \t]*\;[ \t]*\\(" mime/token-regexp "\\)"
40           "[ \t]*=[ \t]*\\(" mime/content-parameter-value-regexp "\\)"))
41
42 (defun mime/parse-parameter (str)
43   (if (string-match mime::parameter-regexp str)
44       (let ((e (match-end 2)))
45         (cons
46          (cons (downcase (substring str (match-beginning 1) (match-end 1)))
47                (rfc822/strip-quoted-string
48                 (substring str (match-beginning 2) e))
49                )
50          (substring str e)
51          ))))
52
53 (defconst mime::ctype-regexp (concat "^" mime/content-type-subtype-regexp))
54
55 (defun mime/parse-Content-Type (str)
56   "Parse STR as field-body of Content-Type field. [tm-parse.el]"
57   (setq str (rfc822/unfolding-string str))
58   (if (string-match mime::ctype-regexp str)
59       (let* ((e (match-end 0))
60              (ctype (downcase (substring str 0 e)))
61              ret dest)
62         (setq str (substring str e))
63         (while (setq ret (mime/parse-parameter str))
64           (setq dest (cons (car ret) dest)
65                 str (cdr ret))
66           )
67         (cons ctype (nreverse dest))
68         )))
69
70 (defconst mime::dtype-regexp (concat "^" mime/disposition-type-regexp))
71
72 (defun mime/parse-Content-Disposition (str)
73   "Parse STR as field-body of Content-Disposition field. [tm-parse.el]"
74   (setq str (rfc822/unfolding-string str))
75   (if (string-match mime::dtype-regexp str)
76       (let* ((e (match-end 0))
77              (ctype (downcase (substring str 0 e)))
78              ret dest)
79         (setq str (substring str e))
80         (while (setq ret (mime/parse-parameter str))
81           (setq dest (cons (car ret) dest)
82                 str (cdr ret))
83           )
84         (cons ctype (nreverse dest))
85         )))
86
87
88 ;;; @ field reader
89 ;;;
90
91 (defun mime/Content-Type ()
92   "Read field-body of Content-Type field from current-buffer,
93 and return parsed it. [tm-parse.el]"
94   (let ((str (rfc822/get-field-body "Content-Type")))
95     (if str
96         (mime/parse-Content-Type str)
97       )))
98
99 (defun mime/Content-Transfer-Encoding (&optional default-encoding)
100   "Read field-body of Content-Transfer-Encoding field from
101 current-buffer, and return it.
102 If is is not found, return DEFAULT-ENCODING. [tm-parse.el]"
103   (let ((str (rfc822/get-field-body "Content-Transfer-Encoding")))
104     (if str
105         (downcase str)
106       default-encoding)
107     ))
108
109 (defun mime/Content-Disposition ()
110   "Read field-body of Content-Disposition field from current-buffer,
111 and return parsed it. [tm-parse.el]"
112   (let ((str (rfc822/get-field-body "Content-Disposition")))
113     (if str
114         (mime/parse-Content-Disposition str)
115       )))
116
117
118 ;;; @ message parser
119 ;;;
120
121 (define-structure mime::content-info
122   rcnum point-min point-max type parameters encoding children)
123
124
125 (defun mime/parse-multipart (boundary ctype params encoding rcnum)
126   (goto-char (point-min))
127   (let* ((dash-boundary   (concat "--" boundary))
128          (delimiter       (concat "\n" (regexp-quote dash-boundary)))
129          (close-delimiter (concat delimiter "--[ \t]*$"))
130          (beg (point-min))
131          (end (progn
132                 (goto-char (point-max))
133                 (if (re-search-backward close-delimiter nil t)
134                     (match-beginning 0)
135                   (point-max)
136                   )))
137          (rsep (concat delimiter "[ \t]*\n"))
138          (dc-ctl
139           (if (string-equal ctype "multipart/digest")
140               '("message/rfc822")
141             '("text/plain")
142             ))
143          cb ce ct ret ncb children (i 0))
144     (save-restriction
145       (narrow-to-region beg end)
146       (goto-char beg)
147       (re-search-forward rsep nil t)
148       (setq cb (match-end 0))
149       (while (re-search-forward rsep nil t)
150         (setq ce (match-beginning 0))
151         (setq ncb (match-end 0))
152         (save-restriction
153           (narrow-to-region cb ce)
154           (setq ret (mime/parse-message dc-ctl "7bit" (cons i rcnum)))
155           )
156         (setq children (cons ret children))
157         (goto-char (mime::content-info/point-max ret))
158         (goto-char (setq cb ncb))
159         (setq i (1+ i))
160         )
161       (setq ce (point-max))
162       (save-restriction
163         (narrow-to-region cb ce)
164         (setq ret (mime/parse-message dc-ctl "7bit" (cons i rcnum)))
165         )
166       (setq children (cons ret children))
167       )
168     (mime::content-info/create rcnum beg (point-max)
169                                ctype params encoding
170                                (nreverse children))
171     ))
172
173 (defun mime/parse-message (&optional ctl encoding rcnum)
174   "Parse current-buffer as a MIME message. [tm-parse.el]"
175   (setq ctl (or (mime/Content-Type) ctl))
176   (setq encoding (or (mime/Content-Transfer-Encoding) encoding))
177   (let ((ctype (car ctl))
178         (params (cdr ctl))
179         )
180     (let ((boundary (assoc "boundary" params)))
181       (cond (boundary
182              (setq boundary (rfc822/strip-quoted-string (cdr boundary)))
183              (mime/parse-multipart boundary ctype params encoding rcnum)
184              )
185             ((string-equal ctype "message/rfc822")
186              (goto-char (point-min))
187              (mime::content-info/create rcnum
188                                         (point-min) (point-max)
189                                         ctype params encoding
190                                         (save-restriction
191                                           (narrow-to-region
192                                            (if (re-search-forward "^$" nil t)
193                                                (1+ (match-end 0))
194                                              (point-min)
195                                              )
196                                            (point-max))
197                                           (list (mime/parse-message
198                                                  nil nil (cons 0 rcnum)))
199                                           )
200                                         )
201              )
202             (t 
203              (mime::content-info/create rcnum (point-min) (point-max)
204                                         ctype params encoding nil)
205              ))
206       )))
207
208
209 ;;; @ end
210 ;;;
211
212 (provide 'tm-parse)
213
214 ;;; tm-parse.el ends here