emu-nemacs.el, emu-mule.el (decode-mime-charset-{region|string}): Add new argument...
[elisp/apel.git] / emu-mule.el
1 ;;; emu-mule.el --- emu module for Mule 1.* and Mule 2.*
2
3 ;; Copyright (C) 1995,1996,1997,1998 MORIOKA Tomohiko
4
5 ;; Author: MORIOKA Tomohiko <morioka@jaist.ac.jp>
6 ;;         Katsumi Yamaoka <yamaoka@jpl.org>
7 ;; Keywords: emulation, compatibility, Mule
8
9 ;; This file is part of emu.
10
11 ;; This program is free software; you can redistribute it and/or
12 ;; modify it under the terms of the GNU General Public License as
13 ;; published by the Free Software Foundation; either version 2, or (at
14 ;; your option) any later version.
15
16 ;; This program is distributed in the hope that it will be useful, but
17 ;; WITHOUT ANY WARRANTY; without even the implied warranty of
18 ;; MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
19 ;; General Public License for more details.
20
21 ;; You should have received a copy of the GNU General Public License
22 ;; along with GNU Emacs; see the file COPYING.  If not, write to the
23 ;; Free Software Foundation, Inc., 59 Temple Place - Suite 330,
24 ;; Boston, MA 02111-1307, USA.
25
26 ;;; Code:
27
28 ;;; @ version specific features
29 ;;;
30
31 (cond (running-emacs-19
32        (require 'emu-e19)
33        
34        ;; Suggested by SASAKI Osamu <osamu@shuugr.bekkoame.or.jp>
35        ;; (cf. [os2-emacs-ja:78])
36        (defun fontset-pixel-size (fontset)
37          (let* ((font (get-font-info
38                        (aref (cdr (get-fontset-info fontset)) 0)))
39                 (open (aref font 4)))
40            (if (= open 1)
41                (aref font 5)
42              (if (= open 0)
43                  (let ((pat (aref font 1)))
44                    (if (string-match "-[0-9]+-" pat)
45                        (string-to-number
46                         (substring
47                          pat (1+ (match-beginning 0)) (1- (match-end 0))))
48                      0)))
49              )))
50        )
51       (running-emacs-18
52        (require 'emu-18)
53        (defun make-overlay (beg end &optional buffer type))
54        (defun overlay-put (overlay prop value))
55        ))
56
57
58 ;;; @ character set
59 ;;;
60
61 (defalias 'make-char 'make-character)
62
63 (defalias 'find-non-ascii-charset-string 'find-charset-string)
64 (defalias 'find-non-ascii-charset-region 'find-charset-region)
65
66 (defalias 'charset-bytes        'char-bytes)
67 (defalias 'charset-description  'char-description)
68 (defalias 'charset-registry     'char-registry)
69 (defalias 'charset-columns      'char-width)
70 (defalias 'charset-direction    'char-direction)
71
72 (defun charset-chars (charset)
73   "Return the number of characters per dimension of CHARSET."
74   (if (= (logand (nth 2 (character-set charset)) 1) 1)
75       96
76     94))
77
78
79 ;;; @ coding system
80 ;;;
81
82 (defun encode-coding-region (start end coding-system)
83   "Encode the text between START and END to CODING-SYSTEM.
84 \[EMACS 20 emulating function]"
85   (code-convert-region start end *internal* coding-system)
86   )
87
88 (defun decode-coding-region (start end coding-system)
89   "Decode the text between START and END which is encoded in CODING-SYSTEM.
90 \[EMACS 20 emulating function]"
91   (code-convert-region start end coding-system *internal*)
92   )
93
94 (defun encode-coding-string (str coding-system)
95   "Encode the STRING to CODING-SYSTEM.
96 \[EMACS 20 emulating function]"
97   (code-convert-string str *internal* coding-system)
98   )
99
100 (defun decode-coding-string (str coding-system)
101   "Decode the string STR which is encoded in CODING-SYSTEM.
102 \[EMACS 20 emulating function]"
103   (let ((len (length str))
104         ret)
105     (while (and
106             (< 0 len)
107             (null
108              (setq ret
109                    (code-convert-string (substring str 0 len)
110                                         coding-system *internal*))
111              ))
112       (setq len (1- len))
113       )
114     (concat ret (substring str len))
115     ))
116
117 (defalias 'detect-coding-region 'code-detect-region)
118
119 (defalias 'set-buffer-file-coding-system 'set-file-coding-system)
120
121 (defmacro as-binary-process (&rest body)
122   (` (let (selective-display    ; Disable ^M to nl translation.
123            ;; Mule
124            mc-flag      
125            (default-process-coding-system (cons *noconv* *noconv*))
126            program-coding-system-alist)
127        (,@ body)
128        )))
129
130 (defmacro as-binary-input-file (&rest body)
131   (` (let (mc-flag
132            (file-coding-system-for-read *noconv*)
133            )
134        (,@ body)
135        )))
136
137 (defmacro as-binary-output-file (&rest body)
138   (` (let (mc-flag
139            (file-coding-system *noconv*)
140            )
141        (,@ body)
142        )))
143
144 (defalias 'set-process-input-coding-system 'set-process-coding-system)
145
146
147 ;;; @ binary access
148 ;;;
149
150 (defun insert-file-contents-as-binary (filename
151                                        &optional visit beg end replace)
152   "Like `insert-file-contents', q.v., but don't code and format conversion.
153 Like `insert-file-contents-literary', but it allows find-file-hooks,
154 automatic uncompression, etc.
155
156 Namely this function ensures that only format decoding and character
157 code conversion will not take place."
158   (let (mc-flag
159         (file-coding-system-for-read *noconv*))
160     (insert-file-contents filename visit beg end replace)
161     ))
162
163 (defalias 'insert-binary-file-contents 'insert-file-contents-as-binary)
164 (make-obsolete 'insert-binary-file-contents 'insert-file-contents-as-binary)
165
166 (defun insert-file-contents-as-raw-text (filename
167                                          &optional visit beg end replace)
168   "Like `insert-file-contents', q.v., but don't code and format conversion.
169 Like `insert-file-contents-literary', but it allows find-file-hooks,
170 automatic uncompression, etc.
171 Like `insert-file-contents-as-binary', but it converts line-break
172 code."
173   (save-excursion
174     (save-restriction
175       (narrow-to-region (point)(point))
176       (insert-file-contents-as-binary filename visit beg end replace)
177       (goto-char (point-min))
178       (while (re-search-forward "\r$" nil t)
179         (replace-match "")
180         ))))
181
182 (defun insert-binary-file-contents-literally (filename
183                                               &optional visit beg end replace)
184   "Like `insert-file-contents-literally', q.v., but don't code conversion.
185 A buffer may be modified in several ways after reading into the buffer due
186 to advanced Emacs features, such as file-name-handlers, format decoding,
187 find-file-hooks, etc.
188   This function ensures that none of these modifications will take place."
189   (let (mc-flag
190         (file-coding-system *noconv*))
191     (insert-file-contents-literally filename visit beg end replace)
192     ))
193
194 (if running-emacs-19_29-or-later
195     ;; for MULE 2.3 based on Emacs 19.34.
196     (defun write-region-as-binary (start end filename
197                                          &optional append visit lockname)
198       "Like `write-region', q.v., but don't code conversion."
199       (let (mc-flag
200             (file-coding-system *noconv*))
201         (write-region start end filename append visit lockname)
202         ))
203   ;; for MULE 2.3 based on Emacs 19.28.
204   (defun write-region-as-binary (start end filename
205                                        &optional append visit lockname)
206     "Like `write-region', q.v., but don't code conversion."
207     (let (mc-flag
208           (file-coding-system *noconv*))
209       (write-region start end filename append visit)
210       ))
211   )
212
213 (defun write-region-as-raw-text-CRLF (start end filename
214                                             &optional append visit lockname)
215   "Like `write-region', q.v., but don't code conversion."
216   (let ((the-buf (current-buffer)))
217     (with-temp-buffer
218       (insert-buffer-substring the-buf start end)
219       (goto-char (point-min))
220       (while (re-search-forward "\\(\\=\\|[^\r]\\)\n" nil t)
221         (replace-match "\\1\r\n")
222         )
223       (write-region-as-binary (point-min)(point-max)
224                               filename append visit lockname)
225       )))
226
227
228 ;;; @ MIME charset
229 ;;;
230
231 (defun encode-mime-charset-region (start end charset)
232   "Encode the text between START and END as MIME CHARSET."
233   (let ((cs (mime-charset-to-coding-system charset)))
234     (if cs
235         (code-convert start end *internal* cs)
236       )))
237
238 (defun decode-mime-charset-region (start end charset &optional lbt)
239   "Decode the text between START and END as MIME CHARSET."
240   (let ((cs (mime-charset-to-coding-system charset lbt)))
241     (if cs
242         (code-convert start end cs *internal*)
243       )))
244
245 (defun encode-mime-charset-string (string charset)
246   "Encode the STRING as MIME CHARSET."
247   (let ((cs (mime-charset-to-coding-system charset)))
248     (if cs
249         (code-convert-string string *internal* cs)
250       string)))
251
252 (defun decode-mime-charset-string (string charset &optional lbt)
253   "Decode the STRING which is encoded in MIME CHARSET."
254   (let ((cs (mime-charset-to-coding-system charset lbt)))
255     (if cs
256         (decode-coding-string string cs)
257       string)))
258
259 (defun write-region-as-mime-charset (charset start end filename)
260   "Like `write-region', q.v., but code-convert by MIME CHARSET."
261   (let ((file-coding-system
262          (or (mime-charset-to-coding-system charset)
263              *noconv*)))
264     (write-region start end filename append visit)
265     ))
266
267
268 ;;; @@ to coding-system
269 ;;;
270
271 (defvar mime-charset-coding-system-alist
272   '((iso-8859-1      . *ctext*)
273     (x-ctext         . *ctext*)
274     (gb2312          . *euc-china*)
275     (koi8-r          . *koi8*)
276     (iso-2022-jp-2   . *iso-2022-ss2-7*)
277     (x-iso-2022-jp-2 . *iso-2022-ss2-7*)
278     (shift_jis       . *sjis*)
279     (x-shiftjis      . *sjis*)
280     ))
281
282 (defun mime-charset-to-coding-system (charset &optional lbt)
283   (if (stringp charset)
284       (setq charset (intern (downcase charset)))
285     )
286   (let ((cs
287          (or (cdr (assq charset mime-charset-coding-system-alist))
288              (let ((cs (intern (concat "*" (symbol-name charset) "*"))))
289                (and (coding-system-p cs) cs)
290                ))))
291     (if (or (null lbt)
292             (null cs))
293         cs
294       (intern (format "%s%s" cs (cond ((eq lbt 'CRLF) 'dos)
295                                       ((eq lbt 'LF) 'unix)
296                                       ((eq lbt 'CR) 'mac)
297                                       (t lbt))))
298       )))
299
300
301 ;;; @@ detection
302 ;;;
303
304 (defvar charsets-mime-charset-alist
305   (let ((alist
306          '(((lc-ascii)                                  . us-ascii)
307            ((lc-ascii lc-ltn1)                          . iso-8859-1)
308            ((lc-ascii lc-ltn2)                          . iso-8859-2)
309            ((lc-ascii lc-ltn3)                          . iso-8859-3)
310            ((lc-ascii lc-ltn4)                          . iso-8859-4)
311 ;;;        ((lc-ascii lc-crl)                           . iso-8859-5)
312            ((lc-ascii lc-crl)                           . koi8-r)
313            ((lc-ascii lc-arb)                           . iso-8859-6)
314            ((lc-ascii lc-grk)                           . iso-8859-7)
315            ((lc-ascii lc-hbw)                           . iso-8859-8)
316            ((lc-ascii lc-ltn5)                          . iso-8859-9)
317            ((lc-ascii lc-roman lc-jpold lc-jp)          . iso-2022-jp)
318            ((lc-ascii lc-kr)                            . euc-kr)
319            ((lc-ascii lc-cn)                            . gb2312)
320            ((lc-ascii lc-big5-1 lc-big5-2)              . big5)
321            ((lc-ascii lc-roman lc-ltn1 lc-grk
322                       lc-jpold lc-cn lc-jp lc-kr
323                       lc-jp2)                           . iso-2022-jp-2)
324            ((lc-ascii lc-roman lc-ltn1 lc-grk
325                       lc-jpold lc-cn lc-jp lc-kr lc-jp2
326                       lc-cns1 lc-cns2)                  . iso-2022-int-1)
327            ((lc-ascii lc-roman
328                       lc-ltn1 lc-ltn2 lc-crl lc-grk
329                       lc-jpold lc-cn lc-jp lc-kr lc-jp2
330                       lc-cns1 lc-cns2 lc-cns3 lc-cns4
331                       lc-cns5 lc-cns6 lc-cns7)          . iso-2022-int-1)
332            ))
333         dest)
334     (while alist
335       (catch 'not-found
336         (let ((pair (car alist)))
337           (setq dest
338                 (append dest
339                         (list
340                          (cons (mapcar (function
341                                         (lambda (cs)
342                                           (if (boundp cs)
343                                               (symbol-value cs)
344                                             (throw 'not-found nil)
345                                             )))
346                                        (car pair))
347                                (cdr pair)))))))
348       (setq alist (cdr alist)))
349     dest))
350
351 (defvar default-mime-charset 'x-ctext
352   "Default value of MIME-charset.
353 It is used when MIME-charset is not specified.
354 It must be symbol.")
355
356 (defun detect-mime-charset-region (start end)
357   "Return MIME charset for region between START and END."
358   (charsets-to-mime-charset
359    (cons lc-ascii (find-charset-region start end))))
360
361
362 ;;; @ buffer representation
363 ;;;
364
365 (defsubst-maybe set-buffer-multibyte (flag)
366   "Set the multibyte flag of the current buffer to FLAG.
367 If FLAG is t, this makes the buffer a multibyte buffer.
368 If FLAG is nil, this makes the buffer a single-byte buffer.
369 The buffer contents remain unchanged as a sequence of bytes
370 but the contents viewed as characters do change.
371 \[Emacs 20.3 emulating function]"
372   (setq mc-flag flag)
373   )
374
375
376 ;;; @ character
377 ;;;
378
379 (defalias 'char-charset 'char-leading-char)
380
381 (defun split-char (character)
382   "Return list of charset and one or two position-codes of CHARACTER."
383   (let ((p (1- (char-bytes character)))
384         dest)
385     (while (>= p 1)
386       (setq dest (cons (- (char-component character p) 128) dest)
387             p (1- p))
388       )
389     (cons (char-charset character) dest)
390     ))
391
392 (defmacro char-next-index (char index)
393   "Return index of character succeeding CHAR whose index is INDEX."
394   (` (+ (, index) (char-bytes (, char)))))
395
396 ;;; @@ obsoleted aliases
397 ;;;
398 ;;; You should not use them.
399
400 (defalias 'char-length 'char-bytes)
401 ;;(defalias 'char-columns 'char-width)
402
403
404 ;;; @ string
405 ;;;
406
407 (defalias 'string-columns 'string-width)
408
409 (defalias 'string-to-int-list 'string-to-char-list)
410
411 (or (fboundp 'truncate-string)
412 ;;; Imported from Mule-2.3
413 (defun truncate-string (str width &optional start-column)
414   "Truncate STR to fit in WIDTH columns.
415 Optional non-nil arg START-COLUMN specifies the starting column.
416 \[emu-mule.el; Mule 2.3 emulating function]"
417   (or start-column
418       (setq start-column 0))
419   (let ((max-width (string-width str))
420         (len (length str))
421         (from 0)
422         (column 0)
423         to-prev to ch)
424     (if (>= width max-width)
425         (setq width max-width))
426     (if (>= start-column width)
427         ""
428       (while (< column start-column)
429         (setq ch (aref str from)
430               column (+ column (char-width ch))
431               from (+ from (char-bytes ch))))
432       (if (< width max-width)
433           (progn
434             (setq to from)
435             (while (<= column width)
436               (setq ch (aref str to)
437                     column (+ column (char-width ch))
438                     to-prev to
439                     to (+ to (char-bytes ch))))
440             (setq to to-prev)))
441       (substring str from to))))
442 ;;;
443   )
444
445 (defalias 'looking-at-as-unibyte 'looking-at)
446
447
448 ;;; @ regulation
449 ;;;
450
451 (defun regulate-latin-char (chr)
452   (cond ((and (<= ?\e$B#A\e(B chr)(<= chr ?\e$B#Z\e(B))
453          (+ (- chr ?\e$B#A\e(B) ?A)
454          )
455         ((and (<= ?\e$B#a\e(B chr)(<= chr ?\e$B#z\e(B))
456          (+ (- chr ?\e$B#a\e(B) ?a)
457          )
458         ((eq chr ?\e$B!%\e(B) ?.)
459         ((eq chr ?\e$B!$\e(B) ?,)
460         (t chr)
461         ))
462
463 (defun regulate-latin-string (str)
464   (let ((len (length str))
465         (i 0)
466         chr (dest ""))
467     (while (< i len)
468       (setq chr (sref str i))
469       (setq dest (concat dest
470                          (char-to-string (regulate-latin-char chr))))
471       (setq i (+ i (char-bytes chr)))
472       )
473     dest))
474
475
476 ;;; @ end
477 ;;;
478
479 (provide 'emu-mule)
480
481 ;;; emu-mule.el ends here