update.
[elisp/apel.git] / emu-mule.el
index b3be9e9..63be74e 100644 (file)
@@ -1,37 +1,35 @@
-;;;
-;;; emu-mule.el --- Mule 2.* emulation module for Mule
-;;;
-;;; Copyright (C) 1995 Free Software Foundation, Inc.
-;;; Copyright (C) 1994 .. 1996 MORIOKA Tomohiko
-;;;
-;;; Author: MORIOKA Tomohiko <morioka@jaist.ac.jp>
-;;; Version:
-;;;    $Id: emu-mule.el,v 7.31 1996/07/08 07:46:02 morioka Exp $
-;;; Keywords: emulation, compatibility, Mule
-;;;
-;;; This file is part of tl (Tiny Library).
-;;;
-;;; This program is free software; you can redistribute it and/or
-;;; modify it under the terms of the GNU General Public License as
-;;; published by the Free Software Foundation; either version 2, or
-;;; (at your option) any later version.
-;;;
-;;; This program is distributed in the hope that it will be useful,
-;;; but WITHOUT ANY WARRANTY; without even the implied warranty of
-;;; MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
-;;; General Public License for more details.
-;;;
-;;; You should have received a copy of the GNU General Public License
-;;; along with This program.  If not, write to the Free Software
-;;; Foundation, 675 Mass Ave, Cambridge, MA 02139, USA.
-;;;
+;;; emu-mule.el --- emu module for Mule 1.* and Mule 2.*
+
+;; Copyright (C) 1995,1996,1997,1998 MORIOKA Tomohiko
+
+;; Author: MORIOKA Tomohiko <morioka@jaist.ac.jp>
+;;         Katsumi Yamaoka <yamaoka@jpl.org>
+;; Keywords: emulation, compatibility, Mule
+
+;; This file is part of emu.
+
+;; This program is free software; you can redistribute it and/or
+;; modify it under the terms of the GNU General Public License as
+;; published by the Free Software Foundation; either version 2, or (at
+;; your option) any later version.
+
+;; This program is distributed in the hope that it will be useful, but
+;; WITHOUT ANY WARRANTY; without even the implied warranty of
+;; MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
+;; General Public License for more details.
+
+;; You should have received a copy of the GNU General Public License
+;; along with GNU Emacs; see the file COPYING.  If not, write to the
+;; Free Software Foundation, Inc., 59 Temple Place - Suite 330,
+;; Boston, MA 02111-1307, USA.
+
 ;;; Code:
 
 ;;; @ version specific features
 ;;;
 
 (cond (running-emacs-19
-       (require 'emu-19)
+       (require 'emu-e19)
        
        ;; Suggested by SASAKI Osamu <osamu@shuugr.bekkoame.or.jp>
        ;; (cf. [os2-emacs-ja:78])
        )
       (running-emacs-18
        (require 'emu-18)
-       (defun tl:make-overlay (beg end &optional buffer type))
-       (defun tl:overlay-put (overlay prop value))
+       (defun make-overlay (beg end &optional buffer type))
+       (defun overlay-put (overlay prop value))
        ))
 
 
 ;;; @ character set
 ;;;
 
-;; 94 character set
-(defconst charset-ascii          lc-ascii  "ASCII")
-(defconst charset-jisx0201-kana  lc-kana   "JIS X0201 Katakana")
-(defconst charset-jisx0201-latin lc-roman  "JIS X0201 Latin")
-
-;; 96 character set
-(defconst charset-latin-1        lc-ltn1   "ISO-8859-1 (Latin-1)")
-(defconst charset-latin-2        lc-ltn2   "ISO-8859-2 (Latin-2)")
-(defconst charset-latin-3        lc-ltn3   "ISO-8859-3 (Latin-3)")
-(defconst charset-latin-4        lc-ltn4   "ISO-8859-4 (Latin-4)")
-(defconst charset-cyrillic       lc-crl    "ISO-8859-5 (Cyrillic)")
-(defconst charset-arabic         lc-arb    "ISO-8859-6 (Arabic)")
-(defconst charset-greek          lc-grk    "ISO-8859-7 (Greek)")
-(defconst charset-hebrew         lc-hbw    "ISO-8859-8 (Hebrew)")
-(defconst charset-latin-5        lc-ltn5   "ISO-8859-9 (Latin-5)")
-
-;; 94x94 character set
-(defconst charset-jisx0208-1978  lc-jpold  "JIS X0208-1978")
-(defconst charset-gb2312         lc-cn     "GB 2312-1980")
-(defconst charset-jisx0208       lc-jp     "JIS X0208-1983")
-(defconst charset-ksc5601        lc-kr     "KS C5601-1987")
-(defconst charset-jisx0212       lc-jp2    "JIS X0212-1990")
-(defconst charset-cns11643-1     lc-cns1   "CNS 11643-1986 plane 1")
-(defconst charset-cns11643-2     lc-cns2   "CNS 11643-1986 plane 2")
-(defconst charset-cns11643-3     lc-cns3   "CNS 11643-1986 plane 3")
-(defconst charset-cns11643-4     lc-cns4   "CNS 11643-1986 plane 4")
-(defconst charset-cns11643-5     lc-cns5   "CNS 11643-1986 plane 5")
-(defconst charset-cns11643-6     lc-cns6   "CNS 11643-1986 plane 6")
-(defconst charset-cns11643-7     lc-cns7   "CNS 11643-1986 plane 7")
-
-;; Big 5
-(defconst charset-big5-1         lc-big5-1 "Big5 Level 1")
-(defconst charset-big5-2         lc-big5-2 "Big5 Level 2")
-
-(defalias 'charset-description 'char-description)
-(defalias 'charset-registry    'char-registry)
-(defalias 'charset-columns     'char-width)
-(defalias 'charset-direction   'char-direction)
+(defalias 'make-char 'make-character)
+
+(defalias 'find-non-ascii-charset-string 'find-charset-string)
+(defalias 'find-non-ascii-charset-region 'find-charset-region)
+
+(defalias 'charset-bytes       'char-bytes)
+(defalias 'charset-description 'char-description)
+(defalias 'charset-registry    'char-registry)
+(defalias 'charset-columns     'char-width)
+(defalias 'charset-direction   'char-direction)
 
 
 ;;; @ coding system
 ;;;
 
-(defun character-encode-string (str coding-system)
-  "Encode the string STR which is encoded in CODING-SYSTEM.
-\[emu-mule.el]"
+(defun encode-coding-region (start end coding-system)
+  "Encode the text between START and END to CODING-SYSTEM.
+\[EMACS 20 emulating function]"
+  (code-convert-region start end *internal* coding-system)
+  )
+
+(defun decode-coding-region (start end coding-system)
+  "Decode the text between START and END which is encoded in CODING-SYSTEM.
+\[EMACS 20 emulating function]"
+  (code-convert-region start end coding-system *internal*)
+  )
+
+(defun encode-coding-string (str coding-system)
+  "Encode the STRING to CODING-SYSTEM.
+\[EMACS 20 emulating function]"
   (code-convert-string str *internal* coding-system)
   )
 
-(defun character-decode-string (str coding-system)
+(defun decode-coding-string (str coding-system)
   "Decode the string STR which is encoded in CODING-SYSTEM.
-\[emu-mule.el]"
+\[EMACS 20 emulating function]"
   (let ((len (length str))
        ret)
     (while (and
     (concat ret (substring str len))
     ))
 
-(defun character-encode-region (start end coding-system)
-  "Encode the text between START and END which is
-encoded in CODING-SYSTEM. [emu-mule.el]"
-  (code-convert start end *internal* coding-system)
-  )
+(defalias 'detect-coding-region 'code-detect-region)
 
-(defun character-decode-region (start end coding-system)
-  "Decode the text between START and END which is
-encoded in CODING-SYSTEM. [emu-mule.el]"
-  (code-convert start end coding-system *internal*)
-  )
+(defalias 'set-buffer-file-coding-system 'set-file-coding-system)
 
 (defmacro as-binary-process (&rest body)
   (` (let (selective-display   ; Disable ^M to nl translation.
@@ -147,64 +121,112 @@ encoded in CODING-SYSTEM. [emu-mule.el]"
        (,@ body)
        )))
 
+(defmacro as-binary-input-file (&rest body)
+  (` (let (mc-flag
+          (file-coding-system-for-read *noconv*)
+          )
+       (,@ body)
+       )))
+
+(defmacro as-binary-output-file (&rest body)
+  (` (let (mc-flag
+          (file-coding-system *noconv*)
+          )
+       (,@ body)
+       )))
+
+(defalias 'set-process-input-coding-system 'set-process-coding-system)
+
+
+;;; @ binary access
+;;;
+
+(defun insert-file-contents-as-binary (filename
+                                      &optional visit beg end replace)
+  "Like `insert-file-contents', q.v., but don't code and format conversion.
+Like `insert-file-contents-literary', but it allows find-file-hooks,
+automatic uncompression, etc.
+
+Namely this function ensures that only format decoding and character
+code conversion will not take place."
+  (let (mc-flag
+       (file-coding-system *noconv*))
+    (insert-file-contents filename visit beg end replace)
+    ))
+
+(defalias 'insert-binary-file-contents 'insert-file-contents-as-binary)
+(make-obsolete 'insert-binary-file-contents 'insert-file-contents-as-binary)
+
+(defun insert-binary-file-contents-literally (filename
+                                             &optional visit beg end replace)
+  "Like `insert-file-contents-literally', q.v., but don't code conversion.
+A buffer may be modified in several ways after reading into the buffer due
+to advanced Emacs features, such as file-name-handlers, format decoding,
+find-file-hooks, etc.
+  This function ensures that none of these modifications will take place."
+  (let (mc-flag
+       (file-coding-system *noconv*))
+    (insert-file-contents-literally filename visit beg end replace)
+    ))
+
+(if running-emacs-19_29-or-later
+    ;; for MULE 2.3 based on Emacs 19.34.
+    (defun write-region-as-binary (start end filename
+                                        &optional append visit lockname)
+      "Like `write-region', q.v., but don't code conversion."
+      (let (mc-flag
+           (file-coding-system *noconv*))
+       (write-region start end filename append visit lockname)
+       ))
+  ;; for MULE 2.3 based on Emacs 19.28.
+  (defun write-region-as-binary (start end filename
+                                      &optional append visit lockname)
+    "Like `write-region', q.v., but don't code conversion."
+    (let (mc-flag
+         (file-coding-system *noconv*))
+      (write-region start end filename append visit)
+      ))
+  )
+
 
 ;;; @ MIME charset
 ;;;
 
-(defvar charsets-mime-charset-alist
-  (list
-   (cons (list lc-ascii)                               'us-ascii)
-   (cons (list lc-ascii lc-ltn1)                       'iso-8859-1)
-   (cons (list lc-ascii lc-ltn2)                       'iso-8859-2)
-   (cons (list lc-ascii lc-ltn3)                       'iso-8859-3)
-   (cons (list lc-ascii lc-ltn4)                       'iso-8859-4)
-;;;(cons (list lc-ascii lc-crl)                                'iso-8859-5)
-   (cons (list lc-ascii lc-crl)                                'koi8-r)
-   (cons (list lc-ascii lc-arb)                                'iso-8859-6)
-   (cons (list lc-ascii lc-grk)                                'iso-8859-7)
-   (cons (list lc-ascii lc-hbw)                                'iso-8859-8)
-   (cons (list lc-ascii lc-ltn5)                       'iso-8859-9)
-   (cons (list lc-ascii lc-jp)                         'iso-2022-jp)
-   (cons (list lc-ascii lc-kr)                         'euc-kr)
-   (cons (list lc-ascii lc-big5-1 lc-big5-2)           'big5)
-   (cons (list lc-ascii lc-cn lc-jp lc-kr lc-jp2
-              lc-ltn1 lc-grk)                          'iso-2022-jp-2)
-   (cons (list lc-ascii lc-cn lc-jp lc-kr lc-jp2
-              lc-cns1 lc-cns2 lc-ltn1 lc-grk)          'iso-2022-int-1)
-   ))
-
-(defvar default-mime-charset 'iso-2022-int-1)
-
-(defun charsets-to-mime-charset (charsets)
-  (if charsets
-      (or (catch 'tag
-           (let ((rest charsets-mime-charset-alist)
-                 cell csl)
-             (while (setq cell (car rest))
-               (if (catch 'not-subset
-                     (let ((set1 charsets)
-                           (set2 (car cell))
-                           obj)
-                       (while set1
-                         (setq obj (car set1))
-                         (or (memq obj set2)
-                             (throw 'not-subset nil)
-                             )
-                         (setq set1 (cdr set1))
-                         )
-                       t))
-                   (throw 'tag (cdr cell))
-                 )
-               (setq rest (cdr rest))
-               )))
-         default-mime-charset)))
-
-(defun detect-mime-charset-region (beg end)
-  (charsets-to-mime-charset
-   (cons lc-ascii (find-charset-region beg end))))
+(defun encode-mime-charset-region (start end charset)
+  "Encode the text between START and END as MIME CHARSET."
+  (let ((cs (mime-charset-to-coding-system charset)))
+    (if cs
+       (code-convert start end *internal* cs)
+      )))
+
+(defun decode-mime-charset-region (start end charset)
+  "Decode the text between START and END as MIME CHARSET."
+  (let ((cs (mime-charset-to-coding-system charset)))
+    (if cs
+       (code-convert start end cs *internal*)
+      )))
+
+(defun encode-mime-charset-string (string charset)
+  "Encode the STRING as MIME CHARSET."
+  (let ((cs (mime-charset-to-coding-system charset)))
+    (if cs
+       (code-convert-string string *internal* cs)
+      string)))
+
+(defun decode-mime-charset-string (string charset)
+  "Decode the STRING which is encoded in MIME CHARSET."
+  (let ((cs (mime-charset-to-coding-system charset)))
+    (if cs
+       (decode-coding-string string cs)
+      string)))
+
+
+;;; @@ to coding-system
+;;;
 
 (defvar mime-charset-coding-system-alist
   '((iso-8859-1      . *ctext*)
+    (x-ctext         . *ctext*)
     (gb2312          . *euc-china*)
     (koi8-r          . *koi8*)
     (iso-2022-jp-2   . *iso-2022-ss2-7*)
@@ -213,14 +235,81 @@ encoded in CODING-SYSTEM. [emu-mule.el]"
     (x-shiftjis      . *sjis*)
     ))
 
-(defun mime-charset-to-coding-system (charset)
+(defun mime-charset-to-coding-system (charset &optional lbt)
   (if (stringp charset)
       (setq charset (intern (downcase charset)))
     )
-  (or (cdr (assq charset mime-charset-coding-system-alist))
-      (let ((cs (intern (concat "*" (symbol-name charset) "*"))))
-       (and (coding-system-p cs) cs)
-       )))
+  (let ((cs
+        (or (cdr (assq charset mime-charset-coding-system-alist))
+            (let ((cs (intern (concat "*" (symbol-name charset) "*"))))
+              (and (coding-system-p cs) cs)
+              ))))
+    (if (or (null lbt)
+           (null cs))
+       cs
+      (intern (concat (symbol-name cs) (symbol-name lbt)))
+      )))
+
+
+;;; @@ detection
+;;;
+
+(defvar charsets-mime-charset-alist
+  (let ((alist
+        '(((lc-ascii)                                  . us-ascii)
+          ((lc-ascii lc-ltn1)                          . iso-8859-1)
+          ((lc-ascii lc-ltn2)                          . iso-8859-2)
+          ((lc-ascii lc-ltn3)                          . iso-8859-3)
+          ((lc-ascii lc-ltn4)                          . iso-8859-4)
+;;;       ((lc-ascii lc-crl)                           . iso-8859-5)
+          ((lc-ascii lc-crl)                           . koi8-r)
+          ((lc-ascii lc-arb)                           . iso-8859-6)
+          ((lc-ascii lc-grk)                           . iso-8859-7)
+          ((lc-ascii lc-hbw)                           . iso-8859-8)
+          ((lc-ascii lc-ltn5)                          . iso-8859-9)
+          ((lc-ascii lc-roman lc-jpold lc-jp)          . iso-2022-jp)
+          ((lc-ascii lc-kr)                            . euc-kr)
+          ((lc-ascii lc-cn)                            . gb2312)
+          ((lc-ascii lc-big5-1 lc-big5-2)              . big5)
+          ((lc-ascii lc-roman lc-ltn1 lc-grk
+                     lc-jpold lc-cn lc-jp lc-kr
+                     lc-jp2)                           . iso-2022-jp-2)
+          ((lc-ascii lc-roman lc-ltn1 lc-grk
+                     lc-jpold lc-cn lc-jp lc-kr lc-jp2
+                     lc-cns1 lc-cns2)                  . iso-2022-int-1)
+          ((lc-ascii lc-roman
+                     lc-ltn1 lc-ltn2 lc-crl lc-grk
+                     lc-jpold lc-cn lc-jp lc-kr lc-jp2
+                     lc-cns1 lc-cns2 lc-cns3 lc-cns4
+                     lc-cns5 lc-cns6 lc-cns7)          . iso-2022-int-1)
+          ))
+       dest)
+    (while alist
+      (catch 'not-found
+       (let ((pair (car alist)))
+         (setq dest
+               (append dest
+                       (list
+                        (cons (mapcar (function
+                                       (lambda (cs)
+                                         (if (boundp cs)
+                                             (symbol-value cs)
+                                           (throw 'not-found nil)
+                                           )))
+                                      (car pair))
+                              (cdr pair)))))))
+      (setq alist (cdr alist)))
+    dest))
+
+(defvar default-mime-charset 'x-ctext
+  "Default value of MIME-charset.
+It is used when MIME-charset is not specified.
+It must be symbol.")
+
+(defun detect-mime-charset-region (start end)
+  "Return MIME charset for region between START and END."
+  (charsets-to-mime-charset
+   (cons lc-ascii (find-charset-region start end))))
 
 
 ;;; @ character
@@ -228,9 +317,16 @@ encoded in CODING-SYSTEM. [emu-mule.el]"
 
 (defalias 'char-charset 'char-leading-char)
 
-(defalias 'char-length 'char-bytes)
+(defmacro char-next-index (char index)
+  "Return index of character succeeding CHAR whose index is INDEX."
+  (` (+ (, index) (char-bytes (, char)))))
 
-(defalias 'char-columns 'char-width)
+;;; @@ obsoleted aliases
+;;;
+;;; You should not use them.
+
+(defalias 'char-length 'char-bytes)
+;;(defalias 'char-columns 'char-width)
 
 
 ;;; @ string