tm 7.102.
[elisp/apel.git] / emu-mule.el
index a015cf0..ea8242e 100644 (file)
@@ -1,30 +1,28 @@
-;;;
-;;; emu-mule.el --- Mule 2.* emulation module for Mule
-;;;
-;;; Copyright (C) 1995 Free Software Foundation, Inc.
-;;; Copyright (C) 1994 .. 1996 MORIOKA Tomohiko
-;;;
-;;; Author: MORIOKA Tomohiko <morioka@jaist.ac.jp>
-;;; Version:
-;;;    $Id: emu-mule.el,v 7.21 1996/05/27 14:08:00 morioka Exp $
-;;; Keywords: emulation, compatibility, Mule
-;;;
-;;; This file is part of tl (Tiny Library).
-;;;
-;;; This program is free software; you can redistribute it and/or
-;;; modify it under the terms of the GNU General Public License as
-;;; published by the Free Software Foundation; either version 2, or
-;;; (at your option) any later version.
-;;;
-;;; This program is distributed in the hope that it will be useful,
-;;; but WITHOUT ANY WARRANTY; without even the implied warranty of
-;;; MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
-;;; General Public License for more details.
-;;;
-;;; You should have received a copy of the GNU General Public License
-;;; along with This program.  If not, write to the Free Software
-;;; Foundation, 675 Mass Ave, Cambridge, MA 02139, USA.
-;;;
+;;; emu-mule.el --- emu module for Mule 1.* and Mule 2.*
+
+;; Copyright (C) 1995,1996,1997 MORIOKA Tomohiko
+
+;; Author: MORIOKA Tomohiko <morioka@jaist.ac.jp>
+;; Version: $Id: emu-mule.el,v 7.60 1997/01/29 15:48:26 morioka Exp $
+;; Keywords: emulation, compatibility, Mule
+
+;; This file is part of emu.
+
+;; This program is free software; you can redistribute it and/or
+;; modify it under the terms of the GNU General Public License as
+;; published by the Free Software Foundation; either version 2, or (at
+;; your option) any later version.
+
+;; This program is distributed in the hope that it will be useful, but
+;; WITHOUT ANY WARRANTY; without even the implied warranty of
+;; MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
+;; General Public License for more details.
+
+;; You should have received a copy of the GNU General Public License
+;; along with GNU Emacs; see the file COPYING.  If not, write to the
+;; Free Software Foundation, Inc., 59 Temple Place - Suite 330,
+;; Boston, MA 02111-1307, USA.
+
 ;;; Code:
 
 ;;; @ version specific features
 ;;; @ character set
 ;;;
 
-;; 94 character set
-(defconst charset-ascii          lc-ascii  "ASCII")
-(defconst charset-jisx0201-kana  lc-kana   "JIS X0201 Katakana")
-(defconst charset-jisx0201-latin lc-roman  "JIS X0201 Latin")
-
-;; 96 character set
-(defconst charset-latin-1        lc-ltn1   "ISO-8859-1 (Latin-1)")
-(defconst charset-latin-2        lc-ltn2   "ISO-8859-2 (Latin-2)")
-(defconst charset-latin-3        lc-ltn3   "ISO-8859-3 (Latin-3)")
-(defconst charset-latin-4        lc-ltn4   "ISO-8859-4 (Latin-4)")
-(defconst charset-cyrillic       lc-crl    "ISO-8859-5 (Cyrillic)")
-(defconst charset-arabic         lc-arb    "ISO-8859-6 (Arabic)")
-(defconst charset-greek          lc-grk    "ISO-8859-7 (Greek)")
-(defconst charset-hebrew         lc-hbw    "ISO-8859-8 (Hebrew)")
-(defconst charset-latin-5        lc-ltn5   "ISO-8859-9 (Latin-5)")
-
-;; 94x94 character set
-(defconst charset-jisx0208-1978  lc-jpold  "JIS X0208-1978")
-(defconst charset-gb2312         lc-cn     "GB 2312-1980")
-(defconst charset-jisx0208       lc-jp     "JIS X0208-1983")
-(defconst charset-ksc5601        lc-kr     "KS C5601-1987")
-(defconst charset-jisx0212       lc-jp2    "JIS X0212-1990")
-(defconst charset-cns11643-1     lc-cns1   "CNS 11643-1986 plane 1")
-(defconst charset-cns11643-2     lc-cns2   "CNS 11643-1986 plane 2")
-(defconst charset-cns11643-3     lc-cns3   "CNS 11643-1986 plane 3")
-(defconst charset-cns11643-4     lc-cns4   "CNS 11643-1986 plane 4")
-(defconst charset-cns11643-5     lc-cns5   "CNS 11643-1986 plane 5")
-(defconst charset-cns11643-6     lc-cns6   "CNS 11643-1986 plane 6")
-(defconst charset-cns11643-7     lc-cns7   "CNS 11643-1986 plane 7")
-
-;; Big 5
-(defconst charset-big5-1         lc-big5-1 "Big5 Level 1")
-(defconst charset-big5-2         lc-big5-2 "Big5 Level 2")
-
-(defalias 'charset-description 'char-description)
-(defalias 'charset-registry    'char-registry)
-(defalias 'charset-columns     'char-width)
-(defalias 'charset-direction   'char-direction)
+(defalias 'find-non-ascii-charset-string 'find-charset-string)
+(defalias 'find-non-ascii-charset-region 'find-charset-region)
+
+(defalias 'charset-bytes       'char-bytes)
+(defalias 'charset-description 'char-description)
+(defalias 'charset-registry    'char-registry)
+(defalias 'charset-columns     'char-width)
+(defalias 'charset-direction   'char-direction)
 
 
 ;;; @ coding system
 ;;;
 
-(defun character-encode-string (str coding-system)
-  "Encode the string STR which is encoded in CODING-SYSTEM.
-\[emu-mule.el]"
-  (code-convert-string str *internal* coding-system)
+(defun encode-coding-region (start end coding-system)
+  "Encode the text between START and END to CODING-SYSTEM.
+\[emu-mule.el; EMACS 20 emulating function]"
+  (code-convert-region start end *internal* coding-system)
   )
 
-(defun character-decode-string (str coding-system)
+(defun decode-coding-string (str coding-system)
   "Decode the string STR which is encoded in CODING-SYSTEM.
 \[emu-mule.el]"
-  (code-convert-string str coding-system *internal*)
-  )
+  (let ((len (length str))
+       ret)
+    (while (and
+           (< 0 len)
+           (null
+            (setq ret
+                  (code-convert-string (substring str 0 len)
+                                       coding-system *internal*))
+            ))
+      (setq len (1- len))
+      )
+    (concat ret (substring str len))
+    ))
 
-(defun character-encode-region (start end coding-system)
-  "Encode the text between START and END which is
-encoded in CODING-SYSTEM. [emu-mule.el]"
-  (code-convert start end *internal* coding-system)
-  )
+(defalias 'detect-coding-region 'code-detect-region)
 
-(defun character-decode-region (start end coding-system)
-  "Decode the text between START and END which is
-encoded in CODING-SYSTEM. [emu-mule.el]"
-  (code-convert start end coding-system *internal*)
-  )
+(defalias 'set-buffer-file-coding-system 'set-file-coding-system)
+
+(defmacro as-binary-process (&rest body)
+  (` (let (selective-display   ; Disable ^M to nl translation.
+          ;; Mule
+          mc-flag      
+          (default-process-coding-system (cons *noconv* *noconv*))
+          program-coding-system-alist)
+       (,@ body)
+       )))
+
+(defmacro as-binary-input-file (&rest body)
+  (` (let (mc-flag
+          (file-coding-system-for-read *noconv*)
+          )
+       (,@ body)
+       )))
+
+(defmacro as-binary-output-file (&rest body)
+  (` (let (mc-flag
+          (file-coding-system *noconv*)
+          )
+       (,@ body)
+       )))
+
+(defalias 'set-process-input-coding-system 'set-process-coding-system)
+
+
+;;; @ MIME charset
+;;;
+
+(defvar charsets-mime-charset-alist
+  (list
+   (cons (list lc-ascii)                               'us-ascii)
+   (cons (list lc-ascii lc-ltn1)                       'iso-8859-1)
+   (cons (list lc-ascii lc-ltn2)                       'iso-8859-2)
+   (cons (list lc-ascii lc-ltn3)                       'iso-8859-3)
+   (cons (list lc-ascii lc-ltn4)                       'iso-8859-4)
+;;;(cons (list lc-ascii lc-crl)                                'iso-8859-5)
+   (cons (list lc-ascii lc-crl)                                'koi8-r)
+   (cons (list lc-ascii lc-arb)                                'iso-8859-6)
+   (cons (list lc-ascii lc-grk)                                'iso-8859-7)
+   (cons (list lc-ascii lc-hbw)                                'iso-8859-8)
+   (cons (list lc-ascii lc-ltn5)                       'iso-8859-9)
+   (cons (list lc-ascii lc-roman lc-jpold lc-jp)       'iso-2022-jp)
+   (cons (list lc-ascii lc-kr)                         'euc-kr)
+   (cons (list lc-ascii lc-cn)                         'gb2312)
+   (cons (list lc-ascii lc-big5-1 lc-big5-2)           'big5)
+   (cons (list lc-ascii lc-roman lc-ltn1 lc-grk
+              lc-jpold lc-cn lc-jp lc-kr lc-jp2)       'iso-2022-jp-2)
+   (cons (list lc-ascii lc-roman lc-ltn1 lc-grk
+              lc-jpold lc-cn lc-jp lc-kr lc-jp2
+              lc-cns1 lc-cns2)                         'iso-2022-int-1)
+   (cons (list lc-ascii lc-roman
+              lc-ltn1 lc-ltn2 lc-crl lc-grk
+              lc-jpold lc-cn lc-jp lc-kr lc-jp2
+              lc-cns1 lc-cns2 lc-cns3 lc-cns4
+              lc-cns5 lc-cns6 lc-cns7)                 'iso-2022-int-1)
+   ))
+
+(defvar default-mime-charset 'x-ctext)
+
+(defvar mime-charset-coding-system-alist
+  '((iso-8859-1      . *ctext*)
+    (x-ctext         . *ctext*)
+    (gb2312          . *euc-china*)
+    (koi8-r          . *koi8*)
+    (iso-2022-jp-2   . *iso-2022-ss2-7*)
+    (x-iso-2022-jp-2 . *iso-2022-ss2-7*)
+    (shift_jis       . *sjis*)
+    (x-shiftjis      . *sjis*)
+    ))
+
+(defun mime-charset-to-coding-system (charset &optional lbt)
+  (if (stringp charset)
+      (setq charset (intern (downcase charset)))
+    )
+  (let ((cs
+        (or (cdr (assq charset mime-charset-coding-system-alist))
+            (let ((cs (intern (concat "*" (symbol-name charset) "*"))))
+              (and (coding-system-p cs) cs)
+              ))))
+    (if (or (null lbt)
+           (null cs))
+       cs
+      (intern (concat (symbol-name cs) (symbol-name lbt)))
+      )))
+
+(defun detect-mime-charset-region (start end)
+  "Return MIME charset for region between START and END.
+\[emu-mule.el]"
+  (charsets-to-mime-charset
+   (cons lc-ascii (find-charset-region start end))))
+
+(defun encode-mime-charset-region (start end charset)
+  "Encode the text between START and END as MIME CHARSET.
+\[emu-mule.el]"
+  (let ((cs (mime-charset-to-coding-system charset)))
+    (if cs
+       (code-convert start end *internal* cs)
+      )))
+
+(defun decode-mime-charset-region (start end charset)
+  "Decode the text between START and END as MIME CHARSET.
+\[emu-mule.el]"
+  (let ((cs (mime-charset-to-coding-system charset)))
+    (if cs
+       (code-convert start end cs *internal*)
+      )))
+
+(defun encode-mime-charset-string (string charset)
+  "Encode the STRING as MIME CHARSET. [emu-mule.el]"
+  (let ((cs (mime-charset-to-coding-system charset)))
+    (if cs
+       (code-convert-string string *internal* cs)
+      string)))
+
+(defun decode-mime-charset-string (string charset)
+  "Decode the STRING which is encoded in MIME CHARSET. [emu-mule.el]"
+  (let ((cs (mime-charset-to-coding-system charset)))
+    (if cs
+       (decode-coding-string string cs)
+      string)))
 
 
 ;;; @ character
@@ -133,6 +226,8 @@ encoded in CODING-SYSTEM. [emu-mule.el]"
 
 (defalias 'char-charset 'char-leading-char)
 
+(defalias 'char-length 'char-bytes)
+
 (defalias 'char-columns 'char-width)
 
 
@@ -178,6 +273,34 @@ Optional non-nil arg START-COLUMN specifies the starting column.
   )
 
 
+;;; @ regulation
+;;;
+
+(defun regulate-latin-char (chr)
+  (cond ((and (<= ?\e$B#A\e(B chr)(<= chr ?\e$B#Z\e(B))
+        (+ (- chr ?\e$B#A\e(B) ?A)
+        )
+       ((and (<= ?\e$B#a\e(B chr)(<= chr ?\e$B#z\e(B))
+        (+ (- chr ?\e$B#a\e(B) ?a)
+        )
+       ((eq chr ?\e$B!%\e(B) ?.)
+       ((eq chr ?\e$B!$\e(B) ?,)
+       (t chr)
+       ))
+
+(defun regulate-latin-string (str)
+  (let ((len (length str))
+       (i 0)
+       chr (dest ""))
+    (while (< i len)
+      (setq chr (sref str i))
+      (setq dest (concat dest
+                        (char-to-string (regulate-latin-char chr))))
+      (setq i (+ i (char-bytes chr)))
+      )
+    dest))
+
+
 ;;; @ end
 ;;;