tm 7.102.
[elisp/apel.git] / emu-mule.el
index bffee9e..ea8242e 100644 (file)
@@ -1,65 +1,29 @@
-;;;
-;;; emu-mule.el --- Mule 2.* emulation module for Mule
-;;;
-;;; Copyright (C) 1995 Free Software Foundation, Inc.
-;;; Copyright (C) 1994,1995 MORIOKA Tomohiko
-;;;
-;;; Author: MORIOKA Tomohiko <morioka@jaist.ac.jp>
-;;; Version:
-;;;    $Id: emu-mule.el,v 7.11 1996/05/09 16:38:20 morioka Exp $
-;;; Keywords: emulation, compatibility, Mule
-;;;
-;;; This file is part of tl (Tiny Library).
-;;;
-;;; This program is free software; you can redistribute it and/or
-;;; modify it under the terms of the GNU General Public License as
-;;; published by the Free Software Foundation; either version 2, or
-;;; (at your option) any later version.
-;;;
-;;; This program is distributed in the hope that it will be useful,
-;;; but WITHOUT ANY WARRANTY; without even the implied warranty of
-;;; MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
-;;; General Public License for more details.
-;;;
-;;; You should have received a copy of the GNU General Public License
-;;; along with This program.  If not, write to the Free Software
-;;; Foundation, 675 Mass Ave, Cambridge, MA 02139, USA.
-;;;
-;;; Code:
+;;; emu-mule.el --- emu module for Mule 1.* and Mule 2.*
 
-;;; @ character set
-;;;
+;; Copyright (C) 1995,1996,1997 MORIOKA Tomohiko
 
-(defalias 'char-charset 'char-leading-char)
+;; Author: MORIOKA Tomohiko <morioka@jaist.ac.jp>
+;; Version: $Id: emu-mule.el,v 7.60 1997/01/29 15:48:26 morioka Exp $
+;; Keywords: emulation, compatibility, Mule
 
+;; This file is part of emu.
 
-;;; @ coding system
-;;;
+;; This program is free software; you can redistribute it and/or
+;; modify it under the terms of the GNU General Public License as
+;; published by the Free Software Foundation; either version 2, or (at
+;; your option) any later version.
 
-(defun character-encode-string (str coding-system)
-  "Encode the string STR which is encoded in CODING-SYSTEM.
-\[emu-mule.el]"
-  (code-convert-string str *internal* coding-system)
-  )
+;; This program is distributed in the hope that it will be useful, but
+;; WITHOUT ANY WARRANTY; without even the implied warranty of
+;; MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
+;; General Public License for more details.
 
-(defun character-decode-string (str coding-system)
-  "Decode the string STR which is encoded in CODING-SYSTEM.
-\[emu-mule.el]"
-  (code-convert-string str coding-system *internal*)
-  )
-
-(defun character-encode-region (start end coding-system)
-  "Encode the text between START and END which is
-encoded in CODING-SYSTEM. [emu-mule.el]"
-  (code-convert start end *internal* coding-system)
-  )
-
-(defun character-decode-region (start end coding-system)
-  "Decode the text between START and END which is
-encoded in CODING-SYSTEM. [emu-mule.el]"
-  (code-convert start end coding-system *internal*)
-  )
+;; You should have received a copy of the GNU General Public License
+;; along with GNU Emacs; see the file COPYING.  If not, write to the
+;; Free Software Foundation, Inc., 59 Temple Place - Suite 330,
+;; Boston, MA 02111-1307, USA.
 
+;;; Code:
 
 ;;; @ version specific features
 ;;;
@@ -91,9 +55,189 @@ encoded in CODING-SYSTEM. [emu-mule.el]"
        ))
 
 
-;;; @@ truncate-string
+;;; @ character set
+;;;
+
+(defalias 'find-non-ascii-charset-string 'find-charset-string)
+(defalias 'find-non-ascii-charset-region 'find-charset-region)
+
+(defalias 'charset-bytes       'char-bytes)
+(defalias 'charset-description 'char-description)
+(defalias 'charset-registry    'char-registry)
+(defalias 'charset-columns     'char-width)
+(defalias 'charset-direction   'char-direction)
+
+
+;;; @ coding system
+;;;
+
+(defun encode-coding-region (start end coding-system)
+  "Encode the text between START and END to CODING-SYSTEM.
+\[emu-mule.el; EMACS 20 emulating function]"
+  (code-convert-region start end *internal* coding-system)
+  )
+
+(defun decode-coding-string (str coding-system)
+  "Decode the string STR which is encoded in CODING-SYSTEM.
+\[emu-mule.el]"
+  (let ((len (length str))
+       ret)
+    (while (and
+           (< 0 len)
+           (null
+            (setq ret
+                  (code-convert-string (substring str 0 len)
+                                       coding-system *internal*))
+            ))
+      (setq len (1- len))
+      )
+    (concat ret (substring str len))
+    ))
+
+(defalias 'detect-coding-region 'code-detect-region)
+
+(defalias 'set-buffer-file-coding-system 'set-file-coding-system)
+
+(defmacro as-binary-process (&rest body)
+  (` (let (selective-display   ; Disable ^M to nl translation.
+          ;; Mule
+          mc-flag      
+          (default-process-coding-system (cons *noconv* *noconv*))
+          program-coding-system-alist)
+       (,@ body)
+       )))
+
+(defmacro as-binary-input-file (&rest body)
+  (` (let (mc-flag
+          (file-coding-system-for-read *noconv*)
+          )
+       (,@ body)
+       )))
+
+(defmacro as-binary-output-file (&rest body)
+  (` (let (mc-flag
+          (file-coding-system *noconv*)
+          )
+       (,@ body)
+       )))
+
+(defalias 'set-process-input-coding-system 'set-process-coding-system)
+
+
+;;; @ MIME charset
 ;;;
 
+(defvar charsets-mime-charset-alist
+  (list
+   (cons (list lc-ascii)                               'us-ascii)
+   (cons (list lc-ascii lc-ltn1)                       'iso-8859-1)
+   (cons (list lc-ascii lc-ltn2)                       'iso-8859-2)
+   (cons (list lc-ascii lc-ltn3)                       'iso-8859-3)
+   (cons (list lc-ascii lc-ltn4)                       'iso-8859-4)
+;;;(cons (list lc-ascii lc-crl)                                'iso-8859-5)
+   (cons (list lc-ascii lc-crl)                                'koi8-r)
+   (cons (list lc-ascii lc-arb)                                'iso-8859-6)
+   (cons (list lc-ascii lc-grk)                                'iso-8859-7)
+   (cons (list lc-ascii lc-hbw)                                'iso-8859-8)
+   (cons (list lc-ascii lc-ltn5)                       'iso-8859-9)
+   (cons (list lc-ascii lc-roman lc-jpold lc-jp)       'iso-2022-jp)
+   (cons (list lc-ascii lc-kr)                         'euc-kr)
+   (cons (list lc-ascii lc-cn)                         'gb2312)
+   (cons (list lc-ascii lc-big5-1 lc-big5-2)           'big5)
+   (cons (list lc-ascii lc-roman lc-ltn1 lc-grk
+              lc-jpold lc-cn lc-jp lc-kr lc-jp2)       'iso-2022-jp-2)
+   (cons (list lc-ascii lc-roman lc-ltn1 lc-grk
+              lc-jpold lc-cn lc-jp lc-kr lc-jp2
+              lc-cns1 lc-cns2)                         'iso-2022-int-1)
+   (cons (list lc-ascii lc-roman
+              lc-ltn1 lc-ltn2 lc-crl lc-grk
+              lc-jpold lc-cn lc-jp lc-kr lc-jp2
+              lc-cns1 lc-cns2 lc-cns3 lc-cns4
+              lc-cns5 lc-cns6 lc-cns7)                 'iso-2022-int-1)
+   ))
+
+(defvar default-mime-charset 'x-ctext)
+
+(defvar mime-charset-coding-system-alist
+  '((iso-8859-1      . *ctext*)
+    (x-ctext         . *ctext*)
+    (gb2312          . *euc-china*)
+    (koi8-r          . *koi8*)
+    (iso-2022-jp-2   . *iso-2022-ss2-7*)
+    (x-iso-2022-jp-2 . *iso-2022-ss2-7*)
+    (shift_jis       . *sjis*)
+    (x-shiftjis      . *sjis*)
+    ))
+
+(defun mime-charset-to-coding-system (charset &optional lbt)
+  (if (stringp charset)
+      (setq charset (intern (downcase charset)))
+    )
+  (let ((cs
+        (or (cdr (assq charset mime-charset-coding-system-alist))
+            (let ((cs (intern (concat "*" (symbol-name charset) "*"))))
+              (and (coding-system-p cs) cs)
+              ))))
+    (if (or (null lbt)
+           (null cs))
+       cs
+      (intern (concat (symbol-name cs) (symbol-name lbt)))
+      )))
+
+(defun detect-mime-charset-region (start end)
+  "Return MIME charset for region between START and END.
+\[emu-mule.el]"
+  (charsets-to-mime-charset
+   (cons lc-ascii (find-charset-region start end))))
+
+(defun encode-mime-charset-region (start end charset)
+  "Encode the text between START and END as MIME CHARSET.
+\[emu-mule.el]"
+  (let ((cs (mime-charset-to-coding-system charset)))
+    (if cs
+       (code-convert start end *internal* cs)
+      )))
+
+(defun decode-mime-charset-region (start end charset)
+  "Decode the text between START and END as MIME CHARSET.
+\[emu-mule.el]"
+  (let ((cs (mime-charset-to-coding-system charset)))
+    (if cs
+       (code-convert start end cs *internal*)
+      )))
+
+(defun encode-mime-charset-string (string charset)
+  "Encode the STRING as MIME CHARSET. [emu-mule.el]"
+  (let ((cs (mime-charset-to-coding-system charset)))
+    (if cs
+       (code-convert-string string *internal* cs)
+      string)))
+
+(defun decode-mime-charset-string (string charset)
+  "Decode the STRING which is encoded in MIME CHARSET. [emu-mule.el]"
+  (let ((cs (mime-charset-to-coding-system charset)))
+    (if cs
+       (decode-coding-string string cs)
+      string)))
+
+
+;;; @ character
+;;;
+
+(defalias 'char-charset 'char-leading-char)
+
+(defalias 'char-length 'char-bytes)
+
+(defalias 'char-columns 'char-width)
+
+
+;;; @ string
+;;;
+
+(defalias 'string-columns 'string-width)
+
+(defalias 'string-to-int-list 'string-to-char-list)
+
 (or (fboundp 'truncate-string)
 ;;; Imported from Mule-2.3
 (defun truncate-string (str width &optional start-column)
@@ -129,6 +273,34 @@ Optional non-nil arg START-COLUMN specifies the starting column.
   )
 
 
+;;; @ regulation
+;;;
+
+(defun regulate-latin-char (chr)
+  (cond ((and (<= ?\e$B#A\e(B chr)(<= chr ?\e$B#Z\e(B))
+        (+ (- chr ?\e$B#A\e(B) ?A)
+        )
+       ((and (<= ?\e$B#a\e(B chr)(<= chr ?\e$B#z\e(B))
+        (+ (- chr ?\e$B#a\e(B) ?a)
+        )
+       ((eq chr ?\e$B!%\e(B) ?.)
+       ((eq chr ?\e$B!$\e(B) ?,)
+       (t chr)
+       ))
+
+(defun regulate-latin-string (str)
+  (let ((len (length str))
+       (i 0)
+       chr (dest ""))
+    (while (< i len)
+      (setq chr (sref str i))
+      (setq dest (concat dest
+                        (char-to-string (regulate-latin-char chr))))
+      (setq i (+ i (char-bytes chr)))
+      )
+    dest))
+
+
 ;;; @ end
 ;;;