(looking-at-as-unibyte): New alias.
[elisp/apel.git] / emu-mule.el
1 ;;; emu-mule.el --- emu module for Mule 1.* and Mule 2.*
2
3 ;; Copyright (C) 1995,1996,1997,1998 MORIOKA Tomohiko
4
5 ;; Author: MORIOKA Tomohiko <morioka@jaist.ac.jp>
6 ;;         Katsumi Yamaoka <yamaoka@jpl.org>
7 ;; Keywords: emulation, compatibility, Mule
8
9 ;; This file is part of emu.
10
11 ;; This program is free software; you can redistribute it and/or
12 ;; modify it under the terms of the GNU General Public License as
13 ;; published by the Free Software Foundation; either version 2, or (at
14 ;; your option) any later version.
15
16 ;; This program is distributed in the hope that it will be useful, but
17 ;; WITHOUT ANY WARRANTY; without even the implied warranty of
18 ;; MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
19 ;; General Public License for more details.
20
21 ;; You should have received a copy of the GNU General Public License
22 ;; along with GNU Emacs; see the file COPYING.  If not, write to the
23 ;; Free Software Foundation, Inc., 59 Temple Place - Suite 330,
24 ;; Boston, MA 02111-1307, USA.
25
26 ;;; Code:
27
28 ;;; @ version specific features
29 ;;;
30
31 (cond (running-emacs-19
32        (require 'emu-e19)
33        
34        ;; Suggested by SASAKI Osamu <osamu@shuugr.bekkoame.or.jp>
35        ;; (cf. [os2-emacs-ja:78])
36        (defun fontset-pixel-size (fontset)
37          (let* ((font (get-font-info
38                        (aref (cdr (get-fontset-info fontset)) 0)))
39                 (open (aref font 4)))
40            (if (= open 1)
41                (aref font 5)
42              (if (= open 0)
43                  (let ((pat (aref font 1)))
44                    (if (string-match "-[0-9]+-" pat)
45                        (string-to-number
46                         (substring
47                          pat (1+ (match-beginning 0)) (1- (match-end 0))))
48                      0)))
49              )))
50        )
51       (running-emacs-18
52        (require 'emu-18)
53        (defun make-overlay (beg end &optional buffer type))
54        (defun overlay-put (overlay prop value))
55        ))
56
57
58 ;;; @ character set
59 ;;;
60
61 (defalias 'make-char 'make-character)
62
63 (defalias 'find-non-ascii-charset-string 'find-charset-string)
64 (defalias 'find-non-ascii-charset-region 'find-charset-region)
65
66 (defalias 'charset-bytes        'char-bytes)
67 (defalias 'charset-description  'char-description)
68 (defalias 'charset-registry     'char-registry)
69 (defalias 'charset-columns      'char-width)
70 (defalias 'charset-direction    'char-direction)
71
72
73 ;;; @ coding system
74 ;;;
75
76 (defun encode-coding-region (start end coding-system)
77   "Encode the text between START and END to CODING-SYSTEM.
78 \[EMACS 20 emulating function]"
79   (code-convert-region start end *internal* coding-system)
80   )
81
82 (defun decode-coding-region (start end coding-system)
83   "Decode the text between START and END which is encoded in CODING-SYSTEM.
84 \[EMACS 20 emulating function]"
85   (code-convert-region start end coding-system *internal*)
86   )
87
88 (defun encode-coding-string (str coding-system)
89   "Encode the STRING to CODING-SYSTEM.
90 \[EMACS 20 emulating function]"
91   (code-convert-string str *internal* coding-system)
92   )
93
94 (defun decode-coding-string (str coding-system)
95   "Decode the string STR which is encoded in CODING-SYSTEM.
96 \[EMACS 20 emulating function]"
97   (let ((len (length str))
98         ret)
99     (while (and
100             (< 0 len)
101             (null
102              (setq ret
103                    (code-convert-string (substring str 0 len)
104                                         coding-system *internal*))
105              ))
106       (setq len (1- len))
107       )
108     (concat ret (substring str len))
109     ))
110
111 (defalias 'detect-coding-region 'code-detect-region)
112
113 (defalias 'set-buffer-file-coding-system 'set-file-coding-system)
114
115 (defmacro as-binary-process (&rest body)
116   (` (let (selective-display    ; Disable ^M to nl translation.
117            ;; Mule
118            mc-flag      
119            (default-process-coding-system (cons *noconv* *noconv*))
120            program-coding-system-alist)
121        (,@ body)
122        )))
123
124 (defmacro as-binary-input-file (&rest body)
125   (` (let (mc-flag
126            (file-coding-system-for-read *noconv*)
127            )
128        (,@ body)
129        )))
130
131 (defmacro as-binary-output-file (&rest body)
132   (` (let (mc-flag
133            (file-coding-system *noconv*)
134            )
135        (,@ body)
136        )))
137
138 (defalias 'set-process-input-coding-system 'set-process-coding-system)
139
140
141 ;;; @ binary access
142 ;;;
143
144 (defun insert-file-contents-as-binary (filename
145                                        &optional visit beg end replace)
146   "Like `insert-file-contents', q.v., but don't code and format conversion.
147 Like `insert-file-contents-literary', but it allows find-file-hooks,
148 automatic uncompression, etc.
149
150 Namely this function ensures that only format decoding and character
151 code conversion will not take place."
152   (let (mc-flag
153         (file-coding-system *noconv*))
154     (insert-file-contents filename visit beg end replace)
155     ))
156
157 (defalias 'insert-binary-file-contents 'insert-file-contents-as-binary)
158 (make-obsolete 'insert-binary-file-contents 'insert-file-contents-as-binary)
159
160 (defun insert-binary-file-contents-literally (filename
161                                               &optional visit beg end replace)
162   "Like `insert-file-contents-literally', q.v., but don't code conversion.
163 A buffer may be modified in several ways after reading into the buffer due
164 to advanced Emacs features, such as file-name-handlers, format decoding,
165 find-file-hooks, etc.
166   This function ensures that none of these modifications will take place."
167   (let (mc-flag
168         (file-coding-system *noconv*))
169     (insert-file-contents-literally filename visit beg end replace)
170     ))
171
172 (if running-emacs-19_29-or-later
173     ;; for MULE 2.3 based on Emacs 19.34.
174     (defun write-region-as-binary (start end filename
175                                          &optional append visit lockname)
176       "Like `write-region', q.v., but don't code conversion."
177       (let (mc-flag
178             (file-coding-system *noconv*))
179         (write-region start end filename append visit lockname)
180         ))
181   ;; for MULE 2.3 based on Emacs 19.28.
182   (defun write-region-as-binary (start end filename
183                                        &optional append visit lockname)
184     "Like `write-region', q.v., but don't code conversion."
185     (let (mc-flag
186           (file-coding-system *noconv*))
187       (write-region start end filename append visit)
188       ))
189   )
190
191
192 ;;; @ MIME charset
193 ;;;
194
195 (defun encode-mime-charset-region (start end charset)
196   "Encode the text between START and END as MIME CHARSET."
197   (let ((cs (mime-charset-to-coding-system charset)))
198     (if cs
199         (code-convert start end *internal* cs)
200       )))
201
202 (defun decode-mime-charset-region (start end charset)
203   "Decode the text between START and END as MIME CHARSET."
204   (let ((cs (mime-charset-to-coding-system charset)))
205     (if cs
206         (code-convert start end cs *internal*)
207       )))
208
209 (defun encode-mime-charset-string (string charset)
210   "Encode the STRING as MIME CHARSET."
211   (let ((cs (mime-charset-to-coding-system charset)))
212     (if cs
213         (code-convert-string string *internal* cs)
214       string)))
215
216 (defun decode-mime-charset-string (string charset)
217   "Decode the STRING which is encoded in MIME CHARSET."
218   (let ((cs (mime-charset-to-coding-system charset)))
219     (if cs
220         (decode-coding-string string cs)
221       string)))
222
223 (defun write-region-as-mime-charset (charset start end filename)
224   "Like `write-region', q.v., but code-convert by MIME CHARSET."
225   (let ((file-coding-system
226          (or (mime-charset-to-coding-system charset)
227              *noconv*)))
228     (write-region start end filename append visit)
229     ))
230
231
232 ;;; @@ to coding-system
233 ;;;
234
235 (defvar mime-charset-coding-system-alist
236   '((iso-8859-1      . *ctext*)
237     (x-ctext         . *ctext*)
238     (gb2312          . *euc-china*)
239     (koi8-r          . *koi8*)
240     (iso-2022-jp-2   . *iso-2022-ss2-7*)
241     (x-iso-2022-jp-2 . *iso-2022-ss2-7*)
242     (shift_jis       . *sjis*)
243     (x-shiftjis      . *sjis*)
244     ))
245
246 (defun mime-charset-to-coding-system (charset &optional lbt)
247   (if (stringp charset)
248       (setq charset (intern (downcase charset)))
249     )
250   (let ((cs
251          (or (cdr (assq charset mime-charset-coding-system-alist))
252              (let ((cs (intern (concat "*" (symbol-name charset) "*"))))
253                (and (coding-system-p cs) cs)
254                ))))
255     (if (or (null lbt)
256             (null cs))
257         cs
258       (intern (concat (symbol-name cs) (symbol-name lbt)))
259       )))
260
261
262 ;;; @@ detection
263 ;;;
264
265 (defvar charsets-mime-charset-alist
266   (let ((alist
267          '(((lc-ascii)                                  . us-ascii)
268            ((lc-ascii lc-ltn1)                          . iso-8859-1)
269            ((lc-ascii lc-ltn2)                          . iso-8859-2)
270            ((lc-ascii lc-ltn3)                          . iso-8859-3)
271            ((lc-ascii lc-ltn4)                          . iso-8859-4)
272 ;;;        ((lc-ascii lc-crl)                           . iso-8859-5)
273            ((lc-ascii lc-crl)                           . koi8-r)
274            ((lc-ascii lc-arb)                           . iso-8859-6)
275            ((lc-ascii lc-grk)                           . iso-8859-7)
276            ((lc-ascii lc-hbw)                           . iso-8859-8)
277            ((lc-ascii lc-ltn5)                          . iso-8859-9)
278            ((lc-ascii lc-roman lc-jpold lc-jp)          . iso-2022-jp)
279            ((lc-ascii lc-kr)                            . euc-kr)
280            ((lc-ascii lc-cn)                            . gb2312)
281            ((lc-ascii lc-big5-1 lc-big5-2)              . big5)
282            ((lc-ascii lc-roman lc-ltn1 lc-grk
283                       lc-jpold lc-cn lc-jp lc-kr
284                       lc-jp2)                           . iso-2022-jp-2)
285            ((lc-ascii lc-roman lc-ltn1 lc-grk
286                       lc-jpold lc-cn lc-jp lc-kr lc-jp2
287                       lc-cns1 lc-cns2)                  . iso-2022-int-1)
288            ((lc-ascii lc-roman
289                       lc-ltn1 lc-ltn2 lc-crl lc-grk
290                       lc-jpold lc-cn lc-jp lc-kr lc-jp2
291                       lc-cns1 lc-cns2 lc-cns3 lc-cns4
292                       lc-cns5 lc-cns6 lc-cns7)          . iso-2022-int-1)
293            ))
294         dest)
295     (while alist
296       (catch 'not-found
297         (let ((pair (car alist)))
298           (setq dest
299                 (append dest
300                         (list
301                          (cons (mapcar (function
302                                         (lambda (cs)
303                                           (if (boundp cs)
304                                               (symbol-value cs)
305                                             (throw 'not-found nil)
306                                             )))
307                                        (car pair))
308                                (cdr pair)))))))
309       (setq alist (cdr alist)))
310     dest))
311
312 (defvar default-mime-charset 'x-ctext
313   "Default value of MIME-charset.
314 It is used when MIME-charset is not specified.
315 It must be symbol.")
316
317 (defun detect-mime-charset-region (start end)
318   "Return MIME charset for region between START and END."
319   (charsets-to-mime-charset
320    (cons lc-ascii (find-charset-region start end))))
321
322
323 ;;; @ character
324 ;;;
325
326 (defalias 'char-charset 'char-leading-char)
327
328 (defmacro char-next-index (char index)
329   "Return index of character succeeding CHAR whose index is INDEX."
330   (` (+ (, index) (char-bytes (, char)))))
331
332 ;;; @@ obsoleted aliases
333 ;;;
334 ;;; You should not use them.
335
336 (defalias 'char-length 'char-bytes)
337 ;;(defalias 'char-columns 'char-width)
338
339
340 ;;; @ string
341 ;;;
342
343 (defalias 'string-columns 'string-width)
344
345 (defalias 'string-to-int-list 'string-to-char-list)
346
347 (or (fboundp 'truncate-string)
348 ;;; Imported from Mule-2.3
349 (defun truncate-string (str width &optional start-column)
350   "Truncate STR to fit in WIDTH columns.
351 Optional non-nil arg START-COLUMN specifies the starting column.
352 \[emu-mule.el; Mule 2.3 emulating function]"
353   (or start-column
354       (setq start-column 0))
355   (let ((max-width (string-width str))
356         (len (length str))
357         (from 0)
358         (column 0)
359         to-prev to ch)
360     (if (>= width max-width)
361         (setq width max-width))
362     (if (>= start-column width)
363         ""
364       (while (< column start-column)
365         (setq ch (aref str from)
366               column (+ column (char-width ch))
367               from (+ from (char-bytes ch))))
368       (if (< width max-width)
369           (progn
370             (setq to from)
371             (while (<= column width)
372               (setq ch (aref str to)
373                     column (+ column (char-width ch))
374                     to-prev to
375                     to (+ to (char-bytes ch))))
376             (setq to to-prev)))
377       (substring str from to))))
378 ;;;
379   )
380
381 (defalias 'looking-at-as-unibyte 'looking-at)
382
383
384 ;;; @ regulation
385 ;;;
386
387 (defun regulate-latin-char (chr)
388   (cond ((and (<= ?\e$B#A\e(B chr)(<= chr ?\e$B#Z\e(B))
389          (+ (- chr ?\e$B#A\e(B) ?A)
390          )
391         ((and (<= ?\e$B#a\e(B chr)(<= chr ?\e$B#z\e(B))
392          (+ (- chr ?\e$B#a\e(B) ?a)
393          )
394         ((eq chr ?\e$B!%\e(B) ?.)
395         ((eq chr ?\e$B!$\e(B) ?,)
396         (t chr)
397         ))
398
399 (defun regulate-latin-string (str)
400   (let ((len (length str))
401         (i 0)
402         chr (dest ""))
403     (while (< i len)
404       (setq chr (sref str i))
405       (setq dest (concat dest
406                          (char-to-string (regulate-latin-char chr))))
407       (setq i (+ i (char-bytes chr)))
408       )
409     dest))
410
411
412 ;;; @ end
413 ;;;
414
415 (provide 'emu-mule)
416
417 ;;; emu-mule.el ends here