update.
[chise/xemacs-chise.git.1] / lisp / utf-2000 / chise-subr.el
1 ;;; chise-subr.el --- basic lisp subroutines for XEmacs CHISE
2
3 ;; Copyright (C) 1999, 2001, 2002, 2003, 2004, 2005, 2007, 2008, 2009,
4 ;;   2010, 2011, 2012, 2013, 2014, 2015 MORIOKA Tomohiko.
5
6 ;; Author: MORIOKA Tomohiko <tomo@kanji.zinbun.kyoto-u.ac.jp>
7 ;; Keywords: CHISE, Character Database, ISO/IEC 10646, UCS, Unicode, MULE.
8
9 ;; This file is part of XEmacs CHISE.
10
11 ;; XEmacs CHISE is free software; you can redistribute it and/or
12 ;; modify it under the terms of the GNU General Public License as
13 ;; published by the Free Software Foundation; either version 2, or (at
14 ;; your option) any later version.
15
16 ;; XEmacs CHISE is distributed in the hope that it will be useful,
17 ;; but WITHOUT ANY WARRANTY; without even the implied warranty of
18 ;; MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
19 ;; General Public License for more details.
20
21 ;; You should have received a copy of the GNU General Public License
22 ;; along with XEmacs CHISE; see the file COPYING.  If not, write to
23 ;; the Free Software Foundation, Inc., 59 Temple Place - Suite 330,
24 ;; Boston, MA 02111-1307, USA.
25
26 ;;; Code:
27
28 (defvar char-db-feature-domains
29   ;; (let (dest str len ret domain)
30   ;;   (dolist (fn (char-attribute-list))
31   ;;     (setq str (symbol-name fn))
32   ;;     (when (string-match "^ideographic-radical@\\([^*]+\\)$" str)
33   ;;       (setq domain (substring str (match-beginning 1)))
34   ;;       (when (> (setq len (length domain)) 0)
35   ;;         (setq ret (read-from-string domain))
36   ;;         (when (= (cdr ret) len)
37   ;;           (setq domain (car ret))
38   ;;           (unless (memq domain dest)
39   ;;             (push domain dest))))))
40   ;;   (sort dest #'string<))
41   '(ucs ucs/compat daikanwa cns gt jis jis/a jis/b
42         jis-x0212 jis-x0213 cdp shinjigen
43         r030 r140 misc unknown))
44
45 (defconst charset-id-=adobe-japan1-0 (charset-id '=adobe-japan1-0))
46 (defconst charset-id-=adobe-japan1-6 (charset-id '=adobe-japan1-6))
47 (defconst charset-id-==adobe-japan1-0 (charset-id '==adobe-japan1-0))
48 (defconst charset-id-==adobe-japan1-6 (charset-id '==adobe-japan1-6))
49 ;; (defconst charset-id-=>>>adobe-japan1-0 (charset-id '=>>>adobe-japan1-0))
50 ;; (defconst charset-id-=>>>adobe-japan1-6 (charset-id '=>>>adobe-japan1-6))
51 (defconst charset-id-=>>adobe-japan1-0 (charset-id '=>>adobe-japan1-0))
52 (defconst charset-id-=>>adobe-japan1-6 (charset-id '=>>adobe-japan1-6))
53
54 (defun charset-id-adobe-japan1-p (id)
55   (or (and (<= charset-id-=adobe-japan1-0 id)
56            (<= id charset-id-=adobe-japan1-6))
57       (and (<= charset-id-==adobe-japan1-0 id)
58            (<= id charset-id-==adobe-japan1-6))
59       ;; (and (<= charset-id-=>>>adobe-japan1-0 id)
60       ;;      (<= id charset-id-=>>>adobe-japan1-6))
61       (and (<= charset-id-=>>adobe-japan1-0 id)
62            (<= id charset-id-=>>adobe-japan1-6))
63       ))
64
65
66 ;;; @ feature name
67 ;;;
68
69 ;;;###autoload
70 (defun expand-char-feature-name (feature domain)
71   (if domain
72       (intern (format "%s@%s" feature domain))
73     feature))
74
75 ;;;###autoload
76 (defun char-attribute-name< (ka kb)
77   "Return t if symbol KA is less than KB in feature-name sorting order."
78   (cond
79    ((and (symbolp ka)
80          (eq (aref (symbol-name ka) 0) ?*))
81     (cond ((and (symbolp kb)
82                 (eq (aref (symbol-name kb) 0) ?*))
83            (string< (symbol-name ka)
84                     (symbol-name kb))
85            ))
86     )
87    ((and (symbolp kb)
88          (eq (aref (symbol-name kb) 0) ?*))
89     t)
90    ((eq '->denotational kb)
91     t)
92    ((eq '->subsumptive kb)
93     (not (eq '->denotational ka)))
94    ((eq '->denotational ka)
95     nil)
96    ((eq '->subsumptive ka)
97     nil)
98    ((and (symbolp ka)
99          (string-match "^->" (symbol-name ka)))
100     (cond ((and (symbolp kb)
101                 (string-match "^->" (symbol-name kb)))
102            (string< (symbol-name ka)
103                     (symbol-name kb))
104            ))
105     )
106    ((and (symbolp kb)
107          (string-match "^->" (symbol-name kb)))
108     t)
109    ((and (symbolp ka)
110          (string-match "^<-" (symbol-name ka)))
111     (cond ((symbolp kb)
112            (cond ((string-match "^<-" (symbol-name kb))
113                   (string< (symbol-name ka)
114                            (symbol-name kb))
115                   )
116                  ;; ((string-match "^->" (symbol-name kb))
117                  ;;  t)
118                  )))
119     )
120    ((and (symbolp kb)
121          (string-match "^<-" (symbol-name kb)))
122     t
123     ;; (not (string-match "^->" (symbol-name ka)))
124     )
125    ((find-charset ka)
126     (if (find-charset kb)
127         (let (a-ir b-ir a-id b-id)
128           (if (setq a-ir (charset-property ka 'iso-ir))
129               (if (setq b-ir (charset-property kb 'iso-ir))
130                   (cond
131                    ((= a-ir b-ir)
132                     (< (charset-id ka)(charset-id kb))
133                     )
134                    ((= a-ir 177)
135                     t)
136                    ((= b-ir 177)
137                     nil)
138                    ((< a-ir
139                        b-ir)
140                     ))
141                 (cond
142                  ((= a-ir 177)
143                   t)
144                  ((eq kb '=mj)
145                   nil)
146                  ((eq kb '==mj)
147                   nil)
148                  ((eq kb '=>>mj)
149                   nil)
150                  ((and (setq b-id (charset-id kb))
151                        (charset-id-adobe-japan1-p b-id))
152                   nil)
153                  (t)))
154             (if (setq b-ir (charset-property kb 'iso-ir))
155                 (cond
156                  ((= b-ir 177)
157                   nil)
158                  ((eq ka '=mj)
159                   t)
160                  ((eq ka '==mj)
161                   t)
162                  ((eq ka '=>>mj)
163                   t)
164                  ((and (setq a-id (charset-id ka))
165                        (charset-id-adobe-japan1-p a-id))
166                   t)
167                  (t nil))
168               (cond
169                ((eq ka '=mj)
170                 t)
171                ((eq ka '==mj)
172                 t)
173                ((eq ka '=>>mj)
174                 t)
175                ((and (setq a-id (charset-id ka))
176                      (charset-id-adobe-japan1-p a-id))
177                 (cond
178                  ((eq kb '=mj)
179                   nil)
180                  ((eq kb '==mj)
181                   nil)
182                  ((eq kb '=>>mj)
183                   nil)
184                  ((and (setq b-id (charset-id kb))
185                        (charset-id-adobe-japan1-p b-id))
186                   (< a-id b-id))
187                  (t))
188                 )
189                ((eq kb '=mj)
190                 nil)
191                ((eq kb '==mj)
192                 nil)
193                ((eq kb '=>>mj)
194                 nil)
195                ((and (setq b-id (charset-id kb))
196                      (charset-id-adobe-japan1-p b-id))
197                 nil)
198                (t
199                 (< (charset-id ka)(charset-id kb))
200                 )))))
201       nil)
202     )
203    ((find-charset kb))
204    ((symbolp ka)
205     (cond ((symbolp kb)
206            (string< (symbol-name ka)
207                     (symbol-name kb)))
208           (t)))
209    ((symbolp kb)
210     nil)))
211
212
213 ;;; @ char feature
214 ;;;
215
216 ;;;###autoload
217 (defun char-ucs (char)
218   "Return code-point of UCS."
219   (or (encode-char char '=ucs 'defined-only)
220       (char-feature char '=ucs)
221       (char-feature char '=>ucs)))
222
223 ;;;###autoload
224 (defun char-id (char)
225   (logand (char-int char) #x3FFFFFFF))
226
227
228 ;;; @ char hierarchy
229 ;;;
230
231 ;;;###autoload
232 (defun map-char-family (function char &optional ignore-sisters)
233   (let ((rest (list char))
234         ret checked)
235     (catch 'tag
236       (while rest
237         (unless (memq (car rest) checked)
238           (if (setq ret (funcall function (car rest)))
239               (throw 'tag ret))
240           (setq checked (cons (car rest) checked)
241                 rest (append rest
242                              (get-char-attribute (car rest) '->subsumptive)
243                              (get-char-attribute (car rest) '->denotational)
244                              (get-char-attribute (car rest) '->identical)))
245           (unless ignore-sisters
246             (setq rest (append rest
247                                (get-char-attribute (car rest) '<-subsumptive)
248                                (get-char-attribute (car rest) '<-denotational)))))
249         (setq rest (cdr rest))))))
250
251
252 ;;;###autoload
253 (defun define-char-before (char-spec next-char)
254   "Define CHAR-SPEC and insert it before NEXT-CHAR." 
255   (let (mother sisters rest)
256     (when (and (or (characterp next-char)
257                    (setq next-char (find-char next-char)))
258                (setq mother (get-char-attribute next-char '<-subsumptive))
259                (setq mother (car mother))
260                (setq sisters (get-char-attribute mother '->subsumptive)))
261       (if (eq (car sisters) next-char)
262           (setq sisters (cons (define-char char-spec) sisters))
263         (setq rest sisters)
264         (while (and (cdr rest)
265                     (not (eq (nth 1 rest) next-char)))
266           (setq rest (cdr rest)))
267         (if (null rest)
268             (setq sisters (cons (define-char char-spec) sisters))
269           (setcdr rest (cons (define-char char-spec) (cdr rest)))))
270       (put-char-attribute mother '->subsumptive sisters))))
271
272 ;;;###autoload
273 (defun define-char-after (prev-char char-spec)
274   "Define CHAR-SPEC and insert it after PREV-CHAR." 
275   (let (mother sisters rest)
276     (when (and (or (characterp prev-char)
277                    (setq prev-char (find-char prev-char)))
278                (setq mother (get-char-attribute prev-char '<-subsumptive))
279                (setq mother (car mother))
280                (setq sisters (get-char-attribute mother '->subsumptive)))
281       (setq rest sisters)
282       (while (and rest
283                   (not (eq (car rest) prev-char)))
284         (setq rest (cdr rest)))
285       (if (null rest)
286           (setq sisters (cons (define-char char-spec) sisters))
287         (setcdr rest (cons (define-char char-spec) (cdr rest))))
288       (put-char-attribute mother '->subsumptive sisters))))
289
290
291 ;;; @ string
292 ;;;
293
294 ;;;###autoload
295 (defun chise-string< (string1 string2 accessors)
296   (let ((len1 (length string1))
297         (len2 (length string2))
298         len
299         (i 0)
300         c1 c2
301         rest func
302         v1 v2)
303     (setq len (min len1 len2))
304     (catch 'tag
305       (while (< i len)
306         (setq c1 (aref string1 i)
307               c2 (aref string2 i))
308         (setq rest accessors)
309         (while (and rest
310                     (setq func (car rest))
311                     (setq v1 (funcall func c1)
312                           v2 (funcall func c2))
313                     (eq v1 v2))
314           (setq rest (cdr rest)))
315         (if v1
316             (if v2
317                 (cond ((< v1 v2)
318                        (throw 'tag t))
319                       ((> v1 v2)
320                        (throw 'tag nil)))
321               (throw 'tag nil))
322           (if v2
323               (throw 'tag t)))
324         (setq i (1+ i)))
325       (< len1 len2))))
326
327
328 ;;; @ end
329 ;;;
330
331 (provide 'chise-subr)
332
333 ;;; chise-subr.el ends here