Sync up with r21-4-10-utf-2000-0_20-=big5-cdp.
[chise/xemacs-chise.git] / lisp / utf-2000 / char-db-util.el
index 202670a..7534977 100644 (file)
@@ -1,6 +1,6 @@
 ;;; char-db-util.el --- Character Database utility
 
-;; Copyright (C) 1998,1999,2000,2001,2002 MORIOKA Tomohiko.
+;; Copyright (C) 1998,1999,2000,2001,2002,2003 MORIOKA Tomohiko.
 
 ;; Author: MORIOKA Tomohiko <tomo@kanji.zinbun.kyoto-u.ac.jp>
 ;; Keywords: UTF-2000, ISO/IEC 10646, Unicode, UCS-4, MULE.
   (let ((v (make-vector 215 nil))
        (i 1))
     (while (< i 215)
-      (aset v i (int-char (+ #x2EFF i)))
+      (aset v i (decode-char 'ucs (+ #x2EFF i)))
       (setq i (1+ i)))
-    (unless (charset-iso-final-char (car (split-char (aref v 34))))
-      (aset v 34 (make-char 'chinese-gb2312 #x62 #x3A)))
     v))
 
 (defvar char-db-ignored-attributes nil)
                       arabic-1-column
                       arabic-2-column)))
              ((string-match "^mojikyo-" (symbol-name (car rest))))
+             ((string-match "^ideograph-cbeta" (symbol-name (car rest))))
+             ((string-match "^china3-jef" (symbol-name (car rest))))
              ((string-match "^chinese-big5" (symbol-name (car rest))))
              ((string-match "^ideograph-gt-pj-" (symbol-name (car rest)))
               (unless (memq 'ideograph-gt dest)
               (setq dest (cons (car rest) dest)))))
       (setq rest (cdr rest)))
     (append (sort dest #'char-attribute-name<)
-           '(chinese-big5-cdp chinese-big5-eten chinese-big5))))
+           '(chinese-big5-cdp ideograph-cbeta china3-jef
+                              chinese-big5-eten chinese-big5))))
 
-(defun char-db-insert-char-spec (char &optional readable column)
-  (unless column
-    (setq column (current-column)))
-  (let (char-spec ret al cal key temp-char)
+(defun char-db-make-char-spec (char)
+  (let (ret char-spec)
     (cond ((characterp char)
           (cond ((and (setq ret (get-char-attribute char 'ucs))
                       (not (and (<= #xE000 ret)(<= ret #xF8FF))))
                  (setq char-spec (list (cons 'ucs ret)))
-                 (if (setq ret (get-char-attribute char 'name))
-                     (setq char-spec (cons (cons 'name ret) char-spec)))
+                 (cond ((setq ret (get-char-attribute char 'name))
+                        (setq char-spec (cons (cons 'name ret) char-spec))
+                        )
+                       ((setq ret (get-char-attribute char 'name*))
+                        (setq char-spec (cons (cons 'name* ret) char-spec))
+                        ))
                  )
                 ((setq ret
-                       (let ((default-coded-charset-priority-list
-                               char-db-coded-charset-priority-list))
-                         (split-char char)))
+                       (catch 'tag
+                         (let ((rest char-db-coded-charset-priority-list))
+                           (while rest
+                             (if (setq ret
+                                       (get-char-attribute char (car rest)))
+                                 (throw 'tag (cons (car rest) ret)))
+                             (setq rest (cdr rest))))))
                  (setq char-spec (list ret))
                  (dolist (ccs (delq (car ret) (charset-list)))
                    (if (or (and (charset-iso-final-char ccs)
                        (setq char-spec (cons (cons ccs ret) char-spec))))
                  (if (null char-spec)
                      (setq char-spec (split-char char)))
-                 (if (setq ret (get-char-attribute char 'name))
-                     (setq char-spec (cons (cons 'name ret) char-spec)))
-                 )))
+                 (cond ((setq ret (get-char-attribute char 'name))
+                        (setq char-spec (cons (cons 'name ret) char-spec))
+                        )
+                       ((setq ret (get-char-attribute char 'name*))
+                        (setq char-spec (cons (cons 'name* ret) char-spec))
+                        ))
+                 ))
+          char-spec)
          ((consp char)
-          (setq char-spec char)
-          (setq char nil)))
-    (unless (or char
+          char))))
+    
+(defun char-db-insert-char-spec (char &optional readable column)
+  (unless column
+    (setq column (current-column)))
+  (let (char-spec ret al cal key temp-char)
+    (setq char-spec (char-db-make-char-spec char))
+    (unless (or (characterp char) ; char
                (condition-case nil
                    (setq char (find-char char-spec))
                  (error nil)))
       (setq key (car (car char-spec)))
       (unless (memq key char-db-ignored-attributes)
        (if (find-charset key)
-           (setq cal (cons key cal))
+           (if (get-char-attribute char key)
+               (setq cal (cons key cal)))
          (setq al (cons key al))))
       (setq char-spec (cdr char-spec)))
+    (unless cal
+      (setq char-spec (char-db-make-char-spec char))
+      (while char-spec
+       (setq key (car (car char-spec)))
+       (unless (memq key char-db-ignored-attributes)
+         (if (find-charset key)
+             (setq cal (cons key cal))
+           (setq al (cons key al))))
+       (setq char-spec (cdr char-spec)))
+      )
     (unless (or cal
                (memq 'ideographic-structure al))
       (push 'ideographic-structure al))
               value line-breaking))
       (setq attributes (delq 'name attributes))
       )
+    (when (and (memq 'name* attributes)
+              (setq value (get-char-attribute char 'name*)))
+      (insert (format
+              (if (> (+ (current-column) (length value)) 48)
+                  "(name* . %S)%s"
+                "(name*              . %S)%s")
+              value line-breaking))
+      (setq attributes (delq 'name* attributes))
+      )
     (when (and (memq 'script attributes)
               (setq value (get-char-attribute char 'script)))
       (insert (format "(script\t\t%s)%s"
                      line-breaking))
       (setq attributes (delq '=>ucs* attributes))
       )
+    (when (and (memq '=>ucs-gb attributes)
+              (setq value (get-char-attribute char '=>ucs-gb)))
+      (insert (format "(=>ucs-gb\t\t. #x%04X)\t; %c%s"
+                     value (decode-char 'ucs value)
+                     line-breaking))
+      (setq attributes (delq '=>ucs-gb attributes))
+      )
+    (when (and (memq '=>ucs-cns attributes)
+              (setq value (get-char-attribute char '=>ucs-cns)))
+      (insert (format "(=>ucs-cns\t\t. #x%04X)\t; %c%s"
+                     value (decode-char 'ucs-cns value)
+                     line-breaking))
+      (setq attributes (delq '=>ucs-cns attributes))
+      )
     (when (and (memq '=>ucs-jis attributes)
               (setq value (get-char-attribute char '=>ucs-jis)))
       (insert (format "(=>ucs-jis\t\t. #x%04X)\t; %c%s"
-                     value (decode-char 'ucs value)
+                     value (decode-char 'ucs-jis value)
                      line-breaking))
       (setq attributes (delq '=>ucs-jis attributes))
       )
+    (when (and (memq '=>ucs-ks attributes)
+              (setq value (get-char-attribute char '=>ucs-ks)))
+      (insert (format "(=>ucs-ks\t\t. #x%04X)\t; %c%s"
+                     value (decode-char 'ucs-ks value)
+                     line-breaking))
+      (setq attributes (delq '=>ucs-ks attributes))
+      )
     (when (and (memq '->ucs attributes)
               (setq value (get-char-attribute char '->ucs)))
       (insert (format (if char-db-convert-obsolete-format
                      line-breaking))
       (setq attributes (delq 'morohashi-daikanwa attributes))
       )
-    ;; (when (and (memq 'hanyu-dazidian attributes)
-    ;;            (setq value (get-char-attribute char 'hanyu-dazidian)))
-    ;;   (insert (format "(hanyu-dazidian     %s)%s"
-    ;;                   (mapconcat #'number-to-string value " ")
-    ;;                   line-breaking))
-    ;;   (setq attributes (delq 'hanyu-dazidian attributes))
-    ;;   )
     (setq radical nil
          strokes nil)
     (when (and (memq 'ideographic-radical attributes)
            (cond ((memq name '(ideograph-daikanwa-2
                                ideograph-daikanwa
                                ideograph-gt
+                               ideograph-gt-k
                                ideograph-cbeta))
                   (if has-long-ccs-name
                       "(%-26s . %05d)\t; %c%s"
                   (if has-long-ccs-name
                       "(%-26s . %06d)\t; %c%s"
                     "(%-18s . %06d)\t; %c%s"))
-                 ((eq name 'ucs)
+                 ((>= (charset-dimension name) 2)
                   (if has-long-ccs-name
                       "(%-26s . #x%04X)\t; %c%s"
                     "(%-18s . #x%04X)\t; %c%s"))
     (tabify (point-min)(point-max))
     ))
 
-;;;###autoload
-(defun char-db-update-comment ()
-  (interactive)
-  (save-excursion
-    (goto-char (point-min))
-    (let (cdef table char)
-      (while (re-search-forward "^[ \t]*\\(([^.()]+)\\)" nil t)
-       (goto-char (match-beginning 1))
-       (setq cdef (read (current-buffer)))
-       (when (find-charset (car cdef))
-         (goto-char (match-end 0))
-         (setq char
-               (if (and
-                    (not (eq (car cdef) 'ideograph-daikanwa))
-                    (or (memq (car cdef) '(ascii latin-viscii-upper
-                                                 latin-viscii-lower
-                                                 arabic-iso8859-6
-                                                 japanese-jisx0213-1
-                                                 japanese-jisx0213-2))
-                        (= (char-int (charset-iso-final-char (car cdef)))
-                           0)))
-                   (apply (function make-char) cdef)
-                 (if (setq table (charset-mapping-table (car cdef)))
-                     (set-charset-mapping-table (car cdef) nil))
-                 (prog1
-                     (apply (function make-char) cdef)
-                   (if table
-                       (set-charset-mapping-table (car cdef) table)))))
-         (when (not (or (< (char-int char) 32)
-                        (and (<= 128 (char-int char))
-                             (< (char-int char) 160))))
-           (delete-region (point) (point-at-eol))
-           (insert (format "\t; %c" char)))
-         )))))
-
 (defun insert-char-data-with-variant (char &optional printable
                                           no-ucs-variant
                                           script excluded-script)