Reformatted.
[chise/xemacs-chise.git.1] / lisp / utf-2000 / maps-conf.el
1 (require 'read-maps)
2
3 (dolist (file '("J90-to-UCS.txt" "JSP-to-UCS.txt"
4                 "JX1-to-UCS.txt" "JX2-to-UCS.txt"
5                 "K0-to-UCS.txt"
6                 "G0-to-UCS.txt"
7                 "C1-to-UCS.txt" "C2-to-UCS.txt"
8                 "C3-to-UCS.txt" "C4-to-UCS.txt"
9                 "C5-to-UCS.txt" "C6-to-UCS.txt"
10                 "C7-to-UCS.txt"
11                 "B-to-UCS.txt" "JC3-to-UCS.txt"))
12   (mapping-table-read-file (expand-file-name file "../etc/char-data/")))
13
14 (ucs-compat-read-file "../etc/char-data/UCS-compat.txt")
15
16 (jp-jouyou-read-file "../etc/char-data/jp-jouyou.txt")
17
18 (let ((ucs #xE000)
19       big5 chr)
20   (while (<= ucs #xF848)
21     (setq chr (decode-char 'ucs ucs))
22     (when (setq big5 (get-char-attribute chr '=big5-pua))
23       (when (setq chr (decode-char '=big5-cdp big5))
24         (unless (get-char-attribute chr '=big5-cdp)
25           (put-char-attribute chr '=big5-cdp big5))))
26     (setq ucs (1+ ucs))))
27
28
29 (defconst gt-pj-1-and-jis-x0208-1990-different-code-points
30       '(#x5C37 #x5C52 #x3521 #x5D62 #x5F4A
31         #x5F5B #x6062 #x4849 #x6173 #x306B
32         #x6328 #x6352 #x6362 #x6471 #x6524
33         #x6530 #x6549 #x6628 #x4356 #x665C
34         #x665D #x6661 #x6660 #x6663 #x4F38
35         #x666B #x4C2E #x6724 #x3D58 #x682B
36         #x427B #x4978 #x694A #x303A #x6A44
37         #x6B43 #x6B78 #x6C2E #x6C57 #x6D36
38         #x6D3A #x3D34 #x4A56 #x3063 #x3D3F
39         #x6E60 #x6F52 #x6F5C #x3458 #x4262
40         #x4E59 #x6F58 #x7051 #x7056 #x375B
41         #x7123 #x712A #x3142 #x3B41 #x7149
42         #x7165 #x7227 #x7233 #x733B #x4E6F
43         #x7366 #x7367 #x7368 #x736C #x5423
44         #x342A #x3476 #x5877 #x592D #x5A61
45         #x3522 #x334C #x657D #x657E #x6621
46         #x335C #x6D7D #x507C #x417C #x5371
47         #x3766 #x3E7D #x555D #x5739 #x5831
48         #x3F78 #x5973 #x5A33 #x5970 #x5A49
49         #x3F22 #x6026 #x4D32 #x612E #x4D63
50         #x4E57 #x316A #x4A43 #x723C #x6A64
51         #x6B36 #x6E43 #x3D36 #x6E44 #x3C60
52         #x6E45 #x6E46 #x6E48 #x6E4B #x6E4A
53         #x6E4F #x6E52 #x6E51 #x4830 #x6E54
54         #x6E55 #x395A #x724D #x737D #x3973
55         #x5379 #x5879 #x3D5D #x3C21 #x4C60
56         #x5267 #x722F #x3C39 #x3848 #x5578
57         #x4742 #x6950 #x697C #x6A24 #x5350
58         #x3326 #x5575 #x5A4B #x3647 #x343F
59         #x4337 #x492D #x3F6C #x6E4D #x4F3F
60         #x353D #x4324 #x475B #x6E47 #x4371
61         #x3F5D #x6E49 #x4D6F #x3C72 #x3D37
62         #x6E4C #x3B44 #x734E #x5567 #x545A
63         #x3071 #x332A #x516A #x476D #x3675
64         #x5734 #x552D #x565A #x564B #x5B79
65         #x5C74 #x5C27 #x5B5E #x3564 #x3823
66         #x6131 #x4A4D #x632E #x635E #x3729
67         #x3951 #x6967 #x704B #x3C38 #x6B26
68         #x4749 #x4428 #x3A47 #x6E4E #x4269
69         #x4043 #x6E56 #x6132 #x5C54 #x3557
70         #x5827 #x4C68 #x505B #x514A #x5D27
71         #x5563 #x5D7A #x4575 #x5F7C #x3B38
72         #x3237 #x3B51 #x596E #x5B5B #x6640
73         #x6D75 #x4D2C #x737B #x7379 #x5E7A
74         #x3E7A #x3865 #x557B #x436B #x413B
75         #x562D #x4C28 #x562F #x5631 #x5632
76         #x5633 #x5635 #x463D #x362E #x3265
77         #x563B #x4A76 #x5638 #x5637 #x3A6A
78         #x5642 #x563D #x5647 #x5641 #x5644
79         #x5648 #x564A #x3A37 #x564F #x4568
80         #x5653 #x5652 #x5654 #x5655 #x5659
81         #x565C #x3474 #x562E #x5630 #x5639
82         #x3D54 #x5645 #x564E #x5651 #x564C
83         #x3460 #x565B #x5628 #x5726 #x5759
84         #x583E #x5833 #x5843 #x584E #x5860
85         #x585D #x4463 #x4C31 #x5351 #x6243
86         #x587A #x5921 #x4879 #x4530 #x4863
87         #x5932 #x3E35 #x4D5E #x5A2D #x4471
88         #x5939 #x3348 #x3969 #x594D #x3044
89         #x594B #x3027 #x3F36 #x405C #x5964
90         #x5962 #x5953 #x5977 #x3B35 #x4531
91         #x5A26 #x5A2B #x5A2F #x5A36 #x5A37
92         #x5A3B #x5A2C #x5A2A #x5A40 #x5A3F
93         #x5A41 #x327E #x384E #x5A43 #x5A47
94         #x5A45 #x4754 #x343A #x3B36 #x4658
95         #x3749 #x3F74 #x4528 #x4030 #x5A4C
96         #x507B #x507E #x5353 #x5A44 #x6E2B
97         #x5B30 #x4C40 #x376E #x6067 #x4E28
98         #x6425))
99
100 (map-char-attribute
101  (lambda (c v)
102    (unless (memq v gt-pj-1-and-jis-x0208-1990-different-code-points)
103      (put-char-attribute (decode-char '=jis-x0208@1990 v)
104                          '=gt-pj-1 v))
105    nil)
106  '=gt-pj-1)
107
108 (let ((default-coded-charset-priority-list
109         '(=gt-pj-1
110           =gt-pj-2
111           =gt-pj-3
112           =gt-pj-4
113           =gt-pj-5
114           =gt-pj-6
115           =gt-pj-7
116           =gt-pj-8
117           =gt-pj-9
118           =gt-pj-10
119           =gt-pj-11
120           =gt-pj-k1
121           =gt-pj-k2))
122       (i 1)
123       chr ret)
124   (while (<= i 12000)
125     (when (and (setq ret (decode-char '=gt-k i))
126                (setq ret (split-char ret))
127                (memq (car ret) default-coded-charset-priority-list))
128       (when (setq chr (apply (function make-char) ret))
129         (put-char-attribute chr '=gt-k i)))
130     (setq i (1+ i))))
131
132 ;; (let (gt ret)
133 ;;   (dolist (ccs '(=gt-pj-1
134 ;;                  =gt-pj-2
135 ;;                  =gt-pj-3
136 ;;                  =gt-pj-4
137 ;;                  =gt-pj-5
138 ;;                  =gt-pj-6
139 ;;                  =gt-pj-7
140 ;;                  =gt-pj-8
141 ;;                  =gt-pj-9
142 ;;                  =gt-pj-10
143 ;;                  =gt-pj-11))
144 ;;     (map-char-attribute
145 ;;      (lambda (c v)
146 ;;        (when (setq gt (encode-char c '=gt))
147 ;;          (put-char-attribute c '=gt gt)
148 ;;          (put-char-attribute (decode-char ccs v) '=gt gt))
149 ;;        nil)
150 ;;      ccs)))
151
152 ;; (let (ret)
153 ;;   (dolist (feature
154 ;;            (let (dest)
155 ;;              (dolist (feature (char-attribute-list))
156 ;;                (when (string-match "\\*sources\\($\\|@[^\\*]+$\\)"
157 ;;                                    (symbol-name feature))
158 ;;                  (setq dest (cons feature dest))))
159 ;;              dest))
160 ;;     (map-char-attribute
161 ;;      (lambda (c v)
162 ;;        (when (setq ret (memq 'shinjigen-1 v))
163 ;;          (setcar ret 'shinjigen@1ed))
164 ;;        (when (setq ret (memq 'shinjigen-2 v))
165 ;;          (setcar ret 'shinjigen@rev))
166 ;;        nil)
167 ;;      feature)))
168
169 ;; (map-char-attribute
170 ;;  (lambda (c v)
171 ;;    (when (eq (encode-char c '=shinjigen@rev) v)
172 ;;      (put-char-attribute c '=shinjigen v)
173 ;;      (remove-char-attribute c '=shinjigen@1ed)
174 ;;      (remove-char-attribute c '=shinjigen@rev)
175 ;;      )
176 ;;    nil)
177 ;;  '=shinjigen@1ed)
178
179 ;; (let (ret)
180 ;;   (dolist (feature
181 ;;            (let (dest)
182 ;;              (dolist (feature (char-attribute-list))
183 ;;                (when (string-match "\\*sources\\($\\|@[^\\*]+$\\)"
184 ;;                                    (symbol-name feature))
185 ;;                  (setq dest (cons feature dest))))
186 ;;              dest))
187 ;;     (map-char-attribute
188 ;;      (lambda (c v)
189 ;;        (cond ((setq ret (memq 'shinjigen@1ed v))
190 ;;               (when (memq 'shinjigen@rev ret)
191 ;;                 (setcar ret 'shinjigen)
192 ;;                 (delq 'shinjigen@rev ret)
193 ;;                 ))
194 ;;              ((setq ret (memq 'shinjigen@rev v))
195 ;;               (when (memq 'shinjigen@1ed ret)
196 ;;                 (setcar ret 'shinjigen)
197 ;;                 (delq 'shinjigen@1ed ret)
198 ;;                 )))
199 ;;        nil)
200 ;;      feature)))
201
202 (dolist (ccs '(=jis-x0208 =jis-x0208@1990))
203   (map-char-attribute
204    (lambda (c v)
205      (unless (eq (encode-char c '=jis-x0213-1@2000) v)
206        (put-char-attribute c '=jis-x0213-1 v))
207      nil)
208    ccs))
209
210 (with-temp-buffer
211   (buffer-disable-undo)
212   (insert-file-contents "../etc/char-data/JX3-JX1-rep-diff.txt")
213   (goto-char (point-min))
214   (let (ku ten char code ucs rep-char)
215     (while (re-search-forward "^1-\\([0-9]+\\)-\\([0-9]+\\)[ \t]+" nil t)
216       (setq ku (string-to-number (match-string 1))
217             ten (string-to-number (match-string 2)))
218       (setq char (make-char '=jis-x0213-1@2000 (+ ku 32)(+ ten 32)))
219       (setq code (encode-char char '=jis-x0213-1@2000))
220       (setq ucs (encode-char char '=ucs@jis/2000))
221       (setq rep-char (decode-char '==jis-x0213-1@2000 code))
222       (cond
223        ((or (eq char rep-char)
224             (null rep-char))
225         (put-char-attribute char '=jis-x0213-1@2000 code)
226         (remove-char-attribute char '=jis-x0213-1)
227         (remove-char-attribute char '=jis-x0213-1@2004)
228         (remove-char-attribute char '=ucs@jis)
229         (remove-char-attribute char '=ucs@jis/2004)
230         (when (setq char (decode-char '=jis-x0213-1@2004 code))
231           (unless (eq (encode-char char '=ucs@jis/2004) ucs)
232             (put-char-attribute char '=ucs@jis/2004 ucs)))
233         )
234        (rep-char
235         (unless (and (= ku 47)(= ten 64))
236           (put-char-attribute rep-char '==jis-x0213-1@2000 code)
237           (remove-char-attribute rep-char '==jis-x0213-1)
238           (remove-char-attribute rep-char '==jis-x0213-1@2004)
239           (setq ucs (or (encode-char rep-char '==ucs@jis/2000)
240                         ucs))
241           (remove-char-attribute rep-char '==ucs@jis)
242           (remove-char-attribute rep-char '==ucs@jis/2004))
243         (when (setq rep-char (decode-char '==jis-x0213-1@2004 code))
244           (unless (eq (encode-char rep-char '==ucs@jis/2004) ucs)
245             (put-char-attribute rep-char '==ucs@jis/2004 ucs)))
246         ))
247       (unless (eq code #x332A)
248         (when (setq char (decode-char '=>jis-x0208@1997 code 'defined-only))
249           (unless (eq (encode-char char '=>>jis-x0208) code)
250             (unless (eq (encode-char char '=+>jis-x0208) code)
251               (put-char-attribute char '=>jis-x0208 code)
252               (remove-char-attribute char '=>jis-x0208@1997)))))
253       )))
254
255 (map-char-attribute
256  (lambda (c v)
257    (unless (eq (encode-char c '=>jis-x0213-1) v)
258      (put-char-attribute c '=>jis-x0213-1 v))
259    nil)
260  '=>jis-x0208)
261
262 (let (dg-chr)
263   (map-char-attribute
264    (lambda (c v)
265      (when (setq dg-chr (decode-char '===jis-x0212 v))
266        (unless (eq c dg-chr)
267          (put-char-attribute dg-chr '===hanyo-denshi/jb v)))
268      nil)
269    '==hanyo-denshi/jb)
270   (map-char-attribute
271    (lambda (c v)
272      (when (setq dg-chr (decode-char '===jis-x0213-1@2000 v))
273        (unless (eq c dg-chr)
274          (put-char-attribute dg-chr '===hanyo-denshi/jc v)))
275      nil)
276    '==hanyo-denshi/jc)
277   (map-char-attribute
278    (lambda (c v)
279      (when (setq dg-chr (decode-char '===jis-x0213-2 v))
280        (unless (eq c dg-chr)
281          (put-char-attribute dg-chr '===hanyo-denshi/jd v)))
282      nil)
283    '==hanyo-denshi/jd)
284   )
285
286 (let (j-chr)
287   (map-char-attribute
288    (lambda (c v)
289      (if (and (setq j-chr (decode-char '=ucs@JP v))
290               (not (eq j-chr c))
291               (null (encode-char c '=ucs)))
292          (put-char-attribute c '=ucs@JP/hanazono nil))
293      nil)
294    '=ucs@unicode)
295   (map-char-attribute
296    (lambda (c v)
297      (if (and (setq j-chr (decode-char '==ucs@JP v))
298               (not (eq j-chr c)))
299          (put-char-attribute c '==ucs@JP/hanazono nil))
300      nil)
301    '==ucs@unicode)
302   )
303
304 (defun glyph-form-feature-to-glyph-image-char-spec (dg-fn
305                                                     code-point
306                                                     &optional
307                                                     rep-gi-fn dg-char)
308   (unless rep-gi-fn
309     (setq rep-gi-fn (intern (format "=%s" dg-fn))))
310   (unless dg-char
311     (setq dg-char (decode-char dg-fn code-point)))
312   (let (code)
313     (when (find-charset rep-gi-fn)
314       (cons (cons rep-gi-fn code-point)
315             (cond
316              ((eq dg-fn '==gt)
317               (if (setq code (encode-char dg-char '==gt-k))
318                   (list (cons '===gt-k code)))
319               )
320              ((eq dg-fn '==hanyo-denshi/jc)
321               (cond ((encode-char dg-char '==jis-x0213-1)
322                      (list (cons '===jis-x0213-1 code-point))
323                      )
324                     ((encode-char dg-char '==jis-x0213-1@2000)
325                      (list (cons '===jis-x0213-1@2000 code-point))
326                      ))
327               )
328              ((eq dg-fn '==hanyo-denshi/jd)
329               (list (cons '===jis-x0213-2 code-point))
330               )
331              ((eq dg-fn '==jis-x0208)
332               (cond ((encode-char dg-char '==jis-x0213-1)
333                      (list (cons '===jis-x0213-1 code-point))
334                      )
335                     ((encode-char dg-char '==jis-x0213-1@2000)
336                      (list (cons '===jis-x0213-1@2000 code-point))
337                      ))
338               )
339              ((eq dg-fn '==ks-x1001)
340               (if (setq code (encode-char dg-char '==ucs@ks))
341                   (list (cons '===ucs@ks code)))
342               ))))))
343
344 (let (dest rep-gi-fn rep-gi spec target-dg-fns)
345   (dolist (fn (char-attribute-list))
346     (when (and (find-charset fn)
347                (string-match "^==[^*=>]+$" (symbol-name fn)))
348       (setq dest (cons fn dest))))
349   (setq dest (sort dest
350                    (lambda (a b)
351                      (string< (symbol-name a)(symbol-name b)))))
352   (dolist (dg-fn dest)
353     (setq rep-gi-fn (intern (format "=%s" dg-fn)))
354     (when (find-charset rep-gi-fn)
355       (map-char-attribute
356        (lambda (c v)
357          (setq rep-gi (decode-char rep-gi-fn v))
358          (unless (or (and (eq dg-fn '==jis-x0208)
359                           (eq (get-char-attribute
360                                (decode-char '===jis-x0208@1990 v)
361                                '===jis-x0208@1990)
362                               v))
363                      (and (eq dg-fn '==jis-x0213-1)
364                           (eq (get-char-attribute
365                                (decode-char '===jis-x0213-1@2000 v)
366                                '===jis-x0213-1@2000)
367                              v))
368                      (and rep-gi
369                           (not (eq c rep-gi))))
370            (if (get-char-attribute c '->subsumptive)
371                (if (setq rep-gi
372                          (define-char
373                            (glyph-form-feature-to-glyph-image-char-spec
374                             dg-fn v rep-gi-fn c)
375                            ;; (list (cons rep-gi-fn v))
376                            ))
377                    (put-char-attribute rep-gi '<-subsumptive (list c)))
378              (setq spec (char-attribute-alist c))
379              (setq target-dg-fns nil)
380              (dolist (fp spec)
381                (unless (memq (car fp)
382                              '(==ks-x1001
383                                ==hanyo-denshi/jb
384                                ==hanyo-denshi/jc ==hanyo-denshi/jd
385                                ==gt-k))
386                  (when (find-charset (intern (format "=%s" (car fp))))
387                    (setq target-dg-fns (cons (car fp) target-dg-fns)))))
388              (when (cdr target-dg-fns)
389                (setq rep-gi
390                      (define-char
391                        (glyph-form-feature-to-glyph-image-char-spec
392                         dg-fn v rep-gi-fn c)))
393                (if rep-gi
394                    (put-char-attribute rep-gi '<-subsumptive (list c))))))
395          nil)
396        dg-fn))))
397
398 (let (chr ucs)
399   (map-char-attribute
400    (lambda (c v)
401      (when (and (setq chr (decode-char '=ks-x1001 v))
402                 (setq ucs (encode-char chr '=ucs@ks)))
403        (put-char-attribute c '===ucs@ks ucs))
404      nil)
405    '===ks-x1001))