update.
[chise/xemacs-chise.git.1] / src / mule-charset.c
index 14efd20..6e7e49f 100644 (file)
@@ -1,7 +1,7 @@
 /* Functions to handle multilingual characters.
    Copyright (C) 1992, 1995 Free Software Foundation, Inc.
    Copyright (C) 1995 Sun Microsystems, Inc.
-   Copyright (C) 1999,2000,2001,2002,2003 MORIOKA Tomohiko
+   Copyright (C) 1999,2000,2001,2002,2003,2004 MORIOKA Tomohiko
 
 This file is part of XEmacs.
 
@@ -67,6 +67,7 @@ Lisp_Object Vcharset_japanese_jisx0212;
 Lisp_Object Vcharset_chinese_cns11643_1;
 Lisp_Object Vcharset_chinese_cns11643_2;
 #ifdef UTF2000
+Lisp_Object Vcharset_system_char_id;
 Lisp_Object Vcharset_ucs;
 Lisp_Object Vcharset_ucs_bmp;
 Lisp_Object Vcharset_ucs_smp;
@@ -845,6 +846,74 @@ get_unallocated_leading_byte (int dimension)
 
 #define BIG5_SAME_ROW (0xFF - 0xA1 + 0x7F - 0x40)
 
+static int
+decode_ccs_conversion (int conv_type, int code_point)
+{
+  if ( conv_type == CONVERSION_IDENTICAL )
+    {
+      return code_point;
+    }
+  if ( conv_type == CONVERSION_94x60 )
+    {
+      int row = code_point >> 8;
+      int cell = code_point & 255;       
+
+      if (row < 16 + 32)
+       return -1;
+      else if (row < 16 + 32 + 30)
+       return (row - (16 + 32)) * 94 + cell - 33;
+      else if (row < 18 + 32 + 30)
+       return -1;
+      else if (row < 18 + 32 + 60)
+       return (row - (18 + 32)) * 94 + cell - 33;
+    }
+  else if ( conv_type == CONVERSION_94x94x60 )
+    {
+      int plane = code_point >> 16;
+      int row = (code_point >> 8) & 255;
+      int cell = code_point & 255;       
+
+      if (row < 16 + 32)
+       return -1;
+      else if (row < 16 + 32 + 30)
+       return
+         (plane - 33) * 94 * 60
+         + (row - (16 + 32)) * 94
+         + cell - 33;
+      else if (row < 18 + 32 + 30)
+       return -1;
+      else if (row < 18 + 32 + 60)
+       return
+         (plane - 33) * 94 * 60
+         + (row - (18 + 32)) * 94
+         + cell - 33;
+    }
+  else if ( conv_type == CONVERSION_BIG5_1 )
+    {
+      unsigned int I
+       = (((code_point >> 8) & 0x7F) - 33) * 94
+       + (( code_point       & 0x7F) - 33);
+      unsigned char b1 = I / (0xFF - 0xA1 + 0x7F - 0x40) + 0xA1;
+      unsigned char b2 = I % (0xFF - 0xA1 + 0x7F - 0x40);
+
+      b2 += b2 < 0x3F ? 0x40 : 0x62;
+      return (b1 << 8) | b2;
+    }
+  else if ( conv_type == CONVERSION_BIG5_2 )
+    {
+      unsigned int I
+       = (((code_point >> 8) & 0x7F) - 33) * 94
+       + (( code_point       & 0x7F) - 33)
+       + BIG5_SAME_ROW * (0xC9 - 0xA1);
+      unsigned char b1 = I / (0xFF - 0xA1 + 0x7F - 0x40) + 0xA1;
+      unsigned char b2 = I % (0xFF - 0xA1 + 0x7F - 0x40);
+
+      b2 += b2 < 0x3F ? 0x40 : 0x62;
+      return (b1 << 8) | b2;
+    }
+  return -1;
+}
+
 Emchar
 decode_defined_char (Lisp_Object ccs, int code_point, int without_inheritance)
 {
@@ -873,39 +942,18 @@ decode_defined_char (Lisp_Object ccs, int code_point, int without_inheritance)
   else if ( !without_inheritance
            && CHARSETP (mother = XCHARSET_MOTHER (ccs)) )
     {
-      if ( XCHARSET_CONVERSION (ccs) == CONVERSION_IDENTICAL )
+      int code
+       = decode_ccs_conversion (XCHARSET_CONVERSION (ccs), code_point);
+
+      if (code >= 0)
        {
+         code += XCHARSET_CODE_OFFSET(ccs);
          if ( EQ (mother, Vcharset_ucs) )
-           return DECODE_CHAR (mother, code_point, without_inheritance);
+           return DECODE_CHAR (mother, code, without_inheritance);
          else
-           return decode_defined_char (mother, code_point,
+           return decode_defined_char (mother, code,
                                        without_inheritance);
        }
-      else if ( XCHARSET_CONVERSION (ccs) == CONVERSION_BIG5_1 )
-       {
-         unsigned int I
-           = (((code_point >> 8) & 0x7F) - 33) * 94
-           + (( code_point       & 0x7F) - 33);
-         unsigned char b1 = I / (0xFF - 0xA1 + 0x7F - 0x40) + 0xA1;
-         unsigned char b2 = I % (0xFF - 0xA1 + 0x7F - 0x40);
-
-         b2 += b2 < 0x3F ? 0x40 : 0x62;
-         return decode_defined_char (mother, (b1 << 8) | b2,
-                                     without_inheritance);
-       }
-      else if ( XCHARSET_CONVERSION (ccs) == CONVERSION_BIG5_2 )
-       {
-         unsigned int I
-           = (((code_point >> 8) & 0x7F) - 33) * 94
-           + (( code_point       & 0x7F) - 33)
-           + BIG5_SAME_ROW * (0xC9 - 0xA1);
-         unsigned char b1 = I / (0xFF - 0xA1 + 0x7F - 0x40) + 0xA1;
-         unsigned char b2 = I % (0xFF - 0xA1 + 0x7F - 0x40);
-
-         b2 += b2 < 0x3F ? 0x40 : 0x62;
-         return decode_defined_char (mother, (b1 << 8) | b2,
-                                     without_inheritance);
-       }
     }
   return -1;
 }
@@ -920,69 +968,16 @@ decode_builtin_char (Lisp_Object charset, int code_point)
     {
       if ( CHARSETP (mother) )
        {
-         int code = code_point;
+         int code
+           = decode_ccs_conversion (XCHARSET_CONVERSION (charset),
+                                    code_point);
 
-         if ( XCHARSET_CONVERSION (charset) == CONVERSION_94x60 )
-           {
-             int row = code_point >> 8;
-             int cell = code_point & 255;        
-
-             if (row < 16 + 32)
-               return -1;
-             else if (row < 16 + 32 + 30)
-               code = (row - (16 + 32)) * 94 + cell - 33;
-             else if (row < 18 + 32 + 30)
-               return -1;
-             else if (row < 18 + 32 + 60)
-               code = (row - (18 + 32)) * 94 + cell - 33;
-           }
-         else if ( XCHARSET_CONVERSION (charset) == CONVERSION_94x94x60 )
-           {
-             int plane = code_point >> 16;
-             int row = (code_point >> 8) & 255;
-             int cell = code_point & 255;        
-
-             if (row < 16 + 32)
-               return -1;
-             else if (row < 16 + 32 + 30)
-               code
-                 = (plane - 33) * 94 * 60
-                 + (row - (16 + 32)) * 94
-                 + cell - 33;
-             else if (row < 18 + 32 + 30)
-               return -1;
-             else if (row < 18 + 32 + 60)
-               code
-                 = (plane - 33) * 94 * 60
-                 + (row - (18 + 32)) * 94
-                 + cell - 33;
-           }
-         else if ( XCHARSET_CONVERSION (charset) == CONVERSION_BIG5_1 )
-           {
-             unsigned int I
-               = (((code_point >> 8) & 0x7F) - 33) * 94
-               + (( code_point       & 0x7F) - 33);
-             unsigned char b1 = I / (0xFF - 0xA1 + 0x7F - 0x40) + 0xA1;
-             unsigned char b2 = I % (0xFF - 0xA1 + 0x7F - 0x40);
-
-             b2 += b2 < 0x3F ? 0x40 : 0x62;
-             code = (b1 << 8) | b2;
-           }
-         else if ( XCHARSET_CONVERSION (charset) == CONVERSION_BIG5_2 )
-           {
-             unsigned int I
-               = (((code_point >> 8) & 0x7F) - 33) * 94
-               + (( code_point       & 0x7F) - 33)
-               + BIG5_SAME_ROW * (0xC9 - 0xA1);
-             unsigned char b1 = I / (0xFF - 0xA1 + 0x7F - 0x40) + 0xA1;
-             unsigned char b2 = I % (0xFF - 0xA1 + 0x7F - 0x40);
-
-             b2 += b2 < 0x3F ? 0x40 : 0x62;
-             code = (b1 << 8) | b2;
-           }
-         return
-           decode_builtin_char (mother,
-                                code + XCHARSET_CODE_OFFSET(charset));
+         if (code >= 0)
+           return
+             decode_builtin_char (mother,
+                                  code + XCHARSET_CODE_OFFSET(charset));
+         else
+           return -1;
        }
       else
        {
@@ -2772,6 +2767,7 @@ syms_of_mule_charset (void)
   defsymbol (&Qmap_cns11643_1,         "=cns11643-1");
   defsymbol (&Qmap_cns11643_2,         "=cns11643-2");
 #ifdef UTF2000
+  defsymbol (&Qsystem_char_id,         "system-char-id");
   defsymbol (&Qmap_ucs,                        "=ucs");
   defsymbol (&Qucs,                    "ucs");
   defsymbol (&Qucs_bmp,                        "ucs-bmp");
@@ -2857,6 +2853,15 @@ complex_vars_of_mule_charset (void)
      ease of access. */
 
 #ifdef UTF2000
+  staticpro (&Vcharset_system_char_id);
+  Vcharset_system_char_id =
+    make_charset (LEADING_BYTE_SYSTEM_CHAR_ID, Qsystem_char_id, 256, 4,
+                 1, 2, 0, CHARSET_LEFT_TO_RIGHT,
+                 build_string ("SCID"),
+                 build_string ("CHAR-ID"),
+                 build_string ("System char-id"),
+                 build_string (""),
+                 Qnil, 0, 0x7FFFFFFF, 0, 0, Qnil, CONVERSION_IDENTICAL);
   staticpro (&Vcharset_ucs);
   Vcharset_ucs =
     make_charset (LEADING_BYTE_UCS, Qmap_ucs, 256, 4,
@@ -2865,7 +2870,7 @@ complex_vars_of_mule_charset (void)
                  build_string ("UCS"),
                  build_string ("ISO/IEC 10646"),
                  build_string (""),
-                 Qnil, 0, 0x7FFFFFFF, 0, 0, Qnil, CONVERSION_IDENTICAL);
+                 Qnil, 0, 0xEFFFF, 0, 0, Qnil, CONVERSION_IDENTICAL);
   staticpro (&Vcharset_ucs_bmp);
   Vcharset_ucs_bmp =
     make_charset (LEADING_BYTE_UCS_BMP, Qucs_bmp, 256, 2,