change IDS text read
authoreto <eto>
Tue, 18 Feb 2003 08:09:31 +0000 (08:09 +0000)
committereto <eto>
Tue, 18 Feb 2003 08:09:31 +0000 (08:09 +0000)
src/chise.rb
t/tc_ids.rb
tools/make_ids_db.rb

index feed0b6..9a95f91 100755 (executable)
@@ -854,9 +854,10 @@ IDS-CBETA.txt
          if char != charimg #code表記と文字が一致していない?
            unless code =~ /^M-/ || code =~ /^MH-/ || code =~ /^CB/ #食い違っていて当然であるので何もしない
              print "unknown char       #{char.inspect} #{code} #{ch}   #{ids}\n"
-             next #それ以外の場合はエラメッセージをだして、次へ。
+             next #それ以外の場合はエラーメッセージをだして、次へ。
            end
          end
+         next if !char.has_attribute? #isolated characterはまぎれこませない。
 
          ids.de_er! #実体参照を解除する
          next if ids == char.to_s #もし文字とまったく一緒なら、意味が無いので情報を持たない
@@ -865,7 +866,6 @@ IDS-CBETA.txt
          idstree = IDS_Tree.new(ids)
          c = idstree.check_integrity
          c = "contains self" if ids.include?(char.to_s)
-#        c = "no attribute"  if !char.has_attribute? #isolated characterはまぎれこませない。
          if c #ちょっとでもエラーがある場合は、
            char['ids-error'] = c #エラーを記録して、データとしては保持しない
            next
index a7dc9e1..06e2b7f 100755 (executable)
@@ -172,8 +172,8 @@ class TC_IDS < Test::Unit::TestCase
     assert_equal("林".ucs, "⿰木木".compose.ucs)
   end
   def test_find
-#    p "日雲".find #"曇"
-    assert_equal(4, "日雲".find .char_length) #"曇"
+    p "日雲".find #"曇"
+    assert(4 <= "日雲".find .char_length) #"曇"
   end
   def test_compose_part
 #    p de.compose_ar
index c1740f2..2508bf2 100755 (executable)
@@ -10,12 +10,12 @@ include CHISE
 db = IDS_DB.instance
 db.make_ids_db
 #IDS_TEXT_DB.instance.make_ids_error
-db.make_ids_reverse
-db.dump_ids_duplicated #1分
-db.make_ids_aggregated
-#db.dump_ids_aggregated
-#db.make_ids_parts
-#db.make_ids_contained
-#db.make_ids_decomposed #1分
+#db.make_ids_reverse
+#db.dump_ids_duplicated #1分
+#db.make_ids_aggregated
+#db.dump_ids_aggregated #1分
+#db.make_ids_parts #10分
+#db.make_ids_contained #2分
+#db.make_ids_decomposed #2分
 
 #----------------------------------------------------------------------end.