From: eto Date: Tue, 18 Feb 2003 08:09:31 +0000 (+0000) Subject: change IDS text read X-Git-Url: http://git.chise.org/cgi-bin/gitweb.cgi?a=commitdiff_plain;h=d361af9c74ca58512a8be05c2eba48d7c81a11e4;p=chise%2Fruby.git change IDS text read --- diff --git a/src/chise.rb b/src/chise.rb index feed0b6..9a95f91 100755 --- a/src/chise.rb +++ b/src/chise.rb @@ -854,9 +854,10 @@ IDS-CBETA.txt if char != charimg #code表記と文字が一致していない? unless code =~ /^M-/ || code =~ /^MH-/ || code =~ /^CB/ #食い違っていて当然であるので何もしない print "unknown char #{char.inspect} #{code} #{ch} #{ids}\n" - next #それ以外の場合はエラメッセージをだして、次へ。 + next #それ以外の場合はエラーメッセージをだして、次へ。 end end + next if !char.has_attribute? #isolated characterはまぎれこませない。 ids.de_er! #実体参照を解除する next if ids == char.to_s #もし文字とまったく一緒なら、意味が無いので情報を持たない @@ -865,7 +866,6 @@ IDS-CBETA.txt idstree = IDS_Tree.new(ids) c = idstree.check_integrity c = "contains self" if ids.include?(char.to_s) -# c = "no attribute" if !char.has_attribute? #isolated characterはまぎれこませない。 if c #ちょっとでもエラーがある場合は、 char['ids-error'] = c #エラーを記録して、データとしては保持しない next diff --git a/t/tc_ids.rb b/t/tc_ids.rb index a7dc9e1..06e2b7f 100755 --- a/t/tc_ids.rb +++ b/t/tc_ids.rb @@ -172,8 +172,8 @@ class TC_IDS < Test::Unit::TestCase assert_equal("林".ucs, "⿰木木".compose.ucs) end def test_find -# p "日雲".find #"曇" - assert_equal(4, "日雲".find .char_length) #"曇" + p "日雲".find #"曇" + assert(4 <= "日雲".find .char_length) #"曇" end def test_compose_part # p de.compose_ar diff --git a/tools/make_ids_db.rb b/tools/make_ids_db.rb index c1740f2..2508bf2 100755 --- a/tools/make_ids_db.rb +++ b/tools/make_ids_db.rb @@ -10,12 +10,12 @@ include CHISE db = IDS_DB.instance db.make_ids_db #IDS_TEXT_DB.instance.make_ids_error -db.make_ids_reverse -db.dump_ids_duplicated #1分 -db.make_ids_aggregated -#db.dump_ids_aggregated -#db.make_ids_parts -#db.make_ids_contained -#db.make_ids_decomposed #1分 +#db.make_ids_reverse +#db.dump_ids_duplicated #1分 +#db.make_ids_aggregated +#db.dump_ids_aggregated #1分 +#db.make_ids_parts #10分 +#db.make_ids_contained #2分 +#db.make_ids_decomposed #2分 #----------------------------------------------------------------------end.