From: handa Date: Mon, 5 Sep 2005 06:10:58 +0000 (+0000) Subject: *** empty log message *** X-Git-Url: http://git.chise.org/cgi-bin/gitweb.cgi?a=commitdiff_plain;h=4a2dfcb0386c6a89e00a5c9111698c238ad6453c;p=m17n%2Fm17n-test.git *** empty log message *** --- diff --git a/LBRK--ai-as-id.dst b/LBRK--ai-as-id.dst new file mode 100644 index 0000000..930bc2f --- /dev/null +++ b/LBRK--ai-as-id.dst @@ -0,0 +1,1278 @@ +testpattern |for |lb7|(CM) |is |realized |as |duplications |in |all |other |rules.| + +lb3a: |a
| +lb3a: |à
| + +lb3b: |b | + |c |d| + |e…| +lb3b: |b̀ | + |c̀ |d̀| + |è…| + +lb3c: |f
|g |h| + |i…| +lb3c: |f̀
|g̀ |h̀| + |ì…| + +lb4 |ab |cd​ | +lb4 |àb̀ |c̀d̀​ | + +lb5 |cd​|ef| +lb5 |c̀d̀​|èf̀| + +lb8: |a]|b ]|c! |d !|e;f …|;g/|g /| +lb8: |à]̀|b̀ ]̀|c̀!̀ |d̀ !̀|è;̀f̀ …|;̀g̀/̀|g̀ /̀| + +lb9: |[ a|[ [| +lb9: |[̀ à|[̀ [̀| +lb9: |[ …|a…|[ [| + +lb10: |"[bc |" [de| +lb10: |"̀[̀b̀c̀ |"̀ [̀d̀è| +lb10: |"[bc |"…|""[de| + +lb11: |f]‼ |g] ‼| +lb11: |f̀]̀‼̀ |g̀]̀ ‼̀| +lb11: |f]‼… |g…|…|…|…|] ‼| + +lb11a: |h|——|i |j|— —|k| +lb11a: |h̀|—̀—̀|ì |j̀|—̀ —̀|k̀| +lb11a: |h|—…|—|i |j|— —|k| + +lb11b: |l⁠m| +lb11b: |l̀⁠̀m̀| +lb11b: |l⁠…|m| + +lb12 |sp |ace| +lb12 |sp̀ |àce| + +lb13: |a b| +lb13: |à ̀b̀| + +lb14: |a"b"c | +lb14: |à"̀b̀"̀c̀ | + +lb14a: |a||b| +lb14a: |à|̀|b̀| + +lb15: |a।| + |b-| + |c‼| + |´d| + +lb15: |à।̀| + |b̀-̀| + |c̀‼̀| + |´̀d̀| + +lb16: |A…| + |あ…| + |……| + |0…| + +lb16: |À…̀| + |あ̀…̀| + |…̀…̀| + |0̀…̀| + +lb17: |あ%| + |A0| + |0A| + +lb17: |あ̀%̀| + |À0̀| + |0̀À| + +lb18: )% | + |-0 | + |.0 | + |00 | + |0% | + |$a | + |$- | + |$あ | + |$0 | + |$( | + |/0 | + +lb18: )̀%̀| + |-̀0̀| + |.̀0̀| + |0̀0̀| + |0̀%̀| + |$̀à| + |$̀-̀| + |$̀あ̀| + |$̀0̀| + |$̀(̀| + |/̀0̀| + +lb18b: |ᄀᄀ| + |가| + |ᄀ가| + |ᄀ각| + + |ᅡᅡ| + |ᅡᆨ| + |가ᅡ| + |각| + + |ᆨᆨ| + |각ᆨ| + +lb18b: |ᄀ̀ᄀ̀| + |ᄀ̀ᅡ̀| + |ᄀ̀가̀| + |ᄀ̀각̀| + + |ᅡ̀ᅡ̀| + |ᅡ̀ᆨ̀| + |가̀ᅡ̀| + |가̀ᆨ̀| + + |ᆨ̀ᆨ̀| + |각̀ᆨ̀| + +lb18c |각…| + |각|%| + |$각| + +lb18c |각̀…̀| + |각̀|%̀| + |$̀각̀| + +lb19 |aa| + +lb19 |àà| + +lb19b .a| +lb19b .̀à*********************************| +character |pairs |with |space| +*********************************| +OP=================================================| +( (| +( )| +( "| +(  | +( ‼| +( ! | +( /| +( .| +( $| +( %| +( 0| +( A| +( あ| +( …| +( -| +( ।| +( ´| +( —| +( ​| +( ̀| +( ⁠| + +CL=================================================| +) |(| +) )| +) |"| +) | | +) ‼| +) !| +) /| +) .| +) |$| +) |%| +) |0| +) |A| +) |あ| +) |…| +) |-| +) |।| +) |´| +) |—| +) ​| +) |̀| +) ⁠| + +QU=================================================| +" (| +" )| +" |"| +" | | +" |‼| +" !| +" /| +" .| +" |$| +" |%| +" |0| +" |A| +" |あ| +" |…| +" |-| +" |।| +" |´| +" |—| +" ​| +" |̀| +" ⁠| + +GL=================================================| +  |(| +  )| +  |"| +  | | +  |‼| +  !| +  /| +  .| +  |$| +  |%| +  |0| +  |A| +  |あ| +  |…| +  |-| +  |।| +  |´| +  |—| +  ​| +  |̀| +  ⁠| + +NS=================================================| +‼ |(| +‼ )| +‼ |"| +‼ | | +‼ |‼| +‼ !| +‼ /| +‼ .| +‼ |$| +‼ |%| +‼ |0| +‼ |A| +‼ |あ| +‼ |…| +‼ |-| +‼ |।| +‼ |´| +‼ |—| +‼ ​| +‼ |̀| +‼ ⁠| + +EX=================================================| +! |(| +! )| +! |"| +! | | +! |‼| +! !| +! /| +! .| +! |$| +! |%| +! |0| +! |A| +! |あ| +! |…| +! |-| +! |।| +! |´| +! |—| +! ​| +! |̀| +! ⁠| + +SY=================================================| +/ |(| +/ )| +/ |"| +/ | | +/ |‼| +/ !| +/ /| +/ .| +/ |$| +/ |%| +/ |0| +/ |A| +/ |あ| +/ |…| +/ |-| +/ |।| +/ |´| +/ |—| +/ ​| +/ |̀| +/ ⁠| + +IS=================================================| +. |(| +. )| +. |"| +. | | +. |‼| +. !| +. /| +. .| +. |$| +. |%| +. |0| +. |A| +. |あ| +. |…| +. |-| +. |।| +. |´| +. |—| +. ​| +. |̀| +. ⁠| + +PR=================================================| +$ |(| +$ )| +$ |"| +$ | | +$ |‼| +$ !| +$ /| +$ .| +$ |$| +$ |%| +$ |0| +$ |A| +$ |あ| +$ |…| +$ |-| +$ |।| +$ |´| +$ |—| +$ ​| +$ |̀| +$ ⁠| + +PO=================================================| +% |(| +% )| +% |"| +% | | +% |‼| +% !| +% /| +% .| +% |$| +% |%| +% |0| +% |A| +% |あ| +% |…| +% |-| +% |।| +% |´| +% |—| +% ​| +% |̀| +% ⁠| + +NU=================================================| +0 |(| +0 )| +0 |"| +0 | | +0 |‼| +0 !| +0 /| +0 .| +0 |$| +0 |%| +0 |0| +0 |A| +0 |あ| +0 |…| +0 |-| +0 |।| +0 |´| +0 |—| +0 ​| +0 |̀| +0 ⁠| + +AL=================================================| +A |(| +A )| +A |"| +A | | +A |‼| +A !| +A /| +A .| +A |$| +A |%| +A |0| +A |A| +A |あ| +A |…| +A |-| +A |।| +A |´| +A |—| +A ​| +A |̀| +A ⁠| + +ID=================================================| +あ |(| +あ )| +あ |"| +あ | | +あ |‼| +あ !| +あ /| +あ .| +あ |$| +あ |%| +あ |0| +あ |A| +あ |あ| +あ |…| +あ |-| +あ |।| +あ |´| +あ |—| +あ ​| +あ |̀| +あ ⁠| + +IN=================================================| +… |(| +… )| +… |"| +… | | +… |‼| +… !| +… /| +… .| +… |$| +… |%| +… |0| +… |A| +… |あ| +… |…| +… |-| +… |।| +… |´| +… |—| +… ​| +… |̀| +… ⁠| + +HY=================================================| +- |(| +- )| +- |"| +- | | +- |‼| +- !| +- /| +- .| +- |$| +- |%| +- |0| +- |A| +- |あ| +- |…| +- |-| +- |।| +- |´| +- |—| +- ​| +- |̀| +- ⁠| + +BA=================================================| +। |(| +। )| +। |"| +। | | +। |‼| +। !| +। /| +। .| +। |$| +। |%| +। |0| +। |A| +। |あ| +। |…| +। |-| +। |।| +। |´| +। |—| +। ​| +। |̀| +। ⁠| + +BB=================================================| +´ |(| +´ )| +´ |"| +´ | | +´ |‼| +´ !| +´ /| +´ .| +´ |$| +´ |%| +´ |0| +´ |A| +´ |あ| +´ |…| +´ |-| +´ |।| +´ |´| +´ |—| +´ ​| +´ |̀| +´ ⁠| + +B2=================================================| +— |(| +— )| +— |"| +— | | +— |‼| +— !| +— /| +— .| +— |$| +— |%| +— |0| +— |A| +— |あ| +— |…| +— |-| +— |।| +— |´| +— —| +— ​| +— |̀| +— ⁠| + +ZW=================================================| +​ |(| +​ |)| +​ |"| +​ | | +​ |‼| +​ |!| +​ |/| +​ |.| +​ |$| +​ |%| +​ |0| +​ |A| +​ |あ| +​ |…| +​ |-| +​ |।| +​ |´| +​ |—| +​ ​| +​ |̀| +​ |⁠| + +CM=================================================| +̀ |(| +̀ )| +̀ |"| +̀ | | +̀ |‼| +̀ !| +̀ /| +̀ .| +̀ |$| +̀ |%| +̀ |0| +̀ |A| +̀ |あ| +̀ |…| +̀ |-| +̀ |।| +̀ |´| +̀ |—| +̀ ​| +̀ |̀| +̀ ⁠| + +WJ=================================================| +⁠ |(| +⁠ )| +⁠ |"| +⁠ | | +⁠ |‼| +⁠ !| +⁠ /| +⁠ .| +⁠ |$| +⁠ |%| +⁠ |0| +⁠ |A| +⁠ |あ| +⁠ |…| +⁠ |-| +⁠ |।| +⁠ |´| +⁠ |—| +⁠ ​| +⁠ |̀| +⁠ ⁠| + +*********************************| +without |space| +*********************************| +OP=================================================| +((| +()| +("| +( | +(‼| +(! | +(/| +(.| +($| +(%| +(0| +(A| +(あ| +(…| +(-| +(।| +(´| +(—| +(​| +(̀| +(⁠| + +CL=================================================| +)|(| +))| +)"| +) | +)‼| +)!| +)/| +).| +)|$| +)%| +)|0| +)|A| +)|あ| +)|…| +)-| +)।| +)|´| +)|—| +)​| +)̀| +)⁠| + +QU=================================================| +"(| +")| +""| +" | +"‼| +"!| +"/| +".| +"$| +"%| +"0| +"A| +"あ| +"…| +"-| +"।| +"´| +"—| +"​| +"̀| +"⁠| + +GL=================================================| + (| + )| + "| +  | + ‼| + !| + /| + .| + $| + %| + 0| + A| + あ| + …| + -| + ।| + ´| + —| + ​| + ̀| + ⁠| + +NS=================================================| +‼|(| +‼)| +‼"| +‼ | +‼‼| +‼!| +‼/| +‼.| +‼|$| +‼|%| +‼|0| +‼|A| +‼|あ| +‼|…| +‼-| +‼।| +‼|´| +‼|—| +‼​| +‼̀| +‼⁠| + +EX=================================================| +!|(| +!)| +!"| +! | +!‼| +!!| +!/| +!.| +!|$| +!|%| +!|0| +!|A| +!|あ| +!|…| +!-| +!।| +!|´| +!|—| +!​| +!̀| +!⁠| + +SY=================================================| +/|(| +/)| +/"| +/ | +/‼| +/!| +//| +/.| +/|$| +/|%| +/0| +/|A| +/|あ| +/|…| +/-| +/।| +/|´| +/|—| +/​| +/̀| +/⁠| + +IS=================================================| +.|(| +.)| +."| +. | +.‼| +.!| +./| +..| +.|$| +.|%| +.0| +.A| +.|あ| +.|…| +.-| +.।| +.|´| +.|—| +.​| +.̀| +.⁠| + +PR=================================================| +$(| +$)| +$"| +$ | +$‼| +$!| +$/| +$.| +$|$| +$|%| +$0| +$A| +$あ| +$|…| +$-| +$।| +$|´| +$|—| +$​| +$̀| +$⁠| + +PO=================================================| +%|(| +%)| +%"| +% | +%‼| +%!| +%/| +%.| +%|$| +%|%| +%|0| +%|A| +%|あ| +%|…| +%-| +%।| +%|´| +%|—| +%​| +%̀| +%⁠| + +NU=================================================| +0|(| +0)| +0"| +0 | +0‼| +0!| +0/| +0.| +0|$| +0%| +00| +0A| +0|あ| +0…| +0-| +0।| +0|´| +0|—| +0​| +0̀| +0⁠| + +AL=================================================| +A|(| +A)| +A"| +A | +A‼| +A!| +A/| +A.| +A|$| +A|%| +A0| +AA| +A|あ| +A…| +A-| +A।| +A|´| +A|—| +A​| +À| +A⁠| + +ID=================================================| +あ|(| +あ)| +あ"| +あ | +あ‼| +あ!| +あ/| +あ.| +あ|$| +あ%| +あ|0| +あ|A| +あ|あ| +あ…| +あ-| +あ।| +あ|´| +あ|—| +あ​| +あ̀| +あ⁠| + +IN=================================================| +…|(| +…)| +…"| +… | +…‼| +…!| +…/| +….| +…|$| +…|%| +…|0| +…|A| +…|あ| +……| +…-| +…।| +…|´| +…|—| +…​| +…̀| +…⁠| + +HY=================================================| +-|(| +-)| +-"| +- | +-‼| +-!| +-/| +-.| +-|$| +-|%| +-0| +-|A| +-|あ| +-|…| +--| +-।| +-|´| +-|—| +-​| +-̀| +-⁠| + +BA=================================================| +।|(| +।)| +।"| +। | +।‼| +।!| +।/| +।.| +।|$| +।|%| +।|0| +।|A| +।|あ| +।|…| +।-| +।।| +।|´| +।|—| +।​| +।̀| +।⁠| + +BB=================================================| +´(| +´)| +´"| +´ | +´‼| +´!| +´/| +´.| +´$| +´%| +´0| +´A| +´あ| +´…| +´-| +´।| +´´| +´—| +´​| +´̀| +´⁠| + +B2=================================================| +—|(| +—)| +—"| +— | +—‼| +—!| +—/| +—.| +—|$| +—|%| +—|0| +—|A| +—|あ| +—|…| +—-| +—।| +—|´| +——| +—​| +—̀| +—⁠| + +ZW=================================================| +​|(| +​|)| +​|"| +​| | +​|‼| +​|!| +​|/| +​|.| +​|$| +​|%| +​|0| +​|A| +​|あ| +​|…| +​|-| +​|।| +​|´| +​|—| +​​| +​|̀| +​|⁠| + +CM=================================================| +̀|(| +̀)| +̀"| +̀ | +̀‼| +̀!| +̀/| +̀.| +̀|$| +̀|%| +̀0| +̀A| +̀|あ| +̀…| +̀-| +̀।| +̀|´| +̀|—| +̀​| +̀̀| +̀⁠| + +WJ=================================================| +⁠(| +⁠)| +⁠"| +⁠ | +⁠‼| +⁠!| +⁠/| +⁠.| +⁠$| +⁠%| +⁠0| +⁠A| +⁠あ| +⁠…| +⁠-| +⁠।| +⁠´| +⁠—| +⁠​| +⁠̀| +⁠⁠| + +**********************************| +Korean |character |pairs |with |space| +**********************************| +H2=================================================| +가 |가| +가 |각| +가 |ᄀ| +가 |ᅡ| +가 |ᆨ| + +H3=================================================| +각 |가| +각 |각| +각 |ᄀ| +각 |ᅡ| +각 |ᆨ| + +JL=================================================| +ᄀ |가| +ᄀ |각| +ᄀ |ᄀ| +ᄀ |ᅡ| +ᄀ |ᆨ| + +JV=================================================| +ᅡ |가| +ᅡ |각| +ᅡ |ᄀ| +ᅡ |ᅡ| +ᅡ |ᆨ| + +JT=================================================| +ᆨ |가| +ᆨ |각| +ᆨ |ᄀ| +ᆨ |ᅡ| +ᆨ |ᆨ| + +**********************************| +Korean |character |pairs |without |space| +**********************************| +H2=================================================| +가가| +가각| +가ᄀ| +가ᅡ| +각| + +H3=================================================| +각가| +각각| +각ᄀ| +각ᅡ| +각ᆨ| + +JL=================================================| +ᄀ가| +ᄀ각| +ᄀᄀ| +가| +ᄀᆨ| + +JV=================================================| +ᅡ가| +ᅡ각| +ᅡᄀ| +ᅡᅡ| +ᅡᆨ| + +JT=================================================| +ᆨ가| +ᆨ각| +ᆨᄀ| +ᆨᅡ| +ᆨᆨ| + + +**********************************| +for |--|ai-|as-|id |option | +**********************************| + +AI==================================================| +̀ |¡ |̀ |¡̀|¡| + +ID==================================================| +̀ |あ |̀ |あ̀|あ| + +**********************************| +for |--|sp-|cm |option | +**********************************| + +AI==================================================| +̀ |¡ |̀ |¡̀|¡| + +OP=================================================| +( ̀| + +CL=================================================| +) |̀| + +QU=================================================| +" |̀| + +GL=================================================| +  |̀| + +NS=================================================| +‼ |̀| + +EX=================================================| +! |̀| + +SY=================================================| +/ |̀| + +IS=================================================| +. |̀| + +PR=================================================| +$ |̀| + +PO=================================================| +% |̀| + +NU=================================================| +0 |̀| + +AL=================================================| +A |̀| + +ID=================================================| +あ |̀| + +IN=================================================| +… |̀| + +HY=================================================| +- |̀| + +BA=================================================| +। |̀| + +BB=================================================| +´ |̀| + +B2=================================================| +— |̀| + +ZW=================================================| +​ |̀| + +CM=================================================| +̀ |̀| + +WJ=================================================| +⁠ |̀| + diff --git a/LBRK--korean-sp.dst b/LBRK--korean-sp.dst new file mode 100644 index 0000000..bf722de --- /dev/null +++ b/LBRK--korean-sp.dst @@ -0,0 +1,1278 @@ +testpattern |for |lb7|(CM) |is |realized |as |duplications |in |all |other |rules.| + +lb3a: |a
| +lb3a: |à
| + +lb3b: |b | + |c |d| + |e…| +lb3b: |b̀ | + |c̀ |d̀| + |è…| + +lb3c: |f
|g |h| + |i…| +lb3c: |f̀
|g̀ |h̀| + |ì…| + +lb4 |ab |cd​ | +lb4 |àb̀ |c̀d̀​ | + +lb5 |cd​|ef| +lb5 |c̀d̀​|èf̀| + +lb8: |a]|b ]|c! |d !|e;f …|;g/|g /| +lb8: |à]̀|b̀ ]̀|c̀!̀ |d̀ !̀|è;̀f̀ …|;̀g̀/̀|g̀ /̀| + +lb9: |[ a|[ [| +lb9: |[̀ à|[̀ [̀| +lb9: |[ …|a…|[ [| + +lb10: |"[bc |" [de| +lb10: |"̀[̀b̀c̀ |"̀ [̀d̀è| +lb10: |"[bc |"…|""[de| + +lb11: |f]‼ |g] ‼| +lb11: |f̀]̀‼̀ |g̀]̀ ‼̀| +lb11: |f]‼… |g…|…|…|…|] ‼| + +lb11a: |h|——|i |j|— —|k| +lb11a: |h̀|—̀—̀|ì |j̀|—̀ —̀|k̀| +lb11a: |h|—…|—|i |j|— —|k| + +lb11b: |l⁠m| +lb11b: |l̀⁠̀m̀| +lb11b: |l⁠…|m| + +lb12 |sp |ace| +lb12 |sp̀ |àce| + +lb13: |a b| +lb13: |à ̀b̀| + +lb14: |a"b"c | +lb14: |à"̀b̀"̀c̀ | + +lb14a: |a||b| +lb14a: |à|̀|b̀| + +lb15: |a।| + |b-| + |c‼| + |´d| + +lb15: |à।̀| + |b̀-̀| + |c̀‼̀| + |´̀d̀| + +lb16: |A…| + |あ…| + |……| + |0…| + +lb16: |À…̀| + |あ̀…̀| + |…̀…̀| + |0̀…̀| + +lb17: |あ%| + |A0| + |0A| + +lb17: |あ̀%̀| + |À0̀| + |0̀À| + +lb18: )% | + |-0 | + |.0 | + |00 | + |0% | + |$a | + |$- | + |$あ | + |$0 | + |$( | + |/0 | + +lb18: )̀%̀| + |-̀0̀| + |.̀0̀| + |0̀0̀| + |0̀%̀| + |$̀à| + |$̀-̀| + |$̀あ̀| + |$̀0̀| + |$̀(̀| + |/̀0̀| + +lb18b: |ᄀᄀ| + |가| + |ᄀ가| + |ᄀ각| + + |ᅡᅡ| + |ᅡᆨ| + |가ᅡ| + |각| + + |ᆨᆨ| + |각ᆨ| + +lb18b: |ᄀ̀ᄀ̀| + |ᄀ̀ᅡ̀| + |ᄀ̀가̀| + |ᄀ̀각̀| + + |ᅡ̀ᅡ̀| + |ᅡ̀ᆨ̀| + |가̀ᅡ̀| + |가̀ᆨ̀| + + |ᆨ̀ᆨ̀| + |각̀ᆨ̀| + +lb18c |각…| + |각%| + |$각| + +lb18c |각̀…̀| + |각̀%̀| + |$̀각̀| + +lb19 |aa| + +lb19 |àà| + +lb19b .a| +lb19b .̀à*********************************| +character |pairs |with |space| +*********************************| +OP=================================================| +( (| +( )| +( "| +(  | +( ‼| +( ! | +( /| +( .| +( $| +( %| +( 0| +( A| +( あ| +( …| +( -| +( ।| +( ´| +( —| +( ​| +( ̀| +( ⁠| + +CL=================================================| +) |(| +) )| +) |"| +) | | +) ‼| +) !| +) /| +) .| +) |$| +) |%| +) |0| +) |A| +) |あ| +) |…| +) |-| +) |।| +) |´| +) |—| +) ​| +) |̀| +) ⁠| + +QU=================================================| +" (| +" )| +" |"| +" | | +" |‼| +" !| +" /| +" .| +" |$| +" |%| +" |0| +" |A| +" |あ| +" |…| +" |-| +" |।| +" |´| +" |—| +" ​| +" |̀| +" ⁠| + +GL=================================================| +  |(| +  )| +  |"| +  | | +  |‼| +  !| +  /| +  .| +  |$| +  |%| +  |0| +  |A| +  |あ| +  |…| +  |-| +  |।| +  |´| +  |—| +  ​| +  |̀| +  ⁠| + +NS=================================================| +‼ |(| +‼ )| +‼ |"| +‼ | | +‼ |‼| +‼ !| +‼ /| +‼ .| +‼ |$| +‼ |%| +‼ |0| +‼ |A| +‼ |あ| +‼ |…| +‼ |-| +‼ |।| +‼ |´| +‼ |—| +‼ ​| +‼ |̀| +‼ ⁠| + +EX=================================================| +! |(| +! )| +! |"| +! | | +! |‼| +! !| +! /| +! .| +! |$| +! |%| +! |0| +! |A| +! |あ| +! |…| +! |-| +! |।| +! |´| +! |—| +! ​| +! |̀| +! ⁠| + +SY=================================================| +/ |(| +/ )| +/ |"| +/ | | +/ |‼| +/ !| +/ /| +/ .| +/ |$| +/ |%| +/ |0| +/ |A| +/ |あ| +/ |…| +/ |-| +/ |।| +/ |´| +/ |—| +/ ​| +/ |̀| +/ ⁠| + +IS=================================================| +. |(| +. )| +. |"| +. | | +. |‼| +. !| +. /| +. .| +. |$| +. |%| +. |0| +. |A| +. |あ| +. |…| +. |-| +. |।| +. |´| +. |—| +. ​| +. |̀| +. ⁠| + +PR=================================================| +$ |(| +$ )| +$ |"| +$ | | +$ |‼| +$ !| +$ /| +$ .| +$ |$| +$ |%| +$ |0| +$ |A| +$ |あ| +$ |…| +$ |-| +$ |।| +$ |´| +$ |—| +$ ​| +$ |̀| +$ ⁠| + +PO=================================================| +% |(| +% )| +% |"| +% | | +% |‼| +% !| +% /| +% .| +% |$| +% |%| +% |0| +% |A| +% |あ| +% |…| +% |-| +% |।| +% |´| +% |—| +% ​| +% |̀| +% ⁠| + +NU=================================================| +0 |(| +0 )| +0 |"| +0 | | +0 |‼| +0 !| +0 /| +0 .| +0 |$| +0 |%| +0 |0| +0 |A| +0 |あ| +0 |…| +0 |-| +0 |।| +0 |´| +0 |—| +0 ​| +0 |̀| +0 ⁠| + +AL=================================================| +A |(| +A )| +A |"| +A | | +A |‼| +A !| +A /| +A .| +A |$| +A |%| +A |0| +A |A| +A |あ| +A |…| +A |-| +A |।| +A |´| +A |—| +A ​| +A |̀| +A ⁠| + +ID=================================================| +あ |(| +あ )| +あ |"| +あ | | +あ |‼| +あ !| +あ /| +あ .| +あ |$| +あ |%| +あ |0| +あ |A| +あ |あ| +あ |…| +あ |-| +あ |।| +あ |´| +あ |—| +あ ​| +あ |̀| +あ ⁠| + +IN=================================================| +… |(| +… )| +… |"| +… | | +… |‼| +… !| +… /| +… .| +… |$| +… |%| +… |0| +… |A| +… |あ| +… |…| +… |-| +… |।| +… |´| +… |—| +… ​| +… |̀| +… ⁠| + +HY=================================================| +- |(| +- )| +- |"| +- | | +- |‼| +- !| +- /| +- .| +- |$| +- |%| +- |0| +- |A| +- |あ| +- |…| +- |-| +- |।| +- |´| +- |—| +- ​| +- |̀| +- ⁠| + +BA=================================================| +। |(| +। )| +। |"| +। | | +। |‼| +। !| +। /| +। .| +। |$| +। |%| +। |0| +। |A| +। |あ| +। |…| +। |-| +। |।| +। |´| +। |—| +। ​| +। |̀| +। ⁠| + +BB=================================================| +´ |(| +´ )| +´ |"| +´ | | +´ |‼| +´ !| +´ /| +´ .| +´ |$| +´ |%| +´ |0| +´ |A| +´ |あ| +´ |…| +´ |-| +´ |।| +´ |´| +´ |—| +´ ​| +´ |̀| +´ ⁠| + +B2=================================================| +— |(| +— )| +— |"| +— | | +— |‼| +— !| +— /| +— .| +— |$| +— |%| +— |0| +— |A| +— |あ| +— |…| +— |-| +— |।| +— |´| +— —| +— ​| +— |̀| +— ⁠| + +ZW=================================================| +​ |(| +​ |)| +​ |"| +​ | | +​ |‼| +​ |!| +​ |/| +​ |.| +​ |$| +​ |%| +​ |0| +​ |A| +​ |あ| +​ |…| +​ |-| +​ |।| +​ |´| +​ |—| +​ ​| +​ |̀| +​ |⁠| + +CM=================================================| +̀ |(| +̀ )| +̀ |"| +̀ | | +̀ |‼| +̀ !| +̀ /| +̀ .| +̀ |$| +̀ |%| +̀ |0| +̀ |A| +̀ |あ| +̀ |…| +̀ |-| +̀ |।| +̀ |´| +̀ |—| +̀ ​| +̀ |̀| +̀ ⁠| + +WJ=================================================| +⁠ |(| +⁠ )| +⁠ |"| +⁠ | | +⁠ |‼| +⁠ !| +⁠ /| +⁠ .| +⁠ |$| +⁠ |%| +⁠ |0| +⁠ |A| +⁠ |あ| +⁠ |…| +⁠ |-| +⁠ |।| +⁠ |´| +⁠ |—| +⁠ ​| +⁠ |̀| +⁠ ⁠| + +*********************************| +without |space| +*********************************| +OP=================================================| +((| +()| +("| +( | +(‼| +(! | +(/| +(.| +($| +(%| +(0| +(A| +(あ| +(…| +(-| +(।| +(´| +(—| +(​| +(̀| +(⁠| + +CL=================================================| +)|(| +))| +)"| +) | +)‼| +)!| +)/| +).| +)|$| +)%| +)|0| +)|A| +)|あ| +)|…| +)-| +)।| +)|´| +)|—| +)​| +)̀| +)⁠| + +QU=================================================| +"(| +")| +""| +" | +"‼| +"!| +"/| +".| +"$| +"%| +"0| +"A| +"あ| +"…| +"-| +"।| +"´| +"—| +"​| +"̀| +"⁠| + +GL=================================================| + (| + )| + "| +  | + ‼| + !| + /| + .| + $| + %| + 0| + A| + あ| + …| + -| + ।| + ´| + —| + ​| + ̀| + ⁠| + +NS=================================================| +‼|(| +‼)| +‼"| +‼ | +‼‼| +‼!| +‼/| +‼.| +‼|$| +‼|%| +‼|0| +‼|A| +‼|あ| +‼|…| +‼-| +‼।| +‼|´| +‼|—| +‼​| +‼̀| +‼⁠| + +EX=================================================| +!|(| +!)| +!"| +! | +!‼| +!!| +!/| +!.| +!|$| +!|%| +!|0| +!|A| +!|あ| +!|…| +!-| +!।| +!|´| +!|—| +!​| +!̀| +!⁠| + +SY=================================================| +/|(| +/)| +/"| +/ | +/‼| +/!| +//| +/.| +/|$| +/|%| +/0| +/|A| +/|あ| +/|…| +/-| +/।| +/|´| +/|—| +/​| +/̀| +/⁠| + +IS=================================================| +.|(| +.)| +."| +. | +.‼| +.!| +./| +..| +.|$| +.|%| +.0| +.A| +.|あ| +.|…| +.-| +.।| +.|´| +.|—| +.​| +.̀| +.⁠| + +PR=================================================| +$(| +$)| +$"| +$ | +$‼| +$!| +$/| +$.| +$|$| +$|%| +$0| +$A| +$あ| +$|…| +$-| +$।| +$|´| +$|—| +$​| +$̀| +$⁠| + +PO=================================================| +%|(| +%)| +%"| +% | +%‼| +%!| +%/| +%.| +%|$| +%|%| +%|0| +%|A| +%|あ| +%|…| +%-| +%।| +%|´| +%|—| +%​| +%̀| +%⁠| + +NU=================================================| +0|(| +0)| +0"| +0 | +0‼| +0!| +0/| +0.| +0|$| +0%| +00| +0A| +0|あ| +0…| +0-| +0।| +0|´| +0|—| +0​| +0̀| +0⁠| + +AL=================================================| +A|(| +A)| +A"| +A | +A‼| +A!| +A/| +A.| +A|$| +A|%| +A0| +AA| +A|あ| +A…| +A-| +A।| +A|´| +A|—| +A​| +À| +A⁠| + +ID=================================================| +あ|(| +あ)| +あ"| +あ | +あ‼| +あ!| +あ/| +あ.| +あ|$| +あ%| +あ|0| +あ|A| +あ|あ| +あ…| +あ-| +あ।| +あ|´| +あ|—| +あ​| +あ̀| +あ⁠| + +IN=================================================| +…|(| +…)| +…"| +… | +…‼| +…!| +…/| +….| +…|$| +…|%| +…|0| +…|A| +…|あ| +……| +…-| +…।| +…|´| +…|—| +…​| +…̀| +…⁠| + +HY=================================================| +-|(| +-)| +-"| +- | +-‼| +-!| +-/| +-.| +-|$| +-|%| +-0| +-|A| +-|あ| +-|…| +--| +-।| +-|´| +-|—| +-​| +-̀| +-⁠| + +BA=================================================| +।|(| +।)| +।"| +। | +।‼| +।!| +।/| +।.| +।|$| +।|%| +।|0| +।|A| +।|あ| +।|…| +।-| +।।| +।|´| +।|—| +।​| +।̀| +।⁠| + +BB=================================================| +´(| +´)| +´"| +´ | +´‼| +´!| +´/| +´.| +´$| +´%| +´0| +´A| +´あ| +´…| +´-| +´।| +´´| +´—| +´​| +´̀| +´⁠| + +B2=================================================| +—|(| +—)| +—"| +— | +—‼| +—!| +—/| +—.| +—|$| +—|%| +—|0| +—|A| +—|あ| +—|…| +—-| +—।| +—|´| +——| +—​| +—̀| +—⁠| + +ZW=================================================| +​|(| +​|)| +​|"| +​| | +​|‼| +​|!| +​|/| +​|.| +​|$| +​|%| +​|0| +​|A| +​|あ| +​|…| +​|-| +​|।| +​|´| +​|—| +​​| +​|̀| +​|⁠| + +CM=================================================| +̀|(| +̀)| +̀"| +̀ | +̀‼| +̀!| +̀/| +̀.| +̀|$| +̀|%| +̀0| +̀A| +̀|あ| +̀…| +̀-| +̀।| +̀|´| +̀|—| +̀​| +̀̀| +̀⁠| + +WJ=================================================| +⁠(| +⁠)| +⁠"| +⁠ | +⁠‼| +⁠!| +⁠/| +⁠.| +⁠$| +⁠%| +⁠0| +⁠A| +⁠あ| +⁠…| +⁠-| +⁠।| +⁠´| +⁠—| +⁠​| +⁠̀| +⁠⁠| + +**********************************| +Korean |character |pairs |with |space| +**********************************| +H2=================================================| +가 |가| +가 |각| +가 |ᄀ| +가 |ᅡ| +가 |ᆨ| + +H3=================================================| +각 |가| +각 |각| +각 |ᄀ| +각 |ᅡ| +각 |ᆨ| + +JL=================================================| +ᄀ |가| +ᄀ |각| +ᄀ |ᄀ| +ᄀ |ᅡ| +ᄀ |ᆨ| + +JV=================================================| +ᅡ |가| +ᅡ |각| +ᅡ |ᄀ| +ᅡ |ᅡ| +ᅡ |ᆨ| + +JT=================================================| +ᆨ |가| +ᆨ |각| +ᆨ |ᄀ| +ᆨ |ᅡ| +ᆨ |ᆨ| + +**********************************| +Korean |character |pairs |without |space| +**********************************| +H2=================================================| +가|가| +가|각| +가|ᄀ| +가ᅡ| +각| + +H3=================================================| +각|가| +각|각| +각|ᄀ| +각|ᅡ| +각ᆨ| + +JL=================================================| +ᄀ가| +ᄀ각| +ᄀᄀ| +가| +ᄀ|ᆨ| + +JV=================================================| +ᅡ|가| +ᅡ|각| +ᅡ|ᄀ| +ᅡᅡ| +ᅡᆨ| + +JT=================================================| +ᆨ|가| +ᆨ|각| +ᆨ|ᄀ| +ᆨ|ᅡ| +ᆨᆨ| + + +**********************************| +for |--|ai-|as-|id |option | +**********************************| + +AI==================================================| +̀ |¡ |̀ |¡̀¡| + +ID==================================================| +̀ |あ |̀ |あ̀|あ| + +**********************************| +for |--|sp-|cm |option | +**********************************| + +AI==================================================| +̀ |¡ |̀ |¡̀¡| + +OP=================================================| +( ̀| + +CL=================================================| +) |̀| + +QU=================================================| +" |̀| + +GL=================================================| +  |̀| + +NS=================================================| +‼ |̀| + +EX=================================================| +! |̀| + +SY=================================================| +/ |̀| + +IS=================================================| +. |̀| + +PR=================================================| +$ |̀| + +PO=================================================| +% |̀| + +NU=================================================| +0 |̀| + +AL=================================================| +A |̀| + +ID=================================================| +あ |̀| + +IN=================================================| +… |̀| + +HY=================================================| +- |̀| + +BA=================================================| +। |̀| + +BB=================================================| +´ |̀| + +B2=================================================| +— |̀| + +ZW=================================================| +​ |̀| + +CM=================================================| +̀ |̀| + +WJ=================================================| +⁠ |̀| + diff --git a/LBRK--sp-cm.dst b/LBRK--sp-cm.dst new file mode 100644 index 0000000..1e78b11 --- /dev/null +++ b/LBRK--sp-cm.dst @@ -0,0 +1,1278 @@ +testpattern |for |lb7|(CM) |is |realized |as |duplications |in |all |other |rules.| + +lb3a: |a
| +lb3a: |à
| + +lb3b: |b | + |c |d| + |e…| +lb3b: |b̀ | + |c̀ |d̀| + |è…| + +lb3c: |f
|g |h| + |i…| +lb3c: |f̀
|g̀ |h̀| + |ì…| + +lb4 |ab |cd​ | +lb4 |àb̀ |c̀d̀​ | + +lb5 |cd​|ef| +lb5 |c̀d̀​|èf̀| + +lb8: |a]|b ]|c! |d !|e;f …|;g/|g /| +lb8: |à]̀|b̀ ]̀|c̀!̀ |d̀ !̀|è;̀f̀ …|;̀g̀/̀|g̀ /̀| + +lb9: |[ a|[ [| +lb9: |[̀ à|[̀ [̀| +lb9: |[ …|a…|[ [| + +lb10: |"[bc |" [de| +lb10: |"̀[̀b̀c̀ |"̀ [̀d̀è| +lb10: |"[bc |"…|""[de| + +lb11: |f]‼ |g] ‼| +lb11: |f̀]̀‼̀ |g̀]̀ ‼̀| +lb11: |f]‼… |g…|…|…|…|] ‼| + +lb11a: |h|——|i |j|— —|k| +lb11a: |h̀|—̀—̀|ì |j̀|—̀ —̀|k̀| +lb11a: |h|—…|—|i |j|— —|k| + +lb11b: |l⁠m| +lb11b: |l̀⁠̀m̀| +lb11b: |l⁠…|m| + +lb12 |sp |ace| +lb12 |sp̀ |àce| + +lb13: |a b| +lb13: |à ̀b̀| + +lb14: |a"b"c | +lb14: |à"̀b̀"̀c̀ | + +lb14a: |a||b| +lb14a: |à|̀|b̀| + +lb15: |a।| + |b-| + |c‼| + |´d| + +lb15: |à।̀| + |b̀-̀| + |c̀‼̀| + |´̀d̀| + +lb16: |A…| + |あ…| + |……| + |0…| + +lb16: |À…̀| + |あ̀…̀| + |…̀…̀| + |0̀…̀| + +lb17: |あ%| + |A0| + |0A| + +lb17: |あ̀%̀| + |À0̀| + |0̀À| + +lb18: )% | + |-0 | + |.0 | + |00 | + |0% | + |$a | + |$- | + |$あ | + |$0 | + |$( | + |/0 | + +lb18: )̀%̀| + |-̀0̀| + |.̀0̀| + |0̀0̀| + |0̀%̀| + |$̀à| + |$̀-̀| + |$̀あ̀| + |$̀0̀| + |$̀(̀| + |/̀0̀| + +lb18b: |ᄀᄀ| + |가| + |ᄀ가| + |ᄀ각| + + |ᅡᅡ| + |ᅡᆨ| + |가ᅡ| + |각| + + |ᆨᆨ| + |각ᆨ| + +lb18b: |ᄀ̀ᄀ̀| + |ᄀ̀ᅡ̀| + |ᄀ̀가̀| + |ᄀ̀각̀| + + |ᅡ̀ᅡ̀| + |ᅡ̀ᆨ̀| + |가̀ᅡ̀| + |가̀ᆨ̀| + + |ᆨ̀ᆨ̀| + |각̀ᆨ̀| + +lb18c |각…| + |각|%| + |$각| + +lb18c |각̀…̀| + |각̀|%̀| + |$̀각̀| + +lb19 |aa| + +lb19 |àà| + +lb19b .a| +lb19b .̀à*********************************| +character |pairs |with |space| +*********************************| +OP=================================================| +( (| +( )| +( "| +(  | +( ‼| +( ! | +( /| +( .| +( $| +( %| +( 0| +( A| +( あ| +( …| +( -| +( ।| +( ´| +( —| +( ​| +( ̀| +( ⁠| + +CL=================================================| +) |(| +) )| +) |"| +) | | +) ‼| +) !| +) /| +) .| +) |$| +) |%| +) |0| +) |A| +) |あ| +) |…| +) |-| +) |।| +) |´| +) |—| +) ​| +)| ̀| +) ⁠| + +QU=================================================| +" (| +" )| +" |"| +" | | +" |‼| +" !| +" /| +" .| +" |$| +" |%| +" |0| +" |A| +" |あ| +" |…| +" |-| +" |।| +" |´| +" |—| +" ​| +" ̀| +" ⁠| + +GL=================================================| +  |(| +  )| +  |"| +  | | +  |‼| +  !| +  /| +  .| +  |$| +  |%| +  |0| +  |A| +  |あ| +  |…| +  |-| +  |।| +  |´| +  |—| +  ​| +  ̀| +  ⁠| + +NS=================================================| +‼ |(| +‼ )| +‼ |"| +‼ | | +‼ |‼| +‼ !| +‼ /| +‼ .| +‼ |$| +‼ |%| +‼ |0| +‼ |A| +‼ |あ| +‼ |…| +‼ |-| +‼ |।| +‼ |´| +‼ |—| +‼ ​| +‼| ̀| +‼ ⁠| + +EX=================================================| +! |(| +! )| +! |"| +! | | +! |‼| +! !| +! /| +! .| +! |$| +! |%| +! |0| +! |A| +! |あ| +! |…| +! |-| +! |।| +! |´| +! |—| +! ​| +!| ̀| +! ⁠| + +SY=================================================| +/ |(| +/ )| +/ |"| +/ | | +/ |‼| +/ !| +/ /| +/ .| +/ |$| +/ |%| +/ |0| +/ |A| +/ |あ| +/ |…| +/ |-| +/ |।| +/ |´| +/ |—| +/ ​| +/| ̀| +/ ⁠| + +IS=================================================| +. |(| +. )| +. |"| +. | | +. |‼| +. !| +. /| +. .| +. |$| +. |%| +. |0| +. |A| +. |あ| +. |…| +. |-| +. |।| +. |´| +. |—| +. ​| +.| ̀| +. ⁠| + +PR=================================================| +$ |(| +$ )| +$ |"| +$ | | +$ |‼| +$ !| +$ /| +$ .| +$ |$| +$ |%| +$ |0| +$ |A| +$ |あ| +$ |…| +$ |-| +$ |।| +$ |´| +$ |—| +$ ​| +$ ̀| +$ ⁠| + +PO=================================================| +% |(| +% )| +% |"| +% | | +% |‼| +% !| +% /| +% .| +% |$| +% |%| +% |0| +% |A| +% |あ| +% |…| +% |-| +% |।| +% |´| +% |—| +% ​| +%| ̀| +% ⁠| + +NU=================================================| +0 |(| +0 )| +0 |"| +0 | | +0 |‼| +0 !| +0 /| +0 .| +0 |$| +0 |%| +0 |0| +0 |A| +0 |あ| +0 |…| +0 |-| +0 |।| +0 |´| +0 |—| +0 ​| +0| ̀| +0 ⁠| + +AL=================================================| +A |(| +A )| +A |"| +A | | +A |‼| +A !| +A /| +A .| +A |$| +A |%| +A |0| +A |A| +A |あ| +A |…| +A |-| +A |।| +A |´| +A |—| +A ​| +A| ̀| +A ⁠| + +ID=================================================| +あ |(| +あ )| +あ |"| +あ | | +あ |‼| +あ !| +あ /| +あ .| +あ |$| +あ |%| +あ |0| +あ |A| +あ |あ| +あ |…| +あ |-| +あ |।| +あ |´| +あ |—| +あ ​| +あ| ̀| +あ ⁠| + +IN=================================================| +… |(| +… )| +… |"| +… | | +… |‼| +… !| +… /| +… .| +… |$| +… |%| +… |0| +… |A| +… |あ| +… |…| +… |-| +… |।| +… |´| +… |—| +… ​| +…| ̀| +… ⁠| + +HY=================================================| +- |(| +- )| +- |"| +- | | +- |‼| +- !| +- /| +- .| +- |$| +- |%| +- |0| +- |A| +- |あ| +- |…| +- |-| +- |।| +- |´| +- |—| +- ​| +-| ̀| +- ⁠| + +BA=================================================| +। |(| +। )| +। |"| +। | | +। |‼| +। !| +। /| +। .| +। |$| +। |%| +। |0| +। |A| +। |あ| +। |…| +। |-| +। |।| +। |´| +। |—| +। ​| +।| ̀| +। ⁠| + +BB=================================================| +´ |(| +´ )| +´ |"| +´ | | +´ |‼| +´ !| +´ /| +´ .| +´ |$| +´ |%| +´ |0| +´ |A| +´ |あ| +´ |…| +´ |-| +´ |।| +´ |´| +´ |—| +´ ​| +´ ̀| +´ ⁠| + +B2=================================================| +— |(| +— )| +— |"| +— | | +— |‼| +— !| +— /| +— .| +— |$| +— |%| +— |0| +— |A| +— |あ| +— |…| +— |-| +— |।| +— |´| +— —| +— ​| +—| ̀| +— ⁠| + +ZW=================================================| +​ |(| +​ |)| +​ |"| +​ | | +​ |‼| +​ |!| +​ |/| +​ |.| +​ |$| +​ |%| +​ |0| +​ |A| +​ |あ| +​ |…| +​ |-| +​ |।| +​ |´| +​ |—| +​ ​| +​| ̀| +​ |⁠| + +CM=================================================| +̀ |(| +̀ )| +̀ |"| +̀ | | +̀ |‼| +̀ !| +̀ /| +̀ .| +̀ |$| +̀ |%| +̀ |0| +̀ |A| +̀ |あ| +̀ |…| +̀ |-| +̀ |।| +̀ |´| +̀ |—| +̀ ​| +̀| ̀| +̀ ⁠| + +WJ=================================================| +⁠ |(| +⁠ )| +⁠ |"| +⁠ | | +⁠ |‼| +⁠ !| +⁠ /| +⁠ .| +⁠ |$| +⁠ |%| +⁠ |0| +⁠ |A| +⁠ |あ| +⁠ |…| +⁠ |-| +⁠ |।| +⁠ |´| +⁠ |—| +⁠ ​| +⁠ ̀| +⁠ ⁠| + +*********************************| +without |space| +*********************************| +OP=================================================| +((| +()| +("| +( | +(‼| +(! | +(/| +(.| +($| +(%| +(0| +(A| +(あ| +(…| +(-| +(।| +(´| +(—| +(​| +(̀| +(⁠| + +CL=================================================| +)|(| +))| +)"| +) | +)‼| +)!| +)/| +).| +)|$| +)%| +)|0| +)|A| +)|あ| +)|…| +)-| +)।| +)|´| +)|—| +)​| +)̀| +)⁠| + +QU=================================================| +"(| +")| +""| +" | +"‼| +"!| +"/| +".| +"$| +"%| +"0| +"A| +"あ| +"…| +"-| +"।| +"´| +"—| +"​| +"̀| +"⁠| + +GL=================================================| + (| + )| + "| +  | + ‼| + !| + /| + .| + $| + %| + 0| + A| + あ| + …| + -| + ।| + ´| + —| + ​| + ̀| + ⁠| + +NS=================================================| +‼|(| +‼)| +‼"| +‼ | +‼‼| +‼!| +‼/| +‼.| +‼|$| +‼|%| +‼|0| +‼|A| +‼|あ| +‼|…| +‼-| +‼।| +‼|´| +‼|—| +‼​| +‼̀| +‼⁠| + +EX=================================================| +!|(| +!)| +!"| +! | +!‼| +!!| +!/| +!.| +!|$| +!|%| +!|0| +!|A| +!|あ| +!|…| +!-| +!।| +!|´| +!|—| +!​| +!̀| +!⁠| + +SY=================================================| +/|(| +/)| +/"| +/ | +/‼| +/!| +//| +/.| +/|$| +/|%| +/0| +/|A| +/|あ| +/|…| +/-| +/।| +/|´| +/|—| +/​| +/̀| +/⁠| + +IS=================================================| +.|(| +.)| +."| +. | +.‼| +.!| +./| +..| +.|$| +.|%| +.0| +.A| +.|あ| +.|…| +.-| +.।| +.|´| +.|—| +.​| +.̀| +.⁠| + +PR=================================================| +$(| +$)| +$"| +$ | +$‼| +$!| +$/| +$.| +$|$| +$|%| +$0| +$A| +$あ| +$|…| +$-| +$।| +$|´| +$|—| +$​| +$̀| +$⁠| + +PO=================================================| +%|(| +%)| +%"| +% | +%‼| +%!| +%/| +%.| +%|$| +%|%| +%|0| +%|A| +%|あ| +%|…| +%-| +%।| +%|´| +%|—| +%​| +%̀| +%⁠| + +NU=================================================| +0|(| +0)| +0"| +0 | +0‼| +0!| +0/| +0.| +0|$| +0%| +00| +0A| +0|あ| +0…| +0-| +0।| +0|´| +0|—| +0​| +0̀| +0⁠| + +AL=================================================| +A|(| +A)| +A"| +A | +A‼| +A!| +A/| +A.| +A|$| +A|%| +A0| +AA| +A|あ| +A…| +A-| +A।| +A|´| +A|—| +A​| +À| +A⁠| + +ID=================================================| +あ|(| +あ)| +あ"| +あ | +あ‼| +あ!| +あ/| +あ.| +あ|$| +あ%| +あ|0| +あ|A| +あ|あ| +あ…| +あ-| +あ।| +あ|´| +あ|—| +あ​| +あ̀| +あ⁠| + +IN=================================================| +…|(| +…)| +…"| +… | +…‼| +…!| +…/| +….| +…|$| +…|%| +…|0| +…|A| +…|あ| +……| +…-| +…।| +…|´| +…|—| +…​| +…̀| +…⁠| + +HY=================================================| +-|(| +-)| +-"| +- | +-‼| +-!| +-/| +-.| +-|$| +-|%| +-0| +-|A| +-|あ| +-|…| +--| +-।| +-|´| +-|—| +-​| +-̀| +-⁠| + +BA=================================================| +।|(| +।)| +।"| +। | +।‼| +।!| +।/| +।.| +।|$| +।|%| +।|0| +।|A| +।|あ| +।|…| +।-| +।।| +।|´| +।|—| +।​| +।̀| +।⁠| + +BB=================================================| +´(| +´)| +´"| +´ | +´‼| +´!| +´/| +´.| +´$| +´%| +´0| +´A| +´あ| +´…| +´-| +´।| +´´| +´—| +´​| +´̀| +´⁠| + +B2=================================================| +—|(| +—)| +—"| +— | +—‼| +—!| +—/| +—.| +—|$| +—|%| +—|0| +—|A| +—|あ| +—|…| +—-| +—।| +—|´| +——| +—​| +—̀| +—⁠| + +ZW=================================================| +​|(| +​|)| +​|"| +​| | +​|‼| +​|!| +​|/| +​|.| +​|$| +​|%| +​|0| +​|A| +​|あ| +​|…| +​|-| +​|।| +​|´| +​|—| +​​| +​|̀| +​|⁠| + +CM=================================================| +̀|(| +̀)| +̀"| +̀ | +̀‼| +̀!| +̀/| +̀.| +̀|$| +̀|%| +̀0| +̀A| +̀|あ| +̀…| +̀-| +̀।| +̀|´| +̀|—| +̀​| +̀̀| +̀⁠| + +WJ=================================================| +⁠(| +⁠)| +⁠"| +⁠ | +⁠‼| +⁠!| +⁠/| +⁠.| +⁠$| +⁠%| +⁠0| +⁠A| +⁠あ| +⁠…| +⁠-| +⁠।| +⁠´| +⁠—| +⁠​| +⁠̀| +⁠⁠| + +**********************************| +Korean |character |pairs |with |space| +**********************************| +H2=================================================| +가 |가| +가 |각| +가 |ᄀ| +가 |ᅡ| +가 |ᆨ| + +H3=================================================| +각 |가| +각 |각| +각 |ᄀ| +각 |ᅡ| +각 |ᆨ| + +JL=================================================| +ᄀ |가| +ᄀ |각| +ᄀ |ᄀ| +ᄀ |ᅡ| +ᄀ |ᆨ| + +JV=================================================| +ᅡ |가| +ᅡ |각| +ᅡ |ᄀ| +ᅡ |ᅡ| +ᅡ |ᆨ| + +JT=================================================| +ᆨ |가| +ᆨ |각| +ᆨ |ᄀ| +ᆨ |ᅡ| +ᆨ |ᆨ| + +**********************************| +Korean |character |pairs |without |space| +**********************************| +H2=================================================| +가가| +가각| +가ᄀ| +가ᅡ| +각| + +H3=================================================| +각가| +각각| +각ᄀ| +각ᅡ| +각ᆨ| + +JL=================================================| +ᄀ가| +ᄀ각| +ᄀᄀ| +가| +ᄀᆨ| + +JV=================================================| +ᅡ가| +ᅡ각| +ᅡᄀ| +ᅡᅡ| +ᅡᆨ| + +JT=================================================| +ᆨ가| +ᆨ각| +ᆨᄀ| +ᆨᅡ| +ᆨᆨ| + + +**********************************| +for |--|ai-|as-|id |option | +**********************************| + +AI==================================================| +̀ |¡| ̀ |¡̀¡| + +ID==================================================| +̀ |あ| ̀ |あ̀|あ| + +**********************************| +for |--|sp-|cm |option | +**********************************| + +AI==================================================| +̀ |¡| ̀ |¡̀¡| + +OP=================================================| +( ̀| + +CL=================================================| +)| ̀| + +QU=================================================| +" ̀| + +GL=================================================| +  ̀| + +NS=================================================| +‼| ̀| + +EX=================================================| +!| ̀| + +SY=================================================| +/| ̀| + +IS=================================================| +.| ̀| + +PR=================================================| +$ ̀| + +PO=================================================| +%| ̀| + +NU=================================================| +0| ̀| + +AL=================================================| +A| ̀| + +ID=================================================| +あ| ̀| + +IN=================================================| +…| ̀| + +HY=================================================| +-| ̀| + +BA=================================================| +।| ̀| + +BB=================================================| +´ ̀| + +B2=================================================| +—| ̀| + +ZW=================================================| +​| ̀| + +CM=================================================| +̀| ̀| + +WJ=================================================| +⁠ ̀| + diff --git a/LBRK.dst b/LBRK.dst new file mode 100644 index 0000000..fb54a89 --- /dev/null +++ b/LBRK.dst @@ -0,0 +1,1278 @@ +testpattern |for |lb7|(CM) |is |realized |as |duplications |in |all |other |rules.| + +lb3a: |a
| +lb3a: |à
| + +lb3b: |b | + |c |d| + |e…| +lb3b: |b̀ | + |c̀ |d̀| + |è…| + +lb3c: |f
|g |h| + |i…| +lb3c: |f̀
|g̀ |h̀| + |ì…| + +lb4 |ab |cd​ | +lb4 |àb̀ |c̀d̀​ | + +lb5 |cd​|ef| +lb5 |c̀d̀​|èf̀| + +lb8: |a]|b ]|c! |d !|e;f …|;g/|g /| +lb8: |à]̀|b̀ ]̀|c̀!̀ |d̀ !̀|è;̀f̀ …|;̀g̀/̀|g̀ /̀| + +lb9: |[ a|[ [| +lb9: |[̀ à|[̀ [̀| +lb9: |[ …|a…|[ [| + +lb10: |"[bc |" [de| +lb10: |"̀[̀b̀c̀ |"̀ [̀d̀è| +lb10: |"[bc |"…|""[de| + +lb11: |f]‼ |g] ‼| +lb11: |f̀]̀‼̀ |g̀]̀ ‼̀| +lb11: |f]‼… |g…|…|…|…|] ‼| + +lb11a: |h|——|i |j|— —|k| +lb11a: |h̀|—̀—̀|ì |j̀|—̀ —̀|k̀| +lb11a: |h|—…|—|i |j|— —|k| + +lb11b: |l⁠m| +lb11b: |l̀⁠̀m̀| +lb11b: |l⁠…|m| + +lb12 |sp |ace| +lb12 |sp̀ |àce| + +lb13: |a b| +lb13: |à ̀b̀| + +lb14: |a"b"c | +lb14: |à"̀b̀"̀c̀ | + +lb14a: |a||b| +lb14a: |à|̀|b̀| + +lb15: |a।| + |b-| + |c‼| + |´d| + +lb15: |à।̀| + |b̀-̀| + |c̀‼̀| + |´̀d̀| + +lb16: |A…| + |あ…| + |……| + |0…| + +lb16: |À…̀| + |あ̀…̀| + |…̀…̀| + |0̀…̀| + +lb17: |あ%| + |A0| + |0A| + +lb17: |あ̀%̀| + |À0̀| + |0̀À| + +lb18: )% | + |-0 | + |.0 | + |00 | + |0% | + |$a | + |$- | + |$あ | + |$0 | + |$( | + |/0 | + +lb18: )̀%̀| + |-̀0̀| + |.̀0̀| + |0̀0̀| + |0̀%̀| + |$̀à| + |$̀-̀| + |$̀あ̀| + |$̀0̀| + |$̀(̀| + |/̀0̀| + +lb18b: |ᄀᄀ| + |가| + |ᄀ가| + |ᄀ각| + + |ᅡᅡ| + |ᅡᆨ| + |가ᅡ| + |각| + + |ᆨᆨ| + |각ᆨ| + +lb18b: |ᄀ̀ᄀ̀| + |ᄀ̀ᅡ̀| + |ᄀ̀가̀| + |ᄀ̀각̀| + + |ᅡ̀ᅡ̀| + |ᅡ̀ᆨ̀| + |가̀ᅡ̀| + |가̀ᆨ̀| + + |ᆨ̀ᆨ̀| + |각̀ᆨ̀| + +lb18c |각…| + |각|%| + |$각| + +lb18c |각̀…̀| + |각̀|%̀| + |$̀각̀| + +lb19 |aa| + +lb19 |àà| + +lb19b .a| +lb19b .̀à*********************************| +character |pairs |with |space| +*********************************| +OP=================================================| +( (| +( )| +( "| +(  | +( ‼| +( ! | +( /| +( .| +( $| +( %| +( 0| +( A| +( あ| +( …| +( -| +( ।| +( ´| +( —| +( ​| +( ̀| +( ⁠| + +CL=================================================| +) |(| +) )| +) |"| +) | | +) ‼| +) !| +) /| +) .| +) |$| +) |%| +) |0| +) |A| +) |あ| +) |…| +) |-| +) |।| +) |´| +) |—| +) ​| +) |̀| +) ⁠| + +QU=================================================| +" (| +" )| +" |"| +" | | +" |‼| +" !| +" /| +" .| +" |$| +" |%| +" |0| +" |A| +" |あ| +" |…| +" |-| +" |।| +" |´| +" |—| +" ​| +" |̀| +" ⁠| + +GL=================================================| +  |(| +  )| +  |"| +  | | +  |‼| +  !| +  /| +  .| +  |$| +  |%| +  |0| +  |A| +  |あ| +  |…| +  |-| +  |।| +  |´| +  |—| +  ​| +  |̀| +  ⁠| + +NS=================================================| +‼ |(| +‼ )| +‼ |"| +‼ | | +‼ |‼| +‼ !| +‼ /| +‼ .| +‼ |$| +‼ |%| +‼ |0| +‼ |A| +‼ |あ| +‼ |…| +‼ |-| +‼ |।| +‼ |´| +‼ |—| +‼ ​| +‼ |̀| +‼ ⁠| + +EX=================================================| +! |(| +! )| +! |"| +! | | +! |‼| +! !| +! /| +! .| +! |$| +! |%| +! |0| +! |A| +! |あ| +! |…| +! |-| +! |।| +! |´| +! |—| +! ​| +! |̀| +! ⁠| + +SY=================================================| +/ |(| +/ )| +/ |"| +/ | | +/ |‼| +/ !| +/ /| +/ .| +/ |$| +/ |%| +/ |0| +/ |A| +/ |あ| +/ |…| +/ |-| +/ |।| +/ |´| +/ |—| +/ ​| +/ |̀| +/ ⁠| + +IS=================================================| +. |(| +. )| +. |"| +. | | +. |‼| +. !| +. /| +. .| +. |$| +. |%| +. |0| +. |A| +. |あ| +. |…| +. |-| +. |।| +. |´| +. |—| +. ​| +. |̀| +. ⁠| + +PR=================================================| +$ |(| +$ )| +$ |"| +$ | | +$ |‼| +$ !| +$ /| +$ .| +$ |$| +$ |%| +$ |0| +$ |A| +$ |あ| +$ |…| +$ |-| +$ |।| +$ |´| +$ |—| +$ ​| +$ |̀| +$ ⁠| + +PO=================================================| +% |(| +% )| +% |"| +% | | +% |‼| +% !| +% /| +% .| +% |$| +% |%| +% |0| +% |A| +% |あ| +% |…| +% |-| +% |।| +% |´| +% |—| +% ​| +% |̀| +% ⁠| + +NU=================================================| +0 |(| +0 )| +0 |"| +0 | | +0 |‼| +0 !| +0 /| +0 .| +0 |$| +0 |%| +0 |0| +0 |A| +0 |あ| +0 |…| +0 |-| +0 |।| +0 |´| +0 |—| +0 ​| +0 |̀| +0 ⁠| + +AL=================================================| +A |(| +A )| +A |"| +A | | +A |‼| +A !| +A /| +A .| +A |$| +A |%| +A |0| +A |A| +A |あ| +A |…| +A |-| +A |।| +A |´| +A |—| +A ​| +A |̀| +A ⁠| + +ID=================================================| +あ |(| +あ )| +あ |"| +あ | | +あ |‼| +あ !| +あ /| +あ .| +あ |$| +あ |%| +あ |0| +あ |A| +あ |あ| +あ |…| +あ |-| +あ |।| +あ |´| +あ |—| +あ ​| +あ |̀| +あ ⁠| + +IN=================================================| +… |(| +… )| +… |"| +… | | +… |‼| +… !| +… /| +… .| +… |$| +… |%| +… |0| +… |A| +… |あ| +… |…| +… |-| +… |।| +… |´| +… |—| +… ​| +… |̀| +… ⁠| + +HY=================================================| +- |(| +- )| +- |"| +- | | +- |‼| +- !| +- /| +- .| +- |$| +- |%| +- |0| +- |A| +- |あ| +- |…| +- |-| +- |।| +- |´| +- |—| +- ​| +- |̀| +- ⁠| + +BA=================================================| +। |(| +। )| +। |"| +। | | +। |‼| +। !| +। /| +। .| +। |$| +। |%| +। |0| +। |A| +। |あ| +। |…| +। |-| +। |।| +। |´| +। |—| +। ​| +। |̀| +। ⁠| + +BB=================================================| +´ |(| +´ )| +´ |"| +´ | | +´ |‼| +´ !| +´ /| +´ .| +´ |$| +´ |%| +´ |0| +´ |A| +´ |あ| +´ |…| +´ |-| +´ |।| +´ |´| +´ |—| +´ ​| +´ |̀| +´ ⁠| + +B2=================================================| +— |(| +— )| +— |"| +— | | +— |‼| +— !| +— /| +— .| +— |$| +— |%| +— |0| +— |A| +— |あ| +— |…| +— |-| +— |।| +— |´| +— —| +— ​| +— |̀| +— ⁠| + +ZW=================================================| +​ |(| +​ |)| +​ |"| +​ | | +​ |‼| +​ |!| +​ |/| +​ |.| +​ |$| +​ |%| +​ |0| +​ |A| +​ |あ| +​ |…| +​ |-| +​ |।| +​ |´| +​ |—| +​ ​| +​ |̀| +​ |⁠| + +CM=================================================| +̀ |(| +̀ )| +̀ |"| +̀ | | +̀ |‼| +̀ !| +̀ /| +̀ .| +̀ |$| +̀ |%| +̀ |0| +̀ |A| +̀ |あ| +̀ |…| +̀ |-| +̀ |।| +̀ |´| +̀ |—| +̀ ​| +̀ |̀| +̀ ⁠| + +WJ=================================================| +⁠ |(| +⁠ )| +⁠ |"| +⁠ | | +⁠ |‼| +⁠ !| +⁠ /| +⁠ .| +⁠ |$| +⁠ |%| +⁠ |0| +⁠ |A| +⁠ |あ| +⁠ |…| +⁠ |-| +⁠ |।| +⁠ |´| +⁠ |—| +⁠ ​| +⁠ |̀| +⁠ ⁠| + +*********************************| +without |space| +*********************************| +OP=================================================| +((| +()| +("| +( | +(‼| +(! | +(/| +(.| +($| +(%| +(0| +(A| +(あ| +(…| +(-| +(।| +(´| +(—| +(​| +(̀| +(⁠| + +CL=================================================| +)|(| +))| +)"| +) | +)‼| +)!| +)/| +).| +)|$| +)%| +)|0| +)|A| +)|あ| +)|…| +)-| +)।| +)|´| +)|—| +)​| +)̀| +)⁠| + +QU=================================================| +"(| +")| +""| +" | +"‼| +"!| +"/| +".| +"$| +"%| +"0| +"A| +"あ| +"…| +"-| +"।| +"´| +"—| +"​| +"̀| +"⁠| + +GL=================================================| + (| + )| + "| +  | + ‼| + !| + /| + .| + $| + %| + 0| + A| + あ| + …| + -| + ।| + ´| + —| + ​| + ̀| + ⁠| + +NS=================================================| +‼|(| +‼)| +‼"| +‼ | +‼‼| +‼!| +‼/| +‼.| +‼|$| +‼|%| +‼|0| +‼|A| +‼|あ| +‼|…| +‼-| +‼।| +‼|´| +‼|—| +‼​| +‼̀| +‼⁠| + +EX=================================================| +!|(| +!)| +!"| +! | +!‼| +!!| +!/| +!.| +!|$| +!|%| +!|0| +!|A| +!|あ| +!|…| +!-| +!।| +!|´| +!|—| +!​| +!̀| +!⁠| + +SY=================================================| +/|(| +/)| +/"| +/ | +/‼| +/!| +//| +/.| +/|$| +/|%| +/0| +/|A| +/|あ| +/|…| +/-| +/।| +/|´| +/|—| +/​| +/̀| +/⁠| + +IS=================================================| +.|(| +.)| +."| +. | +.‼| +.!| +./| +..| +.|$| +.|%| +.0| +.A| +.|あ| +.|…| +.-| +.।| +.|´| +.|—| +.​| +.̀| +.⁠| + +PR=================================================| +$(| +$)| +$"| +$ | +$‼| +$!| +$/| +$.| +$|$| +$|%| +$0| +$A| +$あ| +$|…| +$-| +$।| +$|´| +$|—| +$​| +$̀| +$⁠| + +PO=================================================| +%|(| +%)| +%"| +% | +%‼| +%!| +%/| +%.| +%|$| +%|%| +%|0| +%|A| +%|あ| +%|…| +%-| +%।| +%|´| +%|—| +%​| +%̀| +%⁠| + +NU=================================================| +0|(| +0)| +0"| +0 | +0‼| +0!| +0/| +0.| +0|$| +0%| +00| +0A| +0|あ| +0…| +0-| +0।| +0|´| +0|—| +0​| +0̀| +0⁠| + +AL=================================================| +A|(| +A)| +A"| +A | +A‼| +A!| +A/| +A.| +A|$| +A|%| +A0| +AA| +A|あ| +A…| +A-| +A।| +A|´| +A|—| +A​| +À| +A⁠| + +ID=================================================| +あ|(| +あ)| +あ"| +あ | +あ‼| +あ!| +あ/| +あ.| +あ|$| +あ%| +あ|0| +あ|A| +あ|あ| +あ…| +あ-| +あ।| +あ|´| +あ|—| +あ​| +あ̀| +あ⁠| + +IN=================================================| +…|(| +…)| +…"| +… | +…‼| +…!| +…/| +….| +…|$| +…|%| +…|0| +…|A| +…|あ| +……| +…-| +…।| +…|´| +…|—| +…​| +…̀| +…⁠| + +HY=================================================| +-|(| +-)| +-"| +- | +-‼| +-!| +-/| +-.| +-|$| +-|%| +-0| +-|A| +-|あ| +-|…| +--| +-।| +-|´| +-|—| +-​| +-̀| +-⁠| + +BA=================================================| +।|(| +।)| +।"| +। | +।‼| +।!| +।/| +।.| +।|$| +।|%| +।|0| +।|A| +।|あ| +।|…| +।-| +।।| +।|´| +।|—| +।​| +।̀| +।⁠| + +BB=================================================| +´(| +´)| +´"| +´ | +´‼| +´!| +´/| +´.| +´$| +´%| +´0| +´A| +´あ| +´…| +´-| +´।| +´´| +´—| +´​| +´̀| +´⁠| + +B2=================================================| +—|(| +—)| +—"| +— | +—‼| +—!| +—/| +—.| +—|$| +—|%| +—|0| +—|A| +—|あ| +—|…| +—-| +—।| +—|´| +——| +—​| +—̀| +—⁠| + +ZW=================================================| +​|(| +​|)| +​|"| +​| | +​|‼| +​|!| +​|/| +​|.| +​|$| +​|%| +​|0| +​|A| +​|あ| +​|…| +​|-| +​|।| +​|´| +​|—| +​​| +​|̀| +​|⁠| + +CM=================================================| +̀|(| +̀)| +̀"| +̀ | +̀‼| +̀!| +̀/| +̀.| +̀|$| +̀|%| +̀0| +̀A| +̀|あ| +̀…| +̀-| +̀।| +̀|´| +̀|—| +̀​| +̀̀| +̀⁠| + +WJ=================================================| +⁠(| +⁠)| +⁠"| +⁠ | +⁠‼| +⁠!| +⁠/| +⁠.| +⁠$| +⁠%| +⁠0| +⁠A| +⁠あ| +⁠…| +⁠-| +⁠।| +⁠´| +⁠—| +⁠​| +⁠̀| +⁠⁠| + +**********************************| +Korean |character |pairs |with |space| +**********************************| +H2=================================================| +가 |가| +가 |각| +가 |ᄀ| +가 |ᅡ| +가 |ᆨ| + +H3=================================================| +각 |가| +각 |각| +각 |ᄀ| +각 |ᅡ| +각 |ᆨ| + +JL=================================================| +ᄀ |가| +ᄀ |각| +ᄀ |ᄀ| +ᄀ |ᅡ| +ᄀ |ᆨ| + +JV=================================================| +ᅡ |가| +ᅡ |각| +ᅡ |ᄀ| +ᅡ |ᅡ| +ᅡ |ᆨ| + +JT=================================================| +ᆨ |가| +ᆨ |각| +ᆨ |ᄀ| +ᆨ |ᅡ| +ᆨ |ᆨ| + +**********************************| +Korean |character |pairs |without |space| +**********************************| +H2=================================================| +가가| +가각| +가ᄀ| +가ᅡ| +각| + +H3=================================================| +각가| +각각| +각ᄀ| +각ᅡ| +각ᆨ| + +JL=================================================| +ᄀ가| +ᄀ각| +ᄀᄀ| +가| +ᄀᆨ| + +JV=================================================| +ᅡ가| +ᅡ각| +ᅡᄀ| +ᅡᅡ| +ᅡᆨ| + +JT=================================================| +ᆨ가| +ᆨ각| +ᆨᄀ| +ᆨᅡ| +ᆨᆨ| + + +**********************************| +for |--|ai-|as-|id |option | +**********************************| + +AI==================================================| +̀ |¡ |̀ |¡̀¡| + +ID==================================================| +̀ |あ |̀ |あ̀|あ| + +**********************************| +for |--|sp-|cm |option | +**********************************| + +AI==================================================| +̀ |¡ |̀ |¡̀¡| + +OP=================================================| +( ̀| + +CL=================================================| +) |̀| + +QU=================================================| +" |̀| + +GL=================================================| +  |̀| + +NS=================================================| +‼ |̀| + +EX=================================================| +! |̀| + +SY=================================================| +/ |̀| + +IS=================================================| +. |̀| + +PR=================================================| +$ |̀| + +PO=================================================| +% |̀| + +NU=================================================| +0 |̀| + +AL=================================================| +A |̀| + +ID=================================================| +あ |̀| + +IN=================================================| +… |̀| + +HY=================================================| +- |̀| + +BA=================================================| +। |̀| + +BB=================================================| +´ |̀| + +B2=================================================| +— |̀| + +ZW=================================================| +​ |̀| + +CM=================================================| +̀ |̀| + +WJ=================================================| +⁠ |̀| + diff --git a/LBRK.src b/LBRK.src new file mode 100644 index 0000000..99fa786 --- /dev/null +++ b/LBRK.src @@ -0,0 +1,1278 @@ +testpattern for lb7(CM) is realized as duplications in all other rules. + +lb3a: a
 +lb3a: à
 + +lb3b: b + c d + e… +lb3b: b̀ + c̀ d̀ + è… + +lb3c: f
g h + i… +lb3c: f̀
g̀ h̀ + ì… + +lb4 ab cd​ +lb4 àb̀ c̀d̀​ + +lb5 cd​ef +lb5 c̀d̀​èf̀ + +lb8: a]b ]c! d !e;f …;g/g / +lb8: à]̀b̀ ]̀c̀!̀ d̀ !̀è;̀f̀ …;̀g̀/̀g̀ /̀ + +lb9: [ a[ [ +lb9: [̀ à[̀ [̀ +lb9: [ …a…[ [ + +lb10: "[bc " [de +lb10: "̀[̀b̀c̀ "̀ [̀d̀è +lb10: "[bc "…""[de + +lb11: f]‼ g] ‼ +lb11: f̀]̀‼̀ g̀]̀ ‼̀ +lb11: f]‼… g…………] ‼ + +lb11a: h——i j— —k +lb11a: h̀—̀—̀ì j̀—̀ —̀k̀ +lb11a: h—…—i j— —k + +lb11b: l⁠m +lb11b: l̀⁠̀m̀ +lb11b: l⁠…m + +lb12 sp ace +lb12 sp̀ àce + +lb13: a b +lb13: à ̀b̀ + +lb14: a"b"c +lb14: à"̀b̀"̀c̀ + +lb14a: ab +lb14a: à̀b̀ + +lb15: a। + b- + c‼ + ´d + +lb15: à।̀ + b̀-̀ + c̀‼̀ + ´̀d̀ + +lb16: A… + あ… + …… + 0… + +lb16: À…̀ + あ̀…̀ + …̀…̀ + 0̀…̀ + +lb17: あ% + A0 + 0A + +lb17: あ̀%̀ + À0̀ + 0̀À + +lb18: )% + -0 + .0 + 00 + 0% + $a + $- + $あ + $0 + $( + /0 + +lb18: )̀%̀ + -̀0̀ + .̀0̀ + 0̀0̀ + 0̀%̀ + $̀à + $̀-̀ + $̀あ̀ + $̀0̀ + $̀(̀ + /̀0̀ + +lb18b: ᄀᄀ + 가 + ᄀ가 + ᄀ각 + + ᅡᅡ + ᅡᆨ + 가ᅡ + 각 + + ᆨᆨ + 각ᆨ + +lb18b: ᄀ̀ᄀ̀ + ᄀ̀ᅡ̀ + ᄀ̀가̀ + ᄀ̀각̀ + + ᅡ̀ᅡ̀ + ᅡ̀ᆨ̀ + 가̀ᅡ̀ + 가̀ᆨ̀ + + ᆨ̀ᆨ̀ + 각̀ᆨ̀ + +lb18c 각… + 각% + $각 + +lb18c 각̀…̀ + 각̀%̀ + $̀각̀ + +lb19 aa + +lb19 àà + +lb19b .a +lb19b .̀à********************************* +character pairs with space +********************************* +OP================================================= +( ( +( ) +( " +(   +( ‼ +( ! +( / +( . +( $ +( % +( 0 +( A +( あ +( … +( - +( । +( ´ +( — +( ​ +( ̀ +( ⁠ + +CL================================================= +) ( +) ) +) " +)   +) ‼ +) ! +) / +) . +) $ +) % +) 0 +) A +) あ +) … +) - +) । +) ´ +) — +) ​ +) ̀ +) ⁠ + +QU================================================= +" ( +" ) +" " +"   +" ‼ +" ! +" / +" . +" $ +" % +" 0 +" A +" あ +" … +" - +" । +" ´ +" — +" ​ +" ̀ +" ⁠ + +GL================================================= +  ( +  ) +  " +    +  ‼ +  ! +  / +  . +  $ +  % +  0 +  A +  あ +  … +  - +  । +  ´ +  — +  ​ +  ̀ +  ⁠ + +NS================================================= +‼ ( +‼ ) +‼ " +‼   +‼ ‼ +‼ ! +‼ / +‼ . +‼ $ +‼ % +‼ 0 +‼ A +‼ あ +‼ … +‼ - +‼ । +‼ ´ +‼ — +‼ ​ +‼ ̀ +‼ ⁠ + +EX================================================= +! ( +! ) +! " +!   +! ‼ +! ! +! / +! . +! $ +! % +! 0 +! A +! あ +! … +! - +! । +! ´ +! — +! ​ +! ̀ +! ⁠ + +SY================================================= +/ ( +/ ) +/ " +/   +/ ‼ +/ ! +/ / +/ . +/ $ +/ % +/ 0 +/ A +/ あ +/ … +/ - +/ । +/ ´ +/ — +/ ​ +/ ̀ +/ ⁠ + +IS================================================= +. ( +. ) +. " +.   +. ‼ +. ! +. / +. . +. $ +. % +. 0 +. A +. あ +. … +. - +. । +. ´ +. — +. ​ +. ̀ +. ⁠ + +PR================================================= +$ ( +$ ) +$ " +$   +$ ‼ +$ ! +$ / +$ . +$ $ +$ % +$ 0 +$ A +$ あ +$ … +$ - +$ । +$ ´ +$ — +$ ​ +$ ̀ +$ ⁠ + +PO================================================= +% ( +% ) +% " +%   +% ‼ +% ! +% / +% . +% $ +% % +% 0 +% A +% あ +% … +% - +% । +% ´ +% — +% ​ +% ̀ +% ⁠ + +NU================================================= +0 ( +0 ) +0 " +0   +0 ‼ +0 ! +0 / +0 . +0 $ +0 % +0 0 +0 A +0 あ +0 … +0 - +0 । +0 ´ +0 — +0 ​ +0 ̀ +0 ⁠ + +AL================================================= +A ( +A ) +A " +A   +A ‼ +A ! +A / +A . +A $ +A % +A 0 +A A +A あ +A … +A - +A । +A ´ +A — +A ​ +A ̀ +A ⁠ + +ID================================================= +あ ( +あ ) +あ " +あ   +あ ‼ +あ ! +あ / +あ . +あ $ +あ % +あ 0 +あ A +あ あ +あ … +あ - +あ । +あ ´ +あ — +あ ​ +あ ̀ +あ ⁠ + +IN================================================= +… ( +… ) +… " +…   +… ‼ +… ! +… / +… . +… $ +… % +… 0 +… A +… あ +… … +… - +… । +… ´ +… — +… ​ +… ̀ +… ⁠ + +HY================================================= +- ( +- ) +- " +-   +- ‼ +- ! +- / +- . +- $ +- % +- 0 +- A +- あ +- … +- - +- । +- ´ +- — +- ​ +- ̀ +- ⁠ + +BA================================================= +। ( +। ) +। " +।   +। ‼ +। ! +। / +। . +। $ +। % +। 0 +। A +। あ +। … +। - +। । +। ´ +। — +। ​ +। ̀ +। ⁠ + +BB================================================= +´ ( +´ ) +´ " +´   +´ ‼ +´ ! +´ / +´ . +´ $ +´ % +´ 0 +´ A +´ あ +´ … +´ - +´ । +´ ´ +´ — +´ ​ +´ ̀ +´ ⁠ + +B2================================================= +— ( +— ) +— " +—   +— ‼ +— ! +— / +— . +— $ +— % +— 0 +— A +— あ +— … +— - +— । +— ´ +— — +— ​ +— ̀ +— ⁠ + +ZW================================================= +​ ( +​ ) +​ " +​   +​ ‼ +​ ! +​ / +​ . +​ $ +​ % +​ 0 +​ A +​ あ +​ … +​ - +​ । +​ ´ +​ — +​ ​ +​ ̀ +​ ⁠ + +CM================================================= +̀ ( +̀ ) +̀ " +̀   +̀ ‼ +̀ ! +̀ / +̀ . +̀ $ +̀ % +̀ 0 +̀ A +̀ あ +̀ … +̀ - +̀ । +̀ ´ +̀ — +̀ ​ +̀ ̀ +̀ ⁠ + +WJ================================================= +⁠ ( +⁠ ) +⁠ " +⁠   +⁠ ‼ +⁠ ! +⁠ / +⁠ . +⁠ $ +⁠ % +⁠ 0 +⁠ A +⁠ あ +⁠ … +⁠ - +⁠ । +⁠ ´ +⁠ — +⁠ ​ +⁠ ̀ +⁠ ⁠ + +********************************* +without space +********************************* +OP================================================= +(( +() +(" +(  +(‼ +(! +(/ +(. +($ +(% +(0 +(A +(あ +(… +(- +(। +(´ +(— +(​ +(̀ +(⁠ + +CL================================================= +)( +)) +)" +)  +)‼ +)! +)/ +). +)$ +)% +)0 +)A +)あ +)… +)- +)। +)´ +)— +)​ +)̀ +)⁠ + +QU================================================= +"( +") +"" +"  +"‼ +"! +"/ +". +"$ +"% +"0 +"A +"あ +"… +"- +"। +"´ +"— +"​ +"̀ +"⁠ + +GL================================================= + ( + ) + " +   + ‼ + ! + / + . + $ + % + 0 + A + あ + … + - + । + ´ + — + ​ + ̀ + ⁠ + +NS================================================= +‼( +‼) +‼" +‼  +‼‼ +‼! +‼/ +‼. +‼$ +‼% +‼0 +‼A +‼あ +‼… +‼- +‼। +‼´ +‼— +‼​ +‼̀ +‼⁠ + +EX================================================= +!( +!) +!" +!  +!‼ +!! +!/ +!. +!$ +!% +!0 +!A +!あ +!… +!- +!। +!´ +!— +!​ +!̀ +!⁠ + +SY================================================= +/( +/) +/" +/  +/‼ +/! +// +/. +/$ +/% +/0 +/A +/あ +/… +/- +/। +/´ +/— +/​ +/̀ +/⁠ + +IS================================================= +.( +.) +." +.  +.‼ +.! +./ +.. +.$ +.% +.0 +.A +.あ +.… +.- +.। +.´ +.— +.​ +.̀ +.⁠ + +PR================================================= +$( +$) +$" +$  +$‼ +$! +$/ +$. +$$ +$% +$0 +$A +$あ +$… +$- +$। +$´ +$— +$​ +$̀ +$⁠ + +PO================================================= +%( +%) +%" +%  +%‼ +%! +%/ +%. +%$ +%% +%0 +%A +%あ +%… +%- +%। +%´ +%— +%​ +%̀ +%⁠ + +NU================================================= +0( +0) +0" +0  +0‼ +0! +0/ +0. +0$ +0% +00 +0A +0あ +0… +0- +0। +0´ +0— +0​ +0̀ +0⁠ + +AL================================================= +A( +A) +A" +A  +A‼ +A! +A/ +A. +A$ +A% +A0 +AA +Aあ +A… +A- +A। +A´ +A— +A​ +À +A⁠ + +ID================================================= +あ( +あ) +あ" +あ  +あ‼ +あ! +あ/ +あ. +あ$ +あ% +あ0 +あA +ああ +あ… +あ- +あ। +あ´ +あ— +あ​ +あ̀ +あ⁠ + +IN================================================= +…( +…) +…" +…  +…‼ +…! +…/ +…. +…$ +…% +…0 +…A +…あ +…… +…- +…। +…´ +…— +…​ +…̀ +…⁠ + +HY================================================= +-( +-) +-" +-  +-‼ +-! +-/ +-. +-$ +-% +-0 +-A +-あ +-… +-- +-। +-´ +-— +-​ +-̀ +-⁠ + +BA================================================= +।( +।) +।" +।  +।‼ +।! +।/ +।. +।$ +।% +।0 +।A +।あ +।… +।- +।। +।´ +।— +।​ +।̀ +।⁠ + +BB================================================= +´( +´) +´" +´  +´‼ +´! +´/ +´. +´$ +´% +´0 +´A +´あ +´… +´- +´। +´´ +´— +´​ +´̀ +´⁠ + +B2================================================= +—( +—) +—" +—  +—‼ +—! +—/ +—. +—$ +—% +—0 +—A +—あ +—… +—- +—। +—´ +—— +—​ +—̀ +—⁠ + +ZW================================================= +​( +​) +​" +​  +​‼ +​! +​/ +​. +​$ +​% +​0 +​A +​あ +​… +​- +​। +​´ +​— +​​ +​̀ +​⁠ + +CM================================================= +̀( +̀) +̀" +̀  +̀‼ +̀! +̀/ +̀. +̀$ +̀% +̀0 +̀A +̀あ +̀… +̀- +̀। +̀´ +̀— +̀​ +̀̀ +̀⁠ + +WJ================================================= +⁠( +⁠) +⁠" +⁠  +⁠‼ +⁠! +⁠/ +⁠. +⁠$ +⁠% +⁠0 +⁠A +⁠あ +⁠… +⁠- +⁠। +⁠´ +⁠— +⁠​ +⁠̀ +⁠⁠ + +********************************** +Korean character pairs with space +********************************** +H2================================================= +가 가 +가 각 +가 ᄀ +가 ᅡ +가 ᆨ + +H3================================================= +각 가 +각 각 +각 ᄀ +각 ᅡ +각 ᆨ + +JL================================================= +ᄀ 가 +ᄀ 각 +ᄀ ᄀ +ᄀ ᅡ +ᄀ ᆨ + +JV================================================= +ᅡ 가 +ᅡ 각 +ᅡ ᄀ +ᅡ ᅡ +ᅡ ᆨ + +JT================================================= +ᆨ 가 +ᆨ 각 +ᆨ ᄀ +ᆨ ᅡ +ᆨ ᆨ + +********************************** +Korean character pairs without space +********************************** +H2================================================= +가가 +가각 +가ᄀ +가ᅡ +각 + +H3================================================= +각가 +각각 +각ᄀ +각ᅡ +각ᆨ + +JL================================================= +ᄀ가 +ᄀ각 +ᄀᄀ +가 +ᄀᆨ + +JV================================================= +ᅡ가 +ᅡ각 +ᅡᄀ +ᅡᅡ +ᅡᆨ + +JT================================================= +ᆨ가 +ᆨ각 +ᆨᄀ +ᆨᅡ +ᆨᆨ + + +********************************** +for --ai-as-id option +********************************** + +AI================================================== +̀ ¡ ̀ ¡̀¡ + +ID================================================== +̀ あ ̀ あ̀あ + +********************************** +for --sp-cm option +********************************** + +AI================================================== +̀ ¡ ̀ ¡̀¡ + +OP================================================= +( ̀ + +CL================================================= +) ̀ + +QU================================================= +" ̀ + +GL================================================= +  ̀ + +NS================================================= +‼ ̀ + +EX================================================= +! ̀ + +SY================================================= +/ ̀ + +IS================================================= +. ̀ + +PR================================================= +$ ̀ + +PO================================================= +% ̀ + +NU================================================= +0 ̀ + +AL================================================= +A ̀ + +ID================================================= +あ ̀ + +IN================================================= +… ̀ + +HY================================================= +- ̀ + +BA================================================= +। ̀ + +BB================================================= +´ ̀ + +B2================================================= +— ̀ + +ZW================================================= +​ ̀ + +CM================================================= +̀ ̀ + +WJ================================================= +⁠ ̀ + diff --git a/Makefile.am b/Makefile.am index b5d620f..72f36de 100644 --- a/Makefile.am +++ b/Makefile.am @@ -1,2 +1,13 @@ -noinst_PROGRAMS = replace +noinst_PROGRAMS = linebreak replace +verify: linebreak + @echo "checking line breaking..." + @for arg in "" --sp-cm --korean-sp --ai-as-id; do \ + if test "x$$arg" = "x"; then \ + echo " cheking the default algorithm..."; \ + else \ + echo " cheking $$arg..."; \ + fi; \ + ./linebreak $$arg < LBRK.src > temp; \ + diff -au LBRK$$arg.dst temp; \ + done diff --git a/linebreak.c b/linebreak.c new file mode 100644 index 0000000..aea8ff0 --- /dev/null +++ b/linebreak.c @@ -0,0 +1,83 @@ +#include +#include +#include + +#include +#include + +int +main (int argc, char **argv) +{ + char buf[256]; + MSymbol Mutf_8; + int option = 0; + int i; + + M17N_INIT (); + Mutf_8 = msymbol ("utf-8"); + for (i = 1; i < argc; i++) + { + if (strcmp (argv[i], "--sp-cm") == 0) + option |= MTEXT_LBO_SP_CM; + else if (strcmp (argv[i], "--korean-sp") == 0) + option |= MTEXT_LBO_KOREAN_SP; + else if (strcmp (argv[i], "--ai-as-id") == 0) + option |= MTEXT_LBO_AI_AS_ID; + else + { + printf ("Usage: linebreak [--sp-cm] [--korean-sp] [--ai-as-id]\n"); + exit (0); + } + } + + while (fgets (buf, 256, stdin) != NULL) + { + int len = strlen (buf); + MText *mt1, *mt2; + int pos, last_pos = -1; + + if (buf[len - 1] == '\n') + len--; + + mt1 = mconv_decode_buffer (msymbol ("utf-8"), (unsigned char *) buf, len); + pos = mtext_len (mt1) - 1; + while ((pos = mtext_character (mt1, pos, 0, '\\')) >= 0) + { + if (mtext_ref_char (mt1, pos + 1) == 'n') + { + mtext_del (mt1, pos + 1, pos + 2); + mtext_set_char (mt1, pos, '\n'); + } + } + pos = mtext_len (mt1); + mt2 = mtext_dup (mt1); + while (pos > 0) + { + int break_pos = mtext_line_break (mt1, pos, option, NULL); + + if (break_pos > pos) + break; + if (break_pos != last_pos) + { + mtext_ins_char (mt2, break_pos, '|', 1); + last_pos = break_pos; + } + pos = break_pos - 1; + } + + pos = mtext_len (mt2) - 1; + while ((pos = mtext_character (mt2, pos, 0, '\n')) >= 0) + { + mtext_set_char (mt2, pos, '\\'); + mtext_ins_char (mt2, pos + 1, 'n', 1); + } + + mconv_encode_stream (Mutf_8, mt2, stdout); + printf ("\n"); + m17n_object_unref (mt1); + m17n_object_unref (mt2); + } + + M17N_FINI (); + exit (0); +}