Stage 3: Consider a possibility that an Anudatta follows a Halant.
[m17n/m17n-db.git] / FLT / DEVA-OTF.flt
index 7044e19..71913a9 100644 (file)
@@ -1,34 +1,16 @@
 ;; DEVA-OTF.flt -- Font Layout Table for Devanagari OpenType font
-;; Copyright (C) 2003, 2004, 2007
-;;   National Institute of Advanced Industrial Science and Technology (AIST)
-;;   Registration Number H15PRO112
-
-;; This file is part of the m17n database; a sub-part of the m17n
-;; library.
+;; Copyright (C) 2003, 2004, 2007, 2008  AIST (H15PRO112)
+;; See the end for copying conditions.
 
-;; The m17n library is free software; you can redistribute it and/or
-;; modify it under the terms of the GNU Lesser General Public License
-;; as published by the Free Software Foundation; either version 2.1 of
-;; the License, or (at your option) any later version.
-
-;; The m17n library is distributed in the hope that it will be useful,
-;; but WITHOUT ANY WARRANTY; without even the implied warranty of
-;; MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
-;; Lesser General Public License for more details.
-
-;; You should have received a copy of the GNU Lesser General Public
-;; License along with the m17n library; if not, write to the Free
-;; Software Foundation, Inc., 51 Franklin Street, Fifth Floor,
-;; Boston, MA 02110-1301, USA.
+(font layouter deva-otf nil
+      (font (nil nil unicode-bmp :otf=deva=rphf)))
 
 ;;; <li> DEVA-OTF.flt
 ;;;
 ;;; For Devanagari OpenType fonts to draw the Devanagari script.
 
-(font layouter deva-otf nil
-      (font (nil nil unicode-bmp :otf=deva=rphf)))
-
 (category
+ ;; X: generic
  ;; C: consonant (except for RA)
  ;; R: consonant RA
  ;; n: NUKTA
  ;; S: stress sign / accent (above)
  ;; s: stress sign / accent (below)
  ;; V: independent vowel
+ ;; Z: internal use
  ;; N: ZWNJ
  ;; J: ZWJ
- ;; X: generic
  (0x0900 0x097F        ?X)                     ; generic
+ (0x0900       ?Z)                     ; internal use
  (0x0901 0x0902        ?A)                     ; SIGN CANDRABINDU .. ANUSVARA
  (0x0903       ?a)                     ; SIGN VISARGA
  (0x0904 0x0914        ?V)                     ; LETTER SHORT A .. AU
  (0x0958 0x095F        ?C)                     ; LETTER QA .. YYA
  (0x0960 0x0961        ?V)                     ; LETTER VOCALIC RR  .. VOCALIC LL
  (0x0962 0x0963        ?b)                     ; VOWEL SIGN VOCALIC L .. VOCALIC LL
+ (0x0972       ?V)                     ; LETTER CANDRA A
  (0x097B 0x097C        ?C)                     ; LETTER GGA .. JJA
  (0x097E 0x097F        ?C)                     ; LETTER DDDA .. BBA
  (0x200C       ?N)                     ; ZWNJ
  (0x200D       ?J)                     ; ZWJ
  )
 
+;; Stage 0
 ;; Compose consonant and nukta
 (generator
  (0
    ("." =))
   *))
 
-;; Reordering
+;; Stage 1
+;; Syllable identification and eordering.
 (generator
  (0
   (cond
    ;; A syllable containing a vowel sign.
-   ;;1    23                45   6   7      8   9   10  11
-   ("(RH)?(([CR]n?H)*[CR]n?)((m)|(b)|([up]))(A)?(a)?(S)?(s)?"
-    < | (5 =) (2 move-h) (6 =) (11 =) (7 =) (1 otf:deva=rphf+)
-    (8 =) (10 =) (9 =) | >)
+   ;;1      2            34   5   6     7   8   9   10
+   ("([CR]n?(HJ?[CR]n?)*)((m)|(b)|(u|p))(A)?(a)?(S)?(s)?"
+    < | (4 =) (1 move-h) (5 =) (10 =) (6 =) (1 reph) (7 =) (9 =) (8 =) | >)
 
    ;; A syllable without vowel signs but with a vowel modifier.
-   ;;1    23                45   6   7   8
-   ("(RH)?(([CR]n?H)*[CR]n?)((A)|(a))(S)?(s)?"
-    < | (2 move-h) (8 =) (1 otf:deva=rphf+) (5 =) (7 =) (6 =) | >)
+   ;;1      2            34   5   6   7
+   ("([CR]n?(HJ?[CR]n?)*)((A)|(a))(S)?(s)?"
+    < | (1 move-h) (7 =) (1 reph) (4 =) (6 =) (5 =) | >)
 
    ;; No vowel signs, No vowel modifiers, but with a stress sign or an accent.
-   ;;1    23                45   6
-   ("(RH)?(([CR]n?H)*[CR]n?)((S)|(s))"
-    < | (2 move-h) (6 =) (1 otf:deva=rphf+) (5 =) | >)
+   ;;1      2            34   5
+   ("([CR]n?(HJ?[CR]n?)*)((S)|(s))"
+    < | (1 move-h) (5 =) (1 reph) (4 =) | >)
 
-   ;; A special case: eyelash RA
-   ("(RH)J"
-    < (1 otf:deva=half+) >)
+   ;; No marks at all.  Need further anylysis.
+   ("[CR]n?(HJ?[CR]n?)*(H(N|J)?)?"
+    < | (0 nomarks) | >)
 
-   ;; Forced half form.  Do not move halant.
-   ;;1    23
-   ("(RH)?(([CR]n?H)+)J"
-    < | (2 = *) (1 otf:deva=rphf+) | >)
-
-   ;; When a syllable ends with a halant, add a ZWNJ explicitly.
-   ;;1    23                4
-   ("(RH)?(([CR]n?H)*[CR]n?)(HN?)?"
-    < | (2 move-h) (1 otf:deva=rphf+) (4 = 0x200C) | >)
+   ;; This combination is used in Marathi.
+   ((0x0905 0x0945)
+    < | = = | >)
 
    ;; A syllable starting with an independent vowel.
    ;;1  2   3   4   5
 
  (move-h
   (cond
-   ("([CRnH]+)(H)(R)$"
+   ;; Starting with an eyelash-RA, which remains there.
+   ("(RHJ.+)(H)(R)$"
+    (1 = *) (3 =) (2 =))
+   ("RHJ.*"
+    = *)
+
+   ;; Starting with a reph, which is removed.
+   ("RH(.+)(H)(R)$"
+    (1 = *) (3 =) (2 =))
+   ("RH(.+)"
+    (1 = *))
+
+   ("(.+)(H)(R)$"
     (1 = *) (3 =) (2 =))
    (".+"
-    = *))))
+    = *)))
+
+ (reph
+  (cond
+   ("RHJ.*")
+   ("(RH).*"
+    (1 otf:deva=rphf+))))
 
-;; If a syllable ends with a halant and a ZWNJ, render the final
-;; halant explicitly.  Do not apply 'blwf' nor 'half' to the initial
-;; RA.
+ (del-reph
+  (cond
+   ("RHJ.*"
+    = *)
+   ("RH(.*)"
+    (1 = *))
+   (".+"
+    = *)))
+
+ (nomarks
+  (cond
+   ;; Ending with a Halant and a ZWJ.
+   (".+HJ$"
+    (0 del-reph) (0 reph))
+
+   ;; Ending with a Halant and an optional ZWNJ.  Add ZWNJ explicitly.
+   ("(.+)(H)N?$"
+    (1 move-h) (1 reph) (2 =) 0x200C)
+
+   ;; Ending with a consonant.
+   (".+"
+    (0 move-h) (0 reph))))
+ )
+
+;; Stage 2
+;; Apply GSUB features.  If a syllable ends with a halant and a ZWNJ,
+;; render the final halant explicitly.
 (generator
  (0
   (cond
-   (" (R)([^N]*)(H)N "
-    | (1 =) (2 gsub1) (3 =) |)
+   ;; Allow eyelash RA to appear at the beginning.
+   (" (RH)J([^ ]+)(H)N "
+    | (1 otf:deva=half+) (2 gsub) (3 =) |)
+   (" (m)?(RH)J([^ ]*) "
+    | (1 =) (2 otf:deva=half+) (3 gsub) |)
+
+   ;; Avoid applying 'blwf' and 'half' to the "RH" at the beginning;
+   (" (R)([^ ]*)(H)N "
+    | (1 =) (2 gsub) (3 =) |)
    (" (m?R)([^ ]*) "
-    | (1 = *) (2 gsub1) (3 = *) |)
-   (" ([^N]+)(H)N "
-    | (1 gsub1) (2 =) |)
+    | (1 otf:deva=pres+) (2 gsub) |)
+
+   (" ([^ ]+)(H)N "
+    | (1 gsub) (2 =) |)
    (" ([^ ]+) "
-    | (1  gsub1) |)
+    | (1 gsub) |)
+
    ("." =))
   *)
 
- (gsub1
-  otf:deva=nukt,akhn,blwf,half,vatu,pres+))
+ ;; Dispite Rule R5a (The Unicode Standard 5.0, p.305), we use the
+ ;; below form to depict the sequence "RHJ" at non-initial positions.
+ ;; This is to avoid interpreting the sequence "CHRHJ" as "CH" +
+ ;; "RHJ".  It should be parsed as "CHR" + "HJ".
+ (gsub
+  (cond
+   ("([^J]*)J(.*)"
+    (1 otf:deva=nukt,akhn,blwf,half,vatu,pres+) (2 gsub))
+   (".*"
+    otf:deva=nukt,akhn,blwf,half,vatu,pres+)))
+ )
 
-;; Apply other features.  The 'pres' feature is applied again for
-;; pre-base vowel sign.
+;; Stage 3
+;; Apply other features.
 (generator
  (0
   (cond
    (" ([^ ]+) "
-    (1 otf:deva=pres,abvs,blws,psts,haln+abvm,blwm,dist))
+    (1 otf:deva=abvs,blws,psts,haln+abvm,blwm,dist))
    ("."
     [ = ]))
   *))
 
+;; Copyright (C) 2003, 2004, 2007, 2008
+;;   National Institute of Advanced Industrial Science and Technology (AIST)
+;;   Registration Number H15PRO112
+
+;; This file is part of the m17n database; a sub-part of the m17n
+;; library.
+
+;; The m17n library is free software; you can redistribute it and/or
+;; modify it under the terms of the GNU Lesser General Public License
+;; as published by the Free Software Foundation; either version 2.1 of
+;; the License, or (at your option) any later version.
+
+;; The m17n library is distributed in the hope that it will be useful,
+;; but WITHOUT ANY WARRANTY; without even the implied warranty of
+;; MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
+;; Lesser General Public License for more details.
+
+;; You should have received a copy of the GNU Lesser General Public
+;; License along with the m17n library; if not, write to the Free
+;; Software Foundation, Inc., 51 Franklin Street, Fifth Floor,
+;; Boston, MA 02110-1301, USA.
+
 ;; Local Variables:
 ;; mode: emacs-lisp
 ;; End: