* Using the letter frequency data from the:
authorntakahas <ntakahas>
Thu, 14 Jun 2007 06:10:34 +0000 (06:10 +0000)
committerntakahas <ntakahas>
Thu, 14 Jun 2007 06:10:34 +0000 (06:10 +0000)
  "UCSC LTRL Sinhala Corpus Version 1 June 2006�� (7M words).
  The total number of letters is 33880970. All percentages are
  rounded to 2dps.

* Assign the most frequent letter within a grouping to the unshifted
level,
  then the next most frequent to the shifted level, then the alt-gr
level,
  and the least frequent to shift plus alt-gr level. However, if
Alpapraana
  and Mahaapraana pairs exist, keep them consecutive.

* Key 'd':
  (U+0daf)      1006218 (2.97%)
  (U+0db0)      164704 (0.49%)
  (U+0da9)      171139 (0.51%)
  (U+0daa)      1229 (0.00%)

* Key 's':
  (U+0dc3)      1259498 (3.72%)
  (U+0dc1)      181189 (0.53%)
  (U+0dc2)      118730 (0.35%)

* Key 't':
  (U+0dad)      1568636 (4.63%)
  (U+0dae)      68688 (0.20%)
  (U+0da7)      712353 (2.10%)
  (U+0da8)      11415 (0.03%)

* Key 'x':
  (U+0db3)      120051 (0.35%)
  (U+0dac)      10360 (0.03%)

im/si-phonetic-static.mim

index 8ec2f83..152504a 100644 (file)
@@ -1,7 +1,7 @@
 ;; si-phonetic-static.mim -- Sinhala phonetic static keymap
 ;; m17n Keymap file for Sinhala (Sri Lanka) (2006-04-26)
 ;; Maintainer: Harshula Jayasuriya <harshula@gmail.com>
 ;; si-phonetic-static.mim -- Sinhala phonetic static keymap
 ;; m17n Keymap file for Sinhala (Sri Lanka) (2006-04-26)
 ;; Maintainer: Harshula Jayasuriya <harshula@gmail.com>
-;; Last Updated: 2006-08-15
+;; Last Updated: 2007-06-14
 ;; This is a phonetic static mapping for a standard US-English keyboard
 ;; (qwerty)
 ;; http://www.nongnu.org/sinhala/doc/keymaps/sinhala-keyboard_3.html
 ;; This is a phonetic static mapping for a standard US-English keyboard
 ;; (qwerty)
 ;; http://www.nongnu.org/sinhala/doc/keymaps/sinhala-keyboard_3.html
   ("z" "ඤ")          ; 0x0da4 - taaluja naasikyaya (nya)
   ("Z" "ඥ")          ; 0x0da5 - taaluja sanyooga naasikyaya (jnya)
   ((A-j) "ඦ")                ; 0x0da6 - sanyaka jayanna (nyja)
   ("z" "ඤ")          ; 0x0da4 - taaluja naasikyaya (nya)
   ("Z" "ඥ")          ; 0x0da5 - taaluja sanyooga naasikyaya (jnya)
   ((A-j) "ඦ")                ; 0x0da6 - sanyaka jayanna (nyja)
-  ("t" "ට")          ; 0x0da7 - alpapraana ttayanna (tta)
-  ("T" "ඨ")          ; 0x0da8 - mahaapraana ttayanna (ttha)
-  ("d" "ඩ")          ; 0x0da9 - alpapraana ddayanna (dda)
-  ("D" "ඪ")          ; 0x0daa - mahaapraana ddayanna (ddha)
+  ((A-t) "ට")                ; 0x0da7 - alpapraana ttayanna (tta)
+  ((A-T) "ඨ")                ; 0x0da8 - mahaapraana ttayanna (ttha)
+  ((A-d) "ඩ")                ; 0x0da9 - alpapraana ddayanna (dda)
+  ((A-D) "ඪ")                ; 0x0daa - mahaapraana ddayanna (ddha)
   ("N" "ණ")          ; 0x0dab - muurdhaja nayanna (nna)
   ("N" "ණ")          ; 0x0dab - muurdhaja nayanna (nna)
-  ("x" "ඬ")          ; 0x0dac - sanyaka ddayanna (nndda)
-  ((A-t) "ත")                ; 0x0dad - alpapraana tayanna (ta)
-  ((A-T) "ථ")                ; 0x0dae - mahaapraana tayanna (tha)
-  ((A-d) "ද")                ; 0x0daf - alpapraana dayanna (da)
-  ((A-D) "ධ")                ; 0x0db0 - mahaapraana dayanna (dha)
+  ("X" "ඬ")          ; 0x0dac - sanyaka ddayanna (nndda)
+  ("t" "ත")          ; 0x0dad - alpapraana tayanna (ta)
+  ("T" "ථ")          ; 0x0dae - mahaapraana tayanna (tha)
+  ("d" "ද")          ; 0x0daf - alpapraana dayanna (da)
+  ("D" "ධ")          ; 0x0db0 - mahaapraana dayanna (dha)
   ("n" "න")          ; 0x0db1 - dantaja nayanna (na)
   ("n" "න")          ; 0x0db1 - dantaja nayanna (na)
-  ("X" "ඳ")          ; 0x0db3 - sanyaka dayanna (nda)
+  ("x" "ඳ")          ; 0x0db3 - sanyaka dayanna (nda)
   ("p" "ප")          ; 0x0db4 - alpapraana payanna (pa)
   ("P" "ඵ")          ; 0x0db5 - mahaapraana payanna (pha)
   ("b" "බ")          ; 0x0db6 - alpapraana bayanna (ba)
   ("p" "ප")          ; 0x0db4 - alpapraana payanna (pa)
   ("P" "ඵ")          ; 0x0db5 - mahaapraana payanna (pha)
   ("b" "බ")          ; 0x0db6 - alpapraana bayanna (ba)
@@ -72,8 +72,8 @@
   ("r" "ර")          ; 0x0dbb - rayanna (ra)
   ("l" "ල")          ; 0x0dbd - dantaja layanna (la)
   ("v" "ව")          ; 0x0dc0 - vayanna (va)
   ("r" "ර")          ; 0x0dbb - rayanna (ra)
   ("l" "ල")          ; 0x0dbd - dantaja layanna (la)
   ("v" "ව")          ; 0x0dc0 - vayanna (va)
-  ((A-s) "ශ")                ; 0x0dc1 - taaluja sayanna (sha)
-  ("S" "ෂ")          ; 0x0dc2 - muurdhaja sayanna (ssa)
+  ("S" "ශ")          ; 0x0dc1 - taaluja sayanna (sha)
+  ((A-s) "ෂ")                ; 0x0dc2 - muurdhaja sayanna (ssa)
   ("s" "ස")          ; 0x0dc3 - dantaja sayanna (sa)
   ("h" "හ")          ; 0x0dc4 - hayanna (ha)
   ("L" "ළ")          ; 0x0dc5 - muurdhaja layanna (lla)
   ("s" "ස")          ; 0x0dc3 - dantaja sayanna (sa)
   ("h" "හ")          ; 0x0dc4 - hayanna (ha)
   ("L" "ළ")          ; 0x0dc5 - muurdhaja layanna (lla)