CN101751140B - 现代藏文字母和键盘键位一一对应的输入法 - Google Patents
现代藏文字母和键盘键位一一对应的输入法 Download PDFInfo
- Publication number
- CN101751140B CN101751140B CN2008102435252A CN200810243525A CN101751140B CN 101751140 B CN101751140 B CN 101751140B CN 2008102435252 A CN2008102435252 A CN 2008102435252A CN 200810243525 A CN200810243525 A CN 200810243525A CN 101751140 B CN101751140 B CN 101751140B
- Authority
- CN
- China
- Prior art keywords
- key
- tibetan
- input
- keys
- keyboard
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000013515 script Methods 0.000 title 1
- 230000006870 function Effects 0.000 claims abstract description 4
- 230000010365 information processing Effects 0.000 abstract description 2
- 238000000354 decomposition reaction Methods 0.000 description 9
- 150000001875 compounds Chemical class 0.000 description 4
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
Images
Landscapes
- Document Processing Apparatus (AREA)
- Input From Keyboards Or The Like (AREA)
Abstract
本发明涉及藏文信息处理技术,特别涉及现代藏文音节、梵音藏文组合字符、藏文数字、藏文符号的计算机键盘编码输入。记L是藏文字符集GB 16959中的93个藏文字符构成的集合,K是国际通用QWERTY键盘中除m外的所有字符构成的集合,指定m键为辅助键。本发明建立了L和码元集合K间的一一对应,在m键的辅助下实现全部现代藏文音节、梵音藏文组合字符、藏文数字和常用藏文符号的键盘输入。本发明中辅助键m有两个功能:一是消除所有成对出现的重码,二是结合藏文数字的码元完成相应半值数字的输入。和其它藏文输入法比起来,本发明所需要的键位总数更少、键位布局更合理,使得藏文的输入更加方便和高效。
Description
技术领域
本发明涉及藏文信息处理技术,特别涉及藏文的计算机键盘编码输入。
背景技术
英文字母和键盘键位间的一一对应使得英文的键盘输入方便且自然。藏文虽然也是拼音文字,但由于现有的各种藏文输入方式中,藏文字母和键盘键位间的不一一对应使得藏文的键盘输入比较繁琐。
微软依据藏文键盘标准GB/T 22034《信息技术藏文编码字符集键盘字母数字区的布局》制作了藏文键盘Tibetan(PRC)。Tibetan(PRC)中,一个辅音字母至少需要两个键位:字母的占位(spacing)形式和不占位(nonspacing)形式分别对应不同的键位,个别辅音(例如:字母)甚至需要四个键位。为了输入包括图形符号在内的全部藏文需要192个键位,而为了得到如此众多的键位,Tibetan(PRC)将键盘分为五级:常规键盘(Regular Keyboard)、m键盘、M键盘、shift键盘和CtrlAltShift键盘。使用后发现Tibetan(PRC)有以下缺陷:第一,键盘切换频繁,不占位辅音的输入只有切换到m键盘才能完成,75%的现代藏文音节至少有一个不占位辅音,这意味着常规键盘和m键盘之间的切换频率高达75%,如此高的键盘切换频率制约着输入速度的进一步提高;第二,找字困难,由于192个字符分布在五级键盘上,用户记住并熟悉这些字符的键位分布需要付出较大的学习代价;第三,按键过程复杂,输入CtrlAltShift键盘上的一个字符需要同时按下四个键位(例如:输入元音需要同时按下Ctrl键、Alt键、Shift键和i键),复杂的按键过程使得藏文的输入很不方便。
和藏文键盘Tibetan(PRC)相比,藏文输入法所需的键位数就少得多,但到目前为止还没有一个输入法能实现字母和键位间的一一对应。现有的输入法中,多数字母只和一个键位对应但是辅音和却分别和两个或者两个以上的键位对应,即字母和键位间存在一对多现象,这导致了输入藏文所需的键位数多于字母数。为了用最方便的常规键盘(RegularKeyboard)实现现代藏文和常用标点符号的输入,多数输入法都采用字符归并技术。所谓字符归并就是在不产生重码或者产生重码极少的前提下将两个藏文字符映射到同一个键位上。显然,字符归并又导致了字母和键位间的多对一。
总之,无论是藏文键盘还是藏文输入法,字母和键位间不是一一对应的。
发明内容
本发明设计了一种藏文输入法,本输入法中指定国际通用QWERTY键盘中的m键为辅助键,建立了藏文字符集合L和QWERTY键盘中除m外的所有字符构成的集合K间的一一对应,得到本输入法的键盘布局,在m键的辅助下实现现代藏文音节、梵音藏文组合字符、藏文数字和常用藏文符号的键盘输入。辅助键m有两个功能:一是消除所有成对出现的重码,二是结合藏文数字对应的键位完成相应半值数字的输入。
1本发明的键盘布局
为了下文叙述方便,用L表示藏文字符集基本集GB 16959中的93字符 构成的集合,K表示国际通用QWERTY键盘中除m键外的字母、符号构成的集合即{-、!、@、#、$、%、^、&、*、(、)、-、+、Q、W、E、R、T、Y、U、I、O、P、{、}、|、A、S、D、F、G、H、J、K、L、:、”、Z、X、C、V、B、N、M、<、>、?、`、1、2、3、4、5、6、7、8、9、0、-、=、q、w、e、r、t、y、u、i、o、p、[、]、\、a、s、d、f、g、h、j、k、l、;、’、z、x、c、v、b、n、,、.、/}。指定QWERTY键盘中的m键为辅助键,建立藏文字符集合L和键位集合K间的一一对应,在m键的辅助下全部现代藏文音节、梵音藏文组合字符、藏文数字和常用藏文符号的键盘输入。
在m键的辅助下,利用集合L和集合K间一一对应的键盘输入藏文是否可行,最好的解决办法就是在集合L和K间建立一种具体的对应,然后检验用它输入藏文是否可行。集合L和K间有多种一一对应,而其中的一种一一对应关系,按先Shift键盘后常规键盘、同一级键盘中各行从上到下、同一行中各键位从左到右的顺序列举如下:
2现代藏文字母和键盘键位间的一一对应
多数用户经常输入的是现代藏文,所以,将现代藏文字母全分配在常规键盘上,并且为了减少用户的学习代价,使本发明和GB 22034的常规键盘的布局一致(见图1)。由于计算机用户对QWERTY键盘很熟悉,因此,下文中用QWERTY键盘上的字符表示相应的键位。
利用如图1所示的常规键盘上的布局可对现代藏文音节进行键盘编码:对现代藏文以音节为单位、按书写顺序进行编码。例如:按照书写顺序音节依次由字母和组成,由图1知这些字母对应的键位分别是h、s、k、r、i和l,因此,音节的键盘编码是hskril。对其它的现代藏文音节照此编码。
3现代藏文音节间的重码特点和重码的消除
对常用的4631个现代藏文音节按照§2的规则编码后共产生了116个重码,但这些重码都是成对出现的,也就是说这116个重码两两相重共形成58对(例如:编码kyk对应一对重码:和)。由于重码是成对出现的,因此,可以统一用m键来消除所有重码。具体做法是比较重码对中两个音节的使用频率,在使用频率较低音节的键盘编码后缀一个m。例如:编码kyk对应的一对重码是和,由于音节的使用频率较低,因此,音节的编码仍为kyk,而使音节的编码为kykm。对于现代藏文音节间的其它重码可同样用m来消除。
对常用的4631个现代藏文音节键盘编码后共产生58对重码,消除这些重码需要使用m键58次,因此,m键的使用频率为1.25%。实际应用中只有需要输入重码对中频率较低的音节时才需要m键,也就是说m键的实际使用频率远低于1.25%。
4字形分解
一个完善的藏文输入法不仅要输入现代藏文音节还要输入梵音藏文字符、半值数字以及图形符号。为了用尽可能少的键位实现全部藏文的输入,首先进行字形分解,所谓字形分解就是按照书写顺序将一个复合字形分解成基本字形的序列。本发明主要对四类字形进行分解:复合元音、部分梵音藏文辅音、藏文半值数字和部分图形符号。
每个字符在Unicode字符数据库(Unicode Character Database)中有一条属性记录,依据属性记录中组元编码(Decomposition_Mapping)字段的值可判断一个字形能否分解:如果组元编码字段值为空则表示该字符不能分解,否则,表示该字符能分解并且这个值就是分解后字符的编码。例如:复合元音(0F73)在Unicode字符数据库中的记录为:
0F73;TIBETAN VOWEL SIGN II;Mn;0;NSM;0F71 0F72;;;;N;;;;;其中,组元编码字段值0F71 0F72表明复合元音(0F73)可分解成元音(0F71)和(0F72)。复合元音和的组元编码字段有类似的属性值,对它们可进行类似的分解(见表1中序号为1-9的字符)。
表1可分解字符的分解结果
梵音藏文辅音(0F43)在Unicode字符数据库中的记录为:
0F43;TIBETAN LETTER GHA;Lo;0;L;0F42 0FB7;;;;N;;;;;
其中,组元编码字段的值0F42 0FB7表明辅音可看作字母(0F42)和(0FB7)的组合,也就是说,梵音藏文字母就可分解成字母和。梵音藏文辅音和的组元编码字段有类似的属性值,对它们可进行类似的分解(见表1中序号为10-15的字符)。虽然,音节符号符号的组元编码字段为空,但是如果按照书写顺序将它们分解成基本字形的序列也是合理的(见表1中序号为16-18的字符)。
对部分符号的分解则借鉴了MS Word对省略号的做法,当MS Word中连续输入三个半角句号则会立即被替换成一个省略号“…”,这相当于把省略号分解成了三个半角句号。考察藏文字符集发现,对等5个图形符号也可按此规则进行字形分解,表1列出了5个可这样分解的图形符号(见表1中序号为19-23的字符)。
藏文有10个特殊的数字称为半值数字:从字形上看,每个藏文数字添加笔划就得到相应的半值数字(见表中序号为24-33的字符),或者说笔划是一个半值数字和相应数字在字形上的区别。因此,一个半值数字可以分解成相应的全值数字和笔划
当然,字形分解仅仅是为了减少输入法所需键位的个数,通过输入法输入的字符仍然是原字符,例如:字符可分解成和,而和对应的键位分别是k和-,所以,k-是字符的键盘编码,而通过这个编码输入的仍然是字符(0F43)。这和汉字的五笔输入法中,将“多”进行字形拆分成“夕”、“夕”,然后利用“夕”、“夕”的编码QQ输入“多”是一样的。
表1列出了所有可分解的字母和符号,可以看出通过合理的字形分解,这些字符可以借助基本字形的编码实现输入而不必单独为它们指定键位,从而大幅减少了键位总数。5梵音藏文、半值数字以及图形符号的输入
对于梵音藏文以一个垂直组合字符为单位、按照书写顺序依次进行编码。例如:梵音藏文依次由字母构成,而字母又进一步可以分解成序列,也就是说梵音藏文组合字符最终可分解成字母序列:,这些字母对应的键位分别是:.、y、e、e。因此,梵音藏文组合字符的键盘编码是:.yee。对其它梵音藏文组合字符用同样的方法进行编码。
由于每个藏文数字添加笔画就得到了相应的半值数字(见表1中编号为24-33得字符)。因此,十个全值数字的键位不仅可完成它们自己的输入,结合的键位还可实现10个半值数字的输入。例如:为笔划指定键位m,则的输入码为1m,的输入码为2m,等等。
本输入法对大部分不可分解的图形符号安排了独立的键位(见图2),对于可分解的图形符号按照表1的分解规律通过编码输入,这样本发明还实现了绝大多数图形符号的输入。
6梵音藏文组合字符和现代藏文音节间重码的消除
对较常用的1003个梵音藏文字符按照§4的规则进行编码,添加到4631个现代藏文音节的编码中后,重码总数增加到了103对,重码率也上升到1.83%。但新增的都是梵音藏文字符和现代藏文音节间的重码(例如:和),梵音藏文组合字符之间并没有产生重码。对于梵音藏文组合字符和现代藏文音节间的重码仍然用m键来消除,方法是在梵音藏文字符键盘编码后缀一个m,这是因为和现代藏文音节相比,梵音藏文组合字符的使用频率普遍很低。
由§3、§5和§6可以看出,辅助键m有两个功能:一是消除所有成对出现的重码,二是结合藏文数字对应的键位完成相应半值数字的输入。
发明的优点和积极效果
1.本发明最主要的优点是建立了藏文字符集合L和QWERTY键盘中除m外的字符构成的集合K间的一一对应,克服了现有各种藏文输入方式中存在的藏文字符和键盘键位间存在一对多、多对一现象的弊端,使得藏文的键盘输入更加方便和高效。
2.对于现代藏文音节和现代藏文音节、现代藏文音节和梵音藏文组合字符间的少量重码可统一用辅助键m消除,而且辅助键m的使用频率很低:对于使用梵音藏文较多的用户来说,m键的使用率低于1.83%;对于很少使用梵音藏文的用户来说,m键的使用率低于0.97%;如果以词组为单位输入则m键的使用率约为万分之一。
3.克服了藏文键盘Tibetan(PRC)的两大弊端:频繁的键盘切换和复杂的按键过程,使得本发明的按键效率明显提高(见表2)。此处的按键效率是指一个音节中藏文字母的个数和输入该音节所需的按键次数之比。
表2本发明和Tibetan(PRC)的按键效率对比
注:表示Ctrl键,表示Alt键,表示Shift键。
附图说明
图1是本发明中常规键盘(Regular Keyboard)的键盘布局图。
图2是本发明中Shift键盘(Shift Keyboard)的键盘布局图。
实施方式举例
本发明中的藏文输入法,建立了藏文字符集合L和国际通用QWERTY键盘中除m外的所有字符构成的集合K间的一一对应,在辅助键m的辅助下实现现代藏文音节、梵音藏文组合字符、藏文数字和常用藏文符号的键盘输入:
①现代藏文音节的输入方法:按照现代藏文音节的书写顺序,将音节中每个字母对应的键位依次输入到编码输入窗口(composition window),当候选窗口(Candidate window)中只有一个候选项或者虽然有两个候选项但用户期望输入第一项时,敲击空格键完成输入;当候选窗口中有两个候选项并且用户期望输入第二项时,依次敲击m键和空格键完成输入;
②梵音藏文组合字符的输入方法:按照梵音藏文组合字符的书写顺序,将组合字符中每个字母对应的键位依次输入到编码输入窗口,当候选窗口中只有一个候选项则敲击空格键即可完成输入;当候选窗口中有两个候选项时,则依次敲击m键和空格键;
③半值数字的输入方法:在编码输入窗口输入相应藏文数字对应的键位,然后依次敲击m键和空格键;
④图形符号的输入方法:输入属于集合L的图形符号时,将这个图形符号对应的键位输入到编码输入窗口中,然后敲击空格键;输入可分解的图形符号时,将分解后序列中每个字母或者符号的码元依次输入到编码输入窗口中,然后敲击空格键。
Claims (2)
1.一种藏文输入法,L表示藏文字符集GB 16959中的字符 构成的集合,K表示国际通用QWERTY键盘中除m键外的字母、符号构成的码元集合{~、!、@、#、$、%、^、&、*、(、)、_、+、Q、W、E、R、T、Y、U、I、O、P、{、}、|、A、S、D、F、G、H、J、K、L、:、”、Z、X、C、V、B、N、M、<、>、?、`、1、2、3、4、5、6、7、8、9、0、-、=、q、w、e、r、t、y、u、i、o、p、[、]、\、a、s、d、f、g、h、j、k、l、;、’、z、x、c、v、b、n、,、.、/},指定国际通用QWERTY键盘中的m键为辅助键,其特征在于集合L中的每一个字母代表它的各种显现形式;建立藏文字符集合L和码元集合K间的一一对应;辅助键m有两个功能:一是消除所有成对出现的重码,二是结合藏文数字的码元完成相应半值数字的输入;在m键的辅助下实现全部现代藏文音节、梵音藏文组合字符、藏文数字和常用藏文符号的键盘输入;现代藏文音节、梵音藏文组合字符、藏文半值数字、藏文图形符号的输入方法依次为:
①现代藏文音节的输入方法:按照现代藏文音节的书写顺序,将音节中每个字母对应的码元依次输入到编码输入窗口,当候选窗口中只有一个候选项或者虽然有两个候选项但用户期望输入第一项时,敲击空格键完成输入;当候选窗口中有两个候选项并且用户期望输入第二项时,依次敲击m键和空格键完成输入;
②梵音藏文组合字符的输入方法:按照梵音藏文组合字符的书写顺序,将组合字符中每个字母对应的码元依次输入到编码输入窗口,当候选窗口中只有一个候选项或者虽然有两个候选项但用户期望输入第一项时,敲击空格键完成输入;当候选窗口中有两个候选项并且用户期望输入第二项时,依次敲击m键和空格键完成输入;
③半值数字的输入方法:在编码输入窗口输入相应藏文数字对应的码元,依次敲击m键和空格键完成输入;
④图形符号的输入方法:输入属于集合L的图形符号时,将这个图形符号的码元输入到编码输入窗口,敲击空格键完成输入;输入可分解的图形符号时,将分解后序列中每个字母或者符号的码元依次输入到编码输入窗口,敲击空格键完成输入。
2.根据权利要求1所述的一种藏文输入法,其特征是集合L和集合K间的一一对应关系,按照先Shift键盘后常规键盘、同一级键盘中各行从上到下、同一行中各键位从左到右的顺序列举如下:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008102435252A CN101751140B (zh) | 2008-12-22 | 2008-12-22 | 现代藏文字母和键盘键位一一对应的输入法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008102435252A CN101751140B (zh) | 2008-12-22 | 2008-12-22 | 现代藏文字母和键盘键位一一对应的输入法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101751140A CN101751140A (zh) | 2010-06-23 |
CN101751140B true CN101751140B (zh) | 2011-08-10 |
Family
ID=42478186
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008102435252A Expired - Fee Related CN101751140B (zh) | 2008-12-22 | 2008-12-22 | 现代藏文字母和键盘键位一一对应的输入法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101751140B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103984420B (zh) * | 2014-04-10 | 2017-11-14 | 中央民族大学 | 一种基于拼音的藏文智能输入法 |
CN104503599B (zh) * | 2015-01-13 | 2017-12-26 | 青海师范大学 | 一种基于36键位的藏文输入系统 |
CN105807949B (zh) * | 2016-03-06 | 2019-02-22 | 尼玛扎西 | 藏文输入方法和系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1696880A (zh) * | 2005-05-08 | 2005-11-16 | 卢亚军 | 藏文计算机通用键盘布局与输入法 |
CN1770072A (zh) * | 2005-09-21 | 2006-05-10 | 兰州大学 | 藏文编码输入法及键盘 |
-
2008
- 2008-12-22 CN CN2008102435252A patent/CN101751140B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1696880A (zh) * | 2005-05-08 | 2005-11-16 | 卢亚军 | 藏文计算机通用键盘布局与输入法 |
CN1770072A (zh) * | 2005-09-21 | 2006-05-10 | 兰州大学 | 藏文编码输入法及键盘 |
Non-Patent Citations (1)
Title |
---|
仁青诺布等.藏文输入法研究初探.《西藏大学学报》.2006,第21卷(第4期),第115-121页. * |
Also Published As
Publication number | Publication date |
---|---|
CN101751140A (zh) | 2010-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7417566B2 (en) | Sequential two-key system to input keyboard characters and many alphabets on small keypads | |
CN101017397A (zh) | 计算机汉字输入系统及输入方法 | |
CN101751140B (zh) | 现代藏文字母和键盘键位一一对应的输入法 | |
CN1262473A (zh) | 小型数字键盘拼音汉字输入方法 | |
CN101118463A (zh) | 用于数字键盘的汉语拼音输入方法 | |
CN103376910A (zh) | 无重码双拼输入法 | |
KR101319948B1 (ko) | 소프트웨어 키보드를 이용한 문자 입력 방법 | |
CN102750000A (zh) | 双拼王输入法 | |
CN101135938B (zh) | 一种汉字元拼双音输入方法 | |
CN100533359C (zh) | 甲骨文拼音与部件拆分输入法 | |
CN100476826C (zh) | 中文字型排序检索方法和装置以及一种信息系统 | |
CN102750009B (zh) | 一种无切换汉字输入法及键盘 | |
CN100403239C (zh) | 基于英文键盘的藏文输入法 | |
CN101952790B (zh) | 适用于中文教学的汉字输入方法 | |
CN105183183A (zh) | 一种方块苗文的音形结合快速输入编码及其优化方法 | |
CN104503599B (zh) | 一种基于36键位的藏文输入系统 | |
CN102368177A (zh) | 新汉字声韵输入方法及输入键盘 | |
CN101408807A (zh) | 一种输入中英文字符串的方法 | |
KR100918082B1 (ko) | 사전식 순서 및 사용 빈도를 이용한 문자 입력 장치 | |
CN101071337A (zh) | 一种拼音字母、数字的汉字输入法及键盘和屏幕的显示方法 | |
CN100390710C (zh) | 快易汉字输入法 | |
CN103576891A (zh) | 一键快打字 | |
CN102141844B (zh) | 带声、韵、调读音的汉字内码输入法 | |
CN101706685A (zh) | 一种汉字输入法 | |
CN100428121C (zh) | 五加加汉字输入法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110810 Termination date: 20111222 |