CN1129058C - 仿真拼音汉字输入法 - Google Patents
仿真拼音汉字输入法 Download PDFInfo
- Publication number
- CN1129058C CN1129058C CN 00113828 CN00113828A CN1129058C CN 1129058 C CN1129058 C CN 1129058C CN 00113828 CN00113828 CN 00113828 CN 00113828 A CN00113828 A CN 00113828A CN 1129058 C CN1129058 C CN 1129058C
- Authority
- CN
- China
- Prior art keywords
- chinese
- character
- syllable
- phonetic
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000013461 design Methods 0.000 title description 8
- 150000001875 compounds Chemical class 0.000 claims description 60
- 238000000034 method Methods 0.000 claims description 19
- 230000033228 biological regulation Effects 0.000 claims description 14
- 230000000630 rising effect Effects 0.000 claims description 14
- 235000017166 Bambusa arundinacea Nutrition 0.000 claims description 10
- 235000017491 Bambusa tulda Nutrition 0.000 claims description 10
- 235000015334 Phyllostachys viridis Nutrition 0.000 claims description 10
- 239000011425 bamboo Substances 0.000 claims description 10
- 239000000203 mixture Substances 0.000 claims description 8
- 238000005096 rolling process Methods 0.000 claims description 6
- 239000002023 wood Substances 0.000 claims description 6
- 239000010977 jade Substances 0.000 claims description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 5
- 239000008280 blood Substances 0.000 claims description 4
- 210000004369 blood Anatomy 0.000 claims description 4
- 230000001037 epileptic effect Effects 0.000 claims description 4
- 235000013305 food Nutrition 0.000 claims description 4
- 239000010931 gold Substances 0.000 claims description 4
- 229910052737 gold Inorganic materials 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 4
- 239000002689 soil Substances 0.000 claims description 4
- 239000004575 stone Substances 0.000 claims description 4
- 241000251468 Actinopterygii Species 0.000 claims description 3
- 244000000383 Allium odorum Species 0.000 claims description 3
- 235000018645 Allium odorum Nutrition 0.000 claims description 3
- 241000282994 Cervidae Species 0.000 claims description 3
- 244000241257 Cucumis melo Species 0.000 claims description 3
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 claims description 3
- 241000238631 Hexapoda Species 0.000 claims description 3
- 240000007594 Oryza sativa Species 0.000 claims description 3
- 235000007164 Oryza sativa Nutrition 0.000 claims description 3
- 235000007199 Panicum miliaceum Nutrition 0.000 claims description 3
- 241000282376 Panthera tigris Species 0.000 claims description 3
- 241001494479 Pecora Species 0.000 claims description 3
- 244000046052 Phaseolus vulgaris Species 0.000 claims description 3
- 235000010627 Phaseolus vulgaris Nutrition 0.000 claims description 3
- 241000270708 Testudinidae Species 0.000 claims description 3
- 235000021307 Triticum Nutrition 0.000 claims description 3
- FJJCIZWZNKZHII-UHFFFAOYSA-N [4,6-bis(cyanoamino)-1,3,5-triazin-2-yl]cyanamide Chemical compound N#CNC1=NC(NC#N)=NC(NC#N)=N1 FJJCIZWZNKZHII-UHFFFAOYSA-N 0.000 claims description 3
- 210000000988 bone and bone Anatomy 0.000 claims description 3
- 244000022185 broomcorn panic Species 0.000 claims description 3
- 235000013339 cereals Nutrition 0.000 claims description 3
- 235000009508 confectionery Nutrition 0.000 claims description 3
- 238000010411 cooking Methods 0.000 claims description 3
- 239000000835 fiber Substances 0.000 claims description 3
- 229910052736 halogen Inorganic materials 0.000 claims description 3
- 150000002367 halogens Chemical class 0.000 claims description 3
- 239000010985 leather Substances 0.000 claims description 3
- 235000013372 meat Nutrition 0.000 claims description 3
- 239000004570 mortar (masonry) Substances 0.000 claims description 3
- 235000009566 rice Nutrition 0.000 claims description 3
- 235000015170 shellfish Nutrition 0.000 claims description 3
- 241001088417 Ammodytes americanus Species 0.000 claims description 2
- 244000025254 Cannabis sativa Species 0.000 claims description 2
- 241000699666 Mus <mouse, genus> Species 0.000 claims description 2
- -1 cave Substances 0.000 claims description 2
- 239000002304 perfume Substances 0.000 claims description 2
- 235000013599 spices Nutrition 0.000 claims description 2
- 244000082204 Phyllostachys viridis Species 0.000 claims 3
- 244000098338 Triticum aestivum Species 0.000 claims 1
- 230000008901 benefit Effects 0.000 abstract description 16
- 238000002955 isolation Methods 0.000 abstract 1
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 121
- 238000006243 chemical reaction Methods 0.000 description 13
- 230000010365 information processing Effects 0.000 description 13
- 230000005540 biological transmission Effects 0.000 description 11
- 230000014509 gene expression Effects 0.000 description 11
- 238000011161 development Methods 0.000 description 10
- 230000018109 developmental process Effects 0.000 description 10
- 230000000694 effects Effects 0.000 description 10
- 230000008859 change Effects 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 241001330002 Bambuseae Species 0.000 description 7
- 239000002131 composite material Substances 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 7
- 238000013519 translation Methods 0.000 description 7
- 230000033764 rhythmic process Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000012546 transfer Methods 0.000 description 4
- 241001672694 Citrus reticulata Species 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000010009 beating Methods 0.000 description 3
- 210000004556 brain Anatomy 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000008676 import Effects 0.000 description 3
- 238000001556 precipitation Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 240000006409 Acacia auriculiformis Species 0.000 description 2
- 241000272814 Anser sp. Species 0.000 description 2
- 240000005373 Panax quinquefolius Species 0.000 description 2
- 235000003140 Panax quinquefolius Nutrition 0.000 description 2
- 241000209140 Triticum Species 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 235000019504 cigarettes Nutrition 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 210000005069 ears Anatomy 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000001256 tonic effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 208000019914 Mental Fatigue Diseases 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 241000233805 Phoenix Species 0.000 description 1
- 206010040007 Sense of oppression Diseases 0.000 description 1
- 244000273928 Zingiber officinale Species 0.000 description 1
- 235000006886 Zingiber officinale Nutrition 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000001154 acute effect Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000005452 bending Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 208000002173 dizziness Diseases 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 235000008397 ginger Nutrition 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 230000002650 habitual effect Effects 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 230000000192 social effect Effects 0.000 description 1
- 230000003997 social interaction Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- 206010042772 syncope Diseases 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
- 239000011800 void material Substances 0.000 description 1
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
以25个拉丁字母、3个声调符和1个隔声符为符号体系,规定汉字音节由声母音段、韵母音段、无声义码段和声调音段组成。以201个部首为依据,建立了20个义码同偏旁部首含义及其字音特点的联系,使用义码定形了同方块汉字一一对应的14000个无重的拼音汉字和10万个无重的拼音汉字词条,形成了易学、易记、文字和编码一致的仿真拼音汉字输入方案。
Description
本发明是一种对1958年汉语拼音方案进行修改并依据方块汉字形成的拼音汉字及其无重声调码和键盘方案,属于国际分类号G06F3/023,涉及汉语文字学、语音学、汉字输入和计算机汉字信息处理等多学科。
方块汉字为中华民族的发展在历史上作出过伟大贡献,但是近百年来,尤其是近几十年来,方块汉字不适应我国现代经济建设大发展的形势越来越明显,创立拼音汉字的呼声越来越高,实际探索越来越多。
方块汉字在现代信息处理技术中存在着的严重缺陷,迫切需要拼音汉字来解决方块汉字不能解决的难题。主要是:——a.方块汉字熵值大,为9.65比特。汉字传输时如果没有MIME转换就很容易出现乱码或坏码。方块汉字方式的传输转换成本消耗是世界上最大的,使得信息处理难以有效;——b.方块汉字的书写系统的冗余度很小,容易歧义,在信息处理中容易出错;——c.方块汉字连写,字词间没有空格,信息处理中分词困难,成为机器翻译等技术的严重障碍;——d.在字符识别中,中国方块汉字的识别难度是拉丁字母的2000倍。OCR光学识别技术对阿拉伯数字和拉丁字母的印刷体采用16×16点阵就已很清楚了,而对方块汉字印刷体用60×60的点阵效果仍然不佳;——e.方块汉字的语音识别更为困难,语音机器翻译困难很大,句子一长,译文质量就很差,有时结果不能顺读。现有的汉字编码都不能用于语音识别,要解决语音机器翻译的质量问题,提高机器的智能化是一个方面,更重要的是要有一种精密而单义的汉语拼音文字所表达的形式语文。——f.方块汉字的序性没有彻底解决,形成中文信息处理的另一个难题。
方块汉字识字难一直是困扰我国国民文化教育的一个大问题,也是我国扫盲难的一个原因。我国国民为学习方块汉字付出的时间太多,过多挤占了应当能够接受更多的素质教育内容的最佳生命期间,实际上影响了国民教育质量,浪费了许多为社会创造财富的青春年华。1958年2月人大批准的汉语拼音方案在我国推广应用四十多年,在解决方块汉字识字难问题上产生了很好的效果,为我国文化教育事业的繁荣和经济建设的发展做出了重大贡献。但是1958年汉语拼音方案隐性地定义了65个专用字母符号,除了26个拉丁字母及1个隔音符号外,还有38个符号
ā ō ē ī ū ǖ ü ê ê
ǎ ǒ ě ǐ ǔ ǚ
ê c
à ò è ì ù ǜ
m ê s是1958年汉语拼音方案的专用字母符号。这些专用字母数量太大,既妨碍了让1958年汉语拼音方案直接形成可以在书报、公文中使用的拼音文字,又无法同国际通用的计算机键盘接轨,使得汉语拼音在科研、教育、文化、信息传播、对外交流等方面的实际应用中尤其在排版印刷、书报、公文等方面的应用中出现了严重困难,特别是在解决方块汉字识字难、汉字信息计算机处理和深入推广普通话等重大问题上,不能作为拼音汉字的1958年汉语拼音方案显得力不从心。虽然在1958年汉语拼音方案公布的的字母表中明确规定的只有26个拉丁字母,不包括德语字母ü、四个声调符号和一个隔音符号,但在实际使用中却出现了德语字母ü。虽然在字母表外定义了四个声调符号和一个隔音符号,但声调符号从来不独立使用,而是在引入一个含糊的把韵母同声调结合起来的“韵母的声调表示”概念后,便引出并在汉语拼音中实际使用了上述38个符号。1958年汉语拼音方案本身不承认自己定义了65个专用字母符号,至今很多人尚未清楚地认识到这是1958年汉语拼音方案的弊病。字母y和w是事实上的声母,而1958年汉语拼音方案把他们作为零声母未列入声母表。由于没有区分同音字的措施,1958年汉语拼音仅仅充当了方块汉字的注音符号,没有形成拼音汉字。这种不严密、不规范的符号体系,影响了近20年来计算机汉语信息化技术的发展,某种程度上也影响了汉语文字改革的进程。如果要让1958年汉语拼音方案发挥更大作用的话,必需改革它事实上存在着的缺陷,把她改造成拼音汉字方案。
方块汉字的计算机输入过去依靠汉字编码,输入瓶颈问题一直没有解决。输入瓶颈的含义主要是指方块汉字和输入编码的不一致性造成的信息传输和处理中的各种障碍。只有遵守文字规范并满足文字条件的拼音类编码有望成为解决汉字和编码一致性问题的手段。业界共识,理想汉字编码应当是一种既可以用在书面交流又可以用在计算机输入的拼音汉字。中西方文字输入的差别启示我们,创立一种拼音汉字,消除汉字录入过程人脑中的两层转换,实现汉字的直接输入,才能真正消除汉字输入瓶颈。
推广普通话是新中国建立以来国家一直十分重视的大事。探究中国的无数种地方口音和方言土语的形成原因,除了周围地理、民族环境等影响之外,不能不承认方块汉字这种表象文字发音的随意性和无政府状态是病根。正是发音的随意性和无政府状态,才形成了中国的无数种地方口音和方言土语,实质上在抵制着普通话。我们明白地看到,妨碍普通话推广的一个根本性原因是没有标准发音的文字,而不能表音的方块汉字的发音随意性和无政府状态,同国家推广普通话的意愿、初衷和方针严重背弛。为了有效推广普通话,为了中华语同音,需要建立拼音汉字。
由于1958年拼音方案在表达汉字读音方面是准确的,也是成功的,汉语拼音好念、好写、好记,已经被几十年来几亿少年儿童的学习经历所证明,而且40多年的推广应用在全社会拥有深厚的群众基础和巨大的文化沉淀。因此,一个成功的拼音汉字发明应该充分利用1958年拼音方案的成果,这应当是一个重要原则。本专利发明者查阅有关汉语拼音文字及汉字计算机输入方案的同类发明专利、论文近700件,其中在汉语拼音文字方面已经出现的专利和专著,很多方案其设计思想对于1958年拼音方案的利用和保留太少,不利于推广应用。比较接近本发明的有5件,发明人张飞鹏的【反映语法特征的汉语表意拼音文字输入法】,申请号93120482(文献1);发明人孙宏亮的【一种现代汉语拼音文字编码】,申请号94104542(文献2);发明人邱荷生的【拼音文字型汉字编码及键盘】,申请号88107306(文献3),发明人邱荷生的【拼音文字输入法】,申请号97115964(文献4),和发明人姜爱民的【汉语拼音文字输入法】,申请号90107890(文献5),都存在着这样的问题。这些专利与本发明属于同一类,但其方案同本发明不同,本文后面将做详细分析。
本发明的目的是:创立一种仿真拼音汉字,同方块汉字一一对应,能够准确表达方块汉字所能表达的全部语义,可以见字读音,易学、易记、易写,极适于儿童和全体国民学认,能够解决上述方块汉字和1958年拼音方案存在的各种问题,尤其能在解决汉字信息计算机处理困难、方块汉字识字难和深入推广普通话等重大问题上有所作为。本发明的内容是建立一种仿真拼音汉字输入法,该输入法按照声母音段、韵母音段、无声义码段和声调音段的顺序输入各码元,在通用计算机键盘上重新定义3个键位表示声调音段的阳平声符号
上声符号
去声符号
其他字母同键盘完全对应;所述声母音段和韵母音段采用全拼输入,以1958年国家标准拼音方案的声母和韵母为标准,但以yu替代ü;所述无声义码段采用20个义码表示,以国标GB/T13418-92附件1汉字部首表规定的201部为依据,设定偏旁和部首的称谓读音或习惯读音,并据此对20个义码所代表的偏旁、部首和部件称谓进行归类如下:b—八,丷,巴,宀,冖,勹,卜,白,半,比,匕,贝,鼻,疒,髟;c—艹,厂,
车,寸,臣,虫,赤,辰,采,齿,
辶,长,乂,
屮;d—丶,刀,,刂,豆,歹,大,癶,鼎,夂;f—髟,方,父,风,缶,阜,阝左耳朵,非,飞;g—弓,革,戈,鬼,干,甘,工,瓜,艮,谷,骨,广,龟,高,鼓,
巛;h—一,火,灬,禾,户,黑,虎,,黄,
j—金,钅,斤,巾,几,己,见,角,臼,廴,韭;k—口,匚,凵,冂;l—力,立,老,
里,龙,卤,鹿,耒,隶,
耳,卩,而,儿,尔,零声母字;m—门,木,马,麻,毛,母,毋,目,皿,矛,米,麦,黾,面;n—女,牛,牜,
鸟,廾;p—丿,皮,片,爿,匹,疋,
彡,攴;q—气,欠,犬,犭,青,,其,乞,
r—人,入,亻,,彳,日,肉;s—丨,水,冫,氵,
身,首,舌,手,,扌,食,饣,纟,糸,示,礻,士,山,四,罒,石,十,矢,尸,豕,氏,厶,生,殳,鼠,黍,色,巳;t—土,士,田,天,亠;w—文,攵,王,玉,韦,瓦,毋,无,亠;x—心,忄,,
夕,辛,小,,
西,血,穴,香,巛,彡,彐;y—一,牙,言,讠,又,乙,衣,衤,弋,尤,尢,
业,雨,鱼,页,羽,聿,
月,幺,羊,,
酉,音,曰,邑,阝右耳朵,龠,夭,已,ナ,玉,マ;z—乙,乚、乛、亅、
隹,足,,舟,子,孑,止,爪,爫,竹,,自,走,辶,支,攴,豸,至,
丬;
所述无声义码段的取码规则如下:
●根据国家标准局1992年发布的现代汉语字频统计表选取每个音节中的最高频字作为现代汉语的1285个拼音音节的无义码字;
●左右结构及左中右结构的重码汉字中,具有义码不同的左偏旁的汉字取左偏旁,具有义码相同的左偏旁的汉字则高频字取左偏旁,低频字取右偏旁;上下结构及上中下结构的重码汉字中,具有义码不同的上偏旁的汉字取上偏旁,具有义码相同的上偏旁的汉字则高频字取上偏旁,低频字取下偏旁;内外结构的重码汉字中,具有义码不同的外偏旁的汉字取外偏旁,具有义码相同的外偏旁的汉字则高频字取外偏旁,低频字取内偏旁发音的声母作为义码;
●相同音节内的重码汉字使用上述义码规则没有被全部区分时,剩余的重码汉字用整字发音的声母作为义码;
●相同音节内的重码汉字仍没有被全部区分时,剩余的重码汉字用该汉字第一笔部件称谓的汉字发音的声母作为义码;
本发明的技术方法和方案是:
1.构造了仿真拼音汉字输入法和键盘,其特征是:设定标准拼音汉字音节由声母音段(可以没有)、韵母音段(必须有)、无声义码段(可以没有)和声调音段(必须有,阴平不标,隐含)组成,声母音段和韵母音段完全采用1958年拼音方案,无声义码段和声调音段采用本发明规定。按照这个设定,声调符号将同韵母字符分离并占据一个符号位置明确地表达语义,在构成“无重码”字词时同拉丁字母一样起到语义符号或字母作用。
通常人们都认为方块汉字是音、形、义三位一体的语言符号。国家标准GB-12200.1-90汉语信息处理基本术语4.1.3.8对“汉字属性”的描述是:汉字本身所具有的音、形、义三方面的特征及附加的有关特征。因此音、形、义是方块汉字的汉字属性就以国家标准的形式确定下来了。实际上“音”包含基本发音和声调两种声音内涵,这两种声音内涵都有表义的功能。基本发音是音节发音的个体特征,不随词、短语或者句子而改变;声调是音节发音的整体特征,有时在词、短语或者句子中要发生变化。同声异调表示不同的意思,具有不同的文字含义,是音调起了语义的定位作用,因此有理由对声和调加以区分。由于方块汉字的音、调、形都有文字含义,因此,把方块汉字看作是音、调、形、义四位一体的语言信息载体更为科学合理。在这一点上,我们认为国家标准GB-12200.1-90汉语信息处理基本术语4.1.3.8对“汉字属性”的描述应当做适当修改。以往有专家根据1958年拼音方案的汉语拼音写法和汉字拼音音节的实际构造从语音学角度把汉字音节划分为两个音段,即声母音段和韵母音段,而把声调列为没有位置的超音段。这是基于韵母同声调结合起来的“韵母的声调表示”的含糊概念而给出的解释。标准汉字音节由声母音段、韵母音段、无声义码段和声调音段组成的4段模式是拼音汉字的重要特点,是其同1958年汉语拼音方案的一个重要区别。本专利发明的观点认为,韵母是不带声调的、只支持基本发音的语义,而声调(包括阴平)同基本发音的组合可以产生更多的语义。如果把阴平声调作为基本发音的话,则阴平、阳平、上声和去声4个声调支持了语义。因此,拼音汉字让声调符号独占位置而不是同韵母“结合”,更能反映汉语的“音、调、形、义”四位一体的语言语音特征。拼音汉字将声调符号同韵母字符分离的构思避免了1958年汉语拼音方案使用“变形”拉丁字母亦即38个专有韵母符号的弊病,把拼音汉字的实际字母符号数量减少到29个,其中原封不动地使用了25个拉丁字母。本专利的主张是,拼音汉字方面的任何发明应当充分利用1958年汉语拼音方案的成果和几十年推广应用的文化沉淀,因此,本发明除了nyu、nyue、lyu、lyue等4个音节的30多个拼音汉字之外,其余全部音节的1万多个拼音汉字完全采用1958年拼音方案构造声母音段和韵母音段,声调音段虽是本发明规定但极为形似于1958年拼音方案。多音字和发音偏旁不明确的方块汉字,是方块汉字识字难的主要障碍。拼音汉字以1958年汉语拼音方案构造声母音段和韵母音段,其拼写发音的主要部分保持了1958年拼音方案易读易学易记的优点,又是按无重码原则以规范的义码区分,不但严格精密地确保了同方块汉字一一对应,而且把方块汉字中的多音字区分为异形异音拼音汉字,可以做到见字就能读、发音就能准、能说就能写,从而可以有效克服方块汉字识字难。方块汉字能表义但不能直观地、直接地表音表调,拼音汉字不但能表义而且能够直观地、直接地表音表调,这是方块汉字无法比拟的优点。这就为建立一种真正可以在社会上交流使用的拼音汉字打下了理论和实践基础。使用原准的拉丁字母,可以真正实现拼音汉字同国际拼音文字的接轨。
2.上述方案采用25个拉丁字母、阳平声符号
上声符号
去声符号
和隔音符号
共29个字母符号作为拼音汉字的符号体系,Aa01 Bb02 Cc03 Dd04 Ee05 Ff06 Gg07 Hh08 Ii09 Jj10啊 玻 雌 得 鹅 佛 哥 喝 衣 基Kk11 L112 Mm13 Nn14 Oo15 Pp16 Qq17 Rr18 Ss19 Tt20科 勒 摸 讷 喔 坡 欺 日 思 特Uu21 Ww22 Xx23 Yy24 Zz25
26
27
28
29乌 屋 希 依 资 阳 上 去 音设定在音节书写中声调符号被放置在音节的最后面表示声调音段,是拼音汉字的语义符号,隔音符号占据一个符号位是拼音汉字词的语义符号。
语音学专家指出,阴平声调值55、阳平声调值35、上声调值214、去声调值51,采用阴平不标、符号
表示阳平声、符号
表示上声、符号
表示去声来表达汉语声调的发音方法和调值规律其形状形象逼真,符合汉语发音特点。这几个符号使用已经40多年,国民很熟悉,只不过1958年拼音方案把它们放在韵母字母头顶上同韵母结合,本发明则把它们从韵母字母头顶上挪下来安置在自己的位置上,因而有利于国民学习使用。声调符号字形化,字符形象反差大、易辩别、易于记忆。
3.上述方案改变了1958年拼音方案关于y和w是代表i行和u行的零声母的定义,设定拼音汉字的23个声母是
b p m f d t n l
玻 坡 摸 佛 得 特 讷 勒
g k h j q x
哥 科 喝 基 欺 希
zh ch sh r z c s w y
知 蚩 诗 日 资 雌 思 屋 依由上表可见,23个声母用到了字母表中定义的20个字母,并用方块汉字给声母命了名。字母y和w是事实上的声母,而1958年汉语拼音方案作为零声母未把他们列入声母表,这是1958年汉语拼音方案一种事实上的不完备性。上表中——a.规定y为一个特殊声母,用在i行韵母作为零声母时表达事实上的声母,其作用相当于1958年汉语拼音方案描述的,当i行韵母在其前无声母时可以写成yi(衣)、ya(呀)、ye(耶)、yao(腰)、you(优)、yan(烟)、yin(因)、yang(央)、ying(英)、yong(雍),这里,除了yi(衣)是在单韵母i及复合韵母in(因)、ing(英)的i前面加y之外,其余的都是以y替换i;——b.设定w为一个特殊声母,用在u行韵母作为零声母时表达事实上的声母,其作用相当于1958年汉语拼音方案描述的,当u行韵母在其前无声母时可以写成wu(乌)、wa(蛙)、wo(窝)、wai(歪)、wei(威)、wan(弯)、wen(温)、wang(汪)、weng(翁),这里,除了wu(乌)是在单韵母u前面加w之外,其余的都是以w替换u;
4.上述方案采用yu代替德语字母ü作为一个单韵母,其作用相当于1958年汉语拼音方案描述的,当ü行的韵母在其前面没有声母的时候直接写成yu(迂)、yue(约)、yuan(冤)、yun(晕),ü(yu)行的韵母同声母j、q、x拼音的时候写成ju(居)、qu(区)、xu(虚),省略了字母y,但是同声母n、l拼音的时候要写成nü(nyu)(女)、nu(lyu)(吕),以便同nu(奴)、lu(路)区分,ny和ly可以看作类似zh,ch,sh的双声母,但没有包含在声母表内。
5.上述方案设定了单韵母、双韵母和复合韵母共36个,
由韵母表可见,汉语拼音的单字母韵母、双字母韵母和复合韵母共36个,只用到了字母表中的a,o,e,i,u、n、g、r、y等9个字母。表中空位处是不存在的字母组合(双字母韵母或复合韵母),如果出现这种字母组合作为韵母就是非法的。韵母表用方块汉字给单韵母、双韵母及复合韵母命了名。这些韵母的汉字名称是各种场合中使用的法定名称。在韵母表中,以n结尾的韵母8个,以ng结尾的韵母8个,以r结尾的韵母1个,非n、非r和非ng结尾的韵母19个。单字母韵母5个、双字母韵母16个、3字母韵母10个、4字母韵母5个。同1958年汉语拼音方案相比,不同之处是本方案以双韵母yu取代了德语字母ü,它可以看作是语音意义上的单韵母,同时把韵母er列入了韵母表。复合韵母(16个双字母韵母、10个三字母韵母及5个四字母韵母)是一个整体,是一种法定搭配,在任何情况下都不允许拆分成单个字母进行分析。按照这个规定,汉语音节可以理解为全部是开音节,从而改变由n和ng结尾的音节是闭音节的说法。双声母zh、ch、sh、ny和ly也是一种法定搭配,不允许拆分成单个字母进行分析。这两条规定是确保义码无歧义的先决条件。
i衣 | u乌 | yu迂 | |
a啊 | ia呀 | ua蛙 | |
o喔 | uo窝 | ||
e鹅 | ie耶 | yue约 | |
ai哀 | uai歪 | ||
ei诶 | uei(ui)威 | ||
ao熬 | iao腰 | ||
er儿 | |||
ou欧 | iou(iu)优 | ||
an安 | ian烟 | uan弯 | yuan冤 |
en恩 | in因 | uen(un)温 | yun晕 |
ang昂 | iang央 | uang汪 | |
eng亨的韵母 | ing英 | ueng翁 | |
ong轰的韵母 | iong雍 |
6.上述方案以GB/T13418-92附件1汉字部首表规定的201部为依据,参考“现代汉语词典”(1996年修订版)给出的部首表187部、“现代汉语字典”(1999年版)给出的部首表189部和“常用笔顺字典”(1998年版)给出的部首表200部,设定了偏旁和部首的称谓读音或习惯读音,编制出汉字偏旁部首信息表如下: 说明:部首以GB/T13418-92附件1汉字部首表规定的201部作为主部。主部下含副部,
包括了GB/T13418-92附件1汉字部首表201部原来给出的副部,为了便于查字,本
方案适当增补了副部。其中,——a.对于而、二、耳、儿这4个部首,一律取“零声母”“零”字的声母“l”作为义码
字母,部首左阝和右阝分别称为“阜”和“邑”,也可以使用惯用称谓为“左耳”“右
耳”,此时取“l”为义码;——b.收入了
等6个常用的非规范偏旁的读音作为义码字母;——c.对所有收入的偏旁规定了编号,有利于信息处理和信息交换;——d.对20个义码字母所代表的偏旁、部首和部件称谓进行了归类,b—八(ba),丷(八字头),宀(baogai,宝盖),冖(baogai,秃宝盖),勹(baozitou,包子头),巴(ba),白(bai),半(ban),比(bi),匕(bi),贝(bei),卜(bo,含占字头),鼻(bi),疒(bing),髟(biao),c—艹(cao草字头),厂(chang),
(chang,厂字旁),车(che),寸(cnn),臣(chen),虫(chong),赤(chi),辰(chen),采(cai),爫(采字头),齿(chi),(春字头),辶(che,坐车儿,走之儿),长(chang),乂(yi),
(常字头),(仓字底),屮(出字头),d—丶(dian),刀(dao),(dao刀字形),刂(dao立刀),灬(dian四点底),斗(dou),豆(dou),歹(dai),大(da),癶(deng,登字头),鼎(ding),夂(dong,冬字头)f—髟(biao,发字头,从fa),方(fang),父(fu),风(feng),缶(fu),阜(fu,含左耳阝),非(fei),飞(fei),g—弓(gong),革(ge),戈(ge),鬼(gui),干(gan),甘(gan),工(gong),瓜(gua),艮(gen,含艮字旁),谷(gu),骨(gu),广(guang),疒(guang,病广旁),龟(gui),高(gao),鼓(gu),
(gan字旁),
(ge),
(告字头,牛),巛(三拐儿,巡字心),h—火(huo),灬(火字底),禾(huo),户(hu),黑(hei),一(heng,yi),虎(hu),(hu,虎字旁),黄(huang),
(黄字头),j—金(jin),钅(jin,金字旁),斤(jin),巾(jin),几(ji,几字框,如夙,凰),儿(er,几字型),己(ji),已(yi,己字形),巳(si,己字形),见(jian),角(jiao),臼(jiu),廴(建之儿),韭(jiu),k—口(kou),日(ri,口子框),曰(yue,口子框),口(kuang,大口框),匚(区字框),凵(上框,幽字框),冂(下框,如用同周),田(tian,口子框),(看字 头,shou),l—力(li),立(li),老(lao),
(老字头),里(li),龙(long),卤(lu),鹿(lu),耒(lei),隶(li),
(li,ge),罒(si,罗字头),零(ling)声母字(以a,o,e开头的字)包括er:耳(er),阝(左耳),阝(右耳),卩(单耳朵),
(单耳朵形,仓字底),而(er),儿(er),尔(er),m—门(men),木(mu),马(ma),麻(ma),毛(mao),母(mu,含毋,母字形),目(mu),皿(min),矛(mao),米(mi),麦(mai),黾(mian),面(mian),(美字头),n—女(nyu),牛(niu,含
告字头,牜牛字旁),鸟(niao,含鸟字旁、鸟字底),廾(弄字底),p—丿(pie撇),皮(pi),片(pian),爿(pan),匹(pi),疋(pi),
(疋字旁),覀(xi,票字头),彡(三撇儿,形字旁),攴(pu,支字形),q—气(qi),欠(qian),犬(quan),犭(犬字旁),青(qing),(青字头),其(qi),乞(qi),
(qi),
(齐字底),
(券字头),匚(区字匡),r—人(ren),入(ru,人字形),亻(单立人,含,类人字形),彳(双立人,类人字形),日(ri),肉(rou),s—丨(shu),水(shui),冫(两点水),氵(三点水),
(水字底),身(shen),首(shou),舌(she),手(shou),(手字旁),扌(提手旁),食(shi),饣(食字旁),纟(丝字旁),糸(丝字旁),示(shi),礻(示字旁),士(shi),山(shan),四(si,含罒,罗字头),石(shi),十(shi),矢(shi),尸(shi),豕(shi),氏(shi),厶(si),生(sheng),殳(she),鼠(shu),黍(shu),色(se),巳(si),(尚字头,xiao),t—土(tu),士(shi,土字形),田(tian),天(tian),夭(yao,天字形),扌(提手旁),冂(同字框,用同周),亠(tou),w—文(wen),夊(wen,反文旁),王(wang,含王字旁),玉(王字形,yu),韦(wei),瓦(wa),毋(wu,含母字旁),无(wu,含无字旁),亠(tou,文字头),x—心(xin),忄(竖心),(心字底),夕(xi),辛(xin),小(xiao,含,尚字头),西(xi,含票字头),血(xie),穴(xue,含穴字头),香(xiang),巛(巡字心),彡(三撇儿,形字旁),
(翔字旁),彐(xun,寻字头,含
y—一(yi,heng),牙(ya),言(yan),讠(yan,言字旁),又(you),乙(yi,含乚、乛、亅
乙字形),衣(yi),衤(衣字旁),弋(yi),尤(you,含尢、
尤字形)),业(ye),雨(yu,含雨字头),鱼(yu),页(ye),羽(yu),聿(yu,含
聿字形),月(yue,含月字旁,月字底),幺(yao),羊(yang,含,
),酉(you),音(yin),曰(yue,含扁曰头),邑(yi,含右耳阝),龠(yue),夭(yao),已(yi),乂(yao,单叉形),ナ(有字头),玉(yu,王字形),マ(甬字头),凵(幽字底),z—隹(zhui),足(zu),
(足字旁),舟(zhou),子(zi),孑(子字形),止(zhi),爪(zhao,含爫采字头),竹(zhu),(竹字头),自(zi),走(zou),辶(走
之儿,坐车儿),支(zhi),攴(支字形,pu),豸(zhi),至(zhi),乙(折,含
以声母表中的20个字母作为拼音汉字的义码字母用来充当拼音汉字音节的无声义码段,是区分汉字含义的符号,具有字形特征、偏旁部首含义和字音特点。以国家规范GB/T13418-92附件1汉字部首表规定的201部为依据,抽取偏旁和部首的称谓读音或习惯读音的声母,建立了单义码同方块汉字和偏旁部首发音之间的联系,使用带有字形特征、偏旁部首含义和字音特点的这种义码区分并定形同音异形方块汉字是规范性的有理型分化,有利于学习和记忆。采用义码概念,根据方块汉字的结构组成,以拼音汉字的4段模式分化定形即改写了“现代汉语字典”(学苑出版社,1999年6月)中刊列的14000个方块汉字,给出了一一对应的拼音汉字,并以此为基础建立了约10万条常用汉语词汇的独立无重的拉丁化拼音形式,可以准确无误地表达14000个方块汉字所能表达的全部语义,是汉语的另一种文字形式。
7.上述方案设定了29个字母符号的顺序编号,这个字母排序将唯一地确定无重的拼音汉字及其对应的方块汉字的顺序,因而使方块汉字具备了严格唯一的顺序性;
8.上述方案规定了义码、声调符及隔音符的5条使用原则,——a.阴平声调音节内选定的某个汉字作为无义码字,不加声调符,也不加任何单、双义码,阳平、上声、去声声调音节内选定的某个汉字作为无义码字,只加声调符,不加任何单、双义码,无义码的拼音汉字每个音节一个,亦即共有1285个;——b.在以n结尾的音节之后,不允许使用义码g,这样的音节只能使用除g之外的19个单义码,在以ng结尾的音节之后,可以使用全部20个单义码;——c.在36个韵母中的以a、o、e、i、u结尾的韵母之后,不允许n作单义码,也不允许ng作为双义码,在e之后,不允许使用为单义码r以及r开头的双义码;——d.单义码、双义码和隔音符,一律不发音;——e.在多字词中,只要符合“无重码”原则,可以省略一个字或全部字的义码或/和声调符,当声调符起到隔音作用时,一律替代隔音符。——f.义码确定原则:
●先用成字偏旁称谓的汉字发音的声母
对于由几个汉字组成的汉字:
左右双部形,取左或取右,一般先取左后取右,
上下双部形,取上或取下,一般先取上后取下,
内外双部形,取内或取外,一般先取外后取内,
左中右三部形,取左或取右或取中,一般先取左次取右后取中,
上中下三部形,取上或取下或取中,一般先取上次取下后取中,
●次用整字发音的声母,特别对于独体字
●再用不成字部首称谓的汉字发音的声母
●再次用第一笔部件称谓的汉字发音的声母,特别对于独体字——g.双义码
双义码是由义码表中20个字母中的任两个义码字母按排列组合规则组成,共400个。当一个音节内的同音字只用一个义码字母不能把该音节内的“重码”汉字全部区分为无重码拼音汉字时,需要使用双义码。
9.上述方案规定——a.双字词无重声调码有三种类型44种格式,
第一类无重声调码,声母+调(+隔音符)+声母+调(+隔音符)
规则1)z11+(g)+z21+(g) (阴+阴)2-6键
规则2)z11+d1+z21+(g) (调+阴)3-6键
规则3)z11+(g)+z21+d1 (阴+调)3-6键
规则4)z11+d1+z21+d1 (调+调)4-6键
第二类无重声调码,拼音(声母音段+韵母音段)直接相加格式
规则5)二拼音+(g)+二拼音 (阴+阴)4-5键
规则6)二拼音+d1+二拼音 (调+阴)5键
规则7)二拼音+(g)+二拼音+d2 (阴+调)5-6键
规则8)二拼音+d1+二拼音+d2 (调+调)6键
规则9)二拼音+(g)+三拼音 (阴+阴)5-6键
规则10)二拼音+三拼音+d2 (阴+调)6键
规则11)二拼音+d1+三拼音 (调+阴)6键
规则12)二拼音+d1+三拼音+d2 (调+调)7键
规则13)三拼音+(g)+二拼音 (阴+阴)5-6键
规则14)三拼音+d1+二拼音 (调+阴)6键
规则15)三拼音+二拼音+d2 (阴+调)6键
规则16)三拼音+d1+二拼音+d2(调+调)7键
规则17)三拼音+三拼音 (阴+阴)6键
规则18)三拼音+d1+三拼音 (调+阴)7键
规则19)三拼音+三拼音+d2 (阴+调)7键
规则20)四拼音+二拼音 (不论调)6键
规则21)二拼音+四拼音 (不论调)6键
第三类无重声调码,混合相加格式
规则22)二拼音+g+z21 (阴+阴)4-5键
规则23)二拼音+d1+z21 (调+阴)4-5键
规则24)二拼音+g+z21+d2 (阴+调)5-6键
规则25)二拼音+d1+z21+d2 (调+调)5-6键
规则26)z11+(g)+二拼音(g) (阴+阴)3-6键
规则27)z11+(g)+二拼音+d2 (阴+调)4-6键
规则28)z11+d1+二拼音+(g) (调+阴)4-6键
规则29)z11+d1+二拼音+d2 (调+调)5-6键
规则30)三拼音+g+z21 (阴+阴)5-6键
规则31)三拼音+g+z21+d2 (阴+调)6键
规则32)三拼音+d1+z21 (调+阴)5-6键
规则33)三拼音+d1+z21+d2 (调+调)6键
规则34)z11+(g)+三拼音+(g) (阴+阴)4-6键
规则35)z11+(g)+三拼音+d2 (阴+调)5-7键
规则36)z11+d1+三拼音+(g) (调+阴)5-7键
规则37)z11+d1+三拼音+d2 (调+调)6键
规则38)四拼音+g+z21 (阴+阴)6键
规则39)四拼音+d1+z21 (调+阴)6键
规则40)四拼音+g+z21+d2 (阴+调)6键
规则41)z11+(g)+四拼音 (阴+阴)5-6键
规则42)z11+(g)+四拼音+d2 (阴+调)6-7键
规则43)z11+d1+四拼音 (调+阴)6-7键
规则44)z11+(g)+五拼音 (不论调)6-7键——b.三字词无重声调码的8种格式,均采用声母+声调(+隔音符)格式
规则45)z11+(g)+z21+(g)+z31 (阴+阴+阴)3-8键
规则46)z11+(g)+z21+(g)+z31+d3 (阴+阴+调)4-9键
规则47)z11+(g)+z21+d2+z31 (阴+调+阴)4-8键
规则48)z11+d1+z21+(g)+z31 (调+阴+阴)4-8键
规则49)z11+d1+z21+d2+z31 (调+调+阴)5-8键
规则50)z11+d1+z21+(g)+z31+d3 (调+阴+调)5-9键
规则51)z11+(g)+z21+d2+z31+d3 (阴+调+调)5-9键
规则52)z11+d1+z21+d2+z31+d3 (调+调+调)6-9键——c.四字词无重声调码的16种格式,均采用声母+声调(+隔音符)格式
规则53)z11+(g)+z21+(g)+z31+(g)+z41 (阴+阴+阴+阴)4-7键
规则54)z11+d1+z21+(g)+z31+(g)+z41 (调+阴+阴+阴)5-7键
规则55)z11+(g)+z21+d2+z31+(g)+z41 (阴+调+阴+阴)5-7键
规则56)z11+(g)+z21+(g)+z31+d3+z41 (阴+阴+调+阴)5-7键
规则57)z11+(g)+z21+(g)+z31+(g)+z41+d4 (阴+阴+阴+调)5-8键
规则58)z11+(g)+z21+(g)+z31+d3+z41+d4 (阴+阴+调+调)6-8键
规则59)z11+(g)+z21+d2+z31+d3+z41 (阴+调+调+阴)6-7键
规则60)z11+d1+z21+d2+z31+(g)+z41 (调+调+阴+阴)6-7键
规则61)z11+d1+z21+(g)+z31+d3+z41 (调+阴+调+阴)6-7键
规则62)z11+d1+z21+(g)+z31+(g)+z41+d4 (调+阴+阴+调)6-8键
规则63)z11+(g)+z21+d2+z31+(g)+z41+d4 (阴+调+阴+调)6-8键
规则64)z11+(g)+z21+d2+z31+d3+z41+d4 (阴+调+调+调)7-8键
规则65)z11+d1+z21+(g)+z31+d3+z41+d4 (调+阴+调+调)7-8键
规则66)z11+d1+z21+d2+z31+(g)+z41+d4 (调+调+阴+调)7-8键
规则67)z11+d1+z21+d2+z31+d3+z41 (调+调+调+阴)7键
规则68)z11+d1+z21+d2+z31+d3+z41 (调+调+调+调)7键
以a,o,e及其复合韵母开头的音节字和由它们组成的词在其他字、词之后,要用声调符
(阳平)、
(上声)、
(去声)、或用
隔音符号(代替阴平)隔开,再取零声母字(或韵母)的第一个字母,——d.五字及其以上多字词,无重声调码有16种格式,均采用声母+声调(+隔音符)格式
规则69)z11+(g)+z21+(g)+z31+(g)+zm1 (阴+阴+阴+阴)4-7键
规则70)z11+d1+z21+(g)+z31+(g)+zm1 (调+阴+阴+阴)5-7键
规则71)z11+(g)+z21+d2+z31+(g)+zm1 (阴+调+阴+阴)5-7键
规则72)z11+(g)+z21+(g)+z31+d3+zm1 (阴+阴+调+阴)5-7键
规则73)z11+(g)+z21+(g)+z31+(g)+zm1+dm (阴+阴+阴+调)5-8键
规则74)z11+(g)+z21+(g)+z31+d3+zm1+dm (阴+阴+调+调)6-8键
规则75)z11+(g)+z21+d2+z31+d3+zm1 (阴+调+调+阴)6-7键
规则76)z11+d1+z21+d2+z31+(g)+zm1 (调+调+阴+阴)6-7键
规则77)z11+d1+z21+(g)+z31+d3+zm1 (调+阴+调+阴)6-7键
规则78)z11+d1+z21+(g)+z31+(g)+zm1+dm (调+阴+阴+调)6-8键
规则79)z11+(g)+z21+d2+z31+(g)+m1+dm (阴+调+阴+调)6-8键
规则80)z11+(g)+z21+d2+z31+d3+zm1+dm (阴+调+调+调)7-8键
规则81)z11+d1+z21+(g)+z31+d3+zm1+dm (调+阴+调+调)7-8键
规则82)z11+d1+z21+d2+z31+(g)+m1+dm (调+调+阴+调)7-8键
规则83)z11+d1+z21+d2+z31+d3+zm1 (调+调+调+阴)7键
规则84)z11+d1+z21+d2+z31+d3+zm1 (调+调+调+调)7键
为了输入快捷,以14000个无重的拼音汉字和10万无重码词条的拼音汉字词库为基础,按照上述84种声调组合模式抽取拼音汉字词的声母和声调符作为特征符号建立了无重声调码库,形成了规范、易学、易用、快速、兼容、一致、完备、文字和编码一致的拼音汉字无重声调码输入方案,是一种纯音码。
10.上述的键盘方案设定了两种键盘方式,采用通用计算机键盘时只需要重新定义3个键,可减少输入者的记忆转换劳动,可以较大幅度提高录入速度;在通用计算机键盘的键位基础上增加3个键位表示
和
从而形成一种中英文通用键盘,采用这种键盘可以避免3个键的重新定义和中英文输入状态之间的转换,可以进一步减少输入者的记忆转换劳动,进一步提高录入速度。
11.规定了拼音汉字的词及其书写规则
a.词素及词。同方块汉字一一对应的拼音汉字是汉语拼音词的词素。可以单独作为词使用的词素就是单字词。单字词和词素可以组合构成双字词、三字词和多字词。一个词(无论是单字词、双字词或多字词)的字母之间不允许存在空格,词和词之间以空格或标点符号分开,句子以句号结束。句首字母大写,专有名词(包括地名、山名、江河湖海名)大写。姓氏的第一个字母大写,名字紧连姓后小写。缩写字和缩写词大写。
b.词的分类,遵循现有的所有语法规定。有名词(N)、动词(V)、形容词(A)、数词(M)、量词(Q)、副词(D)、代名词(P)、连接词(C)、介词(R)、助词(H)、语气词(MP)、感叹词(E)、象声词(O)。在用拼音汉字构词时考虑到不同词性的特点可以省略一定的字母、义码或其他符号。
c.在无重码原则下,拼音汉字组词方式有词素直接相连模式,词素相连、减义码模式,词素相连、减声调符模式,词素相连、声调符替代隔音符模式,词素相连、同时减声调符及义码模式。
d.代词、形容词的特点是以-d结尾,如果d前有声调符号,可以省略短横-。
e.儿化词。名词的儿化是口语的特点,文字书写中在字词结尾处以-r表示。如果r前有声调符号,可以省略短横-
f.动词后缀“着”“了”“过”分别在动词之后以-z、-l、-g表示。当z、l、g之前为声调符号时,省去短横-。
g.标点符号。在方块汉字中仍然沿用现行汉语的标点符号。在拼音汉字中采用英文标点符号,即用圆点代替句号圆圈,用逗号代替顿号,用引号代替书名号,用大写字母开头表示专名,用空格表示间隔号,取消着重号。移行,按词素进行,保持词素的完整,将未写完的多字词从某个词素后加短横“-”,其余词素移到下一行。
12.对每个汉字都按法定汉字、笔画、对应的繁体字、笔画、对应的异体字、汉语拼音(1958年方案)、对应的拼音汉字(本发明)、义码、部首、笔画、相关码、姓氏、频度的模式给出了全部信息,编制了计算机拼音汉字字典,按音序建立了14000个方块汉字的字表,给出了对应的拼音汉字,按偏旁部首给出了检索表,同时按法定汉字词、对应的繁体字词、汉语拼音标注(1958年方案)、对应的拼音汉字词(本发明)的模式编制了10万方块汉字词条的计算机拼音汉字词典。
本发明同已知技术相比特点如下:
1)易学、易记,见字就能读,能读就能写,最接近1958年拼音方案,容易推广
本发明的创新点是规定标准汉语音节由声母音段(可以没有)、韵母音段(必须有)、无声义码段(可以没有)和声调音段(必须有,阴平不标,隐含)组成。在这4个音段中,声母音段、韵母音段保持1958年拼音方案的原形;声调音段采用符号
形象直观明确,准确描述了汉语发音特点,实质上也保持1958年拼音方案的原形,只不过把位置从带调韵母头顶上移到自己应当占有的位置上;无声义码段使用偏旁读音的声母,是本发明的规定,但完全符合国家拼音方案规范和国家拆字规范和偏旁部首规范。这个方案简易可行,特别方便地构成了拼音汉字,最大限度地保持和利用了1958年拼音方案的成果,非常准确地定形了14000个方块汉字对应的拼音汉字,同方块汉字一一对应,能够准确表达方块汉字所能表达的全部语义。方块汉字能表义但不能直观地、直接地表音表调,拼音汉字不但能表义而且能够直观地、直接地表音表调,因而拼音汉字易学、易记、易写,极适于儿童和全体国民学认,国民容易接受,容易推广,有利于解决方块汉字识字难问题,有利于增强推广普通话的力度,也有利于国际交流。这是方块汉字无法比拟的优点。
采用符号
表示声调并以yu取代德语字母ü,这个措施克服了1958年方案实际使用了两种符号体系的缺点,把1958年拼音方案事实上使用的65个符号减少为29个,使拼音汉字符号体系得以完备,理论基础变得坚实,可以确保拼音汉字精确、精密、稳定、可靠,从而可以确保在各个领域内的可靠应用。同有些方案利用v替代ü相比,v替代ü在发音上有错位,而yu取代ü在发音上是一致的,有利于发音。把y和w作为声母,增加了声母数,有利于分化方块汉字的同音字。
考察一段拼音汉字实例:
毛泽东演讲选段
诸位代表先生们,我们有一个共同的感觉,这就是我们的工作将写在人类的历史上,它将表明:占人类总数四分之一的中国人从此站立起来了。中国人从来就是一个伟大的勇敢的勤劳的民族,只是在近代是落伍了。这种落伍,完全是被外国帝国主义和本国反动政府压迫和剥削的结果。一百多年以来,我们的先人以不屈不挠的斗争反对内外压迫者,从来没有停止过,其中包括伟大的中国革命先行者孙中山先生所领导的辛亥革命在内。
由这个例子可以见到,拼音汉字是在1958年汉语拼音基础上获得的,完整如实地保留了1958年汉语拼音的拼写和标调规则,仅仅为了区分同音字才在部分拼音音节的无声义码段加了义码。根据大量语料统计证明,按使用概率,无义码的拼音汉字虽然只有1285个,但他们都属于高频字,出现概率占总概率的90%以上,有义码的拼音汉字出现概率占总概率的10%以下,其中双义码字出现极少。因此可以断定,拼音汉字如同汉语拼音一样好写、好念、好记。我国实行九年义务教育几十年,除了个别情况,每个人从小孩子起全都学过汉语拼音。因此还可以断定,国民学会和熟悉拼音汉字的速度会很快。由于本发明充分利用了1958年拼音方案的成果和40多年的推广应用在全社会拥有的深厚群众基础和巨大的文化沉淀,因此在社会上推广难度小。如果采用拼音汉字,可以预期方块汉字识字难问题逐步可以缓和,中小学的素质教育效果就会更加明显,扫除我国文盲的伟大事业有望尽早实现,其应用效果和效益前景极为壮观。
在比较接近本发明的5件专利中,文献1,以汉语拼音方案为基础,根据汉语语法、词义和语音特点把词分为实词和虚词、按实词加意尾、虚词定形化原则设计表意拼音文字兼汉字编码方案;一个词一个拼法,给15类实词规定了15个义尾。输入采用西文键盘,设定取前键、取后键、同音词键及成语切换键。不专标调,调隐含在字符内。该发明的方案同本发明的方案差异较大,但结果同本发明的结果较接近。按照该发明,拼音汉字形式为(单字后的括号中对照写出了本发明的拼音汉字):baa把(
义码s代表偏旁扌),bey被(
义码y代表偏旁衤),bii比
,biy彼(
义码p代表偏旁皮),by必
等等。词句的形式:
张飞鹏:guot gek qis lais bu yuan zuos nulif de renf men,
国歌: 起来, 不愿 做 奴隶的 人们,bas women de xuerouq zhus chengs women xinxd changx chenght把 我们的 血肉 筑成 我们 新的 长城。Zhonghuat minzuf daw le zuy weixianx d shihout中华民族 到了 最 危险的 时候,mey ge renf bey pos zho fas chus zuy how d hous shengt
每个 人 被迫着 发出 最后的 吼声,
汉语是声调显著的语言,声调有确定语义的重要作用,声调符号字形化并且符号形状符合汉语发音特点,字符形象反差大、易辩别、易于记忆是拼音汉字设计中要考虑的最重要点。对比可见,文献1的发明对1958年拼音方案改动虽不太大,但没有充分利用1958年拼音方案的结果,而是自行设计附加成分,非规范性严重,规律性差,加之隐含汉字声调,不仅辨认困难,记忆困难,学习也困难。上述例子国歌选段上面的第2行对照写出了本发明的拼音汉字,显而易见,本发明拼音音节符合拼音方案规范、偏旁部首表示符合国家拆字规范和偏旁部首规范,标调符号形象明确,准确描述了汉语发音特点,容易学习,容易记忆。
文献2,一种多功能汉语拼音代字码,该发明以简化音节形式、变体音节形式、基本音节形式确定了1880多个音节书写形式定义现代汉语中使用频率最高、构词力最强的词根,再辅之以少量的短横“-”和隔音符号“’”,使6万多条通用词语全部分化定形,无一重码。该方案取消字母ü代之以yu,取消全部标调符号,不对音节标调,声调隐含在字母之中。形成的文字如下(单字后的括号中对照写出了本发明的拼音汉字):bay白
by比
bw不(bu),drang装(zhuang),dran转
tsw促
gwai掴(guais,义码s代表偏旁扌),gwe锅(guoj,义码j代表偏旁钅),gwy瑰(guiw,义码w代表偏旁王),tzan惨(
义码x代表偏旁忄),tsan参(cans,义码s代表偏旁厶),tsong聪(congz,义码z代表偏旁总),tzong琮(cong,义码w代表偏旁王),lyan连(
义码c代表偏旁车),jiyang讲
jya加(jiak,义码k代表偏旁口),thong颂(
义码y代表偏旁页),dsao躁(
义码z代表偏旁足),dzao噪(
义码k代表偏旁口),thuag送(
义码z代表偏旁辶),dzwe嘬(zuok,义码k代表偏旁口)。对比可见,文献2发明对1958年拼音方案改动太大,所有规定没有国家文字规范可依,偏离国民40多年来已经熟悉的汉语拼音字形太远,隐含汉字声调,不仅学习记忆困难,辨认也很困难,应用实施难度太大。括号中对照写出了本发明的拼音汉字,显而易见,拼音音节和标调符符合拼音方案规范、偏旁部首表示符合国家拆字规范和偏旁部首规范,标调符号形象,准确描述了汉语发音特点,容易学习,容易记忆。
文献3和文献4, 一种拼音文字型汉字编码法,其特征在于每个汉字用四键输入和提取。第一键是表示该字的声母,第二键表示该字的韵母,第三键表示该字的偏旁,第四键表示该字的声。阿拉伯数字作为代码是可以的,但不允许作为文字符号。文献3和文献4的发明符号系统中包含了阿拉伯数字,违背了拼音文字符号系统的基本原则,是其不可能成为拼音文字的要害。该方案以赵元任先生难为拼音化汉字的考题作例子,考题文字下面的第一行是该方案的编码,本发明的拼音汉字对照写在第二行:施 氏 食 狮 史iy81 iya7 iyq2 iyzl iy47石室 侍士 施氏, 嗜 狮, 誓 食 十 狮。iyy2iyy3 iya3iy43 iy8liy47, iy94iyzl, iyd4 iyq2 iy52 iyzl.
文献3和文献4方案把每个汉字的编码结构分为4键的设计同本发明拼音汉字由4个音段组成的思路看起来相似,但实质有很大的不同。本发明规定标准汉语音节的4个音段中,声母音段、韵母音段保持1958年拼音方案的原形;声调音段,实质上也保持1958年拼音方案的原形,只不过挪了个位置,从带调韵母头顶上移到自己应当占有的位置上;无声义码段使用偏旁读音的声母,是本发明的规定,但完全符合国家规范;按照本发明制定的拼音汉字,完全符合前述文字条件。文献3和文献4方案的4键编码的含义,第1键代表声母,其中zh、ch、sh是用A、E、I代替的,已经部分脱离了1958年拼音方案的原形;第2键代表韵母,除了a、e、i、o这4个单韵母使用了对应的原键外,其余32个韵母对键盘的不同键位全部作了个人见解的人为定义,完全脱离了1958年拼音方案;第3键归纳了40个偏旁,对每个偏旁定义了一个键位(包括数字键),把8500个方块汉字分别列入不同的偏旁(或键位),没有规范可依;第4键代表声调,对每个声调规定了7个代码,4个声调共规定了28个代码(包括数字键),没有规范可依。看起来每个字4键,相对于部分拼音汉字缩短了长度,但人们头脑里需要两次转换才能把方块汉字变成文献3、4的编码。这实质上是对1958年拼音方案的全部否定。该方案最多只能作为一种汉字编码,不可能成为一种拼音文字。所有规定没有国家文字规范可依,偏离国民40多年来已经熟悉的1958年汉语拼音规定和字形太远,如果以这种编码作为文字,学习困难,记忆困难,应用实施难度太大。从文献3列举的赵元任先生出的考题,对比本发明同文献3、4的编码差别,我们可以得出结论:本发明拼音音节和标调符符合拼音方案规范、偏旁部首表示符合国家拆字规范和偏旁部首规范,标调符号形象,准确描述了汉语发音特点,容易学习,容易记忆。
文献5,以汉语拼音方案为基础,增加了表意成分,创造了生物名词构词法、化学元素名词构词法、数词构词法、无声专职标调字母标调法,是一种自然语言文字输入法。该方法规定1)以w代替ü充当韵母,2)以v和y作为标调字母,3)在声母r自成音节时,双写r为第四声,与其他韵母拼写时,双写r不变调。4)zh、ch、sh双写为zzh、cch、ssh表示第四声,5)以m表示轻声,再加上对生物名词构词法、化学元素名词构词法、数词构词法的字符含义的规定,形成如下文字(单字后的括号中对照写出了本发明的拼音汉字):nniuy牛
ggouv狗(
义码q代表偏旁犭),iany shiy岩石(
义码s、k代表偏旁山、口),rreny mminy人民
nuuqii怒气
luuxiian路线
kexwey科学
mmavluu马路
iiangy氧(
义码q代表偏旁气),ttaan碳(
义码t代表偏旁炭),等等。我们看到,该发明对1958年拼音方案改动太大,所有规定没有国家文字规范可依,偏离国民40多年来已经熟悉的汉语拼音字形太远,以字母双写表示汉字声调,不仅记忆困难,辨认也很困难,应用实施难度太大。括号中对照写出了本发明的拼音汉字,显而易见,拼音音节和标调符符合拼音方案规范、偏旁部首表示符合国家拆字规范和偏旁部首规范,标调符号形象,准确描述了汉语发音特点,容易学习,容易记忆。
这几种拼音文字方案和汉字编码方案综合比较如下表:
专利号 | 作者 | 目标 | 发明要点 | 对1958拼音方案利用 | 声调符、隔音符的处理 |
CN1088323A93120482 | 张飞鹏 | 一种文字兼汉字编码 | 定义词类代码,词按语法归类 | 局部改动,但规范性差,利用不充分 | 无专用声调符,以双写声母或韵母和其他字母表达 |
94104542 | 孙宏亮 | 一种文字兼汉字编码 | 用1880多个自定义音节书写形式及符号“-”“’”分化定形6万多条通用词语 | 改动太大,实际上利用很少 | 无专用声调符,以双写声母或韵母和其他字母表达 |
88107306 | 邱荷生 | 汉字编码 | 定义30个字母符号为发明者定义的拼音方案符号系统, | 无 | 用阿拉伯数字作为汉语声调符号 |
97115964 | 邱荷生 | 汉字编码 | 定义30个字母符号为发明者定义的拼音方案符号系统, | 无 | 用阿拉伯数字作为汉语声调符号 |
90107890 | 姜爱民 | 汉字编码 | 生物名词构词法 | 改动多利用少 | 专用声调符但无声 |
本发明 | 李军杰 | 一种文字兼汉字编码 | 定义29个字母符号为拼音汉字符号系统,义码代表部首,分化定形14000个方块汉字及10万条通用词语 | 改动极少,充分利用和维护了1958拼音方案, | 3个声调符作为文字符号并赋以语义,符合汉语发音特点,易学易记 |
2)有利于中文信息传输和处理
a.汉字信息传输
计算机信息传递有并联和串联两种方式。并联方式,一个字节的八个比特同时传递,好处是速度快,问题是成本高。如果在两个城市或两个国家之间用并联,那么,电缆和有关设施的成本很高。串联方式成本比并联方式要低得多,因而,在大范围和长距离的条件下作数据传递,大都用串联。串联传递,字符的字节是按照一个个比特来传递的。通讯收发到一定比特数量,必须确定一个字节是否传递完毕,以便将一连串的0和1转换为可以阅读的字符。大量统计表明,几种主要国际语言的信息熵值分别是:
法文 3.98比特 西班牙文 4.01比特
英文 4.03比特 俄文 4.35比特
方块汉字 9.65比特 拼音汉字 4.20比特
英文等拼音文字的的平均信息熵小于4.5比特,一个字节有八个比特,因此,可以将剩余的比特用来作奇偶检验和抗错。方块汉字需要两个字节,在建立字库的时候,两个字节的比特位全都用满了,没有剩余的比特位来作奇偶检验和抗错,因而中文网络通讯很容易出现坏码。为了满足多种语言文字的网络通讯和防止坏码,国际网络(如英特网)广泛采用MIME方式传递信息,其核心是使用七比特数据方式(7BIT DATA,纯文本字符方式)传递信息,剩下的一个比特作奇偶检验。这种方式通用于所有的计算机和网络渠道。英文等信息熵小的拼音文字本身就使用纯文本字符,不需要MIME转换。方块汉字字符信息熵超过9,没有MIME转换就很容易出现乱码或坏码。MIME转换是有成本消耗的,而汉字方式的转换成本消耗是世界上最大的。
根据200万方块汉字转换成的拼音汉字语料进行的信息熵分析结果指出,拼音汉字的信息熵为4.2,可以像英文等信息熵小的拼音文字一样使用纯文本字符传输,不需要MIME转换。可以预言,拼音汉字将在网络中文信息传输领域发挥重要作用,并将产生不可估量的经济效益。拼音汉字满足高度精密、高度可靠以及键盘处理、字符识别和语音识别3种信息处理方式的要求,具有方块汉字难以具有的优点,例如有序性、便于检索、便于记忆、书写方便、见字识音等,已经不单单是理想编码符号系统的某种推断,而且是一次成功的汉语拼音文字尝试,是完全符合汉字发展和计算机中文信息处理技术发展潮流的一次文字改革和拼音编码文字化的实践。无“重码”拼音汉字将会在汉字信息处理中发挥重要作用。
b.以拼音汉字的序性唯一地确定了方块汉字的序性。
方块汉字的排序虽然在国标GB/T13418-92中作了规定,但使用复杂繁琐,仍然存在部分随意性,不能算做彻底解决。虽然这一困扰计算机中文信息处理的难题人们探讨了几十年,现有汉字编码没有一家方案能解决。拼音汉字的无重码特点确保了与方块汉字一一对应的唯一性,而用来构成拼音汉字的29个字母符号具有唯一的顺序,因而确保了拼音汉字的有序性,相应地确保了方块汉字的有序性。方块汉字的有序性将形成各行各业的一个统一标准,将极大地改善中文信息处理的基础条件,将大幅度提高中文信息处理效率。
c.规范性和有理性
键盘符号同汉字编码之间的对应关系,如果没有任何理由可以解释,称为“无理编码”;如果这种对应关系能够以某种理由解释,称为“有理编码”。拼音汉字是最具合理性的“有理编码”。其理由是:
——所有的拼音汉字都是以1958年汉语拼音方案的汉语拼音表示形式(包括声调符号的形状)为主体,以义码为附加体,确保了同方块汉字发音的严格对应及其发音规范性。
——所有的拼音汉字都是以含有部首、偏旁意义的义码标注的,采用国标GB/T13418-92规定的201个部首、偏旁,归结为20类,分别隶属于20个义码,确保了义码的规范合理性,改善了拼音汉字作为文字或编码的易学易记性。
d.拼音汉字库的前后一致性
拼音汉字的建立是逐步实施逐步完成的,拼音汉字的覆盖范围可达到6万汉字,并确保兼容性,前后分段完成的产品仍能够构成完整系统。
e.拼音汉字分词书写,字词间有空格,可以克服方块汉字连写造成的信息处理中分词的困难,有望解决文字机器翻译等技术的障碍。
f.拼音汉字是一种汉语的精密而单义的形式语文,具有文字同发音严格对应并且发音准确的特点,有望提高语音机器翻译的质量问题。
g.拼音汉字采用拉丁字母,在OCR光学字符识别中其识别难度同英文一样,采用16×16点阵就可以清楚识别拼音汉字。拼音汉字将有力促进这个领域内中文信息产品和技术服务的高质量快速发展,并将产生巨大的经济效益。
3)无重声调码输入方案的优点
a.汉语文字和计算机输入编码的一致性好。
抽取相关拼音汉字的声母和声调作为特征符号形成了仿真拼音汉字无重声调码,规律性强、规范性强,汉语文字和计算机输入编码的一致,易学易记易用。
b.编码效率和录入速度高。
计算机键盘输入是不可替代的,在各种输入方式中占最大比例,因此键盘输入效率一直是人们关注的输入法性能的主要指标。200万字方块汉字语料的分析统计表明,对拼音汉字无重声调码编码的初级难度的文章(报纸文章、规范语言小说等),每个汉字的平均键数为1.5左右,中等难度的文章(方言小说等)每个汉字的平均键数为1.7左右,较高难度的文章(古文等)每个汉字的平均键数为1.9左右。由于拼音汉字的规范合理和易学易记性,使用拼音汉字无重声调码的录入者头脑中的编码过程效率一定会很高,可以断定,录入速度可以冠群。
c.听打和看打的适应性
拼音汉字无重声调码提取了汉语音节的3分之2的语音特征,语音冗余度大,歧义度小,肯定最适合于听打。看打,难点在于不认识的方块汉字。据统计,一级字库3758个字的累计使用频度已经达到99.88%,对于高中生甚至初中生的识字程度都可以达到这个水平,不认识的方块汉字通常不会很多,大可不必担心看打的适应性问题。为了解决方块汉字生字录入问题,设计了电子词典,可以通过偏旁、部首快速查字查码,进行快速输入。
d.语言和文字读音的准确表示及想打适应性
方块汉字能表义但不能直观地、直接地表音表调,拼音汉字不但能表义而且能够直观地、直接地表音表调,同时具备了严格唯一的顺序性,这是方块汉字无法比拟的优点。想打就是没有文稿边想边录写文章。由于拼音汉字都是严格按照1958年汉语拼音方案的规定给出拼写并标注了声调,确保了拼音汉字表达方块汉字读音的准确性和规范性,确保了语言或文字读音的准确表示,因而借助于拼音汉字的计算机输入就是一种母语的直接输入,非常现适应于想打。
e.键盘安排
计算机通用键盘是国际上广泛使用的文字处理工具,已经成为国际标准。现存的汉字编码方案中绝大部分方案都对现有计算机通用键盘进行了较多的重定义。可以断言,对现有计算机通用键盘进行重定义的范围越小则符号转换量越少、记忆量越小、录入速度越高。在拼音汉字符号系统的29个字母符号中,对现行键盘仅重定义了阳平符号
上声符号
和去声符号
其他均采用通用键盘原始定义,在迄今为止所有汉字编码中,键盘重定义范围最小。本发明设计了一种直接定义阳平声、上声和去声符号的中英文通用键盘,让每个键都不重定义,中英文状态不需要转换,这样便可以大大提高输入速度。
f.汉字输入“瓶颈”问题有望终结。
拼音汉字符合”汉语文字”的各种特征与条件,做到了码就是文字,是按照无重码原则设计的,具备汉语文字和计算机输入编码的一致性。采用仿真拼音汉字作计算机输入,可以减少甚至消除录入者头脑中由方块汉字到编码的转换过程,因此可以有效解决长期以来人们试图解决的汉字输入“瓶颈”问题。
g.几种著名拼音编码的综合比较
几种拼音编码的比较
编码名称 | 设计原则 | 声调表示 | 码元与键盘一致性 | 中英文状态切换 | 有无改造成文字的基础 | 帮助手段 | 智能性 |
简拼 | 有重码 | 无词义 | c级 | 有 | 无 | 联想提示 | 无 |
全拼 | 有重码 | 无词义 | c级 | 有 | 无 | 联想提示 | 无 |
双拼 | 有重码 | 无词义 | c级 | 有 | 无 | 联想提示 | 无 |
智能ABC | 有重码 | 无词义 | b级 | 有 | 有 | 联想提示 | 有 |
自然码 | 有重码 | 无词义 | c级 | 有 | 无 | 联想提示 | 有 |
万能码 | 有重码 | 无词义 | b级 | 有 | 有 | 联想提示 | 有 |
表意拼音 | 有重码 | 无词义 | b级 | 有 | 有 | 联想提示 | 有 |
拼音汉字 | 无重码 | 有词义 | a级 | 无 | 已成文字 | 双向词典 | 有 |
4)促进方块汉字改革
计算机中文信息处理呼唤着汉字改革。由于汉字编码符号系统和汉字符号系统本身存在着规则联系,因此很多专家根据理论推理和编码实践大胆预言:“如果有一种在计算机上广泛使用的拼音类汉字编码同方块汉字是一一对应的另外一种符号系统,那么,人们很难保证方块汉字和汉字编码符号不会发生混用和替代使用现象。如果出现这种编码,也许就是汉语的第二种文字。这种新的汉语文字将具有方块汉字本身难以具有的优点,例如有序性、便于检索、便于记忆、书写方便、见字识音等”。拼音汉字正是专家们预言的那种“新的汉语文字”。拼音汉字有利于提高社会生产效率、社会交流效率、缩短我国青少年学习汉字的周期、加快人才培养速度,拼音汉字的推广应用一定会促进方块汉字改革。这是改造1958年汉语拼音方案的一次尝试,作为汉语的第二种文字一定会具有长久可用性。随着使用范围的扩大、使用层次的加深,拼音汉字对国家和社会经济发展的重要性和巨大贡献就会充分显示出来。
5)有利于推广普通话
规范全社会每个国民的汉字发音,不能只靠学生在学校里的短短几年学习,还要靠在社会上的交流使用,这就不仅要有政府的一般号召,而是必须依靠法定的能够准确表音的拼音汉字。如果方块汉字发音的随意性和无政府状态不能得到解决,方言地区的人们学习普通话就不会有效,普通话就不能真正推广。很多人成年之后只能认得方块汉字,把中小学学习的汉语拼音渐渐忘记了。出现这种情况的原因很简单:现行汉语拼音仅仅是一种注音符号,不是一种法定文字,学习它只是为了帮助人认识方块汉字,除此再没有其他用处。因此1958年汉语拼音对于推广普通话的作用有限。如果1958年汉语拼音方案不是注音符号而是汉语的第二种文字,那么情形就会大不一样。由于文字使用有强制性,有规范要求,迫使人们不得不学,不得不用,不能胡写,不能乱拼,不能随意发音。我们有理由断定,如果推出法定的拼音汉字,我国的普通话推广一定会比现在成功得多、迅速得多、有效得多。我们期望有朝一日全中国的每一个人都会讲普通话,实现中华民族的语言统一,实现大中华语同音。要想有这一天,必须要坚决推出能够表义而且直接准确表音的拼音汉字。
6)有利于对外交流和国家地位的提高
对外交流使用什么文字,不仅有一个方便不方便、准确不准确的问题,而且有一个民族地位问题。方块汉字虽然被认定为国际会议上的工作文字之一,但由于方块汉字难学难认难读难写,外国人学习汉语很困难,因而学习汉语的人数总体上不多,国际会议交流实际上很少使用中文,仍然必须借助于英语或其他外语。拼音汉字特别有利于外国人学汉语。让外国人易学易记就有利于汉语在全世界的传播。一个民族的语言在世界上传播的广泛程度,是这个民族的世界地位高低的标志。在当前我国经济迅猛发展的形势下,拼音汉字与国际上众多的拼音文字“接轨”,有利于汉语向全世界的传播,有利于对外交流,有利于传播中华民族文化,有利于提高中华民族和中国的国际地位。因此,尽快创立拼音汉字,不仅是中国经济发展的需要,也是中国政治开拓的需要。我们期望有朝一日中国人在国际会议上宣读文件直接用汉语而不再用外语,我们更期望汉语能够像英语一样在全世界各个国家传播。要想有这一天,必须要坚决推出以拉丁字母符号为语素的拼音汉字。
拼音汉字是一种高效率的文字。它可以见字读音,易学、易记、易写,极适于儿童学认,是加快我国国民教育和人才培养的重要手段,也是我国扫除文盲的有效手段。它可以直接进入计算机,有序性,极有利于中文信息传输,有利于中文信息检索查询和处理,有利于提高机器翻译以及各类有关中文的IT产品的技术水平。它极适于外国人用来学习汉语,有利于汉语向全世界传播,有利于对外交流,有利于提高我国的国际地位和民族地位。几代人苦苦探索汉语拼音文字上百年没有提出可行方案,不过是时候未到。拼音汉字符合我国经济、科技、文化的高速度发展的需要,符合推广普通话、缩短国民学会汉语的周期、提高社会信息交流效率、改善中文信息处理基础手段等方面的迫切需要。拼音汉字是在计算机中文信息处理技术大变革中吸收百家之长总结出来的理论和方法,是一个能产生良好社会效益和经济效益、能造福于千秋万代的语言信息交流工具,一定会引起全社会广泛的注意和应用。本发明已经把包含国家标准GB2312-80中的6763个方块汉字和其中对应的同形异音字、异体字在内的14000个方块汉字全部改写为独立无重的拉丁化拼音形式,并以此为基础建立了约10万条常用汉字词汇的独立无重的拉丁化拼音形式,可以准确无误地表达14000个方块汉字所能表达的全部语义,可以看作是汉语的另一种文字形式,这是一次大规模的汉语拼音文字探索,为今后的研究铺垫了基石。我们相信拼音汉字一定能得到社会承认,我们对拼音汉字的前景十分乐观。为了让拼音汉字走入社会,我们建议下列举措:
●先以拼音汉字无重声调码形式应用推广,考察其实际效果。
●由于拼音汉字是一项浩大的系统工程,包含着大量的技术细节,某一个人的观点不可能尽善尽美并提出完整的最佳方案,希望列入汉语文字研究计划,组成专家队伍对其进行雕凿斧正,使其完善。
●国家应当尽快推出配套的规范,例如人名、地名、山河湖海名、译名规范。
●国家应当尽快制定法律,规定法定方块汉字及其使用规范,逐步禁用繁体、异体字。
●推出国家认可的试用型拼音汉字,按“一语二文”原则,逐步试用。
●制定拼音汉字的国家标准。
●制定法律,正式推广应用。
Claims (3)
1、一种仿真拼音汉字输入法,其特征是:该输入法按照声母音段、韵母音段、无声义码段和声调音段的顺序输入各码元,在通用计算机键盘上重新定义3个键位表示声调音段的阳平声符号
上声符号
去声符号
其他字母同键盘完全对应;
所述声母音段和韵母音段采用全拼输入,以1958年国家标准拼音方案的声母和韵母为标准,但以yu替代ü;
所述无声义码段采用20个义码表示,以国标GB/T13418-92附件1汉字部首表规定的201部为依据,设定偏旁和部首的称谓读音或习惯读音,并据此对20个义码所代表的偏旁、部首和部件称谓进行归类如下:b—八,丷,巴,宀,冖,勹,卜,白,半,比,匕,贝,鼻,疒,髟;c—艹,厂,
车,寸,臣,虫,赤,辰,采,齿,
辶,长,乂,
屮;d—丶,刀,,刂,豆,歹,大,癶,鼎,夂;f—髟,方,父,风,缶,阜,阝左耳,非,飞;g—弓,革,戈,鬼,干,甘,工,瓜,艮,谷,骨,广,龟,高,鼓,
巛;h—一,火,灬,禾,户,黑,虎,,黄,
j—金,钅,斤,巾,几,己,见,角,臼,廴,韭;k—口,匚,凵,冂;l—力,立,老,
里,龙,卤,鹿,耒,隶,
耳,卩,而,儿,尔,零声母字;m—门,木,马,麻,毛,母,毋,目,皿,矛,米,麦,黾,面;n—女,牛,牜,
鸟,廾;p—丿,皮,片,爿,匹,疋,
彡,攴;q—气,欠,犬,犭,青,,其,乞,
r—人,入,亻,,彳,日,肉;s—丨,水,冫,氵,
身,首,舌,手,,扌,食,饣,纟,糸,示,礻,士,山,四,罒,石,十,矢,尸,豕,氏,厶,生,殳,鼠,黍,色,巳;t—土,士,田,天,亠;w—文,攵,王,玉,韦,瓦,毋,无,亠;x—心,忄,,
夕,辛,小,,
西,血,穴,香,巛,彡,彐;y—一,牙,言,讠,又,乙,衣,衤,弋,尤,尢,
业,雨,鱼,页,羽,聿,
月,幺,羊,,
酉,音,曰,邑,阝右耳朵,龠,夭,已,ナ,玉,マ;z—乙,乚、乛、亅、
隹,足,,舟,子,孑,止,爪,爫,竹,,自,走,辶,支,攴,豸,至,
丬;所述无声义码段的取码规则如下:
●根据国家标准局1992年发布的现代汉语字频统计表选取每个音节中的最高频字作为现代汉语的1285个拼音音节的无义码字;
●左右结构及左中右结构的重码汉字中,具有义码不同的左偏旁的汉字取左偏旁,具有义码相同的左偏旁的汉字则高频字取左偏旁,低频字取右偏旁;上下结构及上中下结构的重码汉字中,具有义码不同的上偏旁的汉字取上偏旁,具有义码相同的上偏旁的汉字则高频字取上偏旁,低频字取下偏旁;内外结构的重码汉字中,具有义码不同的外偏旁的汉字取外偏旁,具有义码相同的外偏旁的汉字则高频字取外偏旁,低频字取内偏旁发音的声母作为义码;
●相同音节内的重码汉字使用上述义码规则没有被全部区分时,剩余的重码汉字用整字发音的声母作为义码;
●相同音节内的重码汉字仍没有被全部区分时,剩余的重码汉字用该汉字第一笔部件称谓的汉字发音的声母作为义码;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 00113828 CN1129058C (zh) | 2000-06-01 | 2000-06-01 | 仿真拼音汉字输入法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 00113828 CN1129058C (zh) | 2000-06-01 | 2000-06-01 | 仿真拼音汉字输入法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1289078A CN1289078A (zh) | 2001-03-28 |
CN1129058C true CN1129058C (zh) | 2003-11-26 |
Family
ID=4583579
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 00113828 Expired - Fee Related CN1129058C (zh) | 2000-06-01 | 2000-06-01 | 仿真拼音汉字输入法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1129058C (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103376910A (zh) * | 2012-04-23 | 2013-10-30 | 武汉科技大学 | 无重码双拼输入法 |
CN104423620A (zh) * | 2013-08-21 | 2015-03-18 | 李维良 | 一种五特征输入法 |
CN109710089A (zh) * | 2019-01-22 | 2019-05-03 | 毕耘涛 | 全拼音汉字输入法和汉字输入系统 |
-
2000
- 2000-06-01 CN CN 00113828 patent/CN1129058C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1289078A (zh) | 2001-03-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1040276A (zh) | 简繁字根汉字输入技术及其键盘 | |
CN1015218B (zh) | 字根编码输入法及其设备 | |
CN1129058C (zh) | 仿真拼音汉字输入法 | |
CN101814244A (zh) | 以带调拼音支持的多媒体汉语学习机方案 | |
CN1896923A (zh) | 英语巴蜀杆栏式汉字化词型翻译中间文本计算机输入方法 | |
CN1166997C (zh) | 汉字免拆分快速输入法 | |
CN1241101C (zh) | 一种基于汉语音节双读方案的信息输入方法 | |
CN1121645C (zh) | 音形字理码汉字输入方法 | |
CN85100087A (zh) | 《中文声数编码》方案及其实现方法 | |
CN1081355C (zh) | 三音码计算机汉字输入方法及其键盘 | |
CN1275732A (zh) | 汉语键盘输入系统及其应用技术 | |
CN1455358A (zh) | 华语拼音统一方案及单拼输入与智能转换翻译 | |
CN1109283C (zh) | 利用计算机键盘的拼音汉词编码输入法 | |
CN1062797A (zh) | 文字输入键盘及方法 | |
CN1220127C (zh) | 双分汉字与双分输入法及合成字模 | |
CN1164689A (zh) | 以词为单位的音形意汉字计算机输入法及中西文兼容键盘 | |
CN1357814A (zh) | 计算机汉语键盘及其汉语信息的输入和处理方法 | |
CN1108552C (zh) | 拼音汉字完善汉字法(phf) | |
CN1123818C (zh) | 电拼汉字计算机输入法、所用键盘及其中文内码 | |
CN1159029A (zh) | 规范部首笔画合成输入法及产品 | |
CN1409240A (zh) | 一种全新的表征万物和字词的音象形信息系统 | |
CN1182235A (zh) | 音素结构注音符号双拼及其加调双拼双打46键式输入法 | |
CN1210295A (zh) | 中西文字编码智能输入方法及键盘 | |
CN1120408C (zh) | 一种计算机结构声读汉字输入方法 | |
CN1374577A (zh) | 英文字母键盘和数字键盘通用汉字电脑输入法及其键盘 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
DD01 | Delivery of document by public notice |
Addressee: Li Junjie Document name: Notification to Pay the Fees |
|
DD01 | Delivery of document by public notice |
Addressee: Li Junjie Document name: Notification of Termination of Patent Right |
|
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20031126 Termination date: 20140601 |
|
EXPY | Termination of patent right or utility model |