CN1153334A - 计算机汉字“字块编码”方案 - Google Patents
计算机汉字“字块编码”方案 Download PDFInfo
- Publication number
- CN1153334A CN1153334A CN 95106276 CN95106276A CN1153334A CN 1153334 A CN1153334 A CN 1153334A CN 95106276 CN95106276 CN 95106276 CN 95106276 A CN95106276 A CN 95106276A CN 1153334 A CN1153334 A CN 1153334A
- Authority
- CN
- China
- Prior art keywords
- word
- china
- code
- stroke
- monomer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims abstract description 9
- 239000000178 monomer Substances 0.000 claims description 16
- 230000015572 biosynthetic process Effects 0.000 claims description 4
- 238000005755 formation reaction Methods 0.000 claims description 4
- 238000005498 polishing Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明涉及一种计算机汉字“华夏笔划字型编码”方案,属计算机中文信息处理领域。该编码方案把汉字划分为二体字、三体字、围体字和单体字四种类型,把各字块的首笔划分为斜、横、竖三种类型,次笔划分为横、竖、撇、捺、单折、复折六种类型,首次两笔的关系分为交叉、方框两种类型,每两笔构成一个唯一的编码键位,基本编码为3码,第四笔为识别码(末笔+字型,或汉字读音声母首字母),形成“华下笔型”和“华夏笔声”编码输入法。本方案还提供由0~十个数字构成的四位华夏数字编码。本方案具有编码组合唯一、重码率低、记忆量小,易学易用,短期训练后可实现盲打等特点。
Description
本发明涉及一种计算机汉字“华夏笔划字型编码”方案,属计算机中文信息处理领域。
现有均汉字编码主要有按汉字读音进行编码的音码,按汉字字型结构进行编码的形码和音形结合的混合码,上述各编码均能实现汉字的输入,但音码由于具有对汉字的读音准确性要求高,重码字多等特点,难学难用,输入速度较慢。一般形码则由于选用字根多和规则繁杂而导致难学难记、难以推广。音形结合的混合码虽然能集中汉字更多的信息,但大多数的方案设计复杂,较难掌握。
本发明的目的在于克服现有技术之不足而提供一种重码率低、易学易掌握的、既具有形码特征,又具有混合码特征的华夏笔划字型编码。
本发明四是这样实现的:华夏笔划字型编码方案根据汉字的自然结构把汉字分为二体字、三体字、围体字和单体字四种类型,从各种类型汉字自然形成的各“字块”中选取首笔划、次笔划或末笔划,对汉字进行编码;二体字、三体字、围体字的基本码长为3,第4码为识别码;华夏笔划字型编码方案包括华夏笔型编码、华夏笔声编码、华夏数字编码三种汉字编码输入法。
华夏笔型编码和华夏笔声编码根据计算机键盘英文字母键的布局规律,把汉字各各“块”的首笔划分为斜、横、竖(折)三种类型次笔划分为横(提)、竖、撇、捺、(点)、单折、复折六种类型,把首、次笔划构成的笔型关系分为交叉和方框两种类型,与键盘对应形成3×8的行列交叉二维坐标取码;二体字的第三码为二体末笔交叉取码;含围的二体字按三体字(围算作两体)取码;围体字视“围中”可否拆分按二体字或三体字取码;单体字按笔划每两笔一组取码。单体字华夏笔型均以字母“0”结束,除总笔划数在四笔以上的单体字外,其它单体字的华夏笔声码也以字母“O”结束;单体字除“O”外,最大码长为3,根据其笔划数可为一码、二码或三码,码元为24。华夏笔型码利用“末字块末笔与字型”构成3×8的行列交叉取码;华夏笔声码用读音声母首字母(分别用U、I代替O、P)作为识别码,码元均为24。
华夏笔型编码和华夏笔声编码根据汉字的使用频率高低定义了一、二、三级共四千多个简码,其间组编码为四位编码,范围为两字至二十个字的词组(或短语),对于两字词,每字各取头两码;三字词,第一个字取头两码,二、三字各取第一码;三字以上的词为多字词,取第一、二、三、末字的第一码。
华夏数字编码为四位数字编码,第一码为字型代码,用0~9十个数字作为编码符号分别代表十种不同的汉字字型;后三码为坐标编码,以各字块的首、次两笔构成与计算机数字小键盘相对应的3×3行列交叉二维坐标,每两笔确定一码,单体字不足四码时以数字“0”补齐,华夏数字编码均为四位等长编码,码元为10。
附图1为华夏笔型和华夏笔声编码的键位分配图。
附图2为华夏数字编码的字型代码键位分配图。
附图3为华夏数字编码的坐标编码键位分配图。
采用以上所述的三种编码输入法,分别在SPDOS、UCDOS和CCDOS下挂接使用,同时配套了华夏文字处理系统HXED,均较好地实现了华夏码的各种功能。下表所列内容为采用华夏笔划字型编码方案的实例:
例(字、词) | 字型或词 | 华夏笔型 | 华夏笔声 | 华夏数字 |
悲 | 广义上下体(三体字) | cciy | ccib | 5229 |
化 | 左右体(二体字) | rqlv | rqlh | 4993 |
胜 | 含围的二体字 | idef | ides | 4958 |
同 | “围中”可拆分的围体字 | ldxa | ldxt | 2353 |
用 | “围中”不可拆分的维体字 | idvz | idvy | 2952 |
一 | 两笔以内的单体字 | do | dyo | 0500 |
玉 | 四笔以上的单体字 | dcyo | dcyy | 0527 |
编码 | 两字词 | mugl | mugl | - |
计算机 | 三字词 | iaea | iaea | |
艰苦奋斗 | 多字词 | zaay | zaay | |
中华人民共和国 | 多字词 | mrym | mrym |
本发明与现有技术相比,具有以下优点:
1、利用汉字方块结构的特点,把汉字归为四种类型,并按一定的规则对构成汉字的各“块”进行编码,该方法较符合汉字结构规律。使用该编码时,用户只需认识几种字型、笔划就能上机编码,具有记忆量小、编码直观、易学易用等特点。
2、采用行列交叉的二维坐标取码方法,与汉字的的二维结构和计算机键盘英文字母的二维排列完全相符,编码键位安排只与笔划和字型的规定损顺序有关,与英文字母在键盘上的排列有关,一般人员(包括对键盘不熟悉或不懂英文字母的人员)稍作训练后能实现盲打。
3、该编码方案中加入了基于笔划字型的拼形识别码或基于读音声母首字母的拼音识别码,使用灵活,适用于不同层次的人员使用。
4、该编码方案中的数字编码可作为学习方案的过渡方法使用,亦可作为检字方法使用。
5、方案配套有简码、词组、学习(P键)等辅助输入手段,能大幅度提高输入速度和学习效率。
6、动态重码率低,平均击键次数低,可保证较快的输入速度。
Claims (3)
1、一种计算机汉字“华夏笔划字型编码”方案,其特征在于该方案根据汉字的自然结构把汉字划分为二体字、三体字、围体字和单体字四种类型,从各种类型形成的“块”中选取该字块的首笔划、次笔划或末笔划对汉字进行编码;二体字、三体字、围体字的基本码长为3,第4码为识别码;华夏笔划字型编码方案包括华夏笔型编码、华夏笔声编码、华夏数字编码输入法。
2、按权利要求1所述的华夏笔划字型编码方案,其特征在于华夏笔型编码和华夏笔声编码根据计算机键盘英文字母键的布局规律,把汉字各“块”的首笔划分为斜、横、竖(折)三种类型,次笔划分为横(提)、竖、撇、捺(点)、单折、复折六种类型,把首、次笔划构成的笔形关系分为交叉和方框两种类型,与键盘对应形成3×8的行列交叉二维坐标取码;二体字的第3码为三体末笔交叉取码;含围的二体字按三体字(围算作二体)取码;围体字视“围中”否可拆分按二体字或三体字字取码;单体字按笔划每两笔一组交叉取码;单体字华夏笔型编码均以字母“O”结束;除总笔划数在四笔以上的单体字外,其它单体字的华夏笔声编码也以字母“O”结束。单体字除“O”外,最大码长为3,根据其笔划数可为一码、二码或三码、码元为24;华夏笔型码第4码利用“末字块末笔与字型”构成3×8的行列交叉取码,华夏笔声码用读音声母首字母(分别用u、i代替o、p)作为识别码,码元均为24(除o、p外的英文字母)。
3、按权利要求1所述的华夏笔划字型编码方案,其特征在于由四位数构成字的华夏数字编码,第一码字型代码,用0-9十个数字作为编码符号分别代表十种不同的汉字字型,后三码为坐标交叉编码,以各字块的首、次两笔构成与计算机数字小键盘相对应的3×3行列交叉二维坐标,每两笔确定一码,单体字不足四码时以数字“0”补齐。华夏数字均为等长四码,码元10。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 95106276 CN1153334A (zh) | 1995-06-11 | 1995-06-11 | 计算机汉字“字块编码”方案 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 95106276 CN1153334A (zh) | 1995-06-11 | 1995-06-11 | 计算机汉字“字块编码”方案 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1153334A true CN1153334A (zh) | 1997-07-02 |
Family
ID=5075844
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 95106276 Pending CN1153334A (zh) | 1995-06-11 | 1995-06-11 | 计算机汉字“字块编码”方案 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1153334A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102339140A (zh) * | 2011-11-14 | 2012-02-01 | 大理学院 | 一种汉字拼形编码计算机输入方法 |
CN107885338A (zh) * | 2017-10-17 | 2018-04-06 | 惠州Tcl移动通信有限公司 | 笔画输入处理方法、计算机可读存储介质及终端 |
-
1995
- 1995-06-11 CN CN 95106276 patent/CN1153334A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102339140A (zh) * | 2011-11-14 | 2012-02-01 | 大理学院 | 一种汉字拼形编码计算机输入方法 |
CN107885338A (zh) * | 2017-10-17 | 2018-04-06 | 惠州Tcl移动通信有限公司 | 笔画输入处理方法、计算机可读存储介质及终端 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1153334A (zh) | 计算机汉字“字块编码”方案 | |
CN101231558A (zh) | 甲骨文拼音与部件拆分输入法 | |
CN1069351A (zh) | 汉字直观音形编码输入法及键盘 | |
CN1207519A (zh) | 双笔画码汉字输入方法 | |
CN1032986C (zh) | 笔顺码计算机汉字输入方法 | |
CN1096112A (zh) | 一种汉字声母编码输入法及其所用键盘 | |
CN87105289A (zh) | 汉字形音编码法 | |
CN1055826A (zh) | 中华汉字编码输入方法 | |
CN1202461C (zh) | 一种四角号码计算机汉字输入方法 | |
CN1161497A (zh) | 汉语字词全息编码计算机输入方法及键盘 | |
CN1080070A (zh) | 形声位全息汉字编码 | |
CN1164982C (zh) | 汉字易码输入方法 | |
CN1219701A (zh) | 汉字笔划笔顺拼音部首数字输入法 | |
CN1036359C (zh) | 计算机汉字反切编码输入法 | |
CN1327313C (zh) | 计算机汉字十大结构符型输入法 | |
CN1054449C (zh) | 汉语字词全息编码计算机输入方法及键盘 | |
CN1304075A (zh) | 天然音形码计算机汉字编码输入法 | |
CN1107256C (zh) | 一种汉字右码计算机输入方法 | |
CN1141448A (zh) | 一种拼音笔画汉字输入方法及其所用键盘 | |
CN1042250A (zh) | 汉字层次三位编码方法及其键盘 | |
CN1107594A (zh) | 一种计算机汉字输入方法 | |
CN1164695A (zh) | 汉字笔形数值编码法 | |
CN1395160A (zh) | 十笔字型输入方法 | |
CN1079062A (zh) | 字根首音编码输入法及其键盘 | |
CN1316687A (zh) | 天然数字码电脑汉字编码输入法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |