TW201314498A - 嵌合字根式中文輸入法 - Google Patents
嵌合字根式中文輸入法 Download PDFInfo
- Publication number
- TW201314498A TW201314498A TW100133337A TW100133337A TW201314498A TW 201314498 A TW201314498 A TW 201314498A TW 100133337 A TW100133337 A TW 100133337A TW 100133337 A TW100133337 A TW 100133337A TW 201314498 A TW201314498 A TW 201314498A
- Authority
- TW
- Taiwan
- Prior art keywords
- chinese
- keyboard
- root
- roots
- word
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000013461 design Methods 0.000 claims description 4
- 238000013519 translation Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 3
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 3
- 239000010931 gold Substances 0.000 description 3
- 229910052737 gold Inorganic materials 0.000 description 3
- 239000002023 wood Substances 0.000 description 3
- YMHOBZXQZVXHBM-UHFFFAOYSA-N 2,5-dimethoxy-4-bromophenethylamine Chemical compound COC1=CC(CCN)=C(OC)C=C1Br YMHOBZXQZVXHBM-UHFFFAOYSA-N 0.000 description 1
- 241000143060 Americamysis bahia Species 0.000 description 1
- 235000017166 Bambusa arundinacea Nutrition 0.000 description 1
- 235000017491 Bambusa tulda Nutrition 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 244000082204 Phyllostachys viridis Species 0.000 description 1
- 235000015334 Phyllostachys viridis Nutrition 0.000 description 1
- 241000545067 Venus Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000011425 bamboo Substances 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Landscapes
- Document Processing Apparatus (AREA)
- Input From Keyboards Or The Like (AREA)
Abstract
一種便於記憶的鍵盤對應規則之產生方法及衍生出之輸入法,係執行於具有數字輸入元件及英文字母輸入元件之電子裝置,該電子裝置中存儲有與按鍵上的字碼相對應的中文字庫,該方法包括如下步驟:創造一個對應表,令其相對於每一個英文鍵盤有一個便於記憶之中文字,而此中文字又可以直接被拆解為數個字根;將中文文字依其第一筆畫、最後筆畫、與讀音之聲母,分別對應為“首字根”、“尾字根”、與“音字根”三碼,每一碼由一個鍵盤位置產生;使用者輸入三碼後可調出預存之對應中文字組選擇所需之輸入字。
Description
本發明係關於一種在電子裝置的鍵盤上輸入中文文字方法,特別是關於一種建立於特殊鍵盤對應規則之輸入法。
如何將中文輸入電腦或其他電子設備一直是令人困擾的問題。由於中文字並非由字母組成,中文輸入必須仰賴一層額外的轉換才能將一組鍵盤鍵入的順序(輸入鍵組)對應到內存的中文字。
傳統上,我們以兩種方式實踐這個對應:一是以字的讀音為標準,將音轉換成拼音符號,再以簡單的鍵盤對應輸入。拼音式輸入法的最大優點是容易學習,每個人根據日常口語的使用習慣便可輕易上手。但是拼音式輸入法也有一些缺點,其中最嚴重的是使用者必須分心在眾多同音字中挑選出正確的字,使得這類輸入法的速度無法提升。
另一種輸入法的途徑是將中文字依照特定的規則拆解成若干字根,再將字根分組,對應到鍵盤位置。這類字形式輸入法的速度相對較快,但是有一個致命的缺點:難學易忘。以字形為基礎的輸入法在台灣有倉頡、大易、嘸蝦米等,在中國大陸有五筆、鄭碼、二筆等輸入法。
中文字的構造遵循著若干基本規則。一個字往往能夠用直覺拆解成一些基本的構件,例如「明」可拆成「日」「月」、「呆」可拆成「口」「木」,符合直觀,每個人都能操作。也有某些輸入法為了避免龐大字根表的記憶困難,主張以基本筆劃、或是兩個基本筆劃合併的組合做為拆字的單元。但是用筆劃拆字,並不符合我們對中文字的直觀。我們相信,如果要超越中文眾多同音字的限制,仍必須以字根為單元將每個字拆分編碼。
以字形為基礎的輸入法包含兩套關鍵規則:將文字拆解成字根的「拆字規則」,與將字根對應到鍵盤位置的「對應規則」。如果要使「拆字規則」符合直觀、好記好學,所使用的中文字根數目一般在一百以上。如何將這許多看似無關的字根對應到實際鍵盤位置是一個棘手的問題。這一部分往往也是初學一種輸入法的人最難以克服的障礙。
為了方便學習,各種拆字式輸入法都設計了某種便於記憶學習的字根對應規則。一般的做法是先確定每個鍵的代表中文字,稱之為「碼元」,然後再將形狀類似之字根指定到同一碼元之位置。以倉頡輸入法為例,其碼元是:日(A)、月(B)、金(C)、木(D)、水(E)、火(F)、土(G)、竹(H)、戈(I)、十(J)、大(K)、中(L)、一(M)、弓(N)、人(O)、心(P)、手(Q)、口(R)、尸(S)、廿(T)、山(U)、女(V)、田(W)、卜(Y)。通常碼元與其對應之英文字母並無關係,為了讓使用者容易記憶,作者或許會設計一些可供聯想的口訣。例如倉頡碼有一種口訣是:「日頭、月餅、金星…」;”頭”表示”頭一個字母”,即是A;”餅”與”星”則依諧音對應到B與C。
一旦碼元與字根的對應確立後,可以依照不同拆碼原則產生各式輸入法。以倉頡碼為例,它衍生出:速成、快倉、全倉、易頡、大新、亂倉打鳥、輕鬆等眾多輸入法。而基於五筆鍵盤衍生出的輸入法也有:極點五筆、華夏五筆、搜狗五筆等等。由此看來,鍵盤對應規則可說是輸入法的靈魂。
為了克服一般字根表難背難學的缺點,本發明提出一種將字根嵌合成一般中文字,使字根能符合直觀地對應到鍵盤字母的方法。
若要以字根為單元拆解中文字,大致需要上百個字根才能符合直觀。換言之,如果只用26個英文字母鍵進行編碼,每一個鍵位必需對應數個字根。如果能夠找出一組25或26個中文字,每一個字分別能與一個英文字母產生聯想,同時其本身又由一組字根構成,那麼我們就可以輕易地記憶這些字根以及它們所對應的鍵盤位置。
本發明提出一種符合直觀的字根鍵盤設計方法。許多中文字是直接由字根嵌合而成,換言之,其本身可以拆解成若干個符合直觀的字根。而這個中文字本身的意義又可以直接譯成英文然後自然地對應到鍵盤。舉例來說:“早”這個字由“日”與“十”兩個字根組成。透過[早-Early]的中英對照,我們可以很直觀地將“日”與”十”這兩個字根對應到“E”這個鍵盤位置。又如“釣”可以拆成“金”、“勹”與“丶”,而“釣魚”的英譯是“Fishing”,因此鍵盤上的“F”就代表“金”、“勹”與“丶”這三個字根。我們考慮所有常用的嵌合式中文字,在其中挑出一組作為碼元,它們必須同時符合二個條件:(一)嵌合出這組碼元的字根無重複,(二)每一個碼元對應到一個字詞,這個字詞的英文翻譯的頭一個字母無重複。
例如根據這個方法,可以選出如第1圖所示之25個碼元,分別對應到不同之英文字母(“X”保留為其他用途),因此使用者只要記熟這25個字與其英文意涵,便掌握了鍵盤上六十多個字根的位置。相較於一般輸入法,本發明不但降低了將字根對應到碼元的記憶負擔,同時因為碼元本身代表的六十多個字根提供了更廣泛的類比基礎,未被碼元涵蓋的字根可以更直覺地經由聯想與碼元連結。
在拆字規則方面,本發明捨棄將每一個字完全拆分成字根的傳統模式,對於每一個中文字,依其第一筆劃與最末筆劃所屬之字根取兩碼,再加上由其讀音之聲母對應之鍵盤,這三碼即形成此一中文字之編碼。雖然這種固定三碼長度的法則會產生若干重碼,但是拆字的規則大為簡化,便於學習。三碼可以產生一萬多種組合,相較於拼音式輸入法只有一千多種發音組合,選字需求將大幅降低,使用者可進一步依賴智能選字系統滿足所需。
要依照嵌合字根原理設計一套輸入法首先必須選出認為可用之簡單中文字,同時將其包含之字根與可能對應的英文字母表列出來。我們稱這些字為「候選字庫」。例如我們考慮“案”這個字,它可以直觀地背拆解成“宀”、“女”、“木”這三個字根,而透過[案例-Case]與[答案-Answer]這兩項中英對應,我們可以選擇C或A作為“案”的代表鍵。當然,如果有需要,我們也可以考慮更多相對比較不自然的中英文對照以尋求更多的鍵盤對應,例如可以加入[提案-Proposal]讓P也可能代表“案”。
第4圖列出更多的例子,但是它只顯示可供我們選擇的眾多候選字中的一小部分,我們省略了較罕用字(如“嵌”)、不能直覺地被拆解的字(如“世”)、找不到妥適英文對應的字(如“系”)、字根數過多的字(如“慮”);實際上考量的「候選字庫」超過三百個字。
接著必須就每一個英文字母對應之中文字中選定一個作為碼元,要求所選出的碼元中沒有重複字根。為此,我們建立一個「隨機演算法」(Ramdomized Algorithm)。開始時,建立一個空的「選定字集」,然後在不引進重複字根的條件下,隨機從「候選字庫」中挑出一個字加入。如此反覆,直到「選定字集」中包含了25個字為止。此時再以「匹配」(Matching)演算法檢查這25個字是否能對應到不同的英文字母。以上過程中如果失敗或遇到無字可選的情況,就重新開始。流程圖如第5圖。
實務上,我們也可以先以人工選定一些較符合直觀的字,再以電腦輔助完成剩餘的選擇。第1圖顯示一組依照以上規則所選出之鍵盤對應規則。實踐本發明之方法,可以產生多種不同的碼元組合。第6圖顯示了更多例子。
選定碼元組合後,我們的鍵盤上就對應了數十個字根。但是數目還不夠。以第1圖的碼元組合為例,“工”、“廴”、“刀”等字根就在基本字根的涵蓋之外。但是我們可以將它們指派到形狀相似的字根上,例如以“土”代表“工”、以“辶”代表“廴”、以“力”代表“刀”。如此規定後,幾乎所有常用字根都能被直覺地對應到基本字根。第3圖顯示了一個將各種字根變化對應到基本字根的規則。
因為本發明並不將每一個中文字完全拆解取碼,而是取包含首尾兩筆劃的兩個字根,即使少了某些在其他輸入法中被使用的字根,單是由筆劃也能夠得出合理的編碼。
任何一個中文輸入系統無非只是一個碼表。依照規定的字根對應與簡單的取碼規則對所有中文字建立出碼表後,我們的工作就接近完成。剩下的工作是建立一個智能選字的機制;包括對大量語料庫進行分析統計,找出字與字之間出現的機率,以及對單一使用者新輸入的字進行學習。這些工作都有大量公開且成熟的技術與文件可參考,因此不再贅言。
上述實施例僅為例示性說明本發明之原理及其功效,而非用於限制本發明。本發明亦可藉由其他不同之具體實例加以實施或應用,任何熟習此項技藝之人士均可在不違背本發明之精神及範疇下,對上述實施例進行修飾與變化。因此,本發明之權利保護範圍,應如後述之申請專利範圍所列。
步驟510‧‧‧選出一組嵌合字「候選字庫」
步驟520‧‧‧記錄每個字包含的字根
步驟530‧‧‧附加對應之英文意義並記錄首字母
步驟540‧‧‧隨機由「候選字庫」中選取一字加入「選定字集」
步驟550‧‧‧將「候選字庫」中具有與「選定字集」相同字根的字移除
步驟560‧‧‧「選定字集」之字數是否已達25
步驟570‧‧‧以匹配程式(matching)檢查「選定字集」中每個字是否可對應到一不同的英文首字母
步驟571‧‧‧輸出「選定字集」
步驟580‧‧‧「候選字庫」中是否仍有字可選
步驟590‧‧‧載入原始「候選字庫」
第1圖係顯示依本發明較佳實施例之鍵盤對應。
第2圖係顯示依本發明較佳實施例之英文聯想規則。
第3A,3B,3C,3D圖係顯示依本發明較佳實施例之字根涵蓋對應規則。
第4圖係顯示本發明尋找一組對應於英文鍵盤之碼元之演算法預先建立之「候選字庫」示意圖。
第5圖係顯示依本發明尋找一組對應於英文鍵盤之碼元之演算法流程圖。
第6A,6B,6C圖係顯示若干依本發明演算法所產生之對應碼元。
Claims (2)
- 一種中文輸入法,係執行於具有各式鍵盤之電子裝置,特別有關於一種使用嵌合字根方法將字根組合為中文字,再依其英文翻譯對應到鍵盤位置,其步驟包括有:設計一鍵盤對應表,供使用者記憶鍵盤與字根之對應關係;規定取碼之拆解規則,並依此規則建立中文字集之碼表;接收使用者之輸入鍵組,由碼表中找出對應中文字。
- 如申請專利範圍第1項所述之嵌合字根式輸入法,其中字根與鍵盤對應規則來自將數個字根嵌合為一個中文字,再依該字之英文意涵對應至鍵盤位置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW100133337A TW201314498A (zh) | 2011-09-16 | 2011-09-16 | 嵌合字根式中文輸入法 |
CN201210313088.3A CN102999169B (zh) | 2011-09-16 | 2012-08-29 | 嵌合字根式中文输入法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW100133337A TW201314498A (zh) | 2011-09-16 | 2011-09-16 | 嵌合字根式中文輸入法 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW201314498A true TW201314498A (zh) | 2013-04-01 |
Family
ID=47927825
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW100133337A TW201314498A (zh) | 2011-09-16 | 2011-09-16 | 嵌合字根式中文輸入法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN102999169B (zh) |
TW (1) | TW201314498A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI596510B (zh) * | 2014-02-17 | 2017-08-21 | 李雄熙 | 利用組合鍵的中文輸入裝置及方法 |
CN108304082A (zh) * | 2018-02-27 | 2018-07-20 | 秦明 | 全部汉字汉词简易无重码通用输入法 |
TWI672614B (zh) * | 2018-10-05 | 2019-09-21 | 陳壬癸 | 中文輸入之方法及其輸入裝置 |
TWI777235B (zh) * | 2019-10-25 | 2022-09-11 | 文威 錢 | 一種漢字輸入法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1068685C (zh) * | 1997-12-15 | 2001-07-18 | 童华 | 无重码汉语拼音输入法 |
TW200817938A (en) * | 2006-10-04 | 2008-04-16 | guo-sheng Yu | A Chinese character input method |
-
2011
- 2011-09-16 TW TW100133337A patent/TW201314498A/zh unknown
-
2012
- 2012-08-29 CN CN201210313088.3A patent/CN102999169B/zh not_active Expired - Fee Related
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI596510B (zh) * | 2014-02-17 | 2017-08-21 | 李雄熙 | 利用組合鍵的中文輸入裝置及方法 |
CN108304082A (zh) * | 2018-02-27 | 2018-07-20 | 秦明 | 全部汉字汉词简易无重码通用输入法 |
TWI672614B (zh) * | 2018-10-05 | 2019-09-21 | 陳壬癸 | 中文輸入之方法及其輸入裝置 |
TWI777235B (zh) * | 2019-10-25 | 2022-09-11 | 文威 錢 | 一種漢字輸入法 |
Also Published As
Publication number | Publication date |
---|---|
CN102999169A (zh) | 2013-03-27 |
CN102999169B (zh) | 2017-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101620503B (zh) | 一种汉字输入方法和装置 | |
WO2015147549A1 (ko) | 한자 입력장치와 한자 입력방법 및 이를 이용한 한자 검색방법 | |
TW201314498A (zh) | 嵌合字根式中文輸入法 | |
JP6379215B2 (ja) | コンピュータの漢字入力装置および漢字入力方法 | |
CN102750000A (zh) | 双拼王输入法 | |
CN103376910A (zh) | 无重码双拼输入法 | |
CN103176616A (zh) | 古琴减字谱字符的输入方法和装置 | |
WO2016029729A1 (zh) | 一种藏文输入法 | |
CN102129302B (zh) | 一种通过计算机字母或数字键盘输入汉字的方法 | |
CN102103415A (zh) | 一种古琴减字谱字符输入的计算机处理方法 | |
CN100403239C (zh) | 基于英文键盘的藏文输入法 | |
CN102750002A (zh) | 数码汉字输入法 | |
CN100498663C (zh) | 一种利用韩文字母输入汉字的方法 | |
JP5318030B2 (ja) | 入力支援装置、抽出方法、プログラム、及び情報処理装置 | |
TWI541664B (zh) | Computer - aided selection of word - free input | |
CN107256092B (zh) | 汉字数字形码快速输入法 | |
CN105511636A (zh) | 全部汉字汉词简易无重码统一输入法改进 | |
CN102096478B (zh) | 复笔汉字输入法 | |
CN104238765B (zh) | 中小学生键盘,标拼码输入法 | |
CN102156616A (zh) | 触摸屏写键输入方法 | |
TW201011599A (en) | Interpreted voice communication | |
CN100594469C (zh) | 汉字笔码输入法 | |
Martin et al. | Continuous EdgeWrite: Dictionary-based disambiguation instead of explicit segmentation by the user | |
CN112328095A (zh) | 基本不用数字键选字的四用音形码汉字输入法及输入平台 | |
CN1108553C (zh) | 通用普及型音元形音汉字编码输入方法 |