CN1836226A

CN1836226A - 转换非字母语言字元的方法及装置

Info

Publication number: CN1836226A
Application number: CNA2004800235482A
Authority: CN
Inventors: 熊锦棠
Original assignee: Individual
Current assignee: Individual
Priority date: 2003-08-21
Filing date: 2004-08-21
Publication date: 2006-09-20
Also published as: WO2005020090A1; MY147060A

Abstract

本发明一种转换非字母语言字元的方法及装置，与将一非文字母语言之想要的字元(character)转换为上下文资讯与语言模式的形式之方法有关。根据本发明的方法，其中该想要的字元是以子音(consonant)、母音(vowel)、音调，以及该字元的字根(radical，即部首)的组合来表示。举例来说，此一方法在电脑或电传打字机(teletypewriter)上输入中文字元，或者是将字元的构成元件，也就是子音、母音、音调、以及字根准确地转换语言模式，甚至是对多重发音的字元来说，都相当地简便与好用。该方法也可用不同的文字母(alphabet)组合来代表中文字元的所有字根。

Description

转换非字母语言字元的方法及装置

【技术领域】

本发明涉及一种转换非字母语言字元的方法及装置，具体是涉及一种将一非文字母语言想要的字元转换为上下文资讯与语言模式的形式的方法。

【背景技术】

中文通常是以相当庞大数量的字元(character)为其特征。英文具有26个字母(letter)，用来组成各种单字(word)，相形之下，中文具有数千个象形文字(称为中文字)，用来代表整个单字；每个字元是由数个单位的字根(radical，即部首)与笔画组成，而部首的数目有数百个。由于中文具有庞大数量的字元，因此在电子通讯时代，书写中文字元与其它可以利用文字母(alphabet)拼出的书写语言相较下，在资讯传递速度、记忆便利性、手写或中打等方面，都呈现相对的弱势。

基本上来说，中文字元的输入方法可分为2种类型。一种类型是以部首为主，并且将一组部首对应至标准英文键盘上，另一种类型是采用语音的方式，比如中文语音拼字(Chinese Phonetic Spelling，或汉语拼音)，久已用于代表中文字元。在以汉语拼音为主的方式中，每一个中文字元是以其发音的语音拼字方式，用罗马文字代表，因此，中文字元的拼音(Pinyin)方式，可以用和罗马字母相同的音素(phoneme)加以细分。另外，音调的资讯可以用区别的标记(diacritical mark)表示。

尽管中文语音拼字(汉语拼音)可利用文字母拼字来定义特定中文字元的发音，但是太多中文字元具有同样发音与相同拼字方式，还是会有问题与混淆之处，这些混淆的问题让中文语音拼字(汉语拼音)无法成功地取代传统中文字元，或与传统中文字元并行，简而言之，中文语音拼字(汉语拼音)与中文字元之间缺乏一对一对应关系，造成目前中文语音拼字(汉语拼音)无法成功地取代，或与中文字元并行。

中文字元罗马文字化(Romanization of Chinese characters)至今，还没有一套令人满意且实用的解决方案，能够让中文字元与罗马化中文字元之间有一对一的对应关系。

传统的中文语音拼字「汉语拼音」采用类似英文的字母表，其中包括A到Z的字母，还有所有母音a，e，i，o，u以特别的字元āáǎà、ēéěè、īíǐì、ōóǒò、ūúǔù、ǖǘǚǜ、ê等标示特定的音调。中文语音拼字还不能使用全英文字母的拼字方法，因此无法在以英文为主的键盘或打字机上打出中文语音拼字，而中文语音拼字同样地也还没有将中文字元的中文语音拼字与其相关部首(中文字元的「起源」标头)相结合，成为可与其它字元区分的「全字母(all-alphabet-letter))的特殊单字。

中华人民共和国专利案号第1209598号一案揭示了一种为每一个中文字元输入4个键的语音中文字元的输入方法，不过此方法仅限于4个键的应用，而且在4个键与对象中文字元之间，并无一对一的对应关系。

【发明内容】

本发明的目的是提出一种将一非文字母语言之想要的字元转换为上下文资讯与语言模式的形式之方法。本发明能让较佳为中文字元的非文字母语言完全地文字母化，或罗马化为特定的「全字母单字(all-alphabet-letters-words)。根据本发明，《文字母的中文拼字写法(Alphabetic Chinese Spelling Writing)》，以下称为ACSW，是以最短最方便的打字方式，呈现一中文字元的相关部首的高效率作法，并且在与该相关部首一起阅读时，以比较不会引起混淆的文字母代表音调的可区别标记，让中文字元的完全文字母化变得有意义且实用。

实现上述目的的技术方案是：一种用以转换一非字母语言的想要的字元之方法，包括以下的步骤：(a).根据该字元的语音拼字(phonetic spelling)，提出子音元件；(b).根据该字元的语音拼字，提出母音元件；(c).利用一固定表示方式，指示该字元的音调元件；(d).利用一组预先决定的文字母符号，指定该字元的部首元件；以及(e).结合用以表示该字元的元件，以将该字元转换为上下文资讯(contextual information)与语言模式(linguistic pattern)的形式。

在本发明的较佳实施例中，子音、母音、音调、以及部首元件是为文字母形式，而文字母的组合是设计为容易够到(easy-to-reach)的打字方式。

根据本发明的方法，其中音调元件较佳为一文字母，其具有作为一音调标记身份时较不会造成混淆的性质。

根据本发明的一个特殊实施例，其中部首元件是以一主要部首(main radical)或一复合部首(composite radical)代表，复合部首包含一主要部首之后跟着一次要部首(secondaryradical)，而主要或次要部首只要是在单一字母情况下，是以一分隔(separator)与主要部首区隔。

部首元件是以一空格、点、连字号，或其它具有相同功能的符号和其它元件区分，而主要部首可具有最多2个字母(二元字母部首)。

根据本发明的方法，其中主要部首可以是单字母或双字母的形式，在本发明中双字母也称二元字母部首(Binary Letter Radical)，二元字母部首较佳是衍生自对象部首(subjectradical)的第一个中文语音拼字字母与另一相关中文字元的第一个中文语音拼字字母之组合，其中相关中文字元为一归类为对象部首的家族(family)或具有对象部首的部分笔画之字元。

在本发明的另一实施例中，二元字母部首可以是对象部首的中文语音拼字的前二个字母。

而在本发明的另一实施例中，本发明进一步包含一用于多重发音字元的特殊发音之发音指示，较佳为音调标记上的一撇(’)。

其中该方法进一步包含一用于卷舌字之卷舌指示。较佳为一用于卷舌字的编码系统的元件字尾之“r”。

本发明所揭示的方法进一步包含一用于非通用的中文语音拼字(汉语拼音)之特定的文字母码，比如说ü，üe，以及ê。本发明中较佳为uee等同于ü；ue等同于üe，以及e’等同于ê。

根据本发明的方法，进一步包含一指示数字，较佳为包含于子音、母音、以及音调元件之后，用以将字元转换为传统、简化、或变体形式的字元。

本发明的另一实施例也可用于非文字母语言或方言(dialectual languages)，其中一语言指示较佳为位于本发明的元件之前的‘u’字首。

根据本发明的方法，进一步包含了一汉字(中文字元)指示，用于本发明的方法与一文字母语言交替使用的时候，其中汉字(Hanzi)指示较佳为“hz”，用于非部首字。

在本发明的另一个实施例中，一种用以输入一想要字元的每一元件的输入装置，包含：(a).一输入机构，用以输入字元的代表元件；(b).一记忆体机构，用以储存复数个字元；以及(c).一产生机构，该产生机构因应输入机构，从对应至字元的所输入代表元件之记忆体机构，产生该字元。

在本发明的另一个实施例中，一种用以输入一想要字元发音的每一字元的输入装置，其特征在于：

(a).一输入机构，用以输入字元的代表元件；

(b).一记忆体机构，用以储存复数个字元与发音；

(c).一产生机构，该产生机构因应输入机构；

(d).一嗓音产生机构，用来从该记忆体装置产生对应至所输入的字元元件，从记忆体机构提取出的该字元发音。

代表元件为根据本发明中的字元之子音、母音、音调、以及部首，而其中记忆体机构为资料库。

本发明采用上述技术方案，其有益的技术效果在于：1)本发明本发明的一个优点是，本方法对所有每一个中文字元来说，具有一对一的对应关系。2)本发明让较佳为中文字元的非文字母语言完全地文字母化，或罗马化为特定的全字母单字。根据本发明，能以最短最方便的打字方式，呈现一中文字元的相关部首的高效率作法，3)在与该相关部首一起阅读时，以比较不会引起混淆的文字母代表音调的可区别标记，让中文字元的完全文字母化变得有意义且实用。

【附图说明】

下面通过实施例并结合附图，对本发明作进一步的详细说明：

图1是本发明转换非字母语言字元的方法及装置的显示表1-1至表1-4，为习知所表示之典型的ACSW。

图2是本发明转换非字母语言字元的方法及装置的显示表2-1至表2-2，为单/双字母部首之标准部首列表。

图3是本发明转换非字母语言字元的方法及装置的显示表3-1至表3-9，为部首表格之学术版本。

图4是本发明转换非字母语言字元的方法及装置的显示表4-1至表4-2，为ACSW之字母部首的起源依据记录样本。

图5是本发明转换非字母语言字元的方法及装置的显示单/二元字母部首二维图。

【具体实施方式】

本发明是与用以转换一非文字母语言的一想要的字元之方法有关，包含以下步骤：(a).根据该字元的语音拼字(phonetic spelling)，提出子音元件；(b).根据该字元的语音拼字，提出母音元件；(c).利用一固定表示方式，指示该字元的音调元件；(d).利用一组预先决定的文字母符号，指定该字元的部首元件；以及最后结合用以表示该字元的元件，以将该字元转换为上下文资讯与语言模式的形式。

语音拼字(汉语拼音或拼音)是以语音方式来代表中文中的字元，每一个字元的拼音由1或2个元件组成，一个是起首字母(initial)或子音，另一个是结尾字或母音，举例来说，拼音“yong”可以切分为起首音或子音元件“y”，以及结尾音或母音元件“ong”。有些字元，像是“an”，就没有起首音。

基本上，在本发明中，用于文字母的中文拼字写法(Alphabetic Chinese Spelling Writing)，ACSW)的通用格式是格式化与定义为《根据语音拼字的子音元件+根据语音拼字的母音元件+4声中的一声或轻声+单一字母或二元字母的部首》，非通用格式是定义为《根据语音拼字子音元件+根据语音拼字的母音元件+四声中的一声或轻声+单一字母或二元字母的主要部首+o(仅用来分隔单一字母部首(Single Letter Radical，SLR)，如果有的话)+单一字母或二元字母的次要部首》。

本发明的另一个实施例与一种以输入一想要字元的每一元件的键入装置有关，其包含：(a).一输入机构，用以输入字元的代表元件，也就是字元的子音、母音、音调，以及部首；(b).一记忆体机构，较佳为资料库，用以储存复数个字元；以及(c).一产生机构，该产生机构因应输入机构，从对应至字元的所输入代表元件之记忆体机构，产生该字元。

本发明的再一个实施例中，一种用以输入一想要字元发音的每一字元的输入装置，包含：(a).一输入机构，用以输入字元的代表元件；(b).一记忆体机构，用以储存复数个字元与发音；(c).一产生机构，该产生机构因应输入机构；(d).一嗓音产生机构，用来从该记忆体装置产生对应至所输入的字元元件，从记忆体机构提取出的该字元发音。

根据本发明的ACSW方法，使到能够做到从预先录制的单字嗓音资料库中，人工把嗓音资料库中的单字合成中文字组、词、段落，或文章的准确发音，包括那非常难做到的临场变调，多重发音字元的选择性发音，及中文字方言发音。当相关的音调元件被采用输入，本发明的方法也可以延伸采用在其它语言环境中。

以下介绍单字母单字元部首与二元字母二元字元部首；以及罕见的二元字母单字元部首与单字母二元字元部首。

根据现代汉语词典所列的部首(字元的标头/编组)，一个利用单一字母(单字母单字元部首，Single Letter Single Character Radical)或二元字母(二元字母二元字元部首，BinaryLetter Binary Character Radical)来代表部首的系统，是根据单一字元部首的中文语音拼字(Chinese Phonetic Spelling of Single Character Radicals)的第一个字母(在罕见的情况下，是由第一与第二字母组成二元字母单字元部首)，与二元字元部首中每一字元的中文语音拼字的第一个字母(在罕见的情况下，是由第一字母组成单字母二元字元部首)，所开发出来的，并以一个二维图表表示(见图5)，在本发明中，二元字元部首应定义为双字元部首(doublecharacter radical)，二元字元部首的优点应可克服单一字母不足，以致无法代表现代汉语词典中所有189个中文部首的缺点。图5的列表内容也可以以图2的方式呈现，以致使阅读与记忆更容易。图5的内容列表较佳为以一种有依据的系统化方式衍生，请同时参阅图4之ACSW之字母部首的系统化衍生起源依据的典型样本。

根据本发明，当代表特别部首的每一个单字字母部首或二元字母部首，均与它们个别的字元的语音拼字(或汉语拼音)结合的情况下，所有的中文字元都可成功地以罗马字母加以文字母化。每一个中文字元都会配有一个独特的单字母部首，像是“s”(代表「水」，发音1为“shui3”)或者是二元字母部首，像是“fd”来代表父爹(利用发音“fu4 die1”的开头文字“fd”来代表部首「父」(父的发音为“fu4”，而爹“die1”是父亲昵称，通常部首中有「父」的字元，大多数的意义与父亲有关系，不过有时候只是笔画中有「父」而已))，以此方式实施，让中文字元可达到完全文字母化的目标。一部分现代汉语词典里标准汉字的典型「文字母的中文拼字写法」(ACSW)有在图1《典型的ACSW与其各种用途》里呈现。

以下介绍文字母的中文拼字写法(ACSW)的高效率设计与其设计概念/理论。

ACSW的设计可达成高效率的打字、手写、阅读与记忆，它的理论是由打字演变而来，但最终的成果也提供高效率的手写、阅读与记忆。以下的章节将提出与解释其高效率设计的原理。

(i)较常用的部首(在此定义为在现代汉语词典中较多字使用的部首)被刻意地用单字母单字元部首来代表，比如说使用单一字母“s”来代表氵(发音为“shui3”)，也就是说以单一字母来代表该部首，藉此让ACSW变得更短且更容易撰写、阅读与记忆，藉此提高工作效率。

(ii)此外还有进一步的高效率设计，像是较多字元使用的部首同样也特别指定使用a、s、d、f、g、h、j、k，或l的任何一个，这些是一般手放在键盘上时，手指自然放置或最靠近手指的几个键，藉此让打字工作更快更有效率。

(iii)其他还有更高效率的设计，像是较多字元使用的部首，会被指定在s、d、f、j、k、或者l等几个键的任何一个，然后跟着只会到g、h，以及a，此一理论是s、d、f、j、k，与l等几个键是手放在键盘上自然接触到的，因此最容易、也最快可以输入，而要打‘g’或‘h’需要移动特别的手指，而按‘a’的手指通常很弱。

(iv)接着，比较少字元使用的中文部首，理论上是被分配使用e、r、u、i等位置，而后跟着t、y，然后是w、q、o、p等位置。

(v)而后，更少字元会用到的部首在理论上是使用c、v、b、n、m等位置，然后是最难打的z、x位置。

以上描述了ACSW的几种高效率设计理论中的一种，然而，视情况而定，上述理论可予折衷。

以下介绍二元字母二元字元部首与它们的高效率二元字母组合。

在二元字母二元字元(Binary Letter Binary Character Radical)的文法中，每一个二元字元部首中文语音拼字(汉语拼音)的开头字母，会被拿来结合成二元字母部首，“s、d、f、j、k或者l”的任何一个，会优先拿来与较多字元使用的部首结合，之后跟着是“g、h、a”。在“s、d、f、j、k以及l”之中，另一种筛选的方式是将“d、f、j、k”的任何一个，指定给较多字元使用的部首，然后结合成可以交替使用左、右手或右、左手的方式(像是部首「虫」(chong2)所用的ck组合，是使用「蛞」(kuo1)与原始部首字元「虫」(chong2)结合的结果)。这是刻意达成的独特设计，可提供高效率的打字方式，因此可以在打字时，交替使用左脑与右脑，以及交替让左脑与右脑休息。根据其他研究者与科学家所公布的调查结果，用左手打字会让右脑积极作用，而用右手打字会让左脑积极动作，藉此能够完全或较好地开发左右脑。

同时，具有2个相同字母的二元字母部首(例如ss)在打字速度、写字速度，以及记忆速度方面，会比先前叙述之交替使用手的组合要快，因此具有2个相同字母的二元字元部首，会比较优先的指派给较多字元使用的部首。

在二元字母二元字元部首中，可假设二元字元部首代表更多的中文部首字元(像是zr众zhong4人ren2(逆序而写的部首(倒写部首))可假定为众人入)，但是在ACSW的文法对该部首的正式名称中，仅鼓励使用一个原始部首字元(在此特殊例子中为「人」)与另一字元(在此特殊例子中为「众」)，用来推导其二元字母。但是在学校教学时，应该有另一非正式的多字元表(学术版本)(图3)与正式的二元字元相对照(图2)，让特定二元字母部首的相关意义更容易地被了解，以足进ACSW的学习。

以下介绍「单字母部首与二元字母部首的r、k、v、t、及o行与列的特性：二维部首表(图5)」催生标示中文发音的4声与轻声的新方法。

图5所示为在二维(y，x)坐标表中，有关二元字母部首的排列，这是因为一般来说，二元字母部首的第一个字母代表正式的部首字元，而第二个字母代表该特定部首的相关基本字元，不过也有少数例外情形。此一二维表的排列方式是让所有具有相同起首字母的二元字母部首都出现在同一行(row)，以便识别与记忆，这是因为现在中文都是横写的关系。表5-1至5-3中所示r、k、v、t几行被设计成空置，即没有配置任何二元字母部首(也就是没有ra...至rz、ka...至kz、ta...至tz、va...至vz的二元字母部首)，因此就可以将r、k、v、t字母拿来表示中文发音中的四个基本音调，而不会造成与单一/或二元字母部首之间有太大的混淆。利用r、k、v、t来代表四声(yin1阴、yang2阳、shang3上、qu4去)，让提议的ACSW的外观看起来比目前有时会用的1、2、3、4较为自然。

根据本发明的方法，进一步包含一复合部首(composite radical)，藉由引进一次要部首所组成，但却让最常用的中文字元，采用只有一个部首(非复合部首)的最简短文字母拼字。

以下介绍“O“复合部首分隔(OCRS)。

在有需要使用复合部首来区分具有相同中文语音拼字(汉语拼音)与部首的中文字元时，“o”复合部首分隔(OCRS)可用于区隔主要部首与次要部首，其中主要部首或次要部首其中之一，或两者皆是，为单字母部首。使用“o”作为「复合部首分隔(OCRS)」的原因，是在二维单字母部首与二元字母部首表中，没有任何部首用到“o”的行或列，此一特性使得字母“o”适合用作「复合部首分隔(OCRS)」，而不会造成混淆。尽管在ACSW中，“o”是轻声(light tone)的音调标记，不过在中文中轻声并不常用，因此不会造成太大问题。

除了上述的考量外，“o”仍被视为适合的「复合部首分隔(OCRS)」，因为它的几何形状用于分隔用途，也比较显眼。

具体说明ACSW的拼字的阅读方法，以达到最佳的学习与理解效果。

以下将说明如何阅读ACSW的拼字的阅读方法，以达到最佳的学习与理解效果之方法：

i)阅读拼音时是采用一般ABC字母的发音，除部首部分以外。

ii)用于单字母部首、二元字母部首，或复合部首的部首部分之拼字，依建议是采用部首的实际读音，以及形成单字母部首或二元字母部首的相关基本字元(如果有的话)的实际读音，而不是阅读其字母部分。举例来说，抛(pao 1)以ACSW的拼字是“paor sl”，其中“sl”是“扌shou3拉la1”的二元字母部首的缩写，因此拼字字母应读成“P、A、O、R、Shou3 La1”而不是“P、A、O、R、S、L”。这是因为念成成“P、A、O、R、Shou3 La1”时，一定会连到与部首“扌shou3拉la1”的笔画相关的“抛paor sl”，并且比只念“paor sl”更有意义。

复合部首字的替代方式：「在部首加上一撇「’」的额外音节片语字」。

具有相同部首相同发音(Same-Radical-Idendical-Pronunciation)的任何ACSW字，需要一次要部首，以便和较常用的相同部首相同发音的ACSW字区隔开来，理论上也可藉由在它的二字元字尾片语(two-characters-suffix-phrase，词)的其中之一加上额外的字尾音节以及音调标记(省掉部首部分以缩短写法)，然后在对象部首(subject radical)之后加上一撇「’」，达成替代的方式。举例来说，字元「拌」以复合部首来写的话变成“bantslbf”，并指定为标准ACSW字，而采用另一种写法：「在部首加上一撇「’」的额外音节片语字(Additional SyllablePhrasal Word With Apostrophe’At Radical)」，则可写成“bantsl′zuiv”，是由中文的二字元片语「拌嘴」演变而来，如此一来，中文片语「拌嘴」变成了“bantsl′zuiv zuivk”。

有些相同部首相同发音的ACSW字，需要一次要部首，以便和较常用的相同部首相同发音的ACSW字区隔开来，但是在现代汉语词典中找不到任何二字元中文字尾片语(词)，不过具有二字元字首片语(two-characters-prefix-phrase)，在此情况下，可利用「在部首加上一撇「’」的额外音节片语字(Additional Syllable Phrasal Word With Apostrophe’At Radical)」，其中字首音节与二字元片语的音调标记会被加在对象的相同部首相同发音的ACSW之前，而不增加次要部首。举例来说，友(you3)谊(yi4)的谊(yi4)，在采用复合部首时，是写成“yit yog”，并为标准ACSW字，而采用替代的「在部首加上一撇「’」的额外音节片语字」，则变成二字元片语的，从友(you3)谊(yi4)这个二字元字首片语演变来的“youvyit y′”；而「友谊」的ACSW写法则变成“youvym youvyity′”。

以「在部首加上一撇「’」的额外音节片语字」替代复合部首ACSW字的方式，对不会写中文的外国人或学生来说，是个不错的替代方案，也比较会欣然使用。这是因为这一类型的相同部首相同发音片语字采用二字元片语来区别它与其他相同部首相同发音ACSW字，因为可协助学生了解与记住其意义。不过采用「在部首加上一撇「’」的额外音节片语字」替代复合部首ACSW字为标准化固定的，不应利用其他任何的二字元片语加以变化。

标准高效率文字母的中文拼字写法表第一版与第二版，并没有纳入「在部首加上一撇「’」的额外音节片语字」替代复合部首ACSW字的标准变化方式。

以下介绍“o”在二维文字母的中文拼字写法部首表中的独特特性，让它成为代表中文的轻声的自然选择。

在二维文字母的中文拼字写法部首表(Two-Dimensional-Alphabetical Chinese SpellingWriting Radicals Table)中，“o”的行与“o”列都是空的，因此“o”清楚地将主要部首的简短形式字母与次要部首的简短形式字母分隔开来。(要注意的是：“qh”(由欠qian4欢huan1)衍生而来)终于改变为“hq”(欢huan1欠qian4)，因为欠欢在中文中的意思是不快乐，因此不建议使用)。

“o”的独特特性，使得它成为至今无法找到一个字母来表示的一个中文「音调」，也就是「轻声」的自然选择，由于在ACSW的格式中，音调标记的位置是放在部首之前，而所有的部首都设计为不使用“o”，因此使用“o”作为音调标记，不会让音调标记与部首间产生「那个是部首」的混淆。同时，使用r、k、v、t作为音调标记，也不会产生那个是音调标记，那个是部首的混淆，这是因为所有的二元字母部首都不会从r、k、v、t起头，而所有的原始中文语音拼字(汉语拼音)也不会以r、k、v、t结束，只有“er”是特例。因此，在使用「原始的中文语音拼字(无音调标记的汉语拼音)加上(“rr”或“rk”、“rt”、“kr”、“kk”、“kt”、“vr”、“vk”、“vt”、“tr”、“tk”、“tt”或“rkt”)」的情况下，我们可知最后一个字母应该是部首，而在此之前的一定是标记。在“er”的特别例子中，er4用来表示佴，无音调标记的中文语音拼字(无音调标记的汉语拼音)是以一个破折号“—”作为分隔，像是er-tr。

以下介绍统计上的考量。

本发明所开发之ACSW，十分强调统计考量(statistical consideration)，除了前述章节所提到的考量外，ACSW同时考虑到中华人民共和国拿来用于资讯交换的国际标准码「中华人民共和国国家标准信息交换用编码字符集GB2312-80(中文简称国标码，英文简称为GBCode)」中，对「常用字元(Commonly Used Characters)」与「怪异字元/罕用字元(RarelyUsed Characters)」的正式分类，此一方法是在超过一个以上的字元具有相同部首与相同的中文语音拼字及音调标记时，优先将单一部首指定至「常用字元」，而「罕用字元」与甚至在GB Code中找不到的字元，必须假定为具有一主要部首与一次要部首的复合部首。当同一部首有超过一个「常用字元」，同时也具有相同的中文语音拼字与音调标记，那么发明人就必须进行判断，看那一个「常用字元」是真的比较常用，并且为它指定为单一部首，而其他的使用复合部首。

根据对中华人民共和国国标码(GB Code GB2312-80)的了解，其包含总共6373个字元(根据Junda Web Central的说法则是6378个字元)，是中国第一套用于资讯交换的国家标准编码，而国家扩展码(GBK Code，用于资讯交换的国家标准扩展编码)则是纳入传统中文字元的Big-5码，加上其他较为近期的编码在Unicode 3.0或之后版本中所找到的所有字元，理论上GB Code GB2312-80所包含的字元最常用，接着是没有在GB Code，但是在GBKCode中的字元，然后是在比较近期的编码中有，但是先前的编码中没有的字元。依此顺序，就可针对具有相同中文语音拼字以及音调标记的字元，知道给予单一部首的优先顺序。

没有被选到单一部首的字元就必须采用ACSW的复合双部首，其中主要部首之后跟着次要部首，同时也形成该特定字元的一部分。发明人藉此所列出的ACSW表(图1)，已经将统计与高效率的问题纳入考量。

将「现代汉语词典」中的多部首字元转换为单一部首。

将现代汉语词典中的多部首字元(在部首检字表的多个部首下找到同一个字元)转换为ACSW标准的单一部首的方法，是藉由「决定于字义关系的方法(Method of Relationshipin Meanings Decide)」来达成。当字元的意义与现代汉语词典中指定的部首，并不存在的时候，就可考虑采用那字元的繁体字字元的部首。在其他情况下，像是在现代汉语词典中，许多部首都与特定字元的字义有关系，则可使用「惯用部首优先的方法(Method of HabitualRadical Comes First)」，将多部首字元转换为ACSW所用的单一标准化部首。如果一个ACSW字所配置到的部首与ACSW字本身之间的意义没有关系的情况下，就采用「口诀说明及记忆法(Method of Explaining the Adoption of a particular Radical with Related Sentence)」，使用口诀记忆法(特定制定的片语，用以与该特定字元产生关系，便于记忆ACSW中所指定的单一部首)的方法或流程，解决了在为一特定的ACSW字指定一个部首，而不能明确解释为什么要将一特定单一部首指定给ACSW字的情况，像是在简化的中文字元中，字元的意义与字元的象形图案并无关联，这是因为要简化字元笔画数的关系。

以下介绍用于多重字义多重发音的字元(MPC)的拼字方法，以形成多重音节的ACSW单字。

实际上，在文字母的中文拼字写法(Alphabetic Chinese Spelling，ACSW)中，还有更多重要文法，须要花几个章节来解释。

本章节解释如何指定多重字义多重发音的字元(Multiple Meaning Multiple PronunciationCharacter)的拼字，以下将以范例说明，更能充分了解。

多重字义多重发音的字元的例子像是：

(i)没 mei2；

有2种发音，一是mei2，意思是没有(没有的没)；另一个是mo4，意思是淹没(淹没的没)。

最初步的ACSW写法设计是 mei2mo4s，

在加入r、k、v、t及o在作为音调标记后，变成 meikmot s。

在此k标示第二声(阳平声)，t标示第4声(去声)，而s代表氵(shui3)部首，意思是水。

这种多重发音字元多音节的ACSW字有助于减少具有相同部首相同拼字的单音节中文字元的数目，如此一来就不用造出复合部首的ACSW字，因此可以简化将中文字元转换为文字母拼字方式的工作。它同样可协助学习中文的学生一次就学会同一中文字在不同片语中的不同发音，有时候它可让学生更能够了解多重发音字元所使用的特殊部首的原因，也就能同样的了解多重发音拼字。(要注意的是，所有多重发音字元在经过ACSW转换后即成多重发音拼字)。举例来说，如果不知道没有(mei2you3)的没(mei2)和淹没(yan1mo4)是一样的，就无法了解为什么它会用到氵shui3(意思是水)这个部首。

多重发音字元的共同拼字(Co-spelling)与此特性规格让学生更能了解，在大多数状况下，中国人的祖先是如何选择一特定字元/单字的部首，不过使用中文的社群与相关的语言标准化管理机构应努力限制同一字元所具有的不同发音的数目，以更有效地达成开发高效率的ACSW的目标。减少相同字元的不同发音数目的方法有二，一是透过与中国的语音标准化管理机构的合作，另一个是使用变体字元(Variant character)，用以取代原本的多重发音字元的其中一种发音与意义，藉以减少同一字元的一种发音。本发明之发明人在提出文字母的中文拼字写法(Alphabetic Chinese Spelling Writing，ACSW)的初版时，是采用第二种方法，其中并没有中国官方的参与。

(ii)缝feng4(意思是缝纫或裂缝)；

这个字元有2种意义，一是缝(feng2)衣服的缝；另一是裂缝(feng4)的缝。

ACSW的最早设计为 feng2feng4 ss

在加入k作阳平声及t作去声后，变成 fengkfengt ss

而最后简化为 fengkt ss

缝(feng)是原始的中文语音拼字；k代表阳平声，t代表去声，而ss代表部首纟(si 1，意思是丝)。

这种中文拼字简化了ACSW，因为它只把多重音调字元的所有不同的音调标记一起放在原始语音拼字之后，并在部首的字母简写形式之前。

上述用于多重发音字元的ACSW写法解决了ACSW拼字困难的问题。不过，它的缺点是要让读者根据句子的上下文语义去判断正确的发音。因此，发明人设计了一套方法，利用撇号(’)发音指示(Apostrophe’Pronunciation Indicator，API)来表示正确的发音，以下的段落将详述本方法。

以下介绍“利用撇号(’)发音指示来标示多重发音字元多音节ACSW字的适当发音的方法，以及ACSW单字变化的概念。

在一特殊片语或句子里，如果要特别标出多重发音字元利用多重音节ACSW字表示时的发音，ACSW文法标明在r、k、v、t，或o的音调标记之后立即加上撇号(’)发音指示，这套方法特别在电脑或机器人合成发音时是必须的，所以让软体可以精确地识别发音。采用撇号(’)而非其他符号作为发音指示，是本发明的ACSW方法的另一设计，如此一来也可与现行的英文写法共用，藉此与美式英文或英式英文的电脑软体合并或使用，而不必修改或重写软体，或只需要最低限度的修改。

举例来说：

缝fengkt ss，如果缝纫的意思，则写成fengk’tss；

如果是裂缝的意思，会变成fengkt’ss。

换句话说，字元/单字缝(fengkt ss)可具有另外2种变化/变体，第一种是fengk’t ss，第二种是fengkt′ss。

“Fengkt ss”被确认为标准的ACSW母字(standard parent ACSW word)，这保存了十分重要的，现代汉语词典中原来的中文字元与从其衍生而来的ACSW之间的主从关系，而这种清楚的主从关系，是未来继续发展ACSW所须要的。

以下介绍利用现场最终音调修饰(’)标示现场音调变化所想要的发音之方法。

有时候跟着一个字元后面的第二个字元，或者开头的字元，必须使用轻声或另一音调，所修正的音调不一定，并没有放在该字元或之前的字元中的ACSW中，可能是因为它并非那么常用，或有其他理由，以下的范例指出这类情况：

娃(wa2)成对出现时变成娃娃(wa2wa0)。根据ACSW的写法，发音的变化是从“娃娃(wakn wak n)”变成“娃娃wak n wak no”’；第2个发音/音节加上一个现场最终音调修饰(In-SituTone-At-End Modifier(o’))，来表示轻声，要注意的是，最后所有的ACSW字都会像是“娃娃(wakn wakno’)”一样，把发音部分和部首部分都放在一起的单一个体。

保险(保险，bao3 xian3)变成保险(保险，bao2 xian3)，在ACSW中，写法是从“保险(baovr xianv ef)”变成“保险(baov rk′xianv ef)”；第一个发音/音节被加上了现场最终音调修饰(k’)，并代表第二声的阳平。

在上述的2种情况中，片语的音调经过弹性的修改，这是中文传统上对一些特定情况(即非全部)，对于双字元片语具有2个相同音调时，会做出的修正。这也是标准ACSW的另一个变化形式，它的出现有在助于开发精确的人工合成语音报告，还有不会破坏原有标准ACSW与原始中文字元之间的一对一主从关系。

以下介绍用于某些独特的复合字元的会意字之不发声字部首。

ACSW和一般语言一样，它的文法允许例外的情况，一种主要的例外是它采用非标准的不发声字部首(Silent Word-Radical)，而非从现代汉语词典所衍生而来的189个「标准简短形式单一字母与二元字母部首(standard short-forms Single Letter and Binary LetterRadicals)」。大多数可适用非标准的不发声字部首(Silent Word-Radical)的字元都是属于一些笔画简单的部首，像是一，丨，丿，丶，乙(( 亅乚)，十，八，亠，二以及等等，这些特殊字元的部首无法反映出它们的意义，在此使用不发声字部首可立即反映出该字元的意义，不过不发声字部首的存在并不明显，它是在单一或二元字母部首之后加上「不发声o标示(Silent-o Pronunciation Specifier)」，或者用于该特定的字部首(Word-Radical)。一个不发声字部首的范例是字元艳(“yantsetdfo”)，它是由中文字元丰(feng1)代表丰富，而色(se4)代表颜色，因此，代表色彩漂亮。采用不发声字部首“色setdfo”比单独使用色(setdf)的部首(df，意思是刀，或者是人的象形图案表示)，更可以凸显字元艳(“yantsetdfo”)的意义；同时，藉由在此特殊的字部首后采用「不发声o标示(Silent-o PronunciationSpecifier)」，可标明部首字”色(setdf)”不发音。读者可能注意到字元「色」的标准的ACSW表示方法是“setshaiv df’而非“set df”，因为它是一个多重发音字元，ACSW的文法允许在使用不发声字部首时，仅标示相关的发音，以便凸显字元的意义，并降低拼字的复杂度。与其他语言一样，这些例外就留给教育家去教导与解释。

“r”卷舌音的发音指示介绍。

在ACSW中，个别字元并不以‘r’结尾来代表该字元发‘r’的卷舌音，反之，ACSW文法标明在该特殊字后跟着一个‘r’卷舌发音指示字(rolling tongue pronunciation indicator word)，让特殊的ACSW字元可以有‘r’卷舌音结尾的正确发音，同时保有ACSW字元的标准形式。ACSW进一步标明在所有包含以鼻音ng结尾的中文语音拼字(汉语拼音)中，要标示卷舌音时应写为‘ngr’，而包含以‘er’结尾的字元应写成‘er’。

举例来说：

头tou2儿r 可写成toukdw r；

灯deng1儿r 可写成dengrh ngr；

字zi4儿r 可写成zitg er。

使用r、ngr、或er的所有文法规则仍然遵照现代汉语词典的规定，不过，作者建议不论之前的字为何，可简化为标准的“r”。

但是在正式的写法中，还是应该用“r”、“ngr”、或“er”，以达成高标准的人工合成语音报告。

以字母r、k、v、t、o以外的字母来选择作为1声(阴声)、2声(阳声)、3声(上声)、4声(去声)与轻声的音调标记，只是选择的问题。

音调元件也可用其他符号标示传达，像是日文拼字字母中笔画比较简短的1或2画的字母クスセフユヤラ∧等来表示，但它们并不属于目前中文字元的一部分(以避免与中文字元混淆)，也与英文字母不相似。发明者现在也开始编写另一组音调标记，利用其他符号，像是丄⊙∽♀△或类似的符号，在所有情况下，都应避免使用希腊字母，因为避免与数学符号产生混淆。

以下介绍采用uee来表示ü，ue来表示üe，还有e’来表示ê。

为了让ACSW或本发明中的国际平行中文写法(International Parallel Chinese Writing)能够尽可能地与英文写法相近，让使用英文的社群能够很容易输入与学习本发明的ACSW所提议的中文写法，发明人建议用uee来表示汉语拼音中的ü，ue来表示üe，还有e′来表示ê。

汉语拼音有用到“ü”的地方是“l ü”与“n ü”，本发明已经用“luee与nuee”加以取代，在DJ音标(Jones International Phonetic Symbols)，分别与“lvi：”及“nvi：”的发音近似。

汉语拼音有用到“üe”的地方是“lüe”与“nüe”，本发明已经用“lue”与“nue”加以取代，同时没有改变原始的发音。

汉语拼音有用到“ê”的地方是“欸ê”，可参考现代汉语词典第330与331页，本发明已经用e′加以取代，在打字的时候，就不会受到有需要输入特别的中文语音符号的干扰。

以下介绍地名与人名的拼字方法。

不同种族与社群所用的语言会有重大的差异，拼字方法也是，考虑到中文写法是采用象形文字，与全球其他大多数种族或国家所用的方法不一样，而目前ACSW仅处于导入期，所以可以想象得到，在还没学会ACSW之前，其他种族不能了解ACSW的音调标记的读法及不读出声的部首字母。

因此，发明人建议与明定，目前地名和人名的拼字方式保持不变，也就是不要写出音调标记与部首的部分，让原有的汉语拼音保持没有音调标记。举例来说，中国首都北京应拼成Beijing，而故中国领导人邓小平应拼为Deng Xiaoping，这并非创新，而是与现行系统并用的建议。

以下介绍在「无标示部首字的字尾加上‘hz’汉字指示」。

为了在使用ACSW时达到更简易的沟通，作者介绍在后续的情况下，采用「无标示部首字的字尾加上‘hz’(End With‘hz’Non-Radical-Specific Word)」的做法：

当有人只记得一个ACSW字的音节，却无法想起它的部首时，他可以用‘hz’取代部首部分，用以表示他是标示一个中文字，‘hz’为汉字(Hanzi)，也就是汉人的字元的意思，中文字元基本上就是汉字。“hz”在二维单字母部首与二元字母部首表(图5)中，没有被现代汉语词典的189个部首所用，因此适合此一用途。

介绍「方言音节和u加于标准ACSW字的字首之方法」。

某些方言不仅有趣且包罗万象，其中有丰富的智慧累积，在本发明的另一实施例中进一步包含在ACSW字之前加一发音指示，表示在方言中的读法。

这种「方言音节加上u作为字首」的方法是标明要放在标准ACSW字之前，选择“u”字首的原因是，在方言音节(Dialectual Syllable)中不建议以“u”作为任何音调的标记，因此也不会被误认为是音节的音调标记，同时标准ACSW字也不会从“u”开始，因此“u”非常适合作为预期的方言拼字之音调标记与标准ACSW字之间的分隔。

举例来说，在广东话发音中，有1、2、3、4、5、以及6声，可以很方便地用r、k、i、v、t、以及o代表，因为在图5中它们有特别的空行与/或空列特性，我们以「中」作为例子，「中」的标准ACSW写法是zhongrgz，而广东话「中」的拼字为dzung1，我们建议变成广东话的ACSW写法是dzungruzhongrgz，这个技术是ACSW的另一种变化，其中可保有原始的标准ACSW字与现代汉语词典之间的一对一主从关系，同时也可根据ACSW的文法，进行自由的变化，要注意的是，选择“u”作为字首的原因是，在现代汉语词典中，没有一个标准ACSW字依据的汉语拼音是以“u”字母开头。

「方言音节加上u作为字首」适合在一篇普通话(putonghua)或正式中文论文的章节中出现，但是不适合全篇使用，因为这样可能非常费事。在引进ACSW后使用「方言音节加上u作为字首」的方式并不相当看好，这是因为其中所涉及的工夫之故。转换成与汉字或普通话ACSW无关的拼字写法，也不可行，因为这样会在不同的方言群聚间造成文化的隔阂。方言写法的终极解决方案也许仍是使用原始的中文字元，而不采用拼字写法，这么一来可以和大多数的中文人口维持通用的写法。

本发明所揭示的方法永远可用于任何方言或中文字为基础的方言上，如果这类语言需要拼字写法，可以在“u”和标准ACSW字之前加入拼字与音调标记，以形成变化后的地方性共用(colocal)ACSW字，同时维持与ACSW的主流写法的关系。

与中文字元有历史渊源的语言，如一些东亚语言和同地区的中文方言，如果采用「方言音节加上u作为标准ACSW母字的字首」的方法，将可加快已经了解ACSW的人，学习这些语言的过程，这是因为这种方法享有与中文几乎一对一的关系，而其他语言则否。

以下介绍以[内嵌符号的ACSW写法]作为繁体中文字的ACSW写法。

根据本发明的方法，进一步包含一个显示符号，像是较佳为在字音(辅音)，母音(元音)、以及音调元件之后嵌入数字，用于转换繁体字、简体字，或其它变化形式上。

举例来说，在部首麦(麥)的拼字写法中，加上一个数字，比如说是2，使得部首麦(maitmc)标准中文拼字写法变成了[mait2mc]，它所代表的意义是「ACSW第2种形式(AlphabeticChinese Spelling 2nd Form)」，因此而发展为[用于繁体中文字之内嵌2的ACSW写法(2-encapsulated Alphabetic Chinese Spelling Writing for Traditional Chinese Characters)]。这内嵌2的ACSW写法特别适合在电字计算机环境中用来输入繁体字元，理由如下：

a。在标准中文拼字写法中嵌入2，像是[mait mc]嵌入2以后，变成[mait2mc]，而不是放在外面，变成[mait mc2]或[2mait mc]，可以避免混淆中文拼字写法与数值2，因为[maitmc2]可能会被误认为是maitmc 2号；而[2maitmc]可能会被误认为是2个maitmc；反之，mait2mc不会被误认为是mait x 2mc(mait乘2mc)，因为在中文拼字写法中，音调标记后永远有个部首，而在此音调标记为t(中文字的第4(去)声)，而部首为“mc”，因此[mait2mc]不会被误认为是2个不同的实体，mait与2mc。

b。在电子计算机环境里，我们可以将2内嵌至标准ACSW中，把整套简体字集转换为繁体字集，不过，读者应可了解，简体字集与繁体字集之间具有许多共通处，因为只有有限数目的中文字元被简化。

c。它可以在电脑环境中达到自由混合中文字元的写作环境，其中简体与繁体中文可轻易与自由地在同一篇文件中共存，只要在标准ACSW中加注有没有嵌入2即可。这个功能特别在选写中文学术论文时相当有用，让各种中文字都可以在学术文章出现与受到讨论。

d。[内嵌2的ACSW写法]也可发展为内嵌3(3-encapsulated)和内嵌4(4-encapsulated)，以及内嵌其它数字或符号的形式，变成各种不同版本的中文字元所用的ACSW写法，尤其适用于电脑。

要注意的是，上述的实施方式说明仅用来示范本发明，熟悉此技艺者在不悖离本发明的范畴下，可进行各种变化与修正，因此，本发明应包含申请专利范围所涵盖的各种替代、修正与变化中。

Claims

1、一种转换非文字母语言字元的方法，以使用在文书处理器，其特征在于：所述方法包括步骤：(1)根据该字元的语音拼字，提出子音元件；(2)根据该字元的语音拼字，提出母音元件；(3)利用一固定表示方式，指示该字元的音调元件；(4)利用一组预先决定的字母符号指定该字元的字根元件；以及(5)结合用以表示该字元的元件，以将该字元转换为上下文资讯与语言模式的形式。

2、根据权利要求1所述转换非字母语言字元的方法，其特征在于：其中该想要的字元较佳为一中文字元。

3、根据权利要求1所述转换非字母语言字元的方法，其特征在于：其中该音调元件较佳为一文字母，其具有作为一音调标记身份时较不会造成混淆的性质。

4、根据权利要求1所述转换非字母语言字元的方法及装置，其特征在于：其中该字根元件是以一空格、点、连字号，或其它具有相同功能的符号和其它元件区分。

6.根据权利要求1所述转换非字母语言之字元的方法，其特征在于：其中该字根元件是以一主要字根部分或一复合字根部分代表。

7.根据权利要求5所述转换非字母语言之字元的方法，其特征在于：其中该复合字根部分包含一主要字根与一次要字根。

8.根据权利要求6所述转换非字母语言之字元的方法，其特征在于：其中该主要字根之后跟着该次要字根。

9.根据权利要求6或7所述转换非字母语言之字元的方法，其特征在于：其中该次要字根或主要字根只要是在单一字母情况下，是以一不易混淆的分隔与另一字根区隔。

10.根据权利要求8所述转换非字母语言之字元的方法，其特征在于：其中该不易混淆的分隔较佳为一个“o”。

11.根据权利要求第5至8所述转换非字母语言之字元的方法，其特征在于：其中该主要字根可以是一二元字母字根。

12.根据权利要求10所述转换非字母语言之字元的方法，其特征在于：其中该二元字母字根是衍生自该对象字根的至少一个中文语音拼字字母与另一相关中文字元的至少一个中文语音拼字字母之组合。

13.根据权利要求11所述转换非字母语言之字元的方法，其特征在于：其中该二元字母字根之该对象字根的文字母，在另一相关中文字元的文字母之前。

14.根据权利要求12所述转换非字母语言之字元的方法，其特征在于：其中该相关中文字元为一归类为该对象字根的家族或具有该对象字根的笔画之字元。

15.根据权利要求1所述转换非字母语言之字元的方法，其特征在于：其中该二元字母字根可以是该对象字根的中文语音拼字的第一个或前二个字母。

16.根据权利要求1所述转换非字母语言之字元的方法，其特征在于：其中该方法进一步包含一用于多重发音字元的特殊发音之发音指示。

17.根据权利要求15所述转换非字母语言之字元的方法，其特征在于：其中该发音指示较佳为音标标记上的一撇(’)。

18.根据权利要求1所述转换非字母语言之字元的方法，其特征在于：其中该方法进一步包含一用于卷舌字之卷舌指示。

19.根据权利要求17所述转换非字母语言之字元的方法，其特征在于：其中该卷舌指示较佳为元件字尾后之“r”。

20.根据权利要求1所述转换非字母语言之字元的方法，其特征在于：其中该方法进一步包含一用于非通用的中文语音拼字(汉语拼音)之特定的文字母码。

21.根据权利要求19所述转换非字母语言之字元的方法，其特征在于：其中该特定的文字母码较佳为等同于ü的uee；等同于üe的ue，以及等同于ê的e’。

22.根据权利要求1所述转换非字母语言之字元的方法，其特征在于：其中该方法进一步包含一预先决定的符号，用于将文字转换为传统、简化、或变体形式的字元。

23.根据权利要求21所述转换非字母语言之字元的方法，其特征在于：其中该预先决定的符号较佳为一数字。

24.根据权利要求1所述转换非字母语言之字元的方法，其特征在于：其中该方法对所有每一个中文字来说，具有一对一对应关系。

25.根据权利要求1所述转换非字母语言之字元的方法，其特征在于：其中该方法进一步包含一用于不同的非文字母语言的语言指示。

26.根据权利要求24所述转换非字母语言之字元的方法，其特征在于：其中该语言指示较佳是根据申请专利1至24的中文语音拼字之前的字首。

27.根据权利要求1所述转换非字母语言之字元的方法，其特征在于：其中该方法进一步包含在与一文字母语言并用时，用于非字根字的一汉字(中文字元)指示。

28.根据权利要求26所述转换非字母语言之字元的方法及装置，其特征在于：其中该汉字指示是以“hz”来代表较佳。

29.一种用以输入一想要字元的每一元件的输入码输入装置，其特征在于：包括a)一输入机构，输入该字元的代表元件；b)一记忆体机构，储存复数个该字元；以及c)一产生机构，是因应该输入机构，从对应至该字元的所输入代表元件之该记忆体机构，产生该字元。

30.一种用以输入一想要字元的每一元件的输入码的字元发音装置，其特征在于：包括a)一输入机构，输入该字元的代表元件；b)一记忆体机构，储存该字元的多元复数形式；以及c)一产生机构，是因应该输入机构，d)一发音产生机构，以从对应至该字元的所输入代表元件之该记忆体机构，产生该发音。

31.根据权利要求第28或29之输入装置，其特征在于：其中代表元件是为该字元的子音，母音、音调、与字根。

32.根据权利要求第28或29之输入装置，其特征在于：其中该记忆体机构为资料库。