CN1254895A - 开放式全息全选全程模板式人机互补语言翻译方法 - Google Patents
开放式全息全选全程模板式人机互补语言翻译方法 Download PDFInfo
- Publication number
- CN1254895A CN1254895A CN 98125015 CN98125015A CN1254895A CN 1254895 A CN1254895 A CN 1254895A CN 98125015 CN98125015 CN 98125015 CN 98125015 A CN98125015 A CN 98125015A CN 1254895 A CN1254895 A CN 1254895A
- Authority
- CN
- China
- Prior art keywords
- information
- full
- item
- man
- natural language
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims abstract description 72
- 238000013519 translation Methods 0.000 claims abstract description 71
- 230000000295 complement effect Effects 0.000 claims abstract description 15
- 230000008569 process Effects 0.000 claims description 19
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000013461 design Methods 0.000 claims description 4
- 230000002123 temporal effect Effects 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 2
- 238000012546 transfer Methods 0.000 abstract description 2
- 230000003993 interaction Effects 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000002452 interceptive effect Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009415 formwork Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
Abstract
本发明涉及一种开放式全息全选全程模板式人机互补语言翻译方法,包括建立一个开放的以句子为对象的自然语言翻译多语通用人机对话全息模板,模板中包含有多语翻译人机对话所需的全部备用信息项;根据人机对话求解各自然语言符号实际携带的所有信息项;系统自动转换生成以句子为单元的译文自然语言表达形式,并同时提供用译文符号标注的原文符号信息项求解清单,供译文用户在需要时进行查询。具有人机互补、多语通用、传递语义信息准确的特点,适于在计算机网络中作多语种交流。
Description
本发明涉及一种计算机翻译方法,更确切地说是涉及一种在计算机网络中适于各网络终端以不同自然语言进行信息传递交流的机器翻译方法。
本申请人于1998年4月6日向中国专利局提出名称为《全息全选全程模板式人机对话语言翻译方法》、申请号为98101156.x的发明专利,该方法的实现步骤是:a.建立一个以句子为对象的包括各种自然语言必要信息要素的自然语言翻译人机对话模板;b.由对话模板提供对不同自然语言进行统一通约受限后的所有备选信息项;c.先由翻译系统对统一通约受限后的所有备选信息项进行自动优选,再由用户在全息对话模板上对优选结果进行人工调整和确认;d.由翻译系统根据确定信息项进行译出目标语转换生成,将源语输入方的选项结果随译文提供给用户查询。
全息全选全程模板式人机对话语言翻译方法作为不同自然语言语义信息传递的一种通用方式,与其它计算机自然语言翻译技术相比,在语义信息传递准确、适于多语通用方面是具有明显优势的。但是,由于人机交互信息项是经统一通约受限过的,用户进行人机交互的方法不够多样、灵活,并且由于对系统未收入的符号不能进行处理,因此不能满足自然语言不断发展变化的客观要求。
本发明的目的是设计一种开放式全息全选全程模板式人机互补语言翻译方法,作为对在先申请的98101156.x《全息全选全程模板式人机对话语言翻译方法》技术方案的补充,从而将全息全选全程模板式人机对话语言翻译方法扩展成为一个人机交互方式更为灵活多样、表达内容不受限制、生成译文更为自然流畅的人机对话多语翻译方法。
本发明的目的是这样实现的:一种开放式全息全选全程模板式人机互补语言翻译方法,其特征在于包括下述步骤:
a.建立一个开放的以句子为对象的多语通用的自然语言翻译人机对话模板;
b.由自然语言翻译人机对话模板提供与原文自然语言符号项对应的多语通用的全部备选信息项及供用户扩展的空白信息项;
c.由原文用户对自然语言翻译人机对话模板中的计算机优选信息项进行选项、补充、确认;
d.由翻译系统将人机互补确定的信息项转换生成译文符号,译文用户采用译文符号对原文自然语言符号项的全部备选信息项及扩展的空白信息项的求解结果进行查询。
所述的开放式全息全选全程模板式人机对话语言翻译方法还包括:通过程序设计对由用户扩展的信息项进行使用频率统计,并根据使用频率统计结果确定新增通用基础概念,在翻译系统的所有语种的自然语言翻译人机对话模板中同步增添自然语言符号项及对应的信息项。
所述的步骤b中,当与原文自然语言符号项对应的同语种某备选信息项中出现有空白时,用户可调用已被系统收入过的自然语言符号对其进行描述。
所述的全部备选信息项按类包括自然语言符号项的概念定义、时态信息、语态信息、句法信息、上位“格”信息、词性信息、单复数信息和阴阳性信息,以及由系统提供的供人工设计的除上述信息以外的其它信息。
所述的原文自然语言符号信息项是符号代码,包括原文文字和用图标或用数码表示的形式代码;原文自然语言符号包括单字、词、词组、短语和各种固定搭配的句子。
所述步骤d中的转换求解结果过程是用人工标注图标、数码的方式来实现的。
所述步骤b中,所述的自然语言符号及其全部备选信息项是对各种自然语言常用符号语义信息项基础概念的并集。
所述步骤b中的多语通用备选信息项,是根据语种差异和译文精度要求差异,由系统对用户进行有选择的开放。
本发明开放式全息全选全程模板式人机对话语言翻译方法的技术特点是:由于自然语言翻译的根本目的是传递原文自然语言符号实际携带的语义信息,本发明方案通过建立开放的自然语言全息模板,为各语种中的各个自然语言符号可能携带的所有语义信息均提供了具有灵活开放特征的人机交互求解的渠道,实现全息翻译;建立必要的自然语言表达规范是完成多义符号语义信息项求解任务、保证语言自动翻译质量的重要条件,本发明用全息模板向用户提供可控制的备选信息项,从而建立起面向用户的多语种通用自然语言表达规范,通过在全息模板内进行人机交互选项,来全面求解自然语言符号串实际携带的语义信息,实现全选翻译;即使已对原文自然语言符号的语义信息项进行了全面求解,在转换成了译文符号串后,仍可能新增岐义,为了保证翻译系统的原文语义信息的传递质量,本发明可根据用户需要将原文全息清单的任意信息项人机交互的最终求解结果,包括中间代码,转换成译文符号形式,以供译文用户查询,实现全程翻译。
本发明的开放式全息全选全程模板式人机对话语言翻译方法,在网络信息交流领域具有普遍应用的价值,在打开网络在线服务、机器翻译服务方面将会有广阔的国际市场。
下面结合一个将英文句子“I saw a boy with a telescope near the bank”,翻译成中文的开放式全息全选全程模板式人机对话语言翻译过程进一步说明本发明的技术。
图1是全息全选全程模板式人机对话语言翻译人机交互信息处理的基本过程框图。
图2是以英文原句为对象的自然语言全息模板结构示意图。
图3是图2所示模板结构的中文对照图。
图4是查询自然语言符号“with a telescope”实际携带句法信息项的过程示意图。
图5是用图标、数字或不同形状、颜色线条、框格作代码进行自动或人工标注的过程示意图。
图6是在某种语言的信息项符号空缺时对其进行语义描述的过程示意图
参见图1,图中流程说明了全息全选全程模板式人机对话语言翻译人机交互信息处理的基本过程,其中中间列框11至17是翻译系统计算机的主流程,左边列框21至16示出用户的参与过程,右边列框31至35示出人机交互过程及与内部数据库、规则库间的关系,单向箭头表示人机交互流向,双向箭头表示在语言翻译过程中对数据及规则的调用过程,所标的N表示系统信息处理需要人机交互,所标的Y表示自动进入系统流程的下一个操作步骤,##----##表示此翻译系统与因特网系统的信息处理接口。其上方表示原文用户端,其下方表示译文用户端。
处理过程开始,执行步骤11,由原文用户顺序输入待翻译的自然语言符号。
结合参见图2并对照图3,在模板的序位1至10中依次填入本例中的十个自然语言符号I saw a boy with a telescope near the bank;系统主程序的步骤12在可扩展的多语对应的语义信息项符号库31中,对各自然语言符号进行备用(语义)信息项搜索,当搜索不到时可通过步骤21由原文用户在模板上用系统已收入的语义符号对语义进行描述,上述过程最终生成模板中的由概念定义项、特殊属性项、时态项、语态项等构成的语义备用信息项,如果在某自然语言符号下出现概念定义信息项空白,如bank处出现?,则系统用户可采用系统中已提供有信息项的词汇符号对其进行语义描述,即模板中概念定义项“institution for keeping or lending money”;系统主程序的步骤13,根据语义信息项概率性优选规则库32中的规则,如模板中用黑体字指定的信息项,由计算机对列入模板中的各自然语言符号的多个语义备用信息项进行自动优选,可通过步骤22由原文用户对未获得确定优选的语义信息项进行选择确认;系统主程序的步骤14,通过调用句法成份信息项自动标注模型库33,对列入模板中的各自然语言符号的句法信息项进行自动标注,上述过程最终生成模板中的句法成份项、词性项、上位“格”项、场景项;系统主程序的步骤15,调用句法成份信息项自动优选规则库34,对各自然语言符号的句法成份信息项进行自动优选,其间可通过步骤24调用句法信息项三维结构模型库23,由原文用户在模板上对未获得唯一优选结果的句法信息项进行选择确认,如模板中用黑体字指定的信息项;系统主程序至此就可以以自定的编码形式在网络上传递所确定的上述信息项。
模板中的全部信息项已扩展为自然语言符号所能携带的所有信息项,其全部备用信息项不仅包括自然语言符号的概念定义、时态信息、语态信息、句法信息、上位“格”信息、词性信息、单复数信息、阴阳性信息、而且可在开放式的模板下部扩展人工设计和标注的其它信息。
结合参见图4,译文用户端系统主程序的步骤16,调用译文自动转换生成规则库35,根据多语符号与序位转换规则,将经原文用户确认的信息项求解结果自动转换成译文用户要求的自然语言译文,如图4中所示的中文转换生成结果“在银行附近我看见一男孩带望远镜”;系统主程序在步骤17将会询问用户译文是否已经无岐义,如果有岐义,译文用户可在步骤26通过人机交互过程确定相关信息项的查询范围,基间可调用多语对应信息项符号库25,如译文用户为了求解“带望远镜”到底是修饰主语还是修饰宾语,如图4中?所示,就可直接查询该符号实际携带的句法信息项,从而确定是修饰宾语。至此翻译过程结束。
模板中的所有备选信息项均可利用图标或数字或不同颜色的线条和框格作为代码进行人工或自动标注,如图5中所示的用数字标注,用1标注“我”,用~1标注“在银行附近”(句法信息),用2标注“看见”、“看见一个”(句法信息),用3标注“男孩”,用~3标注“带望远镜的”(句法信息)等。
结合参见图6,图中示出以自然语言符号“笑”为例,并集各种自然语言常用符号语义信息项形成基础概念的过程。图中仅列出其英语、汉语的基础概念并集结果,俄语、日语、法语、德语、西班牙语及其它语种可按相同方法进行语义描述。图中所示的三个主要过程是:如某种语言基础信息项符号出现空缺时,用该种语言的其它常用语义信息项符号进行语义描述,形成基础信息项,如“笑”与“laugh”;当某种语言非基础信息项空缺时,则与基础信息项符号建立模糊对应关系,形成非基础信息项,如“大笑、微笑、笑逐颜开、笑哈哈”与“burst、smile”;当某种语言其它近义信息项空缺时,则用该语言常用语义信息项符号进行语义描述,形成其它近义项,如“傻笑、咧嘴笑”与“snicker、grin”。表中的统一编码就是图1中的自定的编码形式,用于在网络上传递信息。
原文用户在图1步骤21中利用语义描述方法求解原文符号时,系统程序还要自动进行其使用频率的统计,在使用频率达到一定水平时,即在翻译系统收入的所有语种的自然语言符号库中同步增添新增的自然语言符号或新增信息项。如人工描述求解bank的使用频率达到一定水平时,系统即在法语的自然语言符号库中添加新增的符号“banque”和利用系统已收入的相应法语符号进行语义描述,并给出其它相关备选信息项。其它语言的扩展方法与其相同。
实施时,模板中的各自然语言符号顶可以是单字,如“我”,也可以是词,如“银行”(或词组“国家银行”),短语,如“带望远镜的”,和各种固定搭配,如“在…附近”,当然也可以是句子(如“瞎子点灯白费蜡”)。
此外,如果用户只要求翻译基本语义,则系统开放的供人机交互的选项类则可相应减少;反之,当用户要求译文的流畅性高时,则供人机交互选项的类要相应增多。
本发明的方法以人机互补、多语通用、语义信息传递准确为特色,尤其适用于只懂母语的用户在计算机网络上进行广泛的多语交流。
Claims (8)
1.一种开放式全息全选全程模板式人机互补语言翻译方法,其特征在于包括下述步骤:
a.建立一个开放的以句子为对象的多语通用的自然语言翻译人机对话模板;
b.由自然语言翻译人机对话模板提供与原文自然语言符号项对应的多语通用的全部备选信息项及供用户扩展的空白信息项;
c.由原文用户对自然语言翻译人机对话模板中的计算机优选信息项进行选项、补充、确认;
d.由翻译系统将人机互补确定的信息项转换生成译文符号,译文用户采用译文符号对原文自然语言符号项的全部备选信息项及扩展的空白信息项的求解结果进行查询。
2.根据权利要求1所述的开放式全息全选全程模板式人机互补语言翻译方法,其特征在于:所述的开放式全息全选全程模板式人机对话语言翻译方法还包括:通过程序设计对由用户扩展的信息项进行使用频率统计,并根据使用频率统计结果确定新增通用基础概念,在翻译系统的所有语种的自然语言翻译人机对话模板中同步增添自然语言符号项及对应的信息项。
3.根据权利要求1所述的开放式全息全选全程模板式人机互补语言翻译方法,其特征在于:所述的步骤b中,当与原文自然语言符号项对应的同语种某备选信息项中出现有空白时,用户可调用已被系统收入过的自然语言符号对其进行描述。
4.根据权利要求1所述的开放式全息全选全程模板式人机互补语言翻译方法,其特征在于:所述的全部备选信息项按类包括自然语言符号项的概念定义、时态信息、语态信息、句法信息、上位“格”信息、词性信息、单复数信息和阴阳性信息,以及由系统提供的供人工设计的除上述信息以外的其它信息。
5.根据权利要求1所述的开放式全息全选全程模板式人机互补语言翻译方法,其特征在于:所述的原文自然语言符号信息项是符号代码,包括原文文字和用图标或用数码表示的形式代码;原文自然语言符号包括单字、词、词组、短语和各种固定搭配的句子。
6根据权利要求1所述的开放式全息全选全程模板式人机互补语言翻译方法,其特征在于:所述步骤d中的转换求解结果过程是用人工标注图标、数码的方式来实现的。
7.根据权利要求1所述的开放式全息全选全程模板式人机互补语言翻译方法,其特征在于:所述步骤b中,所述的自然语言符号及其全部备选信息项是对各种自然语言常用符号语义信息项基础概念的并集。
8.根据权利要求1所述的开放式全息全选全程模板式人机互补语言翻译方法,其特征在于:所述步骤b中的多语通用备选信息项,是根据语种差异和译文精度要求差异,由系统对用户进行有选择的开放。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 98125015 CN1254895A (zh) | 1998-11-20 | 1998-11-20 | 开放式全息全选全程模板式人机互补语言翻译方法 |
AU33249/99A AU3324999A (en) | 1998-04-06 | 1999-04-06 | Opening and holographic template type of language translation method having man-machine dialogue function and holographic semanteme marking system |
PCT/CN1999/000046 WO1999052041A1 (fr) | 1998-04-06 | 1999-04-06 | Procede de traduction de langage a gabarit holographique et d'ouverture presentant une fonction d'interaction homme-machine et systeme de marquage holographique |
CN99804904A CN1111814C (zh) | 1998-04-06 | 1999-04-06 | 开放式全息模板式人机对话语言翻译方法及全息语义标注系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 98125015 CN1254895A (zh) | 1998-11-20 | 1998-11-20 | 开放式全息全选全程模板式人机互补语言翻译方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1254895A true CN1254895A (zh) | 2000-05-31 |
Family
ID=5228968
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 98125015 Pending CN1254895A (zh) | 1998-04-06 | 1998-11-20 | 开放式全息全选全程模板式人机互补语言翻译方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1254895A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100346337C (zh) * | 2002-12-27 | 2007-10-31 | 联想(北京)有限公司 | 用于生成业务系统信息的开放式自然语言动态生成系统 |
CN1457041B (zh) * | 2002-05-10 | 2010-05-26 | 微软公司 | 为一个自然语言理解系统用来自动注解训练数据的一个系统 |
CN102236645A (zh) * | 2010-05-06 | 2011-11-09 | 上海五和际软件信息有限公司 | 基于语义逻辑的类自然语言人机对话装置 |
CN107436889A (zh) * | 2016-05-29 | 2017-12-05 | 陈勇 | 一种用文字进行交流的人机对话平台 |
-
1998
- 1998-11-20 CN CN 98125015 patent/CN1254895A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1457041B (zh) * | 2002-05-10 | 2010-05-26 | 微软公司 | 为一个自然语言理解系统用来自动注解训练数据的一个系统 |
CN100346337C (zh) * | 2002-12-27 | 2007-10-31 | 联想(北京)有限公司 | 用于生成业务系统信息的开放式自然语言动态生成系统 |
CN102236645A (zh) * | 2010-05-06 | 2011-11-09 | 上海五和际软件信息有限公司 | 基于语义逻辑的类自然语言人机对话装置 |
CN107436889A (zh) * | 2016-05-29 | 2017-12-05 | 陈勇 | 一种用文字进行交流的人机对话平台 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102193643B (zh) | 一种文字输入方法和具有翻译功能的输入法系统 | |
CN104679850B (zh) | 地址结构化方法及装置 | |
JP2732563B2 (ja) | 機械翻訳方法及び装置 | |
CN109145276A (zh) | 一种基于拼音的语音转文字后的文本校正方法 | |
CN101520786A (zh) | 一种输入法词典的实现方法和输入法系统 | |
CN102165437A (zh) | 信息处理装置及信息处理方法 | |
CN102165438A (zh) | 信息处理装置及信息处理方法 | |
US12153619B2 (en) | Generative prompt expansion for image generation | |
Aswani et al. | A hybrid approach to align sentences and words in English-Hindi parallel corpora | |
JPH07114558A (ja) | 漢字変換訂正処理方式 | |
CN101441626A (zh) | 一种多媒体检索系统及其检索方法 | |
JP2011181109A (ja) | 情報検索支援プログラム、情報検索支援機能を有するコンピュータ、サーバー・コンピュータ、プログラム格納媒体 | |
CN113343717A (zh) | 一种基于翻译记忆库的神经机器翻译方法 | |
CN1254895A (zh) | 开放式全息全选全程模板式人机互补语言翻译方法 | |
CN111897958B (zh) | 基于自然语言处理的古诗词分类方法 | |
CN103164397A (zh) | 汉哈电子辞典及其自动转译汉哈语的方法 | |
CN103164398A (zh) | 汉维电子辞典及其自动转译汉维语的方法 | |
CN103164395A (zh) | 汉柯电子辞典及其自动转译汉柯语的方法 | |
CN1111814C (zh) | 开放式全息模板式人机对话语言翻译方法及全息语义标注系统 | |
Barberis et al. | Improving accessibility for deaf people: an editor for computer assisted translation through virtual avatars. | |
DiMARCO et al. | Stylistic grammars in language translation | |
CN110874527A (zh) | 一种基于云端的智能释义注音系统 | |
An | Construction and Application of Corpora in Computer-Assisted Translation of Spanish Intangible Cultural Heritage for External Promotion | |
Erjavec et al. | jaSlo, a Japanese-Slovene learners’ dictionary: methods for dictionary enhancement | |
Shevchuk et al. | Software Service for Studying Words of the Ukrainian Language |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C01 | Deemed withdrawal of patent application (patent law 1993) | ||
WD01 | Invention patent application deemed withdrawn after publication |