CN1624686A - 用于语义速记的系统和方法 - Google Patents
用于语义速记的系统和方法 Download PDFInfo
- Publication number
- CN1624686A CN1624686A CNA2004100980294A CN200410098029A CN1624686A CN 1624686 A CN1624686 A CN 1624686A CN A2004100980294 A CNA2004100980294 A CN A2004100980294A CN 200410098029 A CN200410098029 A CN 200410098029A CN 1624686 A CN1624686 A CN 1624686A
- Authority
- CN
- China
- Prior art keywords
- text
- notes
- local
- semantic
- short notes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/274—Converting codes to words; Guess-ahead of partial word inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
- G06F40/56—Natural language generation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
一种方法和设备将诸如短笔记的输入数据转换为全局文本实现以便提供语义一致且符合语法的文本。在各个示例性实施例中,用户将短笔记输入到计算机系统中,所述计算机系统将局部文本实现与所述短笔记相关联。随后,所述用户可以选择适当的局部文本实现,所述适当的局部文本实现可以被转换为语义一致且符合语法的文本或全局文本实现。
Description
技术领域
本发明涉及包括将短笔记(note)自动转换为语义一致的文本。
背景技术
学生、专业人士、民意调查者和呼叫中心或用户服务中心的雇员常常没有足够的时间记下完整的、形式合格(well-formed)的句子来描述口头传到他们的信息。作为替代,在会话、演讲或其它口头交互进行过程中,这些人通常草草记下几个能够表达基本事实的关键字或短笔记。速记法是在口头交流期间采用速记并且随后将速记笔记转换为完整的书面文本或口头交流的转录的技术或方法。
常常希望加快将速记转换为完整的书面文本的过程,以致可以迅速地记录或发表口头讯息。例如,美国专利申请公布No.2002/0089470A1公开了一种实时互联网转录陈述系统,所述陈述系统生成实况陈述的实时转录。然而,将口头讯息转换为转录常常不能形成形式合格的句子。另外,这些实时转录系统只提供原始信息。这些实时转录系统没有以压缩的、语义一致且符合语法的文本或形式合格的句子来概括信息以便迅速并有效地把信息传达给听众或公众。
另外,能够产生所述笔记首先取决于将复杂的概念结构同可被称为“语义缩写”相关联的惯例。这些惯例常常由公众共享。传递重现类型信息的公众越紧并且需要越频繁,这种编码就越高效。
常规的实时转录系统不能高效地传递重现类型的信息,这是因为这些系统接收原始信息并直接将所接收的原始信息转换为文本。常规的实时转录系统不能认出重现信息和所有的这些惯例。因此,希望能够将短笔记转换为完整的语法文本,以致个人能够接收口头所传递的信息的简明、形式完好的句子形式的完整的文本概要。
另一技术是在受控文档编辑(Controlled Document Authoring)领域。典型地,这些系统的用户在存在于使用用户语言的文档的展开文本中的活动字段中选择可能的语义选项。这些选择反复地细化所述文档内容直到其是完整的。然后,所述系统可以将所述文档翻译为多种语言。这样一种受控文档的编辑系统是多语言文档编辑(MDA)系统,如在关于自然语言生成的第一国际会议(INLG’2000)-MitzpeRamon,Israel,2000的会议记录上由Caroline Brun、Marc Dymetman和Veronika Lux所发表的“Document Structure and MultilingualText Authoring”;Aurélien Max(Max)在EACL′03学生调查研讨会-Budapest,Hungary,2003的会议记录中所发表的“ReversingControlled Document Authoring to Normalize Documents”;和Aurélien Max和Marc Dymetman(Max和Dymetman)在用于信息访问的使用(和获得)语言学(和世界)知识AAAI 2002春季研究会-Stanford大学,美国,2002上发表的“Document Content Analysis throughInverted Generation”,这里将其每一个全部引入以供参考。
上述的这些MDA系统依靠形式机制(一种统一语法)以几种语言或书写风格来描述形式合格的语义表示和它们的文本的实现。这些规范被限制在所公开的具体领域,对于这些领域,文档内容的相对完整的建模是可能的,诸如药物活页、实验报告、分类添加等等。这种规范还可被用作枚举机制,其确定性地产生形式合格的语义表示及其全局文本的实现。然而,在这些MDA系统中,在枚举过程中,采用通过与不同可能的路径相关联的菜单选择来请用户回答问题,来产生全局文本实现(global text realization)。这在所引入的出版物中已有所讨论。
然而,这种MDA系统要求用户在显示屏上选择活动的字段以便完成合乎语法的句子。包含活动字段的句子或短语以特定次序出现。这些活动字段具有固定数目的选项,其取决于先前的选择。在会话、演讲或其它口头交互期间,说话人-例如同客户服务代表讲话的用户做出陈述,但是其陈述的次序不一定与他所做的陈述在所述多语言文档编辑系统的图形用户界面上出现的次序相同。所述用户也许不会选择适当的活动字段和/或在活动字段中的参数可能受到了太大的限制。
发明内容
提供了系统和方法,用于将输入数据转换为语义一致且符合语法的文本。
分别提供了系统和方法,用于分析输入数据并且将输入数据同其它数据相关联。
分别提供了系统和方法,用于将输入数据同所存储数据相关联。
分别提供了系统和方法,用于根据输入数据和其它数据-诸如所存储数据的关联来产生全局文本实现分别提供了系统和方法。其它数据可以包括局部文本实现。
还提供了具有计算机可用介质的计算机程序产品,其具有用于将短笔记转换为全局文本实现的计算机可读程序代码。
可以将短笔记或关键字转换为语义一致且符合语法的文本。所述短笔记或关键字对听众或公众来说可以是有意义的,并且可以包括语义缩写,所述语义缩写可用于形成语义一致且符合语法的文本。可以将所述短笔记和/或符合语义的文本输出到输出设备,诸如显示设备,打印设备,音响设备等等。
可以通过在多个局部文本实现和短笔记之间执行模糊匹配来产生全局文本实现,以便提供与每个短笔记相关联的至少一个局部文本实现。
可以用与其相关联的至少一个局部文本实现输出短笔记。
可以选择与每个短笔记相关联的一个局部文本实现,并且产生基于所选择的短笔记的全局文本实现。
可以根据所述语义表示为每个所选择的相关联的文本实现产生全局文本实现。
通过确认每个局部文本实现,检索相关联的语义表示并且根据所述语义表示产生全局文本实现,来为每个所选择的相关联的文本实现确定语义表示。
可以在多个局部文本实现和短笔记之间执行模糊匹配,以便提供与每个短笔记相关联的至少一个局部文本实现,其中向与每个短笔记相关联的每个局部文本实现赋予一个等级。可以依照给每个局部文本实现所赋予的等级,来输出所述局部文本实现。
可以在多个局部文本实现和短笔记之间执行模糊匹配,以便提供与每个短笔记相关联的至少一个局部文本实现,包括为每个短笔记确定一个描述符,为每个局部文本实现提供描述符,确定在短笔记的描述符和局部文本实现的描述符之间的模糊相似性度量,并且根据模糊相关性度量把描述符分成等级,以便输出与描述符相关联的局部文本实现。
提供了系统和方法,用于处理输入数据以便提供全局文本实现。
分别提供了系统和方法,用于使用语义语法来产生语义结构。
分别提供了系统和方法,用于根据所述语义结构用第一实现语法生成多个局部文本实现。
分别提供了系统和方法,用于把所接收的短笔记输入数据与多个局部文本实现的实例相匹配,以便定义一个最终的语义结构。
分别提供了系统和方法,用于根据所述最终的语义结构用第二实现语法生成全局文本实现。
在下列详细说明中将描述或表现这些及其他特征和优点。
附图说明
参考下列图详细描述备个示例性实施例,其中:
图1是用于执行语义速记(semantic stenography)的语义速记系统的一个示例性实施例;
图2是一个功能性的框图,其举例说明了从短笔记到全局文本实现的数据流的总体次序;
图3是概括地描述了用于将笔记转换为语义一致且符合语法的文本的方法的一个示例性实施例的流程图;
图4是以更多细节概括地描述了将局部文本实现与短笔记相关联的步骤的一个示例性实施例的流程图;
图5是以更多细节概括地描述了使用局部文本实现的语义表示来产生全局文本实现的步骤的一个示例性实施例的流程图;
图6是一个展示由用户输入的短笔记的图形用户界面的示例性实施例;
图7是一个展示与每个短笔记相关联的一个或多个局部文本实现的图形用户界面的示例性实施例;
图8是一个展示与每个短笔记相关联的、所选择的局部文本实现的图形用户界面的示例性实施例;
图9是一个展示从所述短笔记和局部文本实现产生的一个示例性全局文本实现或语义一致且符合语法的文本的图形用户界面的示例性
实施例;和
图10是一个举例说明了笔记转换系统的示例性的实施例的功能性的框图。
具体实施方式
图1举例说明了用于执行语义速记的示例性的语义速记系统10。所述语义速记系统在适于执行指令的任何计算设备上操作,所述指令依照用于执行本系统的备个方法来进行操作。用于操作图1中的实施例的方法并非是确定性的。做为选择,可以使用可采纳的搜索技术来执行最优化,所述搜索技术在上述引入的出版物中已经公开。更具体地说,图1举例说明了语义速记系统10的概念视图,在语义速记系统10中,用户提供短笔记12,以及可选地提供用户输入14。每个短笔记包括一个或多个关键字,其中每个关键字可以是两个或更多关键字的一个分组。作为输出,所述语义速记系统10提供全局文本实现16,所述全局文本实现16代表与所述短笔记12相关的形式合格的段落,所述短笔记12在语言上不是合于语法的。例如,表1下面最左边的栏阐述了短笔记12的例子,并且表2最右边的栏阐述了全局文本实现16的例子。
表1
短笔记 局部文本实现 语义表示
管理助手 工作提供是管理助手 <job_offer>
<job_description>administrative_assistant
</job_description>
Global- 雇佣公司的名字是 <company>GlobalModest</company>
Modest GlobalModest
Laval 工作地点在法国的Laval <job_location>laval_france<job_location>
CDD 合同类型是CDD <contract_type>cdd</contract_type>
1年 合同持续期1年 <contract_duration>one_year</contract_duration>
立即 职位要立即上任 <starting_date>immediate<starting_date>
<tasks>
约定 工作包括处理约定 <task>appointments</task>
电话 工作包括应答电话 <task>telephone</task>
日常信函 工作包括准备日常信函 <task>write_routine_letters</task>
文件系统 工作包括处理文件系统 <task>filing_system_handle</task>
其它 工作包括其它杂项任务 <task>misc_duties</task>
</tasks>
学士+2 要求至少bac+2 <study_level/>bac_plus2<study_level>
2年经验 要求至少已有2年经验 <experience_lenth>2_yeara</experience_length>
Word 要求Word特别擅长 <computer_skills>
<computer_skills>
<cs_program>Word</cs_program>
<cs_level>excellent</cs_level>
<cs_requirement>required</cs_requirement>
<computer_skills>
Outlook 要求Outlook特别擅长 <computer_skills>
<cs_program>Outlook</cs_program>
<cs_level>excellem</cs_level>
<cs_requirement>required</cs_requirement>
<computer_skills>
法语 要求流利的法语 <language_skills>
<language_skills>
<ls_idiom>French</ls_idiom>
<ls_level>fluent</ls_level>
<ls_requirement>required</ls_requirement>
<language_skills>
英语 要求流利的英语 <hanguage_skills>
<language_skills>
<ls_idiom>English</ls_idiom>
<ls_level>fluent</ls_level>
<ls_requirement>required</ls_requirement>
<language_skills>
加上意大 最好掌握意大利语 <language_skills>
<language_skills>
<ls_idiom>Italian</ls_idiom>
<ls_level>good</ls_level>
利语 <ls_requirement>desirablc</ls_requirement>
<language_skills>
<language_skills>
</job_offer>
表2
语义表示 全局文本实现<job_offer><job_description>administrative_assistant<job_description> GlobalModest正在为其在<company>GlobalModest</company><job_location>laval_france</job_location> 法国Laval办公室寻找一位<contract_type>cdd</contract_type><contract_duraction>one_year</contract_duration> 管理助手。该职位是CDD,要<starting_date>immediate</starting_date> 立即上任并为期1年。<tasks>
主要工作是安排约定的时<task>appointmcnts</task><task>telephone</task><task>write routine letters</task> 间,应答电话,准备日常信<task>filing_system_handle</task> 函,管理并维护文件系统并<task>misc_duties</task><tascs>
且执行各种其它杂项事务。<experience_length>2_years</experience_length><computer_skills> 候选者需至少Bac+2,至少
<computer_skill>
<cs_program>Word</cs_program> 有两年在类似职位的工作经
<cs_level>excellent</cs_level>
<cs_requirement>required</cs_requirement> 验,并且在Word和Outlook<computer_skills><computer_skill> 方面特别擅长。
<cs_program>Outlook</cs_program>
<cs_level>required</cs_level>
<cs_requirement>required</cs_requirement></computer_skills></computer_skills><language_skills><language_skill> 需要流利的法语和英语,最<ls_idiom>French</ls_idiom>
<ls_level>fluent</ls_level> 好掌握意大利语
<ls_requirement>required</ls_requirement><language_skill><language_skill><ls_idiom>English</ls_idiom>
<ls_level>fluent</ls_level>
<ls_requirement>required</ls_requirement><language_skill><language_skill><ls_idiom>Italian</ls_idiom>
<ls_level>good</ls_level>
<ls_requirement>desirable</ls_requirement><language_skill><language_skilsl></job_offer>
为了根据短笔记12产生全局文本实现16,所述系统10利用语义语法18,所述语义语法18可以用来产生许多合于语法的语义结构20的集合,所述语义结构例如可以以树的形式来表示。表1最右边的栏示出了语义结构20的许多可能表示之一的例子。局部实现语法22可以用来根据语义结构20生成局部文本实现24,并且全局实现语法26可以用来生成全局文本实现16。在表1的中间栏示出了局部文本实现的例子。一般地说,所述语义语法18由用于枚举语义结构的语义语法对象组成,并且局部和全局实现语法22和26分别由用于将语义输入转换为或者是局部(例如,句子片段)或者是全局(例如,段落)的文本的实现语法对象组成。
图2举例说明了总体次序,由所述系统10按照这个次序来使用表1和2中的数据。最初在A,使用(来自图1中的语义结构20的)语义表示来生成局部文本实现(图1中在24示出)。在B,所述文本实现与短笔记(图1中在12处示出)相匹配。在C,所匹配的局部文本实现向回引用语义表示,在D使用所述语义表示来生成全局文本实现。
操作中,当接收采用短笔记12形式的输入时,最初在28,所述系统10在30指示所述语义语法18来产生下一(当前)语义结构20。一旦产生当前语义结构20,就指示所述局部实现语法22使用当前语义结构20来产生局部文本实现24。随后在32,在32最大化局部文本实现24和短笔记12之间的接近度。在一个实施例中,通过在30产生不同的语义结构20(具有相应的局部文本实现24)来识别并记录最佳匹配34,从而实现接近度最大化,所述最佳匹配34是局部文本实现24和它们相应的语义结构20的集合,所述语义结构20与所述短笔记12最接近地匹配。也就是说,当在32识别出局部文本实现24与短笔记12具有预先确定级别的相似性时,将局部文本实现24与对它们的语义结构20的引用一起记录为最佳匹配34。
在32一旦在局部文本实现24和所述短笔记12之间发生足够级别的匹配,在36可以请求来自用户的输入,以便在不同的局部文本实现之间作出选择,所述不同的局部文本实现相似地接近于一个或多个短笔记(即,与所述一个或多个短笔记具有相似的匹配度)。如果提供多个未定的匹配以供用户在14选择,所述匹配取决于不相关的语义结构,那么当在36选择冲突的局部文本实现时,在一个实施例中的所述系统10从那些用户可用的语义结构中删除不相关的语义结构。一旦定义了最终的语义结构(该最终语义结构在用户在14深信不疑地选择了全部的最佳匹配时加以定义),那么通过将全局实现语法26应用到所述最终语义结构来在38产生全局文本实现16。
图3是概要地描述一个用于将笔记转换为语义一致且符合语法的文本或全局文本实现的示例性方法的流程图,所述笔记在公众(即,具体领域)内是有意义的,当同广大听众交流时,所述语义一致且符合语法的文本或所述全局文本实现是可用的,所述语义一致且符合语法的文本或所述全局文本实现不参与用于所述公众的缩写惯例。用于将短笔记转换为全局文本实现的方法在步骤S110开始,在那里用户或操作者将诸如短笔记的输入数据输入到计算设备中,所述计算设备可以在显示屏上的图形用户界面中显示所述短笔记。控制继续至步骤S120,在那里执行短笔记和局部文本实现的列表之间的模糊匹配,以便将局部文本实现与短笔记相关联。接下来,在步骤S130和S140,显示与局部文本实现相关联的短笔记,以便在存在十分接近要求用户输入的匹配的情况下,用户进行复查和/或修改。做为选择,如果没有要求用户输入,那么控制前进到步骤S150。优选地,为所述用户或操作者高亮显示等级最高的潜在的局部文本实现。
如果要求用户输入,那么控制继续至步骤S145,在那里所述用户或操作者选择局部文本实现,所述局部文本实现在步骤S150被转换为与所述局部文本实现相关联的语义表示。这些语义表示可以由现有的文档编辑系统提供。接下来,在步骤S160,可以由现有的文档编辑系统产生与所述语义表示相关联的全局文本实现。接下来,在步骤S170,该过程通过输出所述全局文本实现(语义一致且符合语法的文本)而结束。
图4示出了以更多的细节概括地描述将局部文本实现与短笔记相关联的步骤的流程图,包括执行短笔记的列表和局部文本实现的列表之间的模糊匹配,例如,如在图3的步骤S120中所阐述。所述模糊匹配过程在步骤S121开始并且继续至步骤S122,在那里为每个局部文本实现提供描述符或语义表示。控制继续至步骤S123,在那里为每个短笔记提供描述符或语义表示。一个MDA系统或其它受控文档编辑系统可以提供这些描述符或语义表示。
控制继续至步骤S124,在那里例如通过将每个短笔记的描述符或语义表示同所述局部文本实现的描述符或语义表示相比较,来产生模糊相关性度量。该相似性可以通过计算在短笔记和任何局部实现之间的语义距离来提供。可以使用已知的或今后开发的技术来实现这些,例如那些阐述在统计自然语言处理基础-Christopher D.Manning和Hinrich Schutze-第15章,MIT出版社,1999中的技术,在此将其全文引入以供参考。
例如,为每个局部文本实现和每个短笔记提供描述符。通过将每个短笔记的描述符与所述潜在局部文本实现的描述符相比较,来度量短笔记和潜在局部文本实现之间的语义距离。该度量通常用来确定短笔记和所有潜在局部文本实现之间的匹配,所述潜在局部文本实现具大于某个预先确定的阈值的相似性。为了避免搜索可能局部文本实现相对于所述MDA语法或其它受控文档编辑系统语法的整个空间,已知的或今后开发的可采纳的搜索技术-诸如那些阐述在人工智能的本质-Matt Ginsberg-第4章,Morgan Kaufmann,1993中的技术(在此将其全文引入以供参考)可以被加以利用,以致只有数目小的所述潜在局部文本实现才将能够与一个特定短笔记之间具有一个大于阈值的相似性。然而,其它短笔记也可用来把与每个短笔记相关联的潜在局部文本实现的数目降低为易管理的数目。
除在步骤S124识别每个短笔记的局部文本实现之外,还可以根据所述相似性度量为每个潜在局部文本实现赋予一个等级,这与在步骤S125中一样。与每个短笔记相关联的潜在局部文本实现的等级排列可以从最高(最可能潜在的局部文本实现)到最低(最不可能潜在的局部文本实现)。所述过程结束并且控制回到步骤S130。
图5举例说明了以更多的细节概括地描述用于确定语义表示的步骤的流程图,所述语义表示与每个选择的局部文本实现相关联,如在图3中步骤S160阐述。所述过程在步骤S161开始,并且继续至步骤S162,在那里例如从存储器提供所述语义表示。控制继续至步骤S163,在那里检索与每个局部文本实现相关联的语义表示。接下来,在步骤S164,根据所述局部文本实现产生完整的语义表示。这些语义表示可以由所述现有的MDA系统提供,以致根据所述局部文本实现产生一个完整的语义表示,例如如在表1和2中所示的。做为选择,语义表示可以由另一受控文档编辑系统提供,或添加。所述过程结束并且控制回到步骤170。
图6示出了示例性图形用户界面100,包括工具条105,请求输入输入数据的请求110,和用于显示输入数据的窗口120,所述输入数据诸如由用户或操作者输入的短笔记。这些短笔记可以被称为关键字,这些关键字可以被理解成对于听众或公众而言是有意义的。由公众使用的短笔记或关键字的数目是不受限制的,并且所述短笔记或关键字可以以任意次序输入。例如,在全体工作人员或职业介绍机构的公众中,存在具有呼叫中心的因特网职业介绍机构,在那里所述因特网职业介绍机构的雇员接收来自潜在雇主的电话并且在可搜寻的因特网网站上投递职位。一个呼叫中心的雇员可能输入短笔记或关键字,然后由如图6所示的图形用户界面100显示所述短笔记或关键字。短笔记或关键字可以使用各种输入设备输入,并且可以显示在输出设备上,所述输出设备诸如一个显示设备。
在一个行业中,某些短笔记或关键字对于全体工作人员和职业介绍机构来说是通用的,诸如雇主的姓名、工作名称、职位的所在地、雇用的持续时间、职位的职责、所要求或优选的教育、所期望的经验年限、所要求计算机软件技能、所要求的语言技能和所期望的语言技能。输入所述短笔记的所采用的次序是不固定或是不重要的。此外,所述操作者可以输入任意数目的短笔记,这是因为所述匹配是根据所述实际的输入数据而不是根据指定的字段或条目的次序来执行的。
所述图形用户界面100包括窗口120,在该窗口中显示有示例性的短笔记“GlobalModest”121、“管理助手”122、“Laval”123、“CDD即任1年”124,“约定、电话、简单信函、文件、杂项”125、“bac+2”126、“2年经验”127、“Word、Outlook”128、“法语,英语”129和“在加上意大利语”130。
在用户输入所述短笔记之后,所述短笔记与局部文本实现相关联。图7举例说明了示例性图形用户界面200,所述图像用户界面具有工具条205、让操作者根据两个栏表220确认局部文本实现的请求210,所述两个栏表包括短笔记栏230和局部文本实现栏250。如图7所示,短笔记231-248对应于局部文本实现251-268。每个短笔记与一个或多个局部文本实现相关联,所述局部文本实现处于可能的局部文本实现之间,所述可能的局部文本实现由所述文档编辑系统为其所能够表示的局部语义结构的范围而产生。例如,短笔记“管理助手”231与在块251中的一个局部文本实现相关联,框251的题目是“工作提供是管理助手”251a。诸如“Laval”233的短笔记可以有与之相关联的一个以上的局部文本实现。如块253所示,两个局部文本实现“工作地点在Laval,魁北克”253a和“工作地点在Laval,法国”253b都与所述短笔记“Laval”233相关联。根据许多因素,诸如:在笔记文本和局部实现文本之间的相似性度量、引用一个给定公司的频率、连同他们的群众统计的城市的数据库和类似的信息,为每个局部文本实现赋予一个等级。例如,向所述局部文本实现“工作地点在Laval,魁北克”253a赋予一个比所述局部文本实现“工作地点在Laval,法国”更高的等级,在图2中按照“工作地点在Laval,魁北克”253a的次序和高亮度示出。然而,所述图形用户界面200允许所述用户选择适当的局部文本实现。如果“工作地点是Laval,魁北克”253a和“工作地点是Laval,法国”253b都不是正确的,那么所述用户或操作者可以选择“其它”253c并且输入所希望的局部文本实现。
图8举例说明了一个例子,在该例子中,所述用户或操作者已经例如通过高亮度显示所述适当的选择来完成他或她所选择。每个局部文本实现在结构上与相对于所述编辑系统的局部语义表示相关联,如表1所示(所述表的行)。总起来说,这些局部语义表示形成全局语义表示(所述表1的最后一栏)。
在将所述局部文本实现转换为全局语义表示之后,如表1所示,所述文档编辑系统就被调用来根据该语义表示产生全局文本实现。所述结果在表2中示出。
图9举例说明了图形用户界面400,该图形用户界面示出了工具条405,用于表示一个显示所述短笔记的所述全局文本实现430的窗口420的标题410,所述短笔记由所述用户或操作者通过应用所述全局实现语法来输入,如上所述。
图10示出了示例性的计算系统500,所述计算系统将短笔记或关键字转换为符号语义的语法文本或全局文本实现。如图10所示,所述计算系统500包括通过一个或多个通信链路580互连的输入/输出接口510、控制器520、存储器530、笔记/实现匹配电路、例程或应用540、GUI生成电路、例程或应用550、笔记/实现链路电路、例程或应用560和文本生成实现电路、例程或应用570。所述通信链路580可以是数据总线或任何其它的分配网络。类似地,所述存储器530可以是任何用于临时或无限期地储存数据、程序等等的结构性装置。
所述存储器530包括笔记部分531、局部文本实现部分532、文本实现部分533和匹配实现部分534。用户或操作者可以提供诸如短笔记的输入数据,或经由用户输入设备502作出选择,用户输入设备502经由所述输入/输出接口510与系统500通信。所述输入设备502可以是向计算机系统500提供电信号的任何类型的设备。所述计算机系统500可以向一个或多个输出设备504输出信号。所述计算机系统500例如可以访问数据源600或向数据接收器610发送数据。通常,所述数据接收器610可以是能够输出或存储所述产生的、处理的图像数据的任何设备。
一旦经由所述输入设备502输入短笔记,那么所述笔记就被存储在存储器530的笔记部分531。然后,所述控制器520能访问存储在所述笔记部分531的短笔记以便处理。由所述控制器520激活或执行所述GUI生成电路、例程或应用550来在输出设备504上显示所述短笔记,并且允许所述用户编辑该短笔记。各种其它电路、例程或应用也可用于所述系统500,诸如声音产生并识别电路、例程或应用。
由所述控制器520激活或执行所述笔记/实现匹配电路、例程或应用540来将存储在例如所述笔记部分531的所述短笔记与多个语义表示和/或存储在例如所述局部文本实现部分532中的局部文本实现相匹配。所述匹配实现部分534可以临时存储与每个短笔记相关联的局部文本实现和与每个局部文本实现相关联的等级。所述GUI生成电路、例程或应用550使所述控制器520为用户或操作者在输出设备504上显示所述短笔记、与每个短笔记相关联的局部文本实现以及全局文本实现。
所述笔记/实现链路、例程或应用560使所述控制器520处理所选择的局部文本实现,所述选择的局部文本实现是从操作者接收的,所述选择的局部文本实现由操作者通过所述用户输入设备502和输入输出接口510而输入。所述文本实现电路、例程或应用570使所述控制器520处理所选择的局部文本实现,以便提供全局文本实现,所述全局文本实现然后被存储在所述文本实现部分533中和/或显示在输出设备504上。
用于将诸如短笔记的输入数据转换为语义一致且符合语法的文本或全局文本实现的系统和方法,可以在能够实现在图2-5中示出的流程图的步骤的可编程的通用计算机或任何其它设备上实现。
尽管可以使用这种语义表示,但是所述系统和方法不因此而受限制。其它类型的语义表示也可以代替或添加到用于所描述的MDA系统中的所述语义表示。
局部文本实现可以存储在存储器或存储设备中,并且可以和各种语义表示联合。从而,所述短笔记或其它输入数据可以与可能的语义结构或表示相关联,以便产生所述全局文本实现。所述语义表示也可以存储在存储器或存储设备中。
一旦接收到输入数据,就可以执行模糊匹配过程,以便识别潜在的局部文本实现语句并且将所述潜在的局部文本实现与所述输入数据相关联。所述局部文本实现可以与语义结构相关联。可以使用各种技术来执行所述模糊匹配,所述技术诸如是引入到上面出版物中所讨论的那些。然而,所述模糊匹配过程并不局限于这种技术。所述模糊匹配过程可以考虑所述输入数据的同义词,输入数据文本和特定字或输入数据的缩写的情报或描述。当一个以上的局部文本实现可以与短笔记相关联时,可以对所述局部文本实现分出等级。
可以允许操作者或用户选择所想要的局部文本实现。例如,用户可以使用输入设备根据与短笔记相关联的局部文本实现的显示列表或菜单来选择局部文本实现。所述列表或菜单可以包括选择,所述选择允许所述用户输入他或她自己的局部文本实现。
可以基于所选择的局部文本实现的语义描述从所选择的局部文本实现产生全局文本实现。
Claims (5)
1.一种用于处理输入数据的方法,包括:
接收短笔记输入数据;
使用语义语法来产生语义结构;
根据所述语义结构用第一实现语法来生成多个局部文本实现;
将所述短笔记输入数据与多个局部文本实现中的一些相匹配以便定义最终的语义结构;并且
根据所述最终的语义结构用第二实现语法来生成全局文本实现。
2.一种用于处理输入数据的系统,包括:
输入设备,用于接收短笔记输入数据;
语义语法发生器,其使用语义语法来产生语义结构;
局部文本实现发生器,其根据所述语义结构用第一实现语法来生成多个局部文本实现;
处理器,其将所述短笔记输入数据与多个局部文本实现相匹配以便定义最终的语义结构;和
所述处理器根据所述最终的语义结构用第二实现语法来生成全局文本实现。
3.一种计算机程序产品,包括:
计算机可用介质,其中包含有用于将输入数据转换为全局文本实现的计算机可读程序代码,其中所述计算机可读指令包括:
用于使计算机接收输入数据的计算机可读程序代码;
用于使计算机根据所述输入数据产生全局文本实现的计算机可读程序代码;和
用于使计算机输出所述全局文本实现的计算机可读程序代码。
4.一种计算机程序产品,包括:
计算机可用介质,其中包含有用于将短笔记转换为全局文本实现的计算机可读程序代码,其中所述计算机可读指令包括:
用于使计算机在局部文本实现和短笔记之间执行模糊匹配以便提供与每个短笔记相关联的至少一个局部文本实现的计算机可读程序代码;和
用于使计算机根据由操作者选择的相关联的局部文本实现为每个短笔记产生全局文本实现的计算机可读程序代码。
5.一种用于将短笔记转换为全局文本实现的系统,包括:
用于输入短笔记的装置;
用于根据所述短笔记产生全局文本实现的装置;和
用于输出所述全局文本实现的装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/727614 | 2003-12-05 | ||
US10/727,614 US7383171B2 (en) | 2003-12-05 | 2003-12-05 | Semantic stenography using short note input data |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1624686A true CN1624686A (zh) | 2005-06-08 |
CN1624686B CN1624686B (zh) | 2010-04-28 |
Family
ID=34633517
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2004100980294A Expired - Fee Related CN1624686B (zh) | 2003-12-05 | 2004-12-03 | 用于语义速记的系统和方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7383171B2 (zh) |
JP (1) | JP4383328B2 (zh) |
CN (1) | CN1624686B (zh) |
BR (1) | BRPI0405386A (zh) |
CA (1) | CA2488961C (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114254158A (zh) * | 2022-02-25 | 2022-03-29 | 北京百度网讯科技有限公司 | 视频生成方法及其装置、神经网络的训练方法及其装置 |
WO2023124647A1 (zh) * | 2021-12-30 | 2023-07-06 | 安徽听见科技有限公司 | 一种纪要确定方法及其相关设备 |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070282813A1 (en) * | 2006-05-11 | 2007-12-06 | Yu Cao | Searching with Consideration of User Convenience |
US9043197B1 (en) * | 2006-07-14 | 2015-05-26 | Google Inc. | Extracting information from unstructured text using generalized extraction patterns |
US20080195371A1 (en) * | 2007-02-09 | 2008-08-14 | Brown Robert J | Apparatus and Method to Syncronously Decode a Stenographic Input into Two or More Different Language Streaming Text Outputs |
JP2008233990A (ja) * | 2007-03-16 | 2008-10-02 | Fuji Electric Systems Co Ltd | 入力画面処理装置、端末、および、コールセンター業務管理システム |
US8671096B2 (en) * | 2008-10-24 | 2014-03-11 | International Business Machines Corporation | Methods and apparatus for context-sensitive information retrieval based on interactive user notes |
US8260664B2 (en) * | 2010-02-05 | 2012-09-04 | Microsoft Corporation | Semantic advertising selection from lateral concepts and topics |
US8150859B2 (en) * | 2010-02-05 | 2012-04-03 | Microsoft Corporation | Semantic table of contents for search results |
US8903794B2 (en) * | 2010-02-05 | 2014-12-02 | Microsoft Corporation | Generating and presenting lateral concepts |
US8983989B2 (en) * | 2010-02-05 | 2015-03-17 | Microsoft Technology Licensing, Llc | Contextual queries |
US20110231395A1 (en) * | 2010-03-19 | 2011-09-22 | Microsoft Corporation | Presenting answers |
CN102918587B (zh) * | 2010-03-30 | 2014-11-05 | Nvoq股份有限公司 | 能够将听写代号短语转录成标准词组的分层快速注解 |
JP5156047B2 (ja) * | 2010-03-31 | 2013-03-06 | 株式会社東芝 | キーワード提示装置、方法及びプログラム |
US20180241848A1 (en) * | 2015-09-11 | 2018-08-23 | Hewlett Packard Enterprise Development Lp | Human-readable cloud structures |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4041467A (en) * | 1975-11-28 | 1977-08-09 | Xerox Corporation | Transcriber system for the automatic generation and editing of text from shorthand machine outlines |
US4632578A (en) * | 1981-04-03 | 1986-12-30 | Digitext, Inc. | Computerized printing system |
US4566065A (en) * | 1983-04-22 | 1986-01-21 | Kalman Toth | Computer aided stenographic system |
IE59659B1 (en) * | 1985-11-07 | 1994-03-09 | Digitext Inc | Stenographic translation system |
US4858170A (en) * | 1986-10-24 | 1989-08-15 | Dewick Sr Robert S | Shorthand notation and transcribing method |
NL8700410A (nl) * | 1987-02-19 | 1988-09-16 | Philips Nv | Tekstbewerkingsinrichting voor stenografisch typen. |
JPH063593B2 (ja) | 1987-10-23 | 1994-01-12 | 株式会社日立製作所 | 手書き速記文字変換装置 |
JPH02297188A (ja) * | 1989-03-14 | 1990-12-07 | Sharp Corp | 文書作成支援装置 |
JP2895184B2 (ja) * | 1990-08-22 | 1999-05-24 | 株式会社日立製作所 | 文書処理システム及び文書処理方法 |
US5477451A (en) * | 1991-07-25 | 1995-12-19 | International Business Machines Corp. | Method and system for natural language translation |
US5466072A (en) * | 1992-01-17 | 1995-11-14 | Stenograph Corporation | Method and apparatus for recording and translating shorthand notes |
WO1993022733A1 (en) | 1992-05-07 | 1993-11-11 | Yuen Henry C | Keyed language translator |
JPH05324702A (ja) * | 1992-05-20 | 1993-12-07 | Fuji Xerox Co Ltd | 情報処理装置 |
ES2101613B1 (es) * | 1993-02-02 | 1998-03-01 | Uribe Echebarria Diaz De Mendi | Metodo de traduccion automatica interlingual asistida por ordenador. |
US5523945A (en) * | 1993-09-17 | 1996-06-04 | Nec Corporation | Related information presentation method in document processing system |
WO1995017729A1 (en) | 1993-12-22 | 1995-06-29 | Taligent, Inc. | Input methods framework |
US6041292A (en) * | 1996-01-16 | 2000-03-21 | Jochim; Carol | Real time stenographic system utilizing vowel omission principle |
JPH09231224A (ja) * | 1996-02-26 | 1997-09-05 | Fuji Xerox Co Ltd | 言語情報処理装置 |
US5873107A (en) * | 1996-03-29 | 1999-02-16 | Apple Computer, Inc. | System for automatically retrieving information relevant to text being authored |
EP0841624A1 (en) * | 1996-11-08 | 1998-05-13 | Softmark Limited | Input and output communication in a data processing system |
US6091956A (en) * | 1997-06-12 | 2000-07-18 | Hollenberg; Dennis D. | Situation information system |
JPH11120487A (ja) * | 1997-10-21 | 1999-04-30 | Toyota Motor Corp | 移動体端末装置、情報提供装置、情報提供システム、情報提供方法及び移動体端末装置のためのプログラムを記録した媒体 |
US6345243B1 (en) * | 1998-05-27 | 2002-02-05 | Lionbridge Technologies, Inc. | System, method, and product for dynamically propagating translations in a translation-memory system |
CN1652107A (zh) * | 1998-06-04 | 2005-08-10 | 松下电器产业株式会社 | 语言变换规则产生装置、语言变换装置及程序记录媒体 |
GB2341052B (en) * | 1998-08-26 | 2003-05-14 | Nokia Mobile Phones Ltd | Wireless communication terminal |
US20020010574A1 (en) * | 2000-04-20 | 2002-01-24 | Valery Tsourikov | Natural language processing and query driven information retrieval |
US20020089470A1 (en) * | 2000-11-22 | 2002-07-11 | Mithila Raman | Real time internet transcript presentation system |
-
2003
- 2003-12-05 US US10/727,614 patent/US7383171B2/en active Active
-
2004
- 2004-11-29 CA CA2488961A patent/CA2488961C/en not_active Expired - Fee Related
- 2004-12-01 JP JP2004349073A patent/JP4383328B2/ja not_active Expired - Fee Related
- 2004-12-02 BR BR0405386-9A patent/BRPI0405386A/pt not_active IP Right Cessation
- 2004-12-03 CN CN2004100980294A patent/CN1624686B/zh not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023124647A1 (zh) * | 2021-12-30 | 2023-07-06 | 安徽听见科技有限公司 | 一种纪要确定方法及其相关设备 |
CN114254158A (zh) * | 2022-02-25 | 2022-03-29 | 北京百度网讯科技有限公司 | 视频生成方法及其装置、神经网络的训练方法及其装置 |
CN114254158B (zh) * | 2022-02-25 | 2022-06-10 | 北京百度网讯科技有限公司 | 视频生成方法及其装置、神经网络的训练方法及其装置 |
Also Published As
Publication number | Publication date |
---|---|
CA2488961A1 (en) | 2005-06-05 |
CA2488961C (en) | 2011-01-04 |
CN1624686B (zh) | 2010-04-28 |
US20050125219A1 (en) | 2005-06-09 |
JP2005174325A (ja) | 2005-06-30 |
US7383171B2 (en) | 2008-06-03 |
BRPI0405386A (pt) | 2005-08-30 |
JP4383328B2 (ja) | 2009-12-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Corpas Pastor | Technology solutions for interpreters: the VIP system | |
Schmidt | EXMARaLDA and the FOLK tools–two toolsets for transcribing and annotating spoken language | |
CN1624686A (zh) | 用于语义速记的系统和方法 | |
CN1886767A (zh) | 作文的评估和评分装置 | |
CN1788305A (zh) | 使用语义分析配置语音阅读器的系统和方法 | |
CN1423194A (zh) | 语法创建系统 | |
CN101065746A (zh) | 文件自动丰富的方法和系统 | |
CN1313972A (zh) | 自适应的自然语言接口 | |
Costa et al. | Assessing Terminology Management Systems for Interpreters. | |
CN111125145A (zh) | 一种通过自然语言获取数据库信息的自动化系统 | |
Corpas Pastor | Interpreting and technology: Is the sky really the limit? | |
EP3404555A1 (en) | Speech converter | |
Saggion et al. | Able to read my mail: An accessible e-mail client with assistive technology | |
Prillwitz et al. | DGS corpus project–development of a corpus based electronic dictionary German Sign Language/German | |
Asselborn et al. | Fine-tuning BERT Models on Demand for Information Systems Explained Using Training Data from Pre-modern Arabic. | |
CN1442787A (zh) | 作文修改写作系统 | |
Ahmad | People centered HMI’s for deaf and functionally illiterate users | |
CN1427966A (zh) | 表达概念的图像的编辑方法和设备 | |
CN1323003A (zh) | 盲人用的汉语智能计算机系统 | |
Falempin et al. | Human vs. Machine: The Future of Translation in an AI-Driven World | |
Potapova et al. | Deep polycode text annotation: to analytical translation method | |
CN119311903B (zh) | 对外汉语教学资源库构建方法及系统 | |
van Hessen et al. | A Multidisciplinary Approach To The Use Of Technology In Research: The Case Of Interview Data | |
Yeh et al. | Leveraging Automated POS Tagging to Decode Parent-Infant Interactions in Digital Gameplays | |
JP2024133453A (ja) | プログラム、コンピュータおよび情報処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20100428 Termination date: 20181203 |
|
CF01 | Termination of patent right due to non-payment of annual fee |