[go: up one dir, main page]

CN1798210B - 用于选择语音或dtmf接口或二者的混合的方法和系统 - Google Patents

用于选择语音或dtmf接口或二者的混合的方法和系统 Download PDF

Info

Publication number
CN1798210B
CN1798210B CN2005101283704A CN200510128370A CN1798210B CN 1798210 B CN1798210 B CN 1798210B CN 2005101283704 A CN2005101283704 A CN 2005101283704A CN 200510128370 A CN200510128370 A CN 200510128370A CN 1798210 B CN1798210 B CN 1798210B
Authority
CN
China
Prior art keywords
dtmf
interface
type
speech
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2005101283704A
Other languages
English (en)
Other versions
CN1798210A (zh
Inventor
C·阿加皮
F·戈梅斯
J·R·刘易斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US11/026,720 external-priority patent/US7356130B2/en
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1798210A publication Critical patent/CN1798210A/zh
Application granted granted Critical
Publication of CN1798210B publication Critical patent/CN1798210B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

一种混合设计的向导能够创建各种音频接口。所生成的接口可以是仅语音、仅DTMF、或各种混合的语音和DTMF UI。当指定语音和DTMF提示时,可以自动地生成这些接口的多种组合。可以通过自动生成“影子”DTMF应用来构建强健的语音识别系统。该DTMF应用将执行与基本的语音应用相同的任务;但是,到DTMF应用的转换可以由用户显式地完成,或者可以在调用流中语音识别存在问题的点上自动地转换(暂时的或永久的转换)。

Description

用于选择语音或DTMF接口或二者的混合的方法和系统
技术领域
本发明涉及计算机系统的能够响应例如语音或按键式电话的音频输入的用户接口领域。
背景技术
传统上,音频接口是由程序设计人员手动构造的,且应用的“声音感觉”在设计时即被固定了。利用音频用户接口的自动代码生成向导,可以生成用于两个最通用的音频用户接口(仅DTMF或仅语音应用)的代码。尽管这大大增进了音频应用的快速开发,然而目前还没有生成混合接口(DTMF和语音)应用的向导。可以通过在合适的时间使用两个接口以各种方式来设计混合接口应用。采用语音和DTMF(双音多频)输入的混合的设计,即按键式电话接口所使用的系统,能够解决在单独的DTMF或语音用户接口时不易处理的问题。例如,当存在语音识别响应的问题时,允许对DTMF的接口,或者设计该问题以通过切换到DTMF而自动对该识别问题作出反应会是有利的。因此,需要提供一种方法和系统来为交互式语音响应系统的开发者提供从单个高级应用调用流设计中简单地启用语音或DTMF或二者的混合的能力,如下面将要详细解释的那样。
发明内容
本发明解决关于交互式语音应用中的管理事件的技术缺陷,提供一种新颖的且非显而易见的用于为音频交互系统预选语音、DTMF或混合的接口类型的方法、系统以及装置。具体地,根据本发明的原理,可以通过向导向用户(例如应用开发者)呈现接口,允许该用户在多种类型中进行选择,其中所选中的类型响应用户所确定的需求。特别是,用户可以选择特定的类型、修改所选中的类型、和/或选择不同的类型,以满足用户对于特定的交互式音频应用环境的需要。
本发明提供一种定义标准语音/DTMF混合用户接口类型的方法,该混合用户接口类型在生成用于在应用中管理该用户接口(UI)呈现的语音应用代码时使用,该应用能够支持语音识别和DTMF(按键式)电话键入,该方法包括步骤:呈现允许一个或多个UI类型的选择的语音/DTMF类型选择菜单,每一UI类型对应于对代码生成请求的系统响应;以及一旦选择UI类型时,为代码生成请求准备系统响应。
根据本发明的方法提供一种能够创建各种音频接口的混合设计的向导。所生成的接口可以是仅语音、仅DTMF、或各种混合的语音和DTMF用户接口。并且包括,用于给定来自于类型选择向导面板的类型的选择,从同一源信息自动地生成这些不同接口类型的手段。
在另一方面,本发明提供一种计算机可读存储介质,其存储计算机程序,当该程序被执行时定义用于交互式音频事件中的类型。该类型通过呈现允许一个或多个类型的选择的类型选择菜单来定义。每一类型对应于系统或用户输入。一旦选择类型时,为代码生成请求准备系统响应。
本发明的其他方面将部分地在下面的说明中阐述,部分地将从该说明中显而易见,或可以通过对本发明的实践来获知。本发明的这些方面都将通过在所附权利要求中具体指出的元素和组合来实现及达到。应该理解的是,上面的概要描述和下面的详细描述仅是示例性和解释性的,而并不是对所要求保护的本发明的限制。
附图说明
结合在本说明书中并构成本说明书的一部分的附图例示了本发明的实施例,并与描述一起用于解释本发明的原理。这里所例示的实施例是当前优选的,然而,应该理解,本发明并不局限于所示出的确切排布,其中:
图1是根据本发明的表示仅DTMF选择的时间图;
图2是根据本发明的表示仅语音选择的时间图;
图3是根据本发明的时间图,其中最初系统响应语音,当出现问题时转换到DTMF,当问题消除时返回到语音;
图4是根据本发明的表示一应用的时间图,在该应用中最初使用语音识别,响应语音识别问题被永久地变换到DTMF;
图5是示出本发明的类型选择接口的计算机屏幕。
具体实施方式
本发明是一种系统和方法,当指定语音和DTMF提示时,用于可自动生成的这些接口的多种组合。强健的语音识别系统能够通过自动生成“影子”DTMF应用来构建。该DTMF应用将执行与基本的语音应用相同的任务;然而,到DTMF应用的转换可以由用户显式地完成,或者可以在调用流中语音识别存在问题的点上自动地转换。
下面的例子由图1所示的时间图所表示。
例1:显式的切换,用于选择一个仅DTMF接口。
在该应用的开始可向用户提供显式的“切换”,以显式地切换到一个DTMF接口。
系统:欢迎来到我们的自动<应用名称>系统。以DTMF模式继续本应用,按1。否则等待下一提示。
用户:(按下键“1”)。
系统:需要气象信息,按1。需要新闻,按2。需要娱乐,按3。
在这一选择之后,所有与该系统的用户交互将以DTMF模式继续。当被绘制在时间图上时,该系统行为(用户交互)看起来将如图1所示的那样。
下面的例子由图2所示的时间图表示。
例2:显式的切换,用于选择一个仅语音接口。
在该应用的开始可向用户提供显式的“切换”,以利用语音接口继续。
系统:欢迎来到我们的自动<应用名称>系统。以DTMF模式继续本应用,按1。否则等待下一提示。
用户:(等待)
系统:需要气象信息,请说气象。需要新闻信息,请说新闻。需要电影和音乐,请说娱乐。
在这一选择之后,与该系统的所有用户交互将以语音模式继续。当被绘制在时间图上时,该系统行为(用户交互)看起来将如图2所示的那样。
下面的例子由图3所示的时间图表示。
例3:依赖于语音响应性能的DTMF与语音之间的隐式混合接口交替。如果在设计时,作出了可能会出现噪音干扰但是噪音源将很快消失的假设,出错恢复可能求助于DTMF,但是然后又恢复到语音。可以提供当存在语音接口的临时问题(过度地无输入或者是不匹配事件)时,将自动暴露DTMF接口的隐式“切换”(建立到不同接口的切换的规则-例如第二个不匹配)。
系统:欢迎来到我们的自动<应用名称>系统。以DTMF模式继续本应用,按1。否则等待下一提示。
用户:(等待)
系统:需要气象信息,请说气象。需要新闻信息,请说新闻。需要电影和音乐,请说娱乐。
用户:气象
系统:对不起,不能听到您说的内容。
用户:气象
系统:听不清;请重复您的内容。
用户:气象
系统:需要气象信息,按1。需要新闻,按2。需要娱乐,按3。
用户:(按键“1”)
系统:博卡拉顿的天气是......
系统:需要气象信息,请说气象。需要新闻信息,请说新闻。需要电影和音乐,请说娱乐。
用户:新闻
系统:九月二日,星期二的头条是......
与该系统的所有用户交互以语音模式启动,但是当需要时将求助于DTMF模式。当被绘制在时间图上时,该系统行为(用户交互)看起来如图3所示的那样。
下面的例子由图4所示的时间图表示。
例4:如果设计假设是语音作为所期望的接口,但是如果环境嘈杂则可能保持这样,即提供当语音接口存在问题时将自动暴露DTMF接口并且所有接下来的提示将以DTMF来呈现的“切换”(实际上,到DTMF UI的切换)。
系统:欢迎来到我们的自动<应用名称>系统。以DTMF模式继续本应用,按1。否则等待下一提示。
用户:(等待)
系统:需要气象信息,请说气象。需要新闻信息,请说新闻。需要电影和音乐,请说娱乐。
用户:气象
系统:对不起,不能听到您说的内容。
用户:气象
系统:听不清;请重复您的内容。
用户:气象
系统:需要气象信息,按1。需要新闻,按2。需要娱乐,按3。
用户:(按键“1”)
系统:博卡拉顿的天气是......
系统:需要气象信息,按1。需要新闻,按2。需要娱乐,按3。
用户:(按键“2”)
系统:九月二日,星期二的头条是......
与该系统的所有用户交互以语音模式启动,但是如果语音识别力低则将永久后退到DTMF接口。当被绘制在时间图上时,该系统行为(用户交互)看起来如图4所示的那样。
图5是示出本发明的类型选择接口的计算机屏幕。应该指出,在自动代码生成引擎中,可以在设计时选择交互类型。
本发明能以硬件、软件、或软硬件的结合来实现。本发明的方法和系统的实现能以集中式方式在一个计算机系统中实现,或以其中不同的组件分布在几个互连的计算机系统上的分布式方式来实现。任何类型的计算机系统,或适合于执行本文描述的方法的其他装置,都适于执行本文所描述的功能。
硬件与软件的典型组合可以是通用计算机系统,其具有中央处理单元和存储在存储介质中的计算机程序,当该程序被加载和执行时,其控制该计算机系统以便它执行本文所描述的方法。本发明也能嵌入在计算机程序产品中,该程序产品包括能够实现本文所描述的方法的所有特征,当该计算机程序被装入到计算机系统中时能够执行这些方法。存储媒介指任何易失性或非易失性存储设备。
本文中的计算机程序或应用意指一组指令以任何语言、代码或符号的任何表达,该组指令旨在使具有信息处理能力的系统执行特定的功能,此执行是直接地或在下面两个中的一个或二者全部之后进行的,a)转换为另一语言、代码或符号;b)以不同的材料形式再现。重要的是,在不背离本发明的精神或本质属性的情况下,本发明可以其他特定的形式来实现,因此,应当参考所附权利要求而不是前面的说明书,作为本发明范围的指示。

Claims (10)

1.一种定义标准语音/DTMF混合用户接口类型的方法,该混合用户接口类型在生成用于在应用中管理该用户接口(UI)呈现的语音应用代码时使用,该应用可以支持语音识别和DTMF电话键入,该方法包括步骤:
呈现允许一个或多个UI类型的选择的类型选择菜单,每一UI类型对应于对代码生成请求的系统响应;以及
一旦选择UI类型时,为代码生成请求准备上述系统响应;
其中,上述一个或多个UI类型中包括混合的语音和DTMF接口类型,该混合的语音和DTMF接口类型允许在检测到语音识别中存在的问题时,从语音接口模式自动切换到DTMF接口模式。
2.如权利要求1的方法,其中上述一个或多个UI类型中还包括仅DTMF接口类型。
3.如权利要求1的方法,其中上述一个或多个UI类型中还包括仅语音接口类型。
4.如权利要求1的方法,其中在上述混合的语音和DTMF接口类型中,用DTMF接口模式临时替换语音接口模式,并在语音识别中存在的问题消除时,从DTMF接口模式切换到语音接口模式。
5.如权利要求1的方法,其中在上述混合的语音和DTMF接口类型中,用DTMF接口模式永久替换语音接口模式。
6.一种用于管理标准语音/DTMF混合用户接口类型的系统,该系统包括计算机,该计算机包括允许一个或多个UI类型的选择的类型选择菜单,每一UI类型对应于对代码生成请求的系统响应;
其中,上述一个或多个UI类型中包括混合的语音和DTMF接口类型,该混合的语音和DTMF接口类型允许在检测到语音识别中存在的问题时,从语音接口模式自动切换到DTMF接口模式。
7.如权利要求6的系统,其中上述一个或多个UI类型中还包括仅DTMF接口类型。
8.如权利要求6的系统,其中上述一个或多个UI类型中还包括仅语音接口类型。
9.如权利要求6的系统,其中在上述混合的语音和DTMF接口类型中,用DTMF接口模式临时替换语音接口模式,并在语音识别中存在的问题消除时,从DTMF接口模式切换到语音接口模式。
10.如权利要求6的系统,其中在上述混合的语音和DTMF接口类型中,用DTMF接口模式永久替换语音接口模式。
CN2005101283704A 2004-12-30 2005-11-14 用于选择语音或dtmf接口或二者的混合的方法和系统 Expired - Fee Related CN1798210B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/026,720 US7356130B2 (en) 2001-10-11 2004-12-30 Method and system for selecting speech or DTMF interfaces or a mixture of both
US11/026,720 2004-12-30

Publications (2)

Publication Number Publication Date
CN1798210A CN1798210A (zh) 2006-07-05
CN1798210B true CN1798210B (zh) 2010-08-11

Family

ID=36818955

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2005101283704A Expired - Fee Related CN1798210B (zh) 2004-12-30 2005-11-14 用于选择语音或dtmf接口或二者的混合的方法和系统

Country Status (1)

Country Link
CN (1) CN1798210B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7912186B2 (en) 2004-10-20 2011-03-22 Microsoft Corporation Selectable state machine user interface system
US7551727B2 (en) 2004-10-20 2009-06-23 Microsoft Corporation Unified messaging architecture
CN101052066B (zh) * 2007-05-22 2011-11-09 杭州华三通信技术有限公司 提示音的测试方法、语音服务器及提示音测试装置
CN102375667B (zh) * 2010-08-24 2015-11-25 腾讯科技(深圳)有限公司 定位输入焦点的方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1193857A (zh) * 1997-03-05 1998-09-23 美国电报电话公司 电信自动服务准备方法
US6058166A (en) * 1997-10-06 2000-05-02 Unisys Corporation Enhanced multi-lingual prompt management in a voice messaging system with support for speech recognition
US6173266B1 (en) * 1997-05-06 2001-01-09 Speechworks International, Inc. System and method for developing interactive speech applications
CN1379947A (zh) * 1999-10-14 2002-11-13 艾利森公司 运用本地语音识别传输dtmf信号的方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1193857A (zh) * 1997-03-05 1998-09-23 美国电报电话公司 电信自动服务准备方法
US6173266B1 (en) * 1997-05-06 2001-01-09 Speechworks International, Inc. System and method for developing interactive speech applications
US6058166A (en) * 1997-10-06 2000-05-02 Unisys Corporation Enhanced multi-lingual prompt management in a voice messaging system with support for speech recognition
CN1379947A (zh) * 1999-10-14 2002-11-13 艾利森公司 运用本地语音识别传输dtmf信号的方法及装置

Also Published As

Publication number Publication date
CN1798210A (zh) 2006-07-05

Similar Documents

Publication Publication Date Title
US7356130B2 (en) Method and system for selecting speech or DTMF interfaces or a mixture of both
CN101557432B (zh) 移动终端及其菜单控制方法
TWI298844B (en) User-defines speech-controlled shortcut module and method
US6034687A (en) Graphical interface for a computer hardware resource having a surrealistic image of a real office machine
JP5249755B2 (ja) セマンティックリッチオブジェクトによる動的なユーザエクスペリエンス
RU2412463C2 (ru) Терминал мобильной связи и способ управления его меню
EP0618710A2 (en) Method of voice activated telephone dialing
CN101605171A (zh) 移动终端及其中的文本校正方法
EP1836564A1 (en) User interface with augmented searching characteristics
US20060047509A1 (en) Eliminating interference of noisy modality in a multimodal application
JPH0736661A (ja) 音声データ処理装置および操作方法
WO2007095504A1 (en) Improved user-interface and architecture portable processing device
CN101184287A (zh) 一种在终端上生成快捷键的方法及终端
Halstead-Nussloch The design of phone-based interfaces for consumers
CN110943908A (zh) 语音消息发送方法、电子设备及介质
CN109275005A (zh) 一种组合按键遥控方法、装置、设备和存储介质
CN1798210B (zh) 用于选择语音或dtmf接口或二者的混合的方法和系统
CN101834925A (zh) 一种终端按键功能设置方法和系统
CN1936848A (zh) 应用程序切换方法及系统
EP1026871B1 (en) Interactive voice response system with general-purpose blocks
CN101778487A (zh) 移动通信终端开机自动启动指定功能的方法
Hornstein Telephone voice interfaces on the cheap
Gamm et al. Findings with the design of a command-based speech interface for a voice mail system
Berti et al. Model-based design of speech interfaces
CN1216363C (zh) 一种状态转换的实现方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100811

Termination date: 20181114

CF01 Termination of patent right due to non-payment of annual fee