KR101255856B1 - 통합형 음성 대화 시스템 - Google Patents
통합형 음성 대화 시스템 Download PDFInfo
- Publication number
- KR101255856B1 KR101255856B1 KR1020060073655A KR20060073655A KR101255856B1 KR 101255856 B1 KR101255856 B1 KR 101255856B1 KR 1020060073655 A KR1020060073655 A KR 1020060073655A KR 20060073655 A KR20060073655 A KR 20060073655A KR 101255856 B1 KR101255856 B1 KR 101255856B1
- Authority
- KR
- South Korea
- Prior art keywords
- voice
- voice conversation
- service components
- speech
- customer
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2203/00—Aspects of automatic or semi-automatic exchanges
- H04M2203/35—Aspects of automatic or semi-automatic exchanges related to information services provided via a voice call
- H04M2203/355—Interactive dialogue design tools, features or methods
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Stored Programmes (AREA)
- Telephonic Communication Services (AREA)
Abstract
Description
Claims (16)
- 음성 대화 시스템을 제어하는 음성 애플리케이션 관리자;음성을 인식하도록 구성된 음석 인식 수단과, 커스터머 서비스를 메시지 라우터에 접속하도록 구성된 커스터머 프로그래머의 인터페이스를 포함하는 상기 음성 대화 시스템의 2 개 이상의 서비스 컴포넌트;상기 2 개 이상의 서비스 컴포넌트 사이에서 서로 그리고 상기 2 개 이상의 서비스 컴포넌트와 상기 음성 애플리케이션 관리자 사이에서 데이터를 교환하는 메시지 라우터; 및상기 음성 대화 시스템을 하드웨어 플랫폼과 작동 시스템 및 하나 이상의 장치 드라이버에 접속하는 플랫폼 추상화(abstraction) 계층을 구비하는 음성 대화 시스템.
- 제 1 항에 있어서, 상기 메시지 라우터는 데이터를 교환하기 위하여 하나의 일반적인 단일 통신 포맷을 이용하는 것인 음성 대화 시스템.
- 제 1 항 또는 제 2 항에 있어서, 상기 2 개 이상의 서비스 컴포넌트는 커스터머 프로그래머의 인터페이스, 보이스 검출 수단, 보이스 프롬프팅 수단, 텍스트 합성 수단, 보이스 리코더, 철자 확인회로(matcher), 구성 데이터베이스, 디버깅 수단 및 대화 관리자 중 하나 이상을 포함하는 것인 음성 대화 시스템.
- 제 1 항 또는 제 2 항에 있어서, 음성 대화를 개발하기 위한 개발(development) 환경을 더 포함하는 것인 음성 대화 시스템.
- 제 4 항에 있어서, 상기 개발 환경은 그래픽 사용자 인터페이스를 포함하는 것인 음성 대화 시스템.
- 제 1 항 또는 제 2 항에 있어서, 상기 음성 대화 시스템에 의해 실제로 작동 또는 제어되거나 또는 작동 또는 제어되도록 계획된 애플리케이션들 및 장치들 중 하나 이상을 시뮬레이션하기 위한 시뮬레이션 환경을 더 포함하는 것인 음성 대화 시스템
- 제 1 항 또는 제 2 항에 있어서, 하나 이상의 애플리케이션 수단을 더 포함하는 것인 음성 대화 시스템.
- 삭제
- 음성을 인식하도록 구성된 음성 인식 수단과 커스터머 프로그래머의 인터페이스를 포함하는 서비스 컴포넌트들을 구비하는 음성 대화 시스템의 작동 방법으로서,상기 음성 대화 시스템을 음성 애플리케이션 관리자에 의해 제어하는 단계;메시지 라우터에 의해, 상기 서비스 컴포넌트들 사이에서, 그리고 상기 서비스 컴포넌트들과 상기 음성 애플리케이션 관리자 사이에서 데이터를 교환하는 단계;플랫폼 추상화 계층에 의해 상기 음성 대화 시스템을 하드웨어 플랫폼과 작동 시스템 및 하나 이상의 장치 드라이버에 접속하는 단계; 및상기 메시지 라우터에 의해 채용된 데이터 포맷을 커스터머 시스템 애플리케이션에 매핑함으로써, 상기 커스터머 프로그래머의 인터페이스에 의해 커스터머 서비스를 상기 음성 대화 시스템의 상기 메시지 라우터에 접속하는 단계를 포함하는 음성 대화 시스템의 작동 방법.
- 제 9 항에 있어서, 상기 메시지 라우터에 의해 교환되는 데이터는 하나의 일반적인 단일 통신 포맷으로 포맷화되는 것인 음성 대화 시스템의 작동 방법.
- 제 9 항 또는 제 10 항에 있어서,음성 신호를 검출 및 처리하는 단계;상기 처리된 음성 신호의 분석에 기초하여 출력 데이터를 생성하는 단계; 및상기 출력 데이터를 애플리케이션 수단에 라우팅하여 애플리케이션을 실행하는 단계를 더 포함하며,상기 라우팅은 상기 플랫폼 추상화 계층에 의해 조정되는 것인 음성 대화 시스템의 작동 방법.
- 제 11 항에 있어서, 상기 음성 신호의 처리는, 상기 음성 신호를 피쳐(feature) 벡터로 변환하는 단계, 음성 인식단계, 철자 확인단계 및 음성 리코딩 단계 중 하나 이상을 포함하는 것인 음성 대화 시스템의 작동 방법.
- 제 11 항에 있어서, 상기 출력 데이터는 상기 음성 대화 시스템에 의해 출력되는 하나 이상의 합성된 음성 신호를 포함하는 것인 음성 대화 시스템의 작동 방법.
- 제 9 항 또는 제 10 항에 있어서, 상기 서비스 컴포넌트들 중 하나를 나타내는 개발 환경을 이용하여 음성 대화를 개발하는 단계를 더 포함하는 것인 음성 대화 시스템의 작동 방법.
- 제 9 항 또는 제 10 항에 있어서, 상기 서비스 컴포넌트들 중 하나를 나타내는 시뮬레이션 환경을 이용하여 상기 음성 대화 시스템에 의해 실제로 동작 또는 제어되거나 또는 동작 또는 제어되도록 계획되는 애플리케이션들 및 장치들 중 하나 이상을 시뮬레이션하는 단계를 더 포함하는 것인 음성 대화 시스템의 작동 방법.
- 제 9 항 또는 제 10 항에 기재된 음성 대화 시스템의 작동 방법의 단계들을 수행하기 위한 컴퓨터 실행가능한 명령들을 가지는 하나 이상의 컴퓨터 판독가능한 매체를 포함하는 컴퓨터 프로그램 제품.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP05016999.4 | 2005-08-04 | ||
EP05016999A EP1750253B1 (en) | 2005-08-04 | 2005-08-04 | Speech dialog system |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20070017050A KR20070017050A (ko) | 2007-02-08 |
KR101255856B1 true KR101255856B1 (ko) | 2013-04-17 |
Family
ID=35457598
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020060073655A KR101255856B1 (ko) | 2005-08-04 | 2006-08-04 | 통합형 음성 대화 시스템 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20070156407A1 (ko) |
EP (1) | EP1750253B1 (ko) |
JP (1) | JP2007041585A (ko) |
KR (1) | KR101255856B1 (ko) |
CN (1) | CN1909063A (ko) |
AT (1) | ATE550756T1 (ko) |
CA (1) | CA2551589A1 (ko) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8732236B2 (en) * | 2008-12-05 | 2014-05-20 | Social Communications Company | Managing network communications between network nodes and stream transport protocol |
KR20130010911A (ko) * | 2008-12-05 | 2013-01-29 | 소우셜 커뮤니케이션즈 컴퍼니 | 실시간 커널 |
US9045098B2 (en) * | 2009-12-01 | 2015-06-02 | Honda Motor Co., Ltd. | Vocabulary dictionary recompile for in-vehicle audio system |
US11416214B2 (en) | 2009-12-23 | 2022-08-16 | Google Llc | Multi-modal input on an electronic device |
EP4318463A3 (en) * | 2009-12-23 | 2024-02-28 | Google LLC | Multi-modal input on an electronic device |
WO2012118917A2 (en) | 2011-03-03 | 2012-09-07 | Social Communications Company | Realtime communications and network browsing client |
DE102014109122A1 (de) * | 2013-07-12 | 2015-01-15 | Gm Global Technology Operations, Llc | Systeme und Verfahren für ergebnisbezogene Arbitrierung in Sprachdialogsystemen |
US9715878B2 (en) | 2013-07-12 | 2017-07-25 | GM Global Technology Operations LLC | Systems and methods for result arbitration in spoken dialog systems |
US9767803B1 (en) | 2013-12-16 | 2017-09-19 | Aftershock Services, Inc. | Dynamically selecting speech functionality on client devices |
US10338959B2 (en) | 2015-07-13 | 2019-07-02 | Microsoft Technology Licensing, Llc | Task state tracking in systems and services |
US20170147286A1 (en) * | 2015-11-20 | 2017-05-25 | GM Global Technology Operations LLC | Methods and systems for interfacing a speech dialog with new applications |
US10635281B2 (en) | 2016-02-12 | 2020-04-28 | Microsoft Technology Licensing, Llc | Natural language task completion platform authoring for third party experiences |
CN108604179A (zh) | 2016-05-10 | 2018-09-28 | 谷歌有限责任公司 | 设备上语音助理的实现 |
CN112947683B (zh) | 2016-05-13 | 2024-08-09 | 谷歌有限责任公司 | 媒体输出设备之间的媒体传送 |
US10552543B2 (en) * | 2017-05-10 | 2020-02-04 | International Business Machines Corporation | Conversational authoring of event processing applications |
CN108320738B (zh) * | 2017-12-18 | 2021-03-02 | 上海科大讯飞信息科技有限公司 | 语音数据处理方法及装置、存储介质、电子设备 |
CN110704070B (zh) * | 2019-09-30 | 2021-04-13 | 北京航空航天大学 | 一种分区实时操作系统下dds通信中间件的构建方法 |
CN113704418A (zh) * | 2020-05-06 | 2021-11-26 | 阿里巴巴集团控股有限公司 | 客服机器人系统、相关方法、装置及设备 |
CN112468402A (zh) * | 2020-11-25 | 2021-03-09 | 广东铱路科技有限公司 | 语音控制智能路由器 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0798649A (ja) * | 1993-06-14 | 1995-04-11 | Internatl Business Mach Corp <Ibm> | 固定オブジェクト記憶システム |
US20030007609A1 (en) | 2001-07-03 | 2003-01-09 | Yuen Michael S. | Method and apparatus for development, deployment, and maintenance of a voice software application for distribution to one or more consumers |
US20030088421A1 (en) * | 2001-06-25 | 2003-05-08 | International Business Machines Corporation | Universal IP-based and scalable architectures across conversational applications using web services for speech and audio processing resources |
WO2005015546A1 (en) * | 2003-08-12 | 2005-02-17 | Philips Intellectual Property & Standards Gmbh | Speech input interface for dialog systems |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19533541C1 (de) * | 1995-09-11 | 1997-03-27 | Daimler Benz Aerospace Ag | Verfahren zur automatischen Steuerung eines oder mehrerer Geräte durch Sprachkommandos oder per Sprachdialog im Echtzeitbetrieb und Vorrichtung zum Ausführen des Verfahrens |
US7085710B1 (en) * | 1998-01-07 | 2006-08-01 | Microsoft Corporation | Vehicle computer system audio entertainment system |
DE19909157A1 (de) * | 1999-03-02 | 2000-09-21 | Daimler Chrysler Ag | Verteiltes Fahrzeuginformationsverarbeitungs- und Fahrzeugsteuersystem |
US6314402B1 (en) * | 1999-04-23 | 2001-11-06 | Nuance Communications | Method and apparatus for creating modifiable and combinable speech objects for acquiring information from a speaker in an interactive voice response system |
JP3737662B2 (ja) * | 1999-12-03 | 2006-01-18 | 富士通株式会社 | システムlsiのテストデータ最適化生成方式 |
WO2001050453A2 (en) * | 2000-01-04 | 2001-07-12 | Heyanita, Inc. | Interactive voice response system |
US6839748B1 (en) * | 2000-04-21 | 2005-01-04 | Sun Microsystems, Inc. | Synchronous task scheduler for corba gateway |
US7017175B2 (en) * | 2001-02-02 | 2006-03-21 | Opentv, Inc. | Digital television application protocol for interactive television |
US20050080628A1 (en) * | 2003-10-10 | 2005-04-14 | Metaphor Solutions, Inc. | System, method, and programming language for developing and running dialogs between a user and a virtual agent |
EP1562180B1 (en) * | 2004-02-06 | 2015-04-01 | Nuance Communications, Inc. | Speech dialogue system and method for controlling an electronic device |
-
2005
- 2005-08-04 AT AT05016999T patent/ATE550756T1/de active
- 2005-08-04 EP EP05016999A patent/EP1750253B1/en not_active Not-in-force
-
2006
- 2006-07-07 CA CA002551589A patent/CA2551589A1/en not_active Abandoned
- 2006-07-18 JP JP2006195647A patent/JP2007041585A/ja active Pending
- 2006-07-27 CN CNA2006101078795A patent/CN1909063A/zh active Pending
- 2006-08-03 US US11/499,139 patent/US20070156407A1/en not_active Abandoned
- 2006-08-04 KR KR1020060073655A patent/KR101255856B1/ko active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0798649A (ja) * | 1993-06-14 | 1995-04-11 | Internatl Business Mach Corp <Ibm> | 固定オブジェクト記憶システム |
US20030088421A1 (en) * | 2001-06-25 | 2003-05-08 | International Business Machines Corporation | Universal IP-based and scalable architectures across conversational applications using web services for speech and audio processing resources |
US20030007609A1 (en) | 2001-07-03 | 2003-01-09 | Yuen Michael S. | Method and apparatus for development, deployment, and maintenance of a voice software application for distribution to one or more consumers |
WO2005015546A1 (en) * | 2003-08-12 | 2005-02-17 | Philips Intellectual Property & Standards Gmbh | Speech input interface for dialog systems |
Also Published As
Publication number | Publication date |
---|---|
KR20070017050A (ko) | 2007-02-08 |
JP2007041585A (ja) | 2007-02-15 |
ATE550756T1 (de) | 2012-04-15 |
EP1750253A1 (en) | 2007-02-07 |
EP1750253B1 (en) | 2012-03-21 |
US20070156407A1 (en) | 2007-07-05 |
CA2551589A1 (en) | 2007-02-04 |
CN1909063A (zh) | 2007-02-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101255856B1 (ko) | 통합형 음성 대화 시스템 | |
Becchetti et al. | Speech recognition: Theory and C++ implementation (with CD) | |
US8463608B2 (en) | Interactive speech recognition model | |
EP1794747B1 (en) | Interactive conversational dialogue for cognitively overloaded device users | |
US20110191107A1 (en) | Structure for Grammar and Dictionary Representation in Voice Recognition and Method for Simplifying Link and Node-Generated Grammars | |
US20030154080A1 (en) | Method and apparatus for modification of audio input to a data processing system | |
CN108550363A (zh) | 语音合成方法及装置、计算机设备及可读介质 | |
CN113380221A (zh) | 中英文混合的语音合成方法、装置、电子设备和存储介质 | |
KR101130351B1 (ko) | 영숫자 개념용 음성 인식 문법 생성 | |
KR20160112202A (ko) | 악기 연주 로봇 통합 제어 장치 | |
KR20100081534A (ko) | 다중언어의 대화시스템 및 그 제어방법 | |
LuperFoy et al. | An architecture for dialogue management, context tracking, and pragmatic adaptation in spoken dialogue systems | |
CN101253547B (zh) | 语音对话方法和系统 | |
CN109524000A (zh) | 离线对话实现方法和装置 | |
KR20000005278A (ko) | 자동 음성인식 방법 및 장치_ | |
CN112786010A (zh) | 语音合成系统、方法及非暂态计算机可读取媒体 | |
Bub et al. | The Verbmobil prototype system–a software engineering perspective | |
KR102663162B1 (ko) | 음성 합성 방법 및 시스템 | |
Melin | ATLAS: A generic software platform for speech technology based applications | |
JP2003016062A (ja) | 言語の意味解析方法 | |
Bressoud et al. | Personal Voice Dialing over PC | |
Zheng | Spokane: Integrating speech technology into gaming domain | |
CN113889112A (zh) | 一种基于kaldi的在线语音识别的方法 | |
CN116631390A (zh) | 对话系统和对话单元 | |
Cerňak et al. | Command speech interface to virtual reality applications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20060804 |
|
PG1501 | Laying open of application | ||
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20110729 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20060804 Comment text: Patent Application |
|
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20120828 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20130325 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20130411 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20130411 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
FPAY | Annual fee payment |
Payment date: 20160318 Year of fee payment: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20160318 Start annual number: 4 End annual number: 4 |
|
FPAY | Annual fee payment |
Payment date: 20170405 Year of fee payment: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20170405 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20180330 Start annual number: 6 End annual number: 6 |
|
FPAY | Annual fee payment |
Payment date: 20190409 Year of fee payment: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20190409 Start annual number: 7 End annual number: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20200327 Start annual number: 8 End annual number: 8 |