[go: up one dir, main page]

RU2011121296A - Способ и система для предоставления речевого интерфейса - Google Patents

Способ и система для предоставления речевого интерфейса Download PDF

Info

Publication number
RU2011121296A
RU2011121296A RU2011121296/08A RU2011121296A RU2011121296A RU 2011121296 A RU2011121296 A RU 2011121296A RU 2011121296/08 A RU2011121296/08 A RU 2011121296/08A RU 2011121296 A RU2011121296 A RU 2011121296A RU 2011121296 A RU2011121296 A RU 2011121296A
Authority
RU
Russia
Prior art keywords
domain
request
voice interface
attribute
specified
Prior art date
Application number
RU2011121296/08A
Other languages
English (en)
Other versions
RU2494476C2 (ru
Inventor
Марк Адлер
Имре КИШШ
Джозеф ПОЛИФРОНИ
Тао Ву
Original Assignee
Нокиа Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Нокиа Корпорейшн filed Critical Нокиа Корпорейшн
Publication of RU2011121296A publication Critical patent/RU2011121296A/ru
Application granted granted Critical
Publication of RU2494476C2 publication Critical patent/RU2494476C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/027Concept to speech synthesisers; Generation of natural phrases from machine-based concepts
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • User Interface Of Digital Computer (AREA)
  • Telephonic Communication Services (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

1. Способ, включающий:прием запроса;анализ запроса для идентификации атрибута;обработку запроса для выбора первого зависящего от домена речевого интерфейса из множества зависящих от домена речевых интерфейсов на основе указанного атрибута, при этом каждый из зависящих от домена речевых интерфейсов содержит специфическую информацию для обработки запросов различных типов, иподачу команды первому зависящему от домена речевому интерфейсу обработать указанный запрос.2. Способ по п.1, дополнительно включающий прием речевого входного сигнала для активации классификатора.3. Способ по п.2, в котором речевой входной сигнал соответствует идентификатору, который назначен классификатору.4. Способ по п.1, в котором первый зависящий от домена речевой интерфейс выбирают посредством идентификации ключевых слов в запросе.5. Способ по п.1, в котором первый зависящий от домена речевой интерфейс выбирают посредством обработки естественного языка запроса.6. Способ по п.5, в котором обработка естественного языка включает использование доменных знаний для обработки запроса.7. Способ по п.5, в котором обработка естественного языка включает использование грамматики для обработки запроса.8. Способ по п.5, в котором обработка естественного языка включает использование статистических моделей для обработки запроса.9. Способ по п.5, в котором обработка естественного языка включает использование пользовательских данных для обработки запроса.10. Способ по п.1, в котором первый зависящий от домена речевой интерфейс выбирают путем передачи запроса в первый зависящий от домена речевой интерфейс для интерпретации этого запроса, чтобы подтверд�

Claims (27)

1. Способ, включающий:
прием запроса;
анализ запроса для идентификации атрибута;
обработку запроса для выбора первого зависящего от домена речевого интерфейса из множества зависящих от домена речевых интерфейсов на основе указанного атрибута, при этом каждый из зависящих от домена речевых интерфейсов содержит специфическую информацию для обработки запросов различных типов, и
подачу команды первому зависящему от домена речевому интерфейсу обработать указанный запрос.
2. Способ по п.1, дополнительно включающий прием речевого входного сигнала для активации классификатора.
3. Способ по п.2, в котором речевой входной сигнал соответствует идентификатору, который назначен классификатору.
4. Способ по п.1, в котором первый зависящий от домена речевой интерфейс выбирают посредством идентификации ключевых слов в запросе.
5. Способ по п.1, в котором первый зависящий от домена речевой интерфейс выбирают посредством обработки естественного языка запроса.
6. Способ по п.5, в котором обработка естественного языка включает использование доменных знаний для обработки запроса.
7. Способ по п.5, в котором обработка естественного языка включает использование грамматики для обработки запроса.
8. Способ по п.5, в котором обработка естественного языка включает использование статистических моделей для обработки запроса.
9. Способ по п.5, в котором обработка естественного языка включает использование пользовательских данных для обработки запроса.
10. Способ по п.1, в котором первый зависящий от домена речевой интерфейс выбирают путем передачи запроса в первый зависящий от домена речевой интерфейс для интерпретации этого запроса, чтобы подтвердить, что выбор первого зависящего от домена речевого интерфейса является подходящим.
11. Способ по п.1, в котором первый зависящий от домена речевой интерфейс выбирают на основе того, что каждый из множества зависящих от домена речевых интерфейсов интерпретирует запрос с генерацией балла ответа, и выбирают наивысший балл ответа.
12. Способ по п.1, дополнительно включающий идентификацию контекстной информации, соответствующей запросу, при этом первый зависящий от домена речевой интерфейс выбирают на основе указанной контекстной информации.
13. Способ по п.12, в котором контекстная информация включает предпочтения пользователя.
14. Машиночитаемый носитель, хранящий выполняемые компьютером инструкции, которые при их исполнении процессором заставляют его выполнять способ по любому из пп.1-13.
15. Устройство, содержащее:
средство для приема запроса;
средство для анализа запроса для идентификации атрибута;
средство для обработки указанного запроса для выбора первого зависящего от домена речевого интерфейса из множества зависящих от домена речевых интерфейсов на основе указанного атрибута, при этом каждый из зависящих от домена речевых интерфейсов содержит специфическую информацию для обработки запросов различных типов, и
средство для подачи команды первому зависящему от домена речевому интерфейсу обработать указанный запрос.
16. Способ, включающий:
прием атрибута;
применение функции подсчета баллов для генерации балла полезности для каждого из множества шаблонов ответов на запрос на основе указанного атрибута;
выбор по меньшей мере одного из множества шаблонов ответов на запрос на основе указанных баллов полезности и
вывод в звуковой форме ответов на запрос, сгенерированных по меньшей мере из одного шаблона ответов на запрос.
17. Способ по п.16, в котором указанный атрибут представляет собой один из множества атрибутов.
18. Способ по п.17, дополнительно включающий ранжирование множества атрибутов на основе предпочтений пользователя для назначения соответствующего веса каждому из множества атрибутов.
19. Способ по п.18, в котором указанным атрибутам присваивают веса на основе контекстной информации.
20. Способ по п.16, дополнительно включающий предложение пользователю ввести следующий запрос.
21. Способ по п.16, дополнительно включающий идентификацию внутридоменного действия, соответствующего первому баллу полезности.
22. Способ по п.21, дополнительно включающий выполнение внутридоменного действия.
23. Способ по п.21, дополнительно включающий идентификацию междоменного действия, ассоциированного с указанным внутридоменным действием.
24. Способ по п.23, дополнительно включающий передачу обработки в зависящий от домена речевой интерфейс для выполнения междоменного действия.
25. Способ по п.24, дополнительно включающий прием результата междоменного действия из зависящего от домена речевого интерфейса.
26. Машиночитаемый носитель, хранящий выполняемые компьютером инструкции, которые при их исполнении процессором заставляют его выполнять способ по любому из пп.16-25.
27. Устройство, содержащее:
средство для приема атрибута;
средство для применения функции подсчета баллов для генерации балла полезности для каждого из множества шаблонов ответов на запрос на основе указанного атрибута;
средство для выбора по меньшей мере одного из множества шаблонов ответов на запрос на основе указанных баллов полезности и
средство для вывода в звуковой форме ответов на запрос, сгенерированных по меньшей мере из одного шаблона ответов на запрос.
RU2011121296/08A 2008-10-31 2009-09-10 Способ и система для предоставления речевого интерфейса RU2494476C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/263,012 US9978365B2 (en) 2008-10-31 2008-10-31 Method and system for providing a voice interface
US12/263,012 2008-10-31
PCT/FI2009/050729 WO2010049582A1 (en) 2008-10-31 2009-09-10 Method and system for providing a voice interface

Publications (2)

Publication Number Publication Date
RU2011121296A true RU2011121296A (ru) 2012-12-10
RU2494476C2 RU2494476C2 (ru) 2013-09-27

Family

ID=42128304

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2011121296/08A RU2494476C2 (ru) 2008-10-31 2009-09-10 Способ и система для предоставления речевого интерфейса

Country Status (5)

Country Link
US (1) US9978365B2 (ru)
EP (1) EP2347409A4 (ru)
CN (3) CN103077707A (ru)
RU (1) RU2494476C2 (ru)
WO (1) WO2010049582A1 (ru)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2699399C2 (ru) * 2014-08-22 2019-09-05 МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи Система и способ обнаружения орфанных высказываний

Families Citing this family (71)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10032452B1 (en) 2016-12-30 2018-07-24 Google Llc Multimodal transmission of packetized data
US8355913B2 (en) * 2006-11-03 2013-01-15 Nokia Corporation Speech recognition with adjustable timeout period
US8510117B2 (en) * 2009-07-09 2013-08-13 Nuance Communications, Inc. Speech enabled media sharing in a multimodal application
US10496714B2 (en) * 2010-08-06 2019-12-03 Google Llc State-dependent query response
US9582609B2 (en) * 2010-12-27 2017-02-28 Infosys Limited System and a method for generating challenges dynamically for assurance of human interaction
US9047378B1 (en) * 2011-09-30 2015-06-02 Google Inc. Systems and methods for accessing a multi-organization collection of hosted contacts
US9201859B2 (en) * 2011-12-15 2015-12-01 Microsoft Technology Licensing, Llc Suggesting intent frame(s) for user request(s)
US9084058B2 (en) * 2011-12-29 2015-07-14 Sonos, Inc. Sound field calibration using listener localization
WO2013112088A1 (en) * 2012-01-27 2013-08-01 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for handling data-related requests
US9111248B2 (en) * 2012-03-28 2015-08-18 Global Eprocure Procurement system
US9575963B2 (en) 2012-04-20 2017-02-21 Maluuba Inc. Conversational agent
US20130325483A1 (en) * 2012-05-29 2013-12-05 GM Global Technology Operations LLC Dialogue models for vehicle occupants
US8577671B1 (en) * 2012-07-20 2013-11-05 Veveo, Inc. Method of and system for using conversation state information in a conversational interaction system
US9465833B2 (en) 2012-07-31 2016-10-11 Veveo, Inc. Disambiguating user intent in conversational interaction system for large corpus information retrieval
WO2014055181A1 (en) * 2012-10-01 2014-04-10 Nuance Communications, Inc. Systems and methods for providing a voice agent user interface
US10276157B2 (en) 2012-10-01 2019-04-30 Nuance Communications, Inc. Systems and methods for providing a voice agent user interface
US9116918B1 (en) * 2012-11-14 2015-08-25 Google Inc. Methods, systems, and media for interpreting queries
US9269354B2 (en) 2013-03-11 2016-02-23 Nuance Communications, Inc. Semantic re-ranking of NLU results in conversational dialogue applications
US9361884B2 (en) 2013-03-11 2016-06-07 Nuance Communications, Inc. Communicating context across different components of multi-modal dialog applications
US9761225B2 (en) 2013-03-11 2017-09-12 Nuance Communications, Inc. Semantic re-ranking of NLU results in conversational dialogue applications
US10031953B1 (en) * 2013-03-14 2018-07-24 Google Llc Generating query answers
US9116952B1 (en) 2013-05-31 2015-08-25 Google Inc. Query refinements using search data
US9336277B2 (en) * 2013-05-31 2016-05-10 Google Inc. Query suggestions based on search data
EP3005348B1 (en) * 2013-06-07 2020-03-11 Nuance Communications, Inc. Speech-based search using descriptive features of surrounding objects
US10073882B1 (en) * 2013-07-15 2018-09-11 Google Llc Semantically equivalent query templates
US9558176B2 (en) * 2013-12-06 2017-01-31 Microsoft Technology Licensing, Llc Discriminating between natural language and keyword language items
US10311115B2 (en) * 2014-05-15 2019-06-04 Huawei Technologies Co., Ltd. Object search method and apparatus
RU2654789C2 (ru) 2014-05-30 2018-05-22 Общество С Ограниченной Ответственностью "Яндекс" Способ (варианты) и электронное устройство (варианты) обработки речевого запроса пользователя
WO2015200422A1 (en) * 2014-06-25 2015-12-30 Nuance Communications, Inc. Semantic re-ranking of nlu results in conversational dialogue applications
US9418663B2 (en) 2014-07-31 2016-08-16 Google Inc. Conversational agent with a particular spoken style of speech
US10817672B2 (en) * 2014-10-01 2020-10-27 Nuance Communications, Inc. Natural language understanding (NLU) processing based on user-specified interests
US9953644B2 (en) * 2014-12-01 2018-04-24 At&T Intellectual Property I, L.P. Targeted clarification questions in speech recognition with concept presence score and concept correctness score
US10417345B1 (en) * 2014-12-22 2019-09-17 Amazon Technologies, Inc. Providing customer service agents with customer-personalized result of spoken language intent
US9852136B2 (en) 2014-12-23 2017-12-26 Rovi Guides, Inc. Systems and methods for determining whether a negation statement applies to a current or past query
US9836452B2 (en) * 2014-12-30 2017-12-05 Microsoft Technology Licensing, Llc Discriminating ambiguous expressions to enhance user experience
US9854049B2 (en) 2015-01-30 2017-12-26 Rovi Guides, Inc. Systems and methods for resolving ambiguous terms in social chatter based on a user profile
US20160293157A1 (en) * 2015-03-30 2016-10-06 Google Inc. Contextual Voice Action History
US10504509B2 (en) 2015-05-27 2019-12-10 Google Llc Providing suggested voice-based action queries
US20170161319A1 (en) * 2015-12-08 2017-06-08 Rovi Guides, Inc. Systems and methods for generating smart responses for natural language queries
US10909111B2 (en) * 2015-12-16 2021-02-02 Adobe Inc. Natural language embellishment generation and summarization for question-answering systems
US10389543B2 (en) * 2015-12-31 2019-08-20 Microsoft Technology Licensing, Llc Starting meeting using natural user input
JP6481643B2 (ja) * 2016-03-08 2019-03-13 トヨタ自動車株式会社 音声処理システムおよび音声処理方法
US10304444B2 (en) * 2016-03-23 2019-05-28 Amazon Technologies, Inc. Fine-grained natural language understanding
CN107305575B (zh) * 2016-04-25 2021-01-26 北京京东尚科信息技术有限公司 人机智能问答系统的断句识别方法和装置
WO2017222503A1 (en) * 2016-06-21 2017-12-28 Hewlett-Packard Development Company, L.P. Communications utilizing multiple virtual assistant services
US10026398B2 (en) * 2016-07-08 2018-07-17 Google Llc Follow-up voice query prediction
US10650621B1 (en) 2016-09-13 2020-05-12 Iocurrents, Inc. Interfacing with a vehicular controller area network
WO2018063155A1 (en) * 2016-09-27 2018-04-05 Hewlett-Packard Development Company, L.P. Communication apparatuses
US10593329B2 (en) 2016-12-30 2020-03-17 Google Llc Multimodal transmission of packetized data
US10708313B2 (en) * 2016-12-30 2020-07-07 Google Llc Multimodal transmission of packetized data
WO2018173405A1 (ja) * 2017-03-24 2018-09-27 ソニー株式会社 情報処理装置および情報処理方法
US10665232B2 (en) * 2017-05-24 2020-05-26 Harman International Industries, Inc. Coordination among multiple voice recognition devices
US20190096397A1 (en) * 2017-09-22 2019-03-28 GM Global Technology Operations LLC Method and apparatus for providing feedback
US10394957B2 (en) 2017-09-25 2019-08-27 Microsoft Technology Licensing, Llc Signal analysis in a conversational scheduling assistant computing system
US11451511B1 (en) * 2017-11-07 2022-09-20 Verisign, Inc. Audio-based systems, devices, and methods for domain services
US10380992B2 (en) * 2017-11-13 2019-08-13 GM Global Technology Operations LLC Natural language generation based on user speech style
JP2019109567A (ja) * 2017-12-15 2019-07-04 オンキヨー株式会社 電子機器、及び、電子機器の制御プログラム
US11487501B2 (en) * 2018-05-16 2022-11-01 Snap Inc. Device control using audio data
WO2020040780A1 (en) * 2018-08-24 2020-02-27 Hewlett-Packard Development Company, L.P. Identifying digital elements
US11899714B1 (en) * 2018-09-27 2024-02-13 Amazon Technologies, Inc. Voice conversational search constraint management
US11687850B2 (en) * 2018-11-21 2023-06-27 Honda Motor Co., Ltd System and method for processing a task request to be executed and fulfilled
US11694130B2 (en) 2018-11-21 2023-07-04 Honda Motor Co., Ltd. System and method for assigning an agent to execute and fulfill a task request
CN110413756B (zh) 2019-07-29 2022-02-15 北京小米智能科技有限公司 自然语言处理的方法、装置及设备
US11256870B2 (en) * 2019-09-25 2022-02-22 Rovi Guides, Inc. Systems and methods for inserting dialogue into a query response
JP7196122B2 (ja) * 2020-02-18 2022-12-26 株式会社東芝 インタフェース提供装置、インタフェース提供方法およびプログラム
CN111488088B (zh) * 2020-04-07 2022-05-06 Oppo广东移动通信有限公司 设备状态标识方法、装置及智能终端
US20230070209A1 (en) * 2021-09-03 2023-03-09 The Travelers Indemnity Company Monitoring system
US12217000B1 (en) * 2021-09-10 2025-02-04 Tableau Software, LLC Optimizing natural language analytical conversations using platform-specific input and output interface functionality
US20230289791A1 (en) * 2022-03-14 2023-09-14 LayerZero Labs Ltd. Trustless omnichain communication protocol platforms implementing resource balancing
US20230352014A1 (en) * 2022-04-28 2023-11-02 Apple Inc. Digital assistant response modes
CN115277165B (zh) * 2022-07-22 2023-11-07 江苏智能网联汽车创新中心有限公司 一种车辆网络风险确定方法、装置、设备及存储介质

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5867817A (en) 1996-08-19 1999-02-02 Virtual Vision, Inc. Speech recognition manager
US5915001A (en) * 1996-11-14 1999-06-22 Vois Corporation System and method for providing and using universally accessible voice and speech data files
GB9726654D0 (en) * 1997-12-17 1998-02-18 British Telecomm Data input and retrieval apparatus
US7036128B1 (en) 1999-01-05 2006-04-25 Sri International Offices Using a community of distributed electronic agents to support a highly mobile, ambient computing environment
US6418440B1 (en) * 1999-06-15 2002-07-09 Lucent Technologies, Inc. System and method for performing automated dynamic dialogue generation
US6381465B1 (en) * 1999-08-27 2002-04-30 Leap Wireless International, Inc. System and method for attaching an advertisement to an SMS message for wireless transmission
US6615172B1 (en) * 1999-11-12 2003-09-02 Phoenix Solutions, Inc. Intelligent query engine for processing voice based queries
AUPR082400A0 (en) * 2000-10-17 2000-11-09 Telstra R & D Management Pty Ltd An information retrieval system
US20020077830A1 (en) 2000-12-19 2002-06-20 Nokia Corporation Method for activating context sensitive speech recognition in a terminal
US7010490B2 (en) 2001-01-26 2006-03-07 International Business Machines Corporation Method, system, and apparatus for limiting available selections in a speech recognition system
US7027987B1 (en) * 2001-02-07 2006-04-11 Google Inc. Voice interface for a search engine
WO2002071393A1 (en) 2001-02-28 2002-09-12 Voice-Insight Natural language query system for accessing an information system
US20030061054A1 (en) 2001-09-25 2003-03-27 Payne Michael J. Speaker independent voice recognition (SIVR) using dynamic assignment of speech contexts, dynamic biasing, and multi-pass parsing
ITTO20011035A1 (it) 2001-10-30 2003-04-30 Loquendo Spa Metodo per la gestione di dialoghi persona-macchina ad iniziativa mista basato sull'interazione vocale.
US7493259B2 (en) * 2002-01-04 2009-02-17 Siebel Systems, Inc. Method for accessing data via voice
US7016849B2 (en) 2002-03-25 2006-03-21 Sri International Method and apparatus for providing speech-driven routing between spoken language applications
US7398209B2 (en) * 2002-06-03 2008-07-08 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
US7693720B2 (en) * 2002-07-15 2010-04-06 Voicebox Technologies, Inc. Mobile systems and methods for responding to natural language speech utterance
CN1266633C (zh) 2002-12-31 2006-07-26 中国科学院计算技术研究所 语音查询中的辨音方法
WO2004106009A1 (ja) * 2003-06-02 2004-12-09 Matsushita Electric Industrial Co., Ltd. 物品操作システムおよび方法、並びに物品管理システムおよび方法
US20050004788A1 (en) 2003-07-03 2005-01-06 Lee Hang Shun Raymond Multi-level confidence measures for task modeling and its application to task-oriented multi-modal dialog management
WO2005064592A1 (ja) 2003-12-26 2005-07-14 Kabushikikaisha Kenwood 機器制御装置、音声認識装置、エージェント装置、車載機器制御装置、ナビゲーション装置、オーディオ装置、機器制御方法、音声認識方法、エージェント処理方法、車載機器制御方法、ナビゲーション方法、オーディオ装置制御方法及びプログラム
CN1993732A (zh) 2004-08-06 2007-07-04 皇家飞利浦电子股份有限公司 用于与用户执行对话通信的系统的方法
US7716056B2 (en) 2004-09-27 2010-05-11 Robert Bosch Corporation Method and system for interactive conversational dialogue for cognitively overloaded device users
US7643822B2 (en) * 2004-09-30 2010-01-05 Google Inc. Method and system for processing queries initiated by users of mobile devices
US7571157B2 (en) 2004-12-29 2009-08-04 Aol Llc Filtering search results
US7526476B2 (en) * 2005-03-14 2009-04-28 Microsoft Corporation System and method for generating attribute-based selectable search extension
US7640160B2 (en) 2005-08-05 2009-12-29 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
US7949529B2 (en) * 2005-08-29 2011-05-24 Voicebox Technologies, Inc. Mobile systems and methods of supporting natural language human-machine interactions
US9201923B2 (en) 2005-10-04 2015-12-01 Robert Bosch Corporation Method and apparatus for organizing and optimizing content in dialog systems
US20070112749A1 (en) 2005-11-04 2007-05-17 Minfo, Inc. Query methods and apparatuses including user profile with domain views
US7822699B2 (en) 2005-11-30 2010-10-26 Microsoft Corporation Adaptive semantic reasoning engine
RU61924U1 (ru) * 2006-03-14 2007-03-10 Михаил Николаевич Гусев Статистическая модель речи
US7818176B2 (en) 2007-02-06 2010-10-19 Voicebox Technologies, Inc. System and method for selecting and presenting advertisements based on natural language processing of voice-based input
US8650030B2 (en) * 2007-04-02 2014-02-11 Google Inc. Location based responses to telephone requests
US7987176B2 (en) * 2007-06-25 2011-07-26 Sap Ag Mixed initiative semantic search
US8140335B2 (en) * 2007-12-11 2012-03-20 Voicebox Technologies, Inc. System and method for providing a natural language voice user interface in an integrated voice navigation services environment
US20090299853A1 (en) * 2008-05-27 2009-12-03 Chacha Search, Inc. Method and system of improving selection of search results

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2699399C2 (ru) * 2014-08-22 2019-09-05 МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи Система и способ обнаружения орфанных высказываний

Also Published As

Publication number Publication date
CN102272828A (zh) 2011-12-07
RU2494476C2 (ru) 2013-09-27
EP2347409A4 (en) 2017-03-15
CN103077707A (zh) 2013-05-01
CN104700835B (zh) 2019-07-12
EP2347409A1 (en) 2011-07-27
WO2010049582A1 (en) 2010-05-06
CN102272828B (zh) 2013-05-08
US20100114944A1 (en) 2010-05-06
CN104700835A (zh) 2015-06-10
US9978365B2 (en) 2018-05-22

Similar Documents

Publication Publication Date Title
RU2011121296A (ru) Способ и система для предоставления речевого интерфейса
US10642577B2 (en) Search and knowledge base question answering for a voice user interface
TWI684881B (zh) 基於機器翻譯的自動生成重述以產生一對話式代理人的方法、系統及非暫態機器可讀取媒體
CN109410927B (zh) 离线命令词与云端解析结合的语音识别方法、装置和系统
KR102388042B1 (ko) 대화 시스템 및 그것을 위한 컴퓨터 프로그램
KR102170563B1 (ko) 인공 지능에 기반한 휴먼 머신 인터랙티브 방법 및 장치
US11189277B2 (en) Dynamic gazetteers for personalized entity recognition
JP7132090B2 (ja) 対話システム、対話装置、対話方法、及びプログラム
WO2019046463A1 (en) SYSTEM AND METHOD FOR THE DEFINITION OF DIALOGUE INTENTIONS AND THE CONSTRUCTION OF INTENTION RECOGNITION MODELS WITHOUT PRIOR KNOWLEDGE
US20220084507A1 (en) Intelligence-driven virtual assistant for automated idea documentation
CN105723360A (zh) 利用情感调节改进自然语言交互
CN107526763A (zh) 处理方法、处理系统及记录介质
CN106847279A (zh) 基于机器人操作系统ros的人机交互方法
JP2019139574A (ja) 情報提供装置、情報提供方法、およびプログラム
JP6927318B2 (ja) 情報処理装置、情報処理方法、及びプログラム
US20240185846A1 (en) Multi-session context
CN108877794A (zh) 用于人机交互的方法、装置、电子设备和计算机可读存储介质
CN112115244A (zh) 对话交互方法、装置、存储介质及电子设备
US11900072B1 (en) Quick lookup for speech translation
US10978076B2 (en) Speaker retrieval device, speaker retrieval method, and computer program product
JP6571231B1 (ja) 検索装置および方法
US10957313B1 (en) System command processing
CN118711572A (zh) 用于语音情感交互模型的训练方法及装置、电子设备
CN112823047B (zh) 用于控制网络应用程序的系统和设备
JP2017161644A (ja) 音声処理システムおよび音声処理方法

Legal Events

Date Code Title Description
PC41 Official registration of the transfer of exclusive right

Effective date: 20160602