KR101233039B1 - 분산형 멀티모드 애플리케이션을 구현하기 위한 방법 및 장치 - Google Patents
분산형 멀티모드 애플리케이션을 구현하기 위한 방법 및 장치 Download PDFInfo
- Publication number
- KR101233039B1 KR101233039B1 KR1020107017167A KR20107017167A KR101233039B1 KR 101233039 B1 KR101233039 B1 KR 101233039B1 KR 1020107017167 A KR1020107017167 A KR 1020107017167A KR 20107017167 A KR20107017167 A KR 20107017167A KR 101233039 B1 KR101233039 B1 KR 101233039B1
- Authority
- KR
- South Korea
- Prior art keywords
- voice
- client device
- multimode
- application server
- response
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/24—Speech recognition using non-acoustical features
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/02—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/04—Protocols specially adapted for terminals or networks with limited capabilities; specially adapted for terminal portability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/75—Indicating network or usage conditions on the user display
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4938—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals comprising a voice browser which renders and interprets, e.g. VoiceXML
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2203/00—Aspects of automatic or semi-automatic exchanges
- H04M2203/25—Aspects of automatic or semi-automatic exchanges related to user interface aspects of the telephonic communication service
- H04M2203/251—Aspects of automatic or semi-automatic exchanges related to user interface aspects of the telephonic communication service where a voice mode or a visual mode can be used interchangeably
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- User Interface Of Digital Computer (AREA)
- Digital Computer Display Output (AREA)
Abstract
Description
도 1은 예시적인 실시예에 따른 분산형 멀티모드 애플리케이션들을 실행하도록 구성된 시스템의 간략도이다.
도 2는 예시적인 실시예에 따른 멀티모드 애플리케이션 세션을 개시하고 수행하기 위한 방법의 흐름도이다.
도 3은 예시적인 실시예에 따른 멀티모드 애플리케이션 세션 동기화를 수행하기 위한 방법의 흐름도이다.
도 4는 예시적인 실시예에 따른 클라이언트 장치에 묘사된 멀티모드 페이지의 일예이다.
도 5는 예시적인 실시예에 따른 보이스 모달리티 입력 이벤트 처리 프로세스를 수행하기 위한 방법의 흐름도이다.
도 6은 예시적인 실시예에 따른 비주얼 모달리티 입력 이벤트 처리 프로세스를 수행하기 위한 방법의 흐름도이다.
Claims (21)
- 클라이언트 장치에 의해 수행되는 방법으로서,
상기 클라이언트 장치에 의해 입력 데이터를 비주얼 모달리티(visual modality) 및 보이스 모달리티(voice modality)를 통해 수신할 수 있는 적어도 하나의 멀티모드 디스플레이 요소(multi-modal display element)를 포함하는 비주얼 디스플레이를 묘사(rendering)하는 단계 - 상기 클라이언트 장치는, 처음에 상기 적어도 하나의 멀티모드 디스플레이 요소의 제1 멀티모드 디스플레이 요소에 설정되는 비주얼 뷰 포커스(visual view focus)에 관한 정보를 유지함 -;
제1 보이스 이벤트 요청을 애플리케이션 서버에 전송하는 단계 - 상기 제1 보이스 이벤트 요청은 비동기적 하이퍼텍스트 전송 프로토콜(asynchronous hypertext transfer protocol; HTTP) 요청이고, 상기 제1 보이스 이벤트 요청은 보이스 이벤트가 발생할 때까지 애플리케이션 서버에 보류 중인 채로 남아있을 것임 -;
상기 보이스 모달리티를 통해 사용자 발성음(user utterance)을 표현할 수 있는 오디오 신호를 수신하는 단계;
상기 오디오 신호를 나타내는 업링크 오디오 데이터를, 보이스 뷰 포커스에 기초하여 상기 업링크 오디오 데이터를 해석하는 음성 인식기에 전송하는 단계 - 상기 보이스 뷰 포커스는 처음에 상기 제1 멀티모드 디스플레이 요소와 연관된 음성 대화의 부분에 설정됨 -;
상기 제1 보이스 이벤트 요청에 응답하여 상기 애플리케이션 서버로부터 보이스 이벤트 응답을 수신하는 단계 - 상기 애플리케이션 서버는 상기 보이스 이벤트가 발생하였다는 표시를 수신하였음 -;
상기 보이스 이벤트 응답의 수신에 응답하여 상기 비주얼 뷰 포커스를 새로운 비주얼 뷰 포커스로 갱신하는 단계; 및
상기 보이스 이벤트 응답의 수신에 응답하여 제2 보이스 이벤트 요청을 상기 애플리케이션 서버에 전송하는 단계 - 상기 제2 보이스 이벤트 요청은 제2 보이스 이벤트가 발생할 때까지 상기 애플리케이션 서버에 보류 중인 채로 남아있을 것임 -
를 포함하는, 클라이언트 장치에 의해 수행되는 방법. - 제1항에 있어서, 상기 업링크 오디오 데이터를 상기 음성 인식기에 전송하는 단계는, 상기 업링크 오디오 데이터를 상기 음성 인식기에 전달되도록 상기 애플리케이션 서버에 전송하는 단계를 포함하는, 클라이언트 장치에 의해 수행되는 방법.
- 제1항에 있어서, 상기 업링크 오디오 데이터를 상기 음성 인식기에 전송하는 단계는, 상기 업링크 오디오 데이터를 직접 상기 음성 인식기에 전송하는 단계를 포함하는, 클라이언트 장치에 의해 수행되는 방법.
- 제1항에 있어서,
음성 인식 결과를 수신하는 단계; 및
상기 비주얼 디스플레이를 갱신하여 상기 음성 인식 결과에 대응하는 텍스트를 상기 제1 멀티모드 디스플레이 요소에서 디스플레이하는 단계를 더 포함하는, 클라이언트 장치에 의해 수행되는 방법. - 제1항에 있어서,
새로운 보이스 뷰 포커스의 표시를 수신하는 단계; 및
상기 비주얼 뷰 포커스를 갱신하여 상기 새로운 보이스 뷰 포커스와 동기화되도록 하는 단계를 더 포함하는, 클라이언트 장치에 의해 수행되는 방법. - 제1항에 있어서,
멀티모드 페이지를 상기 애플리케이션 서버로부터 요청하는 단계 - 상기 멀티모드 페이지는, 해석될 때, 상기 클라이언트 장치로 하여금 상기 비주얼 디스플레이를 묘사할 수 있게 함 - ;
상기 멀티모드 페이지를 상기 애플리케이션 서버로부터 수신하는 단계;
상기 클라이언트 장치가 멀티모드 가능한지를 판정하는 단계; 및
상기 클라이언트 장치가 멀티모드 가능할 때, 상기 비주얼 디스플레이를 묘사하는 단계를 더 포함하는, 클라이언트 장치에 의해 수행되는 방법. - 제1항에 있어서,
오디오 프롬프트(audio prompt)를 포함하는 다운링크 오디오 데이터를 수신하는 단계; 및
상기 오디오 프롬프트를 상기 클라이언트 장치의 오디오 출력 장치를 통해 출력하는 단계를 더 포함하는, 클라이언트 장치에 의해 수행되는 방법. - 제1항에 있어서,
상기 비주얼 뷰 포커스를 상기 적어도 하나의 멀티모드 디스플레이 요소의 제2 멀티모드 디스플레이 요소로 변경하는 사용자 입력을 수신하는 단계;
상기 사용자 입력의 수신에 기초하여, 상기 제2 멀티모드 디스플레이 요소에 대응하는 새로운 비주얼 뷰 포커스를 나타내는 포커스 요청을 상기 애플리케이션 서버에 발행(issuing)하는 단계;
상기 애플리케이션 서버로부터 포커스 응답을 수신하는 단계; 및
상기 포커스 응답의 수신에 응답하여, 상기 비주얼 뷰 포커스 및 상기 비주얼 디스플레이를 갱신하여 상기 제2 멀티모드 디스플레이 요소를 상기 비주얼 뷰 포커스로서 표시하는 단계를 더 포함하는, 클라이언트 장치에 의해 수행되는 방법. - 제8항에 있어서, 상기 사용자 입력을 수신하는 단계는,
상기 사용자가 포인팅 또는 스크롤링 사용자 인터페이스 장치를 이용하여 상기 제2 멀티모드 디스플레이 요소를 선택하였다는 표시를 수신하는 단계를 포함하는, 클라이언트 장치에 의해 수행되는 방법. - 제8항에 있어서, 상기 사용자 입력을 수신하는 단계는,
상기 사용자가 상기 제1 멀티모드 디스플레이 요소의 데이터 입력 필드(data entry field)에 텍스트를 입력하였다는 표시를 수신하는 단계를 포함하며, 상기 포커스 요청은 상기 텍스트의 표시를 포함하는, 클라이언트 장치에 의해 수행되는 방법. - 애플리케이션 서버에 의해 수행되는 방법으로서,
클라이언트 장치에 의해 입력 데이터를 비주얼 모달리티(visual modality) 및 보이스 모달리티(voice modality)를 통해 수신할 수 있는 적어도 하나의 멀티모드 디스플레이 요소를 포함하는 비주얼 디스플레이를 묘사한 상기 클라이언트 장치로부터 제1 보이스 이벤트 요청을 수신하는 단계 - 상기 제1 보이스 이벤트 요청은 보이스 이벤트가 발생할 때까지 상기 애플리케이션 서버에서 보류 중인 채로 남아있을 비동기적 하이퍼텍스트 전송 프로토콜(HTTP) 요청임 - ;
보이스 서버로부터 음성 인식 결과를 수신하는 단계 - 상기 음성 인식 결과는, 상기 클라이언트 장치에 의해 보이스 뷰 포커스를 기초하여 업링크 오디오 데이터를 해석하는 음성 인식기에 전송된 상기 업링크 오디오 데이터에 대해 수행된 음성 인식 프로세스의 결과를 나타내고, 상기 보이스 뷰 포커스는 처음에 적어도 하나의 멀티모드 디스플레이 요소의 제1 멀티모드 디스플레이 요소와 연관된 음성 대화의 부분에 설정됨 - ;
상기 제1 보이스 이벤트 요청에 응답하여 상기 클라이언트 장치에 보이스 이벤트 응답을 전송하는 단계 - 상기 애플리케이션 서버는 상기 음성 인식 결과를 수신하였고, 상기 보이스 이벤트 응답은 상기 클라이언트 장치가 비주얼 뷰 포커스를 갱신하도록 야기함 - ; 및
상기 보이스 이벤트 응답의 전송에 응답하여 상기 클라이언트 장치로부터 제2 보이스 이벤트 요청을 수신하는 단계 - 상기 제2 보이스 이벤트 요청은 제2 보이스 이벤트가 발생할 때까지 상기 애플리케이션 서버에 보류 중인 채로 남아있을 것임 -
를 포함하는, 애플리케이션 서버에 의해 수행되는 방법. - 제11항에 있어서,
상기 클라이언트 장치로부터 상기 업링크 오디오 데이터를 수신하는 단계; 및
상기 업링크 오디오 데이터를 상기 음성 인식기에 전송하는 단계를 더 포함하는, 애플리케이션 서버에 의해 수행되는 방법. - 제11항에 있어서, 상기 보이스 이벤트 응답을 상기 클라이언트 장치에 전송하는 단계는,
상기 음성 인식 결과를 상기 보이스 이벤트 응답에 포함시키는 단계를 포함하는, 애플리케이션 서버에 의해 수행되는 방법. - 제11항에 있어서,
상기 보이스 서버로부터 새로운 보이스 뷰 포커스의 표시를 수신하는 단계; 및
상기 새로운 보이스 뷰 포커스의 표시를 상기 보이스 이벤트 응답에 포함시키는 단계를 더 포함하는, 애플리케이션 서버에 의해 수행되는 방법. - 제11항에 있어서,
상기 클라이언트 장치로부터 새로운 비주얼 뷰 포커스의 표시를 수신하는 단계; 및
상기 새로운 비주얼 뷰 포커스의 표시를 상기 보이스 서버에 전송하는 단계를 더 포함하는, 애플리케이션 서버에 의해 수행되는 방법. - 시스템으로서,
클라이언트 장치
를 포함하며,
상기 클라이언트 장치는,
상기 클라이언트 장치에 의해 입력 데이터를 비주얼 모달리티 및 보이스 모달리티를 통해 수신할 수 있는 적어도 하나의 멀티모드 디스플레이 요소를 포함하는 비주얼 디스플레이를 묘사하고 - 상기 클라이언트 장치는, 처음에 상기 적어도 하나의 멀티모드 디스플레이 요소의 제1 멀티모드 디스플레이 요소에 설정되는 비주얼 뷰 포커스에 관한 정보를 유지함 -,
제1 보이스 이벤트 요청을 애플리케이션 서버에 전송하고 - 상기 제1 보이스 이벤트 요청은 비동기적 하이퍼텍스트 전송 프로토콜(HTTP) 요청이고, 상기 제1 보이스 이벤트 요청은 보이스 이벤트가 발생할 때까지 상기 애플리케이션 서버에 보류 중인 채로 남아있을 것임 -,
상기 보이스 모달리티를 통해 사용자 발성음을 표현할 수 있는 오디오 신호를 수신하고,
상기 오디오 신호를 나타내는 업링크 오디오 데이터를, 보이스 뷰 포커스에 기초하여 상기 업링크 오디오 데이터를 해석하는 음성 인식기에 전송하고 - 상기 보이스 뷰 포커스는 처음에 상기 제1 멀티모드 디스플레이 요소와 연관된 음성 대화의 부분에 설정됨 -,
상기 제1 보이스 이벤트 요청에 응답하여 상기 애플리케이션 서버로부터 보이스 이벤트 응답을 수신하고 - 상기 애플리케이션 서버는 상기 보이스 이벤트가 발생하였다는 표시를 수신하였음 -,
상기 보이스 이벤트 응답의 수신에 응답하여 상기 비주얼 뷰 포커스를 새로운 비주얼 뷰 포커스로 갱신하고,
상기 보이스 이벤트 응답의 수신에 응답하여 제2 보이스 이벤트 요청을 상기 애플리케이션 서버에 전송하도록 - 상기 제2 보이스 이벤트 요청은 제2 보이스 이벤트가 발생할 때까지 상기 애플리케이션 서버에 보류 중인 채로 남아있을 것임 -
적응된 시스템. - 제16항에 있어서, 애플리케이션 서버를 더 포함하며,
상기 애플리케이션 서버는,
상기 클라이언트 장치로부터 상기 제1 보이스 이벤트 요청을 수신하고,
보이스 서버로부터 음성 인식 결과를 수신하고 - 상기 음성 인식 결과는, 상기 클라이언트 장치에 의해 상기 음성 인식기에 전송된 상기 업링크 오디오 데이터에 대해 수행된 음성 인식 프로세스의 결과를 나타냄 - ,
상기 제1 보이스 이벤트 요청에 응답하여 상기 클라이언트 장치에게 상기 보이스 이벤트 응답을 전송하며,
상기 보이스 이벤트 응답의 전송에 응답하여 상기 클라이언트 장치로부터 상기 제2 보이스 이벤트 요청을 수신하도록
적응된 시스템. - 제16항에 있어서, 상기 클라이언트 장치는 또한, 상기 업링크 오디오 데이터를 상기 음성 인식기에 전달되도록 상기 애플리케이션 서버에 전송하도록 적응된 시스템.
- 제16항에 있어서, 상기 클라이언트 장치는 또한, 새로운 보이스 뷰 포커스의 표시를 수신하고, 상기 비주얼 뷰 포커스를 갱신하여 상기 새로운 보이스 뷰 포커스와 동기화되도록 적응된 시스템.
- 제16항에 있어서, 상기 클라이언트 장치는 또한,
상기 비주얼 뷰 포커스를, 상기 적어도 하나의 멀티모드 디스플레이 요소의 제2 멀티모드 디스플레이 요소로 변경하는 사용자 입력을 수신하고, 상기 사용자 입력의 수신에 기초하여, 상기 제2 멀티모드 디스플레이 요소에 대응하는 새로운 비주얼 뷰 포커스를 표시하는 포커스 요청을 상기 애플리케이션 서버에 발행하고, 상기 애플리케이션 서버로부터 포커스 응답을 수신하며, 상기 포커스 응답의 수신에 응답하여, 상기 비주얼 뷰 포커스 및 상기 비주얼 디스플레이를 갱신하여 상기 제2 멀티모드 디스플레이 요소를 상기 비주얼 뷰 포커스로서 표시하도록 적응된 시스템. - 제16항에 있어서, 상기 클라이언트 장치는, 셀룰러 전화기, 무선 장치(radio), 페이저, 개인 휴대용 정보 단말기, 개인용 네비게이션 장치, 모바일 컴퓨터 시스템, 차량용 컴퓨터 시스템, 항공기용 컴퓨터 시스템, 컴퓨터, 랩탑 컴퓨터, 노트북 컴퓨터, 데스크탑 컴퓨터, 및 컴퓨터에서 구현된 보이스 오버 인터넷 프로토콜(VoIP) 전화기를 포함하는 일군의 장치들로부터 선택된 하나의 장치인 시스템.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/967,356 US8370160B2 (en) | 2007-12-31 | 2007-12-31 | Methods and apparatus for implementing distributed multi-modal applications |
US11/967,356 | 2007-12-31 | ||
PCT/US2008/086953 WO2009088665A2 (en) | 2007-12-31 | 2008-12-16 | Methods and apparatus for implementing distributed multi-modal applications |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20100109943A KR20100109943A (ko) | 2010-10-11 |
KR101233039B1 true KR101233039B1 (ko) | 2013-02-13 |
Family
ID=40799545
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020107017167A KR101233039B1 (ko) | 2007-12-31 | 2008-12-16 | 분산형 멀티모드 애플리케이션을 구현하기 위한 방법 및 장치 |
Country Status (6)
Country | Link |
---|---|
US (1) | US8370160B2 (ko) |
EP (1) | EP2243095B1 (ko) |
KR (1) | KR101233039B1 (ko) |
CN (1) | CN101911064B (ko) |
RU (1) | RU2494444C2 (ko) |
WO (1) | WO2009088665A2 (ko) |
Families Citing this family (106)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7895599B2 (en) * | 2007-05-23 | 2011-02-22 | Sap Ag | User interface independent remote interface data loader |
US8837465B2 (en) | 2008-04-02 | 2014-09-16 | Twilio, Inc. | System and method for processing telephony sessions |
CN104902113B (zh) | 2008-04-02 | 2018-10-19 | 特维里奥公司 | 处理电话会话的系统和方法 |
US8311837B1 (en) * | 2008-06-13 | 2012-11-13 | West Corporation | Mobile voice self service system |
US8296148B1 (en) * | 2008-06-13 | 2012-10-23 | West Corporation | Mobile voice self service device and method thereof |
CN102227904A (zh) | 2008-10-01 | 2011-10-26 | 特维里奥公司 | 电话网络事件的系统和方法 |
US11487347B1 (en) * | 2008-11-10 | 2022-11-01 | Verint Americas Inc. | Enhanced multi-modal communication |
EP2211336B1 (en) * | 2009-01-23 | 2014-10-08 | Harman Becker Automotive Systems GmbH | Improved speech input using navigation information |
EP2404412B1 (en) | 2009-03-02 | 2019-05-01 | Twilio Inc. | Method and system for a multitenancy telephone network |
US8509415B2 (en) | 2009-03-02 | 2013-08-13 | Twilio, Inc. | Method and system for a multitenancy telephony network |
WO2011004000A2 (en) * | 2009-07-10 | 2011-01-13 | Dialogs Unlimited B.V. | Information distributing system with feedback mechanism |
US9210275B2 (en) | 2009-10-07 | 2015-12-08 | Twilio, Inc. | System and method for running a multi-module telephony application |
US8582737B2 (en) | 2009-10-07 | 2013-11-12 | Twilio, Inc. | System and method for running a multi-module telephony application |
WO2011091085A1 (en) * | 2010-01-19 | 2011-07-28 | Twilio Inc. | Method and system for preserving telephony session state |
US20120208495A1 (en) | 2010-06-23 | 2012-08-16 | Twilio, Inc. | System and method for monitoring account usage on a platform |
US9338064B2 (en) | 2010-06-23 | 2016-05-10 | Twilio, Inc. | System and method for managing a computing cluster |
US9459925B2 (en) | 2010-06-23 | 2016-10-04 | Twilio, Inc. | System and method for managing a computing cluster |
US9459926B2 (en) | 2010-06-23 | 2016-10-04 | Twilio, Inc. | System and method for managing a computing cluster |
US8416923B2 (en) | 2010-06-23 | 2013-04-09 | Twilio, Inc. | Method for providing clean endpoint addresses |
US9590849B2 (en) | 2010-06-23 | 2017-03-07 | Twilio, Inc. | System and method for managing a computing cluster |
US8838707B2 (en) | 2010-06-25 | 2014-09-16 | Twilio, Inc. | System and method for enabling real-time eventing |
US8731939B1 (en) | 2010-08-06 | 2014-05-20 | Google Inc. | Routing queries based on carrier phrase registration |
US8700782B2 (en) * | 2010-08-18 | 2014-04-15 | Microsoft Corporation | Directing modalities over different networks in multimodal communications |
US8682661B1 (en) * | 2010-08-31 | 2014-03-25 | Google Inc. | Robust speech recognition |
US8649268B2 (en) | 2011-02-04 | 2014-02-11 | Twilio, Inc. | Method for processing telephony sessions of a network |
US20120280915A1 (en) * | 2011-05-02 | 2012-11-08 | Nokia Corporation | Method and apparatus for facilitating interacting with a multimodal user interface |
US20140044123A1 (en) | 2011-05-23 | 2014-02-13 | Twilio, Inc. | System and method for real time communicating with a client application |
US9648006B2 (en) | 2011-05-23 | 2017-05-09 | Twilio, Inc. | System and method for communicating with a client application |
WO2012162397A1 (en) | 2011-05-23 | 2012-11-29 | Twilio, Inc. | System and method for connecting a communication to a client |
US8223088B1 (en) * | 2011-06-09 | 2012-07-17 | Google Inc. | Multimode input field for a head-mounted display |
KR101292487B1 (ko) * | 2011-08-25 | 2013-08-01 | 주식회사 팬택 | 컨텐츠 공유 단말기 |
US10182147B2 (en) | 2011-09-21 | 2019-01-15 | Twilio Inc. | System and method for determining and communicating presence information |
WO2013044138A1 (en) | 2011-09-21 | 2013-03-28 | Twilio, Inc. | System and method for authorizing and connecting application developers and users |
US9495227B2 (en) | 2012-02-10 | 2016-11-15 | Twilio, Inc. | System and method for managing concurrent events |
US9310888B2 (en) | 2012-03-16 | 2016-04-12 | Microsoft Technology Licensing, Llc | Multimodal layout and rendering |
US9037472B2 (en) * | 2012-04-20 | 2015-05-19 | Nuance Communications, Inc. | Method and system for facilitating communications for a user transaction |
US9240941B2 (en) | 2012-05-09 | 2016-01-19 | Twilio, Inc. | System and method for managing media in a distributed communication network |
US20130304928A1 (en) | 2012-05-09 | 2013-11-14 | Twilio, Inc. | System and method for managing latency in a distributed telephony network |
US9602586B2 (en) | 2012-05-09 | 2017-03-21 | Twilio, Inc. | System and method for managing media in a distributed communication network |
US9247062B2 (en) | 2012-06-19 | 2016-01-26 | Twilio, Inc. | System and method for queuing a communication session |
US9536528B2 (en) | 2012-07-03 | 2017-01-03 | Google Inc. | Determining hotword suitability |
US8737962B2 (en) | 2012-07-24 | 2014-05-27 | Twilio, Inc. | Method and system for preventing illicit use of a telephony platform |
US8738051B2 (en) | 2012-07-26 | 2014-05-27 | Twilio, Inc. | Method and system for controlling message routing |
US8938053B2 (en) | 2012-10-15 | 2015-01-20 | Twilio, Inc. | System and method for triggering on platform usage |
US8948356B2 (en) | 2012-10-15 | 2015-02-03 | Twilio, Inc. | System and method for routing communications |
RU2530267C2 (ru) * | 2012-11-28 | 2014-10-10 | Общество с ограниченной ответственностью "Спиктуит" | Способ коммуникации пользователя с информационной диалоговой системой |
US9253254B2 (en) | 2013-01-14 | 2016-02-02 | Twilio, Inc. | System and method for offering a multi-partner delegated platform |
US9282124B2 (en) | 2013-03-14 | 2016-03-08 | Twilio, Inc. | System and method for integrating session initiation protocol communication in a telecommunications platform |
US9001666B2 (en) | 2013-03-15 | 2015-04-07 | Twilio, Inc. | System and method for improving routing in a distributed communication platform |
US9338280B2 (en) | 2013-06-19 | 2016-05-10 | Twilio, Inc. | System and method for managing telephony endpoint inventory |
US9160696B2 (en) | 2013-06-19 | 2015-10-13 | Twilio, Inc. | System for transforming media resource into destination device compatible messaging format |
US9225840B2 (en) | 2013-06-19 | 2015-12-29 | Twilio, Inc. | System and method for providing a communication endpoint information service |
US9483328B2 (en) | 2013-07-19 | 2016-11-01 | Twilio, Inc. | System and method for delivering application content |
US9338018B2 (en) | 2013-09-17 | 2016-05-10 | Twilio, Inc. | System and method for pricing communication of a telecommunication platform |
US9137127B2 (en) | 2013-09-17 | 2015-09-15 | Twilio, Inc. | System and method for providing communication platform metadata |
US9274858B2 (en) | 2013-09-17 | 2016-03-01 | Twilio, Inc. | System and method for tagging and tracking events of an application platform |
US9325624B2 (en) | 2013-11-12 | 2016-04-26 | Twilio, Inc. | System and method for enabling dynamic multi-modal communication |
US9553799B2 (en) | 2013-11-12 | 2017-01-24 | Twilio, Inc. | System and method for client communication in a distributed telephony network |
CN104702576B (zh) * | 2013-12-09 | 2018-02-09 | 腾讯科技(深圳)有限公司 | 语音传输方法、装置和语音服务系统 |
US9344573B2 (en) | 2014-03-14 | 2016-05-17 | Twilio, Inc. | System and method for a work distribution service |
US9226217B2 (en) | 2014-04-17 | 2015-12-29 | Twilio, Inc. | System and method for enabling multi-modal communication |
US10553098B2 (en) | 2014-05-20 | 2020-02-04 | Ooma, Inc. | Appliance device integration with alarm systems |
US9633547B2 (en) | 2014-05-20 | 2017-04-25 | Ooma, Inc. | Security monitoring and control |
US9774687B2 (en) | 2014-07-07 | 2017-09-26 | Twilio, Inc. | System and method for managing media and signaling in a communication platform |
US9246694B1 (en) | 2014-07-07 | 2016-01-26 | Twilio, Inc. | System and method for managing conferencing in a distributed communication network |
US9516101B2 (en) | 2014-07-07 | 2016-12-06 | Twilio, Inc. | System and method for collecting feedback in a multi-tenant communication platform |
US9251371B2 (en) | 2014-07-07 | 2016-02-02 | Twilio, Inc. | Method and system for applying data retention policies in a computing platform |
US11330100B2 (en) * | 2014-07-09 | 2022-05-10 | Ooma, Inc. | Server based intelligent personal assistant services |
US9749428B2 (en) | 2014-10-21 | 2017-08-29 | Twilio, Inc. | System and method for providing a network discovery service platform |
WO2016069991A1 (en) * | 2014-10-31 | 2016-05-06 | Orion Labs | Group communication device management |
US10402038B2 (en) | 2015-01-08 | 2019-09-03 | Hand Held Products, Inc. | Stack handling using multiple primary user interfaces |
US10262660B2 (en) | 2015-01-08 | 2019-04-16 | Hand Held Products, Inc. | Voice mode asset retrieval |
US10061565B2 (en) | 2015-01-08 | 2018-08-28 | Hand Held Products, Inc. | Application development using mutliple primary user interfaces |
US11081087B2 (en) | 2015-01-08 | 2021-08-03 | Hand Held Products, Inc. | Multiple primary user interfaces |
US9477975B2 (en) | 2015-02-03 | 2016-10-25 | Twilio, Inc. | System and method for a media intelligence platform |
CN104683456B (zh) * | 2015-02-13 | 2017-06-23 | 腾讯科技(深圳)有限公司 | 业务处理方法、服务器及终端 |
US9472196B1 (en) | 2015-04-22 | 2016-10-18 | Google Inc. | Developer voice actions system |
US10009286B2 (en) | 2015-05-08 | 2018-06-26 | Ooma, Inc. | Communications hub |
US10419891B2 (en) | 2015-05-14 | 2019-09-17 | Twilio, Inc. | System and method for communicating through multiple endpoints |
US9948703B2 (en) | 2015-05-14 | 2018-04-17 | Twilio, Inc. | System and method for signaling through data storage |
US10659349B2 (en) | 2016-02-04 | 2020-05-19 | Twilio Inc. | Systems and methods for providing secure network exchanged for a multitenant virtual private cloud |
US9740751B1 (en) | 2016-02-18 | 2017-08-22 | Google Inc. | Application keywords |
US9922648B2 (en) | 2016-03-01 | 2018-03-20 | Google Llc | Developer voice actions system |
US10063713B2 (en) | 2016-05-23 | 2018-08-28 | Twilio Inc. | System and method for programmatic device connectivity |
US10686902B2 (en) | 2016-05-23 | 2020-06-16 | Twilio Inc. | System and method for a multi-channel notification service |
US10339934B2 (en) | 2016-06-27 | 2019-07-02 | Google Llc | Asynchronous processing of user requests |
US9691384B1 (en) | 2016-08-19 | 2017-06-27 | Google Inc. | Voice action biasing system |
CN106970717A (zh) * | 2017-03-24 | 2017-07-21 | 海马云(天津)信息技术有限公司 | 服务器文本信息输入的方法和装置 |
CN107146623B (zh) * | 2017-04-07 | 2021-03-16 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音识别方法、装置和系统 |
KR102060775B1 (ko) * | 2017-06-27 | 2019-12-30 | 삼성전자주식회사 | 음성 입력에 대응하는 동작을 수행하는 전자 장치 |
US10708268B2 (en) | 2017-07-31 | 2020-07-07 | Airwatch, Llc | Managing voice applications within a digital workspace |
KR102460491B1 (ko) * | 2017-12-06 | 2022-10-31 | 삼성전자주식회사 | 전자 장치 및 그의 제어 방법 |
US12125486B2 (en) | 2018-05-07 | 2024-10-22 | Google Llc | Multi-modal interaction between users, automated assistants, and other computing services |
CN112868060B (zh) * | 2018-05-07 | 2024-07-12 | 谷歌有限责任公司 | 用户、自动化助理和其它计算服务之间的多模态交互 |
US11436215B2 (en) | 2018-08-20 | 2022-09-06 | Samsung Electronics Co., Ltd. | Server and control method thereof |
CN110543290B (zh) * | 2018-09-04 | 2024-03-05 | 谷歌有限责任公司 | 多模态响应 |
US10949228B1 (en) * | 2018-09-28 | 2021-03-16 | United Services Automobile Association (Usaa) | System and method for controlling the content of a device in response to an audible request |
RU2696221C1 (ru) * | 2018-11-06 | 2019-07-31 | Федеральное государственное казенное военное образовательное учреждение высшего образования Академия Федеральной службы охраны Российской Федерации | Способ передачи многомодальной информации на критически важных объектах |
RU2688248C1 (ru) * | 2019-03-07 | 2019-05-21 | Сергей Иванович Тарасов | Система и способ передачи запросов пользователям |
CN109884907B (zh) | 2019-03-11 | 2021-07-20 | 广东美的制冷设备有限公司 | 家电设备状态播报方法、装置及设备 |
CN112073777B (zh) * | 2019-06-10 | 2022-06-28 | 海信视像科技股份有限公司 | 一种语音交互方法及显示设备 |
CN112073776B (zh) * | 2019-06-10 | 2022-06-24 | 海信视像科技股份有限公司 | 语音控制方法及显示设备 |
CN111966931A (zh) * | 2020-08-23 | 2020-11-20 | 云知声智能科技股份有限公司 | 控件的渲染方法及装置 |
US11972095B2 (en) | 2021-03-23 | 2024-04-30 | Microsoft Technology Licensing, Llc | Voice assistant-enabled client application with user view context and multi-modal input support |
US12050841B2 (en) * | 2021-03-23 | 2024-07-30 | Microsoft Technology Licensing, Llc | Voice assistant-enabled client application with user view context |
US11789696B2 (en) * | 2021-03-23 | 2023-10-17 | Microsoft Technology Licensing, Llc | Voice assistant-enabled client application with user view context |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060235694A1 (en) | 2005-04-14 | 2006-10-19 | International Business Machines Corporation | Integrating conversational speech into Web browsers |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6269336B1 (en) * | 1998-07-24 | 2001-07-31 | Motorola, Inc. | Voice browser for interactive services and methods thereof |
US6185535B1 (en) * | 1998-10-16 | 2001-02-06 | Telefonaktiebolaget Lm Ericsson (Publ) | Voice control of a user interface to service applications |
US6633846B1 (en) * | 1999-11-12 | 2003-10-14 | Phoenix Solutions, Inc. | Distributed realtime speech recognition system |
US7085719B1 (en) * | 2000-07-13 | 2006-08-01 | Rockwell Electronics Commerce Technologies Llc | Voice filter for normalizing an agents response by altering emotional and word content |
US7409349B2 (en) * | 2001-05-04 | 2008-08-05 | Microsoft Corporation | Servers for web enabled speech recognition |
US6785654B2 (en) * | 2001-11-30 | 2004-08-31 | Dictaphone Corporation | Distributed speech recognition system with speech recognition engines offering multiple functionalities |
US7210098B2 (en) * | 2002-02-18 | 2007-04-24 | Kirusa, Inc. | Technique for synchronizing visual and voice browsers to enable multi-modal browsing |
SE0202058D0 (sv) | 2002-07-02 | 2002-07-02 | Ericsson Telefon Ab L M | Voice browsing architecture based on adaptive keyword spotting |
US20040128136A1 (en) * | 2002-09-20 | 2004-07-01 | Irani Pourang Polad | Internet voice browser |
US7016845B2 (en) * | 2002-11-08 | 2006-03-21 | Oracle International Corporation | Method and apparatus for providing speech recognition resolution on an application server |
US7003464B2 (en) * | 2003-01-09 | 2006-02-21 | Motorola, Inc. | Dialog recognition and control in a voice browser |
US7254542B2 (en) * | 2003-03-31 | 2007-08-07 | International Business Machines Corporation | Portal data passing through non-persistent browser cookies |
EP1464920B1 (de) * | 2003-04-03 | 2007-07-25 | Erwin Pristner | Vorrichtung zum Erfassen, Bestimmen und Dokumentieren von Schäden, insbesondere durch plötzliche Ereignisse verursachte Deformationen an lackierten Oberflächen |
US7269562B2 (en) * | 2003-04-29 | 2007-09-11 | Intervoice Limited Partnership | Web service call flow speech components |
US7200559B2 (en) * | 2003-05-29 | 2007-04-03 | Microsoft Corporation | Semantic object synchronous understanding implemented with speech application language tags |
DE602004008887T2 (de) * | 2004-05-18 | 2008-01-17 | Alcatel Lucent | Verfahren und Server zur Bereitstellung eines multi-modalen Dialogs |
US20060036770A1 (en) * | 2004-07-30 | 2006-02-16 | International Business Machines Corporation | System for factoring synchronization strategies from multimodal programming model runtimes |
US7751431B2 (en) * | 2004-12-30 | 2010-07-06 | Motorola, Inc. | Method and apparatus for distributed speech applications |
US8429655B2 (en) * | 2005-04-29 | 2013-04-23 | Microsoft Corporation | System and method for asynchronous processing in page lifecycle |
US7809575B2 (en) * | 2007-02-27 | 2010-10-05 | Nuance Communications, Inc. | Enabling global grammars for a particular multimodal application |
US7945851B2 (en) * | 2007-03-14 | 2011-05-17 | Nuance Communications, Inc. | Enabling dynamic voiceXML in an X+V page of a multimodal application |
-
2007
- 2007-12-31 US US11/967,356 patent/US8370160B2/en active Active
-
2008
- 2008-12-16 RU RU2010132214/08A patent/RU2494444C2/ru active
- 2008-12-16 KR KR1020107017167A patent/KR101233039B1/ko active IP Right Grant
- 2008-12-16 WO PCT/US2008/086953 patent/WO2009088665A2/en active Application Filing
- 2008-12-16 EP EP08869336.1A patent/EP2243095B1/en active Active
- 2008-12-16 CN CN200880123608.6A patent/CN101911064B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060235694A1 (en) | 2005-04-14 | 2006-10-19 | International Business Machines Corporation | Integrating conversational speech into Web browsers |
Also Published As
Publication number | Publication date |
---|---|
US20090171659A1 (en) | 2009-07-02 |
KR20100109943A (ko) | 2010-10-11 |
EP2243095A2 (en) | 2010-10-27 |
EP2243095B1 (en) | 2018-07-18 |
US8370160B2 (en) | 2013-02-05 |
RU2494444C2 (ru) | 2013-09-27 |
WO2009088665A2 (en) | 2009-07-16 |
CN101911064A (zh) | 2010-12-08 |
CN101911064B (zh) | 2017-04-05 |
WO2009088665A3 (en) | 2010-04-15 |
RU2010132214A (ru) | 2012-02-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101233039B1 (ko) | 분산형 멀티모드 애플리케이션을 구현하기 위한 방법 및 장치 | |
KR101237622B1 (ko) | 분산된 멀티모드 애플리케이션을 구현하기 위한 방법 및 장치 | |
US7272564B2 (en) | Method and apparatus for multimodal communication with user control of delivery modality | |
US9946511B2 (en) | Method for user training of information dialogue system | |
CN107112016B (zh) | 多模态状态循环 | |
US11749276B2 (en) | Voice assistant-enabled web application or web page | |
CA2467220C (en) | Semantic object synchronous understanding implemented with speech application language tags | |
US7680816B2 (en) | Method, system, and computer program product providing for multimodal content management | |
RU2355045C2 (ru) | Последовательный мультимодальный ввод | |
US7739350B2 (en) | Voice enabled network communications | |
EP1482479A1 (en) | Semantic object synchronous understanding for highly interactive interface | |
JP2015011170A (ja) | ローカルな音声認識を行なう音声認識クライアント装置 | |
CN103973542B (zh) | 一种语音信息处理方法及装置 | |
US20190347067A1 (en) | User interface interaction channel | |
Rössler et al. | Multimodal interaction for mobile environments | |
US12267395B2 (en) | Communication platform shifting for voice-enabled device | |
US11722572B2 (en) | Communication platform shifting for voice-enabled device | |
JP2009145435A (ja) | 複数の機器に使用される不特定話者音声認識エンジンをインターネットを介して個別のユーザに提供するシステム及び方法 | |
JP2004246865A (ja) | 音声応答ウェブシステム及びその入出力制御方法 | |
Hosn et al. | Multi-modal e-Business |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0105 | International application |
Patent event date: 20100730 Patent event code: PA01051R01D Comment text: International Patent Application |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
N231 | Notification of change of applicant | ||
PN2301 | Change of applicant |
Patent event date: 20101229 Comment text: Notification of Change of Applicant Patent event code: PN23011R01D |
|
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20111021 Patent event code: PE09021S01D |
|
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20120531 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20121231 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20130206 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20130206 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
FPAY | Annual fee payment |
Payment date: 20160122 Year of fee payment: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20160122 Start annual number: 4 End annual number: 4 |
|
FPAY | Annual fee payment |
Payment date: 20170126 Year of fee payment: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20170126 Start annual number: 5 End annual number: 5 |
|
FPAY | Annual fee payment |
Payment date: 20180126 Year of fee payment: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20180126 Start annual number: 6 End annual number: 6 |
|
FPAY | Annual fee payment |
Payment date: 20190124 Year of fee payment: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20190124 Start annual number: 7 End annual number: 7 |
|
FPAY | Annual fee payment |
Payment date: 20200129 Year of fee payment: 8 |
|
PR1001 | Payment of annual fee |
Payment date: 20200129 Start annual number: 8 End annual number: 8 |
|
PR1001 | Payment of annual fee |
Payment date: 20210128 Start annual number: 9 End annual number: 9 |
|
PR1001 | Payment of annual fee |
Payment date: 20220124 Start annual number: 10 End annual number: 10 |
|
PR1001 | Payment of annual fee |
Payment date: 20250122 Start annual number: 13 End annual number: 13 |