KR102629385B1 - 바지-인 관련 직접 경로를 지원하는 저전력 보이스 트리거 시스템을 포함하는 애플리케이션 프로세서, 이를 포함하는 전자 장치 및 그 동작 방법 - Google Patents
바지-인 관련 직접 경로를 지원하는 저전력 보이스 트리거 시스템을 포함하는 애플리케이션 프로세서, 이를 포함하는 전자 장치 및 그 동작 방법 Download PDFInfo
- Publication number
- KR102629385B1 KR102629385B1 KR1020180009496A KR20180009496A KR102629385B1 KR 102629385 B1 KR102629385 B1 KR 102629385B1 KR 1020180009496 A KR1020180009496 A KR 1020180009496A KR 20180009496 A KR20180009496 A KR 20180009496A KR 102629385 B1 KR102629385 B1 KR 102629385B1
- Authority
- KR
- South Korea
- Prior art keywords
- audio
- voice trigger
- data
- trigger
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000012937 correction Methods 0.000 claims abstract description 54
- 238000012545 processing Methods 0.000 claims description 13
- 239000004065 semiconductor Substances 0.000 claims description 7
- 238000012546 transfer Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 abstract description 11
- 238000010586 diagram Methods 0.000 description 30
- 230000006870 function Effects 0.000 description 13
- 230000005540 biological transmission Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 7
- OUXCBPLFCPMLQZ-WOPPDYDQSA-N 4-amino-1-[(2r,3s,4s,5r)-4-hydroxy-5-(hydroxymethyl)-3-methyloxolan-2-yl]-5-iodopyrimidin-2-one Chemical compound C[C@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)N=C(N)C(I)=C1 OUXCBPLFCPMLQZ-WOPPDYDQSA-N 0.000 description 6
- 230000005236 sound signal Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 241000269319 Squalius cephalus Species 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000003190 augmentative effect Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 230000002618 waking effect Effects 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- 101000836337 Homo sapiens Probable helicase senataxin Proteins 0.000 description 1
- 101000615747 Homo sapiens tRNA-splicing endonuclease subunit Sen2 Proteins 0.000 description 1
- 102100027178 Probable helicase senataxin Human genes 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002567 electromyography Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 102100021774 tRNA-splicing endonuclease subunit Sen2 Human genes 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L15/222—Barge in, i.e. overridable guidance for interrupting prompts
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3234—Power saving characterised by the action undertaken
- G06F1/3287—Power saving characterised by the action undertaken by switching off individual functional units in the computer system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/162—Interface to dedicated audio devices, e.g. audio drivers, interface to CODECs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- General Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Computer Hardware Design (AREA)
- Computing Systems (AREA)
- Telephone Function (AREA)
- Circuit For Audible Band Transducer (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Electrophonic Musical Instruments (AREA)
Abstract
Description
도 2a는 본 발명의 실시예들에 따른 전자 장치를 나타내는 블록도이다.
도 2b는 도 2a의 전자 장치의 구현 예를 나타내는 도면이다.
도 3은 본 발명의 실시예들에 따른 애플리케이션 프로세서를 나타내는 블록도이다.
도 4는 본 발명의 실시예들에 따른 애플리케이션 프로세서에 포함되는 에코 제거기를 나타내는 블록도이다.
도 5는 본 발명의 실시예들에 따른 애플리케이션 프로세서의 보이스 트리거 시스템 및 오디오 서브 시스템의 연결 관계를 나타내는 블록도이다.
도 6a는 도 5의 애플리케이션 프로세서에 포함되는 다이렉트 버스의 일 예를 나타내는 도면이다.
도 6b는 도 5의 애플리케이션 프로세서에 포함되는 메일 박스 모듈의 일 예를 나타내는 도면이다.
도 7은 본 발명의 실시예들에 따른 애플리케이션 프로세서의 동작 방법을 나타내는 순서도이다.
도 8은 도 7의 애플리케이션 프로세서의 동작 방법을 설명하기 위한 블록도이다.
도 9는 본 발명의 실시예들에 따른 애플리케이션 프로세서의 동작 방법을 나타내는 순서도이다.
도 10은 도 9의 애플리케이션 프로세서의 동작 방법을 설명하기 위한 블록도이다.
도 11은 본 발명의 실시예들에 따른 애플리케이션 프로세서의 보이스 트리거 시스템 및 오디오 서브 시스템의 연결 관계를 나타내는 블록도이다.
도 12는 본 발명의 실시예들에 따른 애플리케이션 프로세서의 동작 방법을 나타내는 순서도이다.
도 13은 도 12의 애플리케이션 프로세서의 동작 방법을 설명하기 위한 블록도이다.
도 14는 본 발명의 실시예들에 따른 애플리케이션 프로세서의 보이스 트리거 시스템 및 오디오 서브 시스템의 연결 관계를 나타내는 블록도이다.
도 15는 본 발명의 실시예들에 따른 애플리케이션 프로세서의 동작 방법을 나타내는 순서도이다.
도 16은 도 15의 애플리케이션 프로세서의 동작 방법을 설명하기 위한 블록도이다.
도 17은 본 발명의 실시예들에 따른 애플리케이션 프로세서의 보이스 트리거 시스템 및 오디오 서브 시스템의 연결 관계를 나타내는 블록도이다.
도 18a 및 18b는 본 발명의 실시예들에 따른 애플리케이션 프로세서의 파워 도메인을 설명하기 위한 도면들이다.
Claims (20)
- 시스템 버스;
상기 시스템 버스에 전기적으로 연결된 호스트 프로세서;
상기 시스템 버스에 전기적으로 연결되고 트리거 인터페이스를 통하여 제공되는 트리거 입력 신호에 기초하여 보이스 트리거 동작을 수행하여 트리거 이벤트를 발생하는 보이스 트리거 시스템;
상기 시스템 버스에 전기적으로 연결되고 오디오 인터페이스를 통하여 재생 및 녹음되는 오디오 스트림을 처리하는 오디오 서브 시스템; 및
상기 보이스 트리거 시스템 및 상기 오디오 서브 시스템을 전기적으로 연결하고, 상기 보이스 트리거 동작을 수행하는 동안에 오디오 재생을 동시에 수행하는 바지-인(barge-in) 상황에서 상기 보이스 트리거 시스템 및 상기 오디오 서브 시스템 사이의 직접 경로를 제공하는 다이렉트 버스를 포함하고,
상기 바지-인 상황에서 상기 오디오 인터페이스를 통하여 상기 오디오 재생을 수행하는 동안에, 상기 다이렉트 버스를 이용하여, 마이크를 통하여 수신되는 마이크 데이터에 대한 에코 제거(echo cancellation)를 수행하여 보정 데이터를 발생하고 상기 보이스 트리거 시스템에 의해 상기 보정 데이터에 기초하여 상기 보이스 트리거 동작을 수행하며,
상기 보이스 트리거 시스템은 상기 트리거 입력 신호의 샘플 데이터를 상기 다이렉트 버스를 통하여 상기 오디오 서브 시스템에 전송하고,
상기 오디오 서브 시스템은 오디오 출력 데이터에 기초하여 상기 샘플 데이터에 대한 상기 에코 제거를 수행하여 상기 보정 데이터에 대응하는 보정 샘플 데이터를 발생하고, 상기 보정 샘플 데이터를 상기 다이렉트 버스를 통하여 상기 보이스 트리거 시스템에 전송하며,
상기 보이스 트리거 시스템은 상기 보정 샘플 데이터에 기초하여 상기 보이스 트리거 동작을 수행하는 애플리케이션 프로세서. - 제 1 항에 있어서, 상기 다이렉트 버스는,
상기 보이스 트리거 시스템으로부터 상기 오디오 서브 시스템으로의 제1 데이터 전송을 수행하는 제1 직접 경로; 및
상기 오디오 서브 시스템으로부터 상기 보이스 트리거 시스템으로의 제2 데이터 전송을 수행하는 제2 직접 경로를 포함하는 것을 특징으로 하는 애플리케이션 프로세서. - 제 2 항에 있어서, 상기 오디오 서브 시스템은,
상기 에코 제거를 수행하는 에코 제거기를 포함하는 것을 특징으로 하는 애플리케이션 프로세서. - 제 3 항에 있어서,
상기 오디오 출력 데이터에 기초하여 상기 오디오 인터페이스의 출력 패드를 통하여 상기 오디오 재생을 수행하는 동안에,
상기 보이스 트리거 시스템은 상기 트리거 인터페이스를 통하여 상기 트리거 입력 신호를 수신하는 것을 특징으로 하는 애플리케이션 프로세서. - 제 4 항에 있어서,
상기 보이스 트리거 시스템은 상기 트리거 입력 신호의 상기 샘플 데이터를 상기 제1 직접 경로를 통하여 상기 오디오 서브 시스템에 전송하고,
상기 오디오 서브 시스템의 상기 에코 제거기는 상기 오디오 출력 데이터에 기초하여 상기 샘플 데이터에 대한 에코 제거를 수행하여 상기 보정 샘플 데이터를 발생하고,
상기 오디오 서브 시스템은 상기 보정 샘플 데이터를 상기 제2 직접 경로를 통하여 상기 보이스 트리거 시스템에 전송하는 것을 특징으로 하는 애플리케이션 프로세서. - 제 3 항에 있어서,
상기 오디오 출력 데이터에 기초하여 상기 오디오 인터페이스의 출력 패드를 통하여 상기 오디오 재생을 수행하는 동안에,
상기 오디오 서브 시스템은 상기 오디오 인터페이스의 입력 패드를 통하여 오디오 입력 신호를 수신하는 것을 특징으로 하는 애플리케이션 프로세서. - 제 6 항에 있어서,
상기 오디오 서브 시스템의 상기 에코 제거기는 상기 오디오 출력 데이터에 기초하여 상기 오디오 입력 신호의 오디오 입력 데이터에 대한 에코 제거를 수행하여 보정 오디오 입력 데이터를 발생하고,
상기 오디오 서브 시스템은 상기 보정 오디오 입력 데이터를 상기 제2 직접 경로를 통하여 상기 보이스 트리거 시스템에 전송하며,
상기 보이스 트리거 시스템은 상기 보정 오디오 입력 데이터에 기초하여 상기 보이스 트리거 동작을 수행하는 것을 특징으로 하는 애플리케이션 프로세서. - 제 6 항에 있어서,
상기 오디오 재생이 수행되는 동안 상기 트리거 인터페이스는 디스에이블되는 것을 특징으로 하는 애플리케이션 프로세서. - 제 2 항에 있어서, 상기 보이스 트리거 시스템은,
상기 에코 제거를 수행하는 에코 제거기를 포함하는 것을 특징으로 하는 애플리케이션 프로세서. - 제 9 항에 있어서,
상기 오디오 출력 데이터에 기초하여 상기 오디오 인터페이스의 출력 패드를 통하여 상기 오디오 재생을 수행하는 동안에,
상기 보이스 트리거 시스템은 상기 트리거 인터페이스를 통하여 상기 트리거 입력 신호를 수신하는 것을 특징으로 하는 애플리케이션 프로세서. - 제 10 항에 있어서,
상기 오디오 서브 시스템은 상기 오디오 출력 데이터를 상기 제2 직접 경로를 통하여 상기 보이스 트리거 시스템에 전송하고,
상기 보이스 트리거 시스템의 상기 에코 제거기는 상기 오디오 출력 데이터에 기초하여 상기 트리거 입력 신호의 샘플 데이터에 대한 에코 제거를 수행하여 보정 샘플 데이터를 발생하고,
상기 보이스 트리거 시스템은 상기 보정 샘플 데이터에 기초하여 상기 보이스 트리거 동작을 수행하는 것을 특징으로 하는 애플리케이션 프로세서. - 제 2 항에 있어서, 상기 트리거 인터페이스에 연결된 오디오 코덱은,
상기 에코 제거를 수행하는 에코 제거기를 포함하는 것을 특징으로 하는 애플리케이션 프로세서. - 제 12 항에 있어서,
상기 오디오 출력 데이터에 기초하여 상기 오디오 인터페이스의 출력 패드를 통하여 상기 오디오 재생을 수행하는 동안에,
상기 오디오 코덱은 마이크로부터 상기 마이크 데이터를 수신하는 것을 특징으로 하는 애플리케이션 프로세서. - 제 13 항에 있어서,
상기 오디오 코덱의 상기 에코 제거기는 상기 오디오 출력 데이터에 기초하여 상기 마이크 데이터에 대한 에코 제거를 수행하여 보정 트리거 입력 신호를 발생하고,
상기 오디오 코덱은 상기 보정 트리거 입력 신호를 상기 트리거 인터페이스를 통하여 상기 보이스 트리거 시스템에 전송하며,
상기 보이스 트리거 시스템은 상기 보정 트리거 입력 신호의 샘플 데이터에 기초하여 상기 보이스 트리거 동작을 수행하는 것을 특징으로 하는 애플리케이션 프로세서. - 제 1 항에 있어서,
상기 다이렉트 버스는, 상기 보이스 트리거 시스템 및 상기 오디오 서브 시스템 사이에 배치되고, 상기 바지-인 상황에서 상기 보이스 트리거 시스템과 상기 오디오 서브 시스템 사이에 전달되는 데이터를 저장하는 공유 메모리로 대체되고,
상기 오디오 인터페이스를 통하여 상기 오디오 재생을 수행하는 동안에, 상기 공유 메모리를 이용하여, 상기 마이크를 통하여 수신되는 상기 마이크 데이터에 대한 에코 제거를 수행하여 상기 보정 데이터를 발생하고 상기 보이스 트리거 시스템에 의해 상기 보정 데이터에 기초하여 상기 보이스 트리거 동작을 수행하는 것을 특징으로 하는 애플리케이션 프로세서. - 제 1 항에 있어서,
상기 시스템 버스, 상기 호스트 프로세서, 상기 보이스 트리거 시스템, 상기 오디오 서브 시스템 및 상기 다이렉트 버스는 하나의 반도체 칩에 함께 집적되는 것을 특징으로 하는 애플리케이션 프로세서. - 제 1 항에 있어서,
상기 오디오 인터페이스를 통하여 상기 오디오 재생을 수행하는 동안에, 상기 호스트 프로세서 및 상기 시스템 버스는 상기 보이스 트리거 동작을 위해 액티브(active) 모드로 전환함이 없이 슬립(sleep) 모드를 유지하는 것을 특징으로 하는 애플리케이션 프로세서. - 제 1 항에 있어서,
상기 보이스 트리거 시스템 및 상기 오디오 서브 시스템의 각각은 상기 호스트 프로세서와 독립적으로 파워 게이팅되어 상기 호스트 프로세서와 독립적으로 인에이블되는 것을 특징으로 하는 애플리케이션 프로세서. - 애플리케이션 프로세서; 및
적어도 하나의 오디오 입출력 장치를 포함하고,
상기 애플리케이션 프로세서는,
시스템 버스;
상기 시스템 버스에 전기적으로 연결된 호스트 프로세서;
상기 시스템 버스에 전기적으로 연결되고 트리거 인터페이스를 통하여 제공되는 트리거 입력 신호에 기초하여 보이스 트리거 동작을 수행하여 트리거 이벤트를 발생하는 보이스 트리거 시스템;
상기 시스템 버스에 전기적으로 연결되고 오디오 인터페이스를 통하여 재생 및 녹음되는 오디오 스트림을 처리하는 오디오 서브 시스템; 및
상기 보이스 트리거 시스템 및 상기 오디오 서브 시스템을 전기적으로 연결하고, 상기 보이스 트리거 동작을 수행하는 동안에 오디오 재생을 동시에 수행하는 바지-인(barge-in) 상황에서 상기 보이스 트리거 시스템 및 상기 오디오 서브 시스템 사이의 직접 경로를 제공하는 다이렉트 버스를 포함하고,
상기 바지-인 상황에서 상기 오디오 인터페이스를 통하여 상기 오디오 재생을 수행하는 동안에, 상기 다이렉트 버스를 이용하여, 마이크를 통하여 수신되는 마이크 데이터에 대한 에코 제거(echo cancellation)를 수행하여 보정 데이터를 발생하고 상기 보이스 트리거 시스템에 의해 상기 보정 데이터에 기초하여 상기 보이스 트리거 동작을 수행하며,
상기 보이스 트리거 시스템은 상기 트리거 입력 신호의 샘플 데이터를 상기 다이렉트 버스를 통하여 상기 오디오 서브 시스템에 전송하고,
상기 오디오 서브 시스템은 오디오 출력 데이터에 기초하여 상기 샘플 데이터에 대한 상기 에코 제거를 수행하여 상기 보정 데이터에 대응하는 보정 샘플 데이터를 발생하고, 상기 보정 샘플 데이터를 상기 다이렉트 버스를 통하여 상기 보이스 트리거 시스템에 전송하며,
상기 보이스 트리거 시스템은 상기 보정 샘플 데이터에 기초하여 상기 보이스 트리거 동작을 수행하는 전자 장치. - 시스템 버스와, 상기 시스템 버스에 전기적으로 연결되는 호스트 프로세서, 보이스 트리거 시스템, 오디오 서브 시스템 및 다이렉트 버스를 하나의 반도체 칩에 함께 집적하여 형성된 애플리케이션 프로세서에서, 상기 보이스 트리거 시스템에 의해 트리거 인터페이스를 통하여 제공되는 트리거 입력 신호에 기초하여 보이스 트리거 동작을 수행하여 트리거 이벤트를 발생하는 단계;
상기 애플리케이션 프로세서에서, 상기 오디오 서브 시스템에 의해 오디오 인터페이스를 통하여 재생 및 녹음되는 오디오 스트림을 처리하는 단계;
상기 보이스 트리거 동작을 수행하는 동안에 상기 오디오 인터페이스를 통하여 오디오 재생을 동시에 수행하는 바지-인(barge-in) 상황에서, 상기 보이스 트리거 시스템 및 상기 오디오 서브 시스템을 전기적으로 연결하고 상기 바지-인 상황에서 상기 보이스 트리거 시스템 및 상기 오디오 서브 시스템 사이의 직접 경로를 제공하는 상기 다이렉트 버스를 이용하여, 마이크를 통하여 수신되는 마이크 데이터에 대한 에코 제거(echo cancellation)를 수행하여 보정 데이터를 발생하는 단계; 및
상기 보이스 트리거 시스템에 의해 상기 보정 데이터에 기초하여 상기 보이스 트리거 동작을 수행하는 단계를 포함하며,
상기 보이스 트리거 시스템은 상기 트리거 입력 신호의 샘플 데이터를 상기 다이렉트 버스를 통하여 상기 오디오 서브 시스템에 전송하고,
상기 오디오 서브 시스템은 오디오 출력 데이터에 기초하여 상기 샘플 데이터에 대한 상기 에코 제거를 수행하여 상기 보정 데이터에 대응하는 보정 샘플 데이터를 발생하고, 상기 보정 샘플 데이터를 상기 다이렉트 버스를 통하여 상기 보이스 트리거 시스템에 전송하며,
상기 보이스 트리거 시스템은 상기 보정 샘플 데이터에 기초하여 상기 보이스 트리거 동작을 수행하는 애플리케이션 프로세서의 동작 방법.
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180009496A KR102629385B1 (ko) | 2018-01-25 | 2018-01-25 | 바지-인 관련 직접 경로를 지원하는 저전력 보이스 트리거 시스템을 포함하는 애플리케이션 프로세서, 이를 포함하는 전자 장치 및 그 동작 방법 |
US16/185,776 US10971154B2 (en) | 2018-01-25 | 2018-11-09 | Application processor including low power voice trigger system with direct path for barge-in, electronic device including the same and method of operating the same |
DE102018128225.7A DE102018128225A1 (de) | 2018-01-25 | 2018-11-12 | Anwendungsprozessor mit Sprachtriggersystem mit niedriger Leistung und direktem Weg zum Unterbrechen, elektronisches Gerät mit demselben und Verfahren zum Betreiben desselben |
TW107140152A TWI776988B (zh) | 2018-01-25 | 2018-11-13 | 包含具插話用直接路徑之低電力語音觸發系統的應用處理器、包含該處理器的電子裝置及其操作方法 |
CN201910033457.5A CN110083225B (zh) | 2018-01-25 | 2019-01-14 | 应用处理器、电子装置以及操作应用处理器的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180009496A KR102629385B1 (ko) | 2018-01-25 | 2018-01-25 | 바지-인 관련 직접 경로를 지원하는 저전력 보이스 트리거 시스템을 포함하는 애플리케이션 프로세서, 이를 포함하는 전자 장치 및 그 동작 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20190090596A KR20190090596A (ko) | 2019-08-02 |
KR102629385B1 true KR102629385B1 (ko) | 2024-01-25 |
Family
ID=67145229
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180009496A Active KR102629385B1 (ko) | 2018-01-25 | 2018-01-25 | 바지-인 관련 직접 경로를 지원하는 저전력 보이스 트리거 시스템을 포함하는 애플리케이션 프로세서, 이를 포함하는 전자 장치 및 그 동작 방법 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10971154B2 (ko) |
KR (1) | KR102629385B1 (ko) |
CN (1) | CN110083225B (ko) |
DE (1) | DE102018128225A1 (ko) |
TW (1) | TWI776988B (ko) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110238417A1 (en) * | 2010-03-26 | 2011-09-29 | Kabushiki Kaisha Toshiba | Speech detection apparatus |
US20140222436A1 (en) * | 2013-02-07 | 2014-08-07 | Apple Inc. | Voice trigger for a digital assistant |
Family Cites Families (59)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4266254A (en) * | 1977-06-06 | 1981-05-05 | National Semiconductor Corp. | Integrated circuit for recording and playback of such recording |
US4501012A (en) * | 1980-11-17 | 1985-02-19 | Nissan Motor Company, Limited | Speech recognition system for an automotive vehicle |
US4870704A (en) * | 1984-10-31 | 1989-09-26 | Flexible Computer Corporation | Multicomputer digital processing system |
US4736317A (en) * | 1985-07-17 | 1988-04-05 | Syracuse University | Microprogram-coupled multiple-microprocessor module with 32-bit byte width formed of 8-bit byte width microprocessors |
JPH07113840B2 (ja) * | 1989-06-29 | 1995-12-06 | 三菱電機株式会社 | 音声検出器 |
US5657422A (en) * | 1994-01-28 | 1997-08-12 | Lucent Technologies Inc. | Voice activity detection driven noise remediator |
US5708704A (en) * | 1995-04-07 | 1998-01-13 | Texas Instruments Incorporated | Speech recognition method and system with improved voice-activated prompt interrupt capability |
US6101472A (en) * | 1997-04-16 | 2000-08-08 | International Business Machines Corporation | Data processing system and method for navigating a network using a voice command |
GB2325112B (en) * | 1997-05-06 | 2002-07-31 | Ibm | Voice processing system |
US6151397A (en) * | 1997-05-16 | 2000-11-21 | Motorola, Inc. | Method and system for reducing undesired signals in a communication environment |
US6411929B1 (en) * | 1997-11-27 | 2002-06-25 | Hitachi, Ltd. | Speech recognition method and system |
US6574597B1 (en) * | 1998-05-08 | 2003-06-03 | At&T Corp. | Fully expanded context-dependent networks for speech recognition |
US6098043A (en) * | 1998-06-30 | 2000-08-01 | Nortel Networks Corporation | Method and apparatus for providing an improved user interface in speech recognition systems |
US6970925B1 (en) * | 1999-02-03 | 2005-11-29 | William H. Gates, III | Method and system for property notification |
US6353867B1 (en) * | 2000-01-14 | 2002-03-05 | Insilicon Corporation | Virtual component on-chip interface |
US6678661B1 (en) * | 2000-02-11 | 2004-01-13 | International Business Machines Corporation | Method and system of audio highlighting during audio edit functions |
US6725193B1 (en) * | 2000-09-13 | 2004-04-20 | Telefonaktiebolaget Lm Ericsson | Cancellation of loudspeaker words in speech recognition |
AU2002354165A1 (en) * | 2001-12-26 | 2003-07-15 | Sumitomo Special Metals Co., Ltd. | Production method for permanent magnet and press device |
US7587318B2 (en) * | 2002-09-12 | 2009-09-08 | Broadcom Corporation | Correlating video images of lip movements with audio signals to improve speech recognition |
US20040243405A1 (en) * | 2003-05-29 | 2004-12-02 | International Business Machines Corporation | Service method for providing autonomic manipulation of noise sources within computers |
AU2003302486A1 (en) * | 2003-09-15 | 2005-04-06 | Zakrytoe Aktsionernoe Obschestvo Intel | Method and apparatus for encoding audio |
CA2539442C (en) * | 2003-09-17 | 2013-08-20 | Nielsen Media Research, Inc. | Methods and apparatus to operate an audience metering device with voice commands |
US20050114118A1 (en) * | 2003-11-24 | 2005-05-26 | Jeff Peck | Method and apparatus to reduce latency in an automated speech recognition system |
US20050136848A1 (en) * | 2003-12-22 | 2005-06-23 | Matt Murray | Multi-mode audio processors and methods of operating the same |
US8170875B2 (en) | 2005-06-15 | 2012-05-01 | Qnx Software Systems Limited | Speech end-pointer |
US9101279B2 (en) * | 2006-02-15 | 2015-08-11 | Virtual Video Reality By Ritchey, Llc | Mobile user borne brain activity data and surrounding environment data correlation system |
US20080140412A1 (en) * | 2006-12-07 | 2008-06-12 | Jonathan Travis Millman | Interactive tutoring |
CN101636729B (zh) * | 2007-03-16 | 2012-05-16 | 林晖 | 一种存储卡加载数字内容的量化制作系统 |
JP4869420B2 (ja) * | 2010-03-25 | 2012-02-08 | 株式会社東芝 | 音情報判定装置、及び音情報判定方法 |
WO2012025431A2 (en) * | 2010-08-24 | 2012-03-01 | Dolby International Ab | Concealment of intermittent mono reception of fm stereo radio receivers |
US8972251B2 (en) * | 2011-06-07 | 2015-03-03 | Qualcomm Incorporated | Generating a masking signal on an electronic device |
WO2014144579A1 (en) * | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
TWI624709B (zh) * | 2013-06-25 | 2018-05-21 | 寇平公司 | 具有麥克風陣列的眼鏡及其用以減降雜訊的方法 |
US10186262B2 (en) * | 2013-07-31 | 2019-01-22 | Microsoft Technology Licensing, Llc | System with multiple simultaneous speech recognizers |
US9251806B2 (en) * | 2013-09-05 | 2016-02-02 | Intel Corporation | Mobile phone with variable energy consuming speech recognition module |
US9582983B2 (en) * | 2013-09-11 | 2017-02-28 | Intel Corporation | Low power voice trigger for finding mobile devices |
US9385779B2 (en) * | 2013-10-21 | 2016-07-05 | Cisco Technology, Inc. | Acoustic echo control for automated speaker tracking systems |
US20150112690A1 (en) | 2013-10-22 | 2015-04-23 | Nvidia Corporation | Low power always-on voice trigger architecture |
GB2523984B (en) | 2013-12-18 | 2017-07-26 | Cirrus Logic Int Semiconductor Ltd | Processing received speech data |
CN105723451B (zh) * | 2013-12-20 | 2020-02-28 | 英特尔公司 | 从低功率始终侦听模式到高功率语音识别模式的转换 |
US9460735B2 (en) * | 2013-12-28 | 2016-10-04 | Intel Corporation | Intelligent ancillary electronic device |
JP2015138147A (ja) * | 2014-01-22 | 2015-07-30 | シャープ株式会社 | サーバ、対話装置、対話システム、対話方法および対話プログラム |
EP3126929B1 (en) * | 2014-03-31 | 2020-11-18 | Intel Corporation | Location aware power management scheme for always-on- always-listen voice recognition system |
KR102208477B1 (ko) * | 2014-06-30 | 2021-01-27 | 삼성전자주식회사 | 마이크 운용 방법 및 이를 지원하는 전자 장치 |
KR102299330B1 (ko) | 2014-11-26 | 2021-09-08 | 삼성전자주식회사 | 음성 인식 방법 및 그 전자 장치 |
TW201640322A (zh) | 2015-01-21 | 2016-11-16 | 諾爾斯電子公司 | 用於聲音設備之低功率語音觸發及方法 |
US9653079B2 (en) * | 2015-02-12 | 2017-05-16 | Apple Inc. | Clock switching in always-on component |
US9672821B2 (en) * | 2015-06-05 | 2017-06-06 | Apple Inc. | Robust speech recognition in the presence of echo and noise using multiple signals for discrimination |
US9691378B1 (en) * | 2015-11-05 | 2017-06-27 | Amazon Technologies, Inc. | Methods and devices for selectively ignoring captured audio data |
US10089989B2 (en) | 2015-12-07 | 2018-10-02 | Semiconductor Components Industries, Llc | Method and apparatus for a low power voice trigger device |
US10089987B2 (en) * | 2015-12-21 | 2018-10-02 | Invensense, Inc. | Music detection and identification |
KR102501083B1 (ko) * | 2016-02-05 | 2023-02-17 | 삼성전자 주식회사 | 음성 인식 방법 및 이를 사용하는 전자 장치 |
US9805714B2 (en) * | 2016-03-22 | 2017-10-31 | Asustek Computer Inc. | Directional keyword verification method applicable to electronic device and electronic device using the same |
KR101850762B1 (ko) | 2016-07-19 | 2018-04-20 | 최병락 | 내구성이 우수한 방풍부재용 혼합섬유 모헤어 |
US10121494B1 (en) * | 2017-03-30 | 2018-11-06 | Amazon Technologies, Inc. | User presence detection |
CN107577449B (zh) * | 2017-09-04 | 2023-06-23 | 百度在线网络技术(北京)有限公司 | 唤醒语音的拾取方法、装置、设备及存储介质 |
JP2019053165A (ja) * | 2017-09-14 | 2019-04-04 | 株式会社東芝 | 音声認識装置 |
US10482868B2 (en) * | 2017-09-28 | 2019-11-19 | Sonos, Inc. | Multi-channel acoustic echo cancellation |
EP3692522B1 (en) * | 2017-12-31 | 2025-06-18 | Midea Group Co., Ltd. | Method and system for controlling home assistant devices |
-
2018
- 2018-01-25 KR KR1020180009496A patent/KR102629385B1/ko active Active
- 2018-11-09 US US16/185,776 patent/US10971154B2/en active Active
- 2018-11-12 DE DE102018128225.7A patent/DE102018128225A1/de active Pending
- 2018-11-13 TW TW107140152A patent/TWI776988B/zh active
-
2019
- 2019-01-14 CN CN201910033457.5A patent/CN110083225B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110238417A1 (en) * | 2010-03-26 | 2011-09-29 | Kabushiki Kaisha Toshiba | Speech detection apparatus |
US20140222436A1 (en) * | 2013-02-07 | 2014-08-07 | Apple Inc. | Voice trigger for a digital assistant |
Also Published As
Publication number | Publication date |
---|---|
KR20190090596A (ko) | 2019-08-02 |
CN110083225B (zh) | 2024-06-21 |
TWI776988B (zh) | 2022-09-11 |
DE102018128225A1 (de) | 2019-07-25 |
CN110083225A (zh) | 2019-08-02 |
US10971154B2 (en) | 2021-04-06 |
US20190228772A1 (en) | 2019-07-25 |
TW201933086A (zh) | 2019-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11256638B2 (en) | Application processor supporting interrupt during audio playback, electronic device including the same and method of operating the same | |
US20200379932A1 (en) | Application processor for low power operation, electronic device including the same and method of operating the same | |
KR102629424B1 (ko) | 보안 기능을 지원하는 저전력 보이스 트리거 시스템을 포함하는 애플리케이션 프로세서, 이를 포함하는 전자 장치 및 그 동작 방법 | |
KR102459920B1 (ko) | 저전력 에코 제거를 지원하는 애플리케이션 프로세서, 이를 포함하는 전자 장치 및 그 동작 방법 | |
KR102530391B1 (ko) | 외부 인터럽트를 지원하는 저전력 보이스 트리거 시스템을 포함하는 애플리케이션 프로세서, 이를 포함하는 전자 장치 및 그 동작 방법 | |
KR102629385B1 (ko) | 바지-인 관련 직접 경로를 지원하는 저전력 보이스 트리거 시스템을 포함하는 애플리케이션 프로세서, 이를 포함하는 전자 장치 및 그 동작 방법 | |
WO2020025033A1 (zh) | 基于音量的主从切换方法及相关产品 | |
KR102776977B1 (ko) | Usb 모듈을 위한 오디오 서브 시스템의 구동 방법 및 이를 수행하는 시스템 온 칩 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20180125 |
|
PG1501 | Laying open of application | ||
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20201208 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20180125 Comment text: Patent Application |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20230622 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20231101 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20240122 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20240123 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |