KR101724748B1 - Speech recognition apparatus for vehicle - Google Patents
Speech recognition apparatus for vehicle Download PDFInfo
- Publication number
- KR101724748B1 KR101724748B1 KR1020110129412A KR20110129412A KR101724748B1 KR 101724748 B1 KR101724748 B1 KR 101724748B1 KR 1020110129412 A KR1020110129412 A KR 1020110129412A KR 20110129412 A KR20110129412 A KR 20110129412A KR 101724748 B1 KR101724748 B1 KR 101724748B1
- Authority
- KR
- South Korea
- Prior art keywords
- engine
- voice
- user
- command
- capacity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims abstract description 18
- 230000008569 process Effects 0.000 abstract description 7
- 230000001939 inductive effect Effects 0.000 abstract 1
- 230000006870 function Effects 0.000 description 7
- 230000003213 activating effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000004913 activation Effects 0.000 description 5
- 230000009977 dual effect Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 229940061368 sonata Drugs 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000007420 reactivation Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W50/00—Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
- B60W50/08—Interaction between the driver and the control system
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/32—Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Automation & Control Theory (AREA)
- Transportation (AREA)
- Mechanical Engineering (AREA)
- Navigation (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
Abstract
본 발명은 기존의 단일 음성엔진 대신에 2개의 듀얼 음성엔진을 적용하여 소용량의 음성엔진을 PTT 버튼 대용 및 단순 검색을 위해 사용하고, 대용량으로 이루어진 음성엔진을 대용량의 어휘 검색이 필요한 경우에만 활성화시킴으로써, 효율적인 리소스 관리를 할 수 있고, PTT 버튼을 제거할 수 있고 운전자의 시선 분산을 방지할 수 있는 차량용 음성인식 장치를 제공하는데 그 목적이 있다.
또한, 본 발명은 사용자가 음성을 발화 후 음성이 잘못 발화된 경우 대용량 엔진의 음성인식 도중 음성인식 과정을 정지 및 리셋시킴으로써, 대기시간 없이 사용자의 재발화를 유도할 수 있는 차량용 음성인식 장치를 제공하는데 그 목적이 있다.
상기한 목적을 달성하기 위해 본 발명에 따른 차량용 음성인식 장치는 사용자로부터 발화된 소용량 어휘의 음성을 인식하는 제1엔진; 및 사용자로부터 발화된 소용량 어휘에서 대용량 어휘의 음성을 인식할 수 있는 제2엔진;을 포함하고, 상기 제1엔진과 제2엔진은 선택적으로 사용됨으로써, 효율적인 리소스 관리가 이루어질 수 있도록 된 것을 특징으로 한다.In the present invention, two dual-voice engines are applied instead of a conventional single voice engine, a small-capacity voice engine is used for substituting PTT buttons and simple searches, and a large-capacity speech engine is activated only when a large- An object of the present invention is to provide a voice recognition apparatus for a vehicle that can efficiently manage resources and can eliminate a PTT button and prevent a driver from diverging attention.
In addition, the present invention provides a vehicle voice recognition device capable of inducing a user's recurrence without waiting time by stopping and resetting the voice recognition process during voice recognition of a large-capacity engine when a voice is erroneously generated after a user uttered voice It has its purpose.
According to an aspect of the present invention, there is provided a voice recognition apparatus for a vehicle, comprising: a first engine that recognizes a voice of a small capacity vocabulary uttered by a user; And a second engine capable of recognizing a voice of a large capacity vocabulary in a small capacity vocabulary uttered by a user, wherein the first engine and the second engine are selectively used, whereby efficient resource management can be performed do.
Description
본 발명은 차량용 음성인식 장치에 관한 것으로서, 더욱 상세하게는 운전자의 음성명령만으로 차량 내 각종 편의장치를 구동할 수 있는 차량용 음성인식 장치에 관한 것이다.
BACKGROUND OF THE INVENTION 1. Field of the Invention [0002] The present invention relates to a voice recognition apparatus for a vehicle, and more particularly to a voice recognition apparatus for a vehicle capable of driving various convenience devices in a vehicle by voice commands of a driver.
음성인식이란 음성에 포함된 음향학적 정보로부터 음운 즉, 언어적 정보를 추출하여 이를 기계가 인지하고 반응하게 만드는 일련의 과정이다. Speech recognition is a series of processes that extracts phonological or linguistic information from acoustical information included in speech and makes the machine recognize and respond to it.
음성으로 대화하는 것은 수많은 인간과 기계의 정보 교환 매체 중 가장 자연스럽고 간편한 방법으로 인식되어지고 있지만 기계와 음성으로 대화하기 위해서는 인간의 음성을 기계가 처리할 수 있는 코드로 변환을 해줘야 하는 제약이 따르게 된다. 이런 코드로 변환해주는 과정이 바로 음성 인식이다.Speech conversation is recognized as the most natural and easy way to communicate among many human and machine information. However, in order to communicate with machine and voice, there is a restriction to convert the human voice into a code that can process the machine. do. Speech recognition is the process of converting these codes.
최근에는 발전한 음성인식기술을 자동차에 적용하여 간단한 편의 장치, 예를 들면 윈도우의 승강, 와이퍼의 작동 및 정지, 에어컨의 작동, 전조등의 점등 및 소등 등을 운전자의 음성명령만으로 구동할 수 있도록 하고 있다.In recent years, the developed speech recognition technology has been applied to automobiles so that simple convenience devices such as window lift, wiper operation and stop, air conditioner operation, headlight illumination, and the like can be driven only by voice commands of the driver .
종래 차량의 음성인식방법을 설명하면 다음과 같다.A speech recognition method of a conventional vehicle will now be described.
운전자가 음성으로 기구의 작동을 명령하면 마이크로 폰을 통해 운전자의 음성을 입력하는 단계와, 필터링 및 A/D 변환을 통해 아날로그 신호를 디지털 신호로 전처리하는 단계와, 특징벡터 추출 및 음성패턴 분류를 통해 음성명령을 인식하는 단계와, 인식된 음성 명령에 따라 제어대상이 되는 장치를 구동하는 단계로 이루어진다.A step of inputting a voice of a driver through a microphone when the driver commands operation of the device by voice; a step of preprocessing an analog signal into a digital signal through filtering and A / D conversion; Recognizing a voice command through the voice command, and driving the device to be controlled according to the recognized voice command.
현재의 음성인식은 한 개의 음성엔진을 사용하여 소용량 어휘부터 대용량 어휘까지 인식할 수 있도록 되어 있고, PTT(Push-to-Talk) 버튼을 누를 때에만 음성인식을 활성화할 수 있도록 되어 있다.The current speech recognition is capable of recognizing a small capacity vocabulary from a small capacity vocabulary using a single speech engine, and enables voice recognition only when a push-to-talk (PTT) button is pressed.
그러나, 한 개의 음성엔진을 이용하여 음성인식을 하고, PTT 버튼을 이용하여 활성화하는 경우에 다음과 같은 문제점이 있다.However, when voice recognition is performed using one speech engine and activation is performed using the PTT button, the following problem arises.
첫째로, 사용자가 발화 후 잘못 발화됨을 인식하여 이미 발화된 말을 즉시 취소하고 싶을 때, 한 개의 음성엔진만을 사용하면 이미 발화된 말, 예를 들면 어떤 검색어을 검색하라고 지시한 경우 그 검색어에 대한 검색을 취소할 수 없으므로, 이 검색을 마칠 때까지 기다려야 하는 문제점이 있다. First, when a user recognizes that a user has misstated after utterance and desires to immediately cancel uttered utterances immediately, if only one utterance is instructed to instruct a uttered utterance, for example, a certain utterance, It is necessary to wait until the search is completed.
둘째로, 상기 음성엔진은 소용량 어휘에서 대용량 어휘까지 인식하기 위해 프로세스상에서 대용량을 차지하고, PTT 버튼을 제거한 상태에서 음성인식을 할 경우에 상기 대용량으로 이루어진 음성엔진을 항시 활성화된 상태로 사용하여야 하기 때문에, 리소스 관리 측면에서 매우 비효율적인 문제점이 있다.Second, the speech engine occupies a large capacity in the process to recognize small-capacity vocabulary to large-capacity vocabulary. When speech recognition is performed in a state where the PTT button is removed, the speech engine of large capacity must be always used in an activated state , There is a very inefficient problem in terms of resource management.
예를 들어, 음성엔진이 프로세스상에서 차지하는 용량을 100으로 봤을 때, 음성엔진의 활성화 시 항상 100이라는 리소스를 차지하게 되어 매우 비효율적이다.For example, when the speech engine has a capacity of 100 in the process, it is very inefficient because it always occupies 100 resources when activating the speech engine.
세째로, 음성인식을 이용하기 위해 PTT를 버튼을 눌러서 음성엔진을 활성화하여야 하기 때문에, PTT 버튼 누르기 위해 운전자의 시선이 분산되는 문제점이 있다.
Third, since the voice engine must be activated by pressing the PTT button in order to utilize the voice recognition, there is a problem that the driver's line of sight is dispersed for pressing the PTT button.
본 발명은 상기와 같은 문제점을 해결하기 위해 발명한 것으로서, 음성 명령을 수행하기 위한 음성엔진으로 두 개의 엔진(듀얼 엔진)을 적용하여, 사용자가 음성명령을 발화 후 명령어가 잘못 발화됨을 인식한 경우에 명령어를 실행하는 동안에도 새로운 명령어를 인식할 수 있도록 함으로써, 잘못된 음성 명령에 대한 사용자의 명령 대기시간을 단축할 수 있는 차량용 음성인식 장치를 제공하는데 그 목적이 있다.SUMMARY OF THE INVENTION The present invention has been made to solve the above-mentioned problems, and it is an object of the present invention to provide a voice engine for performing a voice command by applying two engines (dual engine) The present invention provides a voice recognition apparatus for a vehicle that can recognize a new command even while executing a command on a voice command, thereby shortening a user's command waiting time for an incorrect voice command.
또한, 본 발명은 기존의 단일 음성 엔진에서 엔진 활성화 기능 및 단순 검색 기능을 가진 소용량의 엔진을 추가로 적용함으로써, 대용량으로 이루어진 음성엔진을 필요한 경우에만 선택적으로 활성화하여, 효율적인 리소스 관리를 할 수 있고, PTT 버튼을 제거하여 운전자의 시선 분산을 방지할 수 있는 차량용 음성인식 장치를 제공하는데 그 목적이 있다.
Further, according to the present invention, by applying a small-capacity engine having an engine activation function and a simple search function in an existing single speech engine, a speech engine having a large capacity can be selectively activated only when necessary, And a voice recognition device for a vehicle that can eliminate a PTT button and prevent a driver from diverging his or her gaze.
상기한 목적을 달성하기 위해 본 발명에 따른 차량용 음성인식 장치는 사용자의 음성명령을 인식하기 위해 활성화 상태로 대기하고 있는 제1엔진; 및According to an aspect of the present invention, there is provided a voice recognition apparatus for a vehicle, including: a first engine that is in an activated state to recognize a voice command of a user; And
상기 제1엔진으로부터 제어신호를 받아 제어되며, 필요에 따라 선택적으로 활성화 되어 사용자의 음성명령을 인식하는 제2엔진;A second engine that is controlled by receiving a control signal from the first engine and selectively activated as needed to recognize a voice command of the user;
으로 구성되고, 상기 제2엔진은 제1엔진에 의해 음성 인식 중에도 실행중인 음성인식을 중단하고, 새로운 음성명령을 인식할 수 있도록 된 것을 특징으로 한다.
Wherein the second engine stops the speech recognition being executed even during speech recognition by the first engine and recognizes a new speech command.
본 발명에 따른 차량용 음성인식장치 및 방법의 장점을 설명하면 다음과 같다.Advantages of the vehicle voice recognition apparatus and method according to the present invention will be described as follows.
첫째로, 항상 활성화되어 있는 음성엔진과 필요한 경우에만 활성화되어 있는 음성엔진으로 이루어지는 듀얼 엔진을 통해 명령어 실행 중에도 취소가 가능하고 새로운 명령 또는 수정된 명령을 재인식가능하여 운전자가 실수로 잘못된 명령을 지시한 후 즉시 수정된 명령으로 변경가능하여 잘못된 명령을 수정하는데 대기시간을 최소화할 수 있는 장점이 있다. First, it can be canceled while executing a command through a dual engine composed of a speech engine that is always active and a speech engine that is activated only when necessary, and a new command or a modified command can be recognized again, It is possible to change to a command that is immediately modified, thereby minimizing the waiting time for correcting an erroneous command.
둘째로, 평상시에는 소용량의 메모리를 차지하는 제1엔진을 항상 활성화시키고, 대용량의 메모리를 차지하는 나머지 제2엔진은 필요한 경우에만 활성화시킴으로써, 리소스 관리를 효율적으로 할 수 있다.Second, resource management can be efficiently performed by always activating the first engine occupying a small capacity memory at normal times and activating the remaining second engine occupying a large capacity memory only when necessary.
셋째로, 소용량의 메모리를 차지하는 제1엔진에 제2엔진을 활성화시키는 기능과 단순 검색을 할 수 있는 기능을 추가로 적용함으로써, 별도의 PTT 버튼을 누를 필요가 없기 때문에 운전시 기존에 PTT 버튼을 누르기 위한 운전자의 시선 분산을 방지할 수 있다.Third, it is not necessary to press the PTT button separately by applying the function of activating the second engine to the first engine occupying a small amount of memory and the function of performing the simple search, so that the PTT button It is possible to prevent the sight line dispersion of the driver for pressing.
넷째로, 소용량 음성 엔진을 이용하여 인터럽트(interrupt; 어떤 장치가 다른 장치의 일을 잠시 중단시키고 자신의 상태 변화를 알려 줌)를 발생시키기 때문에 시스템에 무리가 적게 가는 장점이 있다.
Fourth, there is an advantage of using a small capacity speech engine to interrupt the system because it generates an interrupt (a device temporarily stops the operation of another device and informs its state change).
도 1은 본 발명의 일실시예에 따른 음성인식방법의 예를 보여주는 블록도
도 2는 본 발명의 다른 실시예에 따른 음성인식방법의 예를 보여주는 블록도
도 3은 본 발명의 또 다른 실시예에 따른 음성인식방법의 예를 보여주는 블록도1 is a block diagram showing an example of a speech recognition method according to an embodiment of the present invention;
2 is a block diagram showing an example of a speech recognition method according to another embodiment of the present invention
3 is a block diagram showing an example of a speech recognition method according to another embodiment of the present invention
이하, 첨부도면을 참조하여 본 발명의 바람직한 실시예를 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세하게 설명하면 다음과 같다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings so that those skilled in the art can easily carry out the present invention.
첨부한 도 1은 본 발명의 일실시예에 따른 음성인식방법의 예를 보여주는 블록도이고, 도 2는 본 발명의 다른 실시예에 따른 음성인식방법의 예를 보여주는 블록도이고, 도 3은 본 발명의 또 다른 실시예에 따른 음성인식방법의 예를 보여주는 블록도이다.1 is a block diagram illustrating an example of a speech recognition method according to an embodiment of the present invention. FIG. 2 is a block diagram illustrating an example of a speech recognition method according to another embodiment of the present invention. FIG. 8 is a block diagram illustrating an example of a speech recognition method according to another embodiment of the present invention. FIG.
본 발명은 듀얼 엔진을 통해 음성 인식 중에도 또 다른 음성명령을 인식하여 사용자가 잘못된 명령을 한 경우 즉시 수정할 수 있는 차량용 음성인식 장치에 관한 것이다.The present invention relates to a voice recognition apparatus for a vehicle, which recognizes another voice command even during speech recognition through a dual engine and can promptly correct a wrong command.
본 발명에 따른 차량용 음성인식 장치는 듀얼 음성엔진(이하, 엔진으로 약칭함), 즉 항시 활성화되어 있는 제1엔진(10)과 필요시에만 활성화되는 제2엔진(11)으로 구성된다.The speech recognition apparatus for a vehicle according to the present invention comprises a dual speech engine (hereinafter abbreviated as an engine), that is, a
제1엔진(10)은 항상 활성화되어 음성인식 장치에 전원이 인가되는 한 운전자 또는 승객으로부터 발화되는 음성명령을 항상 인식할 수 있도록 대기 상태에 있다.The
대신에 제1엔진(10)은 항상 활성화 상태에서도 시스템에 무리를 주지 않을 정도로 매우 작은 메모리 용량을 차지하고, 제1엔진(10)을 구동하기 위한 전력 소비량도 매우 작다.Instead, the
따라서 제1엔진(10)은 필요에 따라 제2엔진(11)을 활성화하거나 단순한 단어를 검색 및 제한된 단어만을 인식할 수 있도록 되어 있다.Therefore, the
예를 들면 제2엔진(11)이 단어 검색을 실행하고 있는 중 수정된 단어 검색을 지시해야할 경우에 제1엔진(10)은 사용자로부터 취소명령을 대기하고 있다가 취소명령을 받는 즉시 기존의 단어검색을 하는 제2엔진(11)의 실행을 중지 및 리셋시키고 재활성화시킬 수 있다.For example, when the
그리고, 사용자의 음성명령은 먼저 제1엔진(10)에게 항시 내려지며, 제1엔진(10)은 음성명령을 인식하되, 자신이 직접 하기 어려운 음성명령은 제2엔진(11)을 실행시켜 제2엔진(11)으로 하여금 대신 명령을 수행하게 한다.The voice command of the user is always output to the
상기 제2엔진(11)은 음성명령을 인식하여 수행하던 기존의 한 개의 엔진과 동일한 기능을 하기 때문에 상세한 설명은 생략하기로 한다.Since the
여기서, 본 발명은 기존의 음성엔진과 동일하게 기능하는 제2엔진(11)에 제1엔진(10)을 추가로 구성한 것이다.Here, the present invention further comprises a
제1엔진(10) 자신은 항시 활성화상태에 있으면서 사용자로부터 발화된 음성명령을 인식함과 동시에 필요에 따라 제2엔진(11)을 자동으로 활성화시킴으로써, PTT 버튼을 수동조작하여 음성엔진을 활성화시키는 종래기술에 비해 업그레이드 된 것이다.The
또한, 제1엔진(10)은 사용자의 음성명령을 항시 대기함으로써, 제2엔진(11)이 음성명령을 수행하고 있는 중에도 언제든지 제2엔진(11)의 실행을 중단, 리셋 및 제어할 수 있는 기능을 가짐으로써, 운전자 등이 음성명령 발화 후 수정된 명령을 즉시 재발화하여 기존 명령을 번복할 수 있는 기회를 제공할 수 있다.In addition, the
다시 말해서, 제2엔진(11)은 제1엔진(10)에 의해 제어됨에 따라, 사용자의 명령어에 대한 중복 인식이 가능하다.In other words, as the
본 발명의 일실시예에 따른 제1엔진(10)은 소용량 어휘, 예를 들면 제한된 단어 또는 제2엔진(11)을 활성화시키기 위한 사용자의 음성명령을 인식하고, 작은 프로세스를 필요로 하는 소용량을 차지하는 엔진이다.The
상기 제1엔진(10)이 검색할 수 있는 단어 수는 몇십~몇백 개 정도이기 때문에 제1엔진(10)의 검색가능범위를 벗어나면 제1엔진(10)은 바로 제2엔진(11)에게 활성화 신호를 보내어 제2엔진(11)을 활성화시킬 수 있다.The number of words that can be searched by the
제2엔진(11)은 수백~수만 개의 대용량 어휘까지 모두 인식가능하고, 필요시 제1엔진(10)으로부터 제1엔진(10)으로부터 활성화신호를 입력받아 대용량의 메모리에 저장된 명령어에 따라 음성명령을 실행할 수 있다.The
다시 말해서, 제2엔진(11)은 평상시에는 슬립(Sleep) 상태를 유지하다가 제1엔진(10)에서 발생하는 활성화 신호에 의해 활성화 상태가 된다.In other words, the
여기서, 소용량 어휘란 한 단어 등 간단한 단어로 명령을 수행가능한 어휘를 말하고, 대용량 어휘는 한 단어 등 간단한 단어로 명령을 수행하기 어려운 어휘를 말한다.Here, a small-capacity vocabulary refers to a vocabulary capable of executing an instruction with a simple word such as a single word, and a large-capacity vocabulary refers to a vocabulary difficult to execute a command with a simple word such as a single word.
또한, 상기와 같이 제1엔진(10)의 메모리에 저장된 단어 수에 한정됨을 의미한다.Further, it means that the number of words is limited to the number of words stored in the memory of the
즉, 소용량 어휘는 사용자가 한 단계로 음성 명령을 수행할 수 있는 경우에 해당하고, 대용량 어휘는 사용자가 여러 단계에 걸쳐 음성 명령을 수행하는 경우에 해당한다.That is, a small capacity vocabulary corresponds to a case where a user can perform a voice command in one step, and a large capacity vocabulary corresponds to a case where a user performs a voice command over several stages.
이하, 본 발명에 따른 차량용 음성인식방법을 설명하기로 한다.Hereinafter, a vehicle speech recognition method according to the present invention will be described.
도 1의 일 실시예에 따라 사용자가 차량 오디오시스템의 소리를 줄이기 위해 "소리 줄여"라고 음성 명령(발화)을 하면 소용량으로 이루어진 제1엔진(10)에서 해당 음성명령을 입력받아 오디오 시스템의 소리를 줄이는 액션을 취한다.According to the embodiment of FIG. 1, when the user makes a voice command (utterance) saying "reduce the sound" to reduce the sound of the vehicle audio system, the
다른 실시예에 따라 운전 중 갑자기 전화가 걸려오는 경우에, 사용자는 "전화받어" 또는 "여보세요"라고 발화하면 제1엔진(10)이 이를 인식하고 사용자의 휴대폰에 신호를 보내어 음성통화가 가능하도록 한다.According to another embodiment, when the user suddenly calls a phone call while driving, the
여기서, "소리 줄여" 및 "전화받어" 또는 "여보세요"는 한 단어만으로 명령을 수행할 수 있기 때문에, 제1엔진(10)은 제2엔진(11)을 활성화하지 않고 자체적으로 명령을 수행하며, 제2엔진(11)은 슬립상태를 유지할 수 있다.Here, the
또 다른 실시예에 따라, 도 2에 도시한 바와 같이 사용자가 길을 찾기 위해 "네비게이션"이라고 음성 명령(발화)을 하면, 제1엔진(10)은 "네비게이션"이란 단어를 여러 단계에 걸쳐 명령을 수행할 수 있는 단어로 인식하기 때문에, 제2엔진(11)을 활성화시킨다.According to another embodiment, as shown in Fig. 2, when the user makes a voice command (speech) as "navigation" to find a route, the
그 다음, 운전자가 "우리집" 또는 "서울시 강남구 신사동"을 발화하면, 활성화된 제2엔진(11)이 네비게이션과 관련된 음성인식을 진행하여 네비게이션을 통해 길 안내를 진행한다.Then, when the driver speaks "my house" or "Shinseam-dong, Gangnam-gu, Seoul", the activated
제2엔진(11)의 음성인식이 완료되면 초기상태(슬립상태)로 복귀하여 제1엔진(10)만 활성화 상태로 된다.When the voice recognition of the
여기서, "소리 줄여" 등의 경우에는 사용자가 제어대상 장치에 음성으로 명령하는 것이 일회성으로 끝나지만, "네비게이션"은 음성 명령이 일회성으로 끝나지 않고 사용자가 목적지를 설정하고 경로(최적, 최단)를 선택하거나 경유지 추가 등 길안내를 위해 다양한 단어(음성)들을 사용하게 되기 때문에, 소용량의 제1엔진(10)이 네비게이션을 호출어(특정 ID 값)로 인식하여 대용량의 제2엔진(11)을 활성화시키고, 대용량의 어휘를 인식할 수 있는 제2엔진(11)이 네비게이션과 관련된 음성인식을 진행하게 되는 것이다.Here, in the case of "sound reduction" or the like, the voice command of the user to the control target device ends at one time. However, "navigation " does not end the voice command one time and the user sets the destination and selects the route A small capacity of the
또 다른 실시예에 따라, 도 3에 도시한 바와 같이 사용자가 "쏘나타"를 찾고 싶은데, 실수로 "쏘타나"라고 발화한 경우에 그 순간 실수함을 느끼고 "취소"라고 말할 수 있다.According to another embodiment, as shown in Fig. 3, when a user wants to find a "sonata ", and mistakenly spoken as " sonata ", he feels a mistake at that moment and can say" cancel ".
제2엔진(11)은 사용자로부터 발화된 명령어를 따라 "쏘타나"를 찾는 중에도 제1엔진(10)이 사용자로부터 "취소"명령을 대기하고 있다가 취소명령을 받는 즉시 제2엔진(11)의 명령어 실행을 중지한 후 리셋시킨다.The
이어서, 사용자는 다시 "쏘나타"라고 정확하게 발화하면 제2엔진(11)이 제1엔진(10)으로부터 재활성화 신호를 입력받아 "쏘나타"를 검색하여 사용자가 원하는 "쏘나타"에 대한 검색결과(정보)를 표시하여 제공하게 된다.Then, when the user correctly pronounces "Sonata" again, the
따라서, 본 발명에 의하면 첫째로, 항상 활성화되어 있는 음성엔진과 필요한 경우에만 활성화되어 있는 음성엔진으로 이루어지는 듀얼 엔진을 통해 명령어 실행 중에도 취소가 가능하고 새로운 명령 또는 수정된 명령을 재인식가능하여 운전자가 실수로 잘못된 명령을 지시한 후 즉시 수정된 명령으로 변경가능하여 잘못된 명령을 수정하는데 대기시간을 최소화할 수 있는 장점이 있다. Therefore, according to the present invention, first, the dual engine including the always-activated speech engine and the speech engine activated only when necessary can cancel the command while the command is being executed and can recognize the new command or the corrected command, It is possible to change the command immediately after the instruction is erroneously changed, thereby minimizing the waiting time for correcting the erroneous command.
둘째로, 평상시에는 소용량의 메모리를 차지하는 제1엔진(10)을 항상 활성화시키고, 대용량의 메모리를 차지하는 나머지 제2엔진(11)은 필요한 경우에만 활성화시킴으로써, 리소스 관리를 효율적으로 할 수 있다.Secondly, the
셋째로, 소용량의 메모리를 차지하는 제1엔진(10)에 제2엔진(11)을 활성화시키는 기능과 단순 검색을 할 수 있는 기능을 추가로 적용함으로써, 별도의 PTT 버튼을 누를 필요가 없기 때문에 운전시 기존에 PTT 버튼을 누르기 위한 운전자의 시선 분산을 방지할 수 있다.Third, since the function of activating the
넷째로, 소용량 음성 엔진을 이용하여 인터럽트(interrupt; 어떤 장치가 다른 장치의 일을 잠시 중단시키고 자신의 상태 변화를 알려 줌)를 발생시키기 때문에 시스템에 무리가 적게 가는 장점이 있다.
Fourth, there is an advantage of using a small capacity speech engine to interrupt the system because it generates an interrupt (a device temporarily stops the operation of another device and informs its state change).
10 : 제1엔진 11 : 제2엔진10: first engine 11: second engine
Claims (3)
사용자의 음성명령을 인식하기 위해 활성화 상태로 대기하고 있는 제1엔진(10);
상기 제1엔진(10)으로부터 제어신호를 받아 제어되며, 필요에 따라 선택적으로 활성화되어 사용자의 음성명령을 인식하는 제2엔진(11);
으로 구성되고,
상기 제1엔진(10)이 대기 중 사용자의 취소 명령을 음성인식한 경우 제2엔진(11)에 실행 중인 음성인식을 중단하도록 요청하며,
상기 제2엔진(11)은 음성인식 중에도 상기 제1엔진(10)의 중단 요청에 따라 실행 중인 음성인식을 중단한 후 새로운 음성명령을 인식할 수 있도록 된 것을 특징으로 하는 차량용 음성인식 장치.
In a voice recognition device for a vehicle,
A first engine (10) waiting in an activated state to recognize a voice command of a user;
A second engine (11) controlled by receiving a control signal from the first engine (10) and selectively activated as needed to recognize a voice command of the user;
Lt; / RTI >
When the first engine 10 recognizes the cancel command of the waiting user, it requests the second engine 11 to stop the speech recognition being executed,
Wherein the second engine (11) is able to recognize a new voice command after stopping the speech recognition being executed according to a stop request of the first engine (10) even during voice recognition.
상기 제1엔진(10)은 소용량의 메모리에 제한된 단어수를 저장하고, 사용자의 음성명령에 의해 제2엔진(11)을 자동으로 활성화시키는 것을 특징으로 하는 차량용 음성인식 장치.
The method according to claim 1,
Wherein the first engine (10) stores a limited number of words in a small capacity memory and automatically activates the second engine (11) by a voice command of the user.
상기 제1엔진(10)은 사용자로부터 발화된 소용량 어휘의 음성을 인식하고, 상기 제2엔진(11)은 사용자로부터 발화된 대용량 어휘의 음성을 인식하며, 상기 제1엔진(10)과 제2엔진(11)을 선택적으로 사용하여 음성인식을 할 수 있도록 된 것을 특징으로 하는 차량용 음성인식 장치.
The method according to claim 1,
The first engine 10 recognizes a voice of a small capacity vocabulary uttered by the user, the second engine 11 recognizes a voice of a large capacity vocabulary uttered by the user, and the first engine 10 and the second And the engine (11) is selectively used for voice recognition.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020110129412A KR101724748B1 (en) | 2011-12-06 | 2011-12-06 | Speech recognition apparatus for vehicle |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020110129412A KR101724748B1 (en) | 2011-12-06 | 2011-12-06 | Speech recognition apparatus for vehicle |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20130063091A KR20130063091A (en) | 2013-06-14 |
KR101724748B1 true KR101724748B1 (en) | 2017-04-19 |
Family
ID=48860540
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020110129412A Active KR101724748B1 (en) | 2011-12-06 | 2011-12-06 | Speech recognition apparatus for vehicle |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101724748B1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11756575B2 (en) | 2021-02-16 | 2023-09-12 | Samsung Electronics Co., Ltd. | Electronic device and method for speech recognition processing of electronic device |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101598948B1 (en) * | 2014-07-28 | 2016-03-02 | 현대자동차주식회사 | Speech recognition apparatus, vehicle having the same and speech recongition method |
KR101713770B1 (en) * | 2015-09-18 | 2017-03-08 | 주식회사 베이리스 | Voice recognition system and voice recognition method therefor |
CN107303909B (en) * | 2016-04-20 | 2020-06-23 | 斑马网络技术有限公司 | Voice call-up method, device and equipment |
KR102691889B1 (en) | 2016-07-27 | 2024-08-06 | 삼성전자주식회사 | Electronic device and speech recognition method thereof |
KR101910385B1 (en) | 2017-06-22 | 2018-10-22 | 엘지전자 주식회사 | Vehicle control device mounted on vehicle and method for controlling the vehicle |
KR102429498B1 (en) * | 2017-11-01 | 2022-08-05 | 현대자동차주식회사 | Device and method for recognizing voice of vehicle |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004053825A (en) * | 2002-07-18 | 2004-02-19 | Yamaha Corp | Apparatus, method, and program for language identification |
-
2011
- 2011-12-06 KR KR1020110129412A patent/KR101724748B1/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004053825A (en) * | 2002-07-18 | 2004-02-19 | Yamaha Corp | Apparatus, method, and program for language identification |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11756575B2 (en) | 2021-02-16 | 2023-09-12 | Samsung Electronics Co., Ltd. | Electronic device and method for speech recognition processing of electronic device |
Also Published As
Publication number | Publication date |
---|---|
KR20130063091A (en) | 2013-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101724748B1 (en) | Speech recognition apparatus for vehicle | |
US12223963B2 (en) | Performing speech recognition using a local language context including a set of words with descriptions in terms of components smaller than the words | |
KR102007478B1 (en) | Device and method for controlling application using speech recognition under predetermined condition | |
US6839670B1 (en) | Process for automatic control of one or more devices by voice commands or by real-time voice dialog and apparatus for carrying out this process | |
US20140309996A1 (en) | Voice control method and mobile terminal apparatus | |
US7203651B2 (en) | Voice control system with multiple voice recognition engines | |
US9224404B2 (en) | Dynamic audio processing parameters with automatic speech recognition | |
US20140156268A1 (en) | Incremental speech recognition for dialog systems | |
EP2411977B1 (en) | Service oriented speech recognition for in-vehicle automated interaction | |
US9812129B2 (en) | Motor vehicle device operation with operating correction | |
WO2008067562A3 (en) | Multimodal speech recognition system | |
EP3246915A1 (en) | Voice recognition system and method of robot system | |
CA2814109A1 (en) | Multipass asr controlling multiple applications | |
US20150142449A1 (en) | Method and Device for Operating a Speech-Controlled Information System for a Vehicle | |
US20150310853A1 (en) | Systems and methods for speech artifact compensation in speech recognition systems | |
US11646031B2 (en) | Method, device and computer-readable storage medium having instructions for processing a speech input, transportation vehicle, and user terminal with speech processing | |
JP2002520681A (en) | Automatic speech recognition method | |
US8185400B1 (en) | System and method for isolating and processing common dialog cues | |
US20210233516A1 (en) | Agent system, agent server, and computer readable recording medium | |
CA2839285A1 (en) | Hybrid dialog speech recognition for in-vehicle automated interaction and in-vehicle user interfaces requiring minimal cognitive driver processing for same | |
US11587566B2 (en) | Agent system, terminal device, and computer readable recording medium using speech interaction for services | |
JP2006208486A (en) | Voice inputting device | |
CN204807968U (en) | Speech control's robot | |
JP2007183516A (en) | Voice interactive apparatus and speech recognition method | |
JP2012037820A (en) | Voice recognition apparatus, voice recognition apparatus for picking, and voice recognition method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20111206 |
|
PG1501 | Laying open of application | ||
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20151023 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20111206 Comment text: Patent Application |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20160909 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20170222 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20170403 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20170403 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20200330 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20210329 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20220328 Start annual number: 6 End annual number: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20230327 Start annual number: 7 End annual number: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20240325 Start annual number: 8 End annual number: 8 |