JP2001296887A - Speech recognition method and speech recognition device using the method - Google Patents
Speech recognition method and speech recognition device using the methodInfo
- Publication number
- JP2001296887A JP2001296887A JP2000113152A JP2000113152A JP2001296887A JP 2001296887 A JP2001296887 A JP 2001296887A JP 2000113152 A JP2000113152 A JP 2000113152A JP 2000113152 A JP2000113152 A JP 2000113152A JP 2001296887 A JP2001296887 A JP 2001296887A
- Authority
- JP
- Japan
- Prior art keywords
- noise
- pass filter
- speech recognition
- voice
- periodic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 230000000737 periodic effect Effects 0.000 claims abstract description 64
- 238000001514 detection method Methods 0.000 claims abstract description 12
- 230000001629 suppression Effects 0.000 claims description 9
- 230000005236 sound signal Effects 0.000 abstract description 3
- 238000001228 spectrum Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 5
- 238000007781 pre-processing Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 238000011410 subtraction method Methods 0.000 description 1
Abstract
(57)【要約】
【課題】周期性騒音下での認識率を向上させる音声認識
方法とその装置を提供する。
【解決手段】騒音下の音声認識方法において、音声検出
部20の後段にカットオフ周波数決定部30とそれに制
御されるハイパスフィルタ40を設ける。カットオフ周
波数決定部30は音声信号の各帯域の騒音の主体を分析
する。騒音の主体が周期性騒音ならば、その帯域をカッ
トオフ周波数としてハイパスフィルタ40に設定する。
これにより、周期性騒音の帯域が変化しても常にそれが
低減される。従って、音声認識率が向上する。又、ラン
ダム騒音が主体である場合は所定のカットオフ周波数に
設定する。これにより、人音声帯域をカットして認識率
を低下させることがない。これにより、常に高い音声認
識率を維持することができる。
(57) [Summary] [PROBLEMS] To provide a speech recognition method and apparatus for improving the recognition rate under periodic noise. In a voice recognition method under noise, a cutoff frequency determination unit and a high-pass filter controlled by the cutoff frequency determination unit are provided downstream of a voice detection unit. The cutoff frequency determination unit 30 analyzes the main components of noise in each band of the audio signal. If the main component of the noise is periodic noise, the band is set in the high-pass filter 40 as a cutoff frequency.
Thus, even if the band of the periodic noise changes, it is always reduced. Therefore, the speech recognition rate is improved. If random noise is dominant, a predetermined cutoff frequency is set. As a result, the human voice band is not cut and the recognition rate is not reduced. Thereby, a high speech recognition rate can be always maintained.
Description
【0001】[0001]
【発明の属する技術分野】本発明は、騒音下において音
声認識率を向上させる音声認識方法及びその方式を用い
た音声認識装置に関する。特に、周期性騒音の存在する
環境で人音声の認識率を高める音声認識方法と音声認識
装置に関する。本発明は、車種又は車輌の走行状態によ
って周期雑音が変化する車室内の音声認識装置に適用で
きる。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a speech recognition method for improving a speech recognition rate under noise and a speech recognition apparatus using the method. In particular, the present invention relates to a voice recognition method and a voice recognition device that increase the recognition rate of human voice in an environment where periodic noise exists. INDUSTRIAL APPLICABILITY The present invention can be applied to a vehicle interior voice recognition device in which periodic noise changes depending on a vehicle type or a running state of a vehicle.
【0002】[0002]
【従来の技術】従来より、騒音下で人音声を認識する音
声認識方法とその装置がある。例えば、耐騒音音声認識
装置の開発(1)(日本音響学会講演論文集、平成元年
3月、p117)がある。これは、交通騒音、家庭内騒
音下での音声認識方法である。車輌の騒音は、低周波帯
域にそのパワーが集中しているため、通常、低周波帯域
を抑制するハイパスフィルタが使用される。上記論文で
は、音声認識処理に対する前処理としてそのハイパスフ
ィルタを用い、抑制する帯域とその認識率との関係を調
べている。そして、認識結果よりカットオフ周波数は平
均して300Hz程度が有効であることを示している。
他に、特開平11−231897号公報に開示の音声認
識装置及び方法がある。これは、人音声検出のため周波
数空間で音声区間直前の低周波雑音を除去して音声認識
を行う方法とその装置である。2. Description of the Related Art Conventionally, there is a speech recognition method and apparatus for recognizing human speech under noise. For example, there is a development of a noise-tolerant speech recognition device (1) (Proceedings of the Acoustical Society of Japan, March 1989, p. 117). This is a speech recognition method under traffic noise and domestic noise. Since the noise of the vehicle is concentrated in the low frequency band, a high-pass filter for suppressing the low frequency band is usually used. In the above paper, the high-pass filter is used as preprocessing for the speech recognition processing, and the relationship between the band to be suppressed and the recognition rate is examined. The result of the recognition indicates that the cutoff frequency is effective at about 300 Hz on average.
In addition, there is a speech recognition apparatus and method disclosed in Japanese Patent Application Laid-Open No. 11-231897. This is a method and apparatus for performing voice recognition by removing low-frequency noise immediately before a voice section in a frequency space for human voice detection.
【0003】[0003]
【発明が解決しようする課題】しかしながら、一般に騒
音には定常騒音(ランダム騒音)と周期性騒音があり、
周期性騒音下で音声認識が必要な場合がある。人音声の
認識において重要な母音は有声音であり、その有声音は
100〜300Hzの帯域に基本周波数を有する複合周
期音である。例えば、車室内で運転者の音声を認識する
場合は、上記帯域に例えば車輌のエンジン音に起因する
周期性騒音が混入する。However, noise generally includes stationary noise (random noise) and periodic noise.
Speech recognition may be needed under periodic noise. An important vowel in human voice recognition is a voiced sound, and the voiced sound is a complex periodic sound having a fundamental frequency in a band of 100 to 300 Hz. For example, when recognizing a driver's voice in a vehicle cabin, periodic noise caused by, for example, an engine sound of the vehicle is mixed in the band.
【0004】又、耐騒音音声認識装置の開発(1)(日
本音響学会講演論文集、平成元年3月、p117)は、
ハイパスフィルタのカットオフ周波数を300Hzに固
定している。これは人の音声帯域も一部カットすること
を意味し、場合によっては認識率が低下する。これは、
特開平06−208393でも指摘されている。しかし
ながら、上記騒音にレベルの大きい周期性騒音が含まれ
ている場合は、一部音声情報をカットしてもカットオフ
周波数を高くした方が、逆に認識率が上がる場合があ
る。即ち、音声認識の前処理として一律に固定したハイ
パスフィルタを用いる方法は、必ずしも認識率を向上さ
せる認識方法とはならない。従って、その方法を利用し
た装置は、常に認識率を向上させる音声認識装置とはな
らなかった。[0004] The development of a noise-tolerant speech recognition device (1) (Proceedings of the Acoustical Society of Japan, March 1989, p117)
The cutoff frequency of the high-pass filter is fixed at 300 Hz. This means that a part of the human voice band is also cut, and in some cases, the recognition rate is reduced. this is,
This is also pointed out in Japanese Patent Application Laid-Open No. 06-208393. However, if the noise includes periodic noise having a large level, the recognition rate may be increased by increasing the cutoff frequency even if some audio information is cut. That is, a method of using a fixed high-pass filter as preprocessing for speech recognition is not necessarily a recognition method for improving the recognition rate. Therefore, an apparatus using the method has not always been a speech recognition apparatus that improves the recognition rate.
【0005】本発明は、上述した問題点を解決するため
になされたものであり、その目的は、実際の周期性騒音
の帯域は変化することに着目し、その帯域に応じてハイ
パスフィルタのカットオフ周波数を調整して最適な音声
を抽出して、周期性騒音下での音声認識率を向上させる
ことである。又、他の目的は本発明の音声認識方法を自
動車の車室内での音声認識方法に適用し、運転者の音声
を明確に認識させて走行の安全性を高めることである。SUMMARY OF THE INVENTION The present invention has been made to solve the above-described problems, and has as its object to focus on the fact that the band of the actual periodic noise changes, and to cut the high-pass filter according to the band. An object of the present invention is to improve the speech recognition rate under periodic noise by adjusting an off-frequency and extracting an optimal speech. It is another object of the present invention to apply the voice recognition method of the present invention to a voice recognition method in a vehicle cabin so that a driver's voice can be clearly recognized to improve driving safety.
【0006】[0006]
【課題を解決するための手段】請求項1に記載の音声認
識方法は騒音下における音声認識方法であって、騒音を
含む音声の各周波数帯域を形成する周期音成分を抽出
し、周期音成分が主体である周波数帯域をフィルタによ
って抑制して、音声認識を行うことを特徴とする。According to the first aspect of the present invention, there is provided a voice recognition method under noise, wherein a periodic sound component forming each frequency band of voice including noise is extracted, and a periodic sound component is extracted. Is characterized by performing a speech recognition by suppressing a frequency band of which is a subject by a filter.
【0007】又、請求項2に記載の音声認識方法はフィ
ルタがハイパスフィルタであり、そのハイパスフィルタ
のカットオフ周波数は周期音成分が主体である周波数帯
域に応じて調整されることを特徴とする。Further, the voice recognition method according to the present invention is characterized in that the filter is a high-pass filter, and the cut-off frequency of the high-pass filter is adjusted according to a frequency band mainly composed of a periodic sound component. .
【0008】又、請求項3に記載の音声認識方法によれ
ば、騒音は車室内での騒音であり、ハイパスフィルタの
カットオフ周波数は車種又は車輌の走行状態に起因する
周期音成分に対する周波数帯域に応じて調整されること
を特徴とする。According to the third aspect of the present invention, the noise is noise in a vehicle interior, and the cutoff frequency of the high-pass filter is a frequency band for a periodic sound component caused by a vehicle type or a running state of the vehicle. It is characterized by being adjusted according to.
【0009】又、請求項4に記載の音声認識装置は、騒
音下における音声を認識する音声認識装置において、音
声を検出する音声検出手段と、その音声検出手段の出力
から各周波数帯域の周期音成分を抽出し、周期音成分が
主体である周波数帯域に応じてカットオフ周波数を決定
するカットオフ周波数決定手段と、そのカットオフ周波
数が設定されるハイパスフィルタと、そのハイパスフィ
ルタによって得られた音声から雑音を抑制する雑音抑制
手段と、その雑音抑制手段によって処理された音声を認
識処理する音声認識手段とを備えたことを特徴とする。According to a fourth aspect of the present invention, in the voice recognition apparatus for recognizing voice under noise, voice detection means for detecting voice, and periodic sound of each frequency band based on an output of the voice detection means. Cut-off frequency determining means for extracting a component and determining a cut-off frequency according to a frequency band mainly composed of a periodic sound component, a high-pass filter for setting the cut-off frequency, and a sound obtained by the high-pass filter And a noise recognizing means for recognizing and processing the voice processed by the noise suppressing means.
【0010】[0010]
【発明の作用および効果】請求項1に記載の音声認識方
法によれば、騒音を含む音声から先ず各周波数帯域を形
成する周期音成分を抽出する。そして、周期音成分が主
体である周波数帯域を特定し、その帯域をフィルタによ
って抑制する。これは、認識処理すべき音声から周期性
騒音を除去することを意味する。そして、その後音声認
識を行う。人音声は、上記特定の帯域には常には存在し
ないので、上記フィルタによって、場合によっては一部
は抑制されるが完全には抑制されることはない。即ち、
周期性騒音のみが抑制されて、人音声は抑制されること
はない。即ち、相対的に人音声のみが抽出される。従っ
て、本発明の方法を用いれば効果的に背景雑音が除去さ
れ、音声認識率を向上させることができる。According to the speech recognition method of the present invention, first, a periodic sound component forming each frequency band is extracted from speech including noise. Then, a frequency band mainly composed of the periodic sound component is specified, and the band is suppressed by the filter. This means that the periodic noise is removed from the speech to be recognized. Then, voice recognition is performed. Since the human voice is not always present in the specific band, the filter may partially suppress, but not completely suppress the sound in some cases. That is,
Only periodic noise is suppressed, and human voice is not suppressed. That is, only the human voice is relatively extracted. Therefore, by using the method of the present invention, background noise can be effectively removed, and the speech recognition rate can be improved.
【0011】又、請求項2に記載の音声認識方法によれ
ば、フィルタはハイパスフィルタであり、そのハイパス
フィルタのカットオフ周波数は周期音成分が主体である
周波数帯域に応じて調整される。例えば、モータ音から
なる周期性騒音は、人音声に比較して周波数の高い帯域
に存在する。そして、その周期性騒音は回転数に応じて
変化する。例えば、高速回転時にはより高域にシフトす
る。即ち、周期音成分が主体である周波数帯域が変化す
る。上記ハイパスフィルタのカットオフ周波数は、変化
する上記周波数帯域に応じて調整される。即ち、上記ハ
イパスフィルタは変化する周期性騒音を完全に抑制する
ことができる。換言すれば、相対的に効率よく人音声を
抽出することができる。従って、常に高い音声認識率を
維持させる音声認識方法となる。According to the speech recognition method of the present invention, the filter is a high-pass filter, and the cut-off frequency of the high-pass filter is adjusted according to a frequency band mainly composed of a periodic sound component. For example, periodic noise composed of motor sounds exists in a band having a higher frequency than human voice. Then, the periodic noise changes according to the rotation speed. For example, during high-speed rotation, the frequency shifts to a higher frequency. That is, the frequency band mainly composed of the periodic sound component changes. The cutoff frequency of the high-pass filter is adjusted according to the changing frequency band. That is, the high-pass filter can completely suppress the changing periodic noise. In other words, human voices can be extracted relatively efficiently. Therefore, this is a voice recognition method that always maintains a high voice recognition rate.
【0012】請求項3に記載の音声認識方法によれば騒
音は車室内の騒音であり、そのハイパスフィルタのカッ
トオフ周波数は車種又は車輌の走行状態に起因する周期
音成分に対する周波数帯域に応じて調整されている。一
般に車室内の騒音は、その車輌のエンジン音に起因する
騒音、又は走行に起因する騒音である。従って、車種、
走行速度でその騒音の帯域は変化することになる。本発
明では、上記ハイパスフィルタのカットオフ周波数が車
種又は車輌の走行状態(エンジン回転数)に起因する騒
音の周波数帯域変化に応じて調整されている。即ち、ハ
イパスフィルタは車種又は車輌の走行状態に起因する騒
音変化に応じて、それらを常に低減するように設定され
る。換言すれば、常に背景雑音が除去され、運転者の音
声のみが抽出されることになる。従って、本発明の方法
を用いれば、車室内でも高い音声認識率を維持すること
ができる。According to the third aspect of the present invention, the noise is the noise in the vehicle interior, and the cutoff frequency of the high-pass filter is determined according to the frequency band for the periodic sound component caused by the vehicle type or the running state of the vehicle. Has been adjusted. Generally, the noise in the vehicle cabin is a noise caused by an engine sound of the vehicle or a noise caused by running. Therefore,
The band of the noise changes with the traveling speed. In the present invention, the cutoff frequency of the high-pass filter is adjusted according to the frequency band change of noise caused by the type of vehicle or the running state of the vehicle (engine speed). In other words, the high-pass filter is set so as to always reduce them according to the noise change due to the vehicle type or the running state of the vehicle. In other words, the background noise is always removed, and only the voice of the driver is extracted. Therefore, by using the method of the present invention, a high speech recognition rate can be maintained even in a vehicle cabin.
【0013】又、請求項4に記載の音声認識装置によれ
ば、先ず音声検出手段が騒音を含む音声を検出する。次
いで、カットオフ周波数決定手段がその音声検出手段の
出力から各周波数帯域の周期音成分を抽出し、周期音成
分が主体である周波数帯域を決定する。そして、次に決
定した周波数帯域を抑制するようにハイパスフィルタの
カットオフ周波数を制御する。即ち、ハイパスフィルタ
のカットオフ周波数は周期音成分が主体である周波数帯
域に応じて調整される。そして、音声はそのハイパスフ
ィルタによって周期音成分、即ち周期性騒音のレベルの
大きい周波数帯域の騒音が抑制され、次いで雑音抑制手
段によって雑音が除去される。この場合の雑音はランダ
ム騒音が主体である。その雑音の除去は、例えばスペク
トルサブトラクション法が用いられる。そして、その雑
音抑制手段によって処理された音声が音声認識手段によ
り認識処理される。Further, according to the voice recognition device of the fourth aspect, the voice detection means first detects voice including noise. Next, the cutoff frequency determining means extracts the periodic sound component of each frequency band from the output of the voice detecting means, and determines the frequency band mainly composed of the periodic sound component. Then, the cutoff frequency of the high-pass filter is controlled so as to suppress the next determined frequency band. That is, the cutoff frequency of the high-pass filter is adjusted according to the frequency band in which the periodic sound component is the main component. The high-pass filter suppresses the periodic sound component, that is, the noise in the frequency band where the level of the periodic noise is large, and then removes the noise by the noise suppression unit. The noise in this case is mainly random noise. For the removal of the noise, for example, a spectral subtraction method is used. Then, the speech processed by the noise suppression unit is recognized by the speech recognition unit.
【0014】本発明の音声認識装置では、上述の方法に
よってハイパスフィルタのカットオフ周波数が周期音成
分(周期性騒音)の周波数帯域に応じて調整されてい
る。従って、様々な周期性騒音、特に帯域の変化する周
期性騒音に対して対応可能となる。即ち、人音声への影
響を最小限に押さえ、常に効果的に周期性騒音のみを抑
制することができる。従って、周期性の騒音下でも音声
認識率を向上させる音声認識装置となる。この装置を例
えば車室内の音声認識に用いた場合は、車種、車輌の走
行状態によって変化する周期性騒音を的確に抑制し、確
実に運転者の音声認識率を上げることができる。In the speech recognition apparatus according to the present invention, the cutoff frequency of the high-pass filter is adjusted according to the frequency band of the periodic sound component (periodic noise) by the above-described method. Therefore, it is possible to cope with various periodic noises, in particular, periodic noises whose bands change. That is, it is possible to minimize the influence on the human voice and always effectively suppress only the periodic noise. Therefore, the speech recognition apparatus can improve the speech recognition rate even under periodic noise. When this device is used, for example, for voice recognition in a vehicle cabin, it is possible to accurately suppress periodic noise that changes depending on the vehicle type and the running state of the vehicle, and to reliably increase the voice recognition rate of the driver.
【0015】[0015]
【発明の実施の形態】以下、本発明の音声認識方法とそ
の装置について図面を参照して説明する。上述のよう
に、本発明の音声認識方法とその装置は周期性騒音下で
特に有効である。周期性騒音は、交通騒音、エンジンを
有する移動体内部での騒音、工場等での機械音など周期
性を有する一般的な騒音である。ここでは、自動車の車
室内騒音下における音声認識装置について説明する。DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS A speech recognition method and apparatus according to the present invention will be described below with reference to the drawings. As described above, the speech recognition method and apparatus of the present invention are particularly effective under periodic noise. The periodic noise is a general noise having periodicity such as a traffic noise, a noise inside a moving body having an engine, and a mechanical sound at a factory or the like. Here, a speech recognition device under vehicle interior noise will be described.
【0016】自動車の車室内騒音は、エンジン音に起因
する周期性騒音と走行に起因するランダム騒音(ロード
ノイズ.風切り音等)からなる。これらの車室内騒音は
低周波帯域にそのパワーが集中している。そのため、音
声認識時にはハイパスフィルタを用いてそれらを除去す
る前処理が有効である。しかしながら、現在の所ハイパ
スフィルタを用いても更なる認識率の向上には至ってい
ない。そこで、発明者は上記周期性騒音は車種や走行状
態によってその周波数帯域が変化することに着目し、こ
れが認識率に関係することを明らかにした。本方法は、
車種や走行状況によって変化する周期性騒音の周波数帯
域ごとの音響的特徴(周期音成分が主体か否か)を分析
し、それに基づいてハイパスフィルタのカットオフ周波
数を最適に制御して、音声認識率を向上させたものであ
る。The vehicle interior noise includes periodic noise caused by engine noise and random noise (road noise, wind noise, etc.) caused by running. These vehicle interior noises are concentrated in the low frequency band. Therefore, at the time of speech recognition, preprocessing for removing them using a high-pass filter is effective. However, at present, even if a high-pass filter is used, the recognition rate has not been further improved. Then, the inventor paid attention to the fact that the frequency band of the periodic noise changes depending on the vehicle type and the running state, and clarified that this is related to the recognition rate. The method is
Analyzes the acoustic characteristics (whether the main component of the periodic sound component) of the periodic noise that changes depending on the vehicle type and driving conditions, and based on the analysis, optimally controls the cutoff frequency of the high-pass filter, and performs speech recognition. The rate has been improved.
【0017】図1に本発明の音声認識装置の1実施例を
示す。図は、システムブロック図である。本発明の音声
認識装置は、運転者の音声を収集するマイクロフォン1
0、音声検出手段である音声検出部20、カットオフ周
波数決定手段であるカットオフ周波数決定部30、ハイ
パスフィルタ40、雑音抑制手段である雑音抑制部5
0、そして音声認識手段である音声認識部60から構成
される。FIG. 1 shows an embodiment of a speech recognition apparatus according to the present invention. The figure is a system block diagram. The voice recognition device according to the present invention includes a microphone 1 that collects a driver's voice.
0, a voice detection unit 20 as a voice detection unit, a cutoff frequency determination unit 30 as a cutoff frequency determination unit, a high-pass filter 40, and a noise suppression unit 5 as a noise suppression unit
0, and a voice recognition unit 60 as voice recognition means.
【0018】各構成要素とその機能をその音声信号の流
れに従って説明する。先ず、運転者の音声はマクロフォ
ン10を介して音声検出部20で検出される。音声検出
部20では、人音声に加えて上記周期性騒音とランダム
騒音が検出される。そして、その中から運転者の音声区
間が検出され、カットオフ周波数決定部30に送出され
る。Each component and its function will be described according to the flow of the audio signal. First, the voice of the driver is detected by the voice detection unit 20 via the microphone 10. The voice detection unit 20 detects the periodic noise and the random noise in addition to the human voice. Then, the voice section of the driver is detected from among them, and is sent to the cutoff frequency determination unit 30.
【0019】カットオフ周波数決定部30では、先ず背
景騒音を分析し周波数帯域ごとに周期音成分が主体かど
うかを判定する。この判定は、例えば周波数スペクトル
分析とスペクトル包絡線分析である。スペクトル包絡線
から突出した成分が大きい帯域は周期音成分が主体であ
ると判定する。尚、上記周期音成分はエンジン音に起因
する周期性騒音と見なすことができる。図2(a)、
(b)に2車種の加速走行中の騒音スペクトル図を示
す。(a)がa車種であり(b)がb車種である。a車
種は、200〜400Hz帯域において周期性騒音が主
体であると判定され、b車種はその帯域においてランダ
ム成分が主体であると判定される。尚、細線が周波数ス
ペクトルであり、太線がスペクトル包絡線である。The cut-off frequency determining section 30 first analyzes the background noise and determines whether or not a periodic sound component is the main component for each frequency band. This determination is, for example, frequency spectrum analysis and spectrum envelope analysis. It is determined that a band having a large component protruding from the spectral envelope is mainly composed of a periodic sound component. The periodic sound component can be regarded as periodic noise caused by the engine sound. FIG. 2 (a),
(B) shows a noise spectrum diagram during acceleration running of the two types of vehicles. (A) is a vehicle type and (b) is a b vehicle type. The vehicle type a is determined to be mainly composed of periodic noise in the 200 to 400 Hz band, and the vehicle type b is determined to be mainly composed of random components in the band. The thin line is the frequency spectrum, and the thick line is the spectrum envelope.
【0020】上記騒音スペクトル図より、カットオフ周
波数決定部30はa車種に対してはハイパスフィルタ4
0のカットオフ周波数を400Hzに決定する。そし
て、それをハイパスフィルタ40に出力する。ハイパス
フィルタ40は、400Hz以下の音声信号をカットし
て次段の雑音抑制部50出力する。即ち、周期性騒音を
抑制して出力する。雑音抑制部50は、一般的に行われ
る雑音抑圧処理である。それは、例えば音声区間直前の
スペクトル成分を音声区間のスペクトルから差し引くス
ペクトルサブトラクション処理である。これにより、背
景の騒音が除去され運転者の音声が抽出される。その
後、通常の音声認識部60によって運手者の音声が認識
される。これにより、認識率が向上する。From the above noise spectrum diagram, the cut-off frequency determining unit 30 determines that the high-pass filter 4
The cutoff frequency of 0 is determined to be 400 Hz. Then, it is output to the high-pass filter 40. The high-pass filter 40 cuts an audio signal of 400 Hz or less and outputs the signal to the noise suppression unit 50 at the next stage. That is, the periodic noise is suppressed and output. The noise suppression unit 50 is a noise suppression process that is generally performed. That is, for example, a spectrum subtraction process of subtracting a spectrum component immediately before a voice section from a spectrum of the voice section. Thereby, the background noise is removed and the voice of the driver is extracted. After that, the voice of the carrier is recognized by the normal voice recognition unit 60. Thereby, the recognition rate is improved.
【0021】図2(a)下段にハイパスフィルタ40の
カットオフ周波数による認識率の増減を示す。図中、H
PFはハイパスフィルタ40のカットオフ周波数の意味
である。図に示すように、ハイパスフィルタ40のカッ
トオフ周波数が400Hzの場合の認識率は約57.6
%であり、従来の200Hzの場合は約33.7%であ
る。従来では自動車の加速走行時には音声の基本周波数
付近(100〜300Hz)の帯域にエンジン音成分が
多くなり認識率が大きく悪化したが(33.7%)、本
発明の方法ではハイパスフィルタのカットオフ周波数を
400Hzとしたことで音声認識率を改善(57.6
%)することができた。FIG. 2A shows the increase / decrease of the recognition rate depending on the cutoff frequency of the high-pass filter 40. In the figure, H
PF means the cutoff frequency of the high-pass filter 40. As shown in the figure, the recognition rate when the cutoff frequency of the high-pass filter 40 is 400 Hz is about 57.6.
%, Which is about 33.7% in the case of the conventional 200 Hz. Conventionally, when the vehicle is accelerating, the engine sound component increases in the band near the fundamental frequency (100 to 300 Hz) of the voice and the recognition rate is greatly deteriorated (33.7%). Improving the speech recognition rate by setting the frequency to 400 Hz (57.6
%)We were able to.
【0022】一方、b車種に対してはランダム騒音が主
体であると判定される。この場合は、周期性騒音が主体
ではないのでカットオフ周波数決定部30はカットオフ
周波数を所定の200Hzに決定する。そして、上述の
一連の処理を行う。図2(b)下段にハイパスフィルタ
40のカットオフ周波数による認識率の増減を示す。カ
ットオフ周波数を200Hzに設定した場合、認識率は
約67.4%であり、400Hzに設定した場合は逆に
約58.1%に低下している。即ち、b車種に対しては
カットオフ周波数を400Hzに設定せずに、200H
zとすることで高認識率を維持することができる。On the other hand, it is determined that the random noise is dominant for the vehicle type b. In this case, since the periodic noise is not the main component, the cutoff frequency determination unit 30 determines the cutoff frequency to be a predetermined 200 Hz. Then, a series of processes described above are performed. The lower part of FIG. 2B shows the increase / decrease of the recognition rate depending on the cutoff frequency of the high-pass filter 40. When the cutoff frequency is set to 200 Hz, the recognition rate is about 67.4%, and when it is set to 400 Hz, the recognition rate is reduced to about 58.1%. In other words, the cutoff frequency is not set to 400 Hz and the
By setting z, a high recognition rate can be maintained.
【0023】このように騒音の主体を判別し、それに基
づいてハイパスフィルタのカットオフ周波数を最適に調
整すれば、確実に周期性騒音を低減させることができ
る。即ち、本発明の音声認識方法及びその装置を用いれ
ば、周期性騒音の変化する自動車の車室内でも常に運転
者の音声を明確に抽出し、確実に音声認識率を上げるこ
とができる。As described above, when the main component of the noise is determined and the cutoff frequency of the high-pass filter is optimally adjusted based on the discrimination, the periodic noise can be surely reduced. That is, the use of the voice recognition method and apparatus of the present invention makes it possible to always clearly extract the driver's voice even in the interior of an automobile where the periodic noise changes, and to surely increase the voice recognition rate.
【0024】(変形例)上記実施例は1例であり、他に
様々な変形が考えられる。例えば、上記実施例では、ハ
イパスフィルタを用いたがバンドバスフィルタやローパ
スフィルタを用いてもよい。バンドパスフィルタやロー
パスフィルタによって、周期性騒音の存在する帯域をカ
ットしてもよい。同様の効果が得られる。(Modifications) The above embodiment is one example, and various other modifications are possible. For example, in the above embodiment, a high-pass filter is used, but a band-pass filter or a low-pass filter may be used. A band where periodic noise exists may be cut by a band-pass filter or a low-pass filter. Similar effects can be obtained.
【0025】又、本発明の音声認識方法とその装置は自
動車の車室内騒音だけでなく,周期音を含む騒音一般に
おいても同様に作用し有効である。鉄道、船舶、航空機
内での音声認識装置に有効である。工場、建築現場等の
周期性機械音のある環境での音声認識に対しても有効で
ある。The speech recognition method and apparatus of the present invention are effective not only for the noise in the interior of a car but also for general noise including periodic sounds. It is effective for voice recognition devices in railways, ships, and aircraft. It is also effective for voice recognition in environments with periodic mechanical sounds, such as factories and construction sites.
【図1】本発明の実施例に係る音声認識装置のシステム
ブロック図。FIG. 1 is a system block diagram of a speech recognition device according to an embodiment of the present invention.
【図2】本発明の実施例に係る騒音スペクトルとカット
オフ周波数と認識率の関係図。FIG. 2 is a diagram illustrating a relationship between a noise spectrum, a cutoff frequency, and a recognition rate according to the embodiment of the present invention.
10 マイクロフォン 20 音声検出部 30 カットオフ周波数決定部 40 ハイパスフィルタ 50 雑音抑制部 60 音声認識部 DESCRIPTION OF SYMBOLS 10 Microphone 20 Voice detection part 30 Cutoff frequency determination part 40 High-pass filter 50 Noise suppression part 60 Voice recognition part
Claims (4)
音を含む音声の各周波数帯域を形成する周期音成分を抽
出し、周期音成分が主体である周波数帯域をフィルタに
よって抑制して、音声認識を行うことを特徴とする音声
認識方法。1. A method for recognizing speech under noise, comprising extracting a periodic sound component forming each frequency band of a sound including noise, suppressing a frequency band mainly composed of the periodic sound component by a filter, and A speech recognition method characterized by performing recognition.
該ハイパスフィルタのカットオフ周波数は、前記周期音
成分が主体である周波数帯域に応じて調整されることを
特徴とする請求項1に記載の音声認識方法。2. The filter according to claim 1, wherein said filter is a high-pass filter.
The speech recognition method according to claim 1, wherein a cutoff frequency of the high-pass filter is adjusted according to a frequency band in which the periodic sound component is dominant.
パスフィルタのカットオフ周波数は、車種又は車輌の走
行状態に起因する前記周期音成分に対する周波数帯域に
応じて調整されることを特徴とする請求項2に記載の音
声認識方法。3. The apparatus according to claim 2, wherein the noise is noise in a vehicle compartment, and a cutoff frequency of the high-pass filter is adjusted according to a frequency band for the periodic sound component caused by a vehicle type or a running state of the vehicle. The voice recognition method according to claim 2.
いて、 音声を検出する音声検出手段と、 該音声検出手段の出力から各周波数帯域の周期音成分を
抽出し、周期音成分が主体である周波数帯域に応じてカ
ットオフ周波数を決定するカットオフ周波数決定手段
と、 該カットオフ周波数が設定されるハイパスフィルタと、 前記ハイパスフィルタによって得られた音声から雑音を
抑制する雑音抑制手段と、 該雑音抑制手段によって処理された音声を認識処理する
音声認識手段とを備えたことを特徴とする音声認識装
置。4. A speech recognition apparatus for recognizing speech under noise, comprising: speech detection means for detecting speech; and periodic sound components of each frequency band extracted from the output of the speech detection means. Cut-off frequency determining means for determining a cut-off frequency according to a certain frequency band; a high-pass filter for setting the cut-off frequency; a noise suppressing means for suppressing noise from voice obtained by the high-pass filter; A speech recognition unit for recognizing and processing the speech processed by the noise suppression unit.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000113152A JP2001296887A (en) | 2000-04-14 | 2000-04-14 | Speech recognition method and speech recognition device using the method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000113152A JP2001296887A (en) | 2000-04-14 | 2000-04-14 | Speech recognition method and speech recognition device using the method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2001296887A true JP2001296887A (en) | 2001-10-26 |
Family
ID=18625177
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000113152A Pending JP2001296887A (en) | 2000-04-14 | 2000-04-14 | Speech recognition method and speech recognition device using the method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2001296887A (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005338286A (en) * | 2004-05-25 | 2005-12-08 | Yamaha Motor Co Ltd | Object sound processor and transport equipment system using same, and object sound processing method |
JP2007065122A (en) * | 2005-08-30 | 2007-03-15 | Aisin Seiki Co Ltd | Noise suppressor for in-vehicle speech recognition system |
JP2008165125A (en) * | 2007-01-05 | 2008-07-17 | Kenwood Corp | Audio signal processor, audio signal processing method, and audio signal processing program |
JP2012182648A (en) * | 2011-03-01 | 2012-09-20 | Mitsubishi Electric Corp | Amplifier, mobile body information apparatus, amplifier power saving method |
JP2023159461A (en) * | 2018-06-21 | 2023-10-31 | マジック リープ, インコーポレイテッド | Wearable system speech processing |
-
2000
- 2000-04-14 JP JP2000113152A patent/JP2001296887A/en active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005338286A (en) * | 2004-05-25 | 2005-12-08 | Yamaha Motor Co Ltd | Object sound processor and transport equipment system using same, and object sound processing method |
JP2007065122A (en) * | 2005-08-30 | 2007-03-15 | Aisin Seiki Co Ltd | Noise suppressor for in-vehicle speech recognition system |
JP2008165125A (en) * | 2007-01-05 | 2008-07-17 | Kenwood Corp | Audio signal processor, audio signal processing method, and audio signal processing program |
JP2012182648A (en) * | 2011-03-01 | 2012-09-20 | Mitsubishi Electric Corp | Amplifier, mobile body information apparatus, amplifier power saving method |
JP2023159461A (en) * | 2018-06-21 | 2023-10-31 | マジック リープ, インコーポレイテッド | Wearable system speech processing |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8504362B2 (en) | Noise reduction for speech recognition in a moving vehicle | |
US9230538B2 (en) | Voice recognition device and navigation device | |
JP4134989B2 (en) | Automotive audio equipment | |
KR20080026456A (en) | Sound signal processing method, sound signal processing apparatus and recording medium | |
CN112216300A (en) | Noise reduction method and device for sound in driving cab of mixer truck and mixer truck | |
JP2002314637A (en) | Device for reducing noise | |
JP2012025270A (en) | Apparatus for controlling sound volume for vehicle, and program for the same | |
US20060031067A1 (en) | Sound input device | |
Puder et al. | Improved noise reduction for hands-free car phones utilizing information on vehicle and engine speeds | |
JP2001147153A (en) | Method and system for detecting parasitic noise | |
JP2001296887A (en) | Speech recognition method and speech recognition device using the method | |
JP2000330597A (en) | Noise suppression device | |
CN110525450B (en) | Method and system for adjusting vehicle voice sensitivity | |
JP4016529B2 (en) | Noise suppression device, voice recognition device, and vehicle navigation device | |
JP2008070878A (en) | Audio signal preprocessing device, audio signal processing device, audio signal preprocessing method, and audio signal preprocessing program | |
CN112672255B (en) | A kind of vehicle sound source volume adaptive adjustment method and device | |
JP5040313B2 (en) | Audio signal processing apparatus, audio signal processing method, and audio signal processing program | |
US12322408B2 (en) | Call processing apparatus | |
EP3852098A1 (en) | Audio system for vehicle and audio output method | |
US6314394B1 (en) | Adaptive signal separation system and method | |
JP2007065122A (en) | Noise suppressor for in-vehicle speech recognition system | |
JP2008070877A (en) | Audio signal preprocessing device, audio signal processing device, audio signal preprocessing method, and audio signal preprocessing program | |
CN117121097A (en) | Method and apparatus for acoustically outputting functional system noise of a vehicle | |
Hoshino et al. | Noise-robust speech recognition in a car environment based on the acoustic features of car interior noise | |
JPH04282697A (en) | Noise controller |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040922 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040928 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041119 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20050531 |