JP4817949B2 - 車載機 - Google Patents
車載機 Download PDFInfo
- Publication number
- JP4817949B2 JP4817949B2 JP2006114235A JP2006114235A JP4817949B2 JP 4817949 B2 JP4817949 B2 JP 4817949B2 JP 2006114235 A JP2006114235 A JP 2006114235A JP 2006114235 A JP2006114235 A JP 2006114235A JP 4817949 B2 JP4817949 B2 JP 4817949B2
- Authority
- JP
- Japan
- Prior art keywords
- audio
- unit
- audio data
- sound
- subband
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Description
また、AVNシステムにおけるナビゲーション装置は、自車位置周辺の地図を表示すると共に、目的地までの経路を探索して地図上に表示して経路誘導を行なう。かかるナビゲーション装置に対してユーザが所定の制御の実行を指示する手段としてリモコン、タッチパネルに加えて音声認識装置を装備したものが多くなっている。かかる音声認識装置は、雑音を抑圧した話者音声が入力されると音声認識率を向上する。このため、マイクで受音したオーディオ再生音と話者音声とが混じった音から適応フィルタを用いてオーディオ音のみを抑圧して音声認識装置に入力するオーディオ音キャンセルシステム (ASCシステム:Audio Sound Cancellation System)が、該音声認識装置の前段に設けられている。
圧縮オーディオデコード部9は圧縮オーディオデータに伸張処理(復元処理)を施してオーディオデータを復元して入力切換部11に入力する。入力切換部11は圧縮オーディオデコード部9から入力するオーディオデータあるいは出力切換部8から入力するオーディオデータをASCシステム1に入力すると共に、オーディオ回路12に入力する。オーディオ回路12は入力されたオーディオデータSaをアナログに変換してスピーカ13から音響空間に再生音を出力する。
非圧縮オーディオデータの場合、以上と並行して圧縮オーディオエンコード部10は非圧縮オーディオデータ(PCMオーディオデータ)に圧縮処理を施してディスク制御部14に入力する。ディスク制御部14は入力された圧縮オーディオデータをハードディスク6に記録する(リッピング)。また、ディスク制御部14は図示しない操作部からの要求により、ハードディスク6に記録されている所定曲の圧縮オーディオデータを読み出してソース切替部7に入力する。
LMS演算部24b は、1サンプリング時刻Ts後の次の時刻(n+1)・Tsにおける適応フィルタ24aの係数W(n+1)を、現時刻n・Tsにおける適応フィルタの係数W(n)とエラー信号e(n)を用いて次式
図9のオーディオキャンセルシステムによれば、スピーカからマイクロホンまでの伝達特性を模擬するように、換言すれば、オーディオ音をキャンセルするように適応フィルタ24aの係数が決定される。この結果、オーディオ音が出力されている状態において話者が音声を発声すると、マイクロホン2により該オーディオ音と発話音声の合成音が検出され、誤差発生部23は該合成音信号d(n)よりオーディオ音キャンセル信号y(n)を除いた誤差信号e(n)を発話音声信号として音声認識装置4に入力し、音声認識装置4は該発話音声信号に基づいて音声認識処理を実行する。
ポストフィルタ37は各帯域の誤差信号に所定のバンドパスフィルタ処理を施し、合成部38はポストフィルタ37の各バンドパスフィルタ出力を合成し、アップサンプリング部(UP)39は合成信号をアップサンプリングして出力する。
以上により、マイクロホン2がオーディオ再生音のみを検出しているとき、各帯域のオーディオ音のパワーが最小となるフィルタ係数が適応フィルタFIRに設定される。この結果、マイクロホン2がオーディオ再生音と話者音声が混じった合成音を検出すると、オーディオ再生音が抑圧されて話者音声信号がアップサンプリング部(UP)39から出力する。
以上から、本発明の目的は、オーディオデータの帯域信号成分を出力するASCキャンセルシステムにおけるフィルタバンクを除去してシステムのハードウェア負担を軽減することである。
本発明の車載機は更に、オーディオソースから出力するオーディオデータが圧縮されているか否かを判定する判定部、圧縮オーディオデータを復号する復号部、前記復号部から出力する圧縮オーディオデータに伸張処理を施して前記オーディオ回路に入力する伸張部、前記オーディオソースから出力するオーディオデータが圧縮されていれば、前記復号部の出力データを前記オーディオ音キャンセル部に入力し、圧縮されていなければ前記フィルタバンクから出力するサブバンドオーディオデータを前記オーディオ音キャンセル部に入力する切替部を備えている。
図1は本発明の車載機の要部構成図である。ASCシステム51は後述するようにマルチレート信号処理技術を採用した構成を備えており、その第1入力端子側にはマイクロホン52により検出された検出音信号Sdがフィルタバンク部53を介して入力され、第2入力端子側にはオーディオ部54からオーディオ信号Saが入力される。ASCシステム51は、後述するようにオーディオ部の圧縮に用いるフィルタバンク72aをオーディオ音キャンセル処理に共用する点に特徴を有している。
フィルタバンク部53はマイクロホン検出音信号Sdをn個の帯域、例えば32個のサブバンドに分割して出力するもので、図示しないがフィルタバンクとダウンサンプリング部で構成されている(図10のフィルタバンク32、ダウンサンプリング部34を参照)。すなわち、フィルタバンク部53はマイクロホン検出音信号Sdを32サブバンドに分割し、各サブバンドの信号成分をダウンサンプリングしてASCシステム51に入力する。
オーディオ部54において、CDデッキ等のオーディオ再生部61あるいはハードディスク62から読み出されたオーディオデータは、ソース切替部63、オーディオソース種別判別部64を介して出力切換部65に入力される。ソース切替部63は所定のオーディオソースからのオーディオデータを選択し、オーディオソース種別判別部64は該オーディオデータが圧縮されているか、圧縮されていないかを判別し、判別結果を出力切換部65と第1、第2の入力切替部66、67に入力する。
出力切換部65は入力オーディオデータが圧縮されているか否かにより出力先を選択するもので、圧縮されていればオーディオデータを復号/伸張部71に入力し、圧縮されていなければオーディオデータ(PCMオーディオデータ)を第2の入力切替部67と圧縮/符号化部72に入力する。
入力オーディオデータが圧縮されていなければ、第2の入力切替部67は該非圧縮のオーディオデータ(PCMオーディオデータ)をオーディオ回路74に入力し、オーディオ回路74は入力されたオーディオデータをアナログに変換してスピーカ75から音響空間に再生音を出力する。また、圧縮/符号化部72の分析部(フィルタバンク部)72aは、非圧縮のオーディオデータをn個の帯域(サブバンド)、例えば32個のサブバンドに分割し、第1の入力切替部66を介してASCシステム51に入力すると共に、各サブバンドオーディオデータを圧縮部72bに入力する。圧縮部72bはMPEGオーディオ圧縮方式、例えば32サブバンド・コーディング(帯域分割符号化)方式に従って圧縮/符号化処理を行い、処理結果をディスク制御部76に入力する。ディスク制御部76は入力された圧縮オーディオデータをハードディスク62に記録する(リッピング)。また、ディスク制御部76は図示しない操作部からの要求により、ハードディスク62に記録されている所定曲の圧縮オーディオデータを読み出してソース切替部63に入力して再生する。
図2は圧縮/符号化部72の構成図であり、分析部(フィルタバンク部)72aと圧縮部72bとで構成されている。
フィルタバンク部72aは32個のバンドパスフィルタBPFを備え、オーディオデータを32個のサブバンドオーディオデータにして出力する。なお、32サブバンドオーディオデータは第1の入力切替部66を介してASCシステム51に入力される。圧縮部72bはMPEGオーディオ圧縮方式、例えば、32サブバンド分割符号化方式により圧縮/符号化する。32サブバンド分割符号化方式は、聴感心理的な特性を利用して高能率の圧縮を実現する。
人間の耳はあるレベル以下の音を聞き取ることができず、このレベルを各帯域毎にプロットしてできる特性曲線は最小マスキングしきい値曲線(最小可聴限界曲線)MTCと呼ばれている(図3参照)。マスキング効果は周囲の音の状況により変化し、最小マスキングしきい値曲線MTC以上のレベルを有する音であっても小さな音は大きな音により聞こえなくなってしまう。これは、大きな音によりマスキングしきい値曲線が図3のMTC′のように変化するからであり、該曲線以下の音成分A,Bはマスキングされて人間の耳に聞こえず、マスキングしきい値曲線MTC′より上の音成分C,Dは聞こえる。
以上を考慮して、マスキングしきい値レベルMTC′以下の音A,Bは量子化せず、マスキングしきい値レベル以上の音C,Dを量子化する。又、量子化する場合には、各サブバンドにおけるオーディオレベルとマスキングしきい値レベルの差の大きさに応じて量子化ビット数を割り当てて量子化し、量子化データと割り当てビット数等を出力する。
1つのサブバンドの36サンプルデータに対して共通に1つのスケールファクタが決められる。すなわち、36個のそれぞれの波形の最大値が1.0になるように正規化し、その正規化倍率がスケールファクタとして符号化される。
又、各サブバンドの量子化ビット数を決定し、割り当てビット数とする。臨界帯域幅を考慮したマスキングレベルぎりぎりまでの量子化精度(量子化ビット数)を指定することにより、マスキング効果を最も効果的に利用できる。マスキングの結果、聴感系に認識されないレベルの信号しか含まれないバンドについては、完全に情報をなくすことができ、かかる場合はサンプルデータとしてビットを割り当てない。すなわち、各サブバンドにおけるサンプルデータの量子化ビット数が0の場合、サンプリングデータは存在しない。
図2に戻って、圧縮部72bにおいて、心理聴覚モデル81は、1フレームm(=1152)サンプリングのオーディオデータが入力される毎にマスキングしきい値特性MTC′(図3参照)を求め、このマスキングしきい値特性MTC′の各サブバンドにおけるマスクレベルと信号レベルとからサブバンド(N=32)毎に量子化ビット数、スケールファクタを決定し、各サブバンドの調節部821〜8232はスケールファクタに基づいてビットシフト量を決定し、ビットシフト部831〜8332は各サブバンド信号のビットをシフトして符号化部84に入力する。符号化部84はシフト後のサブバンドデータを量子化ビット数で符号化すると共に、各サブバンドの量子化ビット数、スケールファクタを符号化して出力する。
図6は復号/伸張部71の構成図であり、復号器71aと伸張部71bとで構成されている。復号器71aは符号化されている圧縮オーディオデータを復号し、各サブバンドの圧縮オーディオデータとスケールファクタを伸張部71bに入力すると共に、第1の入力切替部66に入力する。
伸張部71bにおける各サブバンドの調節部851〜8532はスケールファクタに基づいてビットシフト量を決定し、ビットシフト部861〜8632は各サブバンドデータのビットを圧縮時と逆方向にシフトして伸張する。各サブバンドのポストフィルタ(バンドパスフィルタBPF)は伸張された各サブバンド信号に所定のBPF特性を付与し、合成部88は全ポストフィルタ出力を合成してオーディオ信号を復元して出力する。
図7は本発明のASCシステム51の構成図であり、フィルタバンク部53及び入力切替部66からマイクロホン検出音信号Sdおよびオーディオ信号Saが32個のサブバンドに分割されて入力している。すなわち、フィルタバンク部53はマイクロホン検出音信号Sdを32サブバンドの信号成分に分割し、各サブバンドの信号成分をダウンサンプリングしてASCシステム51に入力する。また、入力切替部66は、非圧縮オーディオデータ再生時、圧縮/符号化部72のフィルタバンク部72aから出力する32サブバンドオーディオデータをASCシステム51に入力し、圧縮オーディオデータ再生時、復号/伸張部71の復号器71aから出力する32サブバンドオーディオデータ及びスケールファクタをASCシステム51に入力する。
非圧縮オーディオデータ再生時、入力切替部66は圧縮/符号化部72のフィルタバンク部72aが出力する32サブバンドオーディオデータをASCシステム51に入力する。ASCシステム51のダウンサンプリング部91はサブバンド毎にサンプリング部(DS)を備え、各サブバンドオーディオデータをダウンサンプリングして出力する。
オーディオ音キャンセルコントロール部92は、サブバンド毎に適応信号処理部ASPを備え、サブバンド毎に誤差信号のパワーが最小となるようにLMS適応信号処理を行なう。誤差信号発生部93はサブバンド毎に誤差演算部COMを備え、対応するサブバンドの適応信号処理部の出力信号とマイクロホン検出音信号との差を計算して誤差信号として適応信号処理部ASPにフィードバックする。オーディオ音キャンセルコントロール部92において、各サブバンドの適応信号処理部ASPの適応フィルタ(FIR)は対応するサブバンドのオーディオデータにフィルタリング処理を施して出力し、LMS演算部(LMS)は対応するサブバンドの誤差演算部から出力する誤差信号のパワーが最小となるようにLMS適応信号処理を行って適応フィルタFIRのフィルタ係数を決定する。なお、非圧縮オーディオデータ再生時においてスケールファクタは0である。このため、ビットシフト量は0であり、各サブバンドのビットシフト部941〜9432はビットシフトをしない。
ポストフィルタ96は各サブバンドの誤差信号に所定のバンドパスフィルタ処理を施し、合成部97はポストフィルタ96の各バンドパスフィルタ出力を合成し、アップサンプリング部(UP)98は合成信号をアップサンプリングして話者音声として音声認識装置に出力する。
圧縮オーディオデータ再生時、入力切替部66は復号/伸張部71の復号器71aが出力する32サブバンドオーディオデータ及びスケールファクタをASCシステム51に入力する。ASCシステム51のダウンサンプリング部91は各サブバンドのオーディオデータをダウンサンプリングして出力する。
オーディオ音キャンセルコントロール部92は、サブバンド毎に適応信号処理部ASPを備え、サブバンド毎に誤差信号のパワーが最小となるようにLMS適応信号処理を行なう。各サブバンドの調節部951〜9532はスケールファクタに基づいてビットシフト量を決定し、ビットシフト部941〜9432は各サブバンドの適応フィルタFIRから出力するデータのビットを圧縮時とは逆方向にシフトして伸張する。誤差信号発生部93はサブバンド毎に誤差演算部COMを備え、対応するサブバンドの適応信号処理部ASPの適応フィルタ出力信号とマイクロホン検出音信号との差を計算して誤差信号として該適応信号処理部ASPにフィードバックする。
オーディオ音キャンセルコントロール部92において、各サブバンドの適応信号処理部ASPの適応フィルタ(FIR)はサブバンドのオーディオデータにフィルタリング処理を施して出力し、LMS演算部(LMS)は対応するサブバンドの誤差演算部から出力する誤差信号のパワーが最小となるようにLMS適応信号処理を行って適応フィルタFIRのフィルタ係数を決定する。ポストフィルタ96は各サブバンドの誤差信号に所定のバンドパスフィルタ処理を施し、合成部97はポストフィルタ96の各バンドパスフィルタ出力を合成し、アップサンプリング部(UP)98は合成信号をアップサンプリングして話者音声として音声認識装置に出力する。
52 マイクロホン
53 フィルタバンク部
54 オーディオ部
61 CDデッキ等のオーディオ再生部
62 ハードディスク
63 ソース切替部
64 オーディオソース種別判別部
65 出力切換部
66,67 第1、第2の入力切替部
71 復号/伸張部
71a 復号器
71b 伸張部
72 圧縮/符号化部
72a フィルタバンク部
72b 圧縮部
74 オーディオ部76 ディスク制御部
Claims (2)
- オーディオ再生してスピーカより出力するオーディオ機能とオーディオ音をキャンセルして話者音声を出力するオーディオキャンセル機能とを備えた車載機において、
非圧縮のオーディオデータを入力されてオーディオ音を音響空間に放射するオーディオ回路、
前記オーディオデータを複数のサブバンドオーディオデータにして出力するフィルタバンク、
前記フィルタバンクから出力される各サブバンドのオーディオデータを圧縮してメモリに記憶する圧縮部、
前記フィルタバンクから出力される各サブバンドのオーディオデータにオーディオ音キャンセル処理を施して合成するオーディオ音キャンセル部、
を備えたことを特徴とする車載機。 - オーディオソースから出力するオーディオデータが圧縮されているか否かを判定する判定部、
圧縮オーディオデータを復号する復号部、
前記復号部から出力する圧縮オーディオデータに伸張処理を施して前記オーディオ回路に入力する伸張部、
前記オーディオソースから出力するオーディオデータが圧縮されていれば、前記復号部の出力データを前記オーディオ音キャンセル部に入力し、圧縮されていなければ前記フィルタバンクから出力するサブバンドオーディオデータを前記オーディオ音キャンセル部に入力する切替部、
を備えたことを特徴とする請求項1記載の車載機。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006114235A JP4817949B2 (ja) | 2006-04-18 | 2006-04-18 | 車載機 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006114235A JP4817949B2 (ja) | 2006-04-18 | 2006-04-18 | 車載機 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007288565A JP2007288565A (ja) | 2007-11-01 |
JP4817949B2 true JP4817949B2 (ja) | 2011-11-16 |
Family
ID=38759908
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006114235A Active JP4817949B2 (ja) | 2006-04-18 | 2006-04-18 | 車載機 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4817949B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5017441B2 (ja) * | 2010-10-28 | 2012-09-05 | 株式会社東芝 | 携帯型電子機器 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000207845A (ja) * | 1999-01-13 | 2000-07-28 | Alpine Electronics Inc | 音声記録再生装置 |
JP3822397B2 (ja) * | 1999-09-27 | 2006-09-20 | アルパイン株式会社 | 音声入出力方式 |
-
2006
- 2006-04-18 JP JP2006114235A patent/JP4817949B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2007288565A (ja) | 2007-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2309969T3 (es) | Procedimiento y dispositivo para la ampliacion artificial de la anchura de banda de señales de voz. | |
JP6559741B2 (ja) | 低遅延符号化/復号のための音声信号のリサンプリング | |
JP4899359B2 (ja) | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 | |
US20070239294A1 (en) | Hearing instrument having audio feedback capability | |
JPH10124088A (ja) | 音声帯域幅拡張装置及び方法 | |
EP2596496B1 (en) | A reverberation estimator | |
JP5730303B2 (ja) | 復号装置、符号化装置およびこれらの方法 | |
JP4733939B2 (ja) | 信号復号化装置及び信号復号化方法 | |
KR20010014352A (ko) | 음성 통신 시스템에서 음성 강화를 위한 방법 및 장치 | |
JP2013235284A (ja) | 音声復号化方法及び装置 | |
KR20090043983A (ko) | 고주파수 신호 부호화 및 복호화 장치 및 방법 | |
JPH08286698A (ja) | 音響信号のエラー隠匿方法及びその装置 | |
JPWO2007116809A1 (ja) | ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法 | |
JP2016541004A5 (ja) | ||
KR20080114578A (ko) | 디지털 신호 처리 장치, 디지털 신호 처리 방법 및 디지털신호 처리 프로그램 | |
JP5027966B2 (ja) | 入力信号をボコーディングする方法および装置およびそのためのコンピュータ読み出し可能信号を有する媒体を含む製造物品 | |
EP1841284A1 (en) | Hearing instrument for storing encoded audio data, method of operating and manufacturing thereof | |
JP2010213350A (ja) | 中継装置 | |
JP2000152394A (ja) | 軽度難聴者用補聴装置、軽度難聴者対応伝送システム、軽度難聴者対応記録再生装置、及び軽度難聴者対応再生装置 | |
JPH10124089A (ja) | 音声信号処理装置及び方法、並びに、音声帯域幅拡張装置及び方法 | |
JP4817949B2 (ja) | 車載機 | |
CN102959618A (zh) | 声音识别装置 | |
KR20170098761A (ko) | 인-이어 마이크로폰을 갖는 이어셋의 대역폭 확장 장치 및 방법 | |
JP2007101871A (ja) | 補間装置、オーディオ再生装置、補間方法および補間プログラム | |
JPH09127985A (ja) | 信号符号化方法及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090220 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110822 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110830 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110830 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140909 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4817949 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |