[go: up one dir, main page]

JP5627241B2 - 音声信号処理装置および方法 - Google Patents

音声信号処理装置および方法 Download PDF

Info

Publication number
JP5627241B2
JP5627241B2 JP2009550448A JP2009550448A JP5627241B2 JP 5627241 B2 JP5627241 B2 JP 5627241B2 JP 2009550448 A JP2009550448 A JP 2009550448A JP 2009550448 A JP2009550448 A JP 2009550448A JP 5627241 B2 JP5627241 B2 JP 5627241B2
Authority
JP
Japan
Prior art keywords
audio signal
filter
filter coefficient
frequency
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009550448A
Other languages
English (en)
Other versions
JPWO2009093416A1 (ja
Inventor
田中 直也
直也 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2009550448A priority Critical patent/JP5627241B2/ja
Publication of JPWO2009093416A1 publication Critical patent/JPWO2009093416A1/ja
Application granted granted Critical
Publication of JP5627241B2 publication Critical patent/JP5627241B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/305Electronic adaptation of stereophonic audio signals to reverberation of the listening space
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、スピーカ等によって再生される音声信号を前処理することにより、特に、残響の影響により音声の明瞭性が低下しやすい閉空間において、再生される音声の明瞭性を向上させる技術に関する。
ディジタルもしくはアナログ信号として記録伝送された音声信号を、スピーカ等の音声再生手段を用いて再生する装置は、テレビ・ラジオ受信機、オーディオ装置、拡声装置など、広く一般に用いられている。一部の屋外用拡声装置を除いて、その多くは室内で使用される。室内は、壁に囲まれた閉空間であるため、スピーカから発せられた音波信号は、壁面に到達する毎に反射を繰り返す。従って、耳に届く音波信号は、スピーカから直接届く直接波と、壁面からの反射波が合成された信号となる。壁面からの反射波の強さは、壁面までの距離や、壁面の素材、構造などによって異なるが、たとえばコンクリートやタイルなどの硬い素材で作られた平らな壁面は、反射率が高く、強い反射波を生じる。
このような壁面で囲まれた空間の代表としては、家庭の浴室があげられる。反射波は、様々な方向から到来し、また、その経路長によって異なる遅延時間を有している。耳に届く反射波は、これら多くの反射波の合成であるため、独立した音としては認識されず、響き感やこもり感といった感覚として認識される。これを一般に、残響もしくはリバーブ(reverb)と呼ぶ。残響は、音声の明瞭性を低下させ、残響の強度が上がるに従って、音声の認識率が低下することが知られている。
残響による音声の明瞭性低下を防ぐ方法として、残響が人間の聴覚に悪影響を及ぼしている部分について、その補正となる処理を入力音声信号に対して行ってから、スピーカから再生する方法がある。例えば、特許文献1において、残響による影響を補正する前処理として、入力信号から変調スペクトルを算出し、変調スペクトルの特定の帯域を強調する処理を行った後、前記処理された変調スペクトルから音声信号を再合成する方法が開示されている。この方法によれば、壁面等で反射した音波が原音に重畳する部分での原音の音圧を抑制することができ、特に、残響が音声信号の時間方向への振幅包絡の変化に及ぼす影響を補正し、残響環境下での音声の明瞭性を向上させることができる(特許文献1参照)。
特開2001−100774号公報
しかしながら、残響が音声信号に及ぼす影響は、音声信号の時間方向への振幅包絡の変化だけに留まらない。また、上記の従来の補正では、広い空間内で反射して戻ってきた音波と原音とが重なるタイミングで原音の音声信号をカットしているので、あまり広くない空間内で、すぐに戻ってくる残響に対しては十分に対処することができないという問題がある。図1は、閉空間において、スピーカから発せられた音声信号が、聴取者の耳に到達するまでの経路を示す図である。スピーカ201から発せられた音声信号は、音波信号として空間を伝播する。音波信号S1は、スピーカ201から直接聴取者202に届く直接波であり、音波信号S2、S3は、周囲の壁面203で反射してから届く反射波である。実際の閉空間環境においては、反射波はその経路により無数に存在する。また、一般に反射波が耳に到達するまでの経路長は、直接波に比べて長い。したがって、音速を毎秒340mとすれば、経路長の差1mに対し、約3msの遅延を生じる。つまり、聴取者の耳には、スピーカからの直接波が最初に到達し、続いて、様々な方向から、それぞれの経路長に基づく遅延を伴った反射波が到達することになる。
人間の聴覚は、音波の強弱だけでなく、音波の到来方向も認識しているが、このように、遅延を伴って様々な方向から音波が到来すると、聴覚は音波の到来方向を正しく把握することができない。聴取者が認識する音源位置はあいまいとなり、響き感、モヤモヤ感やこもり感といった感覚を覚え、結果として、音声を明瞭に聴き取れない状態になる。
本発明の目的は、狭い閉空間において音声信号を再生する場合であっても、残響による再生音への悪影響を抑制することによって認識率の高い明瞭な音声を再生することができる音声信号処理装置を提供することである。
前記課題を解決するために本発明の音声信号処理装置は、音声信号の両耳間位相差が音の到来方向の認識に与える影響の大きさに基づいたフィルタ特性を与えるフィルタ係数を決定するフィルタ係数設定部と、前記フィルタ係数設定部によって決定された前記フィルタ係数を用いて、前記音声信号にフィルタリング処理を行うフィルタ部とを備える。具体的には、前記フィルタ係数設定部は、再生された音声信号を聴取者が聴取する際、前記聴取者における両耳間位相差が、音の到来方向の認識に与える影響の大きさが大きくなる周波数ほど、前記音声信号の信号強度を小さくするゲイン定数を周波数毎に設定したフィルタ係数を決定する。
また、前記フィルタ係数設定部は、前記両耳間位相差が音の到来方向の認識に与える影響の大きさの値があらかじめ定められた閾値よりも大きくなる周波数範囲で入力音声信号を減衰するようなフィルタ特性を前記フィルタ部に与えるフィルタ係数を決定するとしてもよい。具体的には、前記フィルタ係数設定部は、(1)前記音の到来方向が前記聴取者の両耳を結ぶ直線方向に対して成す角度である偏角と、(2)前記偏角に基づいて算出される両耳間時間差と、(3)前記両耳間時間差および前記音声信号の周波数の関係から求められる両耳間位相差と、を用いた関係式により算出される周波数を、フィルタ係数により処理する周波数領域の下限周波数として設定してもよい。
また、前記フィルタ係数設定部は、前記両耳間位相差が音の到来方向の認識に与える影響の大きさの値があらかじめ定められた閾値よりも大きくなる周波数範囲の最適値を500Hz〜1200Hzと定め、前記周波数範囲で、入力音声信号を減衰するようなフィルタ特性を与えるフィルタ係数を決定するとしてもよい。
さらに、前記フィルタ係数設定部は、声の第1フォルマントの周波数範囲の前記減衰量を小さくするように調整したフィルタ特性を与えるフィルタ係数を決定するとしてもよい。
また、前記フィルタ係数設定部は、前記フィルタ係数を保持するROMで構成され、前記フィルタ部は、前記ROMから読み出した前記フィルタ係数を用いて、入力音声信号をフィルタリング処理するとしてもよい。
前記音声信号処理装置は、さらに、前記フィルタ部からの出力である音声信号を再生する再生部と、前記再生部により音声信号が再生される再生空間での残響の特性を表す残響特性データを保持する残響特性設定部とを備え、前記フィルタ係数設定部は、前記両耳間位相差が音の到来方向の認識に与える影響の大きさの値に基づくフィルタ特性に、前記残響特性設定部に保持されている前記残響特性データに基づくフィルタ特性を加味して、前記フィルタ係数を決定するとしてもよい。
また、前記音声信号処理装置は、さらに、前記フィルタ部からの出力である音声信号を再生する再生部と、前記再生部の再生特性を表す再生特性データを保持する再生特性設定部とを備え、前記フィルタ係数設定部は、前記両耳間位相差が音の到来方向の認識に与える影響の大きさに基づくフィルタ特性を、前記再生特性設定部に保持されている前記再生特性データに基づいて調整し、調整されたフィルタ特性を表すフィルタ係数を決定するとしてもよい。
前記音声信号処理装置は、さらに、前記フィルタ部からの出力である音声信号を再生する再生部と、前記再生部の再生特性を表す再生特性データを保持する再生特性設定部と、前記再生部により音声信号が再生される再生空間での残響の特性を表す残響特性データを保持する残響特性設定部とを備え、前記フィルタ係数設定部は、前記両耳間位相差が音の到来方向の認識に与える影響の大きさに基づいたフィルタ特性に、前記残響特性設定部に保持されている残響特性データに基づいたフィルタ特性を加味し、得られた前記フィルタ特性を、前記再生特性設定部に保持されている前記再生特性データに基づいて調整し、調整されたフィルタ特性を表す前記フィルタ係数を決定するとしてもよい。
さらに、前記フィルタ係数設定部は、前記両耳間位相差が音の到来方向の認識に与える影響の大きさの値が、あらかじめ定められた閾値よりも大きくなる周波数範囲で減衰するようなフィルタ特性に対して、前記残響特性の残響音の音圧があらかじめ定められた第2の閾値よりも大きい周波数帯域について、前記減衰をさらに大きくするように補正したフィルタ係数を決定するとしてもよい。
また、前記フィルタ係数設定部は、前記両耳間位相差が音の到来方向の認識に与える影響の大きさの値があらかじめ定められた閾値よりも大きくなる周波数範囲で減衰するようなフィルタ特性に対して、前記残響特性の残響音の音圧があらかじめ定められた第2の閾値よりも強く、かつ、残響が持続する時間があらかじめ定められた第3の閾値よりも長い周波数帯域について、前記減衰をさらに大きくするように調整したフィルタ係数を決定するとしてもよい。
さらに、前記フィルタ係数設定部は、前記両耳間位相差が音の到来方向の認識に与える影響の大きさの値があらかじめ定められた閾値よりも大きくなる周波数範囲で、かつ、前記再生部の再生特性から前記再生部の出力音圧が低域側で減衰する周波数範囲について、前記両耳間位相差が音の到来方向の認識に与える影響の大きさの値が前記閾値よりも大きくなる周波数範囲で減衰するようなフィルタ特性に対して、前記減衰を小さくするように調整したフィルタ係数を決定するとしてもよい。
なお、本発明は、装置として実現できるだけでなく、その装置を構成する処理手段をステップとする方法として実現したり、それらステップをコンピュータに実行させるプログラムとして実現したり、そのプログラムを記録したコンピュータ読み取り可能なCD−ROMなどの記録媒体として実現したり、そのプログラムを示す情報、データ又は信号として実現したりすることもできる。そして、それらプログラム、情報、データ及び信号は、インターネット等の通信ネットワークを介して配信してもよい。
上記構成により本発明の音声信号処理装置は、反射波によって音の到来方向の認識を妨げる周波数の成分のみを、どの程度妨害されるかの尺度にしたがって減衰させることにより、全体の音の強度の低下を防ぎながら、残響が強い閉空間の環境における再生音声信号の明瞭性を向上することができる。
図1は閉空間において、スピーカから発せられた音声信号が聴取者の耳に到達するまでの経路を示す図である。 図2は本発明の実施の形態1における音声信号処理装置の構成を示す図である。 図3(a)及び(b)は音の到来方向と両耳間の行程差との関係を示す図である。 図4(a)及び(b)は聴覚特性パラメータとそれに対応するフィルタ特性とを示す図である。 図5は本発明の実施の形態2における音声信号処理装置の構成を示す図である。 図6は残響特性パラメータを示す図である。 図7は本発明の実施の形態3における音声信号処理装置の構成を示す図である。 図8は小型スピーカの再生周波数特性の一例を示す図である。 図9(a)及び(b)は、聴覚特性パラメータおよび残響特性パラメータのみに基づいて設定されたフィルタ係数による、前処理フィルタの周波数特性と出力音圧特性との関係を示す図である。 図10(a)及び(b)はスピーカの再生特性に基づく補正有りの場合の前処理フィルタの周波数特性と出力音圧の関係を示す図である。 図11は実施の形態3の音声信号処理装置の動作を示すフローチャートである。
以下、本発明を実施するための最良の形態について、図面を参照しながら説明する。
(実施の形態1)
図2は、本発明の実施の形態1の音声信号処理装置の構成を示す図である。人間の聴覚には、特定の周波数帯域の音に対して、音の到来方向を認識する能力が高いという特性がある。その結果、その周波数帯域の音が、壁面などの反射により、多様な方向から耳に入った場合には、聴き取った音に響き感、モヤモヤ感、こもり感などを生じさせる影響が強く、音声を明瞭に聴き取れなくする傾向がある。本実施の形態1の音声信号処理装置は、前述のような聴覚特性を有する周波数帯域をあらかじめ検出し、検出された周波数帯域をスピーカ出力の前処理で抑制することによって、閉空間での残響下においても音声を明瞭に聴き取れるようにした音声信号処理装置である。以下、図面を参照しながら、実施の形態1の音声信号処理装置の構成および動作を説明する。図2に示すように、音声信号処理装置10は、第1のフィルタ係数設定部100、前処理フィルタ部103及びスピーカ104を備える。さらに、第1のフィルタ係数設定部100は、聴覚特性設定部101および第1のフィルタ特性設定部102を含む。聴覚特性設定部101は、聴覚特性パラメータを保持している。聴覚特性パラメータについては、後でその詳細を述べる。第1のフィルタ特性設定部102は、聴覚特性設定部101で保持されている聴覚特性パラメータに従って、前処理フィルタ部103による前処理に必要なフィルタ特性を決定する。第1のフィルタ特性設定部102によって決定されたフィルタ特性は、フィルタ係数として、前処理フィルタ部103に入力される。前処理フィルタ部103は、入力音声信号に対して、格納しているフィルタ係数を用いた演算によるフィルタリングである前処理を行う。例えば、前処理フィルタ部103は、入力音声信号に対してFFT(高速フーリエ変換:Fast Fourier Transform)などの周波数変換を施し、周波数変換により得られたスペクトルにフィルタ係数を乗算する。さらに、乗算結果として得られた周波数スペクトルに対してIFFT(逆高速フーリエ変換:Inverse Fast Fourier Transform)などの逆変換を施し、時間の関数として表される音声信号を出力する。前処理された入力音声信号は、スピーカ104を介して出力音声信号として再生される。なお、周波数変換の方法は、高速フーリエ変換に限らず、DCT(Discrete Cosine Transform)およびMDCT(Modified Discrete Cosine Transform)など他の周波数変換方法を用いるとしてもよい。また、周波数変換を行わずに、IIR(無限インパルス応答:Infinite Impulse Response)やFIR(有限インパルス応答:Finite Impulse Response)のフィルタを用いて、時間信号に対して直接フィルタリング処理を行っても良い。
ここで、聴覚特性パラメータについて詳しく説明する。先に述べたように、人間の聴覚は、音の到来方向を認識する能力を持っている。音の到来方向(もしくは音源の位置)の認識は、主に二つの要素から成り立っていることが一般に知られており、"Duplex Theory"と呼ばれている。すなわち、到来方向認識において、周波数が1500Hz以下の音の場合、両耳間時間差ITD(Interaural Time Difference)と呼ばれる指標が主要素であり、1500Hzを超える音の場合、両耳間レベル差ILD(Interaural Level Difference)と呼ばれる指標が主要素となる。ただし、ITDとILDのどちらが主要素になるかは、境界周波数においていずれかにスイッチされるのでは無く、境界周波数から離れるにしたがって徐々に切り替わるものであり、また、境界周波数には個人差がある。したがって、一般的にITDが支配的となる周波数は、例えば1200Hz程度である。さらに、人間がITDを認識できるのは、音波信号の第一波が到達したときのみであり、それ以降は、両耳間位相差IPD(Interaural Phase Defference)と呼ばれる指標により、音の到来方向が認知される。
次に、ITDとIPDの関係を説明する。図3は、音波信号が両耳を結ぶ直線方向に対して偏角(アジマス) θをもって到来した場合に、音波信号が人間の耳にどのように届くかを示す図である。図3(a)に示すように、両耳に到来する音波信号が平行に伝播すると仮定すれば、図3(b)に示すように、両耳間の行程差Yは、次の式1で表される。
Figure 0005627241
ここで、Xは頭の幅に相当する。例えば、平均的な日本人の頭の幅は、15〜17cm程度である。また、偏角θは、0≦θ<2πの範囲を取りえるが、Yを行程差の絶対値と定義すれば、コサイン関数の対称性により、0≦θ≦π/2が有効な範囲となる。
続いて、ITDは音速をVsとして、次の式2で表される。
Figure 0005627241
ここで、X=17cm(=0.17m)として、代表的な偏角θについてITDを算出すると、以下の表1に示す値となる。
Figure 0005627241
これにより、ITDの下限値は0ms、上限値は0.50msとなる。以上のように算出したITDは、両耳間で発生する音波信号の行程差と、音速に基づく値であり、音の周波数に係わらず一定である。これに対してIPDは、音波信号が両耳に到達している状態における、両耳間での信号位相の差であり、音波信号の周波数fによって異なる値を取る。IPDは次の式3で算出される。
Figure 0005627241
また、IPDは右側の耳に到達する音波信号の位相が左側の耳に到達する音波信号の位相よりも進んでいる場合に正の値として0≦IPD≦πの値をとる。また、左側の耳に到達する音波信号の位相が右側の耳に到達する音波信号の位相よりも進んでいる場合に負の値として0≦IPD≦−πの値を取る。IPD=0では、両耳間の位相差が無く、音波信号は真正面もしくは真後ろから到来していることを意味する。音波が頭の前方から到来しているか後方から到来しているかの判別は、耳の形状に起因する周波数特性の相違など、複合的な要因により行われる。0<IPD<πの範囲においては、0からπ/2に向かってIPDが増加するに伴って、音の到来方向は向かって右に移動し、π/2で移動量が最大となる。π/2を超えると、πに向かってIPDが増加するにしたがって、音の到来方向は向かって左に移動し、πにおいて正面に戻る。これは、IPD=πにおいて両耳間の位相がちょうど逆相の関係となり、両耳に到達するどちらの音波信号の位相が進んでいるかの判別が出来ないためである。また、IPDが負の値を取る場合については、左右の関係が逆となる。このように、IPD=π/2もしくは−π/2、つまり両耳間の位相差の絶対値がπ/2であるときに、IPDは音の到来方向の認識に最も大きな影響を与える。
ここで、先に算出した各ITDに対して、式3よりIPDがπ/2となる周波数を求めると以下の様になる。
Figure 0005627241
式3の関係により、ITDが0に近づくほど周波数は高くなる。先に説明したように、一般にITDが主要素となる上限の周波数は1200Hz程度であるが、ITDとIPDの認識には密接な関係があるため、IPDが主要素となって音波信号の到来方向を認知する上限周波数も1200Hz程度と考えて良い。また、上記算出結果より、IPD=π/2となる下限周波数は500Hzである。周波数が500Hz未満では、IPDの最大値はπ/2より小さくなり、音の到来方向の認識に与える影響は、周波数が下がるごとに小さくなる。以上の結果から、両耳に到達する音波信号の行程差に起因するIPDが、音の到来方向の認識に大きな影響を与える周波数範囲は、500〜1200Hz程度となる。
なお、前記上限周波数と下限周波数とで挟まれた周波数範囲において、IPDが音の到来方向の認識に与える影響の大きさは一定ではない。すなわち、同じIPD=π/2の条件であっても、例えば、周波数f=900Hzの第1の音波信号と、周波数f=1100Hzの第2の音波信号では、第1の音波信号の方が音の到来方向の認識に与える影響は大きい。これらの性質を考慮した聴覚特性パラメータの例を図4に示す。図4(a)及び(b)は、聴覚特性パラメータと対応するフィルタ特性を示す図である。図4(a)において、聴覚特性は従来から知られており、周波数をX軸、IPDが音の到来方向の認識に与える影響の大きさをY軸として、聴覚特性401のように表される。IPDが音の到来方向の認識に与える影響の大きさについて任意の閾値402を設定すると、聴覚特性401と閾値402の交点において、下限周波数と上限周波数が求まる。下限周波数と上限周波数に挟まれた区間を、聴覚特性の有効周波数範囲とし、前記有効周波数範囲における、聴覚特性401の実線部分を聴覚特性パラメータと定義する。
次に、図2に示した第1のフィルタ特性設定部102の動作を説明する。図4(a)の聴覚特性パラメータによって示される情報は、ある周波数の音声信号において、IPDが音の到来方向の認識に与える影響の大きさを示す尺度である。これは、残響環境下においては、ある周波数の音波信号の到来方向の認識が、IPDの異なる反射波の影響によってどの程度妨害されるかの尺度と等価となる。なぜならば、IPDが音の到来方向の認識に与える影響が大きいほど、IPDの異なる反射波の存在が問題となるからである。
音波信号の到来方向の認識を妨害されないためには、反射波を発生させなければ良いが、反射波のみを発生させないようにするのは、一般に非常に困難である。したがって、本発明の第1のフィルタ特性設定部102は、反射波の発生を抑制する目的で、元の音波信号を減衰させるフィルタ特性を設定する。元となる音波信号を減衰させれば、反射波も抑制されることは自明であるが、すべての音波信号を減衰させることは、音波信号自体の強度を低下させることであり、意味を成さない。しかしながら、聴覚特性パラメータにしたがって、反射波によって音波信号の到来方向の認識が妨害される周波数の音波信号のみを、どの程度妨害されるかの尺度に従って減衰させれば、音波信号全体の強度の低下を防ぎながら、反射波による妨害の影響だけを取り除くことができる。例えば、図4において、前記聴覚特性パラメータに対応するフィルタ特性403は、図4(b)で示される。第1のフィルタ特性設定部102によって設定されるフィルタ特性の最大減衰量の最適値は、音声が再生される環境の残響強度に依存するが、通常−10から−30dB程度とする。設定されたフィルタ係数は、前処理フィルタ部103に送られる。前処理フィルタ部103は、第1のフィルタ特性設定部102から入力されたフィルタ係数を用いて、入力音声信号に前処理フィルタリング処理を行い、前処理された入力音声信号を生成する。なお、ここで、フィルタ特性の最大減衰量の最適値を−10から−30dBとしたが、下限は必ずしも−30dBと限らず、より大きい減衰量としてもよい。
なお上記例において、聴覚特性パラメータは、ある周波数の音波信号について、IPDが音の到来方向の認識に与える影響の大きさを示す尺度として定義されているが、それ以外の心理聴覚的特性を含んでも良い。例えば、上記IPDが音の到来方向の認識に大きな影響を与える周波数範囲500〜1200Hz程度のうち、500〜800Hz付近は、音声信号において声の第1フォルマントと呼ばれ、言語の音素認識において重要な帯域とされている。したがって、この帯域を大きく減衰させることは、再生音声信号の明瞭性を向上する目的において逆効果となる場合がある。そこで、500〜800Hzについては、減衰量を小さくするように聴覚特性パラメータを調整することにより、問題を解決することができる。
なお、本発明の実施の形態1の構成は、これに限定されない。例えば、聴覚特性設定部101が保持する聴覚特性パラメータをあらかじめ最適な一つの値に固定しておき、固定された聴覚特性パラメータに基づいて第1のフィルタ特性設定部102によって前処理フィルタ部103に設定されるフィルタ係数をあらかじめ算出する。そして、算出されたフィルタ係数を第1のフィルタ特性設定部102のROM(読み出し専用メモリ)等に記憶させておき、前処理フィルタ部103が第1のフィルタ特性設定部102から読み出したフィルタ係数を用いて入力音声信号をフィルタリングすることによっても実現することができる。このように、第1のフィルタ特性設定部102をROMで構成することにより、フィルタ係数を音声再生の都度算出すること無く、ROMから読み出したフィルタ係数を用いて、前処理フィルタ部103において入力音声信号に対して前処理を行うことができるため、第1のフィルタ特性設定部102の処理を省くことができ、処理量を削減することができる。また、複数の聴覚特性パラメータを聴覚特性設定部101に保持させておき、入力部を備えた第1のフィルタ特性設定部102によりユーザが最適な1つを適宜、選択してもよい。そして、選択された聴覚特性パラメータに基づいてフィルタ係数を算出し、算出されたフィルタ係数を第1のフィルタ特性設定部102に格納しておくとしてもよい。
また、さらに、聴覚特性設定部101に外部から任意の閾値が入力されるようにしてもよい。この場合、第1のフィルタ特性設定部102は、図4(a)に示した聴覚特性が外部から入力された閾値を超える周波数帯域の音声信号を減衰するよう、前処理フィルタ部103のフィルタ係数を設定する。
(実施の形態2)
図5は、本発明の実施の形態2の音声信号処理装置の構成を示す図である。浴室のような狭い閉空間では、共通した特有の残響特性を示すことが知られている。このため、本実施の形態2の音声信号処理装置50では、実施の形態1で説明した構成に加えて、狭い閉空間に特有な残響特性を併せて抑制するための処理部を新たに設けている。音声信号処理装置50は、第2のフィルタ係数設定部500、前処理フィルタ部103、スピーカ104を備える。第2のフィルタ係数設定部500は、聴覚特性設定部101に加えてさらに、残響特性設定部501を備え、残響特性設定部501から出力される残響特性パラメータを第2のフィルタ特性設定部502に入力するようにしている。第2のフィルタ特性設定部502は、聴覚特性設定部101からの聴覚特性パラメータと、残響特性設定部501からの残響特性パラメータとの両方の特性を加味して算出されたフィルタ係数を内部に記憶し、前処理フィルタ部103に設定する。第2のフィルタ係数設定部500を構成している残響特性設定部501、第2のフィルタ特性設定部502以外の動作は、図2に示した実施の形態1の構成と同じであるので、同じ参照番号を付し説明を省略する。
残響特性設定部501は、出力音声信号が再生される空間の残響特性を表す残響特性パラメータを保持している。図6は、残響特性設定部501が保持する残響特性パラメータの一例を示す図である。図6において、X軸は時間、Y軸は周波数、Z軸は残響強度を表す。601〜604は、時間0〜T3における周波数対残響強度特性であり、時間の経過に伴い変化する。また、605は、周波数F1における、時間対残響強度特性である。残響強度が大きい程、強い反射波が発生して残響が強いことを意味し、また、時間対残響強度の曲線が0に収束するまでの時間が長いほど反射波が減衰せず、長時間に渡って残響が残ることを意味する。
第2のフィルタ特性設定部502は、聴覚特性パラメータと、音響特性パラメータの両方を参照して、フィルタ係数を設定する。フィルタ係数の設定方法の一例としては、聴覚特性パラメータに基づいて設定したフィルタ係数を、音響特性パラメータに基づいて補正する方法がある。すなわち、実施の形態1で説明した手順に基づいて一旦フィルタ係数を設定した後、音響特性パラメータで示される、反射波の強い周波数や、反射波の継続時間が長い周波数について、フィルタによる減衰量を大きくする。フィルタによって減衰量を大きくする反射波の強い周波数及び反射波の継続時間が長い周波数は、反射波の音圧及び反射波の継続時間をそれぞれに定めた閾値と比較することによって決定する。具体的には、反射波の音圧が音圧の閾値を超える周波数帯域においてフィルタによる減衰量を大きくする。また、反射波の継続時間が、時間の閾値を超える周波数帯域について、フィルタによる減衰量を大きくする。このようにフィルタ係数を設定することによって、音声信号が再生される空間の残響特性を考慮して、反射波の影響をより効果的に抑制することが可能となり、再生される音声信号の明瞭性を向上することができる。
なお、残響特性設定部501において保持される残響特性パラメータは、あらかじめ代表的な空間の残響特性を測定しておき、プリセットパラメータとして保持しておいても良いし、残響特性設定部501にマイクなどの測定部を接続して、定期的に空間の残響特性を測定して更新するようにしても良い。前記測定部によって測定される空間残響特性としては、例えばインパルス応答や、測定信号と再生信号の差分から得られる残響強度および残響時間の特性を用いる。
なお、本発明の実施の形態2の構成は、聴覚特性パラメータおよび残響特性パラメータをあらかじめ最適な一つもしくは複数の値に固定しておき、固定された聴覚特性パラメータおよび残響特性パラメータに基づいて第2のフィルタ特性設定部502によって設定されるフィルタ係数をあらかじめ算出し、算出されたフィルタ係数を第2のフィルタ特性設定部502のROM(読み出し専用メモリ)等に記憶させておくことによっても実現することができる。このように第2のフィルタ係数設定部500をROMで構成することにより、フィルタ係数を音声信号処理装置の起動の都度算出すること無く、ROMから読み出したフィルタ係数を用いて、前処理フィルタ部103において入力信号に対して前処理を行うことができる。このため、第2のフィルタ特性設定部502の処理を省くことができ、処理量を削減することができる。
(実施の形態3)
図7は、本発明の実施の形態3の音声信号処理装置70の構成を示すブロック図である。音声信号処理装置70は、第3のフィルタ係数設定部700、前処理フィルタ部103及びスピーカ104を備える。第3のフィルタ係数設定部700は、実施の形態2で説明した第2のフィルタ係数設定部500の構成に対して、聴覚特性設定部101および残響特性設定部501に加えて、さらに再生特性設定部701を備え、第2のフィルタ特性設定部502に替えて、第3のフィルタ特性設定部702を備える。第3のフィルタ係数設定部700は、聴覚特性設定部101から出力される聴覚特性パラメータ、残響特性設定部501から出力される残響特性パラメータ、および再生特性設定部701から出力される再生特性パラメータを第3のフィルタ特性設定部702に入力するように構成している。ここで、再生特性設定部701、第3のフィルタ特性設定部702以外の動作は、図5に示される実施の形態2の第2のフィルタ係数設定部500の構成と同じであるので、同じ構成要素には同じ参照番号を付し説明を省略する。再生特性設定部701は、出力音声信号を出力するスピーカ104の再生周波数特性を示す再生特性パラメータを保持している。
ここで、再生特性パラメータについて説明する。スピーカの再生周波数特性としては、理想的には、低い周波数(例えば20Hz)から高い周波数(例えば20kHz)までフラットであることが望ましい。しかしながら、実際には、スピーカの構造に起因して、再生周波数特性には山谷があり、特に携帯電話などのポータブル機器で用いられる小型スピーカでは、400〜500Hz程度以下の音声信号がほとんど再生されない場合もある。
図8は小型スピーカの再生周波数特性の一例を示す図である。なお、図8の横軸は対数軸である。図8で示されるように、小型スピーカでは、低域側400Hz以下の周波数帯域はほとんど再生されず、周波数が400Hzを超えてから1kHzにかけて出力レベルが上昇し、周波数が1kHzを超えてからはほぼ平坦な特性となる。このような再生特性においては、人間の音声信号の基本波は再生されないので、500Hz〜800Hz程度の、音声信号の第1フォルマントと呼ばれる帯域が音声の明瞭な聴き取りに関して重要な要素となる。さらに、この周波数帯域の再生レベルは、1kHzを超えてからの周波数帯域の再生レベルと比較して相対的に低いため、前処理フィルタ処理によってこの帯域の信号を減衰させることは好ましくない。したがって、再生特性設定部701において、スピーカの再生周波数特性を示す再生特性パラメータを保持し、第3のフィルタ特性設定部702は、聴覚特性パラメータおよび残響特性パラメータにしたがって計算したフィルタ係数を、再生特性パラメータの特性に基づいて音声信号の第1フォルマントが減衰されすぎないよう補正する。
図9(a)及び(b)は、再生特性パラメータに基づいて補正される前、すなわち聴覚特性パラメータおよび残響特性パラメータのみに基づいて設定されたフィルタ係数による、前処理フィルタ処理の周波数特性(a)と、スピーカから再生される出力音声信号の出力音圧特性(b)との関係を示す図である。また、図10(a)および(b)は、再生特性パラメータに基づいて補正されたフィルタ係数による、前処理フィルタ処理の周波数特性(a)と、スピーカから再生される出力音声信号の出力音圧特性(b)との関係を示す図である。
図9(a)に示す補正前の前処理フィルタの周波数特性を用いて処理を行うと、図9(b)に示すように、前処理フィルタ処理による減衰とスピーカの再生周波数特性の相乗効果により、1kHz程度以下の音声信号はほとんど出力されない。これに対し、図10(a)に示す補正後の前処理フィルタの周波数特性では、前処理フィルタ処理による減衰が抑えられ、図10(b)に示すように、出力音声信号の500〜800Hz付近の減衰量が小さくなる。これにより、音声信号の第1フォルマントの含まれる帯域が大きく減衰することなく再生され、音声の明瞭性の低下を防ぐことができる。
なお、本発明の実施の形態3の構成は、聴覚特性パラメータ、残響特性パラメータおよび再生特性パラメータをあらかじめ最適な一つもしくは複数の値に固定しておき、固定された聴覚特性パラメータ、残響特性パラメータおよび再生特性パラメータに基づいて第3のフィルタ特性設定部702によって設定されるフィルタ係数をあらかじめ算出し、算出されたフィルタ係数を第3のフィルタ特性設定部702のROM(読み出し専用メモリ)等に記憶させておくことによっても実現することができる。このように第3のフィルタ係数設定部700をROMで構成することにより、フィルタ係数を音声信号処理装置70の起動の都度算出すること無く、ROMから読み出したフィルタ係数を用いて、前処理フィルタ部103において入力音声信号に対して前処理を行うことができるため、第3のフィルタ特性設定部702の処理を省くことができ、処理量を削減することができる。
図11は、実施の形態3の音声信号処理装置70の動作を示すフローチャートである。実施の形態3で第3のフィルタ係数設定部700をROMで構成するとした場合には、図11において破線で囲んだステップS1101〜ステップS1105の処理は、音声信号処理装置70を起動する前にユーザ又は計算機があらかじめ行う処理である。IPDが音の到来方向の認識に大きな影響を与える聴覚特性パラメータを1種類または複数種類算出し、算出した聴覚特性パラメータを聴覚特性設定部101に格納する(S1101)。次いで、音声信号処理装置を設置する可能性の高い空間の残響特性を表す残響特性パラメータを1又は複数種類算出し、算出した残響特性パラメータを残響特性設定部501に格納する(S1102)。さらに、再生特性設定部701は、スピーカ104の再生特性を調べ、再生特性を表す再生特性パラメータを再生特性設定部701に格納する(S1103)。第3のフィルタ特性設定部702は、聴覚特性パラメータ、残響特性パラメータ及び再生特性パラメータを用いて、入力音声信号に含まれる第1フォルマントが減衰されすぎないフィルタ係数を決定する(S1104)。第3のフィルタ特性設定部702は、決定したフィルタ係数を内部のROMに格納する(S1105)。
音声信号処理装置70が起動され、入力音声信号が入力されると、前処理フィルタ部103は、第3のフィルタ係数設定部700又は第3のフィルタ特性設定部702内のROMからフィルタ係数を読み出して、入力音声信号をフィルタリングする(S1106)。スピーカ104は、前処理フィルタ部103によってフィルタリングされた音声信号を出力音声信号として再生出力する(S1107)。
以上のように、本実施の形態3の音声信号処理装置によれば、聴覚特性、残響特性及び再生特性に基づいて入力音声信号に前処理を施すので、(1)狭い空間内での反響音が音声の聴き取りに対して与える悪影響に敏感な周波数帯域の音声信号を減衰させるとともに、(2)狭い閉空間に共通の残響を抑制した上で、(3)音声を明瞭に聴き取るために重要な第1フォルマントが減衰されすぎないよう補正することができる。この結果、お風呂場などの狭い閉空間においても、明瞭に音声を聴き取ることができる出力音声信号を得ることができるという効果がある。
なお、実施の形態3において、残響特性設定部501の機能を無効化し、聴覚特性設定部101から出力される聴覚特性パラメータと、再生特性設定部701から出力される再生特性パラメータのみを用いて、第3のフィルタ特性設定部702においてフィルタ係数を設定する構成をとることができるのは自明である。
なお、本発明を上記実施の形態に基づいて説明してきたが、本発明は、上記の実施の形態に限定されないのはもちろんである。以下のような場合も本発明に含まれる。
(1)上記の各装置は、具体的には、マイクロプロセッサ、ROM、RAM、ハードディスクユニット、ディスプレイユニット、キーボード、マウスなどから構成されるコンピュータシステムである。前記RAMまたはハードディスクユニットには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、各装置は、その機能を達成する。ここでコンピュータプログラムは、所定の機能を達成するために、コンピュータに対する指令を示す命令コードが複数個組み合わされて構成されたものである。
(2)上記の各装置を構成する構成要素の一部または全部は、1個のシステムLSI(Large Scale Integration:大規模集積回路)から構成されているとしてもよい。システムLSIは、複数の構成部を1個のチップ上に集積して製造された超多機能LSIであり、具体的には、マイクロプロセッサ、ROM、RAMなどを含んで構成されるコンピュータシステムである。前記RAMには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、システムLSIは、その機能を達成する。
(3)上記の各装置を構成する構成要素の一部または全部は、各装置に脱着可能なICカードまたは単体のモジュールから構成されているとしてもよい。前記ICカードまたは前記モジュールは、マイクロプロセッサ、ROM、RAMなどから構成されるコンピュータシステムである。前記ICカードまたは前記モジュールは、上記の超多機能LSIを含むとしてもよい。マイクロプロセッサが、コンピュータプログラムにしたがって動作することにより、前記ICカードまたは前記モジュールは、その機能を達成する。このICカードまたはこのモジュールは、耐タンパ性を有するとしてもよい。
(4)本発明は、上記に示す方法であるとしてもよい。また、これらの方法をコンピュータにより実現するコンピュータプログラムであるとしてもよいし、前記コンピュータプログラムからなるディジタル信号であるとしてもよい。
また、本発明は、前記コンピュータプログラムまたは前記ディジタル信号をコンピュータ読み取り可能な記録媒体、例えば、フレキシブルディスク、ハードディスク、CD−ROM、MO、DVD、DVD−ROM、DVD−RAM、BD(Blu−ray Disc)、半導体メモリなどに記録したものとしてもよい。また、これらの記録媒体に記録されている前記ディジタル信号であるとしてもよい。
また、本発明は、前記コンピュータプログラムまたは前記ディジタル信号を、電気通信回線、無線または有線通信回線、インターネットを代表とするネットワーク、データ放送等を経由して伝送するものとしてもよい。
また、本発明は、マイクロプロセッサとメモリを備えたコンピュータシステムであって、前記メモリは、上記コンピュータプログラムを記憶しており、前記マイクロプロセッサは、前記コンピュータプログラムにしたがって動作するとしてもよい。
また、前記プログラムまたは前記ディジタル信号を前記記録媒体に記録して移送することにより、または前記プログラムまたは前記ディジタル信号を前記ネットワーク等を経由して移送することにより、独立した他のコンピュータシステムにより実施するとしてもよい。
また、本発明の音声信号処理装置は、人間の聴覚特性、空間の残響特性、およびスピーカの再生特性に基づく信号処理によって出力音声信号の明瞭性を確保するとしたが、信号処理や電気的処理に限らず、筐体の構造及びスピーカの再生特性などを調整することによっても実現することができる。
(5)上記実施の形態及び上記変形例をそれぞれ組み合わせるとしてもよい。
本発明の構成による音声信号処理装置は、スピーカから音声信号を再生する機能を持つテレビ・ラジオ受信機や、CD・半導体プレーヤ等のオーディオ再生装置などに適用可能であり、これらの機器を残響の多い環境、例えば浴室等で使用する場合に効果を発揮する。
10、50、70 音声信号処理装置
100 第1のフィルタ係数設定部
101 聴覚特性設定部
102 第1のフィルタ特性設定部
103 前処理フィルタ部
104、201 スピーカ
202 聴取者
203 壁面
401 聴覚特性
402 閾値
403 フィルタ特性
500 第2のフィルタ係数設定部
501 残響特性設定部
502 第2のフィルタ特性設定部
601〜604 周波数対残響強度特性
605 時間対残響強度特性
700 第3のフィルタ係数設定部
701 再生特性設定部
702 第3のフィルタ特性設定部

Claims (5)

  1. 再生された音声信号を聴取者が聴取する際、前記聴取者における両耳間位相差が、音の到来方向の認識に与える影響の大きさが大きくなる周波数ほど、前記音声信号の信号強度を小さくするゲイン定数を周波数毎に設定したフィルタ係数を決定するフィルタ係数設定部と、
    前記フィルタ係数を用いて、前記音声信号にフィルタリング処理を行うフィルタ部とを備える
    音声信号処理装置。
  2. 前記フィルタ係数設定部は、(1)前記音の到来方向が前記聴取者の両耳を結ぶ直線方向に対して成す角度である偏角と、(2)前記偏角に基づいて算出される両耳間時間差と、(3)前記両耳間時間差および前記音声信号の周波数の関係から求められる両耳間位相差と、を用いた関係式により算出される周波数を、フィルタ係数により処理する周波数領域の下限周波数として設定する
    請求項1に記載の音声信号処理装置。
  3. 前記フィルタ係数設定部は、前記両耳間位相差が音の到来方向の認識に与える影響の大きさの値があらかじめ定められた閾値よりも大きくなる周波数範囲の最適値を500Hz〜1200Hzと定め、前記周波数範囲で、入力音声信号を減衰するようなフィルタ特性を与えるフィルタ係数を決定する
    請求項2記載の音声信号処理装置。
  4. 前記フィルタ係数設定部は、声の第1フォルマントの周波数範囲の前記減衰量を小さくするように調整したフィルタ特性を与えるフィルタ係数を決定する
    請求項2記載の音声信号処理装置。
  5. 再生された音声信号を聴取者が聴取する際、前記聴取者における両耳間位相差が、音の到来方向の認識に与える影響の大きさが大きくなる周波数ほど、前記音声信号の信号強度を小さくするゲイン定数を周波数毎に設定したフィルタ特性を与えるフィルタ係数を決定するフィルタ係数設定ステップと、
    前記フィルタ係数設定ステップによって決定された前記フィルタ係数を用いて、前記音声信号にフィルタリング処理を行うフィルタステップとを含む
    音声信号処理方法。
JP2009550448A 2008-01-21 2009-01-14 音声信号処理装置および方法 Expired - Fee Related JP5627241B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009550448A JP5627241B2 (ja) 2008-01-21 2009-01-14 音声信号処理装置および方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2008010133 2008-01-21
JP2008010133 2008-01-21
PCT/JP2009/000097 WO2009093416A1 (ja) 2008-01-21 2009-01-14 音声信号処理装置および方法
JP2009550448A JP5627241B2 (ja) 2008-01-21 2009-01-14 音声信号処理装置および方法

Publications (2)

Publication Number Publication Date
JPWO2009093416A1 JPWO2009093416A1 (ja) 2011-05-26
JP5627241B2 true JP5627241B2 (ja) 2014-11-19

Family

ID=40900928

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009550448A Expired - Fee Related JP5627241B2 (ja) 2008-01-21 2009-01-14 音声信号処理装置および方法

Country Status (3)

Country Link
US (1) US8675882B2 (ja)
JP (1) JP5627241B2 (ja)
WO (1) WO2009093416A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102461207B (zh) * 2009-05-29 2015-04-22 夏普株式会社 声音重放装置、声音重放方法和记录介质
DE102011075577B4 (de) * 2011-05-10 2013-01-31 MULTIPOND Wägetechnik GmbH Signalverarbeitungsverfahren, Vorrichtung zur Signalverarbeitung und Waage mit Vorrichtung zur Signalverarbeitung
JP6019969B2 (ja) * 2011-11-22 2016-11-02 ヤマハ株式会社 音響処理装置
JP5923994B2 (ja) * 2012-01-23 2016-05-25 富士通株式会社 音声処理装置及び音声処理方法
JP6032832B2 (ja) * 2012-03-09 2016-11-30 学校法人千葉工業大学 音声合成装置
KR102516997B1 (ko) * 2017-05-17 2023-04-04 소니그룹주식회사 음성 출력 제어 장치, 음성 출력 제어 방법, 그리고 프로그램

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002354597A (ja) * 2001-03-22 2002-12-06 New Japan Radio Co Ltd 疑似ステレオ回路および疑似ステレオ装置
JP2003224898A (ja) * 2002-01-29 2003-08-08 Matsushita Electric Ind Co Ltd 拡声明瞭度改善装置および拡声明瞭度改善方法
JP2007101782A (ja) * 2005-10-03 2007-04-19 Matsushita Electric Ind Co Ltd 音響調整装置、音響調整プログラム、および音響調整方法
JP2007282011A (ja) * 2006-04-10 2007-10-25 Matsushita Electric Ind Co Ltd スピーカ装置

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4063035A (en) * 1976-11-12 1977-12-13 Indiana University Foundation Device for visually displaying the auditory content of the human voice
US4888808A (en) * 1987-03-23 1989-12-19 Matsushita Electric Industrial Co., Ltd. Digital equalizer apparatus enabling separate phase and amplitude characteristic modification
JPH039227A (ja) 1990-01-26 1991-01-17 Yoichi Ando 音響装置
US5468213A (en) 1994-09-22 1995-11-21 American Medical Systems, Inc. Mechanical penile prosthesis
US5636272A (en) * 1995-05-30 1997-06-03 Ericsson Inc. Apparatus amd method for increasing the intelligibility of a loudspeaker output and for echo cancellation in telephones
JPH09247788A (ja) 1996-03-13 1997-09-19 Sony Corp 音声処理装置および会議用音声システム
US7085393B1 (en) * 1998-11-13 2006-08-01 Agere Systems Inc. Method and apparatus for regularizing measured HRTF for smooth 3D digital audio
JP3377178B2 (ja) 1998-11-20 2003-02-17 松下電器産業株式会社 音響拡声装置とその明瞭度改善方法
JP4463905B2 (ja) 1999-09-28 2010-05-19 隆行 荒井 音声処理方法、装置及び拡声システム
US6996521B2 (en) * 2000-10-04 2006-02-07 The University Of Miami Auxiliary channel masking in an audio signal
FI118370B (fi) * 2002-11-22 2007-10-15 Nokia Corp Stereolaajennusverkon ulostulon ekvalisointi
US8139797B2 (en) * 2002-12-03 2012-03-20 Bose Corporation Directional electroacoustical transducing
US7330556B2 (en) * 2003-04-03 2008-02-12 Gn Resound A/S Binaural signal enhancement system
JP2005202335A (ja) 2004-01-19 2005-07-28 Takayuki Arai 音声処理方法と装置及びプログラム
JP2005252467A (ja) * 2004-03-02 2005-09-15 Sony Corp 音響再生方法、音響再生装置および記録メディア
EP1818909B1 (en) * 2004-12-03 2011-11-02 Honda Motor Co., Ltd. Voice recognition system
DE102007008738A1 (de) * 2007-02-22 2008-08-28 Siemens Audiologische Technik Gmbh Verfahren zur Verbesserung der räumlichen Wahrnehmung und entsprechende Hörvorrichtung

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002354597A (ja) * 2001-03-22 2002-12-06 New Japan Radio Co Ltd 疑似ステレオ回路および疑似ステレオ装置
JP2003224898A (ja) * 2002-01-29 2003-08-08 Matsushita Electric Ind Co Ltd 拡声明瞭度改善装置および拡声明瞭度改善方法
JP2007101782A (ja) * 2005-10-03 2007-04-19 Matsushita Electric Ind Co Ltd 音響調整装置、音響調整プログラム、および音響調整方法
JP2007282011A (ja) * 2006-04-10 2007-10-25 Matsushita Electric Ind Co Ltd スピーカ装置

Also Published As

Publication number Publication date
US20100296662A1 (en) 2010-11-25
JPWO2009093416A1 (ja) 2011-05-26
US8675882B2 (en) 2014-03-18
WO2009093416A1 (ja) 2009-07-30

Similar Documents

Publication Publication Date Title
KR101234973B1 (ko) 필터 특징을 발생시키는 장치 및 방법
US8611552B1 (en) Direction-aware active noise cancellation system
US9053697B2 (en) Systems, methods, devices, apparatus, and computer program products for audio equalization
KR101547035B1 (ko) 다중 마이크에 의한 3차원 사운드 포착 및 재생
TWI535299B (zh) 低音強化系統及其方法
US8693704B2 (en) Method and apparatus for canceling noise from mixed sound
US8855341B2 (en) Systems, methods, apparatus, and computer-readable media for head tracking based on recorded sound signals
JP5665134B2 (ja) ヒアリングアシスタンス装置
JP5627241B2 (ja) 音声信号処理装置および方法
US9264812B2 (en) Apparatus and method for localizing a sound image, and a non-transitory computer readable medium
US20160066088A1 (en) Utilizing level differences for speech enhancement
RU2595912C2 (ru) Аудиосистема и способ для нее
JP2002078100A (ja) ステレオ音響信号処理方法及び装置並びにステレオ音響信号処理プログラムを記録した記録媒体
KR20180042360A (ko) 누설 소거용 다중 스피커 방법 및 장치
EP3757993B1 (en) Pre-processing for automatic speech recognition
JP4886881B2 (ja) 音響補正装置、音響出力装置、及び音響補正方法
JP2010157852A (ja) 音響補正装置、音響測定装置、音響再生装置、音響補正方法及び音響測定方法
US10560782B2 (en) Signal processor
WO2016042410A1 (en) Techniques for acoustic reverberance control and related systems and methods
CN112437957B (zh) 用于全面收听的强加间隙插入
KR20200139629A (ko) 복수의 스피커를 구비하는 플렉시블 전자 장치에서 오디오를 출력하는 방법 및 장치
CN107197403A (zh) 一种终端音频参数管理方法、装置及系统
JP2011259299A (ja) 頭部伝達関数生成装置、頭部伝達関数生成方法及び音声信号処理装置
JP6828804B2 (ja) 収音装置および収音方法
US20240323635A1 (en) Apparatus, method, and computer program for adjusting noise control processing

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111024

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130430

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20131119

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140930

LAPS Cancellation because of no payment of annual fees