JP5590021B2 - 音声明瞭化装置 - Google Patents
音声明瞭化装置 Download PDFInfo
- Publication number
- JP5590021B2 JP5590021B2 JP2011287793A JP2011287793A JP5590021B2 JP 5590021 B2 JP5590021 B2 JP 5590021B2 JP 2011287793 A JP2011287793 A JP 2011287793A JP 2011287793 A JP2011287793 A JP 2011287793A JP 5590021 B2 JP5590021 B2 JP 5590021B2
- Authority
- JP
- Japan
- Prior art keywords
- gain
- signal
- output
- level
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
そこで、音声の成分が多く含まれるチャンネルのオーディオ信号のダイナミックレンジを圧縮するとともに、圧縮後に、他のチャンネルのオーディオ信号の音量に埋没してしまう不具合を是正するような技術が提案されている(例えば特許文献1参照)。
本発明は、上述した事情に鑑みてなされたもので、その目的の一つは、音声を聴き取りやすくする一方で、音声以外を自然に再生することが可能な音声明瞭化装置を提供することにある。
また、この構成において、前記変換部が、音量を設定する設定情報に応じて前記入出力特性を変更する態様としても良い。この態様によれば、設定情報に応じて音声成分の強調を加減することができる。
また、上記構成において、前記第1ゲイン係数および前記第2ゲイン係数の組を、予め複数記憶する記憶部と、前記複数の組のうち、いずれかの組を選択して、当該選択した組の第1ゲイン係数を前記第1乗算器に供給し、当該選択した組の第2ゲイン係数を前記第2乗算器に供給する設定部と、を含む態様が好ましい。この態様によれば、オーディオ信号の特性、種別等に応じて適切に音声を明瞭化することができる。
図1は、実施形態に係る音声明瞭化装置1の構成を示すブロック図であり、1チャンネル分のオーディオ信号を処理するのに要する構成を示している。したがって、多チャンネルの場合には、チャンネル数に応じて図1の構成が適用される。なお、本実施形態においては、特に記載がない場合に信号はデジタルとする。
このうち、BPF211は、約200〜500Hzの通過帯域を有し、オーディオ信号Inから音声の第1フォルマント成分を抽出する。BPF221は、約2k〜3kHzの通過帯域を有し、オーディオ信号Inから音声の第2フォルマント成分を抽出する。BPF231は、約4k〜12kHzの通過帯域を有し、オーディオ信号Inから第2フォルマントの2〜4倍の倍音成分を抽出する。
第2加算部である加算器240は、乗算器212、222、232からそれぞれ出力される信号を互いに加算して、信号Faとして出力する。
ここで、BPF211、221、231の各通過帯域を上述のものとしたため、各通過帯域は互いに隔絶しており、3つのBPFによる周波数特性の概形は、各通過帯域の中心周波数でそれぞれピーク(山)になり、これらのピークの間でボトム(谷)とみなすことができる。
なお、BPF302の通過帯域は、おおよそ会話時における声帯の振動周波数に相当している。声帯の振動が声道で共鳴することによって音声が生じるので、声帯の振動周波数成分は、音声の源であって、音声成分の大きさを示す指標の1つとして用いることができる。
なお、レベル検出部304は、処理に余裕があれば、5ミリ秒毎ではなく1サンプル毎に絶対値を出力しても良い。また、レベル検出部304は、BPF302から出力される信号レベルのうち、最大値に限られず、実効値(2乗平均値)を求めて出力しても良いし、エンベロープ(包絡線)を求めて出力しても良い。いずれにしても、レベル検出部304は、音声成分を示す信号に基づくレベルを出力する構成であれば良い。
図2は、変換部306における入出力特性を実線で示す図である。図において、横軸は、変換部306への入力レベル、すなわちレベル検出部304から出力される信号(最大値)レベルであり、縦軸は、変換部306の出力レベルを示している。ここで、変換部306から出力されるのは、変換特性における出力レベル/入力レベルの比で示されるゲインである。なお、図において破線は、入力レベルがそのまま出力レベルとなる場合を示している。
このため、入力レベルが閾値th以下となる領域では、出力レベルを増加させるようなゲインが出力され、入力値が閾値thを超える領域では、出力レベルを減少させるようなゲインが出力される。
後述するように信号Faはゲイン調整されて、オーディオ信号Inに加算される構成となっている。入力レベルが閾値thを超える場合、オーディオ信号Inに含まれる音声信号の大きさが十分大きいので、上記構成にあっては音声の強調を抑えるために、出力レベルを減少させるゲインを出力しているのである。
第1加算部である加算器12は、オーディオ信号Inと乗算器13による信号Fbとを加算して、音声明瞭化装置1による信号Outとして出力する。
本実施形態に係る音声明瞭化装置1において、音声帯域抽出部20によって抽出される信号Faは、オーディオ信号Inに含まれる音声成分、詳細には第1フォルマント成分、第2フォルマント成分および当該第2フォルマントの倍音成分である。この信号Faは、ゲイン決定部30の出力であるゲインKaでレベル調整され信号Fbとして出力されるとともに、オーディオ信号Inと加算器12によって加算されて出力される。
一方、音声成分のレベルが十分大きい場合、ゲインKaは上げられない。このため、当該オーディオ信号Inに加算される信号Fbが少なくなる(又は0)となるので、音声の強調が抑えられる。
あるいは、BPF211とBPF221との間の帯域を通過させるBPFと、当該BPFの出力を大きく減衰させる乗算器とを設け、当該乗算器の出力を加算器240での加算対象に加えることによって、第1フォルマントと第2フォルマントとの間の谷に相当する部分を強調しても良い。
本発明は、上述した実施形態に限定されるものではなく、例えば次に述べるような各種の変形が可能である。なお、図3は、応用例・変形例に係る音声明瞭化装置の構成を示すブロック図である。また、次に述べる応用・変形の態様は、任意に選択された一または複数を適宜に組み合わせることもできる。
例えば、変換部306における変換特性をボリュームに応じて変更する構成としても良い。詳細には、図3に示されるように、音量を設定するボリューム312の設定情報Volを変換部306に供給して、変換部306が、設定情報Volに応じて変換特性を変更する構成としても良い。変換特性としては、例えば図4に示されるように、入力レベルが閾値th以下となる領域においては、出力レベルを持ち上げる特性を確保しつつ、設定情報Volが音量を小さくするように設定されるような場合には変換特性のカーブの傾きを小さくして、入力レベルに対する出力レベルが大きくなるようなゲインとなるように相対的に増加させる一方、設定情報Volが音量を大きくするように設定される場合には変換特性のカーブの傾きを大きくして、ゲインを相対的に低下させる。
ボリュームが低く設定されていると、オーディオ信号Inの音量は小さくなる。このとき、オーディオ信号Inに含まれる音声成分が小さい場合、通常の音量での再生に比べて、より明瞭度が低くなってしまう。このような場合に、設定情報Volに応じて変換部306の変換特性を変更させる構成であれば、設定情報Volに応じて音声の強調の度合いであるゲインKaが、実施形態と比較して高められるので、音声をより明瞭化することができる。
なお、設定情報Volは、ボリューム312に限られず、リモコン等によって設定される場合もある。また、ボリュームに応じた変換特性は、図4に限られない。例えばボリュームが高くなるにつれて、図2に示される入出力特性の閾値thを小さくなるように設定し、ボリュームが小さくなるにつれて閾値thを大きくするようにしても良い。ボリュームが十分大きい場合は音声の明瞭度は問題とならないため、この場合にはなるべくオーディオ信号Inをそのまま出力し、反対にボリュームが小さい場合は音声が不明瞭となることが多いためなるべく音声成分を強調するようにすることができる。
実施形態にあっては、乗算器212、222、232のゲイン係数が固定であったが、図3に示されるように、設定部14および記憶部15を追加して、ゲイン係数を各種のモードに応じて切り替える構成としても良い。
この構成において、記憶部15には、例えば図5に示されるように、複数のモード毎に、ゲイン係数K1、K2、K3の組が予め記憶される。設定部14は、上位装置からモードを規定する情報Selの供給を受けると、当該情報Selのモードに対応した係数の組を選択して記憶部15から読み出し、乗算器212にゲイン係数K1を、乗算器222にゲイン係数K2を、乗算器232にゲイン係数K3を、それぞれ供給する。
例えば、情報SelによってモードBが選択された場合、設定部14は、記憶部はモードBに対応するゲイン係数k1b、k2b、k3bを読み出して、各々をゲイン係数K1として乗算器212に、ゲイン係数K2として乗算器222に、ゲイン係数K3として乗算器232に、それぞれ供給する。
ここで、あるモードとして、K1<K2、K1<K3となる係数を記憶部15に記憶させておけば、当該モードが選択されたときに、音声成分のうち、高域成分を低域成分よりも強調させることができる。また、別のモードとして、K1>K3、K2>K3となる係数を記憶部15に記憶させておけば、当該モードが選択されたときに、音声成分のうち、低域成分を高域成分よりも強調させることができるなど、リスナーの好みに応じた音色とするゲイン係数のセットを選択可能にすることができる。
実施形態にあっては、乗算器212、222、232のゲイン係数が固定であったが、入力レベルに応じて各ゲイン係数の値が変化する態様としても良い。具体的には、図6に示されるように、変換部41、42、43を、乗算器212、222、232の各々に対応して設けて、それぞれがゲイン係数を供給する構成としても良い。
ここで、変換部41、42、43は、変換部306と同様に、レベル検出部304から出力される信号のレベルをゲイン係数に変換するものである。変換部41、42、43における入出力特性については、リスナーの嗜好などに合わせて適宜設定すれば良い。このような構成により、入力されるオーディオ信号Inに含まれる音声の大きさに応じて、各BPFの出力信号のゲインがそれぞれ変化して設定されるので、リスナーの好みに合わせた音色とすることができる。
なお、ここでは各BPFの出力に設けられた乗算器212、222、232と、加算後の信号Faに対して処理される乗算器13の両方でレベル調整したが、乗算器13の処理を省略することもできる。
図7に示されるように、オーディオ信号Inの低域側をカットして、加算器12の一方の入力端に供給するHPF(High Pass Filter)11を設けても良い。なお、HPF11のカットオフ周波数は例えば40Hzである。
また、このHPF11については、同図に示されるように、オンまたはオフさせる機能を持たせて、オン時には、オーディオ信号Inの低域側をカットし、オフ時には、オーディオ信号Inをバイパスさせて加算器12の一方の入力端に供給する構成としても良い。
このため、加算器12における入力端の一方には、オーディオ信号Inが供給されても良いし、当該オーディオ信号InをHPF11でフィルタリングした信号が供給されても良い。すなわち、オーディオ信号に基づく信号とは、オーディオ信号のフィルタリング信号のみならず、オーディオ信号それ自体を含む概念である。
図7に示されるように、平滑部308によって出力されるゲインKaを微調整するために、一定値を乗じるなどの演算を実行する演算器310を設けても良い。なお、演算器310は、乗算に限られず、加減算や除算、もしくは、これらを適宜組み合わせても良い。
実施形態においてゲイン決定部30では、音声成分の大きさを示す信号としてBPF302の出力信号を用いたが、BPF211の出力である第1フォルマント成分でも代用可能である。詳細には、図8に示されるように、BPF211の出力を乗算器212とともにレベル検出部304に供給する構成とすれば良い。この構成によれば、BPFを1つ省略することができるので、その分、構成の簡易化を図ることができる。
図1や図3、図6、図7、図8に示した音声明瞭化装置については、DSP(Digital Signal Processor)機能を持ったマイコン(DSPデバイス)に対して、所定の処理を記述したプログラムを書き込むことによって実現される。詳細には、DSPデバイスに対し、高域通過処理(HPF11)や、帯域通過処理(BPF211、221、231、302)、低域通過処理(平滑部308)、乗算処理(乗算器13、212、222、232、310)、加算処理(加算器12、240)などの処理を記述したプログラムを当該DSPデバイスに書き込むことによって音声明瞭化装置1の機能を実現できる。
したがって、本発明は、信号処理方法としても、また、コンピュータを上記音声明瞭化装置として機能させるプログラムとしても表現され得る。
Claims (5)
- 入力されたオーディオ信号から、第1フォルマント成分及び第2フォルマント成分を抽出する音声帯域抽出部と、
前記オーディオ信号のうち、音声成分を示す信号のレベルに応じてゲインを決定するゲイン決定部と、
前記音声帯域抽出部から出力された前記第1フォルマント成分及び前記第2フォルマント成分のレベルを前記ゲインで調整するレベル調整部と、
前記オーディオ信号に基づく信号と、前記レベル調整部でゲインが調整された信号とを加算して出力する第1加算部と、
を具備することを特徴とする音声明瞭化装置。 - 前記ゲイン決定部は、
前記音声成分を示す信号に基づく入力レベルを、所定の入出力特性のゲインに変換する変換部を含み、
前記変換部は、
前記音声成分を示す信号のレベルの絶対値が閾値以下である場合には、前記ゲインを「1」より大きくして出力し、
前記絶対値が前記閾値を超える場合には、前記ゲインを「1」より小さくして出力する
ことを特徴とする請求項1に記載の音声明瞭化装置。 - 前記変換部は、音量を設定する設定情報に応じて前記入出力特性を変更する
ことを特徴とする請求項2に記載の音声明瞭化装置。 - 前記音声帯域抽出部は、
前記オーディオ信号のうち、前記第1フォルマント成分を抽出する第1バンドパスフィルタと、
前記第1バンドパスフィルタにより抽出される信号のレベルに第1ゲイン係数を乗算する第1乗算器と、
前記オーディオ信号のうち、前記第2フォルマント成分を抽出する第2バンドパスフィルタと、
前記第2バンドパスフィルタにより抽出される信号のレベルに第2ゲイン係数を乗算する第2乗算器と、
前記第1乗算器により出力される信号と前記第2乗算器により出力される信号とを加算して出力する第2加算部と、
を含むことを特徴とする請求項1乃至3のいずれかに記載の音声明瞭化装置。 - 前記第1ゲイン係数および前記第2ゲイン係数の組を、予め複数記憶する記憶部と、
前記複数の組のうち、いずれかの組を選択して、当該選択した組の第1ゲイン係数を前記第1乗算器に供給し、当該選択した組の第2ゲイン係数を前記第2乗算器に供給する設定部と、
を有することを特徴とする請求項4に記載の音声明瞭化装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011287793A JP5590021B2 (ja) | 2011-12-28 | 2011-12-28 | 音声明瞭化装置 |
US13/723,899 US9318126B2 (en) | 2011-12-28 | 2012-12-21 | Voice clarification apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011287793A JP5590021B2 (ja) | 2011-12-28 | 2011-12-28 | 音声明瞭化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013137385A JP2013137385A (ja) | 2013-07-11 |
JP5590021B2 true JP5590021B2 (ja) | 2014-09-17 |
Family
ID=48695610
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011287793A Active JP5590021B2 (ja) | 2011-12-28 | 2011-12-28 | 音声明瞭化装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9318126B2 (ja) |
JP (1) | JP5590021B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6336830B2 (ja) * | 2014-06-23 | 2018-06-06 | ローム株式会社 | レベル調節回路、デジタルサウンドプロセッサ、オーディオアンプ集積回路、電子機器、オーディオ信号の自動レベル調節方法 |
CN110024418B (zh) * | 2016-12-08 | 2020-12-29 | 三菱电机株式会社 | 声音增强装置、声音增强方法和计算机可读取的记录介质 |
EP3823315B1 (en) * | 2019-11-18 | 2024-01-10 | Panasonic Intellectual Property Corporation of America | Sound pickup device, sound pickup method, and sound pickup program |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2056110C (en) * | 1991-03-27 | 1997-02-04 | Arnold I. Klayman | Public address intelligibility system |
JPH06289898A (ja) * | 1993-03-30 | 1994-10-18 | Sony Corp | 音声信号処理装置 |
JPH0742236U (ja) * | 1993-12-22 | 1995-07-21 | 沖電気工業株式会社 | 携帯電話機における受話音声回路 |
JPH0968997A (ja) * | 1995-08-30 | 1997-03-11 | Sony Corp | 音声処理方法及び装置 |
JP3925572B2 (ja) * | 1997-06-23 | 2007-06-06 | ソニー株式会社 | 音声信号の処理回路 |
JPH11308484A (ja) * | 1998-04-17 | 1999-11-05 | Mitsubishi Electric Corp | 信号処理装置 |
JP4311034B2 (ja) * | 2003-02-14 | 2009-08-12 | 沖電気工業株式会社 | 帯域復元装置及び電話機 |
JP4380174B2 (ja) * | 2003-02-27 | 2009-12-09 | 沖電気工業株式会社 | 帯域補正装置 |
JP2005045738A (ja) * | 2003-07-25 | 2005-02-17 | Sony Corp | 通話装置及び通話方法、並びに通話システム |
KR20050049103A (ko) * | 2003-11-21 | 2005-05-25 | 삼성전자주식회사 | 포만트 대역을 이용한 다이얼로그 인핸싱 방법 및 장치 |
JP4013906B2 (ja) * | 2004-02-16 | 2007-11-28 | ヤマハ株式会社 | 音量制御装置 |
JP4380669B2 (ja) * | 2006-08-07 | 2009-12-09 | カシオ計算機株式会社 | 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム |
JP4595934B2 (ja) | 2006-12-13 | 2010-12-08 | ヤマハ株式会社 | 音声評価装置及び音声評価方法 |
JP5151762B2 (ja) * | 2008-07-22 | 2013-02-27 | 日本電気株式会社 | 音声強調装置、携帯端末、音声強調方法および音声強調プログラム |
JP4826625B2 (ja) * | 2008-12-04 | 2011-11-30 | ソニー株式会社 | 音量補正装置、音量補正方法、音量補正プログラムおよび電子機器 |
-
2011
- 2011-12-28 JP JP2011287793A patent/JP5590021B2/ja active Active
-
2012
- 2012-12-21 US US13/723,899 patent/US9318126B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US9318126B2 (en) | 2016-04-19 |
US20130173262A1 (en) | 2013-07-04 |
JP2013137385A (ja) | 2013-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9093968B2 (en) | Sound reproducing apparatus, sound reproducing method, and recording medium | |
EP2278707B1 (en) | Dynamic enhancement of audio signals | |
JP5236006B2 (ja) | 音声信号調整装置及び音声信号調整方法 | |
US20160210983A1 (en) | Method and electronic device | |
JP4923939B2 (ja) | オーディオ再生装置 | |
JP4666229B2 (ja) | オーディオ再生装置 | |
JP4591557B2 (ja) | 音声信号処理装置、音声信号処理方法および音声信号処理プログラム | |
TWI535299B (zh) | 低音強化系統及其方法 | |
JP5898534B2 (ja) | 音響信号処理装置および音響信号処理方法 | |
JP5012995B2 (ja) | オーディオ信号処理装置及びオーディオ信号処理方法 | |
JP2002524996A (ja) | 低周波オーディオエンハンスメントシステム | |
US20180242083A1 (en) | Bass enhancement | |
CN104137568B (zh) | 频率特性变形装置 | |
US20140105419A1 (en) | Asymmetric polynomial psychoacoustic bass enhancement | |
KR101377135B1 (ko) | 오디오 신호의 저주파 및 중주파 성분 보강 방법 및 그장치 | |
JP4983694B2 (ja) | 音声再生装置 | |
JP5590021B2 (ja) | 音声明瞭化装置 | |
US20100189283A1 (en) | Tone emphasizing device, tone emphasizing method, tone emphasizing program, and recording medium | |
US8462964B2 (en) | Recording apparatus, recording method, audio signal correction circuit, and program | |
JP5268581B2 (ja) | 低域補完装置 | |
JP4086019B2 (ja) | 音量制御装置 | |
KR100883896B1 (ko) | 음성명료도 향상장치 및 방법 | |
JP2005269543A (ja) | 低音強調回路 | |
JP2009003297A (ja) | 音声信号処理装置および音声再生装置 | |
WO2017056216A1 (ja) | 音声信号生成装置、音声信号生成方法、及び、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130620 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131028 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131119 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140120 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140701 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140714 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5590021 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313532 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |