JP4147445B2 - 音響信号処理装置 - Google Patents
音響信号処理装置 Download PDFInfo
- Publication number
- JP4147445B2 JP4147445B2 JP2001050274A JP2001050274A JP4147445B2 JP 4147445 B2 JP4147445 B2 JP 4147445B2 JP 2001050274 A JP2001050274 A JP 2001050274A JP 2001050274 A JP2001050274 A JP 2001050274A JP 4147445 B2 JP4147445 B2 JP 4147445B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- acoustic signal
- frequency
- formant
- frequency band
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000012545 processing Methods 0.000 title claims description 49
- 230000004044 response Effects 0.000 claims description 8
- 230000000630 rising effect Effects 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 claims description 7
- 230000003321 amplification Effects 0.000 claims description 5
- 230000007423 decrease Effects 0.000 claims description 5
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 5
- 230000005236 sound signal Effects 0.000 claims description 4
- 230000000873 masking effect Effects 0.000 description 27
- 238000012937 correction Methods 0.000 description 25
- 206010011878 Deafness Diseases 0.000 description 16
- 238000010586 diagram Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 9
- 238000000034 method Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 8
- 241000282414 Homo sapiens Species 0.000 description 7
- 206010036626 Presbyacusis Diseases 0.000 description 7
- 238000001514 detection method Methods 0.000 description 7
- 208000009800 presbycusis Diseases 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 239000003990 capacitor Substances 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 208000016354 hearing loss disease Diseases 0.000 description 4
- 210000004556 brain Anatomy 0.000 description 3
- 231100000888 hearing loss Toxicity 0.000 description 3
- 230000010370 hearing loss Effects 0.000 description 3
- 208000032041 Hearing impaired Diseases 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 210000000860 cochlear nerve Anatomy 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 230000007433 nerve pathway Effects 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 206010048865 Hypoacusis Diseases 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 231100000895 deafness Toxicity 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G5/00—Tone control or bandwidth control in amplifiers
- H03G5/16—Automatic control
- H03G5/18—Automatic control in untuned amplifiers
- H03G5/22—Automatic control in untuned amplifiers having semiconductor devices
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/50—Customised settings for obtaining desired overall acoustical characteristics
- H04R25/505—Customised settings for obtaining desired overall acoustical characteristics using digital signal processing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/15—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being formant information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2225/00—Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
- H04R2225/43—Signal processing in hearing aids to enhance the speech intelligibility
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Neurosurgery (AREA)
- Otolaryngology (AREA)
- Circuit For Audible Band Transducer (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Description
【発明の属する技術分野】
本発明は、音響信号を健聴者及び難聴者の何れであるかに拘わらず明瞭で聞き易い音響信号となるように処理することが可能な音響信号処理装置に関する。
【0002】
【従来の技術】
一般に、人間の聴覚に依る音響信号の理解は、音響信号を聴覚神経が検出して脳に送られた当該信号の処理及び過去の経験から得た記憶を参照することで実現されているのであるが、聴覚神経経路は視覚神経経路に比較し、極めて大規模且つ複雑である為、その働きについては殆ど理解されていない。
【0003】
近年の電子工学の進歩は、音響処理の分野に於いて、多くの新しい試みを実施することを可能にしたが、そのなかには、人間の聴覚を混乱させることで、新しい音のイメージを与えるような処理も現れ、人間性の消失に結び付くものではないかと懸念されている。
【0004】
音響処理は、人間の聴覚に依る理解を助ける為の技術として進展させることが本来的な命題であり、健聴者にも難聴者にも容易に理解できる音響を提供できるものでなければならない。
【0005】
【発明が解決しようとする課題】
本発明では、健聴者であると難聴者であるとに拘わらず、音響情報を聞き取り易く且つ正確に理解できるように音響信号を処理できる装置を提供する。
【0006】
【課題を解決するための手段】
本発明では、人間の聴覚に依る音響信号の情報内容に関する理解を助ける為、難聴者の聴覚に依った場合には失われてしまうであろう音響のレベルのみを上昇させ、しかも、その音響は健聴者にとっても聞き易い音響であって、理解し難い音響情報、例えば外国語を内容とする音響情報も容易に聞き取り可能であるようにすることが基本になっている。
【0007】
一般に、聴覚に依る音響信号の理解は、音響信号の流れのなかで、重要な周波数の分布及びレベルの流れを検出し、それ等を脳に伝達して実現されるのであるが、このような流れに関する研究は、言語の分野に於いて比較的進んでいて、その場合、重要な周波数として、第1ホルマント、第2ホルマント、第3ホルマント・・・・と呼んでいる。
【0008】
人間が聴覚で各ホルマントを鋭敏に検出し、また、言語を知覚する能力は幼児期に学習するようであり、例えば日本人が英語のLとRとを聞き分け難いのは、幼児の時に聞き分ける訓練をする必要が無かった為、これ等を分離して検出する聴覚の機能が低下していることに由来し、その意味で日本人は英語に対して軽度の難聴者と見なしても差支えないと思われる。
【0009】
人間の脳は、聴覚から得られた音響情報が若干欠落していても、過去の経験や視覚情報からの助けを借りて、不足している音響情報を補完することができ、従って、音響信号を聴く人にとって常識的話題のような範囲であれば、聴覚で得られる音響情報が多少不正確であっても大きな問題とはならない。
【0010】
然しながら、例えば過去の経験が不足しているような状況下では、音響情報の補完は困難となるので、例えば外国語の聴き取りの場合などに於いては、聴覚が検出する音響情報は、充分に正確であることが必要となる。
【0011】
聴覚が言語を認識する為には、第1ホルマント、第2ホルマント、第3ホルマント・・・・を検出し、それ等の特有の分布から言語を理解するものであり、従って、これ等のホルマントのうち、重要なホルマントの幾つかを検出することができない場合には言語を認識することができず、本来の難聴、及び、外国語の聴き取りが旨くできない外国語難聴の状態となる。
【0012】
ところで、人間は加齢と共に身体のあらゆる機能が低下してくることは止むを得ないことであり、高度の信号解析を行っている聴覚では、種々な障害が発生することになり、軽度の場合は先ず聴覚感度が若干低下し、例えばテレビジョンの音を大きくすると一応聴こえるようになるが、聴覚感度の低下が更に進むと音を大きくしても、通俗的な表現としてはガンガンするだけで、その音響情報内容、例えば言語などは何を言っているのか理解できないという状態になる。
【0013】
これは、音響を大きくしても第1ホルマント、第2ホルマント、第3ホルマント・・・・を分離して検出することができない状態になっていることに由来している。
【0014】
聴覚にはマスキング効果があることは良く知られていて、健聴者の場合であっても、レベルが高い音が発生した場合、その周波数近傍のレベルが低い音は検出することができず、特に、高齢者の場合、音響情報の検出能力が低下するので、マスキング範囲は拡大され、第1ホルマントに比較してレベルが低い第2ホルマント、第3ホルマントはマスキングされ易いことになる。
【0015】
本発明者の実験に依れば、前記のような状態で、音響のレベルを大きくすると第1ホルマントが大きくなる為、マスキング範囲は更に拡大してしまい、結局、第2ホルマント、第3ホルマントを検出することが困難な状況は増大する。
【0016】
図1は音の流れの中からサンプルとして抽出した短時間のブロック内に含まれる音を聴覚認識する場合の過程を説明する為の線図であって、縦軸に音圧レベル〔dB〕を、また、横軸に周波数〔Hz〕をそれぞれ採ってある。
【0017】
図に於いて、aは音の流れの中からサンプルとして抽出した短時間のブロック内に含まれる音、a+は音aを強調した音、a1は音aの第1ホルマント、a2は音aの第2ホルマント、a3は音aの第3ホルマント、a4は音aの第4ホルマント、a1+は音a+の第1ホルマント、a2+は音a+の第2ホルマント、a3+は音a+の第3ホルマント、a4+は音a+の第4ホルマント、MA,MA′,MA′+はマスキング範囲をそれぞれ示している。
【0018】
前記各記号に含まれる意味を説明すると以下の通りである。
a:音aに含まれる周波数とそのレベル
a1:音aの中で最もレベルが高い周波数とそのレベル
a2:a1よりも高い周波数で最初のピークを示す周波数とレベル
a3:a1よりも高い周波数で2番目のピークを示す周波数とレベル
a4:a1よりも高い周波数で3番目のピークを示す周波数とレベル
MA:a1によるマスキング範囲(健聴者の場合)
MA′:a1によるマスキング範囲(老人性難聴者の場合)
a+:aを10〔dB〕強調した音の周波数とレベル
a1+:a+の中で最もレベルが高い周波数とそのレベル
a2+:a1+よりも高い周波数で最初のピークを示す周波数とレベル
a3+:a1+よりも高い周波数で2番目のピークを示す周波数とレベル
a4+:a1+よりも高い周波数で3番目のピークを示す周波数とレベル
MA′+:a1+によるマスキング範囲(老人性難聴者の場合)
【0019】
音aに於ける第1ホルマントa1に依る健聴者のマスキング範囲MAは、第1ホルマントa1に比較して低い周波数に対しては狭い範囲で、また、高い周波数に対しては広い範囲でそれぞれ影響を与え、マスキング範囲MAのレベルよりも低いレベルの音は第1ホルマントa1にマスキングされて聴き取ることはできないのであるが、健聴者の場合、第1ホルマントa1、第2ホルマントa2、第3ホルマントa3、第4ホルマントa4はマスキング範囲MAのレベルよりも高いので、全て聴き取ることが可能であり、従って、音aを認識することができる。
【0020】
然しながら、加齢に依って聴覚機能が低下した場合、第1ホルマントa1に依るマスキング範囲はMA′で指示してあるように拡大され、その結果、第2ホルマントa2、第3ホルマントa3、第4ホルマントa4はマスキング範囲MA′に比較して低いレベルになるので検出不可能になってしまう。
【0021】
第1ホルマントa1のみが聴こえても何の音か認識することはできないので、音aのレベルを10〔dB〕上昇させてa+にしたとすると、第1ホルマントa1も10〔dB〕上昇して第1ホルマントa1+となるのであるが、マスキング範囲MA′はマスキング範囲MA′+に上昇するので、レベルが10〔dB〕上昇した第2ホルマントa2+、第3ホルマントa3+、第4ホルマントa4+は依然としてマスキング範囲MA′+にマスキングされてしまうので聴覚で検出することはできない。
【0022】
従って、老人性難聴者の場合、音のレベルをいくら上昇させても、何か大きな音がしていることを聴くことができるのみで、その音の内容を正確に認識することはできないので、前記したように、マスキング範囲のレベルが高くなってしまった人々に対しては音量を上昇させることは全く効果がない。
【0023】
前記したところを綜合すれば、第1ホルマントa1を強調することなく、第2ホルマントa2、第3ホルマントa3・・・・を強調した音響信号を生成させることで問題を解決できる旨が理解されよう。
【0024】
即ち、第1ホルマントa1のレベルを上昇させなければ、そのマスキング範囲MAのレベルも上昇しないので、当然、第2ホルマントa2、第3ホルマントa3・・・・のレベルはマスキング範囲MAのレベルを越えた状態に在るので、音aを明確に検出することができ、言語であれば、その内容を完全に理解できることになる。尚、この解析は、老人性難聴者に対してのみならず、前記説明した外国語難聴者に対しても当てはまる。
【0025】
そこで、前記解析の結果を実現する音響信号の処理を行なう装置が必要になるが、その音響信号処理装置は次ぎに説明する原理に基づいて動作するものであることが必要である。
【0026】
図2は本発明に依る音響信号処理装置の動作原理を説明する為の線図であり、縦軸に音圧レベル〔dB〕を、また、横軸に周波数〔Hz〕をそれぞれ採ってある。尚、図1に於いて用いた記号と同記号は同部分を表すか或いは同じ意味を持つものとする。
【0027】
図に見られる記号に含まれる意味を説明すると以下の通りである。尚、図1について説明した記号、即ち、音aに関連する記号については前記説明した通りであるから再説明はしない。
【0028】
A:音aに対する本発明に依る補正特性(カーブ)の例
a′:音aを補正特性Aで補正した音
a2′:音a′の第2ホルマント
a3′:音a′の第3ホルマント
a4′:音a′の第4ホルマント
【0029】
b:音の流れの中からサンプルとして抽出した短時間のブロック内に含まれる音であって、その音に含まれる周波数とそのレベルを内容とする
b1:音bの中で最もレベルが高い周波数とそのレベルであって、音bの第1ホルマント
b2:b1よりも高い周波数で最初のピークを示す周波数とレベルであって、音bの第2ホルマント
b3:b1よりも高い周波数で2番目のピークを示す周波数とレベルであって、音bの第3ホルマント
b4:b1よりも高い周波数で3番目のピークを示す周波数とレベルであって、音bの第4ホルマント
MB:b1によるマスキング範囲(健聴者の場合)
MB′:b1によるマスキング範囲(老人性難聴者の場合)
【0030】
B:音bに対する本発明に依る補正特性(カーブ)の例
b′:音bを補正特性Bで補正した音
b2′:音b′の第2ホルマント
b3′:音b′の第3ホルマント
b4′:音b′の第4ホルマント
【0031】
b″:音bを補正特性Aで補正した音
b1″:音b″の第1ホルマント
b2″:音b″の第2ホルマント
b3″:音b″の第3ホルマント
b4″:音b″の第4ホルマント
MB″:b1″によるマスキング範囲(老人性難聴者の場合)
【0032】
図2に見られるように、ここに周波数成分を異にする音a及び音bが発生しているとし、聴覚が音aの第1ホルマントと共に第2ホルマントa2、第3ホルマントa3、第4ホルマントを検出することができれば音aを認識することができる。
【0033】
健聴者の場合、第1ホルマントa1に依るマスキング範囲はMAであるから第2ホルマント、第3ホルマント、第4ホルマントを検出することはできるが、老人性難聴に起因し、マスキング範囲がMA′のように上昇した場合、もはや、第2ホルマント、第3ホルマント、第4ホルマントは検出することができず、従って、音aを認識することはできない。
【0034】
前記状態に在る場合に於いて、本発明に依る音響信号処理装置に於いては、補正特性Aで示す補正を行って、第2ホルマントa2→第2ホルマントa2′、第3ホルマントa3→第3ホルマントa3′、第4ホルマントa4→第4ホルマントa4′とするので、第2ホルマント乃至第4ホルマントは難聴者のマスキング範囲MA′を越えることになり、音aを明瞭に認識することが可能となる。
【0035】
音bについても、健聴者の場合、第2ホルマントb2、第3ホルマントb3、第4ホルマントb4はマスキング範囲MBよりもレベルが高いので、音bを確実に認識できるのであるが、難聴者の場合、マスキング範囲はMB′となるので、音bは認識することはできない。
【0036】
然しながら、本発明に依る音響信号処理装置に於いては、音bの第1ホルマントb1を検出し、音bに対して補正特性Bを適用し、これに依り、第2ホルマントb2→第2ホルマントb2′、第3ホルマントb3→第3ホルマントb3′、第4ホルマントb4→第4ホルマントb4′とするので、第2ホルマント乃至第4ホルマントは難聴者のマスキング範囲MB′を越えることになり、音bを明瞭に認識することが可能となる。
【0037】
従来、多用されてきたトーン・コントロール回路を用いれば、前記の補正特性Aも補正特性Bも実現することは可能であるが、音a、或いは、音bに合わせて補正特性を自動的に選択することは不可能である。
【0038】
従って、若し、補正特性Aで音a及び音bを処理した場合、音aに対しては、本発明に依る音響処理装置と同様な効果を奏することができても、音bを処理した場合には、レベルが増大して音b″となり、音aに比較し、かなり強い音となって、周波数が高くなるにつれて更に強調される為、いわゆるキンキンした騒々しい音になる。
【0039】
また、補正特性Bで音a及び音bを処理した場合、音bに対しては本発明の音響処理装置と同様な効果を奏することができるのであるが、音aに対しては何も補正は行なわれないので、音aを認識することはできない。
【0040】
通常、音は例えば音aから音bへ、或いは、音bから音aへ、連続して変化するのが普通であるから、その一部のみが補正されたとしても、音の理解には役に立たず、本発明に依る場合のように、音を分析して自動的に最適な補正特性を選択し、その分析された音ごとに補正を加えることで、初めて聴覚の理解を助けることができる。
【0041】
聴覚の理解は、人間の言語のみでなく、音楽、動物の声、風や波の音など全て同じプロセスで認識されるものであるから、本発明に依る音響信号の処理は、マスキング範囲が拡大する老人性難聴者に対し、あらゆる場合に改善効果を示すことができる。
【0042】
ところで、本発明の音響処理装置に依って処理した音は、健聴者にとって、処理前の音とは異なって聴こえることになるが、その音は若干明るい音として感じる程度であって、従来のトーン・コントロール回路で高音域を強調した場合のようにキンキンする音にはならない。
【0043】
そのキンキンした音になる理由は、トーン・コントロール回路の場合には、補正対象の音が適合しない補正特性で補正された音になってしまう場合が頻繁に発生することに原因があり、例えば、図2について説明したように音bが補正特性Aで補正され、第1ホルマントb1が音b″の第1ホルマントb1″まで強調されてしまう場合があるのに対し、本発明に依る音響信号処理では、第1ホルマントb1は全く変化せず、第2ホルマントb2、第3ホルマントb3、第4ホルマントb4が若干強調されるだけであることに依る。
【0044】
従って、例えばテレビジョンの音について本発明に依る音響信号処理を実施すれば、健聴者に騒々しく感じない程度の音量で、且つ、老人性難聴者が補聴器を用いずに理解することができるようになり、また、例えば健聴者の外国語学習時に於いて、単語の発音の相違を聴き分けることが難しい場合、その音声について本発明に依る音響信号処理を施すことで発音の違いが強調され、それを聴き分けることができる為、自己の発音の修正を行なうことが可能となって外国語の習得に極めて有効である。
【0045】
前記したところから、本発明に依る音響信号処理装置に於いては、入力された音響信号を構成する周波数のなかから最もエネルギ・レベルが高い周波数帯を求める手段と、該手段で求めた周波数帯に比較して低い周波数帯についてはエネルギを略一定に維持すると共に該手段で求めた周波数帯に比較して高い周波数帯については周波数が高くなるにつれてエネルギの増幅度を増大する特性をもつ可変イコライザとを備えてなることを基本としている。
【0046】
前記手段を取ることに依り、健聴者であると難聴者であるとに拘わらず、音響情報を聞き取り易く且つ正確に理解できるように音響信号を処理できる装置を実現することができる。
【0047】
【発明の実施の形態】
図3は本発明の一実施の形態である音響信号処理装置を表す要部ブロック図である。
【0048】
図に於いて、1は入力側のバッファ回路、2はフィルタ群、3は整流回路群、4はピーク検出回路群、5はコンパレータ群、6はアナログ・スイッチ群、7は可変イコライザ、8は出力側のバッファ回路、9は遅延回路、10はA/D変換器をそれぞれ示し、また、フィルタ群2はフィルタF1、F2、F3・・・・Fnで、整流回路群3は整流回路D1、D2、D3・・・・Dnとキャパシタ及び抵抗で、ピーク検出回路群4はピーク検出ダイオードPD1、PD2、PD3・・・・PDnで、コンパレータ群5はコンパレータP1、P2、P3・・・・Pnで、アナログ・スイッチ群5はアナログ・スイッチS1、S2、S3・・・・Snでそれぞれ構成され、そして、C1、C2、C3・・・・Cnは可変イコライザ7の特性を選定する際に作用するコンデンサである。
【0049】
図4は図3に見られる音響信号処理装置の動作を説明する為の線図であって、(A)は周波数を分析するフィルタF1〜Fnのフィルタ特性を、(B)はフィルタF1〜Fnの出力レベルを、(C)はフィルタの出力レベルに対応して変化するイコライザ特性をそれぞれ示し、何れの図に於いても横軸には周波数を、また、縦軸には、(A)及び(B)ではレベル、(C)では増幅度をそれぞれ採ってある。
【0050】
バッファ回路1を介して入力した音響信号はフィルタ群1に送入され、フィルタ群1に於いてフィルタ周波数成分に分離した音響信号が各フィルタF1〜Fnから出力される。
【0051】
フィルタ群1の特性は図4(A)に見られるように連続していて、必要な周波数帯域、例えば約200〔Hz〕〜5〔kHz〕をカバーするようにしてあり、そのフィルタ群1からの出力レベルの一例が図4(B)に示されている。
【0052】
図4(B)から明らかであるが、この場合、フィルタF3の出力である周波数f3の出力レベルが他のフィルタの出力レベルに比較して大きいことが看取される。
【0053】
ピーク検出回路群4はフィルタF1〜Fnの出力のうち、最も高い出力レベルをコンパレータ群5の負側入力端子に与える為のものであり、図4(B)に見られるように周波数f3のレベルが最も高い場合には全てのコンパレータP1〜Pnの負側入力端子に周波数f3の出力を加える。
【0054】
従って、コンパレータP3を除く他の全てのコンパレータの正側入力端子は負側入力端子に比較して電位が低くなって、出力は“ロー”(low)を示すことになり、そして、コンパレータP3のみは、ダイオードPD3の電圧降下分だけ僅かに正側入力端子の方が電位が高く、従って、コンパレータP3の出力は“ハイ”(high)になる。
【0055】
このようなコンパレータP3の出力は、可変イコライザ7の特性を決定する働きをするものであり、この場合、図4(C)に実線で示してある特性E3が選定されている。尚、可変イコライザ7の特性E1〜Enは、コンパレータP1〜P2nの出力に対応して変化する。
【0056】
その特性決定プロセスとしては、コンパレータP3の出力でアナログ・スイッチS3をオンにしてコンデンサC3を接続し、可変イコライザ7の動作特性を図4(C)に見られる特性E3に定める。
【0057】
可変イコライザ7は、図4(C)に見られるように、特性が可変であるものならば、例えばパッシブ・フィルタであっても使用することができ、近年、特にIC化されたアクティブ・フィルタは、特性を容易にコントロールできるものが多いので、使い易いものを選択することができ、例えばステート・バリアブル・フィルタ、パラメトリック・フィルタ、スイッチト・キャパシタ・フィルタなどを利用することができる。
【0058】
可変イコライザ7の特性としては、聴き取りをする者の特性、即ち、難聴度に合わせて設定することが可能でなければならず、特定の聴き取り者に対して最適化するには次の特性を調節することとする。
▲1▼ 最大補正量(図4(C)に見られるGEの〔dB〕値をいくらにするか)
▲2▼ 補正特性(カーブ)の傾斜(オクターブ当たりの〔dB〕値をいくらにするか)
▲3▼ 周波数分析と補正特性との相関(フィルタ周波数と可変イコライザの立ち上がり周波数は若干前後した方が効果的な場合がある)
▲4▼ 音響信号のレベルと前記▲1▼、▲2▼、▲3▼との相関(信号のレベル如何で補正係数を変えた方が良い場合がある)
【0059】
可変イコライザ7の特性を前記基準に沿って変化させ、多くの軽度乃至中程度の老人性難聴者に対して聴き取り改善効果を調査したところ、調査対象者の全ての人に有効である旨の結果が得られ、また、その為に実施された補正が健聴者に対しても殆ど違和感がない範囲にできることも判明している。
【0060】
本発明に依る音響信号処理装置でテレビジョンの音声を処理した場合、適度の音量にした音声を老人性難聴者と健聴者とが同時に聴き取ることができ、この場合の処理設定条件を標準とすることで簡単に好結果が得られる。
(1) 最大補正量は15〔dB〕〜25〔dB〕とする。
(2) 補正特性(カーブ)の傾斜は6〔dB/オクターブ〕とする。
(3) 可変イコライザの立ち上がり周波数は、入力音響信号の周波数分析で最大レベルの周波数とする。
(4) 可変イコライザは入力音響信号のレベルが60〔dB〕SPL(sound pressure level)〜80〔dB〕SPL付近で図4について説明した動作をするが、入力音響信号のレベルが低下すると共に可変イコライザの立ち上がり周波数は低周波数側にシフトし、入力音響信号が40〔dB〕SPL以下の場合は周波数分析結果の如何にかかわらず最低周波数のイコライズ特性に設定し、また、入力音響エネルギ・レベルが増大するにつれて可変イコライザの立ち上がり周波数を高周波数側にシフトし、100〔dB〕SPLを越える場合は最高周波数のイコライズ特性に設定する。
【0061】
さて、可変イコライザ7は入力音響信号成分の変化に対応してイコライズ特性は変化しなければならないが、フィルタ群2からの出力のピーク検出回路群4に依るレベル検出、コンパレータ群5に依るレベル比較、可変イコライザ7のイコライズ特性の設定、にはそれぞれ応答時間が必要であり、その応答時間を短くすると歪を発生する場合がある。
【0062】
その場合、歪を発生することなく、可変イコライザ7の応答速度を向上するには、可変イコライザ7の信号処理特性を低周波帯から高周波帯に移行する際には5〔msec〕以内、高周波帯から低周波帯に移行する際には10〔msec〕以内の応答時間が適当である。
【0063】
可変イコライザ7に於ける処理の遅延時間は、その遅延時間と同じ遅延時間を可変イコライザ7への入力音響信号に与えることで打ち消すことができ、その為には、図3に破線で示してあるように、可変イコライザ7の入力側に適切な遅延を発生させる遅延回路9を介挿することができ、又、入力音響信号をディジタル化し、メモリ上で遅延時間打ち消しの処理を行うことで遅延時間の問題を解消することもできる。
【0064】
本発明に依る音響信号処理装置は、音響を発生して人間に情報を知得させる全ての電気(電子)機器に適用することができ、そして、それ等の機器に組み込んであっても、必要に応じてオン・オフすることは任意であり、又、音量調節器、トーン・コントロール、自動音量調節回路などを併用することで更に効果を高めることが可能である。
【0065】
また、図3に見られるように、可変イコライザ7の出力側にA/D変換器10を介挿し、可変イコライザ7の出力音響信号をディジタル化し、そのディジタル化音響信号をDVD、CD、FD、磁気テープ、磁気ディスクなどの記録媒体に記録し、その記録媒体を再生装置に掛けて音響信号を再生した場合、その再生された音響信号は難聴者並びに健聴者にとって大変聴き取り易い音となり、これ等の作用及び効果は、ディジタル化された音響信号を適宜の通信手段に依って遠隔地に送った場合でも同効である。
【0066】
ところで、前記実施の形態では、可変イコライザ7を用いて音響信号処理を行う場合について説明したが、これは他の手段に依っても可能である。
【0067】
図5は本発明に於ける他の実施の形態である音響信号処理装置を表す要部ブロック図であり、図に於いて、11はバッファ回路、12はA/D変換器、13はディジタル信号処理装置、14はバッファ回路をそれぞれ示している。
【0068】
ここで、ディジタル信号処理装置13としては、MPU(micro processing unit)やDSP(digital signal processor)などを利用することができる。
【0069】
図示の音響信号処理装置では、アナログの入力音響信号をA/D変換器12に依ってディジタル化し、そのディジタル化された音響信号をディジタル信号処理装置13に依って演算処理することで、図3及び図4について説明した処理と同効の処理を実現することができる。
【0070】
その演算処理された音響信号は、通常のディジタル再生装置で再生して聴くことができ、また、可変イコライザ7を用いる実施の形態で説明したように、演算処理された音響信号を記録媒体に記録し、必要な時に再生することができ、更にまた、遠隔地に送信することもできる。
【0071】
本発明に於いては、段落番号0046に記載した基本形態の他に多くの形態で実施することができ、以下、それを改変例として例示する。
【0072】
(1)
前記基本形態に於いて、可変イコライザが6〔dB〕/オクターブのハイ・パス・フィルタ特性をもつことを特徴とする。
【0073】
(2)
前記基本形態に於いて、可変イコライザ固有の応答遅延時間に相当する遅延時間を入力音響信号に与える遅延回路(遅延回路9:図3参照)を可変イコライザの入力側に介挿してなることを特徴とする。
【0074】
(3)
前記基本形態に於いて、A/D変換器(A/D変換器10:図3参照)を可変イコライザの出力側に介挿してなることを特徴とする。
【0075】
(4)
前記基本形態に於いて、入力音響信号のエネルギ・レベルの低下と共に可変イコライザの立ち上がり周波数は低い方にシフトし、且つ、入力音響信号のエネルギ・レベルの上昇と共に可変イコライザの立ち上がり周波数は高い方にシフトすることを特徴とする。
【0076】
(5)
前記基本形態に於いて、可変イコライザの増幅度が15〔dB〕乃至25〔dB〕の範囲にあることを特徴とする。
【0077】
(6)
前記(2)に於いて、可変イコライザの応答時間は、ハイ・パス・フィルタ特性が高周波側に移行する時間は5〔msec〕以内であり、且つ、低周波側に移行する時間は10〔msec〕以内であることを特徴とする。
【0078】
(7)
入力音響信号をディジタル化するA/D変換器と、該A/D変換器からのディジタル音響信号を周波数分析してエネルギ・レベルが最大である周波数帯よりも高い周波数帯を強調する演算を付与したディジタル音響信号を発生するマイクロ・プロセッサ・ユニット或いはディジタル・シグナル・プロセッサからなるプロセッサとを備えてなることを特徴とする。
【0079】
【発明の効果】
本発明に依る音響信号処理装置に於いては、入力された音響信号を構成する周波数のなかから最もエネルギ・レベルが高い周波数帯を求める手段と、該手段で求めた周波数帯に比較して低い周波数帯についてはエネルギを略一定に維持すると共に該手段で求めた周波数帯に比較して高い周波数帯については周波数が高くなるにつれてエネルギの増幅度を増大する特性をもつ可変イコライザとを備えてなることを基本としている。
【0080】
前記構成を取ることに依り、健聴者であると難聴者であるとに拘わらず、音響情報を聞き取り易く且つ正確に理解できるように音響信号を処理できる装置を実現することができる。
【図面の簡単な説明】
【図1】音の流れの中からサンプルとして抽出した短時間のブロック内に含まれる音を聴覚認識する場合の過程を説明する為の線図である。
【図2】本発明に依る音響信号処理装置の動作原理を説明する為の線図である。
【図3】本発明の一実施の形態である音響信号処理装置を表す要部ブロック図である。
【図4】図3に見られる音響信号処理装置の動作を説明する為の線図である。
【図5】本発明に於ける他の実施の形態である音響信号処理装置を表す要部ブロック図である。
【符号の説明】
1 入力側のバッファ回路
2 フィルタ群
3 整流回路群
4 ピーク検出回路群
5 コンパレータ群
6 アナログ・スイッチ群
7 可変イコライザ
8 出力側のバッファ回路
9 遅延回路
10 A/D変換器
11 バッファ回路
12 A/D変換器
13 ディジタル信号処理装置
14 バッファ回路
Claims (6)
- 入力された音響信号を構成する周波数帯のなかから最もエネルギ・レベルが高い周波数帯を求める手段と、
該手段で求めた周波数帯に比較して低い周波数帯についてはエネルギ・レベルを略一定に維持すると共に該手段で求めた周波数帯に比較して高い周波数帯については周波数が高くなるにつれてエネルギ・レベルの増幅度を増大する特性をもつ可変イコライザとを備えてなること
を特徴とする音響信号処理装置。 - 可変イコライザが6〔dB〕/オクターブのハイ・パス・フィルタ特性をもつこと
を特徴とする請求項1記載の音響信号処理装置。 - 可変イコライザ固有の応答遅延時間に相当する遅延時間を入力音響信号に与える遅延回路を可変イコライザの入力側に介挿してなること
を特徴とする請求項1記載の音響信号処理装置。 - A/D変換器を可変イコライザの出力側に介挿してなること
を特徴とする請求項1記載の音響処理装置。 - 入力音響信号のエネルギ・レベルの低下と共に可変イコライザの立ち上がり周波数は低い方にシフトし、且つ、入力音響信号のエネルギ・レベルの上昇と共に可変イコライザの立ち上がり周波数は高い方にシフトすること
を特徴とする請求項1記載の音響処理装置。 - 入力音響信号をディジタル化するA/D変換器と、
該A/D変換器からのディジタル音響信号を周波数分析して最もエネルギ・レベルが高い周波数帯を求める手段と、
該手段で求めた周波数帯に比較して低い周波数帯についてはエネルギ・レベルを略一定に維持すると共に該手段で求めた周波数帯に比較して高い周波数帯については周波数が高くなるにつれてエネルギ・レベルを増大する演算を行うマイクロ・プロセッサ・ユニット或いはディジタル・シグナル・プロセッサからなるプロセッサとを備えてなること
を特徴とする音響信号処理装置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001050274A JP4147445B2 (ja) | 2001-02-26 | 2001-02-26 | 音響信号処理装置 |
EP02251184A EP1241921A3 (en) | 2001-02-26 | 2002-02-21 | Acoustic signal processor |
US10/079,906 US20020118846A1 (en) | 2001-02-26 | 2002-02-22 | Acoustic signal processor |
US11/008,185 US20050091043A1 (en) | 2001-02-26 | 2004-12-10 | Acoustic signal processor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001050274A JP4147445B2 (ja) | 2001-02-26 | 2001-02-26 | 音響信号処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002252894A JP2002252894A (ja) | 2002-09-06 |
JP4147445B2 true JP4147445B2 (ja) | 2008-09-10 |
Family
ID=18911256
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001050274A Expired - Lifetime JP4147445B2 (ja) | 2001-02-26 | 2001-02-26 | 音響信号処理装置 |
Country Status (3)
Country | Link |
---|---|
US (2) | US20020118846A1 (ja) |
EP (1) | EP1241921A3 (ja) |
JP (1) | JP4147445B2 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004246184A (ja) * | 2003-02-14 | 2004-09-02 | Eigyotatsu Kofun Yugenkoshi | 視覚化された発音の提案を備えた言語学習システム及び方法 |
JP4269892B2 (ja) * | 2003-10-29 | 2009-05-27 | ソニー株式会社 | オーディオデータ処理方法及び装置 |
JP4738213B2 (ja) * | 2006-03-09 | 2011-08-03 | 富士通株式会社 | 利得調整方法及び利得調整装置 |
DE102007014132A1 (de) * | 2007-03-23 | 2008-09-25 | Siemens Audiologische Technik Gmbh | Prozessorsystem mit direkt verschalteten Ports |
US8990081B2 (en) * | 2008-09-19 | 2015-03-24 | Newsouth Innovations Pty Limited | Method of analysing an audio signal |
CN101998206A (zh) * | 2009-08-20 | 2011-03-30 | 鸿富锦精密工业(深圳)有限公司 | 音频补偿装置 |
US8543061B2 (en) | 2011-05-03 | 2013-09-24 | Suhami Associates Ltd | Cellphone managed hearing eyeglasses |
JP6296219B2 (ja) * | 2012-07-13 | 2018-03-20 | パナソニックIpマネジメント株式会社 | 補聴装置 |
TW202008800A (zh) * | 2018-07-31 | 2020-02-16 | 塞席爾商元鼎音訊股份有限公司 | 助聽器及其助聽器之輸出語音調整之方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4039754A (en) * | 1975-04-09 | 1977-08-02 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | Speech analyzer |
DE3070698D1 (en) * | 1979-05-28 | 1985-07-04 | Univ Melbourne | Speech processor |
SE428167B (sv) * | 1981-04-16 | 1983-06-06 | Mangold Stephan | Programmerbar signalbehandlingsanordning, huvudsakligen avsedd for personer med nedsatt horsel |
US5388185A (en) * | 1991-09-30 | 1995-02-07 | U S West Advanced Technologies, Inc. | System for adaptive processing of telephone voice signals |
ATE150609T1 (de) * | 1991-10-03 | 1997-04-15 | Ascom Audiosys Ag | Verfahren zur verstärkung von akustischen signalen für hörbehinderte, sowie vorrichtung zur durchführung des verfahrens |
DE19525944C2 (de) * | 1995-07-18 | 1999-03-25 | Berndsen Klaus Juergen Dr | Hörhilfe |
WO1997014266A2 (en) * | 1995-10-10 | 1997-04-17 | Audiologic, Inc. | Digital signal processing hearing aid with processing strategy selection |
US6353671B1 (en) * | 1998-02-05 | 2002-03-05 | Bioinstco Corp. | Signal processing circuit and method for increasing speech intelligibility |
US6201875B1 (en) * | 1998-03-17 | 2001-03-13 | Sonic Innovations, Inc. | Hearing aid fitting system |
-
2001
- 2001-02-26 JP JP2001050274A patent/JP4147445B2/ja not_active Expired - Lifetime
-
2002
- 2002-02-21 EP EP02251184A patent/EP1241921A3/en not_active Withdrawn
- 2002-02-22 US US10/079,906 patent/US20020118846A1/en not_active Abandoned
-
2004
- 2004-12-10 US US11/008,185 patent/US20050091043A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
JP2002252894A (ja) | 2002-09-06 |
EP1241921A2 (en) | 2002-09-18 |
US20020118846A1 (en) | 2002-08-29 |
EP1241921A3 (en) | 2005-02-02 |
US20050091043A1 (en) | 2005-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8374877B2 (en) | Hearing aid and hearing-aid processing method | |
KR100283421B1 (ko) | 음성 속도 변환 방법 및 그 장치 | |
JP4666229B2 (ja) | オーディオ再生装置 | |
JP4439579B1 (ja) | 音質補正装置、音質補正方法及び音質補正用プログラム | |
JP5917518B2 (ja) | 知覚スペクトルアンバランス改善のための音声信号動的補正 | |
US5737719A (en) | Method and apparatus for enhancement of telephonic speech signals | |
Kates et al. | Speech intelligibility enhancement | |
US4622692A (en) | Noise reduction system | |
US5572593A (en) | Method and apparatus for detecting and extending temporal gaps in speech signal and appliances using the same | |
KR20130072258A (ko) | 개선된 오디오 재생 방법 및 보청기 | |
JP2008191659A (ja) | 音声強調方法及び音声再生システム | |
JP4147445B2 (ja) | 音響信号処理装置 | |
US6674868B1 (en) | Hearing aid | |
Jamieson et al. | Evaluation of a speech enhancement strategy with normal-hearing and hearing-impaired listeners | |
JPH0968997A (ja) | 音声処理方法及び装置 | |
JP2000152394A (ja) | 軽度難聴者用補聴装置、軽度難聴者対応伝送システム、軽度難聴者対応記録再生装置、及び軽度難聴者対応再生装置 | |
JPH08179792A (ja) | 音声処理装置 | |
JPH06289897A (ja) | 音声信号処理装置 | |
JP3303446B2 (ja) | 音声信号処理装置 | |
JPH06276599A (ja) | 衝撃音抑圧装置 | |
JPH06289898A (ja) | 音声信号処理装置 | |
JPH04245720A (ja) | 雑音低減方法 | |
JP2007065285A (ja) | 音声信号処理方法、装置及びプログラム | |
JP4079478B2 (ja) | 音声信号の処理回路および処理方法 | |
JP3596580B2 (ja) | 音声信号の処理回路 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20010226 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060327 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061109 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080304 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080428 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080603 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080611 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110704 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4147445 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110704 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110704 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110704 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120704 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120704 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120704 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120704 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130704 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130704 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130704 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |