JP6629834B2 - ハーモニックフィルタツールのハーモニック依存制御 - Google Patents
ハーモニックフィルタツールのハーモニック依存制御 Download PDFInfo
- Publication number
- JP6629834B2 JP6629834B2 JP2017504673A JP2017504673A JP6629834B2 JP 6629834 B2 JP6629834 B2 JP 6629834B2 JP 2017504673 A JP2017504673 A JP 2017504673A JP 2017504673 A JP2017504673 A JP 2017504673A JP 6629834 B2 JP6629834 B2 JP 6629834B2
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- temporal structure
- harmonic
- filter
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000001419 dependent effect Effects 0.000 title claims description 18
- 230000002123 temporal effect Effects 0.000 claims description 101
- 230000005236 sound signal Effects 0.000 claims description 76
- 230000001052 transient effect Effects 0.000 claims description 45
- 238000000034 method Methods 0.000 claims description 41
- 230000003595 spectral effect Effects 0.000 claims description 27
- 230000008859 change Effects 0.000 claims description 21
- 230000006870 function Effects 0.000 claims description 20
- 238000011045 prefiltration Methods 0.000 claims description 20
- 238000001228 spectrum Methods 0.000 claims description 18
- 238000005070 sampling Methods 0.000 claims description 16
- 230000005284 excitation Effects 0.000 claims description 14
- 238000013459 approach Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 11
- 238000013139 quantization Methods 0.000 claims description 11
- 230000000694 effects Effects 0.000 claims description 7
- 230000004044 response Effects 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000007423 decrease Effects 0.000 claims description 3
- 230000003247 decreasing effect Effects 0.000 claims 1
- 239000011295 pitch Substances 0.000 description 84
- 238000005259 measurement Methods 0.000 description 83
- 238000001914 filtration Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 16
- 238000001514 detection method Methods 0.000 description 15
- 230000007774 longterm Effects 0.000 description 11
- 238000012546 transfer Methods 0.000 description 8
- 230000008901 benefit Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 7
- 230000008447 perception Effects 0.000 description 6
- 230000003213 activating effect Effects 0.000 description 5
- 238000011144 upstream manufacturing Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000740 bleeding effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 238000009527 percussion Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/125—Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Electrophonic Musical Instruments (AREA)
- Auxiliary Devices For Music (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Filters That Use Time-Delay Elements (AREA)
Description
プレおよびポストフィルタリングの両方を適用する時間領域アプローチの例は、以下の非特許文献4,5,6,7,8に示される通りである:
ポストフィルタリングのみが適用される時間領域アプローチの例は、以下の非特許文献9,10,11,12に示される通りである。
過渡現象検出器の例は、以下の非特許文献13に示される通りである。
音響心理学上の関連文献は、以下の非特許文献14,15である。
−客観的または主観的な利点は、フィルタを活性化することによって得られ、
−有意なアーチファクトは、前記フィルタの活性化によって導入されない。
変換長決定に使用される時間測定は、LTPの決定に使用される時間測定とは完全に異なってもよく、または、それらは、重畳しまたは正確に同じであるが異なる領域に計算されてもよい。
2.
1つの時間的構造測定<第3の閾値および(現行または先行フレームのためのハーモニシティ)>第4の閾値;
3.
(1つの時間的構造測定、<第5の閾値またはすべての時間測定<閾値)および現行フレームのためのハーモニシティ>第6の閾値。
しかしながら、場合によっては、時間測定の使用は、不利であり得る。図18におけるスペクトログラムおよび図19における波形は、Fatboy Slimによる「Kalifornia」の始めから、約35ミリ秒の抜粋を示す。それがエネルギーの大きな時間的変動を検出するにつれて、時間平坦性測定に、および、最大エネルギー変化に依存するLTP決定は、この種の信号のためのLTPを無効にする。
配置の修正および変更および本願明細書において記載されている詳細は、他の当業者にとって明らかであるものと理解される。従って、未決の特許請求の範囲だけによって、そして、本願明細書において実施例の説明および説明として示される具体的な詳細だけでないことによって制限されることが、意図される。
Claims (25)
- 音声コーデックのハーモニックフィルタツールのハーモニシティに依存する制御を実行するための装置(10)であって、
前記音声コーデックによって処理されるべき音声信号(12)のピッチ(18)を決定するように構成されるピッチ推定器(16)と;
前記ピッチ(18)を使用している前記音声信号(12)のハーモニシティの指標(22)を決定するように構成されるハーモニシティ測定器(20)と;
前記ピッチ(18)に依存して、前記音声信号(12)の時間的構造の特性を測定する少なくとも1つの時間的構造指標(26)を決定するように構成される時間的構造解析器(24)と;
前記時間的構造指標(26)および前記ハーモニシティの指標(22)に依存して、前記ハーモニックフィルタツール(30)を制御するように構成されたコントローラ(28)とを備え、
前記時間的構造解析器(24)は、前記少なくとも1つの時間的構造指標(26)を、前記ピッチ(18)に依存して一時的に位置決めされた時間領域内で決定するように構成され、かつ、
前記時間的構造解析器(24)は、前記ピッチ(18)に依存して、前記時間領域の時間的に過去の先端(38)を位置づけるように構成される、装置。 - 前記ハーモニシティ測定器(20)は、前記音声信号(12)の正規化された相関あるいはそのプレ修正バージョンを、前記ピッチ(18)のピッチ−遅延において、または、その周辺で計算することによって前記ハーモニシティの指標(22)を決定するように構成される、請求項1に記載の装置。
- 前記ピッチ推定器(16)は、第1のステージおよび第2のステージを含むステージにおいて前記ピッチ(18)を決定するように構成されている、請求項1または2に記載の装置。
- 前記ピッチ推定器(16)は、前記第1のステージ内で、第1のサンプルレートのダウンサンプリングされた領域で前記ピッチの予備推定を決定するとともに、前記第2のステージ内で、前記第1のサンプリングレートより高い第2のサンプリングレートで、前記ピッチの予備推定を精製する、請求項3に記載の装置。
- 前記ピッチ推定器(16)は、自己相関を使用して前記ピッチ(18)を決定するように構成される、請求項1ないし4のいずれかに記載の装置。
- 前記時間的構造解析器(24)は、前記時間領域の、または前記時間的構造指標の前記決定への影響がより高い領域の、時間的に過去の見出し端(38)を位置決めして、前記時間領域の、または前記時間的構造指標の前記決定への影響がより高い領域の、時間的に過去の見出し端(38)が、前記ピッチ(18)の減少に伴って単調増加する時間量分だけ、過去の方向に移動されるように構成される、請求項1ないし5のいずれかに記載の装置。
- 前記時間的構造解析器(24)は、前記時間領域の、または前記時間的構造指標の前記決定への影響がより高い領域の時間的に過去の先端(38)から現在のフレーム(34a)の時間的に将来の先端(44)まで延びる時間候補領域内の前記音声信号(12)の時間的構造に依存して、前記時間領域(36)の、または前記時間的構造指標(26)の決定への影響がより高い領域の、時間的に将来の先端(40)を位置決めするように構成される、請求項1ないし6のいずれかに記載の装置。
- 前記時間的構造解析器(24)は、前記時間領域(36)の、あるいは前記時間的構造指標(26)の前記決定への影響がより高い領域の、時間的に将来の先端を位置決めするために、前記時間候補領域内での振幅または最大エネルギーサンプルと最小のエネルギーサンプルとの比率を使用するように構成される、請求項7に記載の装置。
- 前記コントローラ(28)は、
予め定められた条件が、前記少なくとも1つの時間的構造指標(26)および前記ハーモニシティ指標(22)が既定の条件を満たしているかをチェックして、チェック結果を得るように構成されるロジック(120);と、
前記チェック結果に依存して、前記ハーモニックフィルタツール(30)をイネーブルおよびディセーブルの間で切り替えるように構成されるスイッチ(124)を含む、請求項1ないし8のいずれかに記載の装置。 - 前記少なくとも1つの時間的構造指標(26)は、前記時間領域内で前記音声信号の平均または最大エネルギー変化を測定し、前記ロジックは、
前記少なくとも1つの時間的構造指標(26)が、既定の第1の閾値より小さく、
かつ、前記ハーモニシティの指標(22)は、現在のフレームおよび/または前のフレームについて、第2の閾値を越える、の両方を満たす場合、前記既定の条件が満たされるように構成される、請求項9に記載の装置。 - 前記ロジック(120)は、前記ハーモニシティの指標(22)が、現在のフレームについて、第3の閾値を越え、かつ、前記ハーモニシティの指標は、現在のフレームおよび/または前のフレームについて、前記ピッチ(18)のピッチ遅延の増加に伴って減少する第4の閾値を越える場合にも、前記既定の条件が満たされるように構成される、請求項10に記載の装置。
- 前記コントローラ(28)が、
デコード側に音声コーデックのデータストリームを介して明確に制御信号を送ること、または、
前記デコード側でポストフィルタを制御するためにデコード側に音声コーデックのデータストリームを介して明確に制御信号の信号を送り、かつ前記デコード側での前記ポストフィルタの制御に沿って、エンコーダ側でプレフィルタを制御することによって、前記ハーモニックフィルタツール(30)を制御するように構成される、請求項1ないし11のいずれかに記載の装置。 - 前記時間的構造解析器(24)が、スペクトル的に識別できるように前記少なくとも1つの時間的構造指標(26)を決定して、複数のスペクトル帯域のスペクトル帯域ごとに前記少なくとも1つの時間的構造指標(26)の1つの値を得るように構成される、請求項1ないし12のいずれかに記載の装置。
- 前記コントローラ(28)は、フレームの単位で前記ハーモニックフィルタツール(30)を制御するように構成され、かつ前記時間的構造解析器(24)は、前記フレームのフレームレートより高いサンプルレートで前記音声信号(12)のエネルギーをサンプリングして前記音声信号のエネルギーサンプルを得て、前記エネルギーサンプルに基づいて前記少なくとも一つの時間的構造指標(26)を決定するように構成される、請求項1ないし13のいずれかに記載の装置。
- 前記時間的構造解析器(24)は、前記ピッチ(18)に応じて時間的に位置決めされた時間領域内で前記少なくとも1つの時間的構造指標(26)を決定するように構成され、かつ、前記時間的構造解析器(24)は、前記時間領域内での前記エネルギーサンプルの直接連続するエネルギーサンプルの対の間での変化を測定するエネルギー変化値のセットを計算し、前記エネルギー変化値のセットを、各々が前記エネルギー変化値のセットの厳密に1つに依存する最大値演算子または加数の総和を含むスカラー関数に付すことにより、前記エネルギーサンプルに基づいて前記少なくとも1つの時間的構造指標(26)を決定するように構成される、請求項14に記載の装置。
- 前記時間的構造解析器(24)は、ハイパスフィルタリングされた領域内で前記音声信号(12)の前記エネルギーの前記サンプリングを実行するように構成される、請求項14または15のいずれかに記載の装置。
- 前記ピッチ推定器(16)、前記ハーモニシティ測定器(20)および前記時間的構造解析器(24)は、元の音声信号およびその若干のプレ修正バージョンを含む前記音声信号(12)の異なるバージョンに基づいて、決定を実行する、請求項1ないし16のいずれかに記載の装置。
- 前記コントローラ(28)は、前記ハーモニックフィルタツール(30)を制御する際に、前記時間的構造指標(26)および前記ハーモニシティ指標(22)に依存して、
前記ハーモニックフィルタツール(30)のプレフィルタおよび/またはポストフィルタのイネーブルおよびディセーブルを切り替える、または
前記ハーモニックフィルタツール(30)の前記プレフィルタおよび/または前記ポストフィルタのフィルタ強度を徐々に適応させるように構成され、
前記ハーモニックフィルタツール(30)は、プレフィルタおよびポストフィルタアプローチからなり、かつ、前記ハーモニックフィルタツール(30)の前記プレフィルタは、前記音声信号の前記ピッチの高調波成分内で量子化ノイズを増加させるように構成され、前記ハーモニックフィルタツール(30)の前記ポストフィルタは、送信されたスペクトルをそれに従って再成形するように構成される、または、前記ハーモニックフィルタツール(30)は、ポストフィルタのみのアプローチからなり、かつ、前記ハーモニックフィルタツール(30)の前記ポストフィルタは、前記音声信号の前記ピッチの前記高調波成分間に発生する量子化ノイズをフィルタリングするように構成される、請求項1ないし17のいずれかに記載の装置。 - ハーモニックフィルタツール(30)および請求項1ないし18のいずれかに記載の前記ハーモニックフィルタツールのハーモニシティ依存制御を実行するための装置を含む、音声エンコーダまたは音声デコーダ。
- 請求項14ないし16のいずれかに記載のハーモニックフィルタツールのハーモニシティ依存制御を実行するための装置(10)と、
前記エネルギーサンプルに基づいて、前記音声コーデックによって処理されるべき音声信号における過渡現象を検出するように構成される過渡現象検出器とを含む、システム。 - 請求項20に記載のシステムを含み、検出された過渡現象に依存して変換ブロックおよび/または重畳長を切換えるように構成される、変換ベースエンコーダ。
- 前記検出された過渡現象に依存して、変換符号化励起モードと符号励起線型予測モードとの切り替えをサポートするように構成される、請求項20に記載の音声エンコーダ。
- 前記検出された過渡現象に依存して、変換符号化励起モードにおいて変換ブロックおよび/または重畳長を切換えるように構成される、請求項22に記載の音声エンコーダ。
- 音声コーデックのハーモニックフィルタツールのハーモニシティ依存制御を実行するための方法(10)であって、
前記音声コーデックによって処理されるべき音声信号(12)のピッチ(18)を決定する工程と;
前記ピッチ(18)を使用して、前記音声信号(12)のハーモニシティ指標(22)を決定する工程と;
前記ピッチ(18)に依存して、前記音声信号の時間的構造の特性を測定する少なくとも1つの時間的構造指標(26)を決定する工程と;
前記時間的構造指標(26)および前記ハーモニシティ指標(22)に依存して、前記ハーモニックフィルタツール(30)を制御する工程とを含み、
前記時間領域内の少なくとも1つの時間的構造指標(26)は、前記ピッチ(18)に依存して一時的に位置決めされた時間領域内で決定され、かつ、
前記時間領域の時間的に過去の先端(38)は、前記ピッチ(18)に依存して位置付けられる、方法。 - コンピュータ上で動作するときに、請求項24に記載の方法を実行するためのプログラムコードを有する、コンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14178810.9 | 2014-07-28 | ||
EP14178810.9A EP2980798A1 (en) | 2014-07-28 | 2014-07-28 | Harmonicity-dependent controlling of a harmonic filter tool |
PCT/EP2015/067160 WO2016016190A1 (en) | 2014-07-28 | 2015-07-27 | Harmonicity-dependent controlling of a harmonic filter tool |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019220392A Division JP7160790B2 (ja) | 2014-07-28 | 2019-12-05 | ハーモニックフィルタツールのハーモニック依存制御 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2017528752A JP2017528752A (ja) | 2017-09-28 |
JP2017528752A5 JP2017528752A5 (ja) | 2018-12-20 |
JP6629834B2 true JP6629834B2 (ja) | 2020-01-15 |
Family
ID=51224873
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017504673A Active JP6629834B2 (ja) | 2014-07-28 | 2015-07-27 | ハーモニックフィルタツールのハーモニック依存制御 |
JP2019220392A Active JP7160790B2 (ja) | 2014-07-28 | 2019-12-05 | ハーモニックフィルタツールのハーモニック依存制御 |
JP2022164445A Active JP7568695B2 (ja) | 2014-07-28 | 2022-10-13 | ハーモニックフィルタツールのハーモニック依存制御 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019220392A Active JP7160790B2 (ja) | 2014-07-28 | 2019-12-05 | ハーモニックフィルタツールのハーモニック依存制御 |
JP2022164445A Active JP7568695B2 (ja) | 2014-07-28 | 2022-10-13 | ハーモニックフィルタツールのハーモニック依存制御 |
Country Status (18)
Country | Link |
---|---|
US (3) | US10083706B2 (ja) |
EP (4) | EP2980798A1 (ja) |
JP (3) | JP6629834B2 (ja) |
KR (1) | KR102009195B1 (ja) |
CN (2) | CN106575509B (ja) |
AR (1) | AR101341A1 (ja) |
AU (1) | AU2015295519B2 (ja) |
BR (1) | BR112017000348B1 (ja) |
CA (1) | CA2955127C (ja) |
ES (3) | ES2988064T3 (ja) |
MX (1) | MX366278B (ja) |
MY (1) | MY182051A (ja) |
PL (3) | PL3175455T3 (ja) |
PT (2) | PT3396669T (ja) |
RU (1) | RU2691243C2 (ja) |
SG (1) | SG11201700640XA (ja) |
TW (1) | TWI591623B (ja) |
WO (1) | WO2016016190A1 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2980799A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an audio signal using a harmonic post-filter |
EP3382701A1 (en) | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for post-processing an audio signal using prediction based shaping |
EP3396670B1 (en) * | 2017-04-28 | 2020-11-25 | Nxp B.V. | Speech signal processing |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
EP3483883A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483884A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
JP6962268B2 (ja) * | 2018-05-10 | 2021-11-05 | 日本電信電話株式会社 | ピッチ強調装置、その方法、およびプログラム |
TWI864704B (zh) * | 2023-04-26 | 2024-12-01 | 弗勞恩霍夫爾協會 | 用於音訊編碼器中之尺度參數之諧度相依傾斜控制之設備及方法 |
Family Cites Families (55)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4969192A (en) * | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
US5012517A (en) | 1989-04-18 | 1991-04-30 | Pacific Communication Science, Inc. | Adaptive transform coder having long term predictor |
US5469087A (en) * | 1992-06-25 | 1995-11-21 | Noise Cancellation Technologies, Inc. | Control system using harmonic filters |
JP3122540B2 (ja) * | 1992-08-25 | 2001-01-09 | シャープ株式会社 | ピッチ検出装置 |
DE69614799T2 (de) * | 1995-05-10 | 2002-06-13 | Koninklijke Philips Electronics N.V., Eindhoven | Übertragungssystem und -verfahren für die sprachkodierung mit verbesserter detektion der grundfrequenz |
JP3483998B2 (ja) * | 1995-09-14 | 2004-01-06 | 株式会社東芝 | ピッチ強調方法および装置 |
EP0763818B1 (en) * | 1995-09-14 | 2003-05-14 | Kabushiki Kaisha Toshiba | Formant emphasis method and formant emphasis filter device |
JP2940464B2 (ja) * | 1996-03-27 | 1999-08-25 | 日本電気株式会社 | 音声復号化装置 |
JPH09281995A (ja) * | 1996-04-12 | 1997-10-31 | Nec Corp | 信号符号化装置及び方法 |
CN1180677A (zh) | 1996-10-25 | 1998-05-06 | 中国科学院固体物理研究所 | 纳米添加氧化铝陶瓷的改性方法 |
SE9700772D0 (sv) * | 1997-03-03 | 1997-03-03 | Ericsson Telefon Ab L M | A high resolution post processing method for a speech decoder |
DE19736669C1 (de) | 1997-08-22 | 1998-10-22 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Erfassen eines Anschlags in einem zeitdiskreten Audiosignal sowie Vorrichtung und Verfahren zum Codieren eines Audiosignals |
JP2000206999A (ja) * | 1999-01-19 | 2000-07-28 | Nec Corp | 音声符号伝送装置 |
US6691092B1 (en) * | 1999-04-05 | 2004-02-10 | Hughes Electronics Corporation | Voicing measure as an estimate of signal periodicity for a frequency domain interpolative speech codec system |
CA2388352A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
TW594674B (en) * | 2003-03-14 | 2004-06-21 | Mediatek Inc | Encoder and a encoding method capable of detecting audio signal transient |
JP2004302257A (ja) * | 2003-03-31 | 2004-10-28 | Matsushita Electric Ind Co Ltd | 長期ポストフィルタ |
US20050143979A1 (en) * | 2003-12-26 | 2005-06-30 | Lee Mi S. | Variable-frame speech coding/decoding apparatus and method |
CN1989548B (zh) * | 2004-07-20 | 2010-12-08 | 松下电器产业株式会社 | 语音解码装置及补偿帧生成方法 |
KR101168002B1 (ko) * | 2004-09-16 | 2012-07-26 | 프랑스 텔레콤 | 잡음 신호 처리 방법 및 상기 방법을 구현하기 위한 장치 |
UA91853C2 (ru) * | 2005-04-01 | 2010-09-10 | Квелкомм Инкорпорейтед | Способ и устройство для векторного квантования спектрального представления огибающей |
SG163556A1 (en) | 2005-04-01 | 2010-08-30 | Qualcomm Inc | Systems, methods, and apparatus for wideband speech coding |
US7548853B2 (en) * | 2005-06-17 | 2009-06-16 | Shmunk Dmitry V | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding |
US7546240B2 (en) * | 2005-07-15 | 2009-06-09 | Microsoft Corporation | Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition |
JPWO2007088853A1 (ja) * | 2006-01-31 | 2009-06-25 | パナソニック株式会社 | 音声符号化装置、音声復号装置、音声符号化システム、音声符号化方法及び音声復号方法 |
CN101496095B (zh) * | 2006-07-31 | 2012-11-21 | 高通股份有限公司 | 用于信号变化检测的系统、方法及设备 |
US8036899B2 (en) * | 2006-10-20 | 2011-10-11 | Tal Sobol-Shikler | Speech affect editing systems |
BRPI0718423B1 (pt) * | 2006-10-20 | 2020-03-10 | France Telecom | Método para sintetizar um sinal de áudio digital, dispositivo de síntese de sinal de áudio digital, dispositivo para receber um sinal de áudio digital, e memória de um dispositivo de síntese de sinal de áudio digital |
CN101548319B (zh) * | 2006-12-13 | 2012-06-20 | 松下电器产业株式会社 | 后置滤波器以及滤波方法 |
JP5084360B2 (ja) * | 2007-06-13 | 2012-11-28 | 三菱電機株式会社 | 音声符号化装置及び音声復号装置 |
EP2015293A1 (en) * | 2007-06-14 | 2009-01-14 | Deutsche Thomson OHG | Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain |
EP2210427B1 (en) * | 2007-09-26 | 2015-05-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for extracting an ambient signal |
DE602008005250D1 (de) * | 2008-01-04 | 2011-04-14 | Dolby Sweden Ab | Audiokodierer und -dekodierer |
US9142221B2 (en) * | 2008-04-07 | 2015-09-22 | Cambridge Silicon Radio Limited | Noise reduction |
US20090319263A1 (en) * | 2008-06-20 | 2009-12-24 | Qualcomm Incorporated | Coding of transitional speech frames for low-bit-rate applications |
CN103077722B (zh) * | 2008-07-11 | 2015-07-22 | 弗劳恩霍夫应用研究促进协会 | 提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码 |
WO2010031049A1 (en) * | 2008-09-15 | 2010-03-18 | GH Innovation, Inc. | Improving celp post-processing for music signals |
BR122019023704B1 (pt) * | 2009-01-16 | 2020-05-05 | Dolby Int Ab | sistema para gerar um componente de frequência alta de um sinal de áudio e método para realizar reconstrução de frequência alta de um componente de frequência alta |
EP2226794B1 (en) | 2009-03-06 | 2017-11-08 | Harman Becker Automotive Systems GmbH | Background noise estimation |
CN102169694B (zh) * | 2010-02-26 | 2012-10-17 | 华为技术有限公司 | 生成心理声学模型的方法及装置 |
EP2569767B1 (en) * | 2010-05-11 | 2014-06-11 | Telefonaktiebolaget LM Ericsson (publ) | Method and arrangement for processing of audio signals |
EP2757560B1 (en) * | 2010-07-02 | 2018-02-21 | Dolby International AB | Audio decoding with selective post-filter |
US8738385B2 (en) | 2010-10-20 | 2014-05-27 | Broadcom Corporation | Pitch-based pre-filtering and post-filtering for compression of audio signals |
CA2929800C (en) * | 2010-12-29 | 2017-12-19 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding/decoding for high-frequency bandwidth extension |
MY165853A (en) * | 2011-02-14 | 2018-05-18 | Fraunhofer Ges Forschung | Linear prediction based coding scheme using spectral domain noise shaping |
JP5914527B2 (ja) | 2011-02-14 | 2016-05-11 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 過渡検出及び品質結果を使用してオーディオ信号の一部分を符号化する装置及び方法 |
CN102195288B (zh) * | 2011-05-20 | 2013-10-23 | 西安理工大学 | 一种有源调谐型混合滤波器及进行有源调谐的控制方法 |
US8731911B2 (en) * | 2011-12-09 | 2014-05-20 | Microsoft Corporation | Harmonicity-based single-channel speech quality estimation |
CN103325384A (zh) | 2012-03-23 | 2013-09-25 | 杜比实验室特许公司 | 谐度估计、音频分类、音调确定及噪声估计 |
US9520144B2 (en) * | 2012-03-23 | 2016-12-13 | Dolby Laboratories Licensing Corporation | Determining a harmonicity measure for voice processing |
EP2860729A4 (en) * | 2012-06-04 | 2016-03-02 | Samsung Electronics Co Ltd | METHOD AND DEVICE FOR AUDIO CODING, METHOD AND DEVICE FOR AUDIO DECODING, AND MULTIMEDIA DEVICE EMPLOYING THEM |
DE102014113392B4 (de) | 2014-05-07 | 2022-08-25 | Gizmo Packaging Limited | Verschlussvorrichtung für einen Behälter |
SG11201509526SA (en) * | 2014-07-28 | 2017-04-27 | Fraunhofer Ges Forschung | Apparatus and method for selecting one of a first encoding algorithm and a second encoding algorithm using harmonics reduction |
JP2017122908A (ja) * | 2016-01-06 | 2017-07-13 | ヤマハ株式会社 | 信号処理装置および信号処理方法 |
EP3483883A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
-
2014
- 2014-07-28 EP EP14178810.9A patent/EP2980798A1/en not_active Withdrawn
-
2015
- 2015-07-21 TW TW104123539A patent/TWI591623B/zh active
- 2015-07-27 CN CN201580042675.5A patent/CN106575509B/zh active Active
- 2015-07-27 PL PL15744175T patent/PL3175455T3/pl unknown
- 2015-07-27 MX MX2017001240A patent/MX366278B/es active IP Right Grant
- 2015-07-27 SG SG11201700640XA patent/SG11201700640XA/en unknown
- 2015-07-27 PL PL20200501.3T patent/PL3779983T3/pl unknown
- 2015-07-27 JP JP2017504673A patent/JP6629834B2/ja active Active
- 2015-07-27 CN CN202110519799.5A patent/CN113450810B/zh active Active
- 2015-07-27 ES ES20200501T patent/ES2988064T3/es active Active
- 2015-07-27 PT PT181773722T patent/PT3396669T/pt unknown
- 2015-07-27 KR KR1020177005451A patent/KR102009195B1/ko active Active
- 2015-07-27 ES ES15744175.9T patent/ES2685574T3/es active Active
- 2015-07-27 BR BR112017000348-1A patent/BR112017000348B1/pt active IP Right Grant
- 2015-07-27 PT PT15744175T patent/PT3175455T/pt unknown
- 2015-07-27 EP EP15744175.9A patent/EP3175455B1/en active Active
- 2015-07-27 ES ES18177372T patent/ES2836898T3/es active Active
- 2015-07-27 EP EP20200501.3A patent/EP3779983B1/en active Active
- 2015-07-27 WO PCT/EP2015/067160 patent/WO2016016190A1/en active Application Filing
- 2015-07-27 AU AU2015295519A patent/AU2015295519B2/en active Active
- 2015-07-27 EP EP18177372.2A patent/EP3396669B1/en active Active
- 2015-07-27 RU RU2017105808A patent/RU2691243C2/ru active
- 2015-07-27 CA CA2955127A patent/CA2955127C/en active Active
- 2015-07-27 PL PL18177372T patent/PL3396669T3/pl unknown
- 2015-07-27 MY MYPI2017000031A patent/MY182051A/en unknown
- 2015-07-28 AR ARP150102395A patent/AR101341A1/es active IP Right Grant
-
2017
- 2017-01-20 US US15/411,662 patent/US10083706B2/en active Active
-
2018
- 2018-08-30 US US16/118,316 patent/US10679638B2/en active Active
-
2019
- 2019-12-05 JP JP2019220392A patent/JP7160790B2/ja active Active
-
2020
- 2020-05-27 US US16/885,109 patent/US11581003B2/en active Active
-
2022
- 2022-10-13 JP JP2022164445A patent/JP7568695B2/ja active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7568695B2 (ja) | ハーモニックフィルタツールのハーモニック依存制御 | |
KR101698905B1 (ko) | 정렬된 예견 부를 사용하여 오디오 신호를 인코딩하고 디코딩하기 위한 장치 및 방법 | |
KR101792712B1 (ko) | 주파수 도메인 내의 선형 예측 코딩 기반 코딩을 위한 저주파수 강조 | |
CA2960854C (en) | Noise filling without side information for celp-like coders | |
JP2016535286A (ja) | ハーモニクス低減を使用して第1符号化アルゴリズムと第2符号化アルゴリズムの一方を選択する装置及び方法 | |
KR102426050B1 (ko) | 피치 지연 선택 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170327 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180508 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20180710 |
|
A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A524 Effective date: 20181108 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190402 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20190627 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191002 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191105 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191205 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6629834 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |