JP6099602B2 - Information signal converter using duplicate conversion - Google Patents
Information signal converter using duplicate conversion Download PDFInfo
- Publication number
- JP6099602B2 JP6099602B2 JP2014158475A JP2014158475A JP6099602B2 JP 6099602 B2 JP6099602 B2 JP 6099602B2 JP 2014158475 A JP2014158475 A JP 2014158475A JP 2014158475 A JP2014158475 A JP 2014158475A JP 6099602 B2 JP6099602 B2 JP 6099602B2
- Authority
- JP
- Japan
- Prior art keywords
- information signal
- sampling rate
- conversion
- continuous
- region
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
- G10L19/107—Sparse pulse excitation, e.g. by using algebraic codebook
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/13—Residual excited linear prediction [RELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Processing (AREA)
Description
本発明は重複変換を使用した情報信号変換装置に関し、詳しくは、例えばオーディオ圧縮技術で使用されるようなエイリアシング解消を必要とする情報信号の重複変換を使用した情報信号変換装置に関する。 The present invention relates to an information signal conversion apparatus using overlap conversion, and more particularly to an information signal conversion apparatus using overlap conversion of an information signal that needs to eliminate aliasing as used in, for example, an audio compression technique.
ほとんどの圧縮技術は、特定の種類の情報信号や、最大許容遅延や可能な送信ビットレートというような圧縮データストリームの特定の条件に合うように設計されている。例えば高いビットレートでスピーチではなく音楽を符号化する場合には、オーディオ圧縮に関して、AACのような変換に基づくコーデックの方が、ACELPのような線形予測に基づく時間領域コーデックよりも優れた性能を示す傾向がある。例えばUSACは、様々なオーディオコーディング原理を一つのコーデックに統合することにより、非常に多様な応用場面に対応しようとするものである。しかし、その利点を利用して、例えばより高いコーディング効率を達成するためには、送信ビットレートの変更というような様々なコーディング条件への適応性をさらに上げることが好ましい。 Most compression techniques are designed to meet specific conditions of a particular type of information signal and compressed data stream such as maximum allowable delay and possible transmission bit rate. For example, when encoding music rather than speech at high bit rates, codecs based on transforms such as AAC have better performance than audio time compression based on time domain codecs based on linear prediction such as ACELP. There is a tendency to show. For example, the USAC intends to cope with a wide variety of application scenes by integrating various audio coding principles into one codec. However, in order to achieve higher coding efficiency by using the advantages, it is preferable to further improve adaptability to various coding conditions such as changing the transmission bit rate.
従って、本発明の目標は、重複変換表記を実際の要求に適合させることが可能となるように、エイリアシング解消を必要とする重複変換による情報信号の表記を可能にする情報信号変換装置を提示することにより、このような概念を提供することであり、これにより、より高いコーディング効率を達成することができるであろう。 Accordingly, an object of the present invention is to provide an information signal conversion apparatus that enables information signal notation by duplicate conversion that requires aliasing cancellation so that the duplicate conversion notation can be adapted to actual requirements. By providing such a concept, a higher coding efficiency could be achieved.
この目標は独立請求項の内容によって達成される。 This goal is achieved by the content of the independent claims.
本発明につながる主な思想は以下のようなものである。例えばレートと歪みの比の点で情報信号を効率的に符号化する際にプリステートを形成するために、情報信号の重複変換表記がしばしば使用される。このようなコーデックの例はAACやTCX等である。しかし重複変換表記はまた、変換と再変換を様々なスペクトル分解能で連結させることによりリサンプリングを実行するのに使用され得る。一般的に、情報信号の連続する時間領域のウィンドウバージョンの変換形の個々の再変換形の重複部分でエイリアシングが生じる重複変換表記は、重複変換表記をするために符号化されるべき変換係数レベルの個数が少なくなるという点で有利である。極端な状態では、重複変換は「じっくりとサンプリング」されている。つまり、情報信号の時間サンプルの個数に比較して、重複変換表記の係数の個数は増加しない。重複変換表記の一例は、MDCT(修正離散余弦変換)またはQMF(直交ミラーフィルター)フィルターバンクである。従って、情報信号を効率的に符号化する際に、このような重複変換表記をプリステートとして使用することが好ましい場合がしばしばある。しかし、情報信号が重複変換表記される際のサンプリングレートが、例えば可能な送信ビットレートまたは他の環境条件に適合するように時間変動可能であれば、これもまた好ましい。可能送信ビットレートが変動的であると仮定すると、例えば可能送信ビットレートが所定の閾値よりも下がった場合は常にサンプリングレートを下げることが好ましく、可能送信レートが再び上がった場合には、情報信号を重複変換表記するサンプリングレートが上昇可能であることが好ましい。悪いことに、重複変換表記の再変換の重複エイリアシング部分が、このようなサンプリングレート変更に対して障害を設けており、サンプリングレート変更の場合に重複変換表記を完全に遮断することによってのみ、この障害を打開することが可能であるように思われる。しかし、本発明の発明者たちは上述の問題に対する解決を実現し、これにより、エイリアシングと懸案のサンプリングレート変更を伴う重複変換表記の効率的な使用が可能となる。特に、補間によって、情報信号の先行領域及び/または後続領域が、これらの領域の境界でのサンプリングレート変更に従い、エイリアシング解消部分でリサンプリングされる。そして、結合装置は、エイリアシング解消部分でのリサンプリングにより得られるような先行領域の再変換と後続領域の再変換との境界で、エイリアシング解消を行うことができる。この方法により、サンプリングレート変更/推移時点での重複変換信号の中断を引き起こすことなく、サンプリングレート変更に対して効率的に対処することができる。重複変換を適切に生成するために、変換側での同様の方法も可能である。 The main idea that leads to the present invention is as follows. In order to form a pre-state when encoding an information signal efficiently in terms of, for example, a ratio of rate and distortion, an information signal overlap transform notation is often used. Examples of such codecs are AAC and TCX. However, duplicate transform notation can also be used to perform resampling by concatenating transform and retransform at various spectral resolutions. In general, a duplicate transform notation in which aliasing occurs in the overlapping part of individual retransformed forms of a continuous time domain window version of an information signal is the transform coefficient level to be encoded to represent the duplicate transform notation. This is advantageous in that the number of the is reduced. In extreme situations, duplicate conversions are “sampled carefully”. That is, compared to the number of time samples of the information signal, the number of coefficients in the overlap conversion notation does not increase. An example of an overlap transform notation is MDCT (Modified Discrete Cosine Transform) or QMF (Orthogonal Mirror Filter) filter bank. Therefore, it is often desirable to use such a duplicate transform notation as a pre-state when encoding information signals efficiently. However, this is also preferred if the sampling rate at which the information signal is represented in duplicate conversion can be time-varying, for example to match possible transmission bit rates or other environmental conditions. Assuming that the possible transmission bit rate is variable, it is preferable to reduce the sampling rate whenever the possible transmission bit rate falls below a predetermined threshold, for example, and if the possible transmission rate rises again, the information signal It is preferable that the sampling rate that represents the overlap conversion can be increased. Unfortunately, the duplicate aliasing part of the reconversion of the duplicate conversion notation poses an obstacle to such a sampling rate change, and only by completely blocking the duplicate conversion notation in the case of a sampling rate change. It seems possible to overcome obstacles. However, the inventors of the present invention have realized a solution to the above-mentioned problem, which allows efficient use of duplicate conversion notation with aliasing and pending sampling rate changes. In particular, the preceding region and / or the subsequent region of the information signal are resampled at the aliasing elimination portion according to the sampling rate change at the boundary between these regions by interpolation. The coupling device can cancel aliasing at the boundary between reconversion of the preceding region and reconversion of the subsequent region as obtained by resampling at the aliasing canceling portion. By this method, it is possible to efficiently cope with the sampling rate change without causing the interruption of the duplicate conversion signal at the sampling rate change / transition time. A similar method on the conversion side is also possible in order to properly generate the duplicate conversion.
上述の考えを用いて、オーディオ圧縮技術のような情報信号圧縮技術を提供することが可能であり、これらの技術は、符号化の環境条件の広範囲にわたって、例えば可能転送帯域幅全体にわたって、サンプリングレート変更そのものによる不利益を全く被ることなく、与えられたサンプリングレートをこれらの条件に適合させることにより、高い符号化効率を得ることができるものである。 Using the above considerations, it is possible to provide information signal compression techniques, such as audio compression techniques, which can be sampled over a wide range of encoding environmental conditions, eg, over the entire possible transfer bandwidth. High coding efficiency can be obtained by adapting a given sampling rate to these conditions without incurring any disadvantages due to the change itself.
本発明の利点は、従属請求項に記載の内容である。さらに、本発明の好ましい実施形態を、添付図面を参照し以下に説明する。 Advantages of the invention are the subject-matter of the dependent claims. Further preferred embodiments of the present invention will be described below with reference to the accompanying drawings.
以下に説明する本発明の実施形態の動機付けために、前もって、本願の実施形態が使用でき、以下で述べるような本発明と本願の実施形態の利点を明らかにする実施形態について議論する。 In order to motivate embodiments of the present invention described below, embodiments of the present application can be used in advance, and embodiments that clarify the advantages of the present invention and embodiments of the present application as described below will be discussed.
図1A,1Bは、例えば、以下に説明する実施形態を有利に使用し得る一対のエンコーダとデコーダを示している。図1Aはエンコーダを示し、図1Bはデコーダを示す。図1Aの情報信号エンコーダ10は、情報信号が入力される入力部12と、リサンプラー14と、コアエンコーダ16とを含み、リサンプラー14とコアエンコーダ16は、エンコーダ10の入力部12と出力部18との間で連続的に接続されている。出力部18で、エンコーダ10は入力部12の情報信号を表すデータストリームを出力する。同様に、参照符号20で示された図1Bのデコーダは、コアデコーダ22とリサンプラー24とを含み、コアデコーダ22とリサンプラー24は、図1Bに示されているように、デコーダ20の入力部26と出力部28との間で連続的に接続されている。
1A and 1B show, for example, a pair of encoders and decoders that may advantageously use the embodiments described below. FIG. 1A shows an encoder, and FIG. 1B shows a decoder. 1A includes an
出力部18で出力されたデータストリームをデコーダ20の入力部26に送る際に可能な転送ビットレートが高い場合には、データストリーム内で高サンプリングレートで情報信号12を表すことが符号化効率の点で好ましく、これにより、情報信号のスペクトルの広スペクトル帯域をカバーすることができる。つまり、レート/歪み比尺度のような符号化効率尺度によると、情報信号の低サンプリングレートでの圧縮と比較して、コアエンコーダ16がそれよりも高いサンプリングレートで入力信号12を圧縮する場合には、符号化効率が高くなることが示されている。一方、可能転送ビットレートのうちの低い方のビットレートでは、情報信号12を低サンプリングレートで符号化する際に符号化効率尺度はより高くなり得る。この点に関して、歪みは心理音響的に動機づけられた方法で、つまり、知覚的にあまり関係のない周波数領域(それに対する人間の耳の感度が低い周波数領域)内の歪みよりも、知覚的により関連のある周波数領域内の歪みを集中的に考慮して測定してもよいことに留意すべきである。一般的に、低周波領域は高周波領域よりも知覚的に関連深い傾向があり、従って、低サンプリングレート符号化では、入力部12での信号のナイキスト周波数よりも高い周波数成分は符号化の対象から除外される。しかし、その結果ビットレートの節約を得ることができるので、レート/歪み比の点で、この低サンプリングレート符号化は高サンプリングレート符号化よりも好ましいものとなり得る。低周波部分と高周波部分との間の歪みの重要性に関するこれに類似の矛盾は、測定信号などのような他の情報信号内にも存在する。
When the transfer bit rate that is possible when the data stream output from the
従って、リサンプラー14は情報信号12をサンプリングする際のサンプリングレートを変更するためのものである。とりわけ出力部18と入力部26との間の可能転送ビットレートにより規定されるような外部転送条件に応じてサンプリングレートを適切に制御することにより、外部転送条件が時間と共に変化するにもかかわらず、エンコーダ10は符号化効率を向上させることができる。そして、デコーダ20はデータストリームを展開するコアデコーダ22を含み、また、リサンプラー24は、出力部28で出力される再構築情報信号が再び一定のサンプリングレートを有するように処理する。
Therefore, the
しかし、図1A,1Bのエンコーダ/デコーダ対で重複変換が使用される場合には必ず問題が発生する。再変換の重複領域でエイリアシングが発生する重複変換表記は、効率的な符号化ツールではあるが、時間的エイリアシング解消を必要とするので、サンプリングレート変更の際に問題が発生する。例えば図2A,2Bを参照して下さい。図2A,2Bは、変換符号化タイプのものであると仮定した場合のコアエンコーダ16とコアデコーダ22の可能な実施例を示す。従って、コアエンコーダ16は変換装置30を含み、この後に圧縮装置32が設けられている。図2Bのコアデコーダは展開装置34を含み、この後に今度は再変換装置36が設けられている。図2A,2Bに関して、コアエンコーダ16とコアデコーダ22内には、他に何のモジュールも存在し得ないというように理解すべきではない。例えば、変換装置30の前にフィルターがあってもよく、この場合、変換装置30はリサンプラー14によって与えられたリサンプル情報信号そのままではなく、事前にフィルタリングされた形のものを変換することになる。同様に、再変換装置36の後に、逆変換関数を有するフィルターがあってもよく、この場合、再変換信号は続いて逆フィルタリングされることになる。
However, problems always arise when duplicate transforms are used in the encoder / decoder pairs of FIGS. 1A and 1B. Although the overlap conversion notation in which aliasing occurs in the overlap region of the reconversion is an efficient encoding tool, it requires time aliasing cancellation, which causes a problem when changing the sampling rate. For example, see Figures 2A and 2B. 2A and 2B show possible embodiments of the
圧縮装置32は、変換装置30によって出力された重複変換表記を、ハフマン符号化または算術符号化のような例を含むエントロピーコーディングのようなロスレスコーディングを使用して圧縮し、展開装置34は、再変換装置36へ送られるべき重複変換表記を得るために、例えばハフマン復号または算術復号のようなエントロピーデコーディングにより、まさに逆の処理つまり展開を行う。
The
図2A,2Bに示した変換符号化環境において、リサンプラー14がサンプリングレートを変更するたびに問題が発生する。この問題は、情報信号12が存在する符号化側においてはあまり深刻ではない。従って、変換装置30には、サンプリングレート変更の瞬間を跨いでも、それぞれの領域のウィンドウバージョンを使用したそれぞれの変換のために継続的にサンプリングされた領域が与えられる。変換装置30の可能な実施形態を、図6を参照して以下に説明する。一般的に、変換装置30には情報信号の先行領域のウィンドウバージョンが現在のサンプリングレートで与えられ、その後、リサンプラー14によって、情報信号の次の部分的重複領域が変換装置30に与えられ、そして、情報信号のウィンドウバージョンの変換形が変換装置30によって生成される。必要な時間的エイリアシング解消処理は変換装置30よりもむしろ再変換装置36において行われなければならないので、さらに追加の問題は起こらない。しかし再変換装置36においては、前述のすぐ後に続く領域の再変換形は様々な異なるサンプリングレートに関連するので、再変換装置36は時間的エイリアシング解消を実行することができないという点で、サンプリングレートの変更が問題を発生させる。以下に説明する実施形態はこれらの問題を解決するものである。これらの実施形態によると、再変換装置36は、以下に記載のような情報信号再構築装置に置き代えられてもよい。
In the transform coding environment shown in FIGS. 2A and 2B, a problem occurs every time the
しかし図1A,1Bに関して説明した環境においては、コアエンコーダ16とコアデコーダ22が変換符号化タイプのものである場合にのみ、問題が発生する。より正確には、リサンプラー14と24をそれぞれ形成する重複変換に基づくフィルターバンクを使用した場合にも問題は発生する。例えば図3A,3Bを参照して下さい。図3A,3Bは、リサンプラー14,24を実現するための具体的な一実施形態を示している。図3A,3Bの実施形態によると、どちらのリサンプラーも、解析フィルターバンク38,40とその後に配置された合成フィルターバンク42,44とをそれぞれ連結することにより形成されている。図3A,3Bに示されているように、解析及び合成フィルターバンク38〜44は、QMFフィルターバンク、つまり情報信号を事前に分解し、そして再び信号を結合するためのQMFを使用したMDCTに基づくフィルターバンクとして実施してもよい。このQMFは、10個のブロック重複している(10個は単に一例である)マルチチャンネル変調フィルターバンクを意味するMPEG HE−AACまたはAAC−ELDのSBR部分で使用されているQMFと同様に実施されてもよい。このように、重複変換表記は解析フィルターバンク38,40によって生成され、合成フィルターバンク42,44で、リサンプリングされた信号がこの重複変換表記から再構築される。サンプリングレート変更を可能にするために、合成フィルターバンク42と解析フィルターバンク40は様々な変換長で動作するよう構成されていてもよい。しかし、フィルターバンクまたはQMFのレート、つまり、一方では解析フィルターバンク38,40それぞれによって連続的な変換形が生成され、他方では合成フィルターバンク42,44それぞれによって再変換が行われるレートは一定であり、全ての素子38〜40に関して同じである。変換長の変更は、しかし、サンプリングレートの変更をもたらす。例えば、解析フィルターバンク38と合成フィルターバンク42の対を考えてみる。解析フィルターバンク38は、一定の変換長と一定のフィルターバンクまたは変換レートを使用して動作するものと仮定する。この場合、解析フィルターバンク38によって出力される入力信号の重複変換表記は、入力信号の、連続重複し、一定のサンプル長さを有する領域のそれぞれに関して、それぞれの領域のウィンドウバージョンの変換形を含み、これらの変換形も一定長さを有する。換言すれば、解析フィルターバンク38は一定の時間/周波数分解能のスペクトログラムを合成フィルターバンク42へ送る。しかし、合成フィルターバンクの変換長は変動する。例えば、解析フィルターバンク38の入力部での入力サンプリングレートと合成フィルターバンク42の出力部での信号出力サンプリングレートとの間で、第1のダウンサンプリングレートから第2のダウンサンプリングレートに下げる場合を考える。第1のダウンサンプリングレートが有効である限り、解析フィルターバンク38によって出力された重複変換表記またはスペクトログラムは単に部分的に使用され、合成フィルターバンク42内で再変換をもたらす。合成フィルターバンク42の再変換は、解析フィルターバンク38のスペクトログラム内で連続する変換形の低周波部分に単純に適用される。合成フィルターバンク42の再変換に使用される変換長が短いために、合成フィルターバンク42の再変換形内のサンプル数もまた、それまでフィルターバンク38での変換の対象となっていた重複時間部分でのサンプル数よりも少なく、これにより、解析フィルターバンク38の入力部に入力された情報信号のオリジナルのサンプリングレートに比べて低いサンプリングレートとなる。ダウンサンプリングレートが一定に保たれる限り、合成フィルターバンク42が、連続する再変換形の間の重複部分と、フィルターバンク42の出力部での出力信号の連続重複領域とで、時間的エイリアシング解消を実行することに何の問題もないままなので、何も問題は起こらないだろう。
However, in the environment described with reference to FIGS. 1A and 1B, a problem occurs only when the
ダウンサンプリングレートが第1のダウンサンプリングレートからそれよりも高い第2のダウンサンプリングレートに変更される場合には、常に問題が発生する。この場合、合成フィルターバンク42内の再変換で使用される変換長はさらに縮小され、それにより、このサンプリングレート変更時点よりも後のそれぞれの領域に関しては、さらに低いサンプリングレートとなる。このサンプリングレート変更時点の直前の領域に関する再変換と、このサンプリングレート変更時点の直後にリサンプリングされた領域に関する再変換との間での時間的エイリアシング解消が妨げられるので、ここでも、合成フィルターバンク42にとって問題が発生する。従って、変換長可変の解析フィルターバンク40が変換長一定の合成フィルターバンク44の前に備えられている場合には、デコーディングの側でこのような問題は起こらないという考えは、あまり助けにはならない。ここで、合成フィルターバンク44は、様々な異なる周波数分解能ではない一定のQMF/変換レートのスペクトログラムに、つまり、解析フィルターバンク40から合成フィルターバンク44へ異なるまたは時間変動の変換長ではなく、一定のレートで送られた連続する変換形に適合し、全体変換長の高周波部分を0にして、合成フィルターバンク44の全体変換長の低周波部分を保つ。合成フィルターバンク44の出力部で出力される再構築信号のサンプリングレートは一定のサンプリングレートであるので、合成フィルターバンク44によって出力された連続する再変換形の間の時間的エイリアシング解消は問題ではない。
Problems always arise when the downsampling rate is changed from the first downsampling rate to a higher second downsampling rate. In this case, the conversion length used for the re-conversion in the
このように、ここでも、図1A,1Bに関して上述したようなサンプリングレートの変更/適合を実行しようとする際に問題があるが、これらの問題は、情報信号の再構築装置のための以下に説明する実施形態に従い図3Aの逆フィルターバンクまたは合成フィルターバンク42を実施することにより、克服できる。
Thus, again, there are problems in trying to perform the sampling rate change / adaptation as described above with respect to FIGS. 1A and 1B, but these problems are described below for the information signal reconstruction apparatus. This can be overcome by implementing the inverse or
サンプリングレートの適合/変更に関する上記の考えは、符号化されるべき情報信号の高周波部分がそれに従うパラメトリック手法で(例えば、その信号の低周波部分が変換符号化及び/または予測符号化などを使用して符号化されるスペクトル帯域複製(SBR)を使用して)符号化されるコーディング概念を考慮すると、より興味深くなる。例えば情報信号エンコーダと情報信号デコーダの対を示す図4A,4Bを参照して下さい。エンコーディング側では、コアエンコーダ16が、図3Aに示すように実施されるリサンプラー、つまり解析フィルターバンク38と変換長可変の合成フィルターバンク42の連結によって実施されるリサンプラーの後に続く。上述のように、解析フィルターバンク38の入力と合成フィルターバンク42の出力との間の時間変動ダウンサンプリングレートを達成するために、合成フィルターバンク42は一定領域のスペクトルの一部(合成フィルターバンク42の変換長の時間変動長を有する部分)に対して再変換、つまり、解析フィルターバンク38によって出力された一定長と一定変換レート46の変換を行う。時間変動は両矢印によって示されている。解析フィルターバンク38と合成フィルターバンク42の連結によってリサンプリングされた低周波部分50はコアエンコーダ16によって符号化されるが、残りの部分、つまりスペクトル46の残りの周波数部分である高周波部分52は、パラメトリックエンベロープコーダー54でのエンベロープのパラメトリック符号化の対象とされてもよい。このように、コアデータストリーム56は、パラメトリックエンベロープコーダー54によって出力されたパラメトリック符号化データストリーム58を伴う。
The above idea of adapting / changing the sampling rate is a parametric approach that the high frequency part of the information signal to be encoded follows (for example, the low frequency part of the signal uses transform coding and / or predictive coding, etc. It is more interesting to consider the coding concept encoded using spectral band replication (SBR). For example, see Figures 4A and 4B, which show a pair of information signal encoder and information signal decoder. On the encoding side, the
デコーディング側では、デコーダも同様にコアデコーダ22を含み、この後に、図3Bに示されているようなリサンプラー、つまり、解析フィルターバンク40とそれに続く合成フィルターバンク44から成り、解析フィルターバンク40は、エンコーディング側での合成フィルターバンク42の変換長の時間変動に同期した時間変動変換長を有するリサンプラーが続く。コアデコーダ22はコアデータストリーム56を受信しそれを復号するが、パラメトリックデータストリーム58を受信し、そこから高周波部分52’を導き出し、可変変換長の低周波部分50、つまりエンコーディング側で合成フィルターバンク42によって使用された変換長の時間変動に同期し、コアデコーダ22によって出力されたサンプリングレートの変動に同期した変換長の低周波部分50を完全なものとするために、パラメトリックエンベロープデコーダ60が設置されている。
On the decoding side, the decoder also includes a
図4Aのエンコーダの場合、解析フィルターバンク38が存在していることが利点であり、これにより、リサンプラーの形成のためには単に合成フィルターバンク42を追加するだけでよい。サンプリングレートの切り換えにより、スペクトル46の低周波部分(低周波部分は、単にパラメトリックエンベロープコーディングの対象となる高周波部分と比較して、より正確なコアエンコーディングの対象となる)の割合を適合させることが可能である。特に、この割合は、データストリーム全体を送信するための可能送信帯域幅などのような外部条件に応じて、効率的に制御してもよい。エンコーディング側で制御される時間変動は、例えばそれぞれのサイド情報データによって、デコーディング側に簡単に信号伝達できる。
In the case of the encoder of FIG. 4A, it is an advantage that an
このように、図1A〜4Bは、時間的エイリアシング解消が必要となる重複変換表記を使用しているにもかかわらず、サンプリングレートの変更を事実上可能にする概念を持っていることが好ましいということを示している。図5は、合成フィルターバンク42または図2Bの再変換装置36を実施するために使用される場合には、上述のような問題を克服し、既に述べたようにサンプリングレート変更などの利点を活用することができる情報信号再構築装置の一実施形態を示す。
Thus, it is preferable that FIGS. 1A to 4B have a concept that makes it possible to change the sampling rate practically, even though it uses a duplicate conversion notation that requires elimination of temporal aliasing. It is shown that. FIG. 5 overcomes the above-described problems when used to implement the
図5に示された情報信号再構築装置は再変換装置70とリサンプラー72と結合装置74を含み、これらは、この順番に、情報信号再変換装置80の入力部76と出力部78との間に連続的に接続されている。
The information signal reconstructing device shown in FIG. 5 includes a
図5に示された情報信号再構築装置は、エイリアシング解消を使用して、入力部76で入力された情報信号の重複変換表記から情報信号を再構築するためのものである。つまり、情報信号再構築装置は、入力部76で入力された情報信号の重複変換表記を使用して、出力部78で、時間変動サンプリングレートで情報信号を出力するためのものである。情報信号の重複変換表記は、情報信号のうちの連続する重複時間領域(または時間間隔)のそれぞれに関して、それぞれの領域のウィンドウバージョンの変換形を含む。以下により詳細に説明するように、情報信号再構築装置80は、情報信号90の先行領域84と後続領域86の境界部82で変化するサンプリングレートで情報信号を再構築するよう構成されている。
The information signal reconstructing apparatus shown in FIG. 5 is for reconstructing an information signal from overlapping conversion notation of the information signal input at the
情報信号再構築装置80の個々のモジュール70〜74の機能性を説明するために、入力部76で入力された情報信号の重複変換表記は一定の時間/周波数分解能を有する、つまり時間と周波数に関して分解能は一定であると予め仮定する。以降、別の状況について説明する。
In order to explain the functionality of the
この仮定によると、重複変換表記は図5の92であると考えられる。そこに示されているように、重複変換表記は、ある変換レートΔtで時間的に連続する一連の変換形を含む。各変換形94は、情報信号のそれぞれの時間領域iのウィンドウバージョンの変換形を表す。特に、表記92のための周波数分解能は時間に関して一定であるので、各変換形94は一定個数の変換係数Nkを含む。これは、表記92は、図5に示されているようにス
ペクトル軸kに沿って厳密に並べられていてもよいNk個のスペクトル成分またはサブバ
ンドを含む情報信号のスペクトログラムであることを、事実上示している。それぞれのスペクトル成分またはサブバンドにおいて、スペクトログラム内の変換係数は変換レートΔtで発生する。
According to this assumption, the overlap conversion notation is considered to be 92 in FIG. As shown therein, the overlap conversion notation includes a series of conversion forms that are temporally continuous at a certain conversion rate Δt. Each
このような一定の時間/周波数分解能を有する重複変換表記92は、例えば、図3Aに示されているようなQMF解析フィルターバンクによって出力される。この場合、各変換係数は複素数値となる。つまり、各変換係数は例えば実部と虚部を有することになる。しかし、重複変換表記92の変換係数は、必ずしも複素数値である必要はなく、純粋なMDCTの場合のように、もっぱら実数値であってもよい。これ以外にも、図5の実施形態はまた、時間領域の重複部分でエイリアシングが発生する他の重複変換表記(その変換形94が重複変換表記92内に連続的に配列されるもの)にも適用可能であることに留意すべきである。
Such a
再変換装置70は、各変換形94に関して、連続時間領域84,86に対して各時間エンベロープ96によって示される再変換形を得るために、変換形94に対して再変換を行うよう構成されている。時間エンベロープは、一連の変換形94を生成するために情報信号の前述のような時間領域に適用されるウィンドウに大体相当するものである。先行する時間領域84に関して、図5では、再変換装置70は、重複変換表記92内の領域84に関連する変換形94全体に対して再変換を行ったと仮定している。領域84の再変換形96は、時間領域84全体の時間的長さΔt・a(aは連続する時間領域間の重複部を決定する係数)をサンプリングした例えばNk個のサンプルまたはNkの二倍の個数のサンプルを含む(表記92の変換形94はΔt・aを単位として生成された)。つまり、いずれの場合も、各変換形94を得る元となったウィンドウバージョンを作り上げたのと同じ個数のサンプルを含む。ここで、時間領域84内の時間サンプルの個数と同一の個数(または二倍の個数)と、その時間領域84に属する変換形94内の変換係数の個数は、単に説明のために選択されたものであり、別の実施形態においては、同一(または二倍)は、使用される重複変換の詳細に応じて、両方の数値間の別の一定比に置き代えられてもよい。
ここで、情報信号再構築装置は時間領域84と時間領域86の間で情報信号のサンプリングレートを変更しようとしていることを前提としている。そうすることの動機は外部信号98から生じる。例えば、情報信号再構築装置80が図3A、図4Aの合成フィルターバンク42を実施するために使用される場合、データストリームの転送条件の変更の場合のように、サンプリングレートの変更がより効率的なコーディングを約束する場合には必ず信号98が与えられ得る。
Here, it is assumed that the information signal reconstruction apparatus is changing the sampling rate of the information signal between the
本件の場合、情報信号再構築装置80が時間領域84と86の間でサンプリングレートを下げようとしている前提は、説明のためである。従って、再変換装置70はまた、後続領域86の再変換形100を得るために、この後続領域86のウィンドウバージョンの変換形に対して再変換を行うが、この時、再変換装置70はこの再変換を行うのに短い方の変換長を使用する。より正確には、再変換装置70は、後続領域86の変換に関してだけ、変換係数1…Nk’のうちの最も低い値Nk’への再変換を実行し、これにより得られた再変換形100はより低いサンプリングレートを有することになる。つまり、再変換形100は、Nk(またはNkに相当する割合)の代わりに単にNk’でサンプリングされるこ
とになる。
In this case, the assumption that the information
図5に示されているように、再変換形96と100の間に以下のような問題が起こる。先行領域84の再変換形96と後続領域86の再変換形100は、これらの先行領域84と後続領域86との間の境界部82でのエイリアシング解消部分102で重なる。エイリアシング解消部分の時間的な長さは例えば(a−1)・Δtであるが、このエイリアシング解消部分102内の再変換形96のサンプルの個数は、同じエイリアシング解消部分102内の再変換形100のサンプルの個数とは異なる(この例では、再変換形100のサンプルの個数よりも高くなる)。従って、この時間間隔102で両方の再変換形96と100を重複加算することによる時間的エイリアシング解消は、単純なことではない。
As shown in FIG. 5, the following problem occurs between the reconversion forms 96 and 100. The
従って、リサンプラー72は再構築装置70と結合装置74の間に接続され、結合装置74は時間的エイリアシング解消を実行する。特に、リサンプラー72は、エイリアシング解消部分102における先行領域84の再変換形96及び/または後続領域86の再変換形100を、境界部82でのサンプリングレート変更に従い、補間により、リサンプリングするよう構成されている。再変換形96が再変換形100よりも早くリサンプラー72の入力部に到達するので、リサンプラー72は先行領域84の再変換形96に対するリサンプリングを行うことが好ましい。つまり、補間104により、エイリアシング解消部分102に含まれている再変換形96の部分が、同じエイリアシング解消部分102内の再変換形100のサンプリング条件またはサンプル位置に相当するように、リサンプリングされる。そして、その時間間隔102内で新しいサンプリングレートでの再構築信号90を得るために、結合装置74は、再変換形96のリサンプルバージョンと再変換形100の同一場所のサンプルを単純に加算するだけでもよい。この場合、出力再構築信号は、時間領域86の最初の部分で前のサンプリングレートから新しいサンプリングレートに変換されたものとなる。しかし、再構築信号90におけるサンプリングレート変更に間に合う別のポイント82を得るために、補間はまた、時間間隔102の前半と後半とで違う方法で行われてもよい。このように、瞬間82は図5では領域84と86の重複部分の中間に示されているが、それは単に説明のためであり、他の実施形態においては、この同じ時間的ポイントは、領域86の最初の部分と領域84の最後の部分との間のどちらも含む部分のどこかにあればよい。
Accordingly, the
従って、結合装置74は、エイリアシング解消部分102でのリサンプリングによって得られた先行領域84と後続領域86それぞれの再変換形96と100の間でのエイリアシング解消を実行することができる。より正確には、エイリアシング解消部分102でエイリアシングを解消するために、結合装置74は、リサンプラー72によって得られたリサンプルバージョンを使用して、部分102内の再変換形96と100の重複加算処理を行う。情報信号90のサンプリングレートが時間ポイント82で高いサンプリングレートから低いサンプリングレートに変化しても、この重複加算処理により、変換形94を生成するためのウィンドウ処理に沿って、境界部82を渡っても、エイリアシングフリーで連続的に再構築された情報信号90を出力部78で出力することができる。
Accordingly, the
このように、図5に関する上述の説明から分かるように、先行時間領域84のウィンドウバージョンの変換形94に対して行われた再変換の変換長の、その先行領域84の時間的長さに対する比は、後続時間領域86のウィンドウバージョンに対して行われた再変換の変換長の、その後続領域86の時間的長さに対する比とは、これらの領域84と86との間の境界部82でのサンプリングレート変更に相当する係数分だけ異なっている。上述した例では、この比の変化は外部信号98によって引き起こされたものである。先行領域84と後続領域86の時間的長さは互いに同じであり、再変換装置70は、後続領域86のウィンドウバージョンの変換形94に対する再変換の適用を、例えばNk’番目の変換
係数までの低周波部分に制限するよう構成されたものであるという前提で、説明してきた。もちろん、このような処理は、先行領域84のウィンドウバージョンの変更結果94に対しても可能である。さらに、上述の説明とは対照的に、境界部82でのサンプリングレート変更は逆方向でも可能であり、従って、後続領域86に関しては何の取得も行われず、先行領域84のウィンドウバージョンの変換形94に関してだけ処理が行われてもよい。
Thus, as can be seen from the above description with respect to FIG. 5, the ratio of the transform length of the retransformation performed on the window
より正確には、ここまで、情報信号の領域のウィンドウバージョンの変換形94の変換長と情報信号の領域の時間的長さが一定である場合、つまり、重複変換表記92は一定の時間/周波数分解能を有するスペクトログラムである場合に対する図5の情報信号再構築装置の動作モードを説明してきた。境界部82の位置設定の際に、情報信号再構築装置80は、一例として制御信号98に反応するものとして説明した。
More precisely, so far, when the transform length of the window
従って、この構成において、図5の情報信号再構築装置80は図3Aのリサンプラー14の一部となり得る。換言すれば、図3Aのリサンプラー14は、情報信号の重複変換表記を出力するフィルターバンク38と、今まで説明してきたような情報信号の重複変換表記からエイリアシング解消を使用して情報信号を再構築するよう構成された情報信号再構築装置80を含む逆フィルターバンクとの連結から成る。従って、例えば、図5の再変換装置70はQMF合成フィルターバンクとして構成することができ、フィルターバンク38はQMF解析フィルターバンクとして実施することができる。
Therefore, in this configuration, the information
図1A〜4Aの説明から明らかなように、情報信号エンコーダは、コアエンコーダ16または集隗コアエンコーダ16のような圧縮ステージとパラメトリックエンベロープコーダー54に加えて、このようなリサンプラーを含み得る。圧縮ステージは再構築情報信号を圧縮するよう構成されている。図1A〜4Aに示されているように、このような情報信号エンコーダは、例えば可能転送ビットレートに関する外部情報に応じて制御信号98を制御するよう構成されたサンプリングレートコントローラをさらに含み得る。
As is apparent from the description of FIGS. 1A-4A, the information signal encoder may include such a resampler in addition to a compression stage and
しかし別の例では、図5の情報信号再構築装置は、重複変換表記内で情報信号の領域のウィンドウバージョンの変換長の変化を検出することにより、領域82の位置を特定するよう構成可能である。この可能な実施例をより明確にするために、入力された重複変換表記の一例が示されている図5の92’を参照して下さい。それによると、表記92’内の連続する変換形94は一定の変換レートΔtで再変換装置70に到着するが、それぞれの変換形の変換長は変化している。図5において、例えば、先行時間領域84のウィンドウバージョンの変換形の変換長(Nk)は、後続領域86のウィンドウバージョンの変換形
の変換長(Nk’)よりも大きいと仮定する。ともかく、再変換装置70は入力データストリームから重複変換表記92’に関する情報をパースし、それに従い、再変換装置70は、情報信号の連続領域のウィンドウバージョンの変換形に対して行われる再変換の変換長を、重複変換表記92’の連続する変換形の変換長に適合させてもよい。従って、再変換装置70は先行時間領域84のウィンドウバージョンの変換形94の再変換のために変換長Nkを使用し、後続時間領域86のウィンドウバージョンの変換形の再変換のために
変換長Nk’を使用してもよい。これにより、前述し、図5の上部中央に示されているよ
うな再変換形の間のサンプリングレートの違いが生じる。従って、図5の情報信号再構築装置80の動作モードに関して、この動作モードは、再変換の変換長を重複変換表記92’内の変換形の変換長に適合させる際の今述べたような違いに加えて、上記説明と一致する。
In another example, however, the information signal reconstruction device of FIG. 5 can be configured to identify the location of the
このように、後者の機能性に従えば、情報信号再構築装置は外部制御信号98に反応する必要はない。むしろ、サンプリングレート変更時点に関する情報を情報信号再構築装置に通知するには、入力されてくる重複変換表記92’で十分である。
Thus, according to the latter functionality, the information signal reconstructing device need not react to the
今説明したように動作する情報信号再構築装置80は、図2Bの再変換装置36を形成するために使用できる。つまり、情報信号デコーダは、データストリームから情報信号の重複変換表記92’を再構築するよう構成された展開装置34を含んでいてもよい。前述したように、この再構築はエントロピーデコーディングを伴う。変換形94の時間変動変換長は、展開装置34に入力されるデータストリーム内で適切な方法で信号伝達できる。図5に示されているような情報信号再構築装置は再構築装置36として使用できる。図5の情報信号再構築装置は、展開装置によって与えられたような重複変換表記から、エイリアシング解消を使用して情報信号を再構築するよう構成できる。後者の場合、再変換装置70は、再変換を実行するために、例えばIMDCTを使用することもでき、変換形94は複素数値係数よりもむしろ実数値係数によって表される。
An information
このように、上記の実施形態によると多くの利点が達成できる。例えば毎秒8kbから毎秒128kbに渡るような広い範囲の様々なビットレートで動作するオーディオコーデックに関して、最適なサンプリングレートは、図4A,4Bに関して上述したように、ビットレートに依存する場合もある。低いビットレートでは、低周波だけが、例えばACELPや変換コーディングのような、より正確なコーディング方法で符号化されるべきであり、高周波はパラメトリック方法で符号化されるべきである。高いビットレートでは、スペクトル域全体が例えば正確な方法で符号化される。これは、例えば、これらの正確な方法は常に最適な表記で信号を符号化すべきであることを意味している。これらの信号のサンプリングレートは、ナイキスト原理に準じた最も関連性のある信号周波数成分の変換が可能となるよう、最適化されるべきである。ここで示されているサンプリングレートコントローラ120は、情報信号がコアエンコーダ16に送られる際のサンプリングビットレートを、可能転送ビットレートに応じて制御するよう構成され得る。これは、解析フィルターバンクのスペクトルの低周波部分だけをコアエンコーダ16に送ることを意味している。残りの高周波部分はパラメトリックエンベロープコーダー54に送られる。上述したように、サンプリングレートの時間変動と転送ビットレートは問題ではない。
Thus, many advantages can be achieved according to the above embodiment. For audio codecs that operate at a wide range of bit rates, for example ranging from 8 kb per second to 128 kb per second, the optimal sampling rate may depend on the bit rate, as described above with respect to FIGS. 4A and 4B. At low bit rates, only low frequencies should be encoded with more accurate coding methods, such as ACELP and transform coding, and high frequencies should be encoded with parametric methods. At high bit rates, the entire spectral range is encoded, for example, in an accurate manner. This means, for example, that these exact methods should always encode the signal with an optimal notation. The sampling rate of these signals should be optimized so that the most relevant signal frequency components can be converted according to the Nyquist principle. The
図5の説明は、サンプリングレート変更時に時間的エイリアシング解消の問題に対処するために使用できる情報信号再構築装置に関するものである。また、図1A〜図4Bに関して前述したように、変換器が重複変換表記を生成し、そして図5の情報信号再構築装置にそれを送る図1A〜4Bの装置内で、連続するモジュール間のインターフェースで何らかの対策が行われなければならない。 The description of FIG. 5 relates to an information signal reconstruction device that can be used to address the problem of resolution of temporal aliasing when changing the sampling rate. Also, as described above with respect to FIGS. 1A-4B, between the successive modules in the apparatus of FIGS. 1A-4B, where the converter generates a duplicate conversion notation and sends it to the information signal reconstruction apparatus of FIG. Some measures must be taken at the interface.
図6は情報信号変換装置のこのような一実施形態を示す。図6の情報信号変換装置は、一連のサンプルという形態で情報信号を受け取る入力部105と、情報信号の連続重複領域を取得するよう構成された取込み器106と、各連続重複領域が一定のサンプリングレートを有するように(しかし連続重複領域の間ではサンプリングレートは異なっている)、連続重複領域の少なくとも一部に対してリサンプリングを行うよう構成されたリサンプラー107と、連続重複領域に対してウィンドウ処理を行うよう構成されたウィンドウ処理部108と、図6の情報信号変換器の出力部110で出力される重複変換表記92’を構成する一連の変換形94を得るために、ウィンドウ処理された部分に対して個々に変換を行うよう構成された変換器を含む。ウィンドウ処理部108はハフマンウィンドウ等を使用してもよい。
FIG. 6 shows such an embodiment of the information signal converter. The information signal conversion apparatus of FIG. 6 includes an
取込み器106は、情報信号の連続重複領域が同じ時間的長さを有するように、例えばそれぞれ20msとなるように、取込みを行う。
The take-in
取込み器106は一連の情報信号部分をリサンプラー107に送る。入力情報信号が所定の瞬間に第1のサンプリングレートから第2のサンプリングレートに変わる時間変動サンプリングレートであると仮定すると、例えば、リサンプラー107は、図6の111で示されているように、サンプリングレートが第1のサンプリングレートから第2のサンプリングレートに一度変化するように時間的に所定の時点を含む入力されてくる情報信号部分を補間によってリサンプルするよう構成されていてもよい。これをより明確にするために、図6は、サンプリングレートが瞬間113で変わる一連のサンプル112を説明的に示しており、一例として、一定の時間的長さを有する領域114a〜114dが一定の領域オフセット115Δtで取り込まれる。この領域オフセット115Δtは、一定の領域時間的長さと共に、連続領域114a〜114dの間の所定の重複部分を例えば連続する二つの領域ごとに50%の重複となるように規定する。しかし、これは単に一例にすぎない。この瞬間113より前の第1のサンプリングレートはδt1で示され、この瞬間11
3より後のサンプリングレートはδt2で示されている。111で示されているように、リサンプラー107は、例えば、領域114bを一定のサンプリングレートδt1を有するようリサンプリングするが、時間的後続領域114cに対しては、一定のサンプリングレートδt2を有するようにリサンプリングするよう構成されていてもよい。原則的に、リサンプラー107が、時間的に瞬間113を含むそれぞれの領域114b,114cの一部分を補間によってリサンプリングすれば十分であり、それがまだ目標サンプリングレートでなくても構わない。例えば領域114bの場合、リサンプラー107が、領域114bの時間的に瞬間113より後の部分をリサンプリングし、114cの場合には、瞬間113より前の部分だけをリサンプリングすれば十分である。その場合、取り込まれた領域114a〜114dは一定の時間的長さであるので、リサンプリングされた各領域は、それぞれの一定サンプリングレートδt1,δt2に対応した個数の時間サンプルN1,N2を有する。ウィンドウ処理部108は、そのウィンドウまたはウィンドウ長さを各入力部でのこのサンプルの個数に適合させてもよい。同じことが変換器109にも当てはまり、変換器109もその変換長または変換を同じように適合させてもよい。つまり、図6の111で示されている例では、出力部110での重複変換表記は一連の変換形から成り、変換形の長さはそれぞれ異なり、連続領域のサンプルの個数に対して一次従属的に、つまりそれぞれの領域に対して行ったリサンプリングの際のサンプリングレートに対して一次従属的に増加減少する。
The
The sampling rate after 3 is denoted by δt 2 . As shown at 111, the
リサンプラー107は、それぞれの連続領域114a〜114d内のリサンプリングされるべきサンプル個数が最小となるように、これらの連続領域114a〜114dの間のサンプリングレート変更を記録するよう構成されていてもよい。あるいは、リサンプラー107はこれとは異なるように構成されていてもよい。例えば、リサンプラー107はダウンサンプリングよりもアップサンプリングを選択するまたはその逆であるように構成されていてもよく、つまり、瞬間113と重なる全ての領域が第1のサンプリングレートδt1または第2のサンプリングレートδt2でリサンプリングされるように、リサンプリングを実行するよう構成されていてもよい。
The
図6の情報信号変換装置は、例えば図2Aの変換装置30を実施するのに使用してもよい。その場合、例えば変換器109はMDCTを実行するよう構成されていてもよい。
The information signal converter of FIG. 6 may be used, for example, to implement the
これに関して、変換器109によって行われる変換の変換長は、リサンプリングされたサンプルの個数で測定した領域114cのサイズよりも大きくてもよいことに留意すべきである。その場合、ウィンドウ処理部108から出力されたウィンドウ領域を超える変換長の部分は、変換器109による変換を行う前に0にセットされてもよい。
In this regard, it should be noted that the transform length of the transform performed by the
図5の補間104と図6のリサンプラー107内での補間を実現するための可能な実施例を詳細に説明する前に、図1A,1Bのエンコーダとデコーダの可能な実施形態を示す図7A,7Bを参照して下さい。特に、リサンプラー14,24は図3A,3Bに示されているように実施されているが、コアエンコーダ16とコアデコーダ22は、それぞれ、MDCTに基づく変換コーディングとACELPコーディングのようなCELPコーディングとの間で切り換え可能なコーデックとして実施されている。MDCTに基づくコーディング/デコーディングブランチ122,124は、それぞれ、例えばTCXエンコーダとTCXデコーダであってもよい。あるいは、AACコーダー/デコーダ対が使用されてもよい。CELPコーディングのために、ACELPエンコーダ126がコアエンコーダ16の他方のコーディングブランチとなり、ACELPデコーダ128がコアデコーダ22の他方のデコーディングブランチとなっていてもよい。これら両方のコーディングブランチ間での切り換えは、これらのコーディングモジュールの詳細についてその標準テキストに記載しているUSAC[2]またはAMR−WB+[1]の場合のように、フレーム毎に行われ得る。
Before describing in detail a possible implementation for implementing interpolation in the
図7A,7Bのエンコーダとデコーダをさらに詳しい具体例として考え、コーディングブランチ122,126への入力とデコーディングブランチ124,128による再構築のために内部サンプリングレートの切り換えを可能にするスキームを、以下に詳細に説明する。特に、入力部12での入力信号の入力は、例えば32kHzという一定のサンプリングレートであってもよい。この信号は、上述のような方法でQMF解析/合成フィルターバンク対38,42を使用して、すなわち、帯域数に関して1.25または2.5というような適切な解析及び合成比でリサンプリングされてもよく、これは、例えば25.6kHzまたは12.8kHzの専用サンプリングレートを有するコアデコーダ16に入力してくる内部時間信号となる。そして、ダウンサンプリングされた信号は、コーディングブランチのうちのコーディングモードに応じたものを使用して符号化される。コーディングブランチ122では、MDCT表記及び標準的な変換コーディングスキームを使用して符号化され、または、コーディングブランチ126ではACELPを使用して時間領域で符号化される。コアエンコーダ16のコーディングブランチ126,122によってこのように生成されたデータストリームは出力され、デコーディング側に送られ、そこで再構築される。
Considering the encoder and decoder of FIGS. 7A and 7B as a more specific example, a scheme that allows switching of the internal sampling rate for input to the
内部サンプリングレートを切り換えるために、フィルターバンク38,44は、コアエンコーダ16とコアデコーダ22が動作するであろう内部サンプリングレートに従い、フレーム毎に適合されなければならない。図8は考えられるいくつかの切り換え場面を示しているが、ここでは、単にエンコーダとデコーダのMDCTコーディングの道筋を示しているだけである。
In order to switch the internal sampling rate, the
特に、図8は、32kHzであると想定されている入力サンプリングレートが25.6kHz、12.8kHz、8kHzのいずれかにダウンサンプリングされるか、その入力サンプリングレートが維持される可能性があることを示している。入力サンプリングレートと内部サンプリングレートとの間の選択されたサンプリングレート比に応じて、フィルターバンク解析とフィルターバンク合成との間の変換長の比が決まる。これらの比は図8の影付きの部分(フィルターバンク38,44では、選択された内部サンプリングレートとは関係なく、それぞれ40個のサブバンド、フィルターバンク42,40では、選択された内部サンプリングレートに応じて、それぞれ40個、32個、16個または10個のサブバンド)から導き出すことができる。コアエンコーダ内で使用されるMDCTの変換長はこのように決定された内部サンプリングレートに適合され、結果的に変換レートまたは変換ピッチ時間間隔が一定または選択された内部サンプリングレートとは無関係となるように適合される。これは例えば常に20msであってもよく、その結果、選択された内部サンプリングレートに応じて、それぞれ640、512、256、160の変換長となる。
In particular, FIG. 8 shows that the input sampling rate assumed to be 32 kHz may be downsampled to either 25.6 kHz, 12.8 kHz, or 8 kHz, or the input sampling rate may be maintained. Is shown. Depending on the selected sampling rate ratio between the input sampling rate and the internal sampling rate, the ratio of transform lengths between filter bank analysis and filter bank synthesis is determined. These ratios are shaded in FIG. 8 (in the
上述のような原理を使用して、フィルターバンク切り換えに関する以下の規制に従い、内部サンプリングレートを切り換えることができる。
−切り換えの間にいかなる遅延も追加されない。
−この切り換えつまりサンプリングレート変更は瞬時に行われる。
−切り換えアーチファクトは最低限に抑えられるかまたは少なくとも低減される。
−計算量が小さい。
Using the principle as described above, the internal sampling rate can be switched according to the following regulations regarding filter bank switching.
-No delay is added during switching.
-This switching or sampling rate change is instantaneous.
-Switching artifacts are minimized or at least reduced.
-The amount of calculation is small.
基本的に、フィルターバンク38〜44とコアコーダー内のMDCTは、フィルターバンクにおいて、コアエンコーダとデコーダのMDCTと比較して、ウィンドウ領域の重複度が高くてもよい重複変換である。例えば、フィルターバンクにおいて10回の重複が適用されてもよく、MDCT122,124において2回の重複が適用されてもよい。重複変換のために、ステートバッファが、解析フィルターバンクとMDCTのための解析ウィンドウバッファとして、また合成フィルターバンクとIMDCTのための重複加算バッファとして説明できる。レート切り換えの際に、これらのステートバッファは、図5,6に関して上述したような方法で、サンプリングレートの切り換えに応じて調整されるべきである。以下に、図5に関して説明した合成側よりもむしろ、図6に関して説明した解析側でも実行され得る補間に関して、以下に詳細に説明する。重複変換のプロトタイプまたはウィンドウが適合されてもよい。切り換えアーチファクトを低減するには、重複変換部のエイリアシング解消特性を保持するためにステートバッファ内の信号成分を保存すべきである。
Basically, the MDCTs in the
以下に、リサンプラー72内での補間104の実行方法について詳細に説明する。
Hereinafter, a method for executing the
以下のように2種類の場合に区分できる。
1)スイッチアップは、先行時間部分84から後続時間部分86へサンプリングレートが増加される処理である。
2)スイッチダウンは、先行時間部分84から後続時間部分86へサンプリングレートが減少される処理である。
It can be divided into two cases as follows.
1) Switch-up is a process in which the sampling rate is increased from the
2) Switch down is a process in which the sampling rate is reduced from the
例えば12.8kHz(20msごとに256個のサンプル)から32kHz(20msごとに640個のサンプル)へのようなスイッチアップを想定すると、図5に参照符号130で示されているようなリサンプラー72のステートバッファまたはその容量は、サンプリングレート変更に相当する係数(上述の例では2.5)分だけ拡張される必要がある。追加遅延を発生させない拡張のための可能な方法は、例えば、線形補間またはスプライン補間である。つまり、リサンプラー72は、先行時間領域84に関する再変換形96の後部の(時間間隔102に存在するような)サンプルを、ステートバッファ130内ですぐに補間してもよい。ステートバッファは、図5に示されているように、先入れ先出しバッファとして機能してもよい。当然、完全なエイリアシング解消のために必要な全ての周波数成分がこの処理によって得られるわけではないが、例えば0〜6.4kHzのような少なくとも低周波域が何の歪みもなく生成可能であり、これらの周波数は心理音響的な点で最も関連深いものである。
For example, assuming a switch-up from 12.8 kHz (256 samples every 20 ms) to 32 kHz (640 samples every 20 ms), a
低いサンプリングレートへのスイッチダウンの場合には、線形またはスプライン補間は、また、追加遅延を発生させずにステートバッファを縮小するためにも使用できる。つまり、リサンプラー72は補間によりサンプリングレートを減少させてもよい。しかし、大きい縮小係数でのサンプリングレートへのスイッチダウン、例えば32kHz(20msごとに640個のサンプル)から12.8kHz(20msごとに256個のサンプル)への切り換え(この場合、縮小係数は2.5)は、高周波成分が除去されなければエイリアシング解消をひどく妨害する可能性がある。合成フィルタリングがこの現象に対処してもよく、この合成フィルタリングでは、フィルターバンクまたは再変換装置を「フラッシュ」することにより、高周波成分を除去することができる。これは、切り換えの瞬間にフィルターバンクが少ない周波数成分を合成し、従って、重複加算バッファから高スペクトル成分を取り除いてきれいにすることを意味している。より正確には、先行時間領域84のための第1のサンプリングレートから後続時間領域86のための第2のサンプリングレートへのスイッチダウンを想像して下さい。上記説明から離れて、再変換装置70は、先行時間領域84のウィンドウバージョンの変換形94の周波数成分の全てを再変換の対象とするわけではなく、そうすることによりスイッチダウンに備えるよう構成されている。むしろ、再変換装置70は、変換形94のあまり関係のない高周波成分を例えば0にセットすることにより、あるいは、これらの高周波成分を次第に減衰させるなどしてそれらの再変換に対する影響を減じることで、高周波成分を再変換から除外してもよい。例えば、この処理の対象となる高周波成分は、周波数成分Nk’よりも高いものであってもよい。
従って、結果的に生じた情報信号内では、時間領域84は、意図的に入力部76で入力された重複変換表記で入手可能であった帯域幅よりも低いスペクトル帯域で再構築されたものとなる。しかし、補間処理104にもかかわらず、高周波部分を気付かずに結合装置74内でのエイリアシング解消処理に導入した場合に重複加算処理で起こるであろうエイリアシング問題を避けることができる。
In the case of a switch down to a lower sampling rate, linear or spline interpolation can also be used to shrink the state buffer without incurring additional delay. That is, the
Therefore, in the resulting information signal, the
別の例として、高サンプリングレート表記からの切り換えのために適当なステートバッファ内で使用できるように、さらに低サンプリングレート表記も同時に生成可能である。これにより、デシメーション係数(デシメーションが必要な場合)が常に比較的低く(つまり2より小さく)保たれ、妨害となるようなアーチファクトがエイリアシングから起こることはない。前述したように、これが全ての周波数成分を維持するわけではないが、少なくとも、心理音響的に関連のある低周波を維持することになる。 As another example, a lower sampling rate notation can be generated simultaneously so that it can be used in a suitable state buffer for switching from a higher sampling rate notation. This keeps the decimation factor (if decimation is necessary) always relatively low (i.e. less than 2) and no disturbing artifacts arise from aliasing. As described above, this does not maintain all frequency components, but at least maintains a psychoacoustically relevant low frequency.
従って、特定の実施形態によれば、USACの低遅延型を得るために、以下の方法でUSACコーデックを修正することができる。最初に、TCXコーディングモードとACELPコーディングモードのみが許可される。AACモードは回避できる。20msのフレーミングを得るために、そのフレーム長を選択できる。そして、動作モード(超広帯域(SWB)、広帯域(WB)、狭帯域(NB)または全帯域幅)とビットレートに応じて、以下のようなシステムパラメータが選択可能である。システムパラメータの概略を以下の表1に示す。 Thus, according to a particular embodiment, the USAC codec can be modified in the following manner to obtain a low latency version of USAC. Initially, only TCX coding mode and ACELP coding mode are allowed. AAC mode can be avoided. The frame length can be selected to obtain 20 ms framing. Then, the following system parameters can be selected according to the operation mode (ultra-wide band (SWB), wide band (WB), narrow band (NB) or full bandwidth) and the bit rate. A summary of the system parameters is shown in Table 1 below.
狭帯域(NB)モードに関して、サンプリングレートの増加を避けることができ、内部サンプリングレートを入力サンプリングレートと等しくなるように、つまり8kHzにセットし、それに応じたフレーム長つまりサンプル数160のフレーム長を選択することにより、元に戻すことができる。同様に、広帯域(WB)動作モードの場合には、16kHzを選択し、TCXのためのMDCTのフレーム長を、サンプル数256ではなく、320とすることができる。 For narrowband (NB) mode, an increase in sampling rate can be avoided, the internal sampling rate is set equal to the input sampling rate, ie 8 kHz, and the corresponding frame length, ie the frame length of 160 samples, is set. By selecting, it can be restored. Similarly, in the wideband (WB) mode of operation, 16 kHz may be selected and the MDCT frame length for TCX may be 320 instead of 256 samples.
特に、動作ポイントのリスト全体を通して、つまりサポートされているサンプリングレート、ビットレート及び帯域幅を通して変更動作を支えることができる。以下の表2に、USACコーデックの予想低遅延型の内部サンプリングレートに関する様々な構成を示す。 In particular, the change operation can be supported throughout the list of operation points, i.e. through supported sampling rates, bit rates and bandwidths. Table 2 below shows various configurations for the expected low-latency internal sampling rate of the USAC codec.
サイド情報として、図2A,2Bのリサンプラーを使用する必要はないことに留意すべきである。入力サンプリングレートから専用のコアサンプリング周波数へのリサンプリング機能を負うために、代わりにIIRフィルターセットを設けることができる。これらのIIRフィルター遅延は0.5ms未満であるが、入力周波数と出力周波数との間の比が半端なものであるので、その複雑さは相当なものである。全てのIIRフィルターに関して遅延が同じであると仮定すると、違うサンプリングレート間での変更が可能となる。 It should be noted that it is not necessary to use the resampler of FIGS. 2A and 2B as side information. To take the resampling function from the input sampling rate to a dedicated core sampling frequency, an IIR filter set can be provided instead. These IIR filter delays are less than 0.5 ms, but the complexity is considerable because the ratio between the input frequency and the output frequency is odd. Assuming that the delay is the same for all IIR filters, it is possible to change between different sampling rates.
従って、図2A,2Bのリサンプラーの実施例を使用することが好ましい。パラメトリックエンベロープモジュール(つまりSBR)のQMFフィルターバンクが、上述したようなリサンプリング機能を実現するための共同作業に加わってもよい。SWBの場合、このことは、SBRエンコーダモジュールにより既に解析ステージが実現されている一方で、合成フィルターバンクステージをエンコーダに付加することになる。デコーダ側では、SBRが使用可能である場合にQMFがアップサンプリング機能を既に負っている。このスキームは他の全ての帯域幅モードにおいても使用可能である。以下の表3に、必要なQMF構成の概略を示す。 Therefore, it is preferred to use the resampler embodiment of FIGS. 2A and 2B. A parametric envelope module (ie, SBR) QMF filter bank may participate in collaborative work to implement the resampling function as described above. In the case of SWB, this means that an analysis stage has already been realized by the SBR encoder module while a synthesis filter bank stage is added to the encoder. On the decoder side, the QMF already has an upsampling function when SBR is available. This scheme can also be used in all other bandwidth modes. Table 3 below outlines the required QMF configuration.
入力サンプリング周波数が一定であると仮定すると、QMF合成プロトタイプを変えることにより、内部サンプリングレート間での変更が可能となる。デコーダ側には逆の動作が適用できる。QMF帯域の帯域幅は動作ポイントの全域を通して同じであることに留意すべきである。 Assuming that the input sampling frequency is constant, changing between internal sampling rates is possible by changing the QMF synthesis prototype. The reverse operation can be applied to the decoder side. It should be noted that the bandwidth of the QMF band is the same throughout the operating point.
本発明のいくつかの態様を装置に関して説明してきたが、これらの態様はまたこれらに相当する方法の説明でもあり、ブロックや装置は方法ステップや方法ステップの特徴に対応する。同様に、方法ステップに関して説明した態様はまた、これらに相当するブロックやアイテムまたはこれらに相当する装置の特徴の説明でもある。これらの方法ステップのうちのいくつかまたは全てが、例えばマイクロプロセッサ、プログラム制御可能なコンピュータや電子回路のようなハードウェア装置により(またはそれを使用して)実施してもよい。いくつかの実施形態において、最も重要な方法ステップのうちの一つまたはそれ以上のものが、このような装置によって実行されてもよい。 Although some aspects of the present invention have been described with respect to apparatus, these aspects are also descriptions of corresponding methods, where blocks and apparatus correspond to method steps and features of method steps. Similarly, the aspects described with respect to the method steps are also descriptions of the corresponding blocks and items or the features of the apparatus corresponding thereto. Some or all of these method steps may be performed by (or using) a hardware device such as, for example, a microprocessor, programmable computer or electronic circuit. In some embodiments, one or more of the most important method steps may be performed by such an apparatus.
実施条件に応じて、本発明の実施形態はハードウェアまたはソフトウェアで実現可能である。これは、例えばフロッピーディスク、DVD、ブルーレイ、CD、ROM、PROM、EPROM、EEPROMやFLASHメモリーなどの、電子読み取り制御可能な信号が中に保存されたデジタル記憶媒体を使用して実施することができ、これらの電子読み取り制御可能な信号は、それぞれの方法が実行できるように、プログラム可能なコンピュータシステムと協働する(または協働可能である)。従って、このようなデジタル記憶媒体はコンピュータ読み取り可能なものであってもよい。 Depending on implementation conditions, embodiments of the present invention can be implemented in hardware or software. This can be done using a digital storage medium in which signals that can be read electronically are stored, such as floppy disk, DVD, Blu-ray, CD, ROM, PROM, EPROM, EEPROM or FLASH memory. These electronic reading controllable signals cooperate (or can cooperate) with a programmable computer system so that the respective methods can be performed. Accordingly, such digital storage media may be computer readable.
本発明のいくつかの実施形態は、電子読み取り制御可能な信号を有するデータキャリアを含み、これらの電子読み取り制御可能な信号は、ここで説明した方法のうちの一つを実行できるように、プログラム可能なコンピュータシステムと協働可能である。 Some embodiments of the present invention include a data carrier having electronic read controllable signals that can be programmed to perform one of the methods described herein. Can collaborate with possible computer systems.
一般的に、本発明の実施形態は、プログラムコードを備えたコンピュータプログラム製品として実施でき、このプログラム製品がコンピュータで動作した際、このプログラムコードは前述の方法のうちの一つを実行するためのものである。このようなプログラムコードは、例えば機械読み取り可能なキャリアに保存されていてもよい。 In general, embodiments of the present invention can be implemented as a computer program product with program code, which when run on a computer, the program code performs one of the methods described above. Is. Such a program code may be stored on a machine-readable carrier, for example.
他の実施形態は、ここで説明した方法のうちの一つを実行するためのものであり、機械読み取り可能なキャリアに保存されているコンピュータプログラムを含む。 Another embodiment is for performing one of the methods described herein and includes a computer program stored on a machine readable carrier.
換言すれば、本発明の方法の一実施形態は、従って、コンピュータで動作した際、前述の方法のうちの一つを実行するためのプログラムコードを有するコンピュータプログラムである。 In other words, one embodiment of the method of the present invention is therefore a computer program having program code for performing one of the aforementioned methods when run on a computer.
本発明の方法の別の実施形態は、従って、前述の方法のうちの一つを実行するためのコンピュータプログラムを格納しているデータキャリア(またはデジタル媒体またはコンピュータ読み取り可能な媒体)である。 Another embodiment of the method of the present invention is therefore a data carrier (or digital or computer readable medium) that stores a computer program for performing one of the aforementioned methods.
本発明の方法の別の実施形態は、ここで説明した方法のうちの一つを実行するためのコンピュータプログラムを表すデータストリームまたは一連の信号である。このデータストリームまたは一連の信号は、例えばインターネットのようなデータ通信接続を介して送信されるように構成されていてもよい。 Another embodiment of the method of the present invention is a data stream or a series of signals representing a computer program for performing one of the methods described herein. This data stream or series of signals may be configured to be transmitted over a data communication connection, such as the Internet.
さらに別の実施形態は、ここで説明した方法のうちの一つを実行するように構成された、例えばコンピュータやプログラム可能な論理装置のような処理手段を含む。 Yet another embodiment includes a processing means, such as a computer or programmable logic device, configured to perform one of the methods described herein.
本発明のさらに別の実施形態は、ここで説明した方法のうちの一つを実行するためのコンピュータプログラムがインストールされているコンピュータを含む。 Yet another embodiment of the invention includes a computer having a computer program installed for performing one of the methods described herein.
本発明の別の実施形態は、ここで説明した方法のうちの一つを実行するためのコンピュータプログラムを受信機に転送する(例えば電子的にまたは光学的に)よう構成された装置またはシステムを含む。 Another embodiment of the present invention provides an apparatus or system configured to transfer (eg, electronically or optically) a computer program for performing one of the methods described herein to a receiver. Including.
いくつかの実施形態において、ここで説明した方法の機能性のうちのいくつかまたは全てを実行するために、プログラム可能な論理装置(例えばフィールドプログラマブルゲートアレイ)を使用してもよい。いくつかの実施形態において、ここで説明した方法のうちの一つを実行するために、フィールドプログラマブルゲートアレイがマイクロプロセッサと協働してもよい。一般的に、これらの方法は何らかのハードウェア装置によって実行されることが好ましい。 In some embodiments, programmable logic devices (eg, field programmable gate arrays) may be used to perform some or all of the functionality of the methods described herein. In some embodiments, a field programmable gate array may cooperate with a microprocessor to perform one of the methods described herein. In general, these methods are preferably performed by some hardware device.
上述の実施形態は単に本発明の原理を説明しているにすぎない。ここで説明した配置や詳細に関して様々な修正や変更が当業者には明らかであろう。従って、本発明は以下の特許請求項の範囲によってのみ制限され、上述の実施形態で示された詳細によっては制限されない。 The above-described embodiments are merely illustrative of the principles of the invention. Various modifications and changes to the arrangements and details described herein will be apparent to those skilled in the art. Accordingly, the invention is limited only by the scope of the following claims and not by the details shown in the above-described embodiments.
Claims (6)
一連のサンプルという形態で情報信号を受け取る入力部(105)と、
情報信号の連続重複領域を取得するよう構成された取込み器(106)と、
各連続重複領域が一定のサンプリングレートを有するが、連続重複領域の間ではサンプリングレートは異なるように、連続重複領域の少なくとも一部に対して補間によりリサンプリングを行うよう構成されたリサンプラー(107)と、
情報信号の連続重複領域に対してウィンドウ処理を行うよう構成されたウィンドウ処理部(108)と、
ウィンドウ処理された領域に対して個々に変換を行うよう構成された変換器(109)を含み、
取込み器(106)は、情報信号の連続重複領域は時間的に一定の長さであるように、情報信号の連続重複領域の取り込みを行うよう構成されている。 An information signal conversion device configured to generate an overlap conversion representation of an information signal using aliasing occurrence overlap conversion,
An input unit (105) for receiving an information signal in the form of a series of samples;
A grabber (106) configured to obtain a continuous overlap region of the information signal;
A resampler (107) configured to perform resampling by interpolation on at least a part of the continuous overlapping regions so that each continuous overlapping region has a constant sampling rate, but the sampling rate is different between the continuous overlapping regions. )When,
A window processing unit (108) configured to perform window processing on a continuous overlapping region of information signals;
Converter configured to perform individually transform to windowed region (109) seen including,
The capture unit (106) is configured to capture the continuous overlap region of the information signal so that the continuous overlap region of the information signal has a certain length in time.
一連のサンプルは、所定の瞬間(113)に第1のサンプリングレートから第2のサンプリングレートに変わる変動サンプリングレートを有し、
リサンプラー(107)は、連続重複領域の一定のサンプリングレートは第1のサンプリングレートから第2のサンプリングレートへ一度だけ変化するように、所定の瞬間に重複している連続重複領域(114b,c)に対してリサンプリングを行うよう構成されている。 The information signal conversion device according to claim 1 or 2 ,
The series of samples has a variable sampling rate that changes from a first sampling rate to a second sampling rate at a predetermined instant (113);
The resampler (107) is configured so that the continuous overlapping region (114b, c) overlapping at a predetermined moment is such that the constant sampling rate of the continuous overlapping region changes only once from the first sampling rate to the second sampling rate. ) For resampling.
一連のサンプルという形態で情報信号を受け取ることと、
情報信号の連続重複領域を取得することと、
各連続重複領域が一定のサンプリングレートを有するが、連続重複領域の間ではサンプリングレートは異なるように、連続重複領域の少なくとも一部に対して補間によりリサンプリングを行うことと、
情報信号の連続重複領域に対してウィンドウ処理を行うことと、
ウィンドウ処理された領域に対して個々に変換を行うことを含み、
連続重複領域の取得では、情報信号の連続重複領域は時間的に一定の長さであるように、情報信号の連続重複領域の取り込みを行う。 A method for generating a double conversion representation of an information signal using aliasing generation double conversion,
Receiving an information signal in the form of a series of samples;
Obtaining a continuous overlap region of information signals;
Resampling by interpolation on at least a portion of the continuous overlap areas so that each continuous overlap area has a constant sampling rate, but the sampling rate is different between the continuous overlap areas;
Performing window processing on continuous overlapping areas of information signals;
It looks including that performed individually transform to windowed area,
In the acquisition of the continuous overlapping area, the continuous overlapping area of the information signal is captured so that the continuous overlapping area of the information signal has a certain length in time.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161442632P | 2011-02-14 | 2011-02-14 | |
US61/442,632 | 2011-02-14 | ||
PCT/EP2012/052458 WO2012110478A1 (en) | 2011-02-14 | 2012-02-14 | Information signal representation using lapped transform |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013519117A Division JP5712288B2 (en) | 2011-02-14 | 2012-02-14 | Information signal notation using duplicate conversion |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014240973A JP2014240973A (en) | 2014-12-25 |
JP6099602B2 true JP6099602B2 (en) | 2017-03-22 |
Family
ID=71943597
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013519117A Active JP5712288B2 (en) | 2011-02-14 | 2012-02-14 | Information signal notation using duplicate conversion |
JP2014158475A Active JP6099602B2 (en) | 2011-02-14 | 2014-08-04 | Information signal converter using duplicate conversion |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013519117A Active JP5712288B2 (en) | 2011-02-14 | 2012-02-14 | Information signal notation using duplicate conversion |
Country Status (18)
Country | Link |
---|---|
US (1) | US9536530B2 (en) |
EP (1) | EP2550653B1 (en) |
JP (2) | JP5712288B2 (en) |
KR (1) | KR101424372B1 (en) |
CN (1) | CN102959620B (en) |
AR (1) | AR085222A1 (en) |
AU (1) | AU2012217158B2 (en) |
BR (1) | BR112012029132B1 (en) |
CA (1) | CA2799343C (en) |
ES (1) | ES2458436T3 (en) |
HK (1) | HK1181541A1 (en) |
MX (1) | MX2012013025A (en) |
MY (1) | MY166394A (en) |
PL (1) | PL2550653T3 (en) |
RU (1) | RU2580924C2 (en) |
SG (1) | SG185519A1 (en) |
TW (2) | TWI483245B (en) |
WO (1) | WO2012110478A1 (en) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA3111501C (en) * | 2011-09-26 | 2023-09-19 | Sirius Xm Radio Inc. | System and method for increasing transmission bandwidth efficiency ("ebt2") |
US9842598B2 (en) | 2013-02-21 | 2017-12-12 | Qualcomm Incorporated | Systems and methods for mitigating potential frame instability |
TWI557727B (en) | 2013-04-05 | 2016-11-11 | 杜比國際公司 | Audio processing system, multimedia processing system, method for processing audio bit stream, and computer program product |
US9478224B2 (en) | 2013-04-05 | 2016-10-25 | Dolby International Ab | Audio processing system |
MY175355A (en) * | 2013-08-23 | 2020-06-22 | Fraunhofer Ges Forschung | Apparatus and method for processing an audio signal an aliasing erro signal |
SG11201509526SA (en) * | 2014-07-28 | 2017-04-27 | Fraunhofer Ges Forschung | Apparatus and method for selecting one of a first encoding algorithm and a second encoding algorithm using harmonics reduction |
US10504530B2 (en) | 2015-11-03 | 2019-12-10 | Dolby Laboratories Licensing Corporation | Switching between transforms |
EP3475944B1 (en) * | 2016-06-22 | 2020-07-15 | Dolby International AB | Audio decoder and method for transforming a digital audio signal from a first to a second frequency domain |
CN110870006B (en) | 2017-04-28 | 2023-09-22 | Dts公司 | Method for encoding audio signal and audio encoder |
EP3644313A1 (en) * | 2018-10-26 | 2020-04-29 | Fraunhofer Gesellschaft zur Förderung der Angewand | Perceptual audio coding with adaptive non-uniform time/frequency tiling using subband merging and time domain aliasing reduction |
US11456007B2 (en) | 2019-01-11 | 2022-09-27 | Samsung Electronics Co., Ltd | End-to-end multi-task denoising for joint signal distortion ratio (SDR) and perceptual evaluation of speech quality (PESQ) optimization |
JP7576632B2 (en) | 2020-03-20 | 2024-10-31 | ドルビー・インターナショナル・アーベー | Bass Enhancement for Speakers |
Family Cites Families (217)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU671952B2 (en) | 1991-06-11 | 1996-09-19 | Qualcomm Incorporated | Variable rate vocoder |
US5408580A (en) | 1992-09-21 | 1995-04-18 | Aware, Inc. | Audio compression system employing multi-rate signal analysis |
SE501340C2 (en) | 1993-06-11 | 1995-01-23 | Ericsson Telefon Ab L M | Hiding transmission errors in a speech decoder |
BE1007617A3 (en) | 1993-10-11 | 1995-08-22 | Philips Electronics Nv | Transmission system using different codeerprincipes. |
US5657422A (en) | 1994-01-28 | 1997-08-12 | Lucent Technologies Inc. | Voice activity detection driven noise remediator |
US5784532A (en) | 1994-02-16 | 1998-07-21 | Qualcomm Incorporated | Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system |
US5684920A (en) | 1994-03-17 | 1997-11-04 | Nippon Telegraph And Telephone | Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein |
US5568588A (en) | 1994-04-29 | 1996-10-22 | Audiocodes Ltd. | Multi-pulse analysis speech processing System and method |
CN1090409C (en) | 1994-10-06 | 2002-09-04 | 皇家菲利浦电子有限公司 | Transmission system utilizng different coding principles |
JP3304717B2 (en) * | 1994-10-28 | 2002-07-22 | ソニー株式会社 | Digital signal compression method and apparatus |
EP0720316B1 (en) | 1994-12-30 | 1999-12-08 | Daewoo Electronics Co., Ltd | Adaptive digital audio encoding apparatus and a bit allocation method thereof |
SE506379C3 (en) | 1995-03-22 | 1998-01-19 | Ericsson Telefon Ab L M | Lpc speech encoder with combined excitation |
US5727119A (en) * | 1995-03-27 | 1998-03-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase |
JP3317470B2 (en) | 1995-03-28 | 2002-08-26 | 日本電信電話株式会社 | Audio signal encoding method and audio signal decoding method |
US5659622A (en) | 1995-11-13 | 1997-08-19 | Motorola, Inc. | Method and apparatus for suppressing noise in a communication system |
US5890106A (en) * | 1996-03-19 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation |
US5848391A (en) * | 1996-07-11 | 1998-12-08 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Method subband of coding and decoding audio signals using variable length windows |
JP3259759B2 (en) | 1996-07-22 | 2002-02-25 | 日本電気株式会社 | Audio signal transmission method and audio code decoding system |
JP3622365B2 (en) * | 1996-09-26 | 2005-02-23 | ヤマハ株式会社 | Voice encoding transmission system |
JPH10124092A (en) | 1996-10-23 | 1998-05-15 | Sony Corp | Method and device for encoding speech and method and device for encoding audible signal |
US5960389A (en) | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
JPH10214100A (en) | 1997-01-31 | 1998-08-11 | Sony Corp | Voice synthesizing method |
US6134518A (en) | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
SE512719C2 (en) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | A method and apparatus for reducing data flow based on harmonic bandwidth expansion |
JP3223966B2 (en) | 1997-07-25 | 2001-10-29 | 日本電気株式会社 | Audio encoding / decoding device |
US6070137A (en) | 1998-01-07 | 2000-05-30 | Ericsson Inc. | Integrated frequency-domain voice coding using an adaptive spectral enhancement filter |
EP0932141B1 (en) | 1998-01-22 | 2005-08-24 | Deutsche Telekom AG | Method for signal controlled switching between different audio coding schemes |
GB9811019D0 (en) | 1998-05-21 | 1998-07-22 | Univ Surrey | Speech coders |
US6173257B1 (en) | 1998-08-24 | 2001-01-09 | Conexant Systems, Inc | Completed fixed codebook for speech encoder |
US6439967B2 (en) | 1998-09-01 | 2002-08-27 | Micron Technology, Inc. | Microelectronic substrate assembly planarizing machines and methods of mechanical and chemical-mechanical planarization of microelectronic substrate assemblies |
SE521225C2 (en) | 1998-09-16 | 2003-10-14 | Ericsson Telefon Ab L M | Method and apparatus for CELP encoding / decoding |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
US6317117B1 (en) | 1998-09-23 | 2001-11-13 | Eugene Goff | User interface for the control of an audio spectrum filter processor |
US7124079B1 (en) | 1998-11-23 | 2006-10-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Speech coding with comfort noise variability feature for increased fidelity |
FI114833B (en) | 1999-01-08 | 2004-12-31 | Nokia Corp | Method, speech encoder and mobile apparatus for forming speech coding frames |
DE19921122C1 (en) | 1999-05-07 | 2001-01-25 | Fraunhofer Ges Forschung | Method and device for concealing an error in a coded audio signal and method and device for decoding a coded audio signal |
AU5032000A (en) | 1999-06-07 | 2000-12-28 | Ericsson Inc. | Methods and apparatus for generating comfort noise using parametric noise model statistics |
JP4464484B2 (en) | 1999-06-15 | 2010-05-19 | パナソニック株式会社 | Noise signal encoding apparatus and speech signal encoding apparatus |
US6236960B1 (en) | 1999-08-06 | 2001-05-22 | Motorola, Inc. | Factorial packing method and apparatus for information coding |
US6636829B1 (en) | 1999-09-22 | 2003-10-21 | Mindspeed Technologies, Inc. | Speech communication system and method for handling lost frames |
ES2269112T3 (en) | 2000-02-29 | 2007-04-01 | Qualcomm Incorporated | MULTIMODAL VOICE CODIFIER IN CLOSED LOOP OF MIXED DOMAIN. |
US6757654B1 (en) | 2000-05-11 | 2004-06-29 | Telefonaktiebolaget Lm Ericsson | Forward error correction in speech coding |
JP2002118517A (en) * | 2000-07-31 | 2002-04-19 | Sony Corp | Apparatus and method for orthogonal transformation, apparatus and method for inverse orthogonal transformation, apparatus and method for transformation encoding as well as apparatus and method for decoding |
FR2813722B1 (en) | 2000-09-05 | 2003-01-24 | France Telecom | METHOD AND DEVICE FOR CONCEALING ERRORS AND TRANSMISSION SYSTEM COMPRISING SUCH A DEVICE |
US6847929B2 (en) | 2000-10-12 | 2005-01-25 | Texas Instruments Incorporated | Algebraic codebook system and method |
CA2327041A1 (en) | 2000-11-22 | 2002-05-22 | Voiceage Corporation | A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals |
US6636830B1 (en) * | 2000-11-22 | 2003-10-21 | Vialta Inc. | System and method for noise reduction using bi-orthogonal modified discrete cosine transform |
US7901873B2 (en) | 2001-04-23 | 2011-03-08 | Tcp Innovations Limited | Methods for the diagnosis and treatment of bone disorders |
US7136418B2 (en) * | 2001-05-03 | 2006-11-14 | University Of Washington | Scalable and perceptually ranked signal coding and decoding |
KR100464369B1 (en) | 2001-05-23 | 2005-01-03 | 삼성전자주식회사 | Excitation codebook search method in a speech coding system |
US20020184009A1 (en) | 2001-05-31 | 2002-12-05 | Heikkinen Ari P. | Method and apparatus for improved voicing determination in speech signals containing high levels of jitter |
US20030120484A1 (en) | 2001-06-12 | 2003-06-26 | David Wong | Method and system for generating colored comfort noise in the absence of silence insertion description packets |
DE10129240A1 (en) * | 2001-06-18 | 2003-01-02 | Fraunhofer Ges Forschung | Method and device for processing discrete-time audio samples |
US6879955B2 (en) * | 2001-06-29 | 2005-04-12 | Microsoft Corporation | Signal modification based on continuous time warping for low bit rate CELP coding |
US6941263B2 (en) | 2001-06-29 | 2005-09-06 | Microsoft Corporation | Frequency domain postfiltering for quality enhancement of coded speech |
DE10140507A1 (en) | 2001-08-17 | 2003-02-27 | Philips Corp Intellectual Pty | Method for the algebraic codebook search of a speech signal coder |
US7711563B2 (en) | 2001-08-17 | 2010-05-04 | Broadcom Corporation | Method and system for frame erasure concealment for predictive speech coding based on extrapolation of speech waveform |
KR100438175B1 (en) | 2001-10-23 | 2004-07-01 | 엘지전자 주식회사 | Search method for codebook |
US6934677B2 (en) * | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
CA2365203A1 (en) | 2001-12-14 | 2003-06-14 | Voiceage Corporation | A signal modification method for efficient coding of speech signals |
JP3815323B2 (en) * | 2001-12-28 | 2006-08-30 | 日本ビクター株式会社 | Frequency conversion block length adaptive conversion apparatus and program |
DE10200653B4 (en) * | 2002-01-10 | 2004-05-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Scalable encoder, encoding method, decoder and decoding method for a scaled data stream |
CA2388358A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for multi-rate lattice vector quantization |
CA2388352A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
CA2388439A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
US7302387B2 (en) | 2002-06-04 | 2007-11-27 | Texas Instruments Incorporated | Modification of fixed codebook search in G.729 Annex E audio coding |
US20040010329A1 (en) * | 2002-07-09 | 2004-01-15 | Silicon Integrated Systems Corp. | Method for reducing buffer requirements in a digital audio decoder |
DE10236694A1 (en) * | 2002-08-09 | 2004-02-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Equipment for scalable coding and decoding of spectral values of signal containing audio and/or video information by splitting signal binary spectral values into two partial scaling layers |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
US7299190B2 (en) * | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
ATE318405T1 (en) | 2002-09-19 | 2006-03-15 | Matsushita Electric Ind Co Ltd | AUDIO DECODING APPARATUS AND METHOD |
JP2006502426A (en) | 2002-10-11 | 2006-01-19 | ノキア コーポレイション | Source controlled variable bit rate wideband speech coding method and apparatus |
US7343283B2 (en) | 2002-10-23 | 2008-03-11 | Motorola, Inc. | Method and apparatus for coding a noise-suppressed audio signal |
US7363218B2 (en) | 2002-10-25 | 2008-04-22 | Dilithium Networks Pty. Ltd. | Method and apparatus for fast CELP parameter mapping |
KR100463419B1 (en) | 2002-11-11 | 2004-12-23 | 한국전자통신연구원 | Fixed codebook searching method with low complexity, and apparatus thereof |
KR100465316B1 (en) | 2002-11-18 | 2005-01-13 | 한국전자통신연구원 | Speech encoder and speech encoding method thereof |
KR20040058855A (en) | 2002-12-27 | 2004-07-05 | 엘지전자 주식회사 | voice modification device and the method |
AU2003208517A1 (en) * | 2003-03-11 | 2004-09-30 | Nokia Corporation | Switching between coding schemes |
US7249014B2 (en) | 2003-03-13 | 2007-07-24 | Intel Corporation | Apparatus, methods and articles incorporating a fast algebraic codebook search technique |
US20050021338A1 (en) | 2003-03-17 | 2005-01-27 | Dan Graboi | Recognition device and system |
WO2004090870A1 (en) | 2003-04-04 | 2004-10-21 | Kabushiki Kaisha Toshiba | Method and apparatus for encoding or decoding wide-band audio |
US7318035B2 (en) | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
DE10321983A1 (en) * | 2003-05-15 | 2004-12-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Device and method for embedding binary useful information in a carrier signal |
ES2354427T3 (en) | 2003-06-30 | 2011-03-14 | Koninklijke Philips Electronics N.V. | IMPROVEMENT OF THE DECODED AUDIO QUALITY THROUGH THE ADDITION OF NOISE. |
DE10331803A1 (en) * | 2003-07-14 | 2005-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for converting to a transformed representation or for inverse transformation of the transformed representation |
CA2475283A1 (en) | 2003-07-17 | 2005-01-17 | Her Majesty The Queen In Right Of Canada As Represented By The Minister Of Industry Through The Communications Research Centre | Method for recovery of lost speech data |
DE10345996A1 (en) * | 2003-10-02 | 2005-04-28 | Fraunhofer Ges Forschung | Apparatus and method for processing at least two input values |
DE10345995B4 (en) * | 2003-10-02 | 2005-07-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing a signal having a sequence of discrete values |
US7418396B2 (en) * | 2003-10-14 | 2008-08-26 | Broadcom Corporation | Reduced memory implementation technique of filterbank and block switching for real-time audio applications |
US20050091044A1 (en) * | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for pitch contour quantization in audio coding |
US20050091041A1 (en) | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for speech coding |
ES2282899T3 (en) | 2003-10-30 | 2007-10-16 | Koninklijke Philips Electronics N.V. | CODING OR DECODING OF AUDIO SIGNALS. |
WO2005073959A1 (en) * | 2004-01-28 | 2005-08-11 | Koninklijke Philips Electronics N.V. | Audio signal decoding using complex-valued data |
DE102004007200B3 (en) * | 2004-02-13 | 2005-08-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Device for audio encoding has device for using filter to obtain scaled, filtered audio value, device for quantizing it to obtain block of quantized, scaled, filtered audio values and device for including information in coded signal |
CA2457988A1 (en) | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
FI118834B (en) | 2004-02-23 | 2008-03-31 | Nokia Corp | Classification of audio signals |
FI118835B (en) | 2004-02-23 | 2008-03-31 | Nokia Corp | Select end of a coding model |
CN1930607B (en) | 2004-03-05 | 2010-11-10 | 松下电器产业株式会社 | Error conceal device and error conceal method |
WO2005096274A1 (en) | 2004-04-01 | 2005-10-13 | Beijing Media Works Co., Ltd | An enhanced audio encoding/decoding device and method |
GB0408856D0 (en) | 2004-04-21 | 2004-05-26 | Nokia Corp | Signal encoding |
DE602004025517D1 (en) | 2004-05-17 | 2010-03-25 | Nokia Corp | AUDIOCODING WITH DIFFERENT CODING FRAME LENGTHS |
US7649988B2 (en) | 2004-06-15 | 2010-01-19 | Acoustic Technologies, Inc. | Comfort noise generator using modified Doblinger noise estimate |
US8160274B2 (en) | 2006-02-07 | 2012-04-17 | Bongiovi Acoustics Llc. | System and method for digital signal processing |
US7630902B2 (en) | 2004-09-17 | 2009-12-08 | Digital Rise Technology Co., Ltd. | Apparatus and methods for digital audio coding using codebook application ranges |
KR100656788B1 (en) | 2004-11-26 | 2006-12-12 | 한국전자통신연구원 | Code vector generation method with bit rate elasticity and wideband vocoder using the same |
TWI253057B (en) | 2004-12-27 | 2006-04-11 | Quanta Comp Inc | Search system and method thereof for searching code-vector of speech signal in speech encoder |
BRPI0607247B1 (en) | 2005-01-31 | 2019-10-29 | Skype | method for generating a sample output sequence in response to first and second sample substrings, computer executable program code, program storage device, and arrangement for receiving a digitized audio signal |
US7519535B2 (en) | 2005-01-31 | 2009-04-14 | Qualcomm Incorporated | Frame erasure concealment in voice communications |
EP1845520A4 (en) | 2005-02-02 | 2011-08-10 | Fujitsu Ltd | SIGNAL PROCESSING METHOD AND SIGNAL PROCESSING DEVICE |
US20070147518A1 (en) | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
US8155965B2 (en) * | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
SG163556A1 (en) | 2005-04-01 | 2010-08-30 | Qualcomm Inc | Systems, methods, and apparatus for wideband speech coding |
WO2006126843A2 (en) | 2005-05-26 | 2006-11-30 | Lg Electronics Inc. | Method and apparatus for decoding audio signal |
US7707034B2 (en) | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
RU2296377C2 (en) | 2005-06-14 | 2007-03-27 | Михаил Николаевич Гусев | Method for analysis and synthesis of speech |
PL1897085T3 (en) | 2005-06-18 | 2017-10-31 | Nokia Technologies Oy | System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission |
CN101203907B (en) * | 2005-06-23 | 2011-09-28 | 松下电器产业株式会社 | Audio encoding apparatus, audio decoding apparatus and audio encoding information transmitting apparatus |
KR100851970B1 (en) | 2005-07-15 | 2008-08-12 | 삼성전자주식회사 | Method and apparatus for extracting ISCImportant Spectral Component of audio signal, and method and appartus for encoding/decoding audio signal with low bitrate using it |
US7610197B2 (en) | 2005-08-31 | 2009-10-27 | Motorola, Inc. | Method and apparatus for comfort noise generation in speech communication systems |
RU2312405C2 (en) | 2005-09-13 | 2007-12-10 | Михаил Николаевич Гусев | Method for realizing machine estimation of quality of sound signals |
US7720677B2 (en) * | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
US7536299B2 (en) | 2005-12-19 | 2009-05-19 | Dolby Laboratories Licensing Corporation | Correlating and decorrelating transforms for multiple description coding systems |
US8255207B2 (en) | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
WO2007080211A1 (en) | 2006-01-09 | 2007-07-19 | Nokia Corporation | Decoding of binaural audio signals |
CN101371296B (en) | 2006-01-18 | 2012-08-29 | Lg电子株式会社 | Apparatus and method for encoding and decoding signal |
WO2007083934A1 (en) | 2006-01-18 | 2007-07-26 | Lg Electronics Inc. | Apparatus and method for encoding and decoding signal |
US8032369B2 (en) | 2006-01-20 | 2011-10-04 | Qualcomm Incorporated | Arbitrary average data rates for variable rate coders |
US7668304B2 (en) | 2006-01-25 | 2010-02-23 | Avaya Inc. | Display hierarchy of participants during phone call |
FR2897733A1 (en) | 2006-02-20 | 2007-08-24 | France Telecom | Echo discriminating and attenuating method for hierarchical coder-decoder, involves attenuating echoes based on initial processing in discriminated low energy zone, and inhibiting attenuation of echoes in false alarm zone |
FR2897977A1 (en) | 2006-02-28 | 2007-08-31 | France Telecom | Coded digital audio signal decoder`s e.g. G.729 decoder, adaptive excitation gain limiting method for e.g. voice over Internet protocol network, involves applying limitation to excitation gain if excitation gain is greater than given value |
US20070253577A1 (en) | 2006-05-01 | 2007-11-01 | Himax Technologies Limited | Equalizer bank with interference reduction |
US7873511B2 (en) | 2006-06-30 | 2011-01-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
JP4810335B2 (en) * | 2006-07-06 | 2011-11-09 | 株式会社東芝 | Wideband audio signal encoding apparatus and wideband audio signal decoding apparatus |
EP2040251B1 (en) | 2006-07-12 | 2019-10-09 | III Holdings 12, LLC | Audio decoding device and audio encoding device |
WO2008007700A1 (en) | 2006-07-12 | 2008-01-17 | Panasonic Corporation | Sound decoding device, sound encoding device, and lost frame compensation method |
US7933770B2 (en) | 2006-07-14 | 2011-04-26 | Siemens Audiologische Technik Gmbh | Method and device for coding audio data based on vector quantisation |
CN102096937B (en) | 2006-07-24 | 2014-07-09 | 索尼株式会社 | A hair motion compositor system and optimization techniques for use in a hair/fur pipeline |
US7987089B2 (en) | 2006-07-31 | 2011-07-26 | Qualcomm Incorporated | Systems and methods for modifying a zero pad region of a windowed frame of an audio signal |
WO2008022176A2 (en) | 2006-08-15 | 2008-02-21 | Broadcom Corporation | Packet loss concealment for sub-band predictive coding based on extrapolation of full-band audio waveform |
US7877253B2 (en) | 2006-10-06 | 2011-01-25 | Qualcomm Incorporated | Systems, methods, and apparatus for frame erasure recovery |
US8041578B2 (en) * | 2006-10-18 | 2011-10-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
US8417532B2 (en) * | 2006-10-18 | 2013-04-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
DE102006049154B4 (en) * | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Coding of an information signal |
US8126721B2 (en) * | 2006-10-18 | 2012-02-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
US8036903B2 (en) * | 2006-10-18 | 2011-10-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system |
JP4936569B2 (en) * | 2006-10-25 | 2012-05-23 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | Apparatus and method for generating audio subband values, and apparatus and method for generating time domain audio samples |
DE102006051673A1 (en) * | 2006-11-02 | 2008-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for reworking spectral values and encoders and decoders for audio signals |
MY148913A (en) | 2006-12-12 | 2013-06-14 | Fraunhofer Ges Forschung | Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream |
FR2911228A1 (en) | 2007-01-05 | 2008-07-11 | France Telecom | TRANSFORMED CODING USING WINDOW WEATHER WINDOWS. |
KR101379263B1 (en) | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | Method and apparatus for decoding bandwidth extension |
FR2911426A1 (en) | 2007-01-15 | 2008-07-18 | France Telecom | MODIFICATION OF A SPEECH SIGNAL |
US7873064B1 (en) | 2007-02-12 | 2011-01-18 | Marvell International Ltd. | Adaptive jitter buffer-packet loss concealment |
JP4708446B2 (en) | 2007-03-02 | 2011-06-22 | パナソニック株式会社 | Encoding device, decoding device and methods thereof |
WO2008108083A1 (en) | 2007-03-02 | 2008-09-12 | Panasonic Corporation | Voice encoding device and voice encoding method |
SG179433A1 (en) | 2007-03-02 | 2012-04-27 | Panasonic Corp | Encoding device and encoding method |
JP2008261904A (en) | 2007-04-10 | 2008-10-30 | Matsushita Electric Ind Co Ltd | Encoding device, decoding device, encoding method and decoding method |
US8630863B2 (en) | 2007-04-24 | 2014-01-14 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding audio/speech signal |
CN101388210B (en) | 2007-09-15 | 2012-03-07 | 华为技术有限公司 | Coding and decoding method, coder and decoder |
MX2009013519A (en) * | 2007-06-11 | 2010-01-18 | Fraunhofer Ges Forschung | Audio encoder for encoding an audio signal having an impulse- like portion and stationary portion, encoding methods, decoder, decoding method; and encoded audio signal. |
US9653088B2 (en) | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
KR101513028B1 (en) | 2007-07-02 | 2015-04-17 | 엘지전자 주식회사 | Broadcast receiver and method of processing broadcast signal |
US8185381B2 (en) | 2007-07-19 | 2012-05-22 | Qualcomm Incorporated | Unified filter bank for performing signal conversions |
CN101110214B (en) | 2007-08-10 | 2011-08-17 | 北京理工大学 | Speech coding method based on multiple description lattice type vector quantization technology |
US8428957B2 (en) | 2007-08-24 | 2013-04-23 | Qualcomm Incorporated | Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands |
US8392202B2 (en) * | 2007-08-27 | 2013-03-05 | Telefonaktiebolaget L M Ericsson (Publ) | Low-complexity spectral analysis/synthesis using selectable time resolution |
JP4886715B2 (en) | 2007-08-28 | 2012-02-29 | 日本電信電話株式会社 | Steady rate calculation device, noise level estimation device, noise suppression device, method thereof, program, and recording medium |
US8566106B2 (en) | 2007-09-11 | 2013-10-22 | Voiceage Corporation | Method and device for fast algebraic codebook search in speech and audio coding |
CN100524462C (en) | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | Method and apparatus for concealing frame error of high belt signal |
US8576096B2 (en) | 2007-10-11 | 2013-11-05 | Motorola Mobility Llc | Apparatus and method for low complexity combinatorial coding of signals |
KR101373004B1 (en) | 2007-10-30 | 2014-03-26 | 삼성전자주식회사 | Apparatus and method for encoding and decoding high frequency signal |
CN101425292B (en) | 2007-11-02 | 2013-01-02 | 华为技术有限公司 | Decoding method and device for audio signal |
DE102007055830A1 (en) | 2007-12-17 | 2009-06-18 | Zf Friedrichshafen Ag | Method and device for operating a hybrid drive of a vehicle |
CN101483043A (en) | 2008-01-07 | 2009-07-15 | 中兴通讯股份有限公司 | Code book index encoding method based on classification, permutation and combination |
CN101488344B (en) | 2008-01-16 | 2011-09-21 | 华为技术有限公司 | Quantitative noise leakage control method and apparatus |
DE102008015702B4 (en) | 2008-01-31 | 2010-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for bandwidth expansion of an audio signal |
AU2009221444B2 (en) * | 2008-03-04 | 2012-06-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Mixing of input data streams and generation of an output data stream therefrom |
US8000487B2 (en) | 2008-03-06 | 2011-08-16 | Starkey Laboratories, Inc. | Frequency translation by high-frequency spectral envelope warping in hearing assistance devices |
FR2929466A1 (en) | 2008-03-28 | 2009-10-02 | France Telecom | DISSIMULATION OF TRANSMISSION ERROR IN A DIGITAL SIGNAL IN A HIERARCHICAL DECODING STRUCTURE |
EP2107556A1 (en) * | 2008-04-04 | 2009-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transform coding using pitch correction |
US8879643B2 (en) | 2008-04-15 | 2014-11-04 | Qualcomm Incorporated | Data substitution scheme for oversampled data |
US8768690B2 (en) | 2008-06-20 | 2014-07-01 | Qualcomm Incorporated | Coding scheme selection for low-bit-rate applications |
MY154452A (en) * | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
PL2346030T3 (en) | 2008-07-11 | 2015-03-31 | Fraunhofer Ges Forschung | Audio encoder, method for encoding an audio signal and computer program |
MY152252A (en) * | 2008-07-11 | 2014-09-15 | Fraunhofer Ges Forschung | Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme |
KR101325335B1 (en) * | 2008-07-11 | 2013-11-08 | 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 | Audio encoder and decoder for encoding and decoding audio samples |
CN103077722B (en) * | 2008-07-11 | 2015-07-22 | 弗劳恩霍夫应用研究促进协会 | Time warp activation signal provider, and encoding an audio signal with the time warp activation signal |
ES2683077T3 (en) | 2008-07-11 | 2018-09-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding and decoding frames of a sampled audio signal |
MX2011000375A (en) * | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Audio encoder and decoder for encoding and decoding frames of sampled audio signal. |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
US8380498B2 (en) * | 2008-09-06 | 2013-02-19 | GH Innovation, Inc. | Temporal envelope coding of energy attack signal by using attack point location |
US8352279B2 (en) * | 2008-09-06 | 2013-01-08 | Huawei Technologies Co., Ltd. | Efficient temporal envelope coding approach by prediction between low band signal and high band signal |
WO2010031049A1 (en) | 2008-09-15 | 2010-03-18 | GH Innovation, Inc. | Improving celp post-processing for music signals |
US8798776B2 (en) | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
DE102008042579B4 (en) | 2008-10-02 | 2020-07-23 | Robert Bosch Gmbh | Procedure for masking errors in the event of incorrect transmission of voice data |
BRPI0914056B1 (en) | 2008-10-08 | 2019-07-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | MULTI-RESOLUTION SWITCHED AUDIO CODING / DECODING SCHEME |
KR101315617B1 (en) | 2008-11-26 | 2013-10-08 | 광운대학교 산학협력단 | Unified speech/audio coder(usac) processing windows sequence based mode switching |
CN101770775B (en) | 2008-12-31 | 2011-06-22 | 华为技术有限公司 | Signal processing method and device |
BR122019023704B1 (en) | 2009-01-16 | 2020-05-05 | Dolby Int Ab | system for generating a high frequency component of an audio signal and method for performing high frequency reconstruction of a high frequency component |
US8457975B2 (en) * | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
EP2382625B1 (en) | 2009-01-28 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, encoded audio information, methods for encoding and decoding an audio signal and computer program |
EP2214165A3 (en) | 2009-01-30 | 2010-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for manipulating an audio signal comprising a transient event |
EP2645367B1 (en) | 2009-02-16 | 2019-11-20 | Electronics and Telecommunications Research Institute | Encoding/decoding method for audio signals using adaptive sinusoidal coding and apparatus thereof |
ATE526662T1 (en) | 2009-03-26 | 2011-10-15 | Fraunhofer Ges Forschung | DEVICE AND METHOD FOR MODIFYING AN AUDIO SIGNAL |
KR20100115215A (en) | 2009-04-17 | 2010-10-27 | 삼성전자주식회사 | Apparatus and method for audio encoding/decoding according to variable bit rate |
EP2446539B1 (en) * | 2009-06-23 | 2018-04-11 | Voiceage Corporation | Forward time-domain aliasing cancellation with application in weighted or original signal domain |
CN101958119B (en) | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | Audio-frequency drop-frame compensator and compensation method for modified discrete cosine transform domain |
EP4358082A1 (en) | 2009-10-20 | 2024-04-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation |
EP2491555B1 (en) | 2009-10-20 | 2014-03-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-mode audio codec |
JP5243661B2 (en) | 2009-10-20 | 2013-07-24 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | Audio signal encoder, audio signal decoder, method for providing a coded representation of audio content, method for providing a decoded representation of audio content, and computer program for use in low-latency applications |
CN102081927B (en) | 2009-11-27 | 2012-07-18 | 中兴通讯股份有限公司 | Layering audio coding and decoding method and system |
US8423355B2 (en) | 2010-03-05 | 2013-04-16 | Motorola Mobility Llc | Encoder for audio signal including generic audio and speech frames |
US8428936B2 (en) | 2010-03-05 | 2013-04-23 | Motorola Mobility Llc | Decoder for audio signal including generic audio and speech frames |
CN103069484B (en) | 2010-04-14 | 2014-10-08 | 华为技术有限公司 | Time/frequency two dimension post-processing |
WO2011147950A1 (en) | 2010-05-28 | 2011-12-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low-delay unified speech and audio codec |
MX2013009344A (en) | 2011-02-14 | 2013-10-01 | Fraunhofer Ges Forschung | Apparatus and method for processing a decoded audio signal in a spectral domain. |
KR101624019B1 (en) | 2011-02-14 | 2016-06-07 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | Noise generation in audio codecs |
-
2012
- 2012-02-14 TW TW101104678A patent/TWI483245B/en active
- 2012-02-14 PL PL12705255T patent/PL2550653T3/en unknown
- 2012-02-14 RU RU2012148250/08A patent/RU2580924C2/en active
- 2012-02-14 EP EP12705255.3A patent/EP2550653B1/en active Active
- 2012-02-14 BR BR112012029132-7A patent/BR112012029132B1/en active IP Right Grant
- 2012-02-14 CA CA2799343A patent/CA2799343C/en active Active
- 2012-02-14 JP JP2013519117A patent/JP5712288B2/en active Active
- 2012-02-14 TW TW103134392A patent/TWI564882B/en active
- 2012-02-14 MY MYPI2012004908A patent/MY166394A/en unknown
- 2012-02-14 MX MX2012013025A patent/MX2012013025A/en active IP Right Grant
- 2012-02-14 CN CN201280001344.3A patent/CN102959620B/en active Active
- 2012-02-14 AU AU2012217158A patent/AU2012217158B2/en active Active
- 2012-02-14 KR KR1020127029497A patent/KR101424372B1/en active Active
- 2012-02-14 ES ES12705255.3T patent/ES2458436T3/en active Active
- 2012-02-14 AR ARP120100476A patent/AR085222A1/en active IP Right Grant
- 2012-02-14 WO PCT/EP2012/052458 patent/WO2012110478A1/en active Application Filing
- 2012-02-14 SG SG2012083069A patent/SG185519A1/en unknown
- 2012-11-09 US US13/672,935 patent/US9536530B2/en active Active
-
2013
- 2013-07-24 HK HK13108708.1A patent/HK1181541A1/en unknown
-
2014
- 2014-08-04 JP JP2014158475A patent/JP6099602B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20130064383A1 (en) | 2013-03-14 |
RU2012148250A (en) | 2014-07-27 |
EP2550653B1 (en) | 2014-04-02 |
JP2014240973A (en) | 2014-12-25 |
TWI564882B (en) | 2017-01-01 |
PL2550653T3 (en) | 2014-09-30 |
CA2799343A1 (en) | 2012-08-23 |
BR112012029132A2 (en) | 2020-11-10 |
JP5712288B2 (en) | 2015-05-07 |
KR101424372B1 (en) | 2014-08-01 |
WO2012110478A1 (en) | 2012-08-23 |
US9536530B2 (en) | 2017-01-03 |
KR20130007651A (en) | 2013-01-18 |
CN102959620B (en) | 2015-05-13 |
AU2012217158A1 (en) | 2012-12-13 |
BR112012029132B1 (en) | 2021-10-05 |
MX2012013025A (en) | 2013-01-22 |
HK1181541A1 (en) | 2013-11-08 |
RU2580924C2 (en) | 2016-04-10 |
AU2012217158B2 (en) | 2014-02-27 |
SG185519A1 (en) | 2012-12-28 |
CN102959620A (en) | 2013-03-06 |
JP2013531820A (en) | 2013-08-08 |
TWI483245B (en) | 2015-05-01 |
CA2799343C (en) | 2016-06-21 |
AR085222A1 (en) | 2013-09-18 |
ES2458436T3 (en) | 2014-05-05 |
TW201506906A (en) | 2015-02-16 |
MY166394A (en) | 2018-06-25 |
TW201246186A (en) | 2012-11-16 |
EP2550653A1 (en) | 2013-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6099602B2 (en) | Information signal converter using duplicate conversion | |
CA3076203C (en) | Improved harmonic transposition | |
KR101407120B1 (en) | Apparatus and method for processing an audio signal and for providing a higher temporal granularity for a combined unified speech and audio codec (usac) | |
JP6132885B2 (en) | Harmonic conversion | |
KR20130133843A (en) | Apparatus and method for processing a decoded audio signal in a spectral domain | |
CA3210604A1 (en) | Improved harmonic transposition | |
AU2021204779B2 (en) | Improved Harmonic Transposition | |
AU2023282303B2 (en) | Improved Harmonic Transposition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150521 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150609 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20150827 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160517 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20160817 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20160817 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160928 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20160928 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161116 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170124 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170221 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6099602 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |