JP5530454B2 - オーディオ符号化装置、復号装置、方法、回路およびプログラム - Google Patents
オーディオ符号化装置、復号装置、方法、回路およびプログラム Download PDFInfo
- Publication number
- JP5530454B2 JP5530454B2 JP2011537144A JP2011537144A JP5530454B2 JP 5530454 B2 JP5530454 B2 JP 5530454B2 JP 2011537144 A JP2011537144 A JP 2011537144A JP 2011537144 A JP2011537144 A JP 2011537144A JP 5530454 B2 JP5530454 B2 JP 5530454B2
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- parameter
- audio signal
- encoded
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
第1の実施形態において、動的時間伸縮方式を用いる符号化装置を提案する。
第1の実施形態において、ピッチ輪郭が、動的時間伸縮方式により処理され、動的時間伸縮パラメータが生成される。そして、生成された動的時間伸縮パラメータは、時間伸縮が適用される位置と、その位置の時間伸縮値とを表す。提案の動的時間伸縮方式により、音質が改善される。時間伸縮値の符号化に用いられるビットを、さらに削減するため、可逆符号化も導入する。
第2の実施形態において、時間伸縮パラメータを、より効率よく符号化する方式を用いる動的時間伸縮方法を説明する。
動的時間伸縮により、時間伸縮を通して、ハーモニクス構造を再構築することが可能になる。エネルギーが、参照ピッチと、そのハーモニクス成分に制限されることから、符号化効率が、改善される。評価方式により、ピッチ検出の精度への依存が減少し、符号化システムの性能が、改善される。時間伸縮パラメータを符号化する効率的な方式は、ビットレートを減らすことで、音質を改善し、より大きなピッチ変化レートを有する信号の符号化に対応することができる。
第3の実施形態において、動的時間伸縮方式を用いる復号装置を提案する。
動的時間伸縮再構築の具体例を、第4の実施形態で説明する。
第5の実施形態において、動的時間伸縮方式を用いる、他の符号化装置を提案する。
第6の実施形態において、ミドルサイドステレオモード(MSモード)を組み入れた符号化装置を説明する。
第6の実施形態において、動的時間圧縮は、ステレオ符号化に、さらに適するように変更される。ステレオ符号化に関し、左右のチャネルは、異なる特性を持つことがある。この場合、異なるチャネルに対し、異なる時間圧縮パラメータが算出される。左右のチャネルが、類似の特性を有することもある。両チャネルに、同じ時間圧縮パラメータを用いると、合理的である。左右のチャネルが類似している場合、同じ時間圧縮パラメータの組を用いることで、より効率的なオーディオ符号化が、達成できる。
第7の実施形態において、MSモードに対応する復号装置を説明する。
図6は、MSモードを利用する、変更された動的時間伸縮を用いるエンコーダのブロック図である。
第9の実施形態において、閉ループ動的時間伸縮手段を備える符号化装置を、導入する。
2 復号装置
2S システム
101 ピッチ輪郭分析部
102 動的時間伸縮部
103 可逆符号化部
104 時間伸縮部
105 変換エンコーダ
106 マルチプレクサ
201 可逆復号部
202 動的時間伸縮再構築部
203 時間伸縮部
204 変換デコーダ
205 デマルチプレクサ
Claims (19)
- 入力オーディオ信号のピッチ輪郭情報を検出するピッチディテクタと、
検出された前記ピッチ輪郭情報に基づいて、ピッチ変化比のセント数の絶対値が42以上である範囲を含む範囲の変域にあるピッチ変化比を含むピッチパラメータを生成するピッチパラメータジェネレータと、
生成された前記ピッチパラメータを符号化する第1のエンコーダと、
前記ピッチ輪郭情報に従って、前記入力オーディオ信号のピッチ周波数をシフトするピッチシフタと、
前記ピッチシフタから出力された、シフトがされたオーディオ信号を符号化する第2のエンコーダと、
前記第1のエンコーダから出力された符号化ピッチパラメータと、前記第2のエンコーダから出力された、前記ピッチシフタから出力された前記オーディオ信号が符号化されたデータとを組み合わせることで、前記符号化ピッチパラメータと当該データとが含まれるビットストリームを生成するマルチプレクサとを備える符号化装置。 - 前記ピッチパラメータジェネレータは、検出された前記ピッチ輪郭情報に基づいて、ピッチ変化位置と前記ピッチ変化比とを含む前記ピッチパラメータを生成する請求項1記載の符号化装置。
- 前記第1のエンコーダから出力された前記符号化ピッチパラメータから、復号ピッチ変化位置と復号ピッチ変化比とを含む復号ピッチパラメータを生成する第1のデコーダと、
生成された前記復号ピッチパラメータに従って、ピッチ輪郭情報を復元するピッチ輪郭リコンストラクタとを備え、
前記ピッチシフタは、復元された前記ピッチ輪郭情報である再構築ピッチ輪郭情報に従って、前記入力オーディオ信号のピッチ周波数をシフトする請求項2記載の符号化装置。 - 入力ステレオオーディオ信号の各オーディオフレームにミドルサイドステレオモード(MSステレオモード)を適用するかどうかを確認して、前記MSステレオモードの適用を示すフラグを生成するMSモードセレクタと、
生成された前記フラグに従って、前記入力ステレオオーディオ信号をダウンミックスするダウンミキサとを備え、
前記ピッチディテクタは、生成された前記フラグに従って、前記入力ステレオオーディオ信号がダウンミックスされたダウンミックス信号または前記入力ステレオオーディオ信号のピッチ輪郭情報を検出し、
前記ピッチシフタは、前記ピッチ輪郭情報と前記フラグとに従って、前記入力ステレオオーディオ信号または前記ダウンミックス信号のピッチ周波数をシフトする請求項2または3記載の符号化装置。 - 入力ステレオオーディオ信号に従って、MSステレオモードを選択し、前記MSステレオモードの適用を示すフラグを生成するMSモードセレクタと、
生成された前記フラグに従って前記入力ステレオオーディオ信号をダウンミックスするダウンミキサと、
第1のデコーダと、
ピッチ輪郭リコンストラクタとを備え、
前記ピッチディテクタは、生成された前記フラグに従って、前記入力ステレオオーディオ信号がダウンミックスされたダウンミックス信号または前記入力ステレオオーディオ信号のピッチ輪郭情報を検出し、
前記第1のデコーダは、前記第1のエンコーダから出力された前記符号化ピッチパラメータから、復号ピッチ変化位置と復号ピッチ変化比とを含む復号ピッチパラメータを生成し、
前記ピッチ輪郭リコンストラクタは、生成された前記復号ピッチパラメータと、前記フラグに従って、再構築ピッチ輪郭情報を復元し、
前記ピッチシフタは、復元された前記再構築ピッチ輪郭情報に従って、前記入力ステレオオーディオ信号または前記ダウンミックス信号のピッチ周波数をシフトする請求項2記載の符号化装置。 - 前記ピッチシフタを使用するかどうかを決定する比較手段を備え、
前記マルチプレクサは、符号化データと、前記比較手段から出力された符号化ピッチパラメータとを組み合わせることで、前記ビットストリームを生成する請求項5記載の符号化装置。 - 請求項1〜6の何れかに記載の符号化装置に設けられた前記ピッチパラメータジェネレータであって、
ピッチシフトがされる前の第1のハーモニクス構造と、された後の第2のハーモニクス構造とを比較することで、前記ピッチ輪郭情報を修正し、当該ピッチシフトを利用すべきかどうかを決定するピッチパラメータジェネレータ。 - 前記第1のエンコーダは、
前記ピッチパラメータを、
当該ピッチパラメータが、比較的小さな絶対値のセント数のピッチ変化比のピッチパラメータである場合には、比較的短い符号長の符号の符号化ピッチパラメータへと符号化し、
比較的大きな絶対値のセント数のピッチ変化比のピッチパラメータである場合には、比較的長い符号長の符号の符号化ピッチパラメータへと符号化する請求項1〜6の何れかに記載の符号化装置。 - ピッチシフトされたオーディオ信号の符号化データと、符号化ピッチパラメータ情報とを含むビットストリームを復号する復号装置であって、
復号を行う前記ビットストリームから、当該ビットストリームに含まれる前記符号化データと、前記符号化ピッチパラメータ情報とをそれぞれ分離するデマルチプレクサと、
分離された前記符号化ピッチパラメータ情報から、ピッチ変化比のセント数の絶対値が42以上である範囲を含む範囲の変域にあるピッチ変化比を含む復号ピッチパラメータを生成する第1のデコーダと、
生成された前記復号ピッチパラメータに従って、ピッチ輪郭情報を復元するピッチ輪郭リコンストラクタと、
分離された前記符号化データを復号して、ピッチシフトされた前記オーディオ信号を生成する第2のデコーダと、
復元された前記ピッチ輪郭情報である再構築ピッチ輪郭情報に従って、ピッチシフトされた前記オーディオ信号を、元のオーディオ信号に変換するオーディオ信号リコンストラクタとを備える復号装置。 - 前記第1のデコーダは、分離された前記符号化ピッチパラメータ情報から、ピッチ変化位置と前記ピッチ変化比とを含む前記復号ピッチパラメータを生成する請求項9記載の復号装置。
- 当該復号装置は、ピッチシフトされたステレオオーディオ信号の前記符号化データを含む前記ビットストリームを復号し、
MSモードディテクタを備え、
前記第2のデコーダは、分離された前記符号化データを復号して、ピッチシフトされた前記ステレオオーディオ信号と、MSモード符号化情報とを生成し、
前記MSモードディテクタは、MSモードが有効にされているかどうかを、生成された前記MSモード符号化情報に従って検出し、MSモードが有効にされるべきかどうかを示すMSモードフラグを生成し、
前記ピッチ輪郭リコンストラクタは、前記第1のデコーダから出力された、生成された前記復号ピッチパラメータと、生成された前記MSモードフラグとに従って、前記ピッチ輪郭情報を復元する請求項10記載の復号装置。 - 前記第1のデコーダは、
分離された前記符号化ピッチパラメータ情報を、
当該符号化ピッチパラメータ情報が、比較的短い符号長の符号の符号化ピッチパラメータ情報である場合には、比較的小さな絶対値のセント数のピッチ変化比のピッチパラメータへと復号し、
比較的長い符号長の符号の符号化ピッチパラメータ情報である場合には、比較的大きな絶対値のセント数のピッチ変化比のピッチパラメータへと復号する請求項9〜11の何れかに記載の復号装置。 - 請求項8記載の符号化装置と、請求項12記載の復号装置とを含んでなる信号処理システム。
- 入力オーディオ信号のピッチ輪郭情報を検出するピッチディテクタ工程と、
検出された前記ピッチ輪郭情報に基づいて、ピッチ変化比のセント数の絶対値が42以上である範囲を含む範囲の変域にあるピッチ変化比を含むピッチパラメータを生成するピッチパラメータジェネレータ工程と、
生成された前記ピッチパラメータを符号化する第1のエンコーダ工程と、
前記ピッチ輪郭情報に従って、前記入力オーディオ信号のピッチ周波数をシフトするピッチシフタ工程と、
前記ピッチシフタ工程で出力された、シフトがされたオーディオ信号を符号化する第2のエンコーダ工程と、
前記第1のエンコーダ工程で出力された符号化ピッチパラメータと、前記第2のエンコーダ工程で出力された、前記ピッチシフタ工程から出力された前記オーディオ信号が符号化されたデータとを組み合わせることで、前記符号化ピッチパラメータと当該データとが含まれるビットストリームを生成するマルチプレクサ工程とを含む符号化方法。 - ピッチシフトされたオーディオ信号の符号化データと、符号化ピッチパラメータ情報とを含むビットストリームを復号する復号方法であって、
復号を行う前記ビットストリームから、当該ビットストリームに含まれる前記符号化データと、前記符号化ピッチパラメータ情報とをそれぞれ分離するデマルチプレクサ工程と、
分離された前記符号化ピッチパラメータ情報から、ピッチ変化比のセント数の絶対値が42以上である範囲を含む範囲の変域にあるピッチ変化比を含む復号ピッチパラメータを生成する第1のデコーダ工程と、
生成された前記復号ピッチパラメータに従って、ピッチ輪郭情報を復元するピッチ輪郭リコンストラクタ工程と、
分離された前記符号化データを復号して、ピッチシフトされた前記オーディオ信号を生成する第2のデコーダ工程と、
復元された前記ピッチ輪郭情報である再構築ピッチ輪郭情報に従って、ピッチシフトされた前記オーディオ信号を、元のオーディオ信号に変換するオーディオ信号リコンストラ
クタ工程とを含む復号方法。 - 入力オーディオ信号のピッチ輪郭情報を検出するピッチディテクタと、
検出された前記ピッチ輪郭情報に基づいて、ピッチ変化比のセント数の絶対値が42以上である範囲を含む範囲の変域にあるピッチ変化比を含むピッチパラメータを生成するピッチパラメータジェネレータと、
生成された前記ピッチパラメータを符号化する第1のエンコーダと、
前記ピッチ輪郭情報に従って、前記入力オーディオ信号のピッチ周波数をシフトするピッチシフタと、
前記ピッチシフタから出力された、シフトがされたオーディオ信号を符号化する第2のエンコーダと、
前記第1のエンコーダから出力された符号化ピッチパラメータと、前記第2のエンコーダから出力された、前記ピッチシフタから出力された前記オーディオ信号が符号化されたデータとを組み合わせることで、前記符号化ピッチパラメータと当該データとが含まれるビットストリームを生成するマルチプレクサとを備える集積回路。 - ピッチシフトされたオーディオ信号の符号化データと、符号化ピッチパラメータ情報とを含むビットストリームを復号する集積回路であって、
復号を行う前記ビットストリームから、当該ビットストリームに含まれる前記符号化データと、前記符号化ピッチパラメータ情報とをそれぞれ分離するデマルチプレクサと、
分離された前記符号化ピッチパラメータ情報から、ピッチ変化比のセント数の絶対値が42以上である範囲を含む範囲の変域にあるピッチ変化比を含む復号ピッチパラメータを生成する第1のデコーダと、
生成された前記復号ピッチパラメータに従って、ピッチ輪郭情報を復元するピッチ輪郭リコンストラクタと、
分離された前記符号化データを復号して、ピッチシフトされた前記オーディオ信号を生成する第2のデコーダと、
復元された前記ピッチ輪郭情報である再構築ピッチ輪郭情報に従って、ピッチシフトされた前記オーディオ信号を、元のオーディオ信号に変換するオーディオ信号リコンストラクタとを備える集積回路。 - 入力オーディオ信号のピッチ輪郭情報を検出するピッチディテクタ工程と、
検出された前記ピッチ輪郭情報に基づいて、ピッチ変化比のセント数の絶対値が42以上である範囲を含む範囲の変域にあるピッチ変化比を含むピッチパラメータを生成するピッチパラメータジェネレータ工程と、
生成された前記ピッチパラメータを符号化する第1のエンコーダ工程と、
前記ピッチ輪郭情報に従って、前記入力オーディオ信号のピッチ周波数をシフトするピッチシフタ工程と、
前記ピッチシフタ工程で出力された、シフトがされたオーディオ信号を符号化する第2のエンコーダ工程と、
前記第1のエンコーダ工程で出力された符号化ピッチパラメータと、前記第2のエンコーダ工程で出力された、前記ピッチシフタ工程から出力された前記オーディオ信号が符号化されたデータとを組み合わせることで、前記符号化ピッチパラメータと当該データとが含まれるビットストリームを生成するマルチプレクサ工程とをコンピュータに実行させるためのコンピュータプログラム。 - ピッチシフトされたオーディオ信号の符号化データと、符号化ピッチパラメータ情報とを含むビットストリームをコンピュータに復号させるためのコンピュータプログラムであって、
復号を行う前記ビットストリームから、当該ビットストリームに含まれる前記符号化データと、前記符号化ピッチパラメータ情報とをそれぞれ分離するデマルチプレクサ工程と、
分離された前記符号化ピッチパラメータ情報から、ピッチ変化比のセント数の絶対値が42以上である範囲を含む範囲の変域にあるピッチ変化比を含む復号ピッチパラメータを生成する第1のデコーダ工程と、
生成された前記復号ピッチパラメータに従って、ピッチ輪郭情報を復元するピッチ輪郭リコンストラクタ工程と、
分離された前記符号化データを復号して、ピッチシフトされた前記オーディオ信号を生成する第2のデコーダ工程と、
復元された前記ピッチ輪郭情報である再構築ピッチ輪郭情報に従って、ピッチシフトされた前記オーディオ信号を、元のオーディオ信号に変換するオーディオ信号リコンストラクタ工程とを前記コンピュータに実行させるためのコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011537144A JP5530454B2 (ja) | 2009-10-21 | 2010-10-21 | オーディオ符号化装置、復号装置、方法、回路およびプログラム |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009242302 | 2009-10-21 | ||
JP2009242302 | 2009-10-21 | ||
JP2011537144A JP5530454B2 (ja) | 2009-10-21 | 2010-10-21 | オーディオ符号化装置、復号装置、方法、回路およびプログラム |
PCT/JP2010/006234 WO2011048815A1 (ja) | 2009-10-21 | 2010-10-21 | オーディオ符号化装置、復号装置、方法、回路およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2011048815A1 JPWO2011048815A1 (ja) | 2013-03-07 |
JP5530454B2 true JP5530454B2 (ja) | 2014-06-25 |
Family
ID=43900059
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011537144A Expired - Fee Related JP5530454B2 (ja) | 2009-10-21 | 2010-10-21 | オーディオ符号化装置、復号装置、方法、回路およびプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US8886548B2 (ja) |
EP (1) | EP2492911B1 (ja) |
JP (1) | JP5530454B2 (ja) |
CN (1) | CN102257564B (ja) |
WO (1) | WO2011048815A1 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7720677B2 (en) * | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
CN103077722B (zh) * | 2008-07-11 | 2015-07-22 | 弗劳恩霍夫应用研究促进协会 | 提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码 |
MY154452A (en) * | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
US9950143B2 (en) | 2012-02-07 | 2018-04-24 | Marie Andrea I. Wilborn | Intravenous splint cover and associated methods |
US8855303B1 (en) * | 2012-12-05 | 2014-10-07 | The Boeing Company | Cryptography using a symmetric frequency-based encryption algorithm |
US9257954B2 (en) * | 2013-09-19 | 2016-02-09 | Microsoft Technology Licensing, Llc | Automatic audio harmonization based on pitch distributions |
US9280313B2 (en) | 2013-09-19 | 2016-03-08 | Microsoft Technology Licensing, Llc | Automatically expanding sets of audio samples |
US9798974B2 (en) | 2013-09-19 | 2017-10-24 | Microsoft Technology Licensing, Llc | Recommending audio sample combinations |
US9372925B2 (en) | 2013-09-19 | 2016-06-21 | Microsoft Technology Licensing, Llc | Combining audio samples by automatically adjusting sample characteristics |
CN106571145A (zh) * | 2015-10-08 | 2017-04-19 | 重庆邮电大学 | 一种语音模仿方法和装置 |
GB201621434D0 (en) | 2016-12-16 | 2017-02-01 | Palantir Technologies Inc | Processing sensor logs |
CN107181928A (zh) * | 2017-07-21 | 2017-09-19 | 苏睿 | 会议系统及数据传输方法 |
CN113112993B (zh) * | 2020-01-10 | 2024-04-02 | 阿里巴巴集团控股有限公司 | 一种音频信息处理方法、装置、电子设备以及存储介质 |
CN114242094B (zh) * | 2021-12-16 | 2025-01-21 | 北京达佳互联信息技术有限公司 | 音频处理方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10111694A (ja) * | 1996-10-08 | 1998-04-28 | Sony Corp | 音声信号多重化装置および方法 |
JP2001188600A (ja) * | 1999-12-28 | 2001-07-10 | Matsushita Electric Ind Co Ltd | 音程変換装置 |
JP2002162996A (ja) * | 2000-11-24 | 2002-06-07 | Matsushita Electric Ind Co Ltd | オーディオ信号符号化方法、オーディオ信号符号化装置、音楽配信方法、および、音楽配信システム |
JP2002268694A (ja) * | 2001-03-13 | 2002-09-20 | Nippon Hoso Kyokai <Nhk> | ステレオ信号の符号化方法及び符号化装置 |
JP2003521721A (ja) * | 1998-11-24 | 2003-07-15 | マイクロソフト コーポレイション | ピッチ追跡方法および装置 |
WO2006046761A1 (ja) * | 2004-10-27 | 2006-05-04 | Yamaha Corporation | ピッチ変換装置 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60263375A (ja) * | 1984-06-08 | 1985-12-26 | Ricoh Elemex Corp | 音響信号の時間軸変換装置 |
JPS60263377A (ja) * | 1984-06-08 | 1985-12-26 | Ricoh Elemex Corp | 音響信号の時間軸変換装置 |
EP1589456A1 (en) * | 2000-03-14 | 2005-10-26 | Kabushiki Kaisha Toshiba | Mri system center and mri system |
FR2850781B1 (fr) * | 2003-01-30 | 2005-05-06 | Jean Luc Crebouw | Procede pour le traitement numerique differencie de la voix et de la musique, le filtrage du bruit, la creation d'effets speciaux et dispositif pour la mise en oeuvre dudit procede |
SE0301272D0 (sv) * | 2003-04-30 | 2003-04-30 | Coding Technologies Sweden Ab | Adaptive voice enhancement for low bit rate audio coding |
US7840014B2 (en) * | 2005-04-05 | 2010-11-23 | Roland Corporation | Sound apparatus with howling prevention function |
CN101203907B (zh) * | 2005-06-23 | 2011-09-28 | 松下电器产业株式会社 | 音频编码装置、音频解码装置以及音频编码信息传输装置 |
US9058812B2 (en) | 2005-07-27 | 2015-06-16 | Google Technology Holdings LLC | Method and system for coding an information signal using pitch delay contour adjustment |
US7720677B2 (en) * | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
US7734053B2 (en) * | 2005-12-06 | 2010-06-08 | Fujitsu Limited | Encoding apparatus, encoding method, and computer product |
US7873511B2 (en) | 2006-06-30 | 2011-01-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
KR101450940B1 (ko) * | 2007-09-19 | 2014-10-15 | 텔레폰악티에볼라겟엘엠에릭슨(펍) | 멀티채널 오디오의 조인트 인핸스먼트 |
CN101552005A (zh) * | 2008-04-03 | 2009-10-07 | 华为技术有限公司 | 编码方法、解码方法、系统及装置 |
-
2010
- 2010-10-21 US US13/141,169 patent/US8886548B2/en not_active Expired - Fee Related
- 2010-10-21 JP JP2011537144A patent/JP5530454B2/ja not_active Expired - Fee Related
- 2010-10-21 EP EP10824667.9A patent/EP2492911B1/en not_active Not-in-force
- 2010-10-21 WO PCT/JP2010/006234 patent/WO2011048815A1/ja active Application Filing
- 2010-10-21 CN CN2010800036592A patent/CN102257564B/zh not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10111694A (ja) * | 1996-10-08 | 1998-04-28 | Sony Corp | 音声信号多重化装置および方法 |
JP2003521721A (ja) * | 1998-11-24 | 2003-07-15 | マイクロソフト コーポレイション | ピッチ追跡方法および装置 |
JP2001188600A (ja) * | 1999-12-28 | 2001-07-10 | Matsushita Electric Ind Co Ltd | 音程変換装置 |
JP2002162996A (ja) * | 2000-11-24 | 2002-06-07 | Matsushita Electric Ind Co Ltd | オーディオ信号符号化方法、オーディオ信号符号化装置、音楽配信方法、および、音楽配信システム |
JP2002268694A (ja) * | 2001-03-13 | 2002-09-20 | Nippon Hoso Kyokai <Nhk> | ステレオ信号の符号化方法及び符号化装置 |
WO2006046761A1 (ja) * | 2004-10-27 | 2006-05-04 | Yamaha Corporation | ピッチ変換装置 |
Also Published As
Publication number | Publication date |
---|---|
US8886548B2 (en) | 2014-11-11 |
EP2492911A1 (en) | 2012-08-29 |
WO2011048815A1 (ja) | 2011-04-28 |
CN102257564B (zh) | 2013-07-10 |
CN102257564A (zh) | 2011-11-23 |
JPWO2011048815A1 (ja) | 2013-03-07 |
US20110268279A1 (en) | 2011-11-03 |
EP2492911A4 (en) | 2015-04-15 |
EP2492911B1 (en) | 2017-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5530454B2 (ja) | オーディオ符号化装置、復号装置、方法、回路およびプログラム | |
US11705137B2 (en) | Apparatus for encoding and decoding of integrated speech and audio | |
KR101274827B1 (ko) | 다수 채널 오디오 신호를 디코딩하기 위한 장치 및 방법, 및 다수 채널 오디오 신호를 코딩하기 위한 방법 | |
JP6704037B2 (ja) | 音声符号化装置および方法 | |
JP5208901B2 (ja) | 音声信号および音楽信号を符号化する方法 | |
RU2459282C2 (ru) | Масштабируемое кодирование речи и аудио с использованием комбинаторного кодирования mdct-спектра | |
TWI405187B (zh) | 可縮放語音及音訊編碼解碼器、包括可縮放語音及音訊編碼解碼器之處理器、及用於可縮放語音及音訊編碼解碼器之方法及機器可讀媒體 | |
KR101275892B1 (ko) | 오디오 신호를 인코딩하고 디코딩하기 위한 방법 및 장치 | |
KR101274802B1 (ko) | 오디오 신호를 인코딩하기 위한 장치 및 방법 | |
EP2849180B1 (en) | Hybrid audio signal encoder, hybrid audio signal decoder, method for encoding audio signal, and method for decoding audio signal | |
CN1890714B (zh) | 一种优化的复合编码方法 | |
KR20100086000A (ko) | 오디오 신호 처리 방법 및 장치 | |
WO2016016724A2 (ko) | 패킷 손실 은닉방법 및 장치와 이를 적용한 복호화방법 및 장치 | |
KR20140005277A (ko) | 저-지연 통합 스피치 및 오디오 코딩에서 에러 은닉을 위한 장치 및 방법 | |
KR101809298B1 (ko) | 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법 | |
CN102265337A (zh) | 用于在多信道音频代码化系统内生成增强层的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130319 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140128 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140307 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140401 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140418 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5530454 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |