[go: up one dir, main page]

JP4793539B2 - 符号変換方法及び装置とプログラム並びにその記憶媒体 - Google Patents

符号変換方法及び装置とプログラム並びにその記憶媒体 Download PDF

Info

Publication number
JP4793539B2
JP4793539B2 JP2005095735A JP2005095735A JP4793539B2 JP 4793539 B2 JP4793539 B2 JP 4793539B2 JP 2005095735 A JP2005095735 A JP 2005095735A JP 2005095735 A JP2005095735 A JP 2005095735A JP 4793539 B2 JP4793539 B2 JP 4793539B2
Authority
JP
Japan
Prior art keywords
speech
code string
code
circuit
corresponds
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005095735A
Other languages
English (en)
Other versions
JP2006276476A (ja
Inventor
淳 村島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2005095735A priority Critical patent/JP4793539B2/ja
Priority to CA002539675A priority patent/CA2539675A1/en
Priority to US11/376,436 priority patent/US8374852B2/en
Priority to DE602006001889T priority patent/DE602006001889D1/de
Priority to EP06005553A priority patent/EP1708174B1/en
Priority to KR1020060027942A priority patent/KR100796836B1/ko
Priority to CNA2006100668263A priority patent/CN1841499A/zh
Publication of JP2006276476A publication Critical patent/JP2006276476A/ja
Application granted granted Critical
Publication of JP4793539B2 publication Critical patent/JP4793539B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、音声信号を低ビットレートで伝送あるいは蓄積するための符号化および復号方法に関し、特に、音声をある方式により符号化されて得た符号を、他の方式により復号可能な符号に高音質かつ低演算量で変換する符号変換方法および装置ならびにその記録媒体に関する。
音声信号を中低ビットレートで高能率に符号化する方法として、音声信号を線形予測(Linear Prediction: LP)フィルタとそれを駆動する励振信号とに分離して符号化する方法が広く用いられている。その代表的な方法の一つにCode Excited Linear Prediction(CELP)がある。このCELPでは、入力音声の周波数特性を表すLP係数が設定されたLPフィルタを、入力音声のピッチ周期を表す適応コードブック(Adaptive Codebook: ACB)と、乱数やパルスから成る固定コードブック(Fixed Codebook: FCB)との和で表される励振信号により駆動することで、合成音声信号が得られる。このとき、前記ACB成分と前記FCB成分とには各々ゲイン(ACBゲインとFCBゲイン)を乗ずる。なお、CELPに関しては非特許文献1が参照される。
ところで、例えば3G移動体網と有線パケット網との間の相互接続を想定した場合、各網で用いられる標準音声符号化方式が異なるため、直接接続できないという問題があった。これに対する解法としてはタンデム接続が考えられる。
図6は、タンデム接続に基づく従来の符号変換装置の構成の一例を示す図である。この従来例は、第1の音声符号化方式(方式1)を用いて音声を符号化して得た符号(第1の符号列)を、第2の方式(方式2)により復号可能な符号(第2の符号列)に変換するものである。
図6を参照して、従来の符号変換装置について説明する。尚、符号列は、音声符号化・復号の処理単位であるフレーム周期(例えば、20 msec周期)で入出力されるものとする。
符号列変換回路1100は、音声復号回路1050と音声符号化回路1060とから構成される。
音声復号回路1050は、入力端子10を介して入力される第1の符号列から方式1の復号方法により音声を復号し、復号された音声信号を音声符号化回路1060へ出力する。
音声符号化回路1060は、音声復号回路1050から出力される音声信号を入力し、これを第2の符号化方法により符号化して得られる符号列を第2の符号列として出力端子20を介して出力する。尚、音声の符号化方法および復号方法に関しては、前述の非特許文献1または非特許文献2が参照される。
以上により図6の説明を終える。
しかし、上述した従来の符号変換装置は、該符号変換に必要となる処理量が大きいという問題点があった。その理由は、入力された第1の符号列を方式1の音声復号回路により一旦復号して、前記復号により得られた音声信号を方式2の音声符号化回路により再符号化するからである。
そこで、入力された第1の符号列の非音声を復号化することなしに、方式2の符号化に変換する発明が、特許文献1に開示されている。
この技術は、符号分離部で第1の非音声符号を第1の複数の要素符号に分離し、符号変換部で第1の各要素符号を第2の非音声符号を構成する第2の複数の要素符号に変換し、この変換により得られた第2の各要素符号を多重して第2の非音声符号を出力するものである。
特開2003−76394号 M. R. Schroeder and B. S. Atal, "Code excited linear prediction: High quality speech at very low bit rates", Proc. of IEEE Int. Conf. on Acoust., Speech and Signal Processing, pp.937-940, 1985. 3GPP TS 26.090, "AMR Speech Codec; Transcoding functions"
しかしながら、上述した特許文献1に開示された発明は、第1の非音声符号を第2の非音声符号に変換する非音声符号変換部が必要となり、この変換に必要となる処理量が大きいという課題があった。
そこで、本発明は上記課題に鑑みて発明されたものであって、その目的は、処理量を低減できる符号変換装置および方法ならびにそのプログラムを記録した記録媒体を提供することにある。
上記課題を解決する第1の発明は、第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換方法であって、前記第1の符号列が音声に対応するか、非音声に対応するかを判別する第1のステップと、前記第1の符号列が音声に対応する場合には、前記第1の符号列を第2の符号列に変換して出力する第2のステップと、前記第1の符号列が非音声に対応する場合には、前記第1の符号列を用いずに前記第2の方式によって予め生成した、非音声に対応する第2の符号列を出力する第3のステップとを有することを特徴とする符号変換方法。
上記課題を解決する第の発明は、上記第1の発明において、前記第1の方式と前記第2の方式とが同一の方式であることを特徴とする。
上記課題を解決する第の発明は、第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換装置であって、前記第1の符号列が音声に対応するか、非音声に対応するかを判別する判別回路と、前記第1の符号列が音声に対応する場合には、第1の符号列を第2の符号列に変換する符号列変換回路と、前記第1の符号列が非音声に対応する場合には、前記第1の符号列を用いずに前記第2の方式によって予め生成した、非音声に対応する第2の符号列を出力する符号列出力回路とを有することを特徴とする。
上記課題を解決する第の発明は、上記第の発明において、前記第1の方式と前記第2の方式とが同一の方式であることを特徴とする。
本発明は、第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する装置において、非音声に対応する第2の方式の符号列を生成する手段、又は非音声に対応する第2の方式の符号列を予め記憶した記憶手段を有している。そして、第1の方式に準拠する第1の符号列から得られる情報、あるいはこれを復号して得た音声信号に基づいて、該符号列が音声区間と非音声区間とのいずれに対応するかを判別する。該符号列が非音声区間の場合には、生成した非音声に対応する第2の方式の符号列、又は予め記憶されている非音声に対応する第2の方式の符号列を出力するように構成されている。
本発明は、第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する場合、再符号化することに起因する処理量を低減できるという効果を奏する。その理由は、本発明においては、第1の符号列から得られる情報に基づいて、該符号列が音声区間と非音声区間とのいずれに対応するかを判別し、該符号列が非音声区間に対応する場合は、方式1による復号および方式2による再符号化を経ることなく、方式1の符号列を方式2の符号列へと変換するように構成したためである。
更に、本発明は、特許文献1に代表されるような非音声の符号列を他の方式の符号列に変換するものに比べて、大幅に処理量を低減できるという効果を奏する。その理由は、本発明は、非音声の符号列を他の方式の符号列に変換するものではなく、他の方式の非音声に対応する符号列を生成、もしくは、予め記憶しておくことにより、変換に必要となる計算や処理が必要ないからである。
本発明の実施の形態について説明する。
まず、本発明の概要と原理を説明したあと、実施例について詳細に説明する
本発明に係る方法は以下のステップを有する。
ここで、非音声とは、音声以外の音、並びに無音を意味し、例えば、無音、雑音、トーン信号等の主音以外のものを含む概念である。
ステップa: 第1の符号列に含まれる情報を用いて、前記第1の符号列が音声に対応するか、非音声に対応するかを判別する。
ステップb: 前記第1の符号列が音声に対応する場合には、第1の符号列を第2の符号列に変換する。
ステップc: 前記第1の符号列が非音声に対応する場合には、非音声に対応する第2の符号列を生成する。
本発明に係る他の方法は以下のステップを有する。
ステップa: 第1の符号列から第1の復号方法により音声信号を生成する。
ステップb: 前記音声信号を用いて、前記第1の符号列が音声に対応するか、非音声に対応するかを判別する。
ステップc: 前記第1の符号列が音声に対応する場合には、前記音声信号を第2の符号化方法により符号化して第2の符号列を生成する。
ステップd: 前記第1の符号列が非音声に対応する場合には、非音声に対応する第2の符号列を生成する。
次に本発明の作用を述べる。本発明では、第1の符号列から得られる情報に基づいて、該符号列が音声区間と非音声区間とのいずれに対応するかを判別し、該符号列が非音声区間に対応する場合は、方式1による復号および方式2による再符号化を経ることなく、方式2の符号列を生成し、出力する。
尚、ステップdにおいて、前記第1の符号列が非音声に対応する場合には、非音声に対応する第2の符号列を生成することなく、予め記憶されている非音声に対応する第2の符号列を出力するように構成しても良い。
このように、第1の符号列を方式1の音声復号回路により一旦復号して、前記復号により得られた音声信号を方式2の音声符号化回路により再符号化することに起因する処理量を、符号列に占める非音声区間の割合に応じて低減できる。
次に、本発明の実施例1について図面を参照して詳細に説明する。
図1は、本発明による符号変換装置の実施例1の構成を示す図である。
図1において、従来例の図5と同一または同等の要素には、同一の参照符号が付されている。図1において、入力端子10、出力端子20、音声復号回路1050、音声符号化回路1060は、結線の仕方が一部で異なる以外は基本的に図5に示した要素と同じである。以下では、上述した同一または同等の要素の説明は省略し、図5に示した構成との相違点、すなわち、フレームタイプ抽出回路1200と、判別回路1300と、符号列生成回路1400と、第1の切替器1110と、第2の切替器1120とについて説明する。
フレームタイプ抽出回路1200は、入力端子10を介して入力される第1の符号列からヘッダとペイロードとを分離し、前記ヘッダに含まれるフレームタイプ情報を抽出し、前記フレームタイプ情報を判別回路1300へ出力する。
判別回路1300は、フレームタイプ抽出回路1200から出力されるフレームタイプ情報を入力し、前記フレームタイプ情報が音声に相当するときは制御フラグ“0”を、前記フレームタイプ情報が雑音に相当するときは制御フラグ“1”を、前記フレームタイプ情報が無音に相当するときは制御フラグ“2”を、第1の切替器1110と第2の切替器1120と符号列生成回路1400とへ出力する。
一般的に、第1の符号列はヘッダとペイロードとからなる。前記ヘッダにはフレームタイプ情報が含まれており、これにより該符号列から復号される信号が音声に相当するのか非音声(無音や雑音)に相当するのか区別可能であり、音声復号装置は、このフレームタイプ情報に応じて音声信号または非音声信号を生成する。ここで、ヘッダおよびフレームタイプ情報の詳細については、例えば、文献“3GPP TS 26.101, “AMR Speech Codec Frame Structure”“に記載されている。
ペイロードは、前記フレームタイプ情報が音声に相当するとき、音声信号を表すパラメータ(音声パラメータ)に対応する符号からなる。ここで、音声パラメータには、例えば、LP係数、ACB、FCB、ACBゲインおよびFCBゲインがある。一方、前記フレームタイプ情報が非音声に相当するときは、ペイロードは雑音信号を表すパラメータ(雑音パラメータ)に対応する符号からなる(ペイロードの大きさは音声のそれよりも小さい)か、あるいはペイロードには何も含まれない(ペイロードの大きさがゼロ)か、のいずれかであることが多い。このことから、音声区間と非音声区間とではペイロードの大きさが異なることになる。ここで、雑音パラメータには、例えば、LP係数およびフレームエネルギーがある。
したがって、前記フレームタイプ情報の代わりに、ペイロードの大きさ、あるいは第1の符号列の大きさを用いることで、該符号列から復号される信号が音声に相当するのか非音声に相当するのかを区別することもできる。
上記の文献“3GPP TS 26.101, “AMR Speech Codec Frame Structure”“によれば、音声を12.2 kbit/sで符号化する場合、ペイロードの種類(音声、非音声または無音)と、ペイロードの大きさと、フレームタイプとの対応関係は以下の通りである。
Figure 0004793539
第1の切替器1110は、入力端子10を介して第1の符号列を入力し、判別回路1300から入力した制御フラグが“0”(音声に対応)のときは前記第1の符号列を音声復号回路1050へ出力し、前記制御フラグが”1”(雑音に対応)あるいは”2”(無音に対応)のときは第1の符号列を出力しない。ここで、前記制御フラグが“1”の場合に、第1の符号列を音声復号回路1050へ出力するように構成することも可能である。
符号列生成回路1400は、雑音あるいは無音の第1の符号列に対応した第2の符号列を生成するものであり、この第2の符号列を第2の切替器1120へ出力する。ここで、雑音あるいは無音の第1の符号列に対応する第2の符号列を生成するとは、無音の第2の符号列を生成することを意味する。例えば、第2の方式が3GPP AMRコーデックの場合には、上述のように、無音のペイロードは大きさが0bitであるので、第2の符号列はヘッダ(フレームタイプは15)のみからなる。また、例えば、第2の方式がITU-T G.711の場合には、無音に相当する符号は0xFFであるので、ペイロードはフレーム長に対応するサンプル数分の0xFF符号からなる。例えば、フレーム長が20 msecでサンプリング周波数が8000 Hzとすると、フレーム長に対応するサンプル数は160であるから、この場合のペイロードは、160個の0xFF符号からなる1280bitsのデータと考えればよい。尚、G.711の詳細については、文献“ITU-T Recommendation G.711, “Pulse Code Modulation (PCM) of Voice Frequencies”“に記載されている。
以上は、無音に相当する第2の符号列を生成する例であるが、無音の代わりに、雑音に相当する符号列を生成することも可能である。例えば、第2の方式に準拠する符号化方式により所望の雑音をあらかじめ符号化することによって、雑音に相当する第2の符号列を得ることができる。よって、無音の例と同様にして、この符号列を出力すればよい。
第2の切替器1120は、判別回路1300から入力した制御フラグが”0”(音声に対応)のときは音声復号回路1050から入力した第2の符号列を出力端子20を介して出力し、前記フラグが”1”(雑音に対応)あるいは”2”(無音に対応)のときは符号列生成回路1400から入力した第2の符号列を、出力端子20を介して出力する。ここで、前記制御フラグが“1”の場合に、音声復号回路1050から入力した第2の符号列を、出力端子20を介して出力するように構成することも可能である。
以上の如く、本発明では、音声復号回路および音声符号化回路を改造する必要がないため、標準方式に準拠した前記音声復号回路と音声符号化回路とをそのまま利用することができる。
また、入力される信号方式(第1の方式)と、出力される信号方式(第2の方式)とが、異種であっても同種であっても処理量を低減する効果は同様に得られる。例えば、入力される信号方式と出力される信号方式とが同種の信号形式の場合は、ビットレートを落とすような場合に相当し、非音声に対して出力される信号方式について、処理量を低減する効果が得られる。
本発明の実施例2について説明する。
図2は、本発明による符号変換装置の実施例2の構成を示す図である。尚、図2において、図1と同一または同等の要素には、同一の参照符号が付されている。
本実施例は、実施例1の音声復号回路1050および音声符号化回路1060とからなるタンデム接続を第2の符号列変換回路2100に置き換えることを特徴としている。
第2の符号列変換回路2100について説明する。
第2の符号列変換回路2100は、第1の切替器1110から出力される第1の符号列を入力し、音声パラメータに対応する符号毎に符号変換を実施し、前記符号変換によって変換された各符号からなる符号列を第2の符号列として、第2の切替器1120へ出力する。ここで、タンデム接続によらない符号変換の詳細については、文献“Hong-Goo Kang et al, “Improving Transcoding Capability of Speech Coders in Clean and Frame Erasured Channel Environments”, Proc. of IEEE Workshop on Speech Coding 2000, pp.78-80, 2000.“に記載されている。
本発明の実施例3について説明する。
図3は、本発明による符号変換装置の実施例3の構成を示す図である。図3において、図1と同一または同等の要素には、同一の参照符号が付されている。図3において、入力端子10、出力端子20、音声復号回路1050、第2の切替器1120は、結線の仕方が一部で異なる以外は基本的に図1に示した要素と同じである。以下では、上述した同一または同等の要素の説明は省略し、図1に示した構成との相違点、すなわち、音声信号検出回路3200と、符号列生成回路3400と、音声符号化回路1061とについて説明する。
音声信号検出回路3200は、音声復号回路1050から出力される音声信号を入力し、前記音声信号が音声に相当するときは制御フラグ”0”を、前記音声信号が非音声に相当するときは制御フラグ”1”を、音声符号化回路1061と、符号列生成回路3400と、第2の切替器1120とへ出力する。ここで、前記音声信号から計算可能なピッチ周期性、スペクトルの傾き、電力などの音声信号の特性を表す特徴量を用いて、前記特徴量が音声に対応するか非音声に対応するかに応じて、前記制御フラグに各々に対応する値を設定する。ここで、前記制御フラグは、実施例1における判別回路1300の場合と同様に、非音声を雑音と無音とに区別した割り当てとすることもできる。
例えば、前記特徴量として電力を考えた場合、最も簡単な例としては、電力が相対的に大きいときを音声に対応づけ、小さいときを非音声に対応づけることが考えられる。すなわち、電力Eが音声に対応するときは制御フラグに”0”を設定し、電力Eが非音声に対応するとき、制御フラグに”1”を設定する。尚、音声信号を音声と非音声とに分類する方法としては、文献“3GPP TS 26.094, “AMR Speech Codec; Voice Activity Detector (VAD)”“に記載されている。
なお、非音声は、雑音や無音には限定されない。例えば、トーン信号を非音声信号とみなすこともできる。この場合には、音声信号検出回路の代わりに、トーン信号検出回路を用いて、前記音声信号がトーン信号に相当するときは制御フラグを“1”とし、それ以外は制御フラグを“0”とすることが考えられる。ここで、トーン信号を検出する方法の詳細は、特許文献EP1395065”Tone detector and method therefor”に記載されている。
符号列変換回路1101は、音声復号回路1050と音声符号化回路1061とから構成される。
音声符号化回路1061は、音声信号検出回路3200から出力される制御フラグを入力し、前記制御フラグが”0”(音声に対応)のときは、音声復号回路1050から出力される第1の復号音声を入力し、これを第2の符号化方法により符号化して得られる符号列を第2の符号列として出力端子20を介して出力する。音声符号化回路1061は、制御フラグに応じて符号化処理を行う点を除けば、音声符号化回路1060と同様である。
符号列生成回路3400は、音声信号検出回路3200から出力される制御フラグが”1”(非音声に対応)のときは、無音あるいは雑音に対応する第2の符号列を生成し、前記第2の符号列を第2の切替器1120へ出力する。ここで、符号列生成回路3400は、符号列生成回路1400と同様の考え方に基づいて、無音あるいは雑音に対応する第2の符号列を生成するものである。
本発明の実施例4について説明する。
図4は、本発明による符号変換装置の実施例4の構成を示す図である。尚、図4において、図1と同一または同等の要素には、同一の参照符号が付されている。
本実施例は、実施例1の符号列生成回路1400を符号列出力回路3000に置き換えることを特徴としている。なお、これと同等の置き換えは、実施例2および実施例3へも適用可能である。
符号列出力回路3000について説明する。
符号列出力回路3000は、記憶回路3001と、出力回路3002とを有している。
記憶回路3001には、予め非音声(無音)に対応する第2の符号列が予め記憶されている。記憶されている第2の符号列は、例えば、第2の方式が3GPP AMRコーデックの場合には、上述のように、無音のペイロードは大きさが0bitであるので、第2の符号列はヘッダ(フレームタイプは15)のみからなる。また、第2の方式がITU-T G.711の場合には、無音に相当する符号は0xFFであるので、ペイロードはフレーム長に対応するサンプル数分の0xFF符号からなる。例えば、フレーム長が20 msecでサンプリング周波数が8000 Hzとすると、フレーム長に対応するサンプル数は160であるから、この場合のペイロードは、160個の0xFF符号からなる1280bitsのデータと考えればよい。尚、G.711の詳細については、文献“ITU-T Recommendation G.711, “Pulse Code Modulation (PCM) of Voice Frequencies”“に記載されている。
以上は、無音に相当する第2の符号列を生成する例であるが、実施例1の場合と同様に、無音の代わりに、雑音に相当する符号列を記憶しておき、これを出力することも可能である。
出力回路3002は、記憶回路3001に記憶されている第2の符号列を読出し、第2の切替器1120に出力する。
このように構成することにより、実施例1と同様に、第2の切替器1120からは、判別回路1300から入力された制御フラグが”0”(音声に対応)のときは音声復号回路1050から入力された第2の符号列が出力端子20を介して出力され、前記フラグが”1”(雑音に対応)あるいは”2”(無音に対応)のときは符号列出力回路3000から入力された第2の符号列が出力端子20を介して出力される。ここで、実施例1と同様に、前記制御フラグが“1”の場合に、音声復号回路1050から入力した第2の符号列を出力端子20を介して出力するように構成することも可能である。
本発明の実施例5について説明する。
上述した本発明の各実施例の符号変換装置は、ディジタル信号処理プロセッサ等のコンピュータ制御で実現するようにしてもよい。そこで、実施例5では、ディジタル信号処理プロセッサ等のコンピュータ制御による符号変換装置について説明する。
図5は、本発明の実施例5における上記各実施例の符号変換処理をコンピュータで実現する場合の装置構成を模式的に示した図である。
記録媒体6から読み出されたプログラムを実行するコンピュータ1において、第1の符号化復号装置により音声を符号化して得た第1の符号を第2の符号化復号装置により復号可能な第2の符号へ変換する符号変換処理を実行するにあたり、記録媒体6には、
(a) 第1の符号列に含まれる情報を用いて、前記第1の符号列が音声に対応するか、非音声に対応するかを判別する処理と、
(b) 前記第1の符号列が音声に対応する場合には、第1の符号列を第2の符号列に変換する処理と、
(c) 前記第1の符号列が非音声に対応する場合には、非音声に対応する第2の符号列を生成する処理と
を実行させるためのプログラムが記録されている。
また、
(a) 第1の符号列から第1の復号方法により音声信号を生成する処理と、
(b) 前記音声信号を用いて、前記第1の符号列が音声に対応するか、非音声に対応するかを判別する処理と、
(c) 前記第1の符号列が音声に対応する場合には、前記音声信号を第2の符号化方法により符号化して第2の符号列を生成する処理と、
(d) 前記第1の符号列が非音声に対応する場合には、非音声に対応する第2の符号列を生成する処理と、
を実行させるためのプログラムが記録されている。
記録媒体6から該プログラムを記録媒体読出装置5、インタフェース4を介してメモリ3に読み出して実行する。上記プログラムは、マスクROM等、フラッシュメモリ等の不揮発性メモリに格納してもよく、記録媒体は不揮発性メモリを含むほか、CD-ROM、FD、Digital Versatile Disk (DVD)、磁気テープ(MT)、可搬型HDD等の媒体の他、例えばサーバ装置からコンピュータで該プログラムを通信媒体伝送する場合等、プログラムを担持する有線、無線で通信される通信媒体等も含む。
尚、該プログラムに、(d) 前記第1の符号列が非音声に対応する場合には、非音声に対応する第2の符号列を生成する処理の代わりに、前記第1の符号列が非音声に対応する場合には、予め記憶されている非音声に対応する第2の符号列を出力する処理を行なわせるようにしても良い。この場合には、非音声に対応する第2の符号列を記録媒体6に予め記憶させておく。
図1は本発明による符号変換装置の実施例1の構成を示す図である。 図2は本発明による符号変換装置の実施例2の構成を示す図である。 図3は本発明による符号変換装置の実施例3の構成を示す図である。 図4は本発明による符号変換装置の実施例4の構成を示す図である。 図5は本発明による符号変換装置の実施例5の構成を示す図である。 図6は従来の符号変換装置の構成を示す図である。
符号の説明
1 コンピュータ
2 CPU
3 メモリ
4 記録媒体読出装置インタフェース
5 記録媒体読出装置
6 記録媒体
10 入力端子
20 出力端子
1050 音声復号回路
1060,1061 音声符号化回路
1100,1101 符号列変換回路
1110 第1の切替器
1120 第2の切替器
1200 フレームタイプ抽出回路
1300 判別回路
1400,3400 符号列生成回路
2100 第2の符号列変換回路
3000 符号列出力回路
3001 記憶回路
3002 出力回路
3200 音声検出回路

Claims (4)

  1. 第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換方法であって、
    前記第1の符号列が音声に対応するか、非音声に対応するかを判別する第1のステップと、
    前記第1の符号列が音声に対応する場合には、前記第1の符号列を第2の符号列に変換して出力する第2のステップと、
    前記第1の符号列が非音声に対応する場合には、前記第1の符号列を用いずに前記第2の方式によって予め生成した、非音声に対応する第2の符号列を出力する第3のステップと
    を有することを特徴とする符号変換方法。
  2. 前記第1の方式と前記第2の方式とが同一の方式であることを特徴とする請求項1に記載の符号変換方法。
  3. 第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換装置であって、
    前記第1の符号列が音声に対応するか、非音声に対応するかを判別する判別回路と、
    前記第1の符号列が音声に対応する場合には、第1の符号列を第2の符号列に変換する符号列変換回路と、
    前記第1の符号列が非音声に対応する場合には、前記第1の符号列を用いずに前記第2の方式によって予め生成した、非音声に対応する第2の符号列を出力する符号列出力回路と
    を有することを特徴とする符号変換装置。
  4. 前記第1の方式と前記第2の方式とが同一の方式であることを特徴とする請求項4又は請求項3に記載の符号変換装置。
JP2005095735A 2005-03-29 2005-03-29 符号変換方法及び装置とプログラム並びにその記憶媒体 Expired - Fee Related JP4793539B2 (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP2005095735A JP4793539B2 (ja) 2005-03-29 2005-03-29 符号変換方法及び装置とプログラム並びにその記憶媒体
CA002539675A CA2539675A1 (en) 2005-03-29 2006-03-14 Code conversion method and apparatus
US11/376,436 US8374852B2 (en) 2005-03-29 2006-03-16 Apparatus and method of code conversion and recording medium that records program for computer to execute the method
EP06005553A EP1708174B1 (en) 2005-03-29 2006-03-17 Apparatus and method of code conversion and recording medium that records program for computer to execute the method
DE602006001889T DE602006001889D1 (de) 2005-03-29 2006-03-17 Vorrichtung und Verfahren zur Codeumsetzung und Aufzeichnungsmedium mit aufgezeichnetem Programm für einen Computer zur Ausführung des Verfahrens
KR1020060027942A KR100796836B1 (ko) 2005-03-29 2006-03-28 코드 변환 방법, 장치 및 이 방법을 실행하는 컴퓨터용 프로그램이 기록된 기록 매체
CNA2006100668263A CN1841499A (zh) 2005-03-29 2006-03-29 代码转换装置和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005095735A JP4793539B2 (ja) 2005-03-29 2005-03-29 符号変換方法及び装置とプログラム並びにその記憶媒体

Publications (2)

Publication Number Publication Date
JP2006276476A JP2006276476A (ja) 2006-10-12
JP4793539B2 true JP4793539B2 (ja) 2011-10-12

Family

ID=36660723

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005095735A Expired - Fee Related JP4793539B2 (ja) 2005-03-29 2005-03-29 符号変換方法及び装置とプログラム並びにその記憶媒体

Country Status (7)

Country Link
US (1) US8374852B2 (ja)
EP (1) EP1708174B1 (ja)
JP (1) JP4793539B2 (ja)
KR (1) KR100796836B1 (ja)
CN (1) CN1841499A (ja)
CA (1) CA2539675A1 (ja)
DE (1) DE602006001889D1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004151123A (ja) * 2002-10-23 2004-05-27 Nec Corp 符号変換方法、符号変換装置、プログラム及びその記憶媒体
WO2008086825A1 (en) * 2007-01-18 2008-07-24 Telefonaktiebolaget Lm Ericsson (Publ) Technique for controlling codec selection along a complex call path
IL205394A (en) * 2010-04-28 2016-09-29 Verint Systems Ltd A system and method for automatically identifying a speech encoding scheme
JP6306565B2 (ja) 2012-03-21 2018-04-04 サムスン エレクトロニクス カンパニー リミテッド 帯域幅拡張のための高周波数符号化/復号化方法及びその装置
JP6929062B2 (ja) 2016-12-28 2021-09-01 キヤノン株式会社 印刷システム、印刷システムの制御方法、及びプログラム

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63231500A (ja) 1987-03-20 1988-09-27 松下電器産業株式会社 音声符号化方式
FI101439B1 (fi) * 1995-04-13 1998-06-15 Nokia Telecommunications Oy Transkooderi, jossa on tandem-koodauksen esto
JPH08330972A (ja) 1995-06-01 1996-12-13 Japan Radio Co Ltd 音声符号化装置及び音声符号化伝送速度低減方法
FI105001B (fi) * 1995-06-30 2000-05-15 Nokia Mobile Phones Ltd Menetelmä odotusajan selvittämiseksi puhedekooderissa epäjatkuvassa lähetyksessä ja puhedekooderi sekä lähetin-vastaanotin
SE516595C2 (sv) * 1998-03-13 2002-02-05 Ericsson Telefon Ab L M Kommunikationsanordning och arbetssätt för behandling av röstmeddelanden
US6766291B2 (en) * 1999-06-18 2004-07-20 Nortel Networks Limited Method and apparatus for controlling the transition of an audio signal converter between two operative modes based on a certain characteristic of the audio input signal
JP4438127B2 (ja) * 1999-06-18 2010-03-24 ソニー株式会社 音声符号化装置及び方法、音声復号装置及び方法、並びに記録媒体
US7010001B2 (en) * 2000-01-10 2006-03-07 Qualcomm, Incorporated Method and apparatus for supporting adaptive multi-rate (AMR) data in a CDMA communication system
US20020016161A1 (en) * 2000-02-10 2002-02-07 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for compression of speech encoded parameters
JP3496618B2 (ja) 2000-03-16 2004-02-16 日本電気株式会社 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
JP2001316753A (ja) 2000-05-10 2001-11-16 Japan Steel Works Ltd:The 耐食性および耐熱性に優れたマグネシウム合金およびマグネシウム合金部材
EP1198146A1 (en) * 2000-10-13 2002-04-17 TELEFONAKTIEBOLAGET LM ERICSSON (publ) Method and node for the control of a connection in a communication network
US7012901B2 (en) * 2001-02-28 2006-03-14 Cisco Systems, Inc. Devices, software and methods for generating aggregate comfort noise in teleconferencing over VoIP networks
US20030028386A1 (en) * 2001-04-02 2003-02-06 Zinser Richard L. Compressed domain universal transcoder
EP1288813A1 (en) 2001-08-28 2003-03-05 Hitachi, Ltd. System to calculate buisiness performance index
JP4518714B2 (ja) * 2001-08-31 2010-08-04 富士通株式会社 音声符号変換方法
US6985857B2 (en) 2001-09-27 2006-01-10 Motorola, Inc. Method and apparatus for speech coding using training and quantizing
US7155255B2 (en) * 2001-10-25 2006-12-26 Motorola, Inc. Communication equipment, transcoder device and method for processing frames associated with a plurality of wireless protocols
JP4108317B2 (ja) * 2001-11-13 2008-06-25 日本電気株式会社 符号変換方法及び装置とプログラム並びに記憶媒体
US6829579B2 (en) * 2002-01-08 2004-12-07 Dilithium Networks, Inc. Transcoding method and system between CELP-based speech codes
US6832195B2 (en) * 2002-07-03 2004-12-14 Sony Ericsson Mobile Communications Ab System and method for robustly detecting voice and DTX modes
DE60217859T2 (de) 2002-08-28 2007-07-05 Freescale Semiconductor, Inc., Austin Verfahren und Vorrichtung zur Detektierung von Tonsignalen
US7023880B2 (en) * 2002-10-28 2006-04-04 Qualcomm Incorporated Re-formatting variable-rate vocoder frames for inter-system transmissions
US7747431B2 (en) 2003-04-22 2010-06-29 Nec Corporation Code conversion method and device, program, and recording medium
US7433815B2 (en) * 2003-09-10 2008-10-07 Dilithium Networks Pty Ltd. Method and apparatus for voice transcoding between variable rate coders
FR2861247B1 (fr) * 2003-10-21 2006-01-27 Cit Alcatel Terminal de telephonie a gestion de la qualite de restituton vocale pendant la reception
US7505590B1 (en) * 2003-11-14 2009-03-17 Hewlett-Packard Development Company, L.P. Method and system for providing transcodability to frame coded streaming media
US20050258983A1 (en) * 2004-05-11 2005-11-24 Dilithium Holdings Pty Ltd. (An Australian Corporation) Method and apparatus for voice trans-rating in multi-rate voice coders for telecommunications
BRPI0520720A2 (pt) * 2005-11-30 2009-06-13 Ericsson Telefon Ab L M método para transcodificação de fala de um primeiro esquema de codificação de fala para um segundo esquema de codificação de fala, transcodificador de fala, e, sistema de telecomunicação

Also Published As

Publication number Publication date
EP1708174B1 (en) 2008-07-23
EP1708174A3 (en) 2006-12-20
DE602006001889D1 (de) 2008-09-04
KR20060105493A (ko) 2006-10-11
KR100796836B1 (ko) 2008-01-22
EP1708174A2 (en) 2006-10-04
US8374852B2 (en) 2013-02-12
US20060222084A1 (en) 2006-10-05
JP2006276476A (ja) 2006-10-12
CA2539675A1 (en) 2006-09-29
CN1841499A (zh) 2006-10-04

Similar Documents

Publication Publication Date Title
JP4304360B2 (ja) 音声符号化復号方式間の符号変換方法および装置とその記憶媒体
JP2002268696A (ja) 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体
KR100796836B1 (ko) 코드 변환 방법, 장치 및 이 방법을 실행하는 컴퓨터용 프로그램이 기록된 기록 매체
JP4231987B2 (ja) 音声符号化復号方式間の符号変換方法、その装置、そのプログラム及び記憶媒体
JP4396524B2 (ja) 符号変換方法及び装置
JP3746067B2 (ja) 音声復号化方法及び音声復号化装置
JP4737416B2 (ja) 符号変換方法及び装置
JP3050978B2 (ja) 音声符号化方法
JP4238535B2 (ja) 音声符号化復号方式間の符号変換方法及び装置とその記憶媒体
JP2001051699A (ja) 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
KR101013642B1 (ko) 부호 변환 장치 및 이에 이용되는 부호 변환 방법 및 그 프로그램이 기록되어 있는 컴퓨터 판독 가능 기록 매체
JP2004151424A (ja) トランスコーダ及び符号変換方法
JP2008090311A (ja) 音声符号化方法
JP2000163097A (ja) 音声変換装置、音声変換方法および音声変換プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH01261700A (ja) 音声符号化方式
JP2004078235A (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置
JP2004046232A (ja) 音声復号化装置及び音声復号化方法
JP2005165342A (ja) 音声符号化方法及び音声符号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080213

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100705

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100721

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100916

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110225

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20110307

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110629

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110712

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140805

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees