JP5226777B2 - 音声信号中に埋め込まれた隠れデータの回復 - Google Patents
音声信号中に埋め込まれた隠れデータの回復 Download PDFInfo
- Publication number
- JP5226777B2 JP5226777B2 JP2010509891A JP2010509891A JP5226777B2 JP 5226777 B2 JP5226777 B2 JP 5226777B2 JP 2010509891 A JP2010509891 A JP 2010509891A JP 2010509891 A JP2010509891 A JP 2010509891A JP 5226777 B2 JP5226777 B2 JP 5226777B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- audio
- hidden
- speech
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 44
- 238000011084 recovery Methods 0.000 title claims description 3
- 238000000034 method Methods 0.000 claims abstract description 93
- 230000008569 process Effects 0.000 claims abstract description 46
- 238000012545 processing Methods 0.000 claims description 61
- 230000005284 excitation Effects 0.000 claims description 56
- 230000015572 biosynthetic process Effects 0.000 claims description 33
- 238000003786 synthesis reaction Methods 0.000 claims description 32
- 238000001914 filtration Methods 0.000 claims description 28
- 238000002592 echocardiography Methods 0.000 claims description 26
- 230000004044 response Effects 0.000 claims description 19
- 238000004891 communication Methods 0.000 claims description 15
- 230000005540 biological transmission Effects 0.000 claims description 13
- 230000008859 change Effects 0.000 claims description 9
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 241000282485 Vulpes vulpes Species 0.000 claims 3
- 230000001413 cellular effect Effects 0.000 abstract description 6
- 230000003044 adaptive effect Effects 0.000 description 25
- 238000004458 analytical method Methods 0.000 description 20
- 238000010586 diagram Methods 0.000 description 15
- 238000001228 spectrum Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 9
- 230000006872 improvement Effects 0.000 description 8
- 230000003595 spectral effect Effects 0.000 description 8
- 230000001934 delay Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 238000013139 quantization Methods 0.000 description 6
- 238000005070 sampling Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 4
- 230000002238 attenuated effect Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000003111 delayed effect Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 210000004704 glottis Anatomy 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000008570 general process Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
- Telephonic Communication Services (AREA)
- Traffic Control Systems (AREA)
- Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Description
図1は本発明の第1の実施形態を示し、データ源1によって生成された、データ信号F(t)が、エンコーダ5によって音声源3からの音声トラック内でエンコードされ、テレビ番組用の変更音声トラックを形成する。この実施形態において、データ信号F(t)は、ユーザの移動電話機21上でテレビ番組を流すソフトウェアアプリケーションの動作を同期させるトリガ信号を運ぶ。図1に示されるように、エンコーダ5から出力された変更音声トラックは、信号発生器9において、ビデオ源7からの対応するビデオトラックと合成され、テレビ番組を運ぶテレビ信号を形成する。この実施形態において、データ源1、音声源3、ビデオ源7およびエンコーダ5は、全てテレビスタジオに置かれ、テレビ信号は、配給網11によって分配され、この実施形態において、無線周波数(FR)信号13となる。RF信号13は、テレビアンテナ15によって受信され、そのテレビアンテナは、テレビ信号を従来のテレビ受像機17へ提供する。テレビ受像機17は、ビデオトラックを示す表示器(図示せず)と、変更音声トラックを音響信号19として出力するための、図示しないスピーカとを持つ。
図2は、この実施形態において使用される携帯電話機21の主要構成要素を示す。示されるように、携帯電話機21は、音響信号を受信して、それを電気等価信号に変換するマクロフォン23を含む。これらの電気信号は、それからフィルタ51によって濾波され、(ETSIによって公表されている、標準文献EN300−903において規定されているような)典型的には300Hz〜3.4kHzの周波数帯域の外側の不必要な周波数を取り除く。濾波された音声は、それからA/D変換器53によってディジタル化され、AD変換器は、濾波された音声を8kHzのサンプリング周波数でサンプリングし、各サンプルを典型的には13〜16ビットのディジタル値によって表現する。ディジタル化された音声ストリーム(D(t))は、それから音声コーデック55に入力され、その音声コーデックは適応多重レート(ADR)コーデックであり、その動作を以下に説明する。ADRコーデック55によって出力された圧縮音声は、それからRF処理装置57へ渡され、RF処理装置は、圧縮音声で1つ以上のRF搬送信号を変調し、アンテナ27を介して基地局35へ伝送される。同様に、アンテナ27を介して受信した圧縮音声信号は、RF処理装置57へ送られ、RF処理装置は、受信したRF信号を復調して、RF搬送信号から圧縮音声データを復元し、それはAMRコーデック55へ渡される。AMRコーデック55は、それから圧縮音声データを復号して、それによって表される音声サンプルを再生し、それは、D/A変換器59および増幅器61を介してスピーカ25へ出力される。
AMRコーデック55は、良く知られ、(標準文献TS26.090版3.1.0において)3GPP標準本文によって規定されているが、それが実行する処理の一般的な説明を、読者がアプリケーションソフトウェア69によって実行される処理のその後の説明を理解できるように、図3を参照して述べる。
・ピッチ予測
・LPC分析
・固定コードブック探索
・適応コードブック
である。
LPC分析は、図3aに示されるLPC分析部71によって実行される。LPCは、(図3bに図示される)音声生産の古典的な源フィルタモデルを仮定しており、そこでは、音声は、ゆっくりと時間と共に変化するフィルタ(LPC合成フィルタ72)の出力とみなされており、そのフィルタは、母音のような、有声音声に対して規則的な声門パルスによって励振され、例えば、/sh/の無声音声に対して雑音或いは(励起ブロック74によって表される)/z/のような混合音声音に対しては2つの混合とされる。音声生産のモデルに基いているけれども、それは、また、全ての音を符号化するための有効なモデルを提供する。合成フィルタ72は、全極であると仮定され、例えば、それは共振のみ持つ。この仮定は、LPC分析方法の基礎である。サンプルされたデータ(z面)表記法において、伝達関数は、式(1)の伝達関数H(z)の分母におけるz−1の純粋に多項式である。
係数aiは、実際には、量子化するのが容易ではない。それらは、時間とともにかなり予測できなく変化し、定まらない範囲上で正および負の値を持つ。従って、AMRコーデック55は、それらの不利益を取り除き、LPC係数の効率的なコーディングを可能にする、量子化の前に、それらの係数を線スペクトル周波数に変換するLSF決定部73を使用する。係数aiは、全極合成フィルタ72の重みであり、その根を見つけるために因数に分解され得る、z−1の第P次多項式の係数である。それらの根は、合成フィルタ72における共振すなわち極である。それの極は、それらが適度に整えられたとき伝送のためにしばしば量子化され、平均意を持ち、フレームからフレームへより予想どおりに変化し、そのフレームは、aiのコーディングがなされない、ビットを省くために機会を与える。線スペクトル周波数(LSF)は、極よりこのためにさらによい。それは、全極モデルの極と同じでないが、それらが関連される、LSPを実現するために重要である。それらの導出は、複雑であるが、質的に、それは、合成フィルタの特別な表現における2組の境界条件の選択を必要とし、一方の境界条件は、声門が完全に開いているときに対応し、他方の境界条件は、声門が完全に閉じているときに対応する。これは結果として、2組の仮想の極における零帯域幅、すなわち、完全な共鳴器を生じる。
上述したように、AMRコーデック55は、また、図3bに図示されているモデルの励起部74を有する。これをするために、AMRコーデック55は、それがそれを符号化できるように、励起信号の表現を生成する。図3cに図示されるように、それは、入力音声信号を濾波することによって励起信号を生成し得る「逆」LPCフィルタ76を生成することによってこれをする。逆LPCフィルタ76から得られた励起信号は、また、時々、残余と呼ばれる。この逆LPCフィルタ78は、実際には、上述したように決定れた、同じ係数aiから規定れるが、それらを、式(5)の伝達関数を持つ全極モデルを規定するために使用する。
固定コードブック部87は、上記式(6)で規定される逆フィルタ76の重みを設定するために、現在のフレームに対するLPC分析部71から出力されるLPC係数aiを使用し、かつ、このフィルタで入力音声の現在のフレームを濾波することによって、現在のフレームに対する励起信号(ef)を生成する。それから、固定コードブック部は、励起信号において起こる新しいことを最良に満たす(固定コードブック88に格納されている)固定コードブックパルス又はパターンを識別し、それは、適応コードブック部89からの以前のフレームの励起の遅れた(遅延した)コピーを効率的に変更するだろう。
適応コードブックは、合成された励起の以前の位置の時間遅延されたコピーであり、有声音声を符号化する上で重要である。有声音声は規則的であるので、現在のピッチ周期と固定コードブック出力を使用する以前のピッチ周期との間の差のみを符号化することができる。以前の音声周期の蓄えられたコピーに加えられたとき、このフレームの励起の概算を得る。適応コードブックは伝送されず、コーダとデコーダは、以前の合成した出力と現在のピッチ遅延とから適応コードブックを計算する。
ピッチ予測器(それは適応コードブック部89の一部を形成する)の目的は、適応コードブックの為に使用する最良の遅延を決定することにある。それは2段階の処理である。第1は、単一パス開ループピッチ予測であり、それは、もし音声が有声化されまたは誤差量を最小化する最良の繰り返しレートであるなら、有声期間の推定を見つけるために、音声を前のサンプルと関係づける。この後に、サンプルの(1/6)内の適応コードブックに対する最良の遅延を得るための繰り返し閉ループ予測が続く。この理由のために、ピッチ予測は、コーダにおける適応コードブック処理の一部である。この計算は、第2のより詳細なサーチのみが少ない数のサンプル上で起こったとき、2段階法によって制限される。AMRコーデック55は、合成法による分析を使用し、出力と候補遅延の入力音声との間の平均自乗誤差を最小化することによって最良の遅延を選択する。
データF(t)が音声信号中に隠され得る種々の方法があり、読者は、IBM Systems Journal, Vol 35, no 384, 1996の「データ隠蔽のための技術(Techniques For Data Hiding)」と題名のBenderによる論文を参照でき、そこでは、音声中にデータを隠蔽するための異なった技術の詳細に論じられている。本実施形態において、データは、エコーを音声に加えることによって音声中に隠され、エコーの時間遅延は、データを符号化するために変化される。この変化は、例えば、2進零に対応するエコーのないサンプルと、2進の1方式に対応するエコーとを使用することによって、実行され得る。代わりに、2進の1が、第1の遅延でエコーの付加によって表されてよく、2進の0が、第2の異なった遅延でエコーの付加によって表されてよい。また、エコーの符号は、隠されるべきデータで変化され得る。より複雑な符号化法において、2進の1が、第1のエコーの組み合わせ又は系列(同じ時間に2以上のエコー又は続けて印加される)によって表されてよく、2進の0が、第1の異なったエコーの組み合わせ又は系列によって表されてよい。
図4は、エコーが検出され、隠れデータF(t)がAMRコーデック55の出力からアプリケーションソフトウェア69によって復元される、1つの方法を示す。示されるように、この技術において、アプリケーションソフトウェアは、図3に示されるVQ部83によって出力されたLPC符号化情報から単に隠れデータを復元する。図4に図示されるように、アプリケーションソフトウェア69によって実行される第1の処理は、VQ部91によって実行され、VQ部は、AMRコーデック55によって実行されるベクトル量子化を逆にする。それから、VQ部81の出力は、予測付加部93によって処理され、予測付加部は、(予測器95によって決定された)LSFデルタ予測をVQ部91からの出力に加える。それから、(データ記憶装置97から得られる)LSP平均は、平均付加部99によってもとに付加され、現在のフレームに対するLSFを復元する。それから、LSFは、LSF変換部101によってLPC係数にもとに変換される。したがって、決定された係数ai^は、他のAMR処理段階において実行される近似や量子化のために、図3におけるLPC分析部71によって決定されたものと正確には同じでないだろう。
上述した実施形態において、LPC合成フィルタのインパルス応答の自己相関が決定され、エコーの存在が隠れデータを復元するために決定された。図6は、隠れデータを復元するための代わりの技術に従って実行され得る処理を図示する。図4と図6とを比較することによって分かるように、この実施形態と第1の実施形態との間の主な差違は、現在のフレームに対する再生されたLPC係数ai^が、直接、LPC係数の列の自己相関を計算する、自己相関部107へ渡されていることである。従って、この実施形態は、第1の実施形態の簡易化である。しかしながら、エコー遅れでの自己相関出力におけるピークは、第1の実施形態におけるようにははっきりとは分からず、この理由のために、この簡単な実施形態は、十分な処理電力が使用可能であるとことでは好ましくない。
図7は、エコーの存在を識別しその後の隠れデータの復元のための第3の技術において実行され得る処理を図示する。図6と図7とを比較することによって分かるように、この実施形態と第2の実施形態との間の主な差異は、現在のフレームに対して再生されたLPC係数ai^が、LPC係数から上記式(3)の自己相関行列Rijを再計算するために逆レビンソーンダービン(Levinson-Durbin)アルゴリズムを使用する、逆レビンソーンダービン部114に印加されていることである。決定された値は、それ自身、入力音声信号の自己相関値に対応し、したがって、エコー又は各エコーの遅延に対応する遅れでピークを含む。したがって、逆レビンソーンダービン部114からの出力は、隠れデータを復元する前に処理され得る。この実施形態の主な利点は、逆レビンソーンダービンアルゴリズムが、比較的計算的に強力であることであり、それ故、処理電力に制限がある場合には、この実施形態は好ましくない。
上記3つの実施形態において、隠れデータは、AMRコーデック55から出力された符号化されたLPCフィルタデータを処理することによって復元される。AMRコーデック55は、提供されたLPCフィルタデータにおいてエコーを符号化し、エコーの遅延は、LPCフィルタの長さより短い。上述したように、LPCフィルタは10サンプルの次数pを持つ。8kHzのサンプリング周波数で、これは、1.25msの最大遅延に対応する。もし長い遅延を持つエコーが加えられたなら、そのとき、それは、LPC係数に符号化され得ない。しかしながら、それは、残余すなわち励起信号内で符号化されるだろう。これを図示するために、2進の1と0が、2msと10msのエコーを使用して音声中に符号化された、実施形態について説明する。
上述した実施形態に対する多数の改良について、図10、図11および図12を参照して説明する。これら改良は、隠れデータの成功した復元を増加するためになされ、エコーの存在をマスクできる音声又は部屋音響の効果を抑制するのをねらっている。これら実施形態は、上記第1の実施形態に適用されているが、それらは他の実施形態に同様に適用されるだろう。
上記実施形態において、データは、異なった遅延を持つエコーを加えることによって音声信号中に隠されている。当業者において分かるように、データが音声内に隠され、さらにAMRコーデック55を通過される、種々の方法がある。一般的な用語において、上記データを隠し回復する処理は、それぞれ、図13および図14に示される一般的なブロック図によって表されてよい。図13に示されるように、一般的はデータを隠す処理は、AMRパラメータ(それは、AMR処理において生成される、最終的なAMR出力パラメータ又は中間パラメータであってよい)を生成する、AMRコーデックによって実行される類似コーデング動作161を必要とすると考えられ得る。それらパラメータの1つ以上は、それから、音声内に隠されるべきデータに依存して163で変化される。変更パラメータは、それから、165でデコードされて、変更音声信号を生成し、その変更音声信号は、音響信号として伝送され、携帯電話機のマイクロフォン23によって受信される。フィルタリングとAD変換の後、音声コーダ167は、それから、上述したようなディジタル化された音声サンプルを処理して、変更パラメータを生成する。変更パラメータは、それから、パラメータ処理部169によって処理され、パラメータに施された変更を検出し、そして隠れデータを復元する。
上記実施形態において、データは、テレビ番組の音声内に隠され、このデータは、携帯電話機での適当な処理によって復元された。隠れデータを回復するために実行される処理は、携帯電話機の音声コーデックによって既に実行されている、処理の少なくとも一部を利用する。上述したように、本発明者らは、これが、隠れデータを復元するために必要な計算上のオーバヘッドを減少することを見つけ出した。同様の利点は、音声内に隠された実際のデータがない場合の他の応用において得られることができるが、例えば、音声は、音声それ自体の音響パターン(指紋)から識別される。これが達成され得る方法について、次に、音楽識別システムを参照して説明する。
2. スペクトログラフを分析して、それらの時間と周波数によって特徴づけられる、通常、エネルギーのピーク位置である、特性特徴を決定し、
3. これら特徴のハッシュ関数を使用し、データベースを探索してハッシュ関数の結果を使用し、音声信号とマッチする一組のエントリを決定し、
4. これら潜在マッチに対してさらなるパターンマッチングを実行して、音声信号が実際にデータベースから識別されたものといずれとマッチしているかを決定する。
多数の実施形態について、携帯電話機におけるコーデックが、隠れ情報を回復するため又は入力音声セグメントを識別するために、電話機の他の部品によって実行される引き続く処理を減少させるために使用される、方法を示して説明した。当業者は、種々の変更を認識するだろうし、改良が上記実施形態に対してなされ、それら変更の幾つかについて次に説明する。
Claims (14)
- 通信ネットワーク(39)への伝送用の入力音声信号を圧縮するための音声コーダ(55)を持つ通信装置(21)を使用して、入力音声信号から隠れデータを回復する方法であって、前記方法は、前記通信装置(21)によって実行されるものであり、前記入力音声信号を前記音声コーダ(55)を通過させて、圧縮音声データを発生する工程と、前記圧縮音声データを処理して、前記隠れデータを回復する工程とを含むことを特徴とする方法。
- 前記音声コーダ(55)は、前記入力音声に対して線形予測(LP)を実行して前記入力音声を表すLPデータを生成し、前記処理工程は、前記LPデータを処理して前記隠れデータを回復又は前記入力音声信号を識別する、請求項1に記載の方法。
- 前記音声コーダ(55)は、前記LPデータを圧縮して該圧縮LPデータを生成し、前記処理工程は、前記圧縮音声データから前記LPデータを再生する工程を含む、請求項2に記載の方法。
- 前記LPデータはLPフィルタデータを有し、前記処理工程は、前記LPフィルタデータを使用して、前記隠れデータを回復し、好ましくは、前記処理工程は、合成フィルタのインパルス応答を生成する工程又は前記LPフィルタデータに対して逆レビンソーンダービン(Levinson-Durbin)アルゴリズムを実行する工程を含む、請求項2又は3に記載の方法。
- 前記LPデータは、LPフィルタデータとLP励起データとを有し、前記処理工程は、前記LPフィルタデータおよび前記LP励起データの1つに対応する圧縮音声データの部分集合を処理して、前記隠れデータを回復する、請求項2又は3に記載の方法。
- 前記音声信号は、該音声信号の1つ以上のエコーによって規定される隠れデータを含み、前記処理工程は、前記圧縮した音声を処理して前記音声信号の中のエコーの存在を識別して、前記隠れデータを回復し、又は、前記隠れデータの各データ記号は、前記音声信号の中のエコーの組み合わせ又はエコーの系列によって表され、前記処理工程は、前記エコーの組み合わせを識別して前記隠れデータを回復する工程又は前記音声内のエコーの系列をたどって前記隠れデータを回復する工程を含む、請求項1乃至5のいずれか1項に記載の方法。
- 前記音声コーダ(55)は、予め規定された動作周波数帯域を持ち、前記エコーは、前記動作周波数帯域の予め決められた部分、好ましくは、前記動作周波数帯域上側部分の中に隠れており、前記処理工程は、前記予め定められた部分の外側の周波数を濾波して取り除くフィルタ工程を含む、請求項6に記載の方法。
- 前記処理工程は、前記音声信号の時間フレームの系列の各々に対して1つ以上の自己相関値を決定し、該決定された自己相関値を使用して前記隠れデータを回復する、請求項1乃至7のいずれか1項に記載の方法。
- 前記処理工程は、前記決定された自己相関値のハイパスフィルタリングを実行して、遅く変化する相関を取り除く、請求項8に記載の方法。
- 前記処理工程は、前記圧縮音声データからディジタル化された音声サンプルを生成することなしに、前記隠れデータを回復する、請求項1乃至9のいずれか1項に記載の方法。
- 音響信号を受信し、該受信した音響信号を対応する電気音声信号に変換するマイクロフォン(23)と、
前記電気音声信号をサンプリングして、デジタル音声サンプルを出力するA/D変換器(53)と、
前記デジタル音声サンプルを圧縮して、通信ネットワーク(39)への伝送用の圧縮音声データを生成する音声コータ(55)と、
前記音声コータ(55)に接続され、前記圧縮音声データを処理して、前記受信した音響信号内で運ばれた隠れデータを回復するデータ処理装置(115)と、
を有する通信装置(21)。 - 請求項1乃至10のいずれか1項に記載の方法を実行するように適合された、請求項11に記載の装置。
- 音声信号を表すデジタル音声サンプルを受信及び圧縮して、圧縮音声データを生成する音声コーディング手段(161)と、
前記音声信号中に隠されるべきデータを受信する手段(163)と、
該受信したデータに依存して前記圧縮音声データを変化させることによって、圧縮音声データ中に前記受信したデータを隠して、変更圧縮音声データを生成する手段と、
前記変更圧縮音声データを使用して、元音声信号を表しかつ1つ以上のエコーを介して前記隠れデータを回復した音声サンプルを生成する手段(165)と、
を有するデータ隠蔽装置(5)。 - プログラマブル処理装置に、請求項1乃至10のいずれか1項に記載の処理工程を実行させるために適合したコンピュータ実現可能命令を有する、プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GBGB0710211.4A GB0710211D0 (en) | 2007-05-29 | 2007-05-29 | AMR Spectrography |
GB0710211.4 | 2007-05-29 | ||
PCT/GB2008/001820 WO2008145994A1 (en) | 2007-05-29 | 2008-05-29 | Recovery of hidden data embedded in an audio signal |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2010530154A JP2010530154A (ja) | 2010-09-02 |
JP2010530154A5 JP2010530154A5 (ja) | 2011-07-14 |
JP5226777B2 true JP5226777B2 (ja) | 2013-07-03 |
Family
ID=38289454
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010509891A Active JP5226777B2 (ja) | 2007-05-29 | 2008-05-29 | 音声信号中に埋め込まれた隠れデータの回復 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20100317396A1 (ja) |
EP (1) | EP2160583B1 (ja) |
JP (1) | JP5226777B2 (ja) |
CN (1) | CN101715549B (ja) |
AT (1) | ATE523878T1 (ja) |
BR (1) | BRPI0812029B1 (ja) |
GB (1) | GB0710211D0 (ja) |
WO (1) | WO2008145994A1 (ja) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2460306B (en) * | 2008-05-29 | 2013-02-13 | Intrasonics Sarl | Data embedding system |
US8805723B2 (en) * | 2009-05-27 | 2014-08-12 | Iviu Technologies, Llc | Acoustically transmitting a resource identifier in multiple concurrent segments |
CN101944360A (zh) * | 2009-07-03 | 2011-01-12 | 邱剑 | 方便使用的方法和终端 |
EP3998606B8 (en) | 2009-10-21 | 2022-12-07 | Dolby International AB | Oversampling in a combined transposer filter bank |
CA2804040C (en) * | 2010-06-29 | 2021-08-03 | Georgia Tech Research Corporation | Systems and methods for detecting call provenance from call audio |
FR2966635A1 (fr) * | 2010-10-20 | 2012-04-27 | France Telecom | Procede et dispositif d'affichage de donnees vocales d'un contenu audio |
US20130053012A1 (en) * | 2011-08-23 | 2013-02-28 | Chinmay S. Dhodapkar | Methods and systems for determining a location based preference metric for a requested parameter |
WO2013144092A1 (en) * | 2012-03-27 | 2013-10-03 | mr.QR10 GMBH & CO. KG | Apparatus and method for acquiring a data record, data record distribution system, and mobile device |
CN103377165A (zh) * | 2012-04-13 | 2013-10-30 | 鸿富锦精密工业(深圳)有限公司 | 具有usb接口的电子装置 |
GB201206564D0 (en) | 2012-04-13 | 2012-05-30 | Intrasonics Sarl | Event engine synchronisation |
US9786281B1 (en) * | 2012-08-02 | 2017-10-10 | Amazon Technologies, Inc. | Household agent learning |
US10419556B2 (en) | 2012-08-11 | 2019-09-17 | Federico Fraccaroli | Method, system and apparatus for interacting with a digital work that is performed in a predetermined location |
US9473582B1 (en) | 2012-08-11 | 2016-10-18 | Federico Fraccaroli | Method, system, and apparatus for providing a mediated sensory experience to users positioned in a shared location |
US11184448B2 (en) | 2012-08-11 | 2021-11-23 | Federico Fraccaroli | Method, system and apparatus for interacting with a digital work |
JP6193395B2 (ja) | 2013-11-11 | 2017-09-06 | 株式会社東芝 | 電子透かし検出装置、方法及びプログラム |
US20160380814A1 (en) * | 2015-06-23 | 2016-12-29 | Roost, Inc. | Systems and methods for provisioning a battery-powered device to access a wireless communications network |
GB2556023B (en) | 2016-08-15 | 2022-02-09 | Intrasonics Sarl | Audio matching |
US20190189135A1 (en) * | 2017-11-02 | 2019-06-20 | Massachusetts Institute Of Technology | Method and System for Data-Hiding Within Audio Transmissions |
CN114171035B (zh) * | 2020-09-11 | 2024-10-15 | 海能达通信股份有限公司 | 抗干扰方法及装置 |
US20230368320A1 (en) * | 2022-05-10 | 2023-11-16 | BizMerlinHR Inc. | Automated detection of employee career pathways |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5457807A (en) * | 1994-03-21 | 1995-10-10 | Weinblatt; Lee S. | Technique for surveying a radio or a television audience |
JPH08149163A (ja) * | 1994-11-18 | 1996-06-07 | Toshiba Corp | 信号伝送装置及び受信装置及び方法 |
US5893067A (en) * | 1996-05-31 | 1999-04-06 | Massachusetts Institute Of Technology | Method and apparatus for echo data hiding in audio signals |
JP4062367B2 (ja) * | 1997-03-21 | 2008-03-19 | カナル プラス ソシエテ アノニム | Mpeg受信機/デコーダ及びデータをmpeg受信機/デコーダにダウンロードする方法 |
US6125172A (en) * | 1997-04-18 | 2000-09-26 | Lucent Technologies, Inc. | Apparatus and method for initiating a transaction having acoustic data receiver that filters human voice |
US6467089B1 (en) * | 1997-12-23 | 2002-10-15 | Nielsen Media Research, Inc. | Audience measurement system incorporating a mobile handset |
US6003004A (en) * | 1998-01-08 | 1999-12-14 | Advanced Recognition Technologies, Inc. | Speech recognition method and system using compressed speech data |
ES2296585T3 (es) * | 1998-05-12 | 2008-05-01 | Nielsen Media Research, Inc. | Sistema de medicion de audiencia para la television digital. |
US7155159B1 (en) * | 2000-03-06 | 2006-12-26 | Lee S. Weinblatt | Audience detection |
US20010055391A1 (en) * | 2000-04-27 | 2001-12-27 | Jacobs Paul E. | System and method for extracting, decoding, and utilizing hidden data embedded in audio signals |
GB2365295A (en) * | 2000-07-27 | 2002-02-13 | Cambridge Consultants | Watermarking key |
US6674876B1 (en) * | 2000-09-14 | 2004-01-06 | Digimarc Corporation | Watermarking in the time-frequency domain |
ES2388357T3 (es) * | 2000-11-30 | 2012-10-11 | Intrasonics S.A.R.L. | Telefono móvil para recoger datos de índices de audiencia |
AU2211102A (en) * | 2000-11-30 | 2002-06-11 | Scient Generics Ltd | Acoustic communication system |
KR100375822B1 (ko) * | 2000-12-18 | 2003-03-15 | 한국전자통신연구원 | 디지털 오디오의 워터마크 삽입/추출 장치 및 방법 |
EP1446797B1 (en) * | 2001-10-25 | 2007-05-23 | Koninklijke Philips Electronics N.V. | Method of transmission of wideband audio signals on a transmission channel with reduced bandwidth |
JP4527369B2 (ja) * | 2003-07-31 | 2010-08-18 | 富士通株式会社 | データ埋め込み装置及びデータ抽出装置 |
CN101115124B (zh) * | 2006-07-26 | 2012-04-18 | 日电(中国)有限公司 | 基于音频水印识别媒体节目的方法和装置 |
-
2007
- 2007-05-29 GB GBGB0710211.4A patent/GB0710211D0/en not_active Ceased
-
2008
- 2008-05-29 WO PCT/GB2008/001820 patent/WO2008145994A1/en active Application Filing
- 2008-05-29 AT AT08750719T patent/ATE523878T1/de not_active IP Right Cessation
- 2008-05-29 JP JP2010509891A patent/JP5226777B2/ja active Active
- 2008-05-29 US US12/601,878 patent/US20100317396A1/en not_active Abandoned
- 2008-05-29 EP EP08750719A patent/EP2160583B1/en active Active
- 2008-05-29 CN CN2008800178789A patent/CN101715549B/zh active Active
- 2008-05-29 BR BRPI0812029A patent/BRPI0812029B1/pt active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
EP2160583A1 (en) | 2010-03-10 |
EP2160583B1 (en) | 2011-09-07 |
CN101715549A (zh) | 2010-05-26 |
BRPI0812029A2 (pt) | 2014-11-18 |
CN101715549B (zh) | 2013-03-06 |
ATE523878T1 (de) | 2011-09-15 |
US20100317396A1 (en) | 2010-12-16 |
BRPI0812029B1 (pt) | 2018-11-21 |
GB0710211D0 (en) | 2007-07-11 |
JP2010530154A (ja) | 2010-09-02 |
WO2008145994A1 (en) | 2008-12-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5226777B2 (ja) | 音声信号中に埋め込まれた隠れデータの回復 | |
JP3881943B2 (ja) | 音響符号化装置及び音響符号化方法 | |
US8554550B2 (en) | Systems, methods, and apparatus for context processing using multi resolution analysis | |
JP4132109B2 (ja) | 音声信号の再生方法及び装置、並びに音声復号化方法及び装置、並びに音声合成方法及び装置 | |
US9293143B2 (en) | Bandwidth extension mode selection | |
CN114550732B (zh) | 一种高频音频信号的编解码方法和相关装置 | |
JP4445328B2 (ja) | 音声・楽音復号化装置および音声・楽音復号化方法 | |
EP2945158B1 (en) | Method and arrangement for smoothing of stationary background noise | |
JPH1097296A (ja) | 音声符号化方法および装置、音声復号化方法および装置 | |
JP5027966B2 (ja) | 入力信号をボコーディングする方法および装置およびそのためのコンピュータ読み出し可能信号を有する媒体を含む製造物品 | |
JPH11177434A (ja) | 音声符号化復号方式 | |
JP2000357000A (ja) | 雑音信号符号化装置および音声信号符号化装置 | |
JP4420562B2 (ja) | 背景ノイズが共存する符号化音声の品質を向上させるためのシステムおよび方法 | |
WO2004097798A1 (ja) | 音声復号化装置、音声復号化方法、プログラム、記録媒体 | |
JPH11504733A (ja) | 聴覚モデルによる量子化を伴う予測残余信号の変形符号化による多段音声符号器 | |
JP2004302259A (ja) | 音響信号の階層符号化方法および階層復号化方法 | |
JP6713424B2 (ja) | 音声復号装置、音声復号方法、プログラム、および記録媒体 | |
JP2004301954A (ja) | 音響信号の階層符号化方法および階層復号化方法 | |
JP2002149198A (ja) | 音声符号化装置及び音声復号化装置 | |
JP4826580B2 (ja) | 音声信号の再生方法及び装置 | |
JPH034300A (ja) | 音声符号化復号化方式 | |
JPH01314300A (ja) | 音声符号化復号化方法とその装置 | |
JPH09179588A (ja) | 音声符号化方法 | |
JPH0537393A (ja) | 音声符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110527 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110527 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130128 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130220 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130314 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5226777 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160322 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |