[go: up one dir, main page]

JP2006504327A - 通信リンク間の遅延トレードオフ - Google Patents

通信リンク間の遅延トレードオフ Download PDF

Info

Publication number
JP2006504327A
JP2006504327A JP2004546591A JP2004546591A JP2006504327A JP 2006504327 A JP2006504327 A JP 2006504327A JP 2004546591 A JP2004546591 A JP 2004546591A JP 2004546591 A JP2004546591 A JP 2004546591A JP 2006504327 A JP2006504327 A JP 2006504327A
Authority
JP
Japan
Prior art keywords
delay
encoding
data
jitter buffer
full
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004546591A
Other languages
English (en)
Other versions
JP4426454B2 (ja
Inventor
ステファン ブルーン,
Original Assignee
テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テレフオンアクチーボラゲット エル エム エリクソン(パブル) filed Critical テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Publication of JP2006504327A publication Critical patent/JP2006504327A/ja
Application granted granted Critical
Publication of JP4426454B2 publication Critical patent/JP4426454B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L5/00Arrangements affording multiple use of the transmission path
    • H04L5/14Two-way operation using the same type of signal, i.e. duplex

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Telephonic Communication Services (AREA)
  • Communication Control (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Bidirectional Digital Transmission (AREA)
  • Near-Field Transmission Systems (AREA)
  • Optical Communication System (AREA)

Abstract

本発明では、全二重通信に利用可能な遅延量が、各リンク間で、それらのアクティブ状態、現在および最近の履歴に応じて分配される。全二重通信システム内のリンクがアクティブであるか非アクティブであるか追跡すること、すなわち、転送されるデータの情報値を知ることにより、逆方向のリンクが同時に非アクティブである場合には、通常許容されるものより大きい符号化遅延を持つ符号化手順をアクティブリンクに使用することができる。ユーザの遅延に対する敏感さはリンクがアクティブになる時に最大になるので、リンクがアクティブになる瞬間には通常使用されるものより小さい符号化遅延を持つ符号化手順が割り当てられる。符号化遅延はその後増大される。好ましくは、往復遅延は要求される最大値よりも小さく保たれるように制御される。

Description

本発明は、通信ネットワークの端末間の全二重通信に関し、特に、通信システム内の遅延時間の処理に関する。
単純な電話技術から先進マルチメディア通信に至る各種通信サービスにおいて、遅延は非常に重要なパラメータである。会話型サービスは、通信リンクの終端にいるユーザ間の対話性を特徴とする。遅延、より正確には往復遅延は、対話感、ひいてはサービス品質に重要な影響を及ぼす。通信ネットワークを介して対話する通話者同士は、あたかも同じ場所にいるかのように、同じ方式で対話できる必要がある。そのため、その通信手段はできるだけ目立たないものであるべきである。往復遅延が高いと応答時間が長くなる。そのような長い応答時間はたいてい会話の流れを乱し、それが対話者によって相手側からの躊躇と解釈されることもあり、不快な対話待ち時間を生じることもある。現代の人々は極めて迅速な応答を受け取ることに慣れており、比較的短い遅延でさえもフラストレーションを生じ得る。ゆえに、往復遅延が高いと、対話性が著しく低下する。さらに、往復遅延が高すぎる場合、不十分な電気または音響エコー消去が通信品質に影響を及ぼし得る。
その一方で、伝送の観点からは、各通信リンク上では遅延は必要なものである。伝送自体の基本的な遅延のみならず、情報源符号化の高効率化と伝送不全に対処するよりよい戦略のためには、符号化遅延が必要である。符号化遅延は一般に、情報源符号化、チャネル符号化、インターリービング、符号化変調などに使用され、これによって符号化利得が向上し、伝送性能を低下させることなく送信パワーを低減することができる。本開示の場合、パケット伝送の場合のジッタバッファリングのための遅延も符号化遅延とみなす。したがって、遅延は重要であり、問題のない伝送を提供するために必要ですらある。あるリンク上の全遅延の総和が、マウスツーイヤー(mouth-to-ear)遅延とも呼ばれる終端間遅延(end-to-end delay)である。さらに、最初の伝送とその応答のそれぞれでの終端間遅延の総和が、往復遅延(round-trip delay)である。
伝送の観点からすると遅延は有益であるが、会話型サービスに許容可能なサービス品質を提供するためには、遅延は一定の限度内に保たれる必要がある。したがって、符号化遅延を用いて達成される符号化利得と、その結果生じる往復遅延による対話性の損失とでトレードオフする必要がある。
あらゆる通信サービスは、何らかの方法で符号化利得と遅延とのトレードオフを行っている。現在のGSMシステムにおけるAMR電話技術サービスにおける、回線交換伝送を用いた音声通信の一例を示す。情報源符号化は25msの遅延を伴い、FR音声トラフィックチャネル上のインターリービングを含むチャネル符号化は、37.5msの遅延を伴う。これに加えて、例えば、ディジタル信号処理およびアナログ信号処理、電波バースト生成、変調および復調、無線伝送、基地局とトランスコーダの間のAbisインタフェース上のシリアル伝送などで、一定の遅延が生じる。これらの遅延は、その音声接続の期間は固定である。
インターネットにおける電話技術サービスおける、パケット交換伝送を用いた音声通信の一例を示す。この場合、送信側でのアナログ信号入力から受信側でのアナログ出力までの終端間遅延は、他の原因を無視すると、送信側から受信側へのデータパケットの伝送時間、伝送遅延変動に対処するためのジッタバッファ、および送信側と受信側における非同期サンプルクロックを相互に整合させるサンプル同期技術によって生じる。受信側でのジッタバッファ遅延は、回線交換伝送の例におけるチャネル符号化による遅延と等価であるとみなすことができる。回線交換伝送の例とは異なり、終端間遅延は変動し得る。これらの変動は、終端間遅延を低く保ちつつパケット損失数を最小限に抑えようとする適応ジッタバッファ技術により生じる。輻輳などによる伝送条件の変化はジッタバッファサイズの調整をもたらし、その結果、終端間遅延の変動が生じる。サンプル同期には、やはりジッタバッファサイズを変更するときに適用可能な先進的な技術がいくつか存在する。これは、単純な信号サンプルの挿入または削除から時間軸操作にまで及び、目立った人為的影響を生じずに、異なる速度で信号を再生することを可能にする。
半二重通信チャネルは、一度に双方向ではなくどちらか一方向にデータを搬送することができる。これは、半二重チャネルが音声通信に使用された場合、アクティブなパートナから発せられた信号だけがパッシブなパートナに送信され、パッシブからアクティブなパートナには信号が送信されないことを意味する。そのようにして、伝送リソースは、通信パートナ間で、その現在のアクティブ状態に応じてシフトされる。半二重チャネルによる通信は、それに従って一度に1つの会話リンクだけがアクティブになる非対称特性を利用する。したがって、厳密に一度に1つという原則が満たされなければならないため、半二重チャネル上の対話性は厳しく制限される。
米国特許第6,182,032B1号では、半二重または片方向通信に適用可能な通信方法が提示されている。片方向通信ではフィードバックが存在しないため実際の遅延はあまり重要ではなく、したがって、リンクが片方向通信リンクであることが判明した場合、信号遅延を増大させることができる。そのため、符号化遅延などを変更し、ビットレートを低下させることが可能である。これにより、無線リソースに対する需要が低減され、利用可能なシステムリソースのより効率的な利用が可能になる。この方法は、ボイスメールやメッセージサービスなどで片方向通信が期待される場合、すなわち、端末(terminal)が音声データの送信機(source)または受信機(sink)のどちらかとして機能しその両方としては機能しない場合には、有用であると考えられる。しかしながら、本開示では、この解決法は全二重の状況には適用できないと判断するものである。
従来の全二重通信システムの概略的な問題は、その通信システム内の限られた利用可能なリソースの容量の範囲内で対話性とサービス品質との間でトレードオフが必要なことである。
したがって、本発明の一般的な目的は、遅延トレードオフの能力を改善する方法およびシステムを提供することである。本発明の別の目的は、遅延トレードオフのために会話型通信の非対称特性を利用する方法およびシステムを提供することである。
前述の目的は、添付の特許請求の範囲による方法およびシステムにより達成される。概略的に述べると、全二重通信に利用可能な遅延量(delay budget)は、各リンク間で、それらのアクティブ状態、現在および最近の履歴に応じて分配される。全二重通信システム内のリンクがアクティブであるか非アクティブであるかを追跡すること、すなわち、転送されるデータの情報値を知ることにより、逆方向のリンクが同時に非アクティブである場合には、通常許容されるものより大きい符号化遅延を持つ符号化手順をアクティブリンクに使用することができる。ユーザの遅延に対する敏感さはリンクがアクティブになる時に最大になるので、リンクがアクティブになる瞬間には、通常使用されるものより小さい符号化遅延を持つ符号化手順が割り当てられる。符号化遅延は、その後増大される。好ましくは、往復遅延は要求される最大値より小さく保たれるように制御される。
本発明の利点は、会話型サービスを展開するシステムにおけるサービス品質を向上させることができ、また、システム容量を向上できることである。これらの改善は、知覚される往復遅延または実際の全二重の実行可能な能力を悪化させることなく実現できる。
本発明ならびにその他の目的および利点は、以下の説明を添付の図面と併せて参照することにより十分に理解されよう。
従来のシステムでは、往復遅延を論じるとき、通常は、そのシステムが対称型である、すなわち、どちらの方向にも同じ量の情報が転送されると想定される。したがって、両通信方向を等価とみなすべきであるというのが共通の前提とされており、したがって、符号化遅延量(coding delay budget)は、両通信方向に等分に分配される。
しかしながら、異なる方向に転送されるデータの長期平均特性が概ね対称である場合であっても、全二重会話型通信におけるリンクの瞬時特性は対称ではない。実際には強い非対称性が存在する。したがって、多くの会話型サービスの重要な特性は、所定の時間に必要とされる伝送リソースは非対称であるということである。これは、会話においては普通、一方の側がアクティブである間、他方は聴いており、あるいは多人数による通信の場合には、その他の通話者が聴いているからである。このことを考慮すれば、往復遅延は時間的な変動に関連するといえる。非常に重要な瞬間は、通信方向が変わるときである。というのは、それが応答時刻と同一だからである。システムのユーザにとっては、非アクティブ状態に対応するデータ、すなわち、無視し得る情報値のデータに対応するデータが遅延され、あるいは劣悪な品質で届いても問題にはならない。
現在の技術水準における方法では、回線交換伝送であれパケット交換伝送であれ、会話型サービスで伝送される信号が、時間変化する符号化利得を有するとともに、その現在の信号の種類に応じた遅延要求を有する、という事実が見過ごされている。例えば、アクティブ音声は非アクティブ状態信号よりはるかに高い情報内容を有しており、そのため、アクティブ音声に対しては、より高い符号化遅延を要する高効率な情報源符号化やチャネル符号化が必要になる。
しかしながら、現在のモバイル音声通信システムは、情報源により制御されるレート(Source-Controlled-Rate : SCR)動作によって、会話音声は例えばアクティブ音声と無音区間を伴って時間的に変化する過程であるということを利用している。この種の動作は例えば、瞬時ビットレートを現在の入力信号のビットレート要求に適合させ、基本的に音声休止時の伝送を停止する間欠伝送(Discontinuous Transmission : DTX)モードを用いたシステムで使用される。SCR動作は非アクティブ雑音信号の高符号化遅延を伴うことがある。SCR動作は、現在の信号がアクティブ音声か無音かを検出するVAD(Voice Activity Detector)を利用する。つまりSCR動作は、音声信号はその内容に応じて時間変化するビットレートを要求することを利用している。しかし、SCR動作を用いる場合もそうでない場合も、遅延を信号に適合させることで符号化利得を制御しようとする試みはこれまで行われてこなかった。タイミングの問題が生じることになるからである。したがってこれまでの符号化はそのありうべき状態よりも効率が低いものであったといえる。
本発明の利点を明らかにするため、まずは、典型的な会話状況での従来技術の手順を図1に示す。ここでは、要求される最大往復遅延は500msであると想定する。この値は概ね適切なエコー消去を想定した大部分のシステムにおいて許容され得るものであるが、以下の例における遅延の値は、単に、カウントするためのものを提供する例にすぎない。本発明はいかなるサイズの遅延にも適用できる。この従来技術による第1の例では、利用可能な遅延は、各方向に250msずつに2等分される。
2人のユーザU1とU2とが会話している。時刻t0では、ユーザU1がアクティブであり話をしている。ユーザU1側のT(送信)レベルを示す網掛け部分の音声は、ユーザU2側のR(受信)レベルを示す別の網掛け部分の音声を受け取るユーザU2に、250msの遅延で伝送される。ゆえに、時刻t0にユーザU1によって与えられる情報は、時刻t1にU2によって受け取られる。ユーザU1は、時間t2まで話し続ける。この発話の終了は、ユーザU2からの応答を誘発する。この発話の終了は、通常の250msの遅延で、時刻t3にU2に提示される。ユーザU2は反応時間Δt1の間をもって自分の応答を開始し、時刻t4には、ユーザU2がアクティブになり話を始める。U2の発話の開始は、時刻t5にU1に届く。ユーザU1は、合計応答時間Δt2を体験し、これは、実際の反応時間Δt1と両通信方向での遅延との和である。すなわち、知覚される遅延時間は以下のようになる。
Δt2=Δt1+250ms+250ms
応答時間Δt2が大きくなりすぎると会話することが困難になる。しかしながら、この応答時間は、多かれ少なかれ、一方の方向での発話の開始によってのみ知覚される。連続した音声の流れの間は、遅延に対する敏感さは一般に、はるかに小さい。
U2は話し続ける。時刻t6に、U2は、U1による割込み応答を誘発する何らかの情報を与える。この情報は時刻t7にU1に到達する。時刻t8にユーザU1によって発話が開始されるまでの反応時間はΔt3である。この発話の開始は時刻t9にU2に到達し、合計応答時間Δt4となる。上記と同様に表現するならば、以下のようになる。
Δt4=Δt3+250ms+250ms
図1では、ほとんど常に、ユーザの少なくとも一方が非アクティブであることが容易に認められる。そのような期間中、無音を表すデータの遅延は、会話の容易さの経験には全く無関係である。多くの場合、前述のように、実際の無音信号は転送すらされず、コンフォートノイズまたはSID(無音記述子)パラメータが送信される。本発明は、この非対称性を用いてシステムにとっての利点をもたらす。
この例と、以下の2つの例では、実際の伝送遅延が既知であると仮定する。通常、伝送遅延は一定の統計的分布を有する。その詳細については後述するが、最初の例では、説明を簡単にするために、伝送遅延は既知であって一定であるとする。
図2に、本発明の場合を示す。この第1の簡単な例では、本発明の基本的概念の理解を容易にするために、一度に1人のユーザだけが話すものと仮定する。同図の上部に、図1と同様に2人の会話するユーザのアクティブ期間の図を遅延時間および音声到着時刻と共に示す。同図の中央には、異なる方向での伝送の遅延時間を示す。T1はユーザU1からユーザU2への伝送であり、T2はユーザU2からユーザU1への伝送である。
時刻t10ではユーザU1が話し、ユーザU2は無音である。この音声は、同図中央の遅延方式に従い、そのユーザU2への符号化/復号化、転送などの間に350ms遅延される。このため、ユーザU2は時刻t11にその音声を知覚する。逆方向には情報値のあるデータは転送されないので、逆方向のデータの遅延時間は重要ではない。ユーザU1は時刻t12に話すのを止め、それが、350ms遅延されて、時刻t13にユーザU2によって認められる。ユーザU2は、反応時間Δt5の間にこの停止に反応し、時刻t14に応答を送信し始める。ユーザU2がアクティブになると、この転送方向の遅延が重要なものになる。このため、図2中央のT2遅延(T2 DELAY)チャートに示すように、その発話開始には遅延の少ない転送モードが用いられる。ここでは150ms遅延の転送モードが用いられる。よって、時刻t14に生じた発話開始は、時刻t15にユーザU1に提示される。このときユーザU1は、以下のようにΔt6の応答時間を知覚する。
Δt6=Δt5+350ms+150ms
つまり、応答開始は、従来技術を用いた場合と全く同じ往復遅延でユーザU1に提示されることになる。
しかし、150ms遅延の転送は非常にリソース要求が厳しく、あるいは音質が低下する。したがって、より高遅延の転送モードへの変更が要求される。ユーザU1は非アクティブであり、短い期間の後、この実施形態では、時刻t16で、転送モードが350ms遅延のモードに向けて変化していく。この変化は時刻t17まで続き、遅延は漸近的にその最終値に接近する。U2側では、間隔Δt7の音声がU1に送信されて、Δt8の時間間隔内に受信される。Δt8の継続期間はΔt7より長いため、音声を徐々に遅延させる必要がある。この遅延は、送信側、または好ましくは、受信側で、伸長技術や、2単語間などへの短い無音間隔の挿入などによって処理される。これについては、以下でさらに詳細に説明する。この場合、ユーザU1は、発話の途中ではこの付加的な遅延にほとんど気付くことはない。
次に、U2からU1への発話は350msに増大した遅延で転送される。ユーザU2は、時刻t18に非アクティブになり、この非アクティブ状態が時刻t19にU1に提示される。次いでユーザU1は、自分の応答を準備することができる。
本発明による通信の主要部分が、増大した遅延(本例では350ms)の転送モードを用いて実行されることが直ちに理解されよう。同時に、発話開始往復遅延が(本例では500msに)維持される。
この有効な付加的な遅延時間は、異なる方式でも利用することができる。図2の下部に2つの例を示す。第1の例では、増大した遅延を用いて伝送リソース要求が低減される。点線は、従来の遅延量によるリソース要求に相当する。実線は、本発明の実施形態を用いたときのリソース要求を表す。結果としてリソース要求が全体的に削減されることがわかる。時刻t14、すなわちユーザU2の応答開始時には、使用される転送モードはわずか150msの遅延しかなく、これは、伝送リソースが通常より高い度合いで使用されていることを意味する。しかし、この高いリソース利用が必要とされる期間は非常に短く、そのため平均のリソース利用は著しく低減される。この場合のリソース利用のピークは発話開始時に発生し、その発生時期は全期間にわたって統計的に分散しているから、多数の会話を処理する大規模なシステムでは、このピークがリソース利用をわずかに増大させることにはなる。しかしながら、その他の期間における大きな削減に比べれば、この増大は実際にはごくわずかなものにすぎない。
この有効な増大した遅延時間を利用する別の方法は音声の品質を向上させるものである。より好適な符号化を適用できるため、これによって品質を向上させることができる。これを図2の最下部に示す。図では、品質尺度が、会話型通信全体についての時間の関数として示されている。会話の平均品質が向上していることがわかる。しかしながら、リソース利用の場合と対比すると、低遅延が使用される発話開始時においては状況が異なる。すなわち、発話開始時には音声品質が低下する一方、使用される遅延が増大すると急速にそれが回復することが示されている。
この増大した有効な遅延は他の多くの方法にも利用できることは当業者には理解されよう。例えば、品質向上とリソース要求の組み合わせを考慮することが可能である。
これらの利点を達成するために払うべき代償は、全て会話で音声方向が変化する都度の200msの遅延である。好適にはこの遅延は連続音声の中に埋もれてしまうので、ユーザはおそらく、この遅延に全く気付かないであろう。ただし、その応答時間、すなわち、発話開始時の往復時間は、悪影響のない会話を行うためには非常に重要なものであり、不変のままである。
上記の例では、会話するユーザ同士は非常に行儀がよく、相手側が話し終えるのを待ってから応答した。しかし実際の会話には、割込みや同時2方向音声なども含まれるのが通常である。上記の方法は、そのような状況でさえも性能向上を提供する。ユーザが遅延に関連する煩わしさを最も感じやすい最も重要な時は、ユーザの一方の発話開始時である。前述の解決法は、他方のユーザの発話継続中に発話開始が発生したときでさえも、その問題を解決する。しかし、発話開始後に遅延時間が増大するため、双方の話者が話し続けると実際の往復遅延が増大することになる。おそらく、これはあまり重要なものではない。というのは、会話者同士は自分自身の発話に専念しており、したがっておそらく、わずかに付加した遅延にはあまり敏感でないからである。
しかしながら、そのような応答時間の増大が許容され得ない状況も考えられよう。そのような場合とは例えば、強い暗騒音環境の下で、その暗騒音によって非アクティブ状態が誤ってアクティブ音声と判定されてしまうような場合である。しかし本発明の好ましい実施形態は、こうした状況にも対処するものである。
図3に、別の例を示す。この場合もやはり、最大500msの合計往復遅延が想定され、150msないし350msの遅延時間を有する転送モードを用いることが可能である。
時刻t20で、ユーザU1が話している。その音声は350msの遅延で転送され、時刻t21にユーザU2に届く。ユーザU2に到達した情報は、そのユーザによる割込みを誘発し、ユーザU1がその発話を終える前に応答を開始する。応答時間Δt9の後、ユーザU2は時刻t22にその応答を開始し、150msの遅延時間を使用する。その応答の開始は時刻t23にユーザU1に到達し、合計応答遅延はΔt10になる。この遅延は、上記と同様に示すと以下のようになる。
Δt10=Δt9+350ms+150ms
応答がユーザU2に到達すると、両通信方向とも同時にアクティブになる。したがって、ユーザU1の音声の転送モードは、より短い遅延、好ましくは、合計許容往復遅延の半分、すなわち250msの転送モードに変更される必要がある。ユーザU2の発話開始の到着の直前、すなわち時刻t23の直前に転送されたユーザU1の音声は、高遅延を伴って転送される。時間Δt11の間、転送モードは徐々に変更されて250msの遅延に接近し、最終的にはそれが用いられる。したがって、時間Δt11における音声は、それよりもわずかに短い時間間隔Δt12の間にユーザU1に提示される。これは、ある種の音声時間圧縮または情報廃棄が行われるべきことを示唆する。これについては以下でより詳細に論じる。ここでは、ただ、何らかの音声時間圧縮が行われることだけに留意する。
ユーザU1からユーザU2への音声転送の遅延が低減されると、その逆方向は、利用可能な遅延分配のより大きい部分を使用できるようになる。したがって、U2からU1への転送の遅延は、好ましくは徐々に増大する。本実施形態では、この増大は、時間間隔Δt12で行われ、これは、時刻t25に生成された音声が250msの転送遅延を伴うことを意味する。間隔Δt12のU2の音声は、時間Δt13の間にユーザU1に届く。Δt13の継続期間はΔt12の継続期間より長いため、音声伸長処理を適用する必要がある。これについては以下でより詳細に論じる。
時刻t26でU1の発話が終了し、U1からU2へのリンクが非アクティブになる。伝送遅延は250msであるため、U2に届く発話の終了は時刻t27に起こる。この時点で一方の方向が非アクティブであり、これは、本発明によれば、利用可能な遅延バッファの大部分がアクティブリンクによって利用され得ることを意味する。その後、時間Δt14の間に、U2からU1への情報転送遅延が250msから350msに増大する。受信側では、時間Δt15内にその音声が受け取られ、これは、この場合もやはり音声伸長処理を実行すべきことを意味する。最後に、時刻t28でU2によって生成された音声は、ユーザU1への転送の間に350msの遅延を伴う。
時刻t29で、ユーザU1は再びアクティブになり、このアクティブ状態の開始は時刻t30にユーザU2に到達する。このイベントは、両方向でのデータ転送遅延の動的調整を再び誘発することになる。
図3の下部には、異なる時に異なる方向で用いられる転送遅延のチャートが示されている。両ユーザが同時に話しているときには、本発明の効果の度合いは基本的には失われることがわかる。しかし、1ユーザだけが話している期間には、本発明は従来技術のシステムと比べて全般的に利点を生み出す。
上記の例から、本発明の基本原理は、実際に同時に全二重の会話が行われるときにも用いられ得ることがわかる。好ましくは、そのような場合、音声圧縮および伸長を処理する機構を用いて、厄介な損失や目立った休止を伴わずに、音声をできるだけスムーズにユーザに提示させる。
異なる方向にデータによって運ばれる情報値の判定を得ることにより、転送モード、例えば、異なる符号化遅延を有するモードの動的割り当てを実行することができる。ゆえに、符号化遅延は、伝送されるデータの内容の値の判定に依存することになる。この情報値は、データを搬送するリンクがアクティブかそれとも非アクティブかの値とすることができる。両方向の情報値を判定することにより、一方向だけがアクティブである期間を判断できる。そのような期間中には、従来から使用されているものより大きい符号化遅延を有する転送モードを利用することができる。ゆえに、アクティブリンクでの遅延は、逆方向のリンクが非アクティブであるとき、要求される最大往復遅延の半分を上回る値まで増大し得る。しかしながら、そのような改善された遅延と最大往復遅延との間の差は、応答転送によって生じる遅延を許容する必要がある。ただし、この応答転送は非常に低い符号化遅延を持ち得る。というのは、それは短期間だけしか利用されないからである。
本発明は、異なる種類の会話型システムで使用することもできる。転送される信号は、音声信号もビデオ信号も表し得る。音声信号の場合、非アクティブ状態は、例えば、無音、暗騒音および/または一定の時間不変信号であると定義することができる。ビデオの場合、非アクティブ状態は、例えば、画像なし、暗騒音および/または静止であると定義することができる。これらの「非アクティブ」状況に共通するのは、伝送データの情報値がないか、または非常に低く、その内容が受信側に影響を及ぼさないことである。
本発明は、2者を超える参加者を持つ多人数通信システム(会議など)にも適用することが可能である。この場合、通常は、1人の通話者がアクティブであり、他のすべての(非アクティブ)通話者へのリンク上で高符号化遅延を得る。アクティブな通話者の変更の場合、アクティブになろうとする通話者から前にアクティブだった(または依然としてアクティブな)通話者に送信される開始には低符号化遅延が適用される。新しいアクティブ通話者から以前に非アクティブであった通話者へのリンク上には、開始時でも高遅延が使用され得る。
上記の例では、3つの遅延レベルが適用されている。しかしながら、複数の、任意の数の遅延レベル、ならびに種々の連続または擬似連続遅延レベルに基づく解決法を適用してもよい。より多くの遅延レベルが利用可能であるほど、この方法はより効率的になり、データの圧縮/伸長がより容易になる。そのような複数の符号化遅延レベルは、好ましくは、1組の所定の符号化方式に基づくものである。
前述の解決法による実際の効果について、1つはパケット交換伝送を伴い、1つは回線交換伝送を伴う2つの別の例によって、さらに説明することができる。
このパケット交換伝送の例では、アクティブリンクとパッシブリンクの間で分配される合計遅延量が400msであると想定する。送信側から受信側へのパケット伝送遅延の所与の配分があり、説明を簡単にするために、それは両方向で同一であると想定する。典型的な遅延配分では、小さい遅延の可能性が高く、大きい遅延の可能性はゼロではないが低いと想定することができる。現状の方法では、両通信方向のジッタバッファに最大200msが割り当てられることになる。この場合、200msの時間内に到着するすべてのパケットを適正に復号化することが可能である。すべてのその後のパケットは紛失パケットとみなされることになる。この例では、遅延配分は、時間内に到着しないパケットの可能性が3%になるように想定される。
本発明による方法では、アクティブリンクに例えば350msを割り当てることができる。アクティブリンクでは、時間内にパケットを受け取らない可能性が例えば1%に低下し、品質改善をもたらす。非アクティブリンクには、2つの基本オプションがある。1つのオプションは、遅延量の中から残りの50msの遅延以下を使用するものである。これはパケット紛失率の増大をもたらすが、あまり重要でない非アクティブ信号に関連するものであるため、許容されるはずである。もう1つのオプションは、リンクが非アクティブである間は、高符号化遅延(すなわちジッタバッファ長)を維持するものである。いずれの場合も、遅くともリンクがアクティブになり始めるときに、50msの低遅延に拘束されるはずである。というのは、それがその会話での応答を搬送するからである。ジッタバッファは、発話開始を運ぶ最初のパケットを受け取り次第、それに応じて調整される。非アクティブリンクが50msに切り換わると、350msジッタバッファ中の残りの情報は、重要な情報を喪失することなく廃棄され得る。短いジッタバッファによる符号化利得の喪失を補償するために、開始には、冗長パケット伝送や、より小さいパケットでの伝送など、よりコストの高い伝送技術が適用され得る。そのような高速な開始伝送の後で、符号化遅延、すなわちバッファサイズは、好ましくは、可能な限り連続して350msのアクティブリンクの遅延まで増大するはずである。遅くともジッタバッファがその最大長に到達するときに、パケット伝送は、余分な冗長性がなく、通常サイズのパケットを持つ通常モードに戻され得る。
上記の例での解決法の効果は、通信品質の向上である。
回線交換伝送の例では、符号化に利用可能な合計遅延量は125msであると想定される。2者間通信での最新の解決法は、順方向リンクと逆方向リンクがそれぞれ、62.5msの利用可能符号化遅延を得るように、遅延量を等分に分配するはずである。25msは、例えば、情報源符号化に使用され、37.5msはインターリービングを含むチャネル符号化に使用される。さらに、アクティブリンク上の伝送は、0.5%のフレーム消去率を達成するために、出力レベルTXlev_A-Bを必要とすると想定される。非アクティブの逆方向リンク上では、DTXがTXlev_A-Bの1/8の平均出力レベルで使用される。本発明による解決法は、アクティブリンク上の遅延を82.5msまで増大させ、非アクティブリンク上での遅延を42.5msまで減少させることである。これは、例えば、アクティブリンク上の符号化利得が1dB増大させることができ、非アクティブリンク上の符号化利得は3dB減少する。ゆえに、アクティブリンク上の1dBの低減出力と、非アクティブリンク上の3dBの増大出力を用いて同じ伝送性能が達成される。順方向と逆方向両方の通信リンクを考慮した合計伝送出力バジェットは、
(1+1/8)*TXlev_A-B=1.125*TXlev_A-B
から、
(1*10-1/10+1/8*103/10)*TXlev_A-B=1.044*TXlev_A-B
に減少する。
ゆえに、この解決法は、システムに、例えば容量を増大させるのに使用できる効果を提供すると結論づけることができる。
非アクティブ状態信号により高い符号化遅延が許容できることを考慮すると、改善の度合いはいっそう高くなる(合計伝送量=0.919*TXlev_A-B)。非アクティブ状態信号の符号化遅延は低減する必要がなく、符号化利得での損失を補償する必要がない。この場合、非アクティブリンクが、その会話での応答を運ぶ際にアクティブになろうとするときに遅延量を上回らないようにする必要がある。低符号化遅延にもかかわらずアクティブになろうとするリンクの信号開始の適正な伝送を保証するために、(一時的に)伝送出力を増大させることにより低減した符号化利得を補償することが可能である。その開始の高速伝送の後、符号化は、より高い遅延を有するより効率的な符号化に切り換わる。より高い遅延符号化への切換えは、出力信号が時間的に伸長されることを必要とする。これは、任意の最新の時間軸操作アルゴリズムに従って行われ得る。
原則として、本発明の基本的概念は、各通信方向で自律的に適用され得る。リンクがアクティブである場合、符号化遅延は、ある最大値まで増大する。リンクがアクティブになったばかりである場合、遅延は、ある下限値まで減少し、その後増大する。これらの解決法は、一度に1つのリンクだけがアクティブである限り、すなわち図2に示す例によれば、逆方向の通信とは独立に機能するはずである。その場合、一方の通信リンクでのアクティブ状態レベルだけがわかっていればよい。そのような解決法は、実際に、ユーザが遅延に対して反応する最も重要な瞬間であるアクティブ状態期間の開始時に合計要求応答時間を保つことを可能にする。しかしながら、その解決法は、両リンクが同時にアクティブであるような状況で応答時間の完全な制御を行うことはできない。その場合、両方のリンクに長い符号化遅延が適用されるため、応答時間が事前定義された最大限度を超えることになる。
この問題に対する解決策として、図3などで示すように、応答時間制御機構を適用することができる。そのような機構では、応答時間が事前定義された限界を絶対に超えないようにする。これは、まず、両通信方向でのアクティブ状態または遅延の量を判定することを必要とし、次いで、アクティブ状態での最大許容遅延を適合させることを必要とする。
1つの単純な解決法は、両リンクのアクティブ状況に基づいて必要とされる測定値を導出するものである。これは、両リンクが、アクティブ状態信号に利用可能な符号化遅延の観点から見て対称であれば、各通信端で可能である。着信リンクと発信リンクの両方が同時にアクティブであることを検出すると、合計使用符号化遅延が、各通信端で生じる符号化遅延の2倍になると想定することができる。各終端で生じる遅延は、明らかに、各終端で利用可能である。
より普遍的だが要求の厳しい方法は、現在各終端で使用されている符号化遅延に関して通信端間でサイド情報を交換するもの、あるいは、RTCP(IETF RFC 1889)24〜27頁などに開示されている、実際の往復遅延測定を行うものである。
測定された合計符号化遅延が許容される符号化遅延量を超える場合、図3に関連してさらに示したように、アクティブ状態での最大許容符号化遅延が適合される必要がある。1つの単純な可能な方法は、各リンクに、符号化遅延量の半分を割り当てるものである。
本発明による一般的方法は、図4のフローチャートによって示すことができる。この手順はステップ200で開始する。ステップ202で、データの全二重転送が実行される。ステップ204で、好ましくはアクティブ状態および非アクティブ状態の観点から、転送されるデータの情報値の判定が得られる。最後に、ステップ206で、この判定値を用いて適当な符号化遅延が動的に割り当てられる。少なくとも逆方向のリンクが非アクティブであるときには、リンクがアクティブであるときにより高い符号化遅延が割り当てられる。さらに、好ましくは、アクティブ状態の開始時にはより低い符号化遅延が割り当てられる。この手順はステップ208で終了する。
図5に、本発明による会話型サービスの全二重通信のための通信システム1の実施形態を示す。通信システム1は、そのうちの一部だけしか示していないが、いくつかのユーザ端末20を接続するネットワーク10を含む。ユーザ端末20は、着信コネクション32と発信コネクション34を有する全二重コネクション30によって接続される。発信コネクション32および着信コネクション34は共通または別個の手段として実施されうる。ユーザ端末20は、それぞれ、発信コネクション上および着信コネクション上でデータを送信し、受信するための送受信手段22を備える。この送受信手段22は、端末20が接続される個々のネットワークに必要な、例えば、全二重方式でデータを転送する手段、符号化/復号化手段などを含む。送受信手段は、着信および/または発信トラフィックの転送モードを選択するための、転送モード制御手段26をさらに含む。これらの転送モードは、異なる符号化、バッファリングなどを含み得る。端末20は、全二重コネクション30でデータによって運ばれる情報値の判定のための検出器24をさらに備える。この実施形態では、検出器24は、発信コネクション34および着信コネクション32でのアクティブ状態を判定するために接続されたアクティブ状態検出手段を備える。検出器24は、送受信手段22の転送モード制御手段26に接続される。転送モード制御手段26は、本発明によれば、検出器24の判定に従って転送モードを動的に割り当てるように構成される。この実施形態では、通信の両方のリンクがアクティブ状態レベルに関して監視され、それによって実際の応答時間制御が可能になる。
図6に、本発明によるユーザ端末20の別の例を示す。この場合、検出器24は、アクティブ状態に関してリンクの一方だけを監視するように構成される。そのような場合、システム内でそれ以上の情報が交換されなければ、応答時間制御は、アクティブ状態期間の開始時だけに保証される。
図7に、本発明によるユーザ端末20のさらに別の例を示す。この場合、検出器24は、アクティブ状態に関して発信コネクションだけを監視する。しかしながら、この実施形態では、送受信手段22は、遅延関連情報交換のための手段28をさらに含む。遅延関連情報交換のための手段28は、遅延発行に関する制御信号を受け取るように構成される。例えば、相手側のユーザ端末は、特定の遅延を有するある転送モードが適用されるというメッセージを転送することができる。そのような情報は、検出器24を介して達成される着信コネクション32上のアクティブ状態の情報と共に、転送モード制御手段26が発信データのために適当な遅延を選択することを可能にする。好ましくは、遅延情報交換のための手段28は、検出器24からの結果をも制御信号に変換し、それが相手側のユーザ端末に転送される。
図8に、本発明による端末20の実施形態を示す。この実施形態の伝送システムは、パケット交換伝送を用いて動作するものと想定する。すなわち、通信ネットワーク10は、この実施形態では、パケットネットワークである。さらに、図8による、または対応する機能を有する2つの端末間の通信を想定する。ユーザによって発出された着信音声(SPEECH IN)が端末20に供給される。A/D変換器40は、着信アナログ信号を例えば8kHzなどの一定のサンプリングレート(SFIN)でディジタル化した信号サンプルを出力する。効率のよい音声コーデックは一般にフレーム単位で機能するため、音声符号化器(SPE)44の前にはフレームバッファ(frame buffer)42があり、そこで(例えば20ms長の)サンプルのフレームが収集され、次いで、それらがSPE44により処理される。フレーム化はフレーム化クロック信号(FRAME CLK)によって制御される。SPE44はフレーム単位で動作し、符号化音声データを出力する。次いで、各データセットが音声フレームを表す符号化音声データがパケタイザ (packetizer) 46に伝送され、そこでいくつかの音声データフレームが収集されて音声データパケットが形成され、パケットヘッダが付加される。次いでこのパケットは、送信チャネル50から発信リンク34を経て、パケットネットワーク10を介して送信される。
このネットワークを介した伝送は、一定の遅延プロファイルによって特徴付けられ、それが各パケットを、例えば50msなど、ある最小伝送遅延を伴うある統計的遅延分布に従って遅延させる。また、伝送されるパケットのうち一定の割合のパケットは失われ、受信側の着信リンク32には届かない。
受信側では、到着パケットが、デパケタイザ (de-packetizer) 52に供給され、次いで、不連続のパケット入力ストリームがジッタバッファ54に供給され、音声復号化器(SPD)56で復号化することのできる連続した音声データフレームのストリームに変換される。ジッタバッファ54は、後述する出力クロック信号に応答して、音声データフレームを出力する。SPD56は、音声データフレームを復号化し、それに応答して、復号化音声フレームをサンプル同期器 (sample synchronizer) 58に出力する。サンプル同期器58は、その最も単純な形では、バッファ制御機構を備えるバッファであり、それが音声サンプルを所与のサンプリング周波数(SFOUT)でD/A変換器60に出力し、次にそこでアナログ音声出力信号(SPEECH OUT)が生成される。サンプル同期器58は、単にサンプルを挿入または廃棄することもできるし、より高度な音声圧縮または伸長処理を実行することもできる。これについては、以下でより詳細に説明する。
ジッタバッファ動作を制御する基本的な方法は2つある。1つの簡単な方法は、出力クロックを、例えば20msなど、音声コーデック・フレームレートと等しいD/A変換器クロックSFOUTの約数に設定するものである。これは、サンプル同期器58が、単なるパラレル/シリアル変換器に置き換えられることを意味し、サンプル挿入も削除も不要である。送信側/受信側フレーム同期を保証するために、ジッタバッファ制御は、平均(何らかの短期平均)バッファ・フィルレベルが、一定の目標ジッタバッファ・レベルより低いか、それとも高いかに応じて、音声データ・フレームを挿入し、または廃棄する手段を備える。
ジッタバッファ制御の第2の方法は、ジッタバッファ出力クロックを操作するものである。この方法は、送信側/受信側同期が、フレーム単位ではなく、サンプル単位で行われるという利点を持つ。通常の動作では(通信方向の変更がない場合)、理想的には、ジッタバッファ出力クロックの周波数は、SPE44が音声データフレームを生成するのに用いるクロック周波数に対応する。しかしながら、実際には、このクロックは、受信側で、ジッタバッファ制御手段26中に含まれるある制御機構によって得られ、その機構は、フィルレベルなどのジッタバッファ状態に基づくものである。ジッタバッファ・クロックを制御する公知の方法があり、それらは、通常、前述のジッタバッファ制御方法と同様に、ジッタバッファ54の平均フィルレベルが一定になるようにクロックを制御するものである。
本発明の場合、平均ジッタバッファ・レベルと遅延の関係を強調することは重要である。すなわち、低い平均ジッタバッファ・レベルは低い終端間遅延に対応し、高い平均ジッタバッファ・レベルは長い遅延に対応する。平均ジッタバッファ・レベルおよび遅延が低いと、ジッタバッファ・アンダーフローの可能性が高くなるため、多くの音声フレーム消失が誘発される。平均ジッタバッファ・レベルおよび遅延が高いと、フレーム消失数の削減が可能になり、これにより受信側での音声品質が向上する。
前述の伝送システムと関連する典型的な終端間遅延の一例では、処理遅延など他の関連性の少ない原因を無視すれば、以下の主要な条件を特定することができる。
1.音声フレームバッファ:20ms
2.2音声データフレームを有するパケタイザ:20ms
3.パケタイザの出力から、そのパケットの最初の音声データフレームのジッタバッファからの出力までのパケット遅延:100msまたは300msのいずれか一方であって、
3a.40msの最小伝送遅延を伴う一定の遅延プロファイルによるパケット伝送遅延、
3b.3音声データ・フレーム(=60ms)または13音声データフレーム(=260ms)のいずれか一方のジッタバッファ量(jitter buffer depth)を用いたパケット遅延変動を補償するジッタバッファおよびデパケタイザ、
を含む
4.サンプル同期バッファ:10ms
よって、終端間遅延は、ジッタバッファ量に応じて150msまたは350msである。
この端末のユーザは無音であり、別の端末からアクティブな音声が受け取られると想定する。着信リンク32上にはアクティブ音声の伝送があり、発信リンク上には、符号化無音信号(暗騒音)の伝送だけしかない。その結果、着信伝送はできるだけ効率的でなければならず、このリンクにできるだけ多くの利用可能な符号化遅延が許容されることになる。通常、受信側ジッタバッファはこの符号化遅延を用いる。すなわちそれは、13音声データフレーム分の量のジッタバッファを用いて機能し、送信側から受信側への終端間遅延は350msになる。この高遅延のために、受信側での再生音声品質は高い。逆方向では、ジッタバッファ量が小さい構成が使用され、150msの終端間遅延を生じる。
次に、通信方向の変更を考察する。まず、相手側が非アクティブになる。これにより、着信リンク32上で伝送されるフレームに、符号化無音信号が含められる。送信側にVADがあるものと想定すると、対応するフレームは、対応する無音フラグでマークされる。あるいは、本実施形態で示すように、端末20は、SPD56に接続されたVADまたは他のアクティブ状態検出器24を用い、このフラグをローカルで導出することもできる。無音フラグがアクティブになると、ジッタバッファ制御手段26への信号が生成され、ジッタバッファ量をその最小の3フレームまで低減する。その結果、終端間遅延が減少する。ジッタバッファ量の低減は、フレームを捨てることにより、あるいはジッタバッファクロックを増大させることにより達成される。増大したジッタバッファクロックは、さらに、SPD56に、単位時間当たりより多くの復号化無音フレームを生成させ、次いでそれがサンプル同期バッファを満たす。これにより、単純なサンプル同期手順が過剰なサンプルを廃棄することになる。廃棄されたサンプルは無音信号サンプルであるため、この信号変更はほとんど聞き取れない。
次に、この端末20のユーザがアクティブになる。発信リンク34は前に非アクティブであったので、受信側のジッタバッファ量は低い。ゆえに、アクティブ音声開始は、わずか150msの終端間遅延で送信される。ゆえに、結果として生じる応答時間は500msである。しかし、相手側の受信機のジッタバッファ量は低いので、フレーム消失率が増大し、結果として音声品質は低くなる。これを補償するために、音声開始伝送、すなわち無音期間後の最初のn個の音声フレームには、より高い伝送リソースが使用される。nは、例えば、100とすることができ、時間的には2秒間に相当する。この挙動を制御する開始信号は、例えば、発信リンクでVADによって得られる音声アクティブ状態フラグから導出され得る。より高い伝送リソースは、例えば、2つではなく1つだけの音声データフレームを含むパケットを送信することによって、かつ/または各パケットを2回送信することによって使用される。1パケット当たりのフレーム数を減少させることには、それによって終端間遅延も減少するというさらなる利点がある。
相手側の受信機は、符号化器VADによって、あるいはSPD56に接続して用いられるローカル復号化器VAD24によって生成されたフラグでマークされたアクティブ音声フレームを受け取ると、ジッタバッファ量を増大させ始める。これは、ジッタバッファに(フレーム反復などにより)追加のフレームを挿入することによって、あるいはアクティブ音声フレーム・フラグを、ジッタバッファ制御手段26が、ジッタバッファ量がその最大の13フレームに到達するまでクロックを減少させるための信号とみなすことによって達成される。前者の場合、追加フレームは、例えば、既存のフレームの反復によって生成され得る。好ましくは、結果として生じる音声品質に影響を与えないように、雑音的な音声部分または低レベルの音声部分を伝達するフレームが反復される。後者の場合の結果として、SPD56は、所与の時間に、より少ない復号化音声フレームを生じることになり、次いでそれが、サンプル同期バッファ・フィルレベルを低減する。次いで、単純なサンプル同期方法は、サンプル同期バッファ・アンダーフローを回避するために、例えば、サンプル反復などによってサンプルを挿入することができる。より複雑な方法については後述する。この例では、ジッタバッファ遅延の音声変更および蓄積には2秒間を要し、これは10%のその音声の時間変更を示唆するものである。
ゆえに、図8の実施形態は、どんな特定の往復遅延制御もせずに、非アクティブリンクの低遅延およびアクティブリンクの高遅延を生じる。
図9に、本発明による端末20の別の類似の実施形態を示す。前の実施形態のものと同じ各部分には同じ参照番号を付し、本実施形態の動作にとって特に重要なものでない限り、それらについての詳細な説明は省略する。この実施形態の伝送システムは、図8の実施形態のものと同じであると想定する。図8の実施形態と比べた、図9の実施形態の主要な差異は、ジッタバッファ54の前に着信リンクのアクティブ状態を判定するアクティブ状態チェック手段24が接続され、このアクティブ状態チェック手段24がジッタバッファ54への直接制御コネクション62を有することである。また、デパケタイザ52もSID変換器64を備える。
着信リンクがアクティブで、発信リンクが非アクティブであると想定する。着信リンク上にはアクティブ音声の伝送があり、発信リンク上には符号化無音信号の伝送だけしかない。したがって、着信トラフィックの処理はできるだけ効率的でなければならず、このリンクにできるだけ多くの利用可能な符号化遅延が割り振られることになる。通常、受信側ジッタバッファはこの符号化遅延を使用する。すなわちそれは、13音声データフレーム分の量の深いジッタバッファを用いて機能し、350msの終端間遅延を生じる。この高遅延のために、受信側での再生音声品質は高い。発信方向では、無音信号の終端間伝送遅延も350msである。
次に、着信リンクが非アクティブになった場合、本実施形態ではこれは全くジッタバッファ変更を生じず、ゆえに、終端間遅延の変更も生じない。
上記と異なり、両リンクが非アクティブであり、両方が深いジッタバッファを持つものと想定する。次に、着信リンクがアクティブになる。低い応答時間を得るために、最初のアクティブ音声フレームの受信により、ジッタバッファが、3フレームの低いジッタバッファ量までフラッシュされる。廃棄されたフレームは単なる無音信号フレームにすぎないため、これは、受信側での再構築信号にとって重要ではない。アクティブ音声の有無のチェックは、本実施形態では、パケット分解の直後になされ、(符号化器VADによって生成された)アクティブ状態フラグに基づいて、または、図に示すように、復号化器VAD24によってローカルで行われ得る。VAD24は、ここでは、ジッタバッファ54を直接フラッシュするように構成される。ジッタバッファを低いジッタバッファ量までフラッシュすることにより、ジッタバッファ遅延は、ほとんど瞬時に下限まで低減されており、その結果、アクティブ音声開始は、わずか150msの終端間遅延で送信される。ゆえに、結果として生じる応答時間は500msになる。この場合もやはり、増大したフレーム消失率は、伝送リソースの使用を増大させることにより補償され得る。ジッタバッファ量の最初のフラッシュおよび低減の後、アクティブ音声フレームを受け取ると、受信側ジッタバッファ量は、その後、再度増大し始める。これは、アクティブ音声フレーム・フラグを、ジッタバッファ制御手段が、ジッタバッファ量を再度その最大値の13フレームまで増大させるための信号とみなすことにより達成される。前述のように、追加の音声フレームを挿入するか、サンプル同期器58が減少した音声フレーム速度を補償する必要がある。
本実施形態は、DTX機能も備える。これは、実際の暗騒音を送信するのではなく、コンフォートノイズ(comfort noise)フレームを時折送信することを意味する。この無音状態での実際の終端間伝送遅延は、350msさえも上回ることがある。というのは、ノイズフレームは、例えば、8フレームごとに1回(160msごとに1回)など、時折送信されるにすぎないからである。この場合の処理は、デパケタイザが、さらに、着信SID(無音記述子)フレームの不連続ストリームを連続無音信号フレームのシーケンスに変換するSIDフレーム変換器64を含む場合には、DTXなしの状況と同一になる。その場合、各着信SIDフレームは、20ms当たり1個のSIDフレームを含む8個のSIDフレームで置換される。このコンフォートノイズでは、パラメータ補間を行うことができ、それは普通、SPDのコンフォートノイズ合成として行われる。
図10に、本発明による端末20の別の類似の実施形態を示す。前の実施形態のものと同じ各部分には同じ参照番号を付し、本実施形態の動作にとって特に重要なものでない限り、それらについての詳細な説明は省略する。この実施形態は、ダブルトーク応答時間制御での解決法を提示する。その原理は、送信側でも音声アクティブ状態を感知し、受信信号に属するアクティブ状態フラグに加えて、送信側アクティブ状態フラグもジッタバッファ制御手段26に伝送することである。
これは、例えば、送信側で状況を感知するように構成され、ジッタバッファ制御手段26に接続されたVAD70を設けることによって達成される。両方のフラグがアクティブ音声を示している場合、ジッタバッファ制御手段26は、ジッタバッファ量を、可能なジッタバッファ量の最大と最小の間の平均、すなわち本実施形態では8フレームに導く。現在のジッタバッファ量が8フレームより低い場合、フレームが挿入され、または、個々に、ジッタバッファ・クロックが低減され、8フレームより高い場合、フレームが廃棄され、または、個々に、クロックが増大される。
また、ジッタバッファ制御手段26は、相手側が異なるリンクでのアクティブ状態変化のための調整を開始できるように、所定の時間ジッタバッファ量の増大を延期させる手段を備えることもできる。
図11では、類似のダブルトーク応答時間制御が、図9の、非アクティブリンクの高遅延を有するシステムに導入されている。
これまで説明した各例は、2つのリンクの間で、それぞれのアクティブ状況に応じて合計の利用可能な符号化遅延量を分配し、それによって一定の応答時間を保証できるようにするものである。しかし、一般にはこれらの方法では、所与の絶対応答時間を維持することはできない。その1つの理由は、一般に、パケット・ネットワークを介したパケット伝送遅延が不明であることにある。これまでに示した解決法は、実際の応答時間ではなく、ジッタバッファ状態に基づくものである。一定の絶対応答時間を保証するためには、実際の伝送時間を推定することが必要である。これは、例えば、一方の側Aから他方Bにメッセージが送信され、B側の、おそらくジッタバッファでの受信後にそれがA側に返信される、往復遅延測定によってなされ得る。そのような測定は、もちろん、両方の側で行われ得る。そのような往復遅延測定に基づき、実際の応答時間が容易に導出され、最大および最小の目標ジッタバッファ量がしかるべく調整され得る。例えば、往復遅延測定により、必要とされる500msではなく600msの実際の応答時間がもたらされた場合、目標ジッタバッファ量を低減する必要がある。最小目標ジッタバッファ量が、例えば、2音声データ・フレーム(=40ms)まで、最大の目標ジッタバッファ量が9フレーム(=180ms)まで低減されれば、合計で100msの応答時間が節約される。
最後の実施形態は、適正なジッタバッファ制御を利用する。その基本原理について、以下で図12のフローチャートに基づき説明する。このフローチャートは、特に指定しない限り、図10の実施形態に対応するものである。この手順はステップ210で開始する。一般に、ジッタバッファ制御は、受信音声信号、およびおそらくは送信音声信号のアクティブ状態に応じて、一定の目標ジッタバッファ量が満たされるように行われる。ステップ212で、受信音声の任意のアクティブ状態フラグが検出される。ステップ214で、送信音声の任意のアクティブ状態フラグが検出される。論理への1次入力は、受信音声のアクティブ状態フラグである。ステップ216で、受信音声でのアクティブ状態フラグがあるかどうかチェックされる。受信信号がアクティブ音声でない場合、目標ジッタバッファ量は、ステップ218で最小目標ジッタバッファ量dminに設定される。図9による例など、合計遅延量が一定に保たれない場合には、目標ジッタバッファは、そうではなく、不変のままとされる。
ステップ216でフラグがアクティブ状態を示した場合、手順はステップ220に進み、そこで送信信号でのアクティブ状態フラグがあるかどうかチェックされる。送信信号がアクティブ音声でない場合、目標ジッタバッファ量は、ステップ222で最大目標ジッタバッファ量dmaxに設定される。しかしながら、送信信号がアクティブ音声であった場合、目標ジッタバッファ量は、ステップ224で平均目標ジッタバッファ量(dmin+dmax)/2に設定される。図8のように、応答時間制御が適用されない場合、ステップ222が常に選択される。
前述のように導出された目標ジッタバッファ量は、次のステップ226で、平均ジッタバッファ・フィルレベルと比較される。平均フィル・レベルが目標より少ない場合、追加のフレームが(反復などにより)挿入され、またはステップ228で、低減されたクロックレートを用いてジッタバッファ出力がクロック制御される。平均フィル・レベルが目標値以上の場合、フレームがバッファから廃棄され、またはステップ230で、増大されたクロック速度を用いてジッタバッファ出力がクロック制御される。代替の実施形態では、ステップ228が、上記の代わりに、フィル・レベルを増大させるためにフレームを挿入することを含み、ステップ230がフィル・レベルを低減するためにフレームを廃棄することを含む。この手順はステップ232で終了する。このフローチャートは開始 (START) および停止 (STOP) を持つものとして示されているが、この制御手順は実質的には連続しており、そのため、実際の流れは、通常、破線矢印に従ってステップ212に戻る。
受信側で前述のジッタバッファ目標の制御を配置するのが当然であることを指摘することは重要である。これが言えるのは、平均ジッタバッファ量との比較が受信側で行われる最も簡単なものだからである。しかし、音声フレーム挿入(反復など)および削除を用いて、あるいはフレームバッファの出力クロック制御を用いて、送信側で対応するクロック制御を配置することも不可能ではない。後者の場合、フレームバッファは、入力音声信号の時間軸操作を備える必要があり、それによって、音声品質を劣化させずに様々なクロックレートで音声フレームをクロック出力することが可能になる。
本発明で使用されるアクティブ状態検出器は、例えば、従来のDTX用途で使用されるのと同種のものとすることができる。ただし、送信および/または受信信号の情報内容の値を判定するいずれの種類のセンサを使用することができる。音声アクティブ状態を判定するには、例えば、3GPP TS26.094 (Rel-4、V4.0.0)、7〜15頁に開示されたVADアルゴリズムを使用することができる。ビデオ・アクティブ状態を判定するためのアルゴリズムは、連続ビデオ・フレーム間の差異に基づくものとすればよい。低い差異は、例えば、非アクティブ状態の信号である。
前述のように、サンプル同期手段を用いて、基本的な方式で音声伸長および音声圧縮を実行することができる。音声伸長は、例えば、必要に応じてサンプルまたは完全なフレームを反復することによって実行可能である。音声圧縮は、例えば、必要に応じて音声サンプルまたはフレームを廃棄することによって実行可能である。この場合、音声品質は影響を受ける。しかし、音声伸長の度合いが限られたものであれば、音声の劣化は特に問題にはならない。時間軸操作などより複雑な方法では、音声変更がほとんど聞き取れないように復号化音声を伸長または圧縮するはずである。例えば、ジッタ遅延の音声変更および蓄積に2秒を要する場合、200msの遅延変更での時間軸操作はわずか10%にしかならない。さらに、時間軸操作は、それがほとんど聞き取れない音声部分、例えば、雑音的な部分や、低レベルの部分で、あるいは完全なピッチ周期を反復/廃棄することによって実行することが望ましい。音声の時間軸操作の最新の方法は、Yi J. Liang、N. Farber、B. Girod による、"Adaptive playout scheduling and loss concealment for voice communication over IP networks", (IEEE Transactions on Multimedia, 2001年4月) に記載されている。
添付の特許請求の範囲によって定義される本発明の範囲を逸脱することなく、本発明にさまざまな改変および変更を加え得ることは、当業者には理解されよう。
従来技術のシステムを用いた会話を示すタイムチャートである。 本発明の実施形態における会話を示すタイムチャートである。 本発明の実施形態における同時音声を含む会話を示すタイムチャートである。 本発明の実施形態における方法を概略的に示すフローチャートである。 本発明の実施形態における通信システムを示す図である。 本発明の別の実施形態におけるユーザ端末を示す図である。 本発明の別の実施形態による別のユーザ端末を示す図である。 非アクティブリンクに低遅延を与える、本発明によるユーザ端末の詳細な実施形態を示す図である。 非アクティブリンクに高遅延を与える、本発明によるユーザ端末の別の詳細な実施形態を示す図である。 非アクティブリンクに低遅延を与え、応答時間制御を備える、本発明によるユーザ端末の詳細な実施形態を示す図である。 非アクティブリンクに高遅延を与え、応答時間制御を備える、本発明によるユーザ端末の詳細な実施形態を示す図である。 本発明において有用なジッタバッファ制御の実施形態を示すフローチャートである。

Claims (52)

  1. 全二重方式でデータを転送する転送ステップ(202)と、
    前記データによって運ばれる情報値の判定を行う判定ステップ(204)と、
    を有する全二重通信の方法であって、さらに、
    前記判定に応じて符号化遅延を動的に割り当てる割当てステップ(206)
    を有することを特徴とする方法。
  2. 前記情報値が高いほどより高い符号化遅延が割り当てられることを特徴とする請求項1に記載の方法。
  3. より高い符号化遅延を適用するときにはより低い割当て伝送リソースで伝送するステップを更に有し、
    前記伝送リソースは、
    伝送出力、
    伝送に使用されるビットレート、
    伝送に使用されるパケット数、
    割り当てられる伝送チャネル数、
    のグループ中のいずれか1つであることを特徴とする請求項2に記載の方法。
  4. 前記判定は、前記データが前記データを搬送するリンク(32、34)のアクティブ状態に対応するか非アクティブ状態に対応するかの判定であることを特徴とする請求項2または3に記載の方法。
  5. 前記転送ステップはさらに、第1の方向(32)にデータを転送するステップと、第2の方向(34)にデータを転送するステップとを含み、
    前記判定ステップは、前記第1の方向(32)に転送された前記データがアクティブ状態に対応するか非アクティブに対応するかの第1の判定を行うステップをさらに含み、
    前記割当てステップは、前記第1の判定に応じて、前記第1の方向(32)での符号化遅延を動的に割り当てる
    ことを特徴とする請求項4に記載の方法。
  6. 前記割当てステップは、前記第1の判定がアクティブ状態を示す場合には、前記第1の方向(32)での前記符号化遅延を最大符号化遅延に接近するように制御するステップをさらに含むことを特徴とする請求項5に記載の方法。
  7. 前記接近が漸進的接近であることを特徴とする請求項6に記載の方法。
  8. 前記接近が、複数の所定の符号化遅延レベルを経て行われることを特徴とする請求項6に記載の方法。
  9. 前記符号化遅延レベルが、一組の所定の符号化方式に基づくものであることを特徴とする請求項8に記載の方法。
  10. 前記割当てステップは、前記第1の判定がアクティブ状態を示す期間の開始時に、前記第1の方向(32)での前記符号化遅延を最小符号化遅延に設定するステップをさらに含むことを特徴とする請求項7に記載の方法。
  11. より低い符号化遅延を適用するときにはより高い割当て伝送リソースで伝送するステップを更に有し、
    前記伝送リソースは、
    伝送出力、
    伝送に使用されるビットレート、
    伝送に使用されるパケット数、
    割り当てられる伝送チャネル数、
    のグループ中のいずれか1つであることを特徴とする請求項10に記載の方法。
  12. 前記漸進的接近が、前記開始後の所定の時刻まで遅延されることを特徴とする請求項10または11に記載の方法。
  13. 前記割当てステップは、前記第1の判定が非アクティブ状態を示す場合には、前記第1の方向(32)での前記符号化遅延を最小符号化遅延に接近するように制御するステップをさらに含むことを特徴とする請求項5から12までのいずれかに記載の方法。
  14. 前記システムが要求される最大往復遅延を有し、
    前記判定ステップは、前記第2の方向(34)に転送された前記データがアクティブ状態に対応するか非アクティブ状態に対応するかの第2の判定を行うステップをさらに含み、
    前記割当てステップは、前記第1の判定および前記第2の判定の両方に応じて、前記第1の方向(32)での符号化遅延を動的に割り当てる
    ことを特徴とする請求項5に記載の方法。
  15. 前記割当てステップは、前記第1の判定がアクティブ状態を示すとともに前記第2の判定が非アクティブ状態を示す場合には、前記第1の方向(32)での前記符号化遅延を最大符号化遅延に接近するように制御するステップをさらに含むことを特徴とする請求項14に記載の方法。
  16. 前記割当てステップは、前記第1の判定および第2の判定が共にアクティブ状態を示す場合には、前記第1の方向(32)での前記符号化遅延を中間の符号化遅延に接近するように制御するステップをさらに含むことを特徴とする請求項15に記載の方法。
  17. 前記中間の符号化遅延は、前記第1の方向(32)での前記データ転送の合計遅延であって、それが前記要求される最大往復遅延の実質的に半分であることを特徴とする請求項16に記載の方法。
  18. 前記割当てステップは、前記第1の判定がアクティブ状態を示す期間の開始時に、前記第1の方向(32)での前記符号化遅延を最小符号化遅延に設定するステップをさらに含むことを特徴とする請求項15から17までのいずれかに記載の方法。
  19. 前記最大符号化遅延は、前記第1の方向での前記データ転送の第1の合計遅延を示し、
    前記最小符号化遅延は、前記第1の方向での前記データ転送の第2の合計遅延を示し、
    前記第1の合計遅延と第2の合計遅延との和が、実質的に、前記要求される最大往復遅延に等しいことを特徴とする請求項18に記載の方法。
  20. 前記最大符号化遅延は、前記第1の方向での前記データ転送の第1の合計遅延を示し、
    前記最小符号化遅延は、前記第2の方向での前記データ転送の第2の合計遅延を示し、
    前記第1の合計遅延と第2の合計遅延との和が、実質的に、前記要求される最大往復遅延に等しいことを特徴とする請求項18に記載の方法。
  21. 符号化遅延の任意の増大が所定の期間延期されることを特徴とする請求項15から20までのいずれかに記載の方法。
  22. 前記データは音声信号を表し、これにより、
    非アクティブ状態は、
    無音、
    暗騒音、
    一定の信号、
    のうちの少なくとも1つとして定義されることを特徴とする請求項4ないし21のいずれかに記載の方法。
  23. 前記データはビデオ信号を表し、これにより、
    非アクティブ状態は、
    無画像、
    暗騒音、
    静止、
    のうちの少なくとも1つとして定義されることを特徴とする請求項4ないし21のいずれかに記載の方法。
  24. 前記システムにおいてメッセージが送信/返信される実際の応答時間を測定するステップと、
    前記実際の応答時間を前記要求される最大往復遅延と等しくするように前記最小および最大符号化遅延を適合させるステップと、
    をさらに含むことを特徴とする請求項18に記載の方法。
  25. 前記符号化遅延がジッタバッファ量に依存することを特徴とする請求項1ないし24のいずれかに記載の方法。
  26. 前記割当てステップは、
    前記測定に応じて目標ジッタバッファ・フィル・レベルを設定するステップと、
    前記目標ジッタバッファ・フィル・レベルに等しい平均フィル・レベルを達成するようにジッタバッファ・クロックを調整するステップと、
    をさらに含むことを特徴とする請求項25に記載の方法。
  27. 前記割当てステップは、
    前記測定に応じて目標ジッタバッファ・フィル・レベルを設定するステップと、
    前記目標ジッタバッファ・フィル・レベルに等しい平均フィル・レベルを達成するようにフレームを挿入または廃棄するステップと、
    をさらに含むことを特徴とする請求項25に記載の方法。
  28. 前記全二重通信が多者間通信であることを特徴とする請求項1ないし27のいずれかに記載の方法。
  29. 少なくとも2つの端末(20)と、
    前記少なくとも2つの端末(20)を接続するネットワーク(10)と、
    前記少なくとも2つの端末(20)の任意の2つの間で、全二重方式でデータを転送する転送手段(30)と、
    前記少なくとも2つの端末(20)に設けられた符号化/復号化手段(22)と、
    を含む全二重通信システム(1)であって、
    前記データによって運ばれる情報値を判定する検出手段(24、70)と、
    前記判定に応じて、多数の値をとりうる符号化遅延に関連する符号化/復号化を動的に割り当てるように構成され、前記符号化/復号化手段(22)の符号化遅延を制御する符号化制御手段(26)と、
    を有することを特徴とする全二重通信システム。
  30. 前記符号化遅延は、前記情報値が高いほど高いことを特徴とする請求項29に記載の全二重通信システム。
  31. 前記転送手段は、適用される符号化遅延に応じて伝送リソースを割り当てる手段をさらに含み、
    前記伝送リソースは、
    伝送出力、
    伝送に使用されるビットレート、
    伝送に使用されるパケット数、
    割り振られる伝送チャネル数
    のグループ中の少なくとも1つであることを特徴とする請求項30に記載の全二重通信システム。
  32. 前記検出手段(24、70)は、前記データが前記データを搬送するリンク(32、34)のアクティブ状態に対応するか非アクティブ状態に対応するかの判定を行う検出器であることを特徴とする請求項30または31に記載の全二重通信システム。
  33. 前記転送手段は、前記少なくとも2つの端末の2つの間で第1の方向にデータを転送する手段と、前記第1の方向とは逆の第2の方向にデータを転送する手段とを含み、
    前記検出手段は、前記第1の方向に転送される前記データによって運ばれる前記データがアクティブ状態に対応するか非アクティブ状態に対応するかの判定を行う第1の検出器(24)をさらに含み、
    前記符号化制御手段(26)は、前記第1の検出器(24)からの出力に応じて符号化/復号化を動的に割り当てるように構成されている
    ことを特徴とする請求項32に記載の全二重通信システム。
  34. 前記第1の検出器(24)は、前記端末(20)の少なくとも1つの着信リンク(32)に接続され、
    前記符号化制御手段(26)は、前記第1の検出器(24)からの出力に応じて復号化を動的に割り当てるように構成されている
    ことを特徴とする請求項33に記載の全二重通信システム。
  35. 前記検出手段は、前記第2の方向に転送される前記データがアクティブ状態に対応するか非アクティブ状態に対応するかの判定を行う第2の検出器(70)をさらに含み、
    前記符号化制御手段(26)は、前記第1の検出器(24)と前記第2の検出器(70)の両方からの出力に応じて、符号化/復号化を動的に割り当てるように構成されている
    ことを特徴とする請求項33または34に記載の全二重通信システム。
  36. 前記第1の検出器(24)が前記端末(20)の少なくとも1つの着信リンク(32)に接続され、
    前記第2の検出器(70)が前記端末(20)の前記少なくとも1つの発信リンク(34)に接続され、
    前記符号化制御手段(26)は、前記第1の検出器(24)と前記第2の検出器(70)の両方からの出力に応じて、復号化を動的に割り当てるように構成されている
    ことを特徴とする請求項35に記載の全二重通信システム。
  37. 前記符号化/復号化手段(22)は、ジッタバッファ(54)を含み、
    前記符号化制御手段はジッタバッファ制御手段(26)である
    ことを特徴とする請求項32ないし36のいずれかに記載の全二重通信システム。
  38. 前記ジッタバッファ制御手段(26)は、ジッタバッファ・クロックを制御するように構成されていることを特徴とする請求項37に記載の全二重通信システム。
  39. 前記ジッタバッファ制御手段(26)は、フレームを挿入または廃棄するように構成されていることを特徴とする請求項37に記載の全二重通信システム。
  40. 前記データは音声信号を表し、これにより、
    前記検出器(24、70)は、
    無音、
    暗騒音、
    一定の信号、
    のうちの少なくとも1つを感知することを特徴とする請求項32ないし39のいずれかに記載の全二重通信システム。
  41. 前記データはビデオ信号を表し、これにより、
    前記検出器(24、70)は、
    無画像、
    暗騒音、
    静止、
    のうちの少なくとも1つを感知することを特徴とする請求項32ないし39のいずれかに記載の全二重通信システム。
  42. 前記全二重通信システムにおいてメッセージが送信/返信される実際の応答時間を測定する手段と、
    前記実際の応答時間を測定する手段の出力に応答して、最小および最大符号化遅延を適合させる手段と、
    さらに含むことを特徴とする請求項29に記載の全二重通信システム。
  43. 多者間通信をサポートする手段をさらに含むことを特徴とする請求項29ないし42のいずれかに記載の全二重通信システム。
  44. 端末(20)との間で、全二重方式でデータを転送する転送手段と、
    発信リンク(34)に関連付けられた符号化手段と、
    着信リンク(32)に関連付けられた復号化手段と、
    を含む端末(20)であって、
    前記データによって運ばれる情報値を判定する検出手段(24、70)と、
    前記判定に応じて、多数の値をとりうる符号化遅延に関連する符号化/復号化を動的に割り当てるように構成され、前記符号化手段と前記復号化手段の少なくとも一方を制御する符号化制御手段(26)と、
    を有することを特徴とする端末。
  45. 前記符号化制御手段(26)は、複数の所定の符号化遅延レベルに関連付けられた符号化/復号化を動的に割り当てるように構成されていることを特徴とする請求項44に記載の端末。
  46. 前記符号化制御手段(26)は、一組の所定の符号化方式に基づく複数の符号化遅延レベルに関連付けられた符号化/復号化を動的に割り当てるように構成されていることを特徴とする請求項44に記載の端末。
  47. 前記検出手段は、前記データが前記データを搬送するリンク(32、24)のアクティブ状態に対応するか非アクティブ状態に対応するかの判定を行う検出器(24、70)であることを特徴とする請求項44ないし46のいずれかに記載の端末。
  48. 前記検出手段は、前記着信リンク(32)で転送される前記データによって運ばれる前記データがアクティブ状態に対応するか非アクティブ状態に対応するかの判定を行う第1の検出器(24)をさらに含み、
    前記符号化制御手段(26)は、前記第1の検出器(24)からの出力に応じて復号化を動的に割り当てるように構成されている
    ことを特徴とする請求項47に記載の端末。
  49. 前記検出手段は、前記発信リンク(34)で転送される前記データがアクティブ状態に対応するか非アクティブ状態に対応するかの判定を行う第2の検出器(70)をさらに含み、
    前記符号化制御手段(26)は、前記第1の検出器(24)と前記第2の検出器(70)の両方からの出力に応じて、復号化を動的に割り当てるように構成されている
    ことを特徴とする請求項48に記載の端末。
  50. 前記復号化手段(22)は、ジッタバッファ(54)を含み、
    前記符号化制御手段はジッタバッファ制御手段(26)である
    ことを特徴とする請求項49に記載の端末。
  51. 前記ジッタバッファ制御手段(26)は、ジッタバッファ・クロックを制御するように構成されていることを特徴とする請求項50に記載の端末。
  52. 前記ジッタバッファ制御手段(26)は、フレームを挿入または廃棄するように構成されていることを特徴とする請求項50に記載の端末。
JP2004546591A 2002-10-25 2003-09-11 通信リンク間の遅延トレードオフ Expired - Lifetime JP4426454B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/280,096 US7289451B2 (en) 2002-10-25 2002-10-25 Delay trading between communication links
PCT/SE2003/001411 WO2004038992A1 (en) 2002-10-25 2003-09-11 Delay trading between communication links

Publications (2)

Publication Number Publication Date
JP2006504327A true JP2006504327A (ja) 2006-02-02
JP4426454B2 JP4426454B2 (ja) 2010-03-03

Family

ID=32106841

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004546591A Expired - Lifetime JP4426454B2 (ja) 2002-10-25 2003-09-11 通信リンク間の遅延トレードオフ

Country Status (9)

Country Link
US (1) US7289451B2 (ja)
EP (1) EP1554833B1 (ja)
JP (1) JP4426454B2 (ja)
CN (1) CN100566230C (ja)
AT (1) ATE370568T1 (ja)
AU (1) AU2003258944A1 (ja)
DE (1) DE60315689T2 (ja)
ES (1) ES2291746T3 (ja)
WO (1) WO2004038992A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012253823A (ja) * 2012-09-24 2012-12-20 Yamaha Corp 配信システム、配信方法、配信サーバ及び通信端末

Families Citing this family (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7068729B2 (en) * 2001-12-21 2006-06-27 Digital Fountain, Inc. Multi-stage code generator and decoder for communication systems
US6307487B1 (en) * 1998-09-23 2001-10-23 Digital Fountain, Inc. Information additive code generator and decoder for communication systems
US9240810B2 (en) 2002-06-11 2016-01-19 Digital Fountain, Inc. Systems and processes for decoding chain reaction codes through inactivation
KR101143282B1 (ko) 2002-10-05 2012-05-08 디지털 파운튼, 인크. 연쇄 반응 코드의 체계적 인코딩 및 디코딩
WO2005036753A2 (en) * 2003-10-06 2005-04-21 Digital Fountain, Inc. Error-correcting multi-stage code generator and decoder for communication systems having single transmitters or multiple transmitters
US7756108B2 (en) * 2003-11-07 2010-07-13 Nokia Corporation Transmission of voice over a network
JP2007532053A (ja) * 2004-03-16 2007-11-08 スノーシヨア・ネツトワークス・インコーポレーテツド ジッター・バッファーの管理
KR101205758B1 (ko) 2004-05-07 2012-12-03 디지털 파운튼, 인크. 파일 다운로드 및 스트리밍 시스템
US7721184B2 (en) * 2004-08-11 2010-05-18 Digital Fountain, Inc. Method and apparatus for fast encoding of data symbols according to half-weight codes
US7674096B2 (en) * 2004-09-22 2010-03-09 Sundheim Gregroy S Portable, rotary vane vacuum pump with removable oil reservoir cartridge
US7783482B2 (en) * 2004-09-24 2010-08-24 Alcatel-Lucent Usa Inc. Method and apparatus for enhancing voice intelligibility in voice-over-IP network applications with late arriving packets
US8411662B1 (en) 2005-10-04 2013-04-02 Pico Mobile Networks, Inc. Beacon based proximity services
EP1985021A4 (en) * 2006-02-13 2013-05-29 Digital Fountain Inc CONTINUOUS TRANSMISSION AND BUFFER DELIVERY USING CONTINUOUS MONITORING OVERVIEW AND PERIODS OF PROTECTION
US9270414B2 (en) 2006-02-21 2016-02-23 Digital Fountain, Inc. Multiple-field based code generator and decoder for communications systems
US7711841B2 (en) * 2006-02-28 2010-05-04 Sharp Laboratories Of America, Inc. Systems and methods for reducing the effects of variations on the playback of streaming media
US20070294087A1 (en) * 2006-05-05 2007-12-20 Nokia Corporation Synthesizing comfort noise
WO2007134196A2 (en) 2006-05-10 2007-11-22 Digital Fountain, Inc. Code generator and decoder using hybrid codes
US9380096B2 (en) 2006-06-09 2016-06-28 Qualcomm Incorporated Enhanced block-request streaming system for handling low-latency streaming
US9386064B2 (en) * 2006-06-09 2016-07-05 Qualcomm Incorporated Enhanced block-request streaming using URL templates and construction rules
US9178535B2 (en) * 2006-06-09 2015-11-03 Digital Fountain, Inc. Dynamic stream interleaving and sub-stream based delivery
US9432433B2 (en) * 2006-06-09 2016-08-30 Qualcomm Incorporated Enhanced block-request streaming system using signaling or block creation
US9419749B2 (en) 2009-08-19 2016-08-16 Qualcomm Incorporated Methods and apparatus employing FEC codes with permanent inactivation of symbols for encoding and decoding processes
US9209934B2 (en) 2006-06-09 2015-12-08 Qualcomm Incorporated Enhanced block-request streaming using cooperative parallel HTTP and forward error correction
US7680099B2 (en) * 2006-08-22 2010-03-16 Nokia Corporation Jitter buffer adjustment
US9374263B2 (en) * 2006-09-29 2016-06-21 Avaya Ecs Ltd. Latency differential mitigation for real time data streams
US8279884B1 (en) * 2006-11-21 2012-10-02 Pico Mobile Networks, Inc. Integrated adaptive jitter buffer
GB0705329D0 (en) 2007-03-20 2007-04-25 Skype Ltd Method of transmitting data in a communication system
AU2008298602A1 (en) 2007-09-12 2009-03-19 Digital Fountain, Inc. Generating and communicating source identification information to enable reliable communications
US7742415B1 (en) * 2007-09-26 2010-06-22 The United States Of America As Represented By Secretary Of The Navy Non-intrusive knowledge suite for evaluation of latencies in IP networks
US20100322122A1 (en) * 2008-02-05 2010-12-23 Telefonktiebolaget Lm Ericsson (Publ) Bundling of speech frames in cs over hspa networks
US8665737B2 (en) * 2008-04-17 2014-03-04 Telefonaktiebolaget L M Ericsson (Publ) Conversational interactivity measurement and estimation for real-time media
KR101192437B1 (ko) * 2008-12-18 2012-10-17 삼성전자주식회사 인터넷 전화 서비스 제공을 위한 송신장치, 음성데이터의 송신방법 및 수신방법
US9281847B2 (en) 2009-02-27 2016-03-08 Qualcomm Incorporated Mobile reception of digital video broadcasting—terrestrial services
US20100265834A1 (en) * 2009-04-17 2010-10-21 Avaya Inc. Variable latency jitter buffer based upon conversational dynamics
US9288010B2 (en) 2009-08-19 2016-03-15 Qualcomm Incorporated Universal file delivery methods for providing unequal error protection and bundled file delivery services
US9917874B2 (en) * 2009-09-22 2018-03-13 Qualcomm Incorporated Enhanced block-request streaming using block partitioning or request controls for improved client-side handling
US20110096828A1 (en) * 2009-09-22 2011-04-28 Qualcomm Incorporated Enhanced block-request streaming using scalable encoding
JP5635626B2 (ja) * 2010-01-27 2014-12-03 コニンクリーケ・ケイピーエヌ・ナムローゼ・フェンノートシャップ メディア・ストリームの同期のための方法、システム及び装置
US9380401B1 (en) 2010-02-03 2016-06-28 Marvell International Ltd. Signaling schemes allowing discovery of network devices capable of operating in multiple network modes
US8898060B2 (en) * 2010-03-02 2014-11-25 Telefonaktiebolaget L M Ericsson (Publ) Source code adaption based on communication link quality and source coding delay
US8693355B2 (en) * 2010-06-21 2014-04-08 Motorola Solutions, Inc. Jitter buffer management for power savings in a wireless communication device
US9049497B2 (en) 2010-06-29 2015-06-02 Qualcomm Incorporated Signaling random access points for streaming video data
US8918533B2 (en) 2010-07-13 2014-12-23 Qualcomm Incorporated Video switching for streaming video data
US9185439B2 (en) 2010-07-15 2015-11-10 Qualcomm Incorporated Signaling data for multiplexing video components
US9596447B2 (en) 2010-07-21 2017-03-14 Qualcomm Incorporated Providing frame packing type information for video coding
US9319448B2 (en) 2010-08-10 2016-04-19 Qualcomm Incorporated Trick modes for network streaming of coded multimedia data
US9270299B2 (en) 2011-02-11 2016-02-23 Qualcomm Incorporated Encoding and decoding using elastic codes with flexible source block mapping
US8958375B2 (en) 2011-02-11 2015-02-17 Qualcomm Incorporated Framing for an improved radio link protocol including FEC
US9253233B2 (en) 2011-08-31 2016-02-02 Qualcomm Incorporated Switch signaling methods providing improved switching between representations for adaptive HTTP streaming
US9843844B2 (en) 2011-10-05 2017-12-12 Qualcomm Incorporated Network streaming of media data
EP2749069B1 (en) * 2011-10-07 2019-05-01 Telefonaktiebolaget LM Ericsson (publ) Methods providing packet communications including jitter buffer emulation and related network nodes
GB2495927B (en) 2011-10-25 2015-07-15 Skype Jitter buffer
US9294226B2 (en) 2012-03-26 2016-03-22 Qualcomm Incorporated Universal object delivery and template-based file delivery
EP2670157B1 (en) * 2012-06-01 2019-10-02 Koninklijke KPN N.V. Fingerprint-based inter-destination media synchronization
CN104469255A (zh) 2013-09-16 2015-03-25 杜比实验室特许公司 改进的音频或视频会议
KR20140067512A (ko) * 2012-11-26 2014-06-05 삼성전자주식회사 신호 처리 장치 및 그 신호 처리 방법
WO2014202647A1 (en) 2013-06-21 2014-12-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Jitter buffer control, audio decoder, method and computer program
SG11201510501YA (en) 2013-06-21 2016-01-28 Fraunhofer Ges Forschung Time scaler, audio decoder, method and a computer program using a quality control
CN105939289B (zh) 2015-12-21 2019-03-12 小米科技有限责任公司 网络抖动处理方法、装置和终端设备
US10978096B2 (en) * 2017-04-25 2021-04-13 Qualcomm Incorporated Optimized uplink operation for voice over long-term evolution (VoLte) and voice over new radio (VoNR) listen or silent periods
US11197345B2 (en) 2017-09-07 2021-12-07 Intel Corporation Apparatuses for end-to-end coordination of voice over cellular data network communications
EP4000275A1 (en) 2019-07-17 2022-05-25 Dolby International AB Latency management for content delivery
CN112532738B (zh) * 2020-12-07 2024-11-12 百果园技术(新加坡)有限公司 链路确定方法、装置及电子设备
CN118677886A (zh) * 2023-03-14 2024-09-20 瑞昱半导体股份有限公司 具有双向高品质音频传输机制的音频通信装置及方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1134904C (zh) 1997-09-10 2004-01-14 塞尔隆法国股份有限公司 通信系统和终端
US6829244B1 (en) * 2000-12-11 2004-12-07 Cisco Technology, Inc. Mechanism for modem pass-through with non-synchronized gateway clocks
US20030043934A1 (en) * 2001-06-13 2003-03-06 Roberts Mark D. System and method for applying delay codes to pulse train signals
US6894715B2 (en) * 2001-06-16 2005-05-17 Eric Harold Henrikson Mixing video signals for an audio and video multimedia conference call
US20040032860A1 (en) * 2002-08-19 2004-02-19 Satish Mundra Quality of voice calls through voice over IP gateways

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012253823A (ja) * 2012-09-24 2012-12-20 Yamaha Corp 配信システム、配信方法、配信サーバ及び通信端末

Also Published As

Publication number Publication date
ATE370568T1 (de) 2007-09-15
CN100566230C (zh) 2009-12-02
WO2004038992A1 (en) 2004-05-06
ES2291746T3 (es) 2008-03-01
CN1689264A (zh) 2005-10-26
AU2003258944A1 (en) 2004-05-13
JP4426454B2 (ja) 2010-03-03
DE60315689T2 (de) 2008-06-05
US7289451B2 (en) 2007-10-30
EP1554833A1 (en) 2005-07-20
US20040081106A1 (en) 2004-04-29
EP1554833B1 (en) 2007-08-15
DE60315689D1 (de) 2007-09-27

Similar Documents

Publication Publication Date Title
JP4426454B2 (ja) 通信リンク間の遅延トレードオフ
US7680099B2 (en) Jitter buffer adjustment
JP4367657B2 (ja) 音声通信方法及び装置
US7283585B2 (en) Multiple data rate communication system
JP4842075B2 (ja) 音声伝送装置
US7269141B2 (en) Duplex aware adaptive playout method and communications device
JP5410601B2 (ja) パケット交換網における遅延の監視
EP1694029A1 (en) Method and apparatus for handling network jitter in a voice-over IP communication network using a virtual jittter buffer and time scale modification
JP5528811B2 (ja) 効率的なメディアの扱いのための受信機の動作及び実装
JP2008517560A (ja) 端末間のボイスオーバインターネットプロトコルのメディアの待ち時間を管理する方法および装置
US7606330B2 (en) Dual-rate single band communication system
JP4050961B2 (ja) パケット型音声通信端末
JP3669660B2 (ja) 通話システム
JP2014107614A (ja) 通信端末
JP2005045740A (ja) 通話装置、通話方法及び通話システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060904

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090710

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091008

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091113

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091210

R150 Certificate of patent or registration of utility model

Ref document number: 4426454

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121218

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121218

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131218

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term