[go: up one dir, main page]

JP2006080784A - Media information distribution apparatus and method - Google Patents

Media information distribution apparatus and method Download PDF

Info

Publication number
JP2006080784A
JP2006080784A JP2004261477A JP2004261477A JP2006080784A JP 2006080784 A JP2006080784 A JP 2006080784A JP 2004261477 A JP2004261477 A JP 2004261477A JP 2004261477 A JP2004261477 A JP 2004261477A JP 2006080784 A JP2006080784 A JP 2006080784A
Authority
JP
Japan
Prior art keywords
media information
speaker
encoded data
redundant data
communicator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004261477A
Other languages
Japanese (ja)
Inventor
Kazuhisa Yamagishi
和久 山岸
Takanori Hayashi
孝典 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2004261477A priority Critical patent/JP2006080784A/en
Publication of JP2006080784A publication Critical patent/JP2006080784A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)

Abstract

【課題】パケット損失が生じた場合でもネットワークリソースが限られた状況の中で通信者が主観的に感じるコミュニティ全体の品質を維持する。
【解決手段】メディア情報配信装置10の発言者判別部14により、各通信者端末30A〜30Cからのメディア情報に基づいてこれらメディア情報のうちのいずれが発言者のものかどうかを判別し、各通信者端末30A〜30Cからのメディア情報を符号化した符号化データを符号化部15により生成する。そして冗長データ処理部16により、符号化部15で生成された符号化データのうち発言者判別部14で判別された発言者の符号化データについて冗長データを生成し当該符号化データに付加し、冗長データが付加された発言者の符号化データと傍聴者の符号化データとを各通信者端末30A〜30Cへ配信する。
【選択図】 図1
An object of the present invention is to maintain the quality of an entire community that a communicator feels subjectively in a situation where network resources are limited even when packet loss occurs.
A speaker determination unit of a media information distribution device determines whether any of the media information belongs to a speaker based on the media information from each communication terminal. The encoding unit 15 generates encoded data obtained by encoding the media information from the correspondent terminals 30A to 30C. Then, the redundant data processing unit 16 generates redundant data for the encoded data of the speaker determined by the speaker determining unit 14 among the encoded data generated by the encoding unit 15, and adds the redundant data to the encoded data. The encoded data of the speaker to which the redundant data is added and the encoded data of the listener are distributed to each of the communication terminal 30A to 30C.
[Selection] Figure 1

Description

近年、インターネットに代表される通信ネットワークにおけるアクセス回線のブロードバンド化に応じて、比較的容量の大きいストリーミング系の映像や音声を含むメディア情報の配信サービスが提供されつつある。特に、インターネットでは、そのアクセス回線を用いて複数の端末間で映像・音声メディアをやり取りする、いわゆるテレビ会議などの多地点映像コミュニケーションサービスが注目されている。   2. Description of the Related Art In recent years, media information delivery services including streaming video and audio with a relatively large capacity are being provided in accordance with broadband access lines in communication networks represented by the Internet. In particular, in the Internet, a multipoint video communication service such as a so-called video conference, in which video / audio media are exchanged between a plurality of terminals using the access line, has attracted attention.

この種の多地点映像コミュニケーションサービスでは、通信者が会話する場合、傍聴者の映像に対してはあまり注目せず発言者の映像に注目して会話を進めることが多く、通信者間の立場によって映像の重要度が異なる。
従来、このような多地点映像コミュニケーションの特性に着目し、各通信者端末からの映像・音声を中継配信処理するメディア情報配信装置で、発言者の映像を他の傍聴者の映像より拡大して配信するようにしたものが提案されている(例えば、特許文献1など参照)。
In this type of multi-point video communication service, when a communication person has a conversation, the conversation often proceeds with attention to the video of the speaker without much attention to the video of the listener. The importance of the video is different.
Conventionally, paying attention to such characteristics of multi-point video communication, media information distribution device that relays video and audio from each communication terminal, expands the video of the speaker from the video of other listeners. What has been distributed has been proposed (see, for example, Patent Document 1).

これによれば、例えば通信者Aが発言している期間については、通信者Aの映像が他の通信者に比較して大きく画面表示され、通信者Bが発言している期間については、通信者Bの映像が他の通信者に比較して大きく画面表示される。
これにより、ネットワークリソースが限られた状況の中で、より鮮明な映像を得て臨場感あるコミュニケーションシステムが実現される。
According to this, for example, during the period in which the communication person A is speaking, the video of the communication person A is displayed larger on the screen than the other communication persons, and for the period in which the communication person B is speaking, the communication is performed. The video of the party B is displayed larger on the screen than other communication parties.
As a result, a communication system with a sense of presence can be realized by obtaining clearer images in a situation where network resources are limited.

なお、出願人は、本明細書に記載した先行技術文献情報で特定される先行技術文献以外には、本発明に関連する先行技術文献を出願時までに発見するには至らなかった。
特開平5−103324号公報
The applicant has not yet found prior art documents related to the present invention by the time of filing other than the prior art documents specified by the prior art document information described in this specification.
JP-A-5-103324

しかしながら、このような従来技術では、通信ネットワーク内で発言者のメディア情報についてパケット損失が発生した場合、重要度の高い発言者の音声および映像に歪みが生じ、さらにはその損失したパケットの再送により途切れが生じるため、スムーズにコミュニケーションできず、多地点映像コミュニケーションサービスにおいて、通信者が主観的に感じるコミュニティ全体の品質が低下するという問題がある。   However, in such a conventional technique, when a packet loss occurs in the media information of the speaker in the communication network, the voice and video of the highly important speaker are distorted, and further due to retransmission of the lost packet. Since the interruption occurs, there is a problem that the communication cannot be smoothly performed, and the quality of the entire community that the communicator feels subjectively is deteriorated in the multi-point video communication service.

本発明はこのような課題を解決するためのものであり、多地点映像コミュニケーションサービスにおいて、パケット損失が生じた場合でもネットワークリソースが限られた状況の中で通信者が主観的に感じるコミュニティ全体の品質を維持できるメディア情報配信装置および方法を提供することを目的としている。   The present invention is to solve such a problem. In a multipoint video communication service, even when packet loss occurs, the entire community feels subjectively by a communicator in a situation where network resources are limited. It is an object of the present invention to provide a media information distribution apparatus and method capable of maintaining quality.

このような目的を達成するために、本発明にかかるメディア情報配信装置は、多地点に配置されている複数の通信者端末と通信ネットワークを介して接続し、これら通信者端末から送信された映像および音声を含むメディア情報を中継配信処理することにより各通信者端末に対して多地点映像コミュニケーションサービスを提供するメディア情報配信装置であって、各通信者端末からのメディア情報に基づいて、これらメディア情報のうちのいずれが発言者のものかどうかを判別する発言者判別部と、各通信者端末からのメディア情報を符号化した符号化データを生成する符号化部と、符号化部で生成された符号化データのうち発言者判別部で判別された発言者の符号化データについて冗長データを生成し当該符号化データに付加する冗長データ処理部と、冗長データ処理部で冗長データが付加された発言者の符号化データと符号化部からの発言者以外の傍聴者の符号化データとを各通信者端末へ配信する制御部とを備えている。   In order to achieve such an object, a media information distribution apparatus according to the present invention is connected to a plurality of communicator terminals arranged at multiple points via a communication network, and images transmitted from these communicator terminals. Media information distribution apparatus that provides a multipoint video communication service to each communicator terminal by performing relay distribution processing of media information including audio and audio, and based on the media information from each communicator terminal Generated by a speaker discriminating unit for discriminating which of the information belongs to the speaker, an encoding unit for generating encoded data obtained by encoding media information from each communication terminal, and an encoding unit Among the encoded data, redundant data is generated for the encoded data of the speaker determined by the speaker determining unit and added to the encoded data. And a control unit that distributes the encoded data of the speaker to which redundant data is added by the redundant data processing unit and the encoded data of a listener other than the speaker from the encoding unit to each communication terminal. It has.

この際、各通信者端末からのメディア情報が発言者のものか傍聴者のものかに応じて、当該メディア情報に対する符号量を決定する符号量決定部をさらに設け、符号化部で、符号量決定部で決定された符号量に基づきメディア情報を符号化した符号化データを生成するようにしてもよい。   At this time, a code amount determination unit for determining a code amount for the media information according to whether the media information from each communicator terminal belongs to the speaker or the listener is further provided. You may make it produce | generate the encoding data which encoded media information based on the code amount determined by the determination part.

また、本発明にかかるメディア情報配信方法は、多地点に配置されている複数の通信者端末と通信ネットワークを介して接続されるメディア情報配信装置で用いられ、これら通信者端末から送信された映像および音声を含むメディア情報を中継配信処理することにより各通信者端末に対して多地点映像コミュニケーションサービスを提供するメディア情報配信方法であって、各通信者端末からのメディア情報に基づいて、これらメディア情報のうちのいずれが発言者のものかどうかを判別する発言者判別ステップと、各通信者端末からのメディア情報を符号化した符号化データを生成する符号化ステップと、符号化部で生成された符号化データのうち発言者判別部で判別された発言者の符号化データについて冗長データを生成し当該符号化データに付加する冗長データ処理ステップと、冗長データ処理ステップで冗長データが付加された発言者の符号化データと符号化ステップからの発言者以外の傍聴者の符号化データとを各通信者端末へ配信する制御ステップとを備えている。   Also, the media information distribution method according to the present invention is used in a media information distribution apparatus connected to a plurality of communication terminals arranged at multiple points via a communication network, and images transmitted from these communication terminals. Information distribution method for providing a multipoint video communication service to each communicator terminal by performing relay distribution processing on media information including audio and audio, and based on the media information from each communicator terminal Generated by an encoding unit, an encoding step for generating encoded data obtained by encoding media information from each communication terminal, and an encoding unit that determines which of the information belongs to the speaker Among the encoded data, redundant data is generated for the encoded data of the speaker determined by the speaker determining unit, and the encoded data is generated. Redundant data processing step to be added to the data, the encoded data of the speaker to which the redundant data was added in the redundant data processing step, and the encoded data of the listener other than the speaker from the encoding step to each communicator terminal And a control step for distribution.

この際、各通信者端末からのメディア情報が発言者のものか傍聴者のものかに応じて、当該メディア情報に対する符号量を決定する符号量決定ステップをさらに設け、符号化ステップは、符号量決定部で決定された符号量に基づきメディア情報を符号化した符号化データを生成するようにしてもよい。   At this time, a code amount determining step for determining a code amount for the media information according to whether the media information from each communicator terminal belongs to the speaker or the listener is further provided, and the encoding step You may make it produce | generate the encoding data which encoded media information based on the code amount determined by the determination part.

本発明によれば、メディア情報配信装置において、各通信者端末から受信したメディア情報を符号化して各通信者端末へ配信する際、各メディア情報のうち発言者のメディア情報についてのみ、その符号化データに冗長データが付加されて配信されるため、発言者のメディア情報について冗長性を持たせて配信することができる。
これにより、発言者のメディア情報を傍聴者のそれに比較して、高い通信品質で配信することができるため、通信ネットワーク内でのパケット損失の発生に起因して、メディア情報に歪みや途切れが生じるような場合でも、コミュニケーションで重要となる発言者のメディア情報については歪みや途切れを抑制することができる。
According to the present invention, when media information received from each communicator terminal is encoded and distributed to each communicator terminal in the media information distribution apparatus, only the media information of the speaker among the media information is encoded. Since the redundant data is added to the data and distributed, the media information of the speaker can be distributed with redundancy.
As a result, the media information of the speaker can be distributed with higher communication quality than that of the listener, so that the media information is distorted or interrupted due to the occurrence of packet loss in the communication network. Even in such a case, distortion and discontinuity can be suppressed for the media information of the speaker who is important in communication.

したがって、多地点映像コミュニケーションサービスにおいて、パケット損失が生じた場合でも、ネットワークリソースが限られた状況の中で通信者が主観的に感じるコミュニティ全体の品質を維持することができる。   Therefore, even when packet loss occurs in the multipoint video communication service, it is possible to maintain the quality of the entire community that the communicator feels subjectively in a situation where network resources are limited.

次に、本発明の実施の形態について図面を参照して説明する。
[第1の実施の形態]
まず、図1を参照して、本発明の第1の実施の形態にかかるメディア情報配信装置について説明する。図1は、本発明の第1の実施の形態にかかるメディア情報配信装置の構成を示すブロック図である。
Next, embodiments of the present invention will be described with reference to the drawings.
[First Embodiment]
First, a media information distribution apparatus according to the first embodiment of the present invention will be described with reference to FIG. FIG. 1 is a block diagram showing the configuration of the media information distribution apparatus according to the first embodiment of the present invention.

メディア情報配信装置(多地点接続装置/MCU:Multipoint Communication Unit)10は、全体としてサーバなどの情報処理装置からなり、インターネットに代表される通信ネットワーク20を介して、異なる地点に配置されている複数の通信者端末30(30A〜30C)と接続し、これら通信者端末からの映像および音声を含むメディア情報を中継配信処理することにより多地点映像コミュニケーションサービスを提供する装置である。
通信者端末30は、パソコンなどの情報処理端末装置からなり、所定のアプリケーションプログラムを実行することにより、メディア情報配信装置10で提供される多地点映像コミュニケーションサービスを利用する装置である。
A media information distribution device (multipoint communication unit / MCU: Multipoint Communication Unit) 10 is composed of an information processing device such as a server as a whole, and is arranged at different points via a communication network 20 represented by the Internet. Is a device that provides a multipoint video communication service by connecting to the communication terminal 30 (30A to 30C) and relaying and distributing media information including video and audio from the communication terminal.
The communicator terminal 30 is an information processing terminal device such as a personal computer, and is a device that uses a multipoint video communication service provided by the media information distribution device 10 by executing a predetermined application program.

本実施の形態では、このメディア情報配信装置10において、各通信者端末30から受信したメディア情報を符号化して各通信者端末30へ配信する際、各メディア情報の送信元通信者端末30の通信者が発言者の場合にのみ、当該メディア情報を符号化して得られた符号化データに冗長性を持たせて配信するようにしたものである。   In the present embodiment, when media information received from each communicator terminal 30 is encoded and distributed to each communicator terminal 30 in this media information distribution device 10, communication of each media information transmission source communicator terminal 30 is performed. Only when the person is a speaker, the encoded data obtained by encoding the media information is delivered with redundancy.

次に、図1を参照して、本実施の形態にかかるメディア情報配信装置10の構成について説明する。以下では、3つの通信者端末30A〜30Cが、メディア情報配信装置10で提供される多地点映像コミュニケーションサービスを利用する場合を例として説明する。   Next, the configuration of the media information distribution apparatus 10 according to the present embodiment will be described with reference to FIG. Hereinafter, a case where the three communicator terminals 30A to 30C use the multipoint video communication service provided by the media information distribution apparatus 10 will be described as an example.

このメディア情報配信装置10には、通信インターフェース部(以下、通信I/F部という)11、制御部12、復号部13、発言者判別部14、符号化部15、および冗長データ処理部16が設けられている。   The media information distribution apparatus 10 includes a communication interface unit (hereinafter referred to as a communication I / F unit) 11, a control unit 12, a decoding unit 13, a speaker discriminating unit 14, an encoding unit 15, and a redundant data processing unit 16. Is provided.

通信I/F部11は、通信ネットワーク20を介して各通信者端末30A〜30Cと各種データを送受信することにより、通信者端末30A〜30Cからのメディア情報を受信し、これらを合成したメディア情報を通信者端末30A〜30Cへ配信する回路部である。
制御部12は、CPUなどのマイクロプロセッサとその周辺回路を有し、記憶部(図示せず)から所定のプログラムを読み込んで実行することにより、上記ハードウェアとプログラムとを協働させて、所定の通信プロトコルに応じた各種通信処理を行う機能部である。
The communication I / F unit 11 receives media information from the communicator terminals 30A to 30C by transmitting and receiving various data to and from the communicator terminals 30A to 30C via the communication network 20, and media information obtained by combining these media information. Is a circuit unit that distributes to the correspondent terminals 30A to 30C.
The control unit 12 includes a microprocessor such as a CPU and its peripheral circuits, and reads and executes a predetermined program from a storage unit (not shown), thereby causing the hardware and the program to cooperate with each other. It is a functional part which performs various communication processes according to the communication protocol.

復号部13は、通信I/F部11および制御部12を介して受信した各通信者端末30A〜30Cからのメディア情報を復号する回路部である。
発言者判別部14は、復号部13で得られた各通信者端末30からのメディア情報に含まれる音声のレベル、あるいはパケットに含まれるメディア情報のビットストリームに応じて、各メディア情報のうちのいずれが発言者のものであるかを判別する回路部である。
符号化部15は、予め設定されている符号量に基づき、復号部13で得られた各通信者端末30A〜30Cからのメディア情報を符号化した符号化データを生成する回路部である。
The decoding unit 13 is a circuit unit that decodes media information from each of the correspondent terminals 30 </ b> A to 30 </ b> C received via the communication I / F unit 11 and the control unit 12.
The speaker discriminating unit 14 includes the media information in accordance with the audio level included in the media information from each communicator terminal 30 obtained by the decoding unit 13 or the bit stream of the media information included in the packet. It is a circuit unit that determines which one belongs to the speaker.
The encoding unit 15 is a circuit unit that generates encoded data obtained by encoding the media information from each communication terminal 30A to 30C obtained by the decoding unit 13 based on a preset code amount.

冗長データ処理部16は、符号化部15で符号化されたメディア情報のうち、発言者の符号化データに対して冗長データを生成して付加する回路部である。
これら冗長データは、受信側でのエラー訂正に用いるための情報であり、ストリーミング系データ通信に適用可能で再送制御が不要となる公知の誤り訂正方式(例えばFEC:Forward Error Correctionなど)に基づき生成すればよい。受信側の通信者端末30A〜30Cでは、本来の映像あるいは音声の符号化データが欠損した場合、上記誤り訂正方式に基づきこの冗長データを用いて欠損した符号化データが復元される。
The redundant data processing unit 16 is a circuit unit that generates and adds redundant data to the encoded data of the speaker among the media information encoded by the encoding unit 15.
These redundant data are information used for error correction on the receiving side, and are generated based on a known error correction method (for example, FEC: Forward Error Correction) that is applicable to streaming data communication and does not require retransmission control. do it. In the communication terminals 30A to 30C on the receiving side, when the original video or audio encoded data is lost, the lost encoded data is restored using the redundant data based on the error correction method.

なお、以上では、復号部13、発言者判別部14、符号化部15、および冗長データ処理部16が回路部から構成される場合を例として説明したが、これに限定されるものではない。これら各部のうちのいずれかまたはすべてを、前述した制御部12で実現される機能部によりその一部またはすべてを構成してもよい。   In the above description, the decoding unit 13, the speaker discriminating unit 14, the encoding unit 15, and the redundant data processing unit 16 are described as examples. However, the present invention is not limited to this. Any or all of these units may be configured by a part or all of the functional units realized by the control unit 12 described above.

[第1の実施の形態の動作]
次に、図2を参照して、本実施の形態にかかるメディア情報配信装置10の動作について説明する。図2は、本実施の形態にかかるメディア情報配信装置10の中継配信処理を示すフローチャートである。ここでは、発言者のメディア情報のうち映像および音声の両方の符号化データに冗長データを付加して配信する場合を例として説明する。
[Operation of First Embodiment]
Next, the operation of the media information distribution apparatus 10 according to the present embodiment will be described with reference to FIG. FIG. 2 is a flowchart showing relay distribution processing of the media information distribution apparatus 10 according to the present embodiment. Here, a case will be described as an example where redundant data is added to the encoded data of both video and audio in the media information of the speaker for distribution.

メディア情報配信装置10は、まず、制御部12により、通信ネットワーク20および通信I/F部11を介して、通信者端末30A〜30Cからのメディア情報を受信し(ステップ100)、復号部13へ出力する。
復号部13は、通信者ごとにメディア情報を復号し(ステップ102)、そのメディア情報を符号化部15に出力するとともに、メディア情報のうちの音声については発言者判別部14に出力する。発言者判別部14は、音量の大きい通信者を発言者として判別し(ステップ103)、判別結果を符号化部15と冗長データ処理部16に出力する。
In the media information distribution apparatus 10, first, the control unit 12 receives media information from the correspondent terminals 30 </ b> A to 30 </ b> C via the communication network 20 and the communication I / F unit 11 (step 100), and sends the media information to the decoding unit 13. Output.
The decoding unit 13 decodes the media information for each communicator (step 102), outputs the media information to the encoding unit 15, and outputs the voice of the media information to the speaker discriminating unit 14. The speaker discriminating unit 14 discriminates a communication person having a high volume as a speaker (step 103), and outputs the discrimination result to the encoding unit 15 and the redundant data processing unit 16.

符号化部15は、予め設定されている所定の符号量に応じた量子化ステップ幅を用いて、各通信者からのメディア情報を符号化し(ステップ104)、得られた符号化データを冗長データ処理部16へ出力する。
冗長データ処理部16は、入力された符号化データのうち発言者の符号化データについてのみ冗長データを生成して付加し、制御部12へ出力する(ステップ105)。なお、冗長データ処理部16では、傍聴者の符号化データについては冗長データを付加せずそのまま制御部12へ出力する。
The encoding unit 15 encodes media information from each communicator using a quantization step width corresponding to a predetermined code amount set in advance (step 104), and converts the obtained encoded data into redundant data. Output to the processing unit 16.
The redundant data processing unit 16 generates and adds redundant data only to the encoded data of the speaker among the input encoded data, and outputs the redundant data to the control unit 12 (step 105). The redundant data processing unit 16 outputs the encoded data of the listener to the control unit 12 without adding redundant data.

制御部12は、冗長データが付加された発言者の符号化データを受け取るとともに、冗長データが付加されていない傍聴者の符号化データを受け取り、これら符号化データを、通信I/F部11および通信ネットワーク20を介して、各通信者端末30A〜30Cへ配信する(ステップ106)。   The control unit 12 receives the encoded data of the speaker to which the redundant data is added, receives the encoded data of the listener to which the redundant data is not added, and transmits the encoded data to the communication I / F unit 11 and Distribution is made to each of the correspondent terminals 30A to 30C via the communication network 20 (step 106).

このようにして、各通信者端末30A〜30Cから送信されたメディア情報は、メディア情報配信装置10で、逐次、上記のような中継配信処理が行われて各通信者端末30A〜30Cへ配信される。この際、発言者のメディア情報については冗長性を持って配信される。
これにより、通信ネットワーク内でパケット損失が発生した場合でも、各通信者端末30A〜30Cでは、発言者のメディア情報について、その冗長データに基づき誤り訂正処理が行われ、元のメディア情報が正常に復号されて通信者へ提供される。
In this way, the media information transmitted from each of the correspondent terminals 30A to 30C is sequentially distributed to the correspondent terminals 30A to 30C through the above-described relay distribution processing by the media information distribution apparatus 10. The At this time, the media information of the speaker is distributed with redundancy.
As a result, even when packet loss occurs in the communication network, each of the communication terminals 30A to 30C performs error correction processing on the speaker's media information based on the redundant data, and the original media information is normally restored. Decrypted and provided to the correspondent.

したがって、メディア情報配信装置10から配信されるメディア情報は、図3のように制御される。図3は、本実施の形態にかかるメディア情報配信装置でのメディア情報の配信制御を示すタイミングチャートである。   Therefore, the media information distributed from the media information distribution apparatus 10 is controlled as shown in FIG. FIG. 3 is a timing chart showing media information distribution control in the media information distribution apparatus according to the present embodiment.

図3において、通信者Aが発言している期間TAでは、通信者Aの符号化データに対して冗長データが付加されて配信され、傍聴者である通信者B,Cの符号化データについては冗長データなしで配信される。
その後、時刻Tに発言者が通信者Aから通信者Bに切り替わった場合、それ以降の通信者Bが発言している期間TBでは、通信者Bの符号化データに対して冗長データが付加されて配信され、傍聴者である通信者A,Cの符号化データについては冗長データなしで配信される。
In FIG. 3, in a period TA in which the communication person A speaks, redundant data is added to the encoded data of the communication person A and distributed, and the encoded data of the communication persons B and C who are listeners are Delivered without redundant data.
Thereafter, when the speaker is switched from the communicator A to the communicator B at time T, redundant data is added to the encoded data of the communicator B in the period TB during which the communicator B speaks thereafter. The encoded data of the communication persons A and C who are the listeners are distributed without redundant data.

このように、本実施の形態では、メディア情報配信装置10において、各通信者端末30から受信した各メディア情報を符号化して各通信者端末30へ配信する際、各メディア情報の送信元通信者端末30の通信者が発言者の場合にのみ、その符号化データに冗長データを付加して配信するようにしたので、発言者のメディア情報に冗長性を持たせて配信することができる。   Thus, in the present embodiment, when the media information received from each communicator terminal 30 is encoded and distributed to each communicator terminal 30 in the media information distribution device 10, the sender communicator of each media information Only when the communicator of the terminal 30 is a speaker, redundant data is added to the encoded data for distribution, so that the media information of the speaker can be distributed with redundancy.

これにより、発言者のメディア情報を傍聴者のそれに比較して、高い通信品質で配信することができるため、通信ネットワーク内でのパケット損失の発生に起因して、メディア情報に歪みや途切れが生じるような場合でも、コミュニケーションで重要となる発言者のメディア情報については歪みや途切れを抑制することができる。
したがって、多地点映像コミュニケーションサービスにおいて、パケット損失が生じた場合でも、ネットワークリソースが限られた状況の中でネットワークリソースの増大を必要とすることなく、通信者が主観的に感じるコミュニティ全体の品質を維持することができる。
As a result, the media information of the speaker can be distributed with higher communication quality than that of the listener, so that the media information is distorted or interrupted due to the occurrence of packet loss in the communication network. Even in such a case, distortion and discontinuity can be suppressed for the media information of the speaker who is important in communication.
Therefore, even in the case of packet loss in multi-point video communication services, the quality of the entire community felt by the communicator subjectively without requiring an increase in network resources in a situation where network resources are limited. Can be maintained.

[第2の実施の形態]
次に、図4を参照して、本発明の第2の実施の形態にかかるメディア情報配信装置について説明する。図4は、本発明の第2の実施の形態にかかるメディア情報配信装置の構成を示すブロック図である。
前述した第1の実施の形態では、発言者のメディア情報について冗長性を持たせて配信する場合について説明した。本実施の形態では、発言者のメディア情報について冗長性を持たせて配信する際、発言者か否かに応じて当該通信者のメディア情報の符号量を調整する場合について説明する。
[Second Embodiment]
Next, a media information distribution apparatus according to the second embodiment of the present invention will be described with reference to FIG. FIG. 4 is a block diagram showing the configuration of the media information distribution apparatus according to the second embodiment of the present invention.
In the first embodiment described above, a case has been described in which media information of a speaker is distributed with redundancy. In the present embodiment, a case will be described in which when the media information of a speaker is delivered with redundancy, the code amount of the media information of the communicator is adjusted according to whether or not the speaker is a speaker.

ネットワークリソースが限られた状況の中で、メディア情報配信装置10から各通信者のメディア情報を配信するとともに発言者の冗長データを配信する場合、冗長データを配信しない場合と比較して、より多くのネットワークリソースを必要とする。したがって、量子化ステップ幅などを調整して各通信者のメディア情報の符号量を一律に削減し、その削減分のネットワークリソースで冗長データを配信する方法が考えられる。しかし、各通信者のメディア情報の符号量を一律に削減した場合、発言者のメディア情報が劣化するため、通信者が主観的に感じるコミュニティ全体の品質が低下する。   When the network information is distributed from the media information distribution device 10 and the redundant data of the speaker is distributed from the media information distribution apparatus 10 in a situation where the network resources are limited, it is more than the case where the redundant data is not distributed. Requires network resources. Therefore, a method of adjusting the quantization step width and the like to uniformly reduce the code amount of media information of each communicator and distributing redundant data with the network resources corresponding to the reduction is conceivable. However, when the code amount of the media information of each communicator is uniformly reduced, the media information of the speaker deteriorates, so the quality of the entire community that the communicator feels subjectively decreases.

本実施の形態では、メディア情報について冗長性を持たせて配信する際、発言者か否かに応じて当該通信者のメディア情報の符号量を調整し、傍聴者の符号量に比較して発言者の符号量を多くするよう調整している。
本実施の形態にかかるメディア情報配信装置10(図4参照)には、前述した第1の実施の形態にかかるメディア情報配信装置10(図1参照)と比較して符号量決定部17が追加されている。なお、図4において、図1と同じまたは同等部分には同一符号を付してあり、詳細な説明については省略する。
In this embodiment, when media information is distributed with redundancy, the code amount of the media information of the correspondent is adjusted according to whether or not the speaker is a speaker, and the message information is compared with the code amount of the listener. The code amount is adjusted so as to increase the code amount.
The media information distribution apparatus 10 (see FIG. 4) according to the present embodiment is added with a code amount determination unit 17 as compared with the media information distribution apparatus 10 (see FIG. 1) according to the first embodiment described above. Has been. In FIG. 4, the same or equivalent parts as in FIG. 1 are denoted by the same reference numerals, and detailed description thereof is omitted.

符号量決定部17は、発言者判別部14での判別結果に応じて、各通信者端末からのメディア情報に対する符号量を決定する回路部である。
符号量とは、例えば映像(画像)の場合、その映像を構成する1画素(1ピクセル)あたりに用いるビット数(bits/pel:pel=pixel element)であり、映像(画像)の精細度を左右する。この符号量が大きい場合は、1画素を表現するために用いるデータ量が多くなり映像が精細になる。逆に、符号量が小さい場合は、1画素を表現するために用いるデータ量が少なくなり映像が粗くなる。
The code amount determination unit 17 is a circuit unit that determines the code amount for the media information from each communication terminal according to the determination result in the speaker determination unit 14.
For example, in the case of video (image), the code amount is the number of bits (bits / pel: pel = pixel element) used per pixel (one pixel) constituting the video, and the definition of the video (image) is It depends on you. When this code amount is large, the amount of data used to represent one pixel increases and the video becomes finer. Conversely, when the code amount is small, the amount of data used to represent one pixel is reduced and the video becomes rough.

デジタル映像の符号化方式として広く用いているMPEG(Moving Picture Expert Group)などの符号化方式では、入力された映像データをDCT(離散余弦変換:Discrete Cosine Transform)処理などの周波数変換処理を行った後に量子化し、これを2次元ハフマン符号に割り当てることにより元の映像データを圧縮処理しており、ITU−T H.26Xシリーズ、モーションJPEG(Motion-JPEG:Joint Photographic Experts Group)、あるいはJPEG2000などの符号化方式でも同様である。   In coding methods such as MPEG (Moving Picture Expert Group) widely used as digital video coding methods, input video data is subjected to frequency conversion processing such as DCT (Discrete Cosine Transform) processing. The original video data is compressed by later quantizing and assigning it to a two-dimensional Huffman code. The same applies to coding schemes such as the 26X series, motion JPEG (Motion-JPEG: Joint Photographic Experts Group), or JPEG2000.

量子化処理では、DCT処理で得られた各DCT係数を、デフォルトで設定されている量子化テーブルの対応する量子化係数でそれぞれ除算することにより量子化している。したがって、高周波数成分に対応する量子化係数を大きくしておくことにより、除算結果のうち高周波成分のDCT係数に対する除算結果が小さくなって、その値を表現するのに必要な情報量も少なくなり、結果として圧縮されたことになる。   In the quantization process, each DCT coefficient obtained by the DCT process is quantized by dividing it by the corresponding quantization coefficient of the quantization table set by default. Therefore, by increasing the quantization coefficient corresponding to the high frequency component, the division result for the DCT coefficient of the high frequency component among the division results is reduced, and the amount of information necessary to express the value is also reduced. As a result, it is compressed.

上記量子化処理では、量子化テーブルの量子化係数を調整することにより、圧縮の度合いを制御する符号量制御方式が利用されている。例えば、デフォルトの量子化係数を少し大きくすれば、上記除算結果が小さくなるDCT係数が多くなり圧縮率が増加し、結果として符号量が小さくなる。逆にデフォルトの量子化係数を少し小さくすれば、上記除算結果が小さくなるDCT係数が少なくなり圧縮率が低下し、結果として符号量が大きくなる。   In the quantization process, a code amount control method for controlling the degree of compression by adjusting the quantization coefficient of the quantization table is used. For example, if the default quantization coefficient is slightly increased, the number of DCT coefficients that reduce the division result increases, the compression rate increases, and the code amount decreases as a result. On the contrary, if the default quantization coefficient is slightly reduced, the DCT coefficients that reduce the division result are reduced, the compression rate is lowered, and as a result, the code amount is increased.

本実施の形態では、このような量子化係数の調整幅すなわち量子化ステップ幅を、符号量決定部17で決定された符号量に応じて制御することにより、発言者および傍聴者に対する符号量を制御している。
なお、MPEG以外の符号化方式でも、上記と同様に量子化処理において符号量を制御するパラメータが用意されており、これらパラメータを用いて符号量を制御すればよい。例えば、JPEG2000では、DCT処理に代えてウェーブレット変換処理が用いられているが、この場合も上記と同様の量子化ステップ幅を用いて符号量を制御できる。
In the present embodiment, the code amount for the speaker and the listener is controlled by controlling the adjustment width of the quantization coefficient, that is, the quantization step width, according to the code amount determined by the code amount determination unit 17. I have control.
Note that, in encoding methods other than MPEG, parameters for controlling the code amount in the quantization process are prepared in the same manner as described above, and the code amount may be controlled using these parameters. For example, in JPEG2000, wavelet transform processing is used instead of DCT processing. In this case as well, the code amount can be controlled using the same quantization step width as described above.

[第2の実施の形態の動作]
次に、図5を参照して、本実施の形態にかかるメディア情報配信装置10の動作について説明する。図5は、本実施の形態にかかるメディア情報配信装置10の中継配信処理を示すフローチャートである。前述した図2中継配信処理と比較して、ステップ103とステップ104との間に、メディア情報の符号量を決定するための処理としてステップ110が追加されている。なお、図5において、図2と同じまたは同等部分については同一符号を付してある。ここでは、発言者のメディア情報のうち映像および音声の両方の符号化データに冗長データを付加して配信する場合を例として説明する。
[Operation of Second Embodiment]
Next, the operation of the media information distribution apparatus 10 according to the present embodiment will be described with reference to FIG. FIG. 5 is a flowchart showing relay distribution processing of the media information distribution apparatus 10 according to the present embodiment. Compared with the relay distribution process in FIG. 2 described above, step 110 is added between step 103 and step 104 as a process for determining the code amount of the media information. In FIG. 5, the same or equivalent parts as in FIG. Here, a case will be described as an example where redundant data is added to the encoded data of both video and audio in the media information of the speaker for distribution.

メディア情報配信装置10は、まず、制御部12により、通信ネットワーク20および通信I/F部11を介して、通信者端末30A〜30Cからのメディア情報を受信し(ステップ100)、復号部13へ出力する。
復号部13は、通信者ごとにメディア情報を復号し(ステップ102)、そのメディア情報を符号化部15に出力するとともに、メディア情報のうちの音声については発言者判別部14に出力する。発言者判別部14は、音量の大きい通信者を発言者として判別し(ステップ103)、判別結果を符号化部15、冗長データ処理部16、および符号量決定部17に出力する。
In the media information distribution apparatus 10, first, the control unit 12 receives media information from the correspondent terminals 30 </ b> A to 30 </ b> C via the communication network 20 and the communication I / F unit 11 (step 100), and sends the media information to the decoding unit 13. Output.
The decoding unit 13 decodes the media information for each communicator (step 102), outputs the media information to the encoding unit 15, and outputs the voice of the media information to the speaker discriminating unit 14. The speaker discriminating unit 14 discriminates a speaker having a high volume as a speaker (step 103), and outputs the discrimination result to the encoding unit 15, the redundant data processing unit 16, and the code amount determining unit 17.

ここで、符号量決定部17は、発言者判別部14からの判別結果に基づき、各通信者のうち傍聴者のメディア情報の符号化に用いる符号量を、発言者の符号量より小さく設定する(ステップ110)。
符号化部15は、発言者および傍聴者ごとに符号量決定部17によって設定された符号量に応じた量子化ステップ幅を個別に用いて、発言者および傍聴者からのメディア情報をそれぞれ符号化し(ステップ104)、得られた符号化データを冗長データ処理部16へ出力する。
Here, the code amount determination unit 17 sets the code amount used for encoding the media information of the listener among the communicators based on the determination result from the speaker determination unit 14 to be smaller than the code amount of the speaker. (Step 110).
The encoding unit 15 individually encodes media information from the speaker and the listener by using a quantization step width corresponding to the code amount set by the code amount determination unit 17 for each speaker and listener. (Step 104), the obtained encoded data is output to the redundant data processing unit 16.

冗長データ処理部16は、入力された符号化データのうち発言者の符号化データについてのみ冗長データを生成して付加し、制御部12へ出力する(ステップ105)。なお、冗長データ処理部16では、傍聴者の符号化データについては冗長データを付加せずそのまま制御部12へ出力する。
制御部12は、冗長データが付加された発言者の符号化データを受け取るとともに、冗長データが付加されていない傍聴者の符号化データを受け取り、これら符号化データを、通信I/F部11および通信ネットワーク20を介して、各通信者端末30A〜30Cへ配信する(ステップ106)。
The redundant data processing unit 16 generates and adds redundant data only to the encoded data of the speaker among the input encoded data, and outputs the redundant data to the control unit 12 (step 105). The redundant data processing unit 16 outputs the encoded data of the listener to the control unit 12 without adding redundant data.
The control unit 12 receives the encoded data of the speaker to which the redundant data is added, receives the encoded data of the listener to which the redundant data is not added, and transmits the encoded data to the communication I / F unit 11 and Distribution is made to each of the correspondent terminals 30A to 30C via the communication network 20 (step 106).

このようにして、各通信者端末30A〜30Cから送信されたメディア情報は、メディア情報配信装置10で、逐次、上記のような中継配信処理が行われて各通信者端末30A〜30Cへ配信される。この際、発言者に比較して傍聴者のメディア情報の符号量が少なくなるよう配信されるとともに、発言者のメディア情報については冗長性を持って配信される。   In this way, the media information transmitted from each of the correspondent terminals 30A to 30C is sequentially distributed to the correspondent terminals 30A to 30C through the above-described relay distribution processing by the media information distribution apparatus 10. The At this time, it is distributed so that the code amount of the media information of the listener is smaller than that of the speaker, and the media information of the speaker is distributed with redundancy.

したがって、符号量の調整を行わない本発明の第1の実施の形態にかかるメディア情報配信装置10と、上記のような符号量の調整を行う本発明の第2の実施の形態にかかるメディア情報配信装置10とでは、冗長データを付加する際に図6および図7のような制御が行われる。図6は、符号量の調整を行わない場合(第1の実施の形態)の冗長データの付加制御を示す説明図である。図7は、符号量の調整を行う場合(第2の実施の形態)の冗長データの付加制御を示す説明図である。なお、これら図6,図7では、ネットワークリソースが限られた状況を想定し、冗長データを付加した場合でもネットワークリソース(通信帯域幅)は拡張されず、配信可能な全符号量を増加できない場合を前提としている。   Therefore, the media information distribution apparatus 10 according to the first embodiment of the present invention that does not adjust the code amount, and the media information according to the second embodiment of the present invention that adjusts the code amount as described above. The distribution apparatus 10 performs control as shown in FIGS. 6 and 7 when adding redundant data. FIG. 6 is an explanatory diagram showing redundant data addition control when the code amount is not adjusted (first embodiment). FIG. 7 is an explanatory diagram showing redundant data addition control when the code amount is adjusted (second embodiment). 6 and 7, assuming that the network resources are limited, the network resources (communication bandwidth) are not expanded even when redundant data is added, and the total amount of codes that can be distributed cannot be increased. Is assumed.

まず、図6に示すように、冗長データを付加しない場合、メディア情報配信装置10から各通信者端末30A〜30Cへ配信できる全符号量をWとし、これを各通信者からのメディア情報の符号化データで均等に使用した場合、各通信者の符号量WDは、WD=W/3となる。このとき各通信者の量子化ステップ幅をSとする。   First, as shown in FIG. 6, when redundant data is not added, the total code amount that can be distributed from the media information distribution apparatus 10 to each communication terminal 30A to 30C is W, and this is the code of the media information from each communication party. When the equalized data is used evenly, the code amount WD of each communicator is WD = W / 3. At this time, let S be the quantization step width of each communicator.

次に、各通信者の符号量を調整せずに冗長データを付加する場合、各通信者で同じSより大きい量子化ステップ幅S’を用いて、各通信者の符号量を上記WDより小さいWD’とし、その余剰分を利用して、発言者この場合は通信者Aの冗長データを配信することになる。したがって、冗長データの符号量をWPとした場合、冗長データを付加した際の発言者である通信者Aの符号量WAは、WD’=(W−WP)/3となり、冗長データを付加しない場合の符号量WDより小さくなる。これにより、冗長データを付加しない場合と比較して発言者の符号量が低減し、受信側において発言者のメディア情報も傍聴者と同程度に低精細となる。   Next, when adding redundant data without adjusting the code amount of each communicator, the code amount of each communicator is smaller than the above WD by using a quantization step width S ′ larger than the same S by each communicator. In this case, the redundant data of the communicator A is distributed by using WD ′ and the surplus. Therefore, when the code amount of redundant data is WP, the code amount WA of the communication person A who is the speaker when the redundant data is added is WD ′ = (W−WP) / 3, and no redundant data is added. In this case, the code amount WD becomes smaller. As a result, the amount of code of the speaker is reduced as compared with the case where redundant data is not added, and the media information of the speaker becomes low definition on the receiving side as well as the listener.

一方、図7において、各通信者の符号量を調整して冗長データを付加する場合、傍聴者となる通信者B,CでSより大きい量子化ステップ幅S’(>S)を用いて通信者B,Cの符号量をWDより小さいWD’とし、その余剰分を利用して、発言者である通信者Aの符号データと冗長データを配信することになる。この際、傍聴者のS’を調整すれば、発言者である通信者AでSと等しい量子化ステップ幅S”(=S)を用いることができる。したがって、冗長データを付加した際の発言者である通信者Aの符号量WAは、WD’=W−2・WD’−WPで表され、冗長データを付加しない場合の符号量WDと等しくなる。   On the other hand, in FIG. 7, in the case where redundant data is added by adjusting the code amount of each communicator, communication is performed by using the quantization step width S ′ (> S) larger than S by the communicators B and C serving as listeners. The code amounts of the parties B and C are set to WD ′ smaller than the WD, and the surplus is used to distribute the code data and redundant data of the speaker A who is the speaker. At this time, if the listener's S ′ is adjusted, the communication person A who is the speaker can use the quantization step width S ″ (= S) equal to S. Therefore, the message when the redundant data is added. The code amount WA of the communication person A, who is a user, is expressed by WD ′ = W−2 · WD′−WP, and is equal to the code amount WD when no redundant data is added.

このように、本実施の形態では、メディア情報配信装置10において、メディア情報について冗長性を持たせて配信する際、発言者か否かに応じて当該通信者のメディア情報の符号量を調整し、発言者の符号量に比較して傍聴者の符号量が少なくなるよう調整するようにしたので、受信側において傍聴者のメディア情報の精細度が低下するものの、発言者のメディア情報については所望の精細度を得ることができる。したがって、各通信者のメディア情報の符号量を一律に削減した場合と比較して、冗長データを付加した場合でも発言者のメディア情報の劣化を抑制でき、通信者が主観的に感じるコミュニティ全体の品質の低下を抑制することができる。   As described above, in the present embodiment, when the media information distribution apparatus 10 distributes media information with redundancy, the code amount of the media information of the communicator is adjusted according to whether or not the speaker is a speaker. Since the code amount of the listener is reduced compared to the code amount of the speaker, the definition of the media information of the listener is reduced on the receiving side, but the media information of the speaker is desired. Can be obtained. Therefore, compared with the case where the amount of code of media information of each communicator is reduced uniformly, even when redundant data is added, deterioration of the media information of the talker can be suppressed, and the entire community that the communicator feels subjectively A reduction in quality can be suppressed.

なお、前述した各実施の形態では、発言者のメディア情報のうち映像および音声の両方について冗長データを生成して付加する場合を例として説明したが、これに限定されるものではなく、例えば冗長データ処理部16において、映像または音声のいずれか一方についてのみ冗長データを生成して付加するようにしてもよく、前述と同様の作用効果が得られる。   In each of the embodiments described above, an example has been described in which redundant data is generated and added to both video and audio in the media information of a speaker. However, the present invention is not limited to this, and for example, redundant data is provided. In the data processing unit 16, redundant data may be generated and added only for one of video and audio, and the same effect as described above can be obtained.

また、前述した第2の実施の形態では、図7において、冗長データを付加する場合の発言者の量子化ステップ幅S”について冗長データを付加しない場合のSと等しくした場合について説明したが、これに限定されるものではなく、傍聴者の量子化ステップ幅S’より小さい量子化ステップ幅S”<S’を用いれば、前述した作用効果を得ることができる。したがって、S”とSとの関係はあまり重要ではなく、S”<S<S’であっても、S<S”<S’であってもよい。発言者の量子化ステップ幅S”としてS”>Sを用いた場合、発言者の符号量WD”は、Wを等分した際のWDより大きくなり、発言者のメディア情報としてより精細なメディア情報を配信できる。   Further, in the second embodiment described above, in FIG. 7, a case has been described in which the quantization step width S ″ of a speaker when adding redundant data is equal to S when no redundant data is added. However, the present invention is not limited to this, and if the quantization step width S ″ <S ′ smaller than the quantization step width S ′ of the listener is used, the above-described effects can be obtained. Therefore, the relationship between S ″ and S is not so important and may be S ″ <S <S ′ or S <S ″ <S ′. When S ″> S is used, the code amount WD ″ of the speaker becomes larger than the WD when W is equally divided, and finer media information can be distributed as the media information of the speaker.

なお、メディア情報配信時において、冗長データが付加されない期間が存在する場合、図6や図7のように、各通信者の符号量WDを等しくする必要はなく、例えば通信者ごとに個別の符号量WDを用いてもよい。
また、冗長データを付加する際、図6では各通信者の符号量WD’を等しくした場合、図7では各傍聴者の符号量WD’を等しくした場合を、それぞれ例として説明したが、これに限定されるものではなく、例えば通信者ごとあるいは傍聴者ごとに個別の符号量WD’を用いてもよく、前述と同様の作用効果が得られる。
When there is a period during which redundant data is not added at the time of media information distribution, it is not necessary to equalize the code amount WD of each communicator as shown in FIG. 6 and FIG. The quantity WD may be used.
In addition, when adding redundant data, FIG. 6 illustrates the case where the code amount WD ′ of each communicator is made equal, and FIG. 7 illustrates the case where the code amount WD ′ of each listener is made equal. For example, an individual code amount WD ′ may be used for each communicator or for each listener, and the same effect as described above can be obtained.

また、前述した各実施の形態では、発言者が1人の場合を例として説明したが、発言者が複数の場合でも、前述と同様にして各実施の形態を適用でき、前述と同様の作用効果が得られる。特に、第2の実施の形態では、発言者が複数の場合でも、S”<S’の関係を維持しつつS”,S’を調整することにより、冗長データを付加した場合でも発言者のメディア情報の劣化を抑制でき、通信者が主観的に感じるコミュニティ全体の品質の低下を抑制することができる。   Further, in each of the above-described embodiments, the case where there is one speaker has been described as an example. However, even when there are a plurality of speakers, each embodiment can be applied in the same manner as described above, and the same operation as described above. An effect is obtained. In particular, in the second embodiment, even when there are a plurality of speakers, even if redundant data is added by adjusting S ″ and S ′ while maintaining the relationship of S ″ <S ′. The deterioration of the media information can be suppressed, and the deterioration of the quality of the entire community that the communication person feels subjectively can be suppressed.

本発明の第1の実施の形態にかかるメディア情報配信装置の構成を示すブロック図である。It is a block diagram which shows the structure of the media information delivery apparatus concerning the 1st Embodiment of this invention. 本発明の第1の実施の形態にかかるメディア情報配信装置の中継配信処理を示すフローチャートである。It is a flowchart which shows the relay delivery process of the media information delivery apparatus concerning the 1st Embodiment of this invention. 本発明の第1の実施の形態にかかるメディア情報配信装置での映像・音声の配信制御を示すタイミングチャートである。5 is a timing chart showing video / audio distribution control in the media information distribution apparatus according to the first exemplary embodiment of the present invention. 本発明の第2の実施の形態にかかるメディア情報配信装置の構成を示すブロック図である。It is a block diagram which shows the structure of the media information delivery apparatus concerning the 2nd Embodiment of this invention. 本発明の第2の実施の形態にかかるメディア情報配信装置の中継配信処理を示すフローチャートである。It is a flowchart which shows the relay delivery process of the media information delivery apparatus concerning the 2nd Embodiment of this invention. 本発明の第1の実施の形態にかかるメディア情報配信装置での冗長データの付加制御を示す説明図である。It is explanatory drawing which shows addition control of the redundant data in the media information delivery apparatus concerning the 1st Embodiment of this invention. 本発明の第2の実施の形態にかかるメディア情報配信装置での冗長データの付加制御を示す説明図である。It is explanatory drawing which shows addition control of the redundant data in the media information delivery apparatus concerning the 2nd Embodiment of this invention.

符号の説明Explanation of symbols

10…メディア情報配信装置、11…通信I/F部、12…制御部、13…復号部、14…発言者判別部、15…符号化部、16…冗長データ処理部、17…符号量決定部、20…通信ネットワーク、30A〜30C…通信者端末。
DESCRIPTION OF SYMBOLS 10 ... Media information delivery apparatus, 11 ... Communication I / F part, 12 ... Control part, 13 ... Decoding part, 14 ... Speaker discrimination | determination part, 15 ... Encoding part, 16 ... Redundant data processing part, 17 ... Code amount determination Part, 20 ... communication network, 30A-30C ... communicator terminal.

Claims (4)

多地点に配置されている複数の通信者端末と通信ネットワークを介して接続し、これら通信者端末から送信された映像および音声を含むメディア情報を中継配信処理することにより前記各通信者端末に対して多地点映像コミュニケーションサービスを提供するメディア情報配信装置であって、
前記各通信者端末からのメディア情報に基づいて、これらメディア情報のうちのいずれが発言者のものかどうかを判別する発言者判別部と、
前記各通信者端末からのメディア情報を符号化した符号化データを生成する符号化部と、
前記符号化部で生成された符号化データのうち前記発言者判別部で判別された発言者の符号化データについて冗長データを生成し当該符号化データに付加する冗長データ処理部と、
前記冗長データ処理部で冗長データが付加された発言者の符号化データと前記符号化部からの発言者以外の傍聴者の符号化データとを前記各通信者端末へ配信する制御部と
を備えることを特徴とするメディア情報配信装置。
Connect to a plurality of communicator terminals arranged at multiple points via a communication network, and relay and distribute media information including video and audio transmitted from these communicator terminals to each communicator terminal. Media information distribution device providing multi-point video communication service,
Based on the media information from each of the correspondent terminals, a speaker discriminator for discriminating whether any of these media information belongs to the speaker,
An encoding unit that generates encoded data obtained by encoding media information from each of the communication terminal;
A redundant data processing unit that generates redundant data for the encoded data of the speaker determined by the speaker determining unit among the encoded data generated by the encoding unit and adds the redundant data to the encoded data;
A controller that distributes the encoded data of the speaker to which redundant data is added by the redundant data processing unit and the encoded data of a listener other than the speaker from the encoding unit to each of the communication terminal. A media information distribution apparatus characterized by the above.
請求項1に記載のメディア情報配信装置において、
前記各通信者端末からのメディア情報が発言者のものか傍聴者のものかに応じて、当該メディア情報に対する符号量を決定する符号量決定部をさらに備え、
前記符号化部は、前記符号量決定部で決定された符号量に基づき前記メディア情報を符号化した符号化データを生成する
ことを特徴とするメディア情報配信装置。
The media information distribution apparatus according to claim 1,
According to whether the media information from each communicator terminal is that of a speaker or a listener, further comprises a code amount determination unit that determines a code amount for the media information,
The said encoding part produces | generates the encoding data which encoded the said media information based on the code amount determined by the said code amount determination part. The media information delivery apparatus characterized by the above-mentioned.
多地点に配置されている複数の通信者端末と通信ネットワークを介して接続されるメディア情報配信装置で用いられ、これら通信者端末から送信された映像および音声を含むメディア情報を中継配信処理することにより前記各通信者端末に対して多地点映像コミュニケーションサービスを提供するメディア情報配信方法であって、
前記各通信者端末からのメディア情報に基づいて、これらメディア情報のうちのいずれが発言者のものかどうかを判別する発言者判別ステップと、
前記各通信者端末からのメディア情報を符号化した符号化データを生成する符号化ステップと、
前記符号化部で生成された符号化データのうち前記発言者判別部で判別された発言者の符号化データについて冗長データを生成し当該符号化データに付加する冗長データ処理ステップと、
前記冗長データ処理ステップで冗長データが付加された発言者の符号化データと前記符号化ステップからの発言者以外の傍聴者の符号化データとを前記各通信者端末へ配信する制御ステップと
を備えることを特徴とするメディア情報配信方法。
Used in media information distribution devices connected to a plurality of communicator terminals arranged at multiple points via a communication network, and relaying and distributing media information including video and audio transmitted from these communicator terminals A media information distribution method for providing a multipoint video communication service to each of the communication terminal,
Based on the media information from each communicator terminal, a speaker determination step of determining whether any of these media information belongs to the speaker;
An encoding step for generating encoded data obtained by encoding the media information from each of the correspondent terminals;
A redundant data processing step of generating redundant data for the encoded data of the speaker determined by the speaker determining unit among the encoded data generated by the encoding unit and adding the redundant data to the encoded data;
A control step of delivering the encoded data of the speaker to which the redundant data is added in the redundant data processing step and the encoded data of a listener other than the speaker from the encoding step to each of the communication terminal. A media information delivery method characterized by the above.
請求項3に記載のメディア情報配信方法において、
前記各通信者端末からのメディア情報が発言者のものか傍聴者のものかに応じて、当該メディア情報に対する符号量を決定する符号量決定ステップをさらに備え、
前記符号化ステップは、前記符号量決定部で決定された符号量に基づき前記メディア情報を符号化した符号化データを生成する
ことを特徴とするメディア情報配信方法。
In the media information delivery method according to claim 3,
A code amount determination step of determining a code amount for the media information according to whether the media information from each communicator terminal belongs to a speaker or a listener;
The encoding step generates encoded data obtained by encoding the media information based on the code amount determined by the code amount determination unit.
JP2004261477A 2004-09-08 2004-09-08 Media information distribution apparatus and method Pending JP2006080784A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004261477A JP2006080784A (en) 2004-09-08 2004-09-08 Media information distribution apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004261477A JP2006080784A (en) 2004-09-08 2004-09-08 Media information distribution apparatus and method

Publications (1)

Publication Number Publication Date
JP2006080784A true JP2006080784A (en) 2006-03-23

Family

ID=36159888

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004261477A Pending JP2006080784A (en) 2004-09-08 2004-09-08 Media information distribution apparatus and method

Country Status (1)

Country Link
JP (1) JP2006080784A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8233736B2 (en) 2007-11-16 2012-07-31 Samsung Electronics Co., Ltd. Digital photographing apparatus, method of controlling the same, and recording medium having recorded thereon program for executing the method
JP2015154315A (en) * 2014-02-17 2015-08-24 日本電信電話株式会社 Video conference server, video conference system, and video conference method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8233736B2 (en) 2007-11-16 2012-07-31 Samsung Electronics Co., Ltd. Digital photographing apparatus, method of controlling the same, and recording medium having recorded thereon program for executing the method
JP2015154315A (en) * 2014-02-17 2015-08-24 日本電信電話株式会社 Video conference server, video conference system, and video conference method

Similar Documents

Publication Publication Date Title
JP3530293B2 (en) Video transmission rate matching for multimedia communication systems
JP4160278B2 (en) Scalable encoding method of media stream, scalable encoder, and multimedia terminal
US8842159B2 (en) Encoding processing for conferencing systems
US8731152B2 (en) Reducing use of periodic key frames in video conferencing
US8176199B2 (en) Content delivery system, communicating apparatus, communicating method, and program
US8848790B2 (en) Encoding processing apparatus and method for a moving image
US20020136298A1 (en) System and method for adaptive streaming of predictive coded video data
US9826260B2 (en) Video encoding device and video encoding method
US20080259796A1 (en) Method and apparatus for network-adaptive video coding
US8675728B2 (en) Transmitting apparatus and method, and receiving apparatus and method
CN1788494A (en) System and method for transmission of a multitude of video sequences
JP2006087125A (en) Method for encoding video frame sequence, encoded bitstream, method for decoding image or image sequence, use including transmission or reception of data, method for transmitting data, encoding and / or decoding device, computer program, system , And computer-readable storage medium
US11641447B2 (en) System and method for automatically adjusting key frame quantization parameter and frame rate
US20090310672A1 (en) Method and System for Rate Control in a Video Encoder
JP2011029868A (en) Terminal device, remote conference system, method for controlling terminal device, control program of terminal device, and computer readable recording medium recording control program of terminal device
US12439057B2 (en) Coding parameter deriving apparatus, coding parameter deriving method and program
Lei et al. Adaptive video transcoding and streaming over wireless channels
JP2006080784A (en) Media information distribution apparatus and method
JP2005341347A (en) Multipoint connection apparatus and method
KR20090125556A (en) Video codec method, video codec device and video service system
JP2017028622A (en) Image quality control apparatus, image quality control method, image quality control system, and program for image quality control
CN104811272B (en) Collaboration communication method, equipment and the system of terminal room
JP2002534864A (en) Adaptive buffer and quantization adjustment scheme for bandwidth scalability of video data
US20250301033A1 (en) Bit-rate selection apparatus, bit-rate selection method and program
US11855775B2 (en) Transcoding method and apparatus, medium, and electronic device