明 細 書 Specification
通信方法、通信装置、通信システム及びプログラム COMMUNICATION METHOD, COMMUNICATION DEVICE, COMMUNICATION SYSTEM, AND PROGRAM
技術分野 Technical field
[0001] 本発明は、通信方法、通信装置、通信システム及びプログラムに係り、特に IP電話 、 TV電話や TV会議システム等に適した通信方法、通信装置、通信システム及びプ ログラムに関する。 The present invention relates to a communication method, a communication device, a communication system, and a program, and more particularly to a communication method, a communication device, a communication system, and a program suitable for an IP phone, a TV phone, a video conference system, and the like.
背景技術 Background art
[0002] IP電話、 TV電話や TV会議システム等では、音声情報及び画像情報が送信側の 通信装置と受信側の通信装置との間で通信伝送路を介して送受信される。音声情 報及び画像情報は、送信側の通信装置において符号化されて送信され、受信側の 通信装置におレ、て複合化されて再生される。 In an IP phone, a TV phone, a TV conference system, and the like, audio information and image information are transmitted and received between a communication device on the transmission side and a communication device on the reception side via a communication transmission path. The audio information and the image information are encoded and transmitted by the communication device on the transmission side, and are combined and reproduced by the communication device on the reception side.
[0003] 音声情報は、符号化、複合化、画像情報との同期、バッファリング等の処理や、通 信伝送路の遅延等により、送信側の通信装置での実際の発声 (入力)から所定遅延 時間後に受信側の通信装置のスピーカ力 発声(出力)される。音声情報の画像情 報との同期とは、受信側の通信装置において表示される画像情報と再生される音声 情報とを同期させる、即ち、表示された話者の口の動きと再生される音声情報とを合 わせる処理を言う。 [0003] Audio information is pre-determined from the actual utterance (input) in the communication device on the transmission side by processing such as encoding, decoding, synchronization with image information, buffering, delay of the communication transmission path, etc. After the delay time, the speaker power of the receiving communication device is uttered (output). The synchronization of the audio information with the image information means that the image information displayed on the communication device on the receiving side is synchronized with the reproduced audio information, that is, the displayed movement of the mouth of the speaker and the reproduced audio. This is the process of combining information.
発明の開示 Disclosure of the invention
発明が解決しょうとする課題 Problems to be solved by the invention
[0004] このように、送信側の通信装置における実際の発声から所定遅延時間後に、受信 側の通信装置において音声情報が再生される。又、受信側の通信装置において表 示される画像情報は、受信側の通信装置において発声される音声情報と同期されて レ、るため、やはり送信側の通信装置における実際の画像入力力も所定時間後に表 示される。所定時間は、例えば約 0. 4-0. 5秒程度の時間である。このため、受信 側の通信装置においては、送信側の通信装置での実際の発声から所定時間経過し ないと、送信側の通信装置における発声を認識することができなレ、。この結果、受信 側の通信装置では、送信側の通信装置において実際に発声があった、即ち、送信
側の話者が話し始めたのを知らずに、受信側の話者が話を始めてしまうことがあり、 会話のぶっかり(かぶり)のために送信側と受信側とでスムーズな会話を行えないと レ、う問題があった。 [0004] As described above, the audio information is reproduced in the receiving communication device after a predetermined delay time from the actual utterance in the transmitting communication device. Also, since the image information displayed in the receiving communication device is synchronized with the voice information uttered by the receiving communication device, the actual image input force in the transmitting communication device is also a predetermined time later. Is displayed. The predetermined time is about 0.4 to 0.5 seconds, for example. For this reason, in the communication device on the reception side, the utterance in the communication device on the transmission side cannot be recognized unless a predetermined time has elapsed since the actual utterance in the communication device on the transmission side. As a result, in the communication device on the reception side, there was actually a voice in the communication device on the transmission side, that is, the transmission The receiving speaker may start talking without knowing that the other speaker has started speaking, and the conversation between the sending and receiving parties will not be able to carry out a smooth conversation. There was a problem.
[0005] 尚、発声者を特定する従来技術としては、例えば特開平 6 - 83391号公報に提案 されている方法が知られており、会話のぶっかりを防止するための従来技術としては 、例えば特開 2002—232475号公報及び特開 2002—158984号広報に提案されて レ、る方法が知られている。 [0005] As a conventional technique for identifying a speaker, for example, a method proposed in Japanese Patent Laid-Open No. 6-83391 is known, and as a conventional technique for preventing a conversational collision, for example, A method proposed in Japanese Laid-Open Patent Publication Nos. 2002-232475 and 2002-158984 is known.
課題を解決するための手段 Means for solving the problem
[0006] そこで、本発明は、上記の問題を解決した新規、且つ、有用な通信方法、通信装置 、通信システム及びプログラムを提供することを概括的目的とする。 [0006] In view of the above, a general object of the present invention is to provide a new and useful communication method, communication apparatus, communication system, and program that solve the above problems.
[0007] 本発明のより具体的な目的は、送信側での発声を略リアルタイムに受信側に知らせ ることで、送信側と受信側とでスムーズな会話を行える通信方法、通信装置、通信シ ステム及びプログラムを提供することにある。 [0007] A more specific object of the present invention is to provide a communication method, a communication apparatus, and a communication system capable of enabling smooth conversation between the transmission side and the reception side by informing the reception side of the utterance on the transmission side in substantially real time. System and program.
[0008] 本発明の他の目的は、画像情報及び音声情報を第 1及び第 2の通信装置間で通 信伝送路を介して送受信する通信方法であって、該第 1の通信装置から該第 2の通 信装置宛の音声情報を該通信伝送路へ送信する第 1の送信ステップと、該音声情報 力、ら該第 1の通信装置における話者の発声期間を示すデータを生成する生成ステツ プと、該第 1の送信ステップと並行して、該第 1の通信装置から該第 2の通信装置宛 の該データを該通信伝送路へ送信する第 2の送信ステップとを含むことを特徴とする 通信方法を提供することにある。本発明になる通信方法によれば、送信側での発声 を略リアルタイムに受信側に知らせることで、送信側と受信側とでスムーズな会話を 行うことが可能となる。 [0008] Another object of the present invention is a communication method for transmitting and receiving image information and audio information between a first communication device and a second communication device via a communication transmission path, from the first communication device to the communication device. A first transmission step of transmitting voice information addressed to a second communication device to the communication transmission line, and generation of generating the voice information power and data indicating a speaker's utterance period in the first communication device; And a second transmission step of transmitting the data addressed to the second communication device from the first communication device to the communication transmission path in parallel with the first transmission step. It is to provide a characteristic communication method. According to the communication method of the present invention, it is possible to communicate smoothly between the transmitting side and the receiving side by notifying the receiving side of the utterance on the transmitting side in substantially real time.
[0009] 本発明の更に他の目的は、画像情報及び音声情報を通信伝送路を介して送受信 する通信装置であって、音声情報を該通信伝送路へ送信する第 1の送信手段と、該 音声情報から該通信装置における話者の発声期間を示すデータを生成する生成手 段と、該第 1の送信手段と並行して、該データを該通信伝送路へ送信する第 2の送 信手段とを備えたことを特徴とする通信装置を提供することにある。本発明になる通 信装置によれば、送信側での発声を略リアルタイムに受信側に知らせることで、送信
側と受信側とでスムーズな会話を行うことが可能となる。 [0009] Still another object of the present invention is a communication device that transmits and receives image information and audio information via a communication transmission path, wherein the first transmission means transmits the audio information to the communication transmission path, and A generation unit that generates data indicating a speaker's utterance period in the communication device from voice information, and a second transmission unit that transmits the data to the communication transmission path in parallel with the first transmission unit. And providing a communication apparatus characterized by comprising: According to the communication device of the present invention, the utterance on the transmission side is notified to the reception side in substantially real time, so that transmission can be performed. It is possible to have a smooth conversation between the receiving side and the receiving side.
[0010] 本発明の他の目的は、画像情報及び音声情報を通信伝送路を介して送受信する 通信装置であって、該通信伝送路を介して該音声情報を受信して再生する第 1の受 信手段と、該第 1の受信手段と並行して、送信側の話者の発声期間を示すデータを 該通信伝送路を介して受信する第 2の受信手段と、該データを表示する表示手段と を備えたことを特徴とする通信装置を提供することにある。本発明になる通信装置に よれば、送信側での発声を略リアルタイムに受信側に知らせることで、送信側と受信 側とでスムーズな会話を行うことが可能となる。 [0010] Another object of the present invention is a communication device that transmits and receives image information and audio information via a communication transmission path, and receives and reproduces the audio information via the communication transmission path. In parallel with the receiving means, the second receiving means for receiving data indicating the utterance period of the speaker on the transmitting side via the communication transmission path, and a display for displaying the data It is another object of the present invention to provide a communication apparatus comprising the means. According to the communication apparatus of the present invention, it is possible to perform a smooth conversation between the transmitting side and the receiving side by notifying the receiving side of the utterance on the transmitting side in substantially real time.
[0011] 本発明の更に他の目的は、画像情報及び音声情報を第 1及び第 2の通信装置間 で通信伝送路を介して送受信する通信システムであって、該第 1の通信装置から該 第 2の通信装置宛の音声情報を該通信伝送路へ送信する第 1の送信手段と、該音 声情報から該第 1の通信装置における話者の発声期間を示すデータを生成する生 成手段と、該第 1の送信手段と並行して、該第 1の通信装置から該第 2の通信装置宛 の該データを該通信伝送路へ送信する第 2の送信手段と、該第 1の通信装置からの 該データを該通信伝送路を解して受信し、該第 2の通信装置の表示部に表示する表 示手段を備えたことを特徴とする通信システムを提供することにある。本発明になる 通信システムによれば、送信側での発声を略リアルタイムに受信側に知らせることで 、送信側と受信側とでスムーズな会話を行うことが可能となる。 [0011] Still another object of the present invention is a communication system for transmitting and receiving image information and audio information between a first communication device and a second communication device via a communication transmission path, and First transmission means for transmitting voice information addressed to the second communication device to the communication transmission path, and generation means for generating data indicating the utterance period of the speaker in the first communication device from the voice information Parallel to the first transmission means, second transmission means for transmitting the data addressed to the second communication device from the first communication device to the communication transmission path, and the first communication It is an object of the present invention to provide a communication system comprising display means for receiving the data from a device through the communication transmission path and displaying the data on a display unit of the second communication device. According to the communication system according to the present invention, it is possible to perform a smooth conversation between the transmission side and the reception side by notifying the reception side of the utterance on the transmission side in substantially real time.
[0012] 本発明の他の目的は、コンピュータに、画像情報及び音声情報を通信伝送路を介 して送受信する通信装置として機能させるプログラムであって、該コンピュータに、音 声情報を該通信伝送路へ送信させる第 1の送信手順と、該コンピュータに、該音声 情報から該通信装置における話者の発声期間を示すデータを生成させる生成手順 と、該コンピュータに、該第 1の送信手順と並行して、該データを該通信伝送路へ送 信させる第 2の送信手順とを含むことを特徴とするプログラムを提供することにある。 本発明になるプログラムによれば、送信側での発声を略リアルタイムに受信側に知ら せることで、送信側と受信側とでスムーズな会話を行うことが可能となる。 Another object of the present invention is a program that causes a computer to function as a communication device that transmits and receives image information and audio information via a communication transmission path. The computer transmits audio information to the computer. A first transmission procedure for transmitting to a road; a generation procedure for causing the computer to generate data indicating a speech period of a speaker in the communication device from the voice information; and causing the computer to perform the first transmission procedure in parallel. Then, a second transmission procedure for transmitting the data to the communication transmission path is provided. According to the program of the present invention, it is possible to have a smooth conversation between the transmission side and the reception side by informing the reception side of the utterance on the transmission side in substantially real time.
[0013] 本発明の更に他の目的は、コンピュータに、画像情報及び音声情報を通信伝送路 を介して送受信する通信装置として機能させるプログラムであって、該コンピュータに
、該通信伝送路を介して該音声情報を受信して再生させる第 1の受信手順と、該コン ピュータに、該第 1の受信手順と並行して、送信側の話者の発声期間を示すデータ を該通信伝送路を介して受信させる第 2の受信手順と、該コンピュータに、該データ を表示させる表示手順とを含むことを特徴とするプログラムを提供することにある。本 発明になるプログラムによれば、送信側での発声を略リアルタイムに受信側に知らせ ることで、送信側と受信側とでスムーズな会話を行うことが可能となる。 Still another object of the present invention is a program that causes a computer to function as a communication device that transmits and receives image information and audio information via a communication transmission path. A first reception procedure for receiving and reproducing the voice information via the communication transmission path, and indicating to the computer an utterance period of the speaker on the transmission side in parallel with the first reception procedure. An object of the present invention is to provide a program characterized by including a second receiving procedure for receiving data via the communication transmission path and a display procedure for displaying the data on the computer. According to the program of the present invention, it is possible to perform a smooth conversation between the transmission side and the reception side by informing the reception side of the utterance on the transmission side in substantially real time.
[0014] 本発明の更に他の目的及び特長は、以下に図面と共に述べる説明より明らかとな ろう。 [0014] Still other objects and features of the present invention will become apparent from the following description taken in conjunction with the drawings.
図面の簡単な説明 Brief Description of Drawings
[0015] [図 1]本発明になる通信システムの第 1実施例の一部を示すブロック図である。 FIG. 1 is a block diagram showing a part of a first embodiment of a communication system according to the present invention.
[図 2]音声検出信号処理系の動作を説明するタイムチャートである。 FIG. 2 is a time chart for explaining the operation of the voice detection signal processing system.
[図 3]本発明になる通信システムの第 2実施例の一部を示すブロック図である。 FIG. 3 is a block diagram showing a part of a second embodiment of a communication system according to the present invention.
[図 4]本発明になる通信システムの第 3実施例の一部を示すブロック図である。 FIG. 4 is a block diagram showing a part of a third embodiment of a communication system according to the present invention.
[図 5]本発明になる通信システムの第 4実施例の一部を示すブロック図である。 FIG. 5 is a block diagram showing a part of a fourth embodiment of the communication system according to the present invention.
[図 6]本発明になる通信システムの第 5実施例の一部を示すブロック図である。 FIG. 6 is a block diagram showing a part of a fifth embodiment of a communication system according to the present invention.
[図 7]多地点制御装置の動作を説明する図である。 FIG. 7 is a diagram for explaining the operation of the multipoint control device.
[図 8]本発明になる通信システムの第 6実施例の一部を示すブロック図である。 FIG. 8 is a block diagram showing a part of a sixth embodiment of the communication system according to the present invention.
[図 9]多地点間の通信を行う場合の表示画面の一実施例を示す図である。 FIG. 9 is a diagram showing an example of a display screen when performing communication between multiple points.
[図 10]多地点間の通信を行う場合の表示画面の他の実施例を示す図である。 FIG. 10 is a diagram showing another embodiment of the display screen when performing communication between multiple points.
[図 11]2地点間の通信を行う場合の表示画面の一実施例を示す図である。 FIG. 11 is a diagram showing an example of a display screen when communication between two points is performed.
発明を実施するための最良の形態 BEST MODE FOR CARRYING OUT THE INVENTION
[0016] 以下に、本発明になる通信方法、通信装置、通信システム及びプログラムの各実施 例を、図面と共に説明する。 Hereinafter, embodiments of a communication method, a communication apparatus, a communication system, and a program according to the present invention will be described with reference to the drawings.
実施例 1 Example 1
[0017] 図 1は、本発明になる通信システムの第 1実施例の一部を示すブロック図である。通 信システムの第 1実施例は、本発明になる通信方法の第 1実施例、本発明になる通 信装置の第 1実施例及び本発明になるプログラムの第 1実施例を採用する。本実施 例では、本発明が IP電話に適用されている。
[0018] 図 1において、送信側の通信装置 1は、アナログ/デジタル変換器 (ADC) 3、符号 化回路 4、インタフェース部 5、レベル検出部 6、符号化部 7及びインタフェース部 8か らなる。マイクロホン 2は、通信装置 1の一部であっても、外部接続されるものであって も良い。受信側の通信装置 11は、インターネット等のネットワークから構成される通信 伝送路 10を介して送信側の通信装置 1と接続されている。受信側の通信装置 11は、 インタフェース部 12、複号化部 13、デジタル/アナログ変換器(DAC) 14、インタフ エース部 16、復号化部 17及び DAC18からなる。スピーカ 15及び/又は表示部 19 は、通信装置 11の一部であっても、外部接続されるものであっても良い。 FIG. 1 is a block diagram showing a part of a first embodiment of a communication system according to the present invention. The first embodiment of the communication system employs the first embodiment of the communication method according to the present invention, the first embodiment of the communication apparatus according to the present invention, and the first embodiment of the program according to the present invention. In this embodiment, the present invention is applied to an IP phone. In FIG. 1, a communication device 1 on the transmission side includes an analog / digital converter (ADC) 3, an encoding circuit 4, an interface unit 5, a level detection unit 6, an encoding unit 7, and an interface unit 8. . The microphone 2 may be part of the communication device 1 or may be externally connected. The communication device 11 on the reception side is connected to the communication device 1 on the transmission side via a communication transmission path 10 composed of a network such as the Internet. The communication device 11 on the receiving side includes an interface unit 12, a decoding unit 13, a digital / analog converter (DAC) 14, an interface unit 16, a decoding unit 17 and a DAC 18. The speaker 15 and / or the display unit 19 may be part of the communication device 11 or may be externally connected.
[0019] 表示部 19は、 CRT, LCD、 PDP等のディスプレイ及び/又はランプ等の表示器か らなる。以下の説明では、表示部 19の点灯、或いは、ランプの点灯とは、ディスプレ ィの表示画面上に表示されるランプ及び Z又は表示器の点灯を意味する。 The display unit 19 includes a display such as a CRT, LCD, PDP and / or a display such as a lamp. In the following description, lighting of the display unit 19 or lighting of the lamp means lighting of the lamp and Z displayed on the display screen of the display.
[0020] 尚、図 1では、説明の便宜上、通信装置 1については送信系の一部のみを示し、通 信装置 11につレ、ては受信系の一部のみを示すが、実際には双方向通信が行われ るので、通信装置 1は通信装置 11と同様の受信系を有し、通信装置 11は通信装置 1 と同様の送信系を有する。又、画像情報の処理及び表示には、周知の技術を用いる ことができるので、画像情報処理系の図示及び説明は省略する。更に、受信側の通 信装置 11において再生する音声情報と表示する画像情報の同期は、周知の技術を 用いることができるので、同期処理部の図示及び説明も省略する。送信側の通信装 置 1から送信される音声信号の宛先、即ち、受信側の通信装置 11のアドレスの送信 及び受信 (検出)についても、周知の技術を用いることができるので、その図示及び 説明は省略する。 In FIG. 1, for convenience of explanation, only a part of the transmission system is shown for the communication device 1 and only a part of the reception system is shown for the communication device 11, but in practice, Since bidirectional communication is performed, the communication device 1 has a reception system similar to the communication device 11, and the communication device 11 has a transmission system similar to the communication device 1. In addition, since a known technique can be used for processing and displaying image information, illustration and description of the image information processing system are omitted. Furthermore, since the well-known technique can be used for the synchronization of the audio information to be reproduced and the image information to be displayed in the communication device 11 on the receiving side, illustration and description of the synchronization processing unit are also omitted. Since the transmission and reception (detection) of the destination of the audio signal transmitted from the communication device 1 on the transmission side, that is, the address of the communication device 11 on the reception side can also be used, it is illustrated and described. Is omitted.
[0021] 送信側の通信装置 1において、話者の発声はマイクロホン 2により検知され、アナ口 グ音声信号として ADC3及びレベル検出部 6に入力される。 ADC3から出力される デジタル音声信号は、符号化部 4により任意の符号化処理 (圧縮処理)を施され、ィ ンタフエース部 5に入力される。インタフェース部 5は、符号化された音声データを、 通信伝送路 10に適したプロトコルの音声データに変換する。本実施例では、インタフ エース部 5は VoIP (Voice Over Internet Protocol)の符号化音声データを通信伝送 路 10に出力する。マイクロホン 2、 ADC3、符号ィ匕部 4及びインタフェース部 5は、送
信側の IP電話部の送信系を構成し、これらは周知の素子や回路で実現可能である。 In the communication device 1 on the transmission side, the utterance of the speaker is detected by the microphone 2 and input to the ADC 3 and the level detection unit 6 as an analog audio signal. The digital audio signal output from the ADC 3 is subjected to arbitrary encoding processing (compression processing) by the encoding unit 4 and input to the interface unit 5. The interface unit 5 converts the encoded audio data into audio data of a protocol suitable for the communication transmission path 10. In this embodiment, the interface unit 5 outputs VoIP (Voice Over Internet Protocol) encoded voice data to the communication transmission line 10. Microphone 2, ADC3, code key 4 and interface 5 This constitutes the transmission system of the IP telephone unit on the communication side, and these can be realized with known elements and circuits.
[0022] 他方、受信側の通信装置 11において、通信伝送路 10から入力される VoIPの符号 化音声データは、インタフェース部 12によりインタフェース部 5と相補的な処理を施さ れる。インタフェース部 12からの符号ィ匕音声データは、復号化部 13により複号化処 理 (伸長処理)を施される。 DAC14は、復号化されたデジタル音声信号を元のアナ ログ音声信号に変換し、スピーカ 15は、送信側の話者の発声を再生する。インタフエ ース部 12、複号化部 13、 DAC14及びスピーカ 15は、受信側の IP電話部の受信系 を構成し、これらは周知の素子や回路で実現可能である。 On the other hand, in the communication device 11 on the receiving side, the encoded voice data of VoIP input from the communication transmission path 10 is subjected to processing complementary to the interface unit 5 by the interface unit 12. The encoded audio data from the interface unit 12 is subjected to decryption processing (decompression processing) by the decoding unit 13. The DAC 14 converts the decoded digital audio signal into the original analog audio signal, and the speaker 15 reproduces the speech of the transmitting speaker. The interface unit 12, the decoding unit 13, the DAC 14, and the speaker 15 constitute a receiving system of the IP telephone unit on the receiving side, and these can be realized by known elements and circuits.
[0023] 次に、音声検出信号の処理系について、図 2と共に説明する。図 2は、音声検出信 号処理系の動作を説明するタイムチャートである。図 2中、(A) (E)は送信側の通 信装置 1における音声検出信号の処理を説明するものであり、(F), (G)は受信側の 通信装置 11における音声検出信号の処理を説明するものである。図 2中、 (A)はレ ベル検出部 6に入力される音声信号、(B)はレベル検出部 6により出力される音声検 出信号、(C)は符号ィ匕部 7により生成される音声開始検出信号、 (D)は符号化部 7に よりサンプリングされた音声サンプノレ信号、(E)は符号ィ匕部 7から出力されるランプ点 灯データを示す。又、図 2中、(F)は復号化部 17から出力されるランプ点灯パルス信 号、(G)は DAC18の出力により点灯される表示部 19の点灯時間を示す。 Next, a speech detection signal processing system will be described with reference to FIG. FIG. 2 is a time chart for explaining the operation of the voice detection signal processing system. In FIG. 2, (A) and (E) explain the processing of the voice detection signal in the transmission side communication device 1, and (F) and (G) show the voice detection signal in the communication device 11 on the reception side. The process will be described. In FIG. 2, (A) is an audio signal input to the level detection unit 6, (B) is an audio detection signal output from the level detection unit 6, and (C) is generated by the code key unit 7. The voice start detection signal, (D) shows the voice sample signal sampled by the encoding unit 7, and (E) shows the lamp lighting data output from the coding unit 7. In FIG. 2, (F) shows the lamp lighting pulse signal output from the decoding unit 17, and (G) shows the lighting time of the display unit 19 that is turned on by the output of the DAC 18.
[0024] 送信側の通信装置 1において、マイクロホン 2から出力される図 2 (A)のアナログ音 声信号は、レベル検出部 6に入力される。レベル検出部 6は、アナログ音声信号を閾 値 L1と比較することにより、閾値 L1を超えると通信側の話者の発声を示す図 2 (B)の 音声検出信号を出力する。閾値 L1は、例えば話者の発声と、発声以外の雑音等とを 区別し得るような値に設定されている。音声検出信号は、符号化部 7により任意の符 号化処理 (圧縮処理)を施され、インタフェース部 8に入力される。具体的には、符号 化部 7は、音声検出信号から発声の開始 (即ち、発声検出信号の立ち上がり)を示す 図 2 (C)の音声開始検出信号を生成し、音声検出信号を任意のサンプリング間隔 T1 でサンプリングして音声検出信号がオン(又は、ハイレベル)であればオン (又は、ハ ィレベル)となる図 2 (D)の音声サンプル信号を生成し、音声開始検出信号と音声検 出信号及び音声サンプノレ信号のオア(OR)とに基づいて図 2 (E)のランプ点灯デー
タを出力する。音声検出信号のサンプリングは、音声開始検出信号の立ち上がりから 時間 T1後に開始しても良レ、。インタフェース部 8は、ランプ点灯データが発生する毎 に、ランプ点灯データを通信伝送路 10に適したプロトコルのランプ点灯データに変 換してパケット単位で出力する。本実施例では、インタフェース部 8は、 UDP (User Datagram Protocol)のランプ点灯データをパケット単位で通信伝送路 10に出力する 。このように、音声検出信号に基づいたランプ点灯データを送信するので、ランプ点 灯データの送信には、パケットの喪失よりは遅延時間の少なレ、、即ち、例えば TCP/ IP (Transmission Control Protocol/Internet Protocol)よりは遅延時間の少ない UDP を用いる。マイクロホン 2、レベル検出部 6、符号化部 7及びインタフェース部 8は、送 信側の音声検出信号処理系を構成する。 In the communication apparatus 1 on the transmission side, the analog audio signal in FIG. 2 (A) output from the microphone 2 is input to the level detection unit 6. The level detection unit 6 compares the analog voice signal with the threshold value L1, and outputs the voice detection signal shown in FIG. 2 (B) indicating the utterance of the speaker on the communication side when the threshold value L1 is exceeded. The threshold value L1 is set to a value that can distinguish, for example, a speaker's utterance and noise other than the utterance. The voice detection signal is subjected to arbitrary encoding processing (compression processing) by the encoding unit 7 and input to the interface unit 8. Specifically, the encoding unit 7 generates the voice start detection signal shown in FIG. 2C indicating the start of utterance (ie, the rising edge of the utterance detection signal) from the voice detection signal, and the voice detection signal is arbitrarily sampled. If the audio detection signal is sampled at the interval T1 and the audio detection signal is on (or high level), the audio sample signal shown in FIG. Based on the OR of the signal and audio sample signal, the lamp lighting data in Fig. 2 (E) Output. Sampling of the audio detection signal can be started after time T1 from the rise of the audio start detection signal. Each time the lamp lighting data is generated, the interface unit 8 converts the lamp lighting data into lamp lighting data of a protocol suitable for the communication transmission path 10 and outputs the data in packets. In the present embodiment, the interface unit 8 outputs UDP (User Datagram Protocol) lamp lighting data to the communication transmission path 10 in units of packets. Since the lamp lighting data is transmitted based on the voice detection signal in this way, the lamp lighting data is transmitted with less delay time than the packet loss, that is, for example, TCP / IP (Transmission Control Protocol / Use UDP with less delay time than Internet Protocol). The microphone 2, the level detection unit 6, the encoding unit 7, and the interface unit 8 constitute a voice detection signal processing system on the transmission side.
[0025] 他方、受信側の通信装置 11において、通信伝送路 10から入力されるパケット単位 の UDPのランプ点灯データは、インタフェース部 16によりインタフェース部 8と相補的 な処理を施される。インタフェース部 16からのランプ点灯データは、復号化部 17によ り復号化処理 (伸長処理)を施される。具体的には、復号化部 17は、インタフェース 部 16からのランプ点灯データのパケットを受け取る毎にパルス幅(時間) T2のパルス を発生することで図 2 (F)のランプ点灯パルス信号を生成し、 DAC14は、ランプ点灯 パルス信号をアナログランプ点灯信号に変換する。図 2 (F)中、ハッチングは重なる パルス部分を示し、重なるパルス数が多い程ハッチングの間隔を狭く図示してある。 表示部 19は、アナログランプ点灯信号に基づいて図 2 (G)に示す点灯時間の間、即 ち、送信側の話者の発声中に対応する時間、送信側の話者の発声タイミングと略リア ルタイムで点灯される。従って、受信側の通信装置 11においては、表示部 19が点灯 していれば、送信側の通信装置 1において話者が発声していることを視覚的に認識 することができ、表示部 19が点灯中は受信側の通信装置 11において話者が発声を 控えることで会話のぶつ力 を確実に防止することができる。インタフェース部 16、復 号化部 17、 DAC18及び表示部 19は、受信側の音声検出信号処理系を構成する。 On the other hand, in the communication device 11 on the receiving side, UDP lamp lighting data in units of packets input from the communication transmission path 10 is subjected to processing complementary to the interface unit 8 by the interface unit 16. The lamp lighting data from the interface unit 16 is subjected to decryption processing (decompression processing) by the decryption unit 17. Specifically, the decoding unit 17 generates a pulse lighting pulse signal shown in FIG. 2 (F) by generating a pulse having a pulse width (time) T2 every time a lamp lighting data packet is received from the interface unit 16. The DAC 14 converts the lamp lighting pulse signal into an analog lamp lighting signal. In Fig. 2 (F), hatching indicates the overlapping pulse part, and the larger the number of overlapping pulses, the narrower the hatching interval. Based on the analog lamp lighting signal, the display unit 19 stands for the lighting time shown in Fig. 2 (G), that is, the time corresponding to the time when the speaker on the transmitting side is speaking, and the timing of the speaker on the transmitting side. Illuminated in real time. Therefore, in the communication device 11 on the reception side, if the display unit 19 is lit, it can be visually recognized that the speaker is speaking in the communication device 1 on the transmission side. While the light is lit, the conversational force of the conversation can be reliably prevented by the speaker refraining from speaking in the communication device 11 on the receiving side. The interface unit 16, the decoding unit 17, the DAC 18, and the display unit 19 constitute an audio detection signal processing system on the reception side.
[0026] 通信側の通信装置 1内の符号化部 7で用いるサンプリング間隔(時間) T1と、受信 側の通信装置 11内の複号化部 17で用いるパルス幅(時間) T2とは、適切に調整す ることでパケット送出数を増減することができる。時間 Tl, Τ2を小さく設定すると、パ
ケット送出数は増えるが、ランプ点灯時間は送信側の通信装置 1における話者の実 際の発声期間 (発声時間)に近づき、発声の終了を精度良く受信側の通信装置 11に 知らせることができる。しかし、会話のぶっかりを防止する場合、発声の終了より発声 の開始を精度良く受信側の通信装置 11に知らせることが重要であるため、発声の終 了を受信側の通信装置 11に知らせる精度を大幅に向上することは必ずしも必要で はない。そこで、通信伝送路 10の状況に応じて、発声の終了が不自然にならない程 度に時間 Tl, Τ2を大きく設定し、パケット送信数を少なくすることが望ましい。 [0026] The sampling interval (time) T1 used in the encoding unit 7 in the communication device 1 on the communication side and the pulse width (time) T2 used in the decoding unit 17 in the communication device 11 on the reception side are appropriate. By adjusting to, the number of packets sent can be increased or decreased. If the time Tl and Τ2 are set small, Although the number of packets transmitted increases, the lamp lighting time approaches the actual utterance period (speech time) of the speaker in the communication device 1 on the transmission side, and the end of the utterance can be accurately notified to the communication device 11 on the reception side. . However, since it is important to accurately notify the receiving communication device 11 of the start of utterance rather than the end of utterance in order to prevent a conversational disruption, the accuracy of notifying the receiving communication device 11 of the end of utterance is important. It is not always necessary to significantly improve Therefore, it is desirable to set the time Tl and Τ2 large and reduce the number of packet transmissions so that the end of utterance does not become unnatural depending on the situation of the communication transmission path 10.
[0027] 時間 T1は送信側の通信装置 1で調整し、時間 Τ2は受信側の通信装置 11で調整 すれば良いが、送信側の通信装置 1は図 1に示す受信側の通信装置 11と同様の記 録系を有し、受信側の通信装置 1は送信側の通信装置 1と同様の送信系を有するの で、時間 Tl , Τ2は各通信装置 1, 11で調整すれば良い。例えば、各通信装置 1 , 1 1は、閾値 L1及び時間 Tl, Τ2を通信相手毎に最適化して内部のメモリ(図示せず) の対応するファイルに格納することもできる。この場合、各通信装置 1 , 11は、通信相 手との接続時の IPアドレスや独自識別番号等に基づいて通信相手である通信装置 を認識して、 自動的に対応するファイルを用いて閾値 L1及び時間 Tl, T2を設定す ること力 Sできる。 [0027] The time T1 may be adjusted by the communication device 1 on the transmission side, and the time Τ2 may be adjusted by the communication device 11 on the reception side, but the communication device 1 on the transmission side is connected to the communication device 11 on the reception side shown in FIG. Since the receiving side communication device 1 has the same recording system as the transmitting side communication device 1, the time Tl and, 2 may be adjusted by the communication devices 1 and 11, respectively. For example, each of the communication devices 1 and 11 can optimize the threshold L1 and the time Tl and Τ2 for each communication partner and store them in a corresponding file in an internal memory (not shown). In this case, each communication device 1, 11 recognizes the communication device that is the communication partner based on the IP address, unique identification number, etc. at the time of connection with the communication partner, and automatically uses the corresponding file to set the threshold value. Ability to set L1 and time Tl, T2.
実施例 2 Example 2
[0028] 図 3は、本発明になる通信システムの第 2実施例の一部を示すブロック図である。通 信システムの第 2実施例は、本発明になる通信方法の第 2実施例及び本発明になる 通信装置の第 2実施例及び本発明になるプログラムの第 2実施例を採用する。本実 施例では、本発明が IP電話に適用されている。図 3中、図 1と同一部分には同一符 号を付し、その説明は省略する。 FIG. 3 is a block diagram showing a part of a second embodiment of the communication system according to the present invention. The second embodiment of the communication system employs the second embodiment of the communication method according to the present invention, the second embodiment of the communication apparatus according to the present invention, and the second embodiment of the program according to the present invention. In this embodiment, the present invention is applied to an IP phone. In FIG. 3, the same parts as those in FIG.
[0029] 本実施例では、送信側の通信装置 1に、ランプ点灯パルス生成部 21、表示部 22及 び L1設定部 23が更に設けられている。ランプ点灯パルス生成部 21は、符号化部 7 が出力する図 2 (E)のランプ点灯データに基づレ、て、図 2 (F)のランプ点灯パルス信 号と同様の信号を出力する。表示部 22は、ランプ点灯ノ^レス生成部 21からのランプ 点灯パルス信号に基づいて送信側の話者の発声中は略リアルタイムで図 2 (G)に示 す点灯時間と同様の点灯時間の間点灯される。 L1設定部 23は、ダイヤル、ボタン、
表示部 22の表示画面上のグラフィックユーザインタフェース(GUI)等で構成され、レ ベル検出部 6に閾値 L1を入力するためのものである。 In the present embodiment, the communication device 1 on the transmission side is further provided with a lamp lighting pulse generation unit 21, a display unit 22, and an L1 setting unit 23. The lamp lighting pulse generator 21 outputs a signal similar to the lamp lighting pulse signal shown in FIG. 2 (F) based on the lamp lighting data shown in FIG. 2 (E) output from the encoder 7. Based on the lamp lighting pulse signal from the lamp lighting noise generation unit 21, the display unit 22 has a lighting time similar to that shown in FIG. Lights for a while. The L1 setting section 23 has dials, buttons, It is composed of a graphic user interface (GUI) on the display screen of the display unit 22 and is used for inputting the threshold value L1 to the level detection unit 6.
[0030] 従って、送信側の通信装置 1においては、話者は発声して表示部 22の点灯状態を 確認しながら L1設定部 23を操作することで、閾値 L1を適切に調整して設定すること ができる。又、話者は表示部 22の点灯状態を確認することで、送信側の音声検出信 号処理系(レベル検出部 6及び符号化部 7)の正常動作を確認することもできる。 実施例 3 [0030] Therefore, in the communication device 1 on the transmission side, the speaker speaks and confirms the lighting state of the display unit 22, and operates the L1 setting unit 23 to appropriately adjust and set the threshold L1. be able to. In addition, the speaker can also confirm the normal operation of the voice detection signal processing system (level detection unit 6 and encoding unit 7) on the transmission side by confirming the lighting state of the display unit 22. Example 3
[0031] 図 4は、本発明になる通信システムの第 3実施例の一部を示すブロック図である。通 信システムの第 3実施例は、本発明になる通信方法の第 3実施例及び本発明になる 通信装置の第 3実施例及び本発明になるプログラムの第 3実施例を採用する。本実 施例では、本発明が IP電話に適用されている。図 4中、図 1と同一部分には同一符 号を付し、その説明は省略する。 FIG. 4 is a block diagram showing a part of a third embodiment of the communication system according to the present invention. The third embodiment of the communication system employs the third embodiment of the communication method according to the present invention, the third embodiment of the communication apparatus according to the present invention, and the third embodiment of the program according to the present invention. In this embodiment, the present invention is applied to an IP phone. In FIG. 4, the same parts as those in FIG.
[0032] 本実施例では、送信側の通信装置 1に、サンプノレボタン 31、サンプリング部 32、サ ンプル格納部 33, 34及び平均値計算部 35が更に設けられている。 ADC3から出力 されるデジタル音声信号は、サンプルボタン 31の操作に基づいて決定される 2回の タイミングでサンプリング部 32によりサンプルされ、夫々のサンプルがサンプル格納 部 33, 34に格納される。平均値計算部 35は、サンプノレ格納部 33, 34に格納された 2つのサンプルの平均値を、閾値 L1としてレベル検出部 6に入力する。 In the present embodiment, the communication device 1 on the transmission side is further provided with a sample button 31, a sampling unit 32, sample storage units 33 and 34, and an average value calculation unit 35. The digital audio signal output from the ADC 3 is sampled by the sampling unit 32 at two timings determined based on the operation of the sample button 31, and the respective samples are stored in the sample storage units 33 and 34. The average value calculation unit 35 inputs the average value of the two samples stored in the sample storage units 33 and 34 to the level detection unit 6 as the threshold value L1.
[0033] つまり、送信側の通信装置 1において、話者は発声中にサンプノレボタン 31を操作し 、発声を止めてサンプルボタン 31を操作する。これにより、発声時の音声データと無 声時の音声データ(周囲の雑音等)がサンプルされて対応するサンプノレ格納部 33, 34に格納される。平均値計算部 35は、サンプノレ格納部 33, 34に格納された発声時 の音声データと無声時の音声データの平均値を計算し、この平均値を閾値 L1として 設定することができる。 That is, in the communication device 1 on the transmission side, the speaker operates the sample button 31 during utterance, stops the utterance, and operates the sample button 31. As a result, voice data at the time of utterance and voice data at the time of silent (such as ambient noise) are sampled and stored in the corresponding sample storage sections 33 and 34. The average value calculation unit 35 can calculate the average value of the voice data at the time of utterance and the voice data at the time of no voice stored in the sample storage units 33 and 34, and can set this average value as the threshold value L1.
実施例 4 Example 4
[0034] 図 5は、本発明になる通信システムの第 4実施例の一部を示すブロック図である。通 信システムの第 4実施例は、本発明になる通信方法の第 4実施例及び本発明になる 通信装置の第 4実施例及び本発明になるプログラムの第 4実施例を採用する。本実
施例では、本発明が IP電話に適用されている。図 5中、図 1と同一部分には同一符 号を付し、その説明は省略する。図 5では、送信側の通信装置 1の受信系の一部と、 受信側の通信装置 11の送信系の一部とが示されている。 FIG. 5 is a block diagram showing a part of the fourth embodiment of the communication system according to the present invention. The fourth embodiment of the communication system employs the fourth embodiment of the communication method according to the present invention, the fourth embodiment of the communication apparatus according to the present invention, and the fourth embodiment of the program according to the present invention. Real In the embodiment, the present invention is applied to an IP phone. In FIG. 5, the same parts as those in FIG. FIG. 5 shows a part of the reception system of the communication device 1 on the transmission side and a part of the transmission system of the communication device 11 on the reception side.
[0035] 本実施例では、送信側の通信装置 1に、表示部 42及び L1設定部 43が更に設けら れており、受信側の通信装置 11に L1設定部 53が更に設けられている。 L1設定部 4 3, 53は、ダイヤル、ボタン、対応する表示部 42, 19の表示画面上のグラフィックュ 一ザインタフェース(GUI)等で構成され、対応するインタフェース部 8に閾値 L1を入 力するためのものである。又、送信側の通信装置 1において、インタフェース部 16の 出力はレベル検出部 6に入力されている。他方、受信側の通信装置 11において、ィ ンタフェース部 16の出力はレベル検出部 6に入力されている。送信側の通信装置 1 において閾値 L1がインタフェース部 8に入力されると、閾値 L1は受信側の通信装置 11のインタフェース部 16を介して受信側のレベル検出部 6に入力される。このため、 閾値 L1が設定された受信側における表示部 19の点灯状況は、送信側に送られて 表示部 42が受信側の表示部 19と同様に点灯する。 In this embodiment, the communication device 1 on the transmission side is further provided with a display unit 42 and an L1 setting unit 43, and the L1 setting unit 53 is further provided on the communication device 11 on the reception side. The L1 setting units 4 3, 53 are composed of dials, buttons, the graphic user interface (GUI) on the display screen of the corresponding display units 42, 19, etc., and the threshold value L1 is input to the corresponding interface unit 8 Is for. Further, in the communication device 1 on the transmission side, the output of the interface unit 16 is input to the level detection unit 6. On the other hand, in the communication device 11 on the receiving side, the output of the interface unit 16 is input to the level detection unit 6. When the threshold value L1 is input to the interface unit 8 in the communication device 1 on the transmission side, the threshold value L1 is input to the level detection unit 6 on the reception side via the interface unit 16 of the communication device 11 on the reception side. For this reason, the lighting state of the display unit 19 on the reception side for which the threshold L1 is set is sent to the transmission side, and the display unit 42 is lit in the same manner as the display unit 19 on the reception side.
[0036] 従って、送信側の通信装置 1においては、話者は発声して表示部 42の点灯状態を 確認しながら L1設定部 43を操作することで、受信側の通信装置 11に対する閾値 L1 を適切に調整して設定することができる。同様にして、受信側の通信装置 11におい ては、話者は発声して表示部 19の点灯状態を確認しながら L1設定部 53を操作する ことで、送信側の通信装置 1に対する閾値 L1を適切に調整して設定することができる 実施例 5 Therefore, in the communication device 1 on the transmission side, the speaker speaks and operates the L1 setting unit 43 while confirming the lighting state of the display unit 42, thereby setting the threshold L1 for the communication device 11 on the reception side. It can be adjusted and set appropriately. Similarly, in the communication device 11 on the receiving side, the speaker speaks and operates the L1 setting unit 53 while confirming the lighting state of the display unit 19, thereby setting the threshold L1 for the communication device 1 on the transmitting side. Can be adjusted and set appropriately Example 5
[0037] 図 6は、本発明になる通信システムの第 5実施例の一部を示すブロック図である。通 信システムの第 5実施例は、本発明になる通信方法の第 5実施例及び本発明になる 通信装置の第 5実施例及び本発明になるプログラムの第 5実施例を採用する。本実 施例では、本発明が IP電話に適用されており、図 1、図 3—図 5に示す通信装置 1 ( 又は 11)と同様の構成を有し複数の地点 A— Dに設置されている通信装置 101A— 101D力 通信伝送路 10上の多地点制御装置 51を介して接続されているものとする 。多地点制御装置 51は、例えば汎用のコンピュータから構成され、通信装置 101A
一 101Dのうち 1台の通信装置に対して、他の通信装置からのランプ点灯データのォ ァ(OR)処理を施して送信する機能を備える。図 6中、実線の矢印は、各地点での発 声検出によるランプ点灯データの出力を示し、破線の矢印は、各地点への相手側か らのランプ点灯データの入力を示す。 FIG. 6 is a block diagram showing a part of a fifth embodiment of the communication system according to the present invention. The fifth embodiment of the communication system employs the fifth embodiment of the communication method according to the present invention, the fifth embodiment of the communication apparatus according to the present invention, and the fifth embodiment of the program according to the present invention. In this embodiment, the present invention is applied to an IP phone, and has the same configuration as the communication device 1 (or 11) shown in FIGS. 1, 3 to 5, and is installed at a plurality of points A to D. It is assumed that the communication devices 101A-101D are connected via the multipoint control device 51 on the communication transmission line 10. The multipoint control device 51 is composed of a general-purpose computer, for example, and includes a communication device 101A. One communication device of 101D is provided with a function of performing an over (OR) process of lamp lighting data from another communication device and transmitting it. In Fig. 6, the solid line arrows indicate the output of lamp lighting data by voice detection at each point, and the broken line arrows indicate the input of lamp lighting data from the other party to each point.
[0038] 図 7は、多地点制御装置 51の動作を説明する図である。同図は、通信装置 101B 一 101Dからのランプ点灯データを通信装置 101Aに送信する場合の動作を示す。 多地点制御装置 51は、通信装置 101B 101Dからのランプ点灯データのオア(O R)を求めた結果をランプ点灯データとして通信装置 101Aに送信する。従って、通 信装置 101Aの表示部は、通信装置 101B— 101Dのいずれかの話者が発声中で あると点灯する。このため、通信装置 101Aにおいては、通信装置 101B 101Dの いずれかの話者が発声している事を視覚的に認識することができ、通信装置 101A の表示部が点灯中は通信装置 101Aにおいて話者が発声を控えることで会話のぶ つ力りを確実に防止することができる。 FIG. 7 is a diagram for explaining the operation of the multipoint control device 51. This figure shows the operation when lamp lighting data from the communication devices 101B and 101D is transmitted to the communication device 101A. The multipoint control device 51 transmits the result of obtaining the OR (OR) of the lamp lighting data from the communication device 101B 101D to the communication device 101A as the lamp lighting data. Accordingly, the display unit of communication device 101A is lit when any speaker of communication devices 101B-101D is speaking. Therefore, the communication device 101A can visually recognize that any speaker of the communication device 101B 101D is speaking, and the communication device 101A can speak while the display unit of the communication device 101A is lit. By refraining from speaking, it is possible to reliably prevent the conversational force.
実施例 6 Example 6
[0039] 図 8は、本発明になる通信システムの第 6実施例の一部を示すブロック図である。通 信システムの第 6実施例は、本発明になる通信方法の第 6実施例及び本発明になる 通信装置の第 6実施例及び本発明になるプログラムの第 6実施例を採用する。本実 施例では、本発明が IP電話に適用されており、 3地点以上に設置されている通信装 置が、通信伝送路 10を介して接続されているものとする。説明の便宜上、 4地点に 4 台の通信装置が設置されており、 2つの地点に設置された 2台の通信装置が図 8の 構成を有するものとする。図 8中、図 1と同一部分には同一符号を付し、その説明は 省略する。 FIG. 8 is a block diagram showing a part of a sixth embodiment of the communication system according to the present invention. The sixth embodiment of the communication system employs the sixth embodiment of the communication method according to the present invention, the sixth embodiment of the communication apparatus according to the present invention, and the sixth embodiment of the program according to the present invention. In this embodiment, it is assumed that the present invention is applied to an IP phone, and communication devices installed at three or more points are connected via a communication transmission line 10. For convenience of explanation, it is assumed that four communication devices are installed at four points, and the two communication devices installed at two points have the configuration shown in FIG. In FIG. 8, the same parts as those in FIG. 1 are denoted by the same reference numerals, and the description thereof is omitted.
[0040] 図 8において、送信側の通信装置 1は、地点 Bに設置されており、受信側の通信装 置 11は地点 Aに設置されているものとする。地点 C, Dに設置されている通信装置の 図示は省略する。地点 B— Dに設置された通信装置から送信される 3つのランプ点灯 データは、通信伝送路 10を介して地点 Aに設置された通信装置 11のインタフェース 部 16-1に入力される。 3つのランプ点灯データは、例えば地点 B— Dの通信装置の 発信者 IPアドレス等に基づいて対応する復号化部 17— B— 17— Dに入力される。復
号化部 17-B— 17-Dからのランプ点灯パルス信号は、対応する DAC18-B— 18- Dを介して対応する表示部 19-B— 19-Dに供給される。従って、表示部 19-B— 19 - Dのうち、話者が発声している地点に対応する表示部が点灯される。 In FIG. 8, it is assumed that the communication device 1 on the transmission side is installed at the point B and the communication device 11 on the reception side is installed at the point A. Illustration of communication devices installed at points C and D is omitted. The three lamp lighting data transmitted from the communication device installed at the point B-D are input to the interface unit 16-1 of the communication device 11 installed at the point A via the communication transmission path 10. The three lamp lighting data are input to the corresponding decryption units 17-B-17-D based on, for example, the sender IP address of the communication device at point B-D. Recovery The lamp lighting pulse signal from the encoding unit 17-B-17-D is supplied to the corresponding display unit 19-B-19-D via the corresponding DAC 18-B-18-D. Therefore, among the display units 19-B-19-D, the display unit corresponding to the point where the speaker is speaking is turned on.
[0041] 図 9は、地点 Aに設置された通信装置 11の表示部 19 (表示部 19—B 19-D)が 単一のディスプレイからなり、地点 B— Dの通信装置からの 3つのランプ点灯データに 応じて対応する表示部 19—B 19—Dがランプ表示 19B 19Dとして話者の画像 20 0Bと共にディスプレイの表示画面に表示される場合の表示画面の一実施例を示す。 通信装置 11におレ、て話者が自分の発声を認識したレ、場合には、図 9に示すように、 図 3に示す表示部 22に対応する表示部をランプ表示 19Aとしてディスプレイの表示 画面に表示するようにしても良い。 [0041] FIG. 9 shows that the display unit 19 (display unit 19—B 19-D) of the communication device 11 installed at the point A comprises a single display, and three lamps from the communication device at the point B—D. An example of the display screen when the display units 19-B 19-D corresponding to the lighting data are displayed on the display screen of the display together with the speaker image 200B as the lamp display 19B 19D is shown. In the case where the speaker recognizes his / her utterance at the communication device 11, as shown in FIG. 9, the display unit corresponding to the display unit 22 shown in FIG. It may be displayed on the screen.
[0042] 尚、図 9では、例えば最初に発声した話者の画像 200Bのみがディスプレイの表示 画面に表示されている場合を示すが、表示する話者は適宜切り替えても、図 10に示 すように、全ての話者 200B— 200Dを同時に表示するようにしても良レ、。図 10は、 地点 Aに設置された通信装置 11の表示部 19 (表示部 19一 B— 19-D)が単一のディ スプレイからなり、地点 B— Dの通信装置からの 3つのランプ点灯データに応じて対 応する表示部 19—B— 19—Dがランプ表示 19B— 19Dとして全ての話者の画像 200 B— 200Dと共にディスプレイの表示画面に表示される場合の表示画面の他の実施 例を示す。通信装置 11において話者が自分の発声を認識したい場合には、図 10に 示すように、図 3に示す表示部 22に対応する表示部をランプ表示 19Aとして自分の 画像 200Aと共にディスプレイの表示画面に表示するようにしても良い。この場合、各 地点 A— Dの話者の画像 200A— 200Dと各話者の発声状況が対応して表示される ので、発声中の話者を容易に認識することができる。又、図 10に示すように、 自分( 地点 A)のランプ表示 19Aと他の地点 B Dに対するランプ表示 19B— 19Dの大きさ を異なるものにしたり、形状や色を異なるものとすることにより、 自分と他の話者の発 声状況を容易に識別可能とすることもできる。尚、画像の表示自体は、本発明の要旨 とは直接関係がないので、その説明は省略する。 [0042] Note that FIG. 9 shows a case where, for example, only the image 200B of the speaker who spoke first is displayed on the display screen of the display. As you can see, all speakers 200B-200D can be displayed simultaneously. Figure 10 shows that the display unit 19 (display unit 19 1 B- 19-D) of the communication device 11 installed at point A consists of a single display, and the three lamps from the communication device at point B-D are lit. Other implementations of the display screen when the display unit 19—B— 19—D corresponding to the data is displayed on the display screen of the display as a lamp display 19B—19D with all the images 200 B—200D An example is shown. When the speaker wants to recognize his / her utterance in the communication device 11, as shown in FIG. 10, the display unit corresponding to the display unit 22 shown in FIG. May be displayed. In this case, the images 200A-200D of the speakers at the respective points A—D and the utterance status of each speaker are displayed correspondingly, so that the speaker who is speaking can be easily recognized. Also, as shown in Fig. 10, by changing the size of the lamp display 19A for yourself (point A) and the lamp display 19B-19D for other points BD, or by making the shape and color different, It is also possible to easily distinguish the utterance status of other speakers. The display of the image itself is not directly related to the gist of the present invention, and the description thereof is omitted.
[0043] 図 11は、上記第 1一第 4実施例のように、 2つの地点間で通信を行う場合に、通信 装置の表示部を構成するディスプレイの表示画面に表示される表示画面の一実施
例を示す図である。図 11は、地点 Aに設置された通信装置 11の表示部 19が単一の ディスプレイからなり、地点 Bに設置された通信装置 1からのランプ点灯データに応じ たランプ表示 19Bが地点 Bの話者の画像 200Bと共にディスプレイの表示画面に表 示される場合の表示画面の一実施例を示す。通信装置 11におレ、て話者が自分の発 声を認識したい場合には、図 11に示すように、図 3に示す表示部 22に対応する表示 部をランプ表示 19Aとしてディスプレイの表示画面に表示するようにしても良い。図 1 1に示すように、自分(地点 A)のランプ表示 19Aと他の地点 Bに対するランプ表示 19 Bの大きさを異なるものにしたり、形状や色を異なるものとすることにより、 自分と他の 話者の発声状況を容易に識別可能とすることもできる。 [0043] FIG. 11 shows a display screen displayed on the display screen of the display constituting the display unit of the communication device when communication is performed between two points as in the first to fourth embodiments. Implementation It is a figure which shows an example. Figure 11 shows that the display 19 of the communication device 11 installed at the point A consists of a single display, and the lamp display 19B according to the lamp lighting data from the communication device 1 installed at the point B is the story of the point B. An example of the display screen when it is displayed on the display screen of the display together with the person's image 200B is shown. When the speaker wants to recognize his / her voice in the communication device 11, as shown in FIG. 11, the display unit corresponding to the display unit 22 shown in FIG. May be displayed. As shown in Figure 11, the lamp display 19A for yourself (point A) and the lamp display 19B for other points B can be made different from each other by changing the size or shape and color of the lamp display 19B. It is also possible to easily identify the speaker's utterance situation.
[0044] 本発明になるプログラムは、上記各実施例における通信側の通信装置及び/又は 受信側の通信装置を構成するコンピュータを通信装置として機能させるものである。 この場合、通信装置を構成するコンピュータは、プログラムを格納するメモリ及びプロ グラムを実行する CPU等のプロセッサからなる周知の構成を有する汎用コンピュータ で良い。又、プログラムは、コンピュータ読み取り可能な記憶媒体に格納されていても 良い。 [0044] A program according to the present invention causes a computer constituting a communication device on the communication side and / or a communication device on the reception side in each of the above embodiments to function as a communication device. In this case, the computer constituting the communication device may be a general-purpose computer having a well-known configuration including a memory for storing a program and a processor such as a CPU for executing the program. The program may be stored in a computer-readable storage medium.
[0045] 上記各実施例では、本発明が同時に双方向通信が可能な通信システムに適用さ れているが、本発明はこれに限定されるものではなぐ例えば半二重通信システムに も同様に適用可能である。例えばエコーキャンセルを行う半二重通信システムにおい ては、送信側の話者の発声時には受信側の話者の発声が送信側に届かず、受信側 の話者の発声時には送信側の話者の発声が受信側に届かず、会話力 Sスムーズに行 えない場合もある。しかし、本発明を適用することにより、相手側の話者の発声時に はその発声を示す情報が受信側で表示されるので、会話をスムーズに行うことが可 能となる。 [0045] In each of the above embodiments, the present invention is applied to a communication system capable of two-way communication at the same time. However, the present invention is not limited to this, for example, similarly to a half-duplex communication system. Applicable. For example, in a half-duplex communication system that performs echo cancellation, the utterance of the receiving speaker does not reach the transmitting side when the transmitting speaker speaks, and the transmitting speaker does not reach when the receiving speaker speaks. Speaking does not reach the receiver, and there is a case where the conversation ability S is not smooth. However, by applying the present invention, when the other speaker speaks, information indicating the utterance is displayed on the receiving side, so that conversation can be performed smoothly.
[0046] 以上、本発明を実施例により説明したが、本発明は上記実施例に限定されるもので はなぐ本発明の範囲内で種々の変形および改良が可能であることは、言うまでもな レ、。
[0046] While the present invention has been described with reference to the embodiments, it is needless to say that the present invention is not limited to the above embodiments, and various modifications and improvements can be made within the scope of the present invention. .