[go: up one dir, main page]

JPH0568241A - Cif image transforming system for video telephone - Google Patents

Cif image transforming system for video telephone

Info

Publication number
JPH0568241A
JPH0568241A JP3227626A JP22762691A JPH0568241A JP H0568241 A JPH0568241 A JP H0568241A JP 3227626 A JP3227626 A JP 3227626A JP 22762691 A JP22762691 A JP 22762691A JP H0568241 A JPH0568241 A JP H0568241A
Authority
JP
Japan
Prior art keywords
image
cif
face
person
face area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3227626A
Other languages
Japanese (ja)
Inventor
Yuichi Fujino
雄一 藤野
Mamoru Nakanishi
衛 中西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP3227626A priority Critical patent/JPH0568241A/en
Publication of JPH0568241A publication Critical patent/JPH0568241A/en
Pending legal-status Critical Current

Links

Landscapes

  • Television Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

PURPOSE:To attain good conversation by picking up beforehand the image of an objective person in a wide angle, and detecting the face area of the person by picture processing, and generating this area by segmenting it by CIF or QCIF picture elements. CONSTITUTION:In order to generate a CIF or a QCIF picture, the image of the objective person is picked up beforehand in the wide angle, and the face area of the person is detected by the picture processing by a moving area detecting means 103, and center coordinates for segmentation are calculated by a segmenting address calculating means 104, and a rectangular range including the face area of the person is segmented by the CIF or the QCIF picture elements. Then, if a face moves, a segmented range is changed within the image- picked up range in accordance with the movement of the face area, and the face is displayed as following the face area. Thus, the face area never goes out of the picture frame of a camera on account of the movement of the face part of the objective person, and the face are can be transmitted always to an opposite party side, and as the result, the good conversation can be realized through a video telephone.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、CCITT標準に準拠
したテレビ電話装置の、NTSCからCIF画像への変
換処理方式に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an NTSC-to-CIF image conversion processing system for a videophone device conforming to the CCITT standard.

【0002】[0002]

【従来の技術】ここでは従来の、CCITT標準に準拠
したテレビ電話装置の、NTSCからCIF画像への変
換処理方式について説明する前に、CIF画像規格につ
いて説明する。CCITTではテレビ電話の相互接続を
実現するために1990年12月にp×64kbit/
sオーディオビジュアル・サービス用ビデオ符号化方式
を勧告した(CCITT Rec. H261 "Video Codec for Audio
visual Service at px64kbit/s 1990 )。ここでは、各
国のテレビ信号の方式の差を吸収するために共通中間フ
ォーマット画像(CIF; Comon Intermediate Forma
t)を以下のように規定している。
2. Description of the Related Art Here, the CIF image standard will be described before the description of the conventional conversion processing system from the NTSC to the CIF image in the video telephone apparatus conforming to the CCITT standard. In CCITT, p × 64 kbit /
s Recommended video coding method for audiovisual services (CCITT Rec. H261 "Video Codec for Audio
visual Service at px64kbit / s 1990). Here, a common intermediate format image (CIF; Comon Intermediate Forma) is used in order to absorb the difference in the television signal system of each country.
t) is defined as follows.

【0003】第1のフォーマット(CIF)では、輝度
の標本は、1ラインあたり352画素、1フレームあた
り288ラインで直交格子状に配列される。2つの色差
成分の標本は、それぞれ1ラインあたり176画素、1
フレームあたり144ラインで直交格子状に配列され
る。色差信号の画素ブロック境界は輝度信号の画素ブロ
ック境界と一致するように置かれ、これらの数の画素で
囲まれた画像領域は、アスペクト比が4:3であり、標
準テレビジョン信号の有効画面と一致する。
In the first format (CIF), the luminance samples are arranged in an orthogonal grid with 352 pixels per line and 288 lines per frame. The samples of the two color difference components are 176 pixels per line and 1
144 lines per frame are arranged in an orthogonal grid. The pixel block boundary of the color difference signal is placed so as to coincide with the pixel block boundary of the luminance signal, and the image area surrounded by these number of pixels has an aspect ratio of 4: 3, and an effective screen of a standard television signal. Matches

【0004】第2のフォーマット(QCIF)は、上述
のCIFの画素とライン数を各々1/2にしたものであ
る。(以上、TTC標準 JT−H221より抜粋)以
上の規格に準拠したテレビ電話装置ではテレビジョンの
標準方式の違いに関わらず相互通信を行うことができ
る。以下に本規格に準拠した従来のテレビ電話装置にお
けるNTSC/CIF変換処理方式について説明する。
The second format (QCIF) is one in which the number of pixels and the number of lines of the above-mentioned CIF are each halved. (The above is an excerpt from the TTC standard JT-H221.) In the videophone device conforming to the above standards, mutual communication can be performed regardless of the difference in standard television systems. The NTSC / CIF conversion processing method in the conventional videophone device based on this standard will be described below.

【0005】従来のテレビ電話装置において、日本の標
準テレビジョン方式であるNTSC方式からCIF画像
を作成するNTSC/CIF変換処理方式は、垂直、水
平方向の画素数、ライン数を縮小する縮小フィルタを使
用する方式であった。
In a conventional videophone apparatus, the NTSC / CIF conversion processing method for creating a CIF image from the NTSC method, which is a Japanese standard television method, uses a reduction filter for reducing the number of pixels in the vertical and horizontal directions and the number of lines. It was the method used.

【0006】図7はNTSC信号を13.5MHzで標
本化し、ディジタル色分離処理を行い、水平方向704
画素、垂直方向480ラインの画像を作成し、該画像か
らCIF画像を作成する従来方式を示す例である。な
お、水平方向704画素、垂直方向480ラインの画像
は1982年にCCIRにおいて「スタジオ用ディジタ
ルテレビの符号化パラメータ」(Rec.601)とし
て勧告された規格に準拠している。ここで、1は撮像
部、2は帯域制限用ローパスフィルタ(LPF)部、3
はA/D変換部、4はディジタルY/C分離部、5は水
平方向縮小フィルタ部、6はノンインタレース変換部、
7は垂直方向縮小フィルタ部、8は符号化処理部、9は
網インタフェース処理部である。
In FIG. 7, an NTSC signal is sampled at 13.5 MHz, digital color separation processing is performed, and horizontal direction 704 is performed.
It is an example showing a conventional method of creating an image of 480 lines in the vertical direction of pixels and creating a CIF image from the image. The image of 704 pixels in the horizontal direction and 480 lines in the vertical direction conforms to the standard recommended in CCIR in 1982 as "encoding parameter of studio digital television" (Rec. 601). Here, 1 is an imaging unit, 2 is a low-pass filter (LPF) unit for band limitation, 3
Is an A / D conversion unit, 4 is a digital Y / C separation unit, 5 is a horizontal reduction filter unit, 6 is a non-interlaced conversion unit,
Reference numeral 7 is a vertical reduction filter unit, 8 is an encoding processing unit, and 9 is a network interface processing unit.

【0007】撮像部1により撮像されたNTSC信号
は、LPF部2により帯域制限され、A/D変換部3に
よりサンプリング周波数13.5MHzでサンプリン
グ、量子化ビット数9ビットで量子化される。これによ
り水平方向のサンプリング数は858サンプル、有効画
素数は704画素となる。ディジタル化されたNTSC
信号はディジタルY/C分離部4により輝度信号Y、色
差信号C1,C2 のコンポーネント信号に分離される。
色分離されたコンポーネント信号はそれぞれ水平方向縮
小フィルタ部に入力される。ここでの具体的処理は、水
平方向の有効画素数が704画素であるため、1/2に
サブサンプリングし縮小する。水平方向に1/2に縮小
されたコンポーネント信号はノンインタレース変換部6
に入力され、奇数フィールド、偶数フィールドの信号は
それぞれ一度フィールドメモリに蓄積される。読み出す
際には、奇数、偶数フィールドの各ラインを交互に読み
出すことによりインタレース信号をノンインタレース信
号に変換する。ノンインタレース化されたコンポーネン
ト信号は垂直方向縮小フィルタ部7に入力され、垂直方
向に3/5倍に縮小される。具体的な縮小方法は、5ラ
インから3ラインを単純に間引く方法、5ラインの信号
それぞれに重み係数を乗じて3ラインに変換する方法が
あるが、ここでは単純に前者の方法にて縮小する。
The NTSC signal picked up by the image pickup section 1 is band-limited by the LPF section 2, sampled at a sampling frequency of 13.5 MHz by the A / D conversion section 3, and quantized by a quantization bit number of 9 bits. As a result, the number of samples in the horizontal direction is 858 samples and the number of effective pixels is 704 pixels. Digitized NTSC
The signal is separated by the digital Y / C separation unit 4 into component signals of a luminance signal Y and color difference signals C 1 and C 2 .
The color-separated component signals are input to the horizontal reduction filter unit. In the concrete processing here, since the number of effective pixels in the horizontal direction is 704 pixels, sub-sampling is performed to ½ and reduction is performed. The non-interlaced conversion unit 6 receives the component signal that is reduced to 1/2 in the horizontal direction.
And the signals of the odd field and the even field are once stored in the field memory. When reading, the interlaced signal is converted into a non-interlaced signal by alternately reading the lines of the odd and even fields. The non-interlaced component signal is input to the vertical reduction filter unit 7 and vertically reduced by a factor of 3/5. As a concrete reduction method, there is a method of simply thinning out 5 lines to 3 lines and a method of multiplying each signal of 5 lines by a weighting factor to convert into 3 lines, but here, the reduction is simply performed by the former method. .

【0008】以上により、水平、垂直方向にそれぞれ1
/2,3/5に縮小されたコンポーネント信号はそれぞ
れ352画素、288ラインとなり、CIF画像が作成
され、符号化処理部8に入力され符号化処理を施され、
網インタフェース処理部9を介して伝送路に送出され
る。
As a result of the above, 1 in each of the horizontal and vertical directions
The component signals reduced to / 2, 3/5 are 352 pixels and 288 lines, respectively, and a CIF image is created, input to the encoding processing unit 8 and subjected to encoding processing,
It is sent to the transmission line via the network interface processing unit 9.

【0009】以上、CIF画像の作成法について述べた
が、QCIF画像は上記方法で水平方向のサブサンプリ
ングを1/4に、垂直方向の間引きを3/10にする事
により同様に作成できる。
Although the method of creating a CIF image has been described above, a QCIF image can be similarly created by setting the horizontal subsampling to 1/4 and the vertical thinning to 3/10 by the above method.

【0010】[0010]

【発明が解決しようとする課題】上述の従来方式では、
CIFまたはQCIFの画素数が少ないために、テレビ
電話として相手の顔の表情までをはっきり認識するため
にはある程度ズームアップして撮像し、伝送されなけれ
ばならず、このような場合には、相手被写体人物の顔の
部分が少しでも動いてしまうとカメラの画枠から外れて
しまい、正常な顔面像が伝送されない欠点がある。
In the above-mentioned conventional method,
Since the number of pixels of CIF or QCIF is small, in order to clearly recognize the facial expression of the other party as a videophone, it must be zoomed up to some degree and imaged and transmitted. If the face part of the subject person moves even a little, it will be out of the image frame of the camera, and the normal facial image will not be transmitted.

【0011】本発明は、被写体人物の顔の部分が動いて
しまうことによってカメラの画枠から顔領域が外れる点
を解決し、常に人物顔領域がカメラの画枠内にあり、良
好な会話が可能にすることを目的としている。
The present invention solves the problem that the face area deviates from the image frame of the camera due to movement of the face portion of the subject person, and the human face area is always in the image frame of the camera, and good conversation is ensured. The purpose is to enable.

【0012】[0012]

【課題を解決するための手段】図1は本発明の原理構成
図を示す。図中の符号101はA/D変換処理手段、1
02はフレームメモリであってA/D変換されたテレビ
ジョン信号を蓄積するもの、103は動領域検出手段で
あってテレビジョン信号の中の動領域を検出するもの、
104は切り出しアドレス算出手段であって切り出しア
ドレスを算出する手段である。
FIG. 1 is a block diagram showing the principle of the present invention. Reference numeral 101 in the figure is A / D conversion processing means, 1
Reference numeral 02 is a frame memory for storing the A / D converted television signal, 103 is a moving area detecting means for detecting a moving area in the television signal,
Reference numeral 104 denotes a cutout address calculating means, which is a means for calculating the cutout address.

【0013】[0013]

【作用】CIFまたはQCIF画像を作成するのに、あ
らかじめ広角で被写体人物像を撮像し、画像処理により
人物顔領域を検出して該領域をCIFまたはQCIF画
素で切り出して作成すること、顔が動いた場合には撮像
された範囲内で該顔領域の動きに応じて切り出し範囲を
変更することにより、常に顔領域を相手側に送信できる
ようにする。更に、切り出したCIF画像の歪をなくす
ため、CIF画像切り出しに際し水平方向、垂直方向の
アスペクト比に基づいたサンプリング周波数を求め、該
サンプリング周波数で標本化する。
In order to create a CIF or QCIF image, a person image of a subject is picked up in advance at a wide angle, a human face area is detected by image processing, and the area is cut out with CIF or QCIF pixels. In this case, the cutout range is changed within the imaged range according to the movement of the face area, so that the face area can be always transmitted to the other party. Further, in order to eliminate the distortion of the cut CIF image, a sampling frequency based on the aspect ratio in the horizontal direction and the vertical direction is obtained when the CIF image is cut out, and sampling is performed at the sampling frequency.

【0014】従来の技術においては、CIFまたはQC
IF画像を作成するのに、水平、垂直方向の縮小フィル
タを使用し縮小変換により作成するのに対し、本発明で
はあらかじめ広角で撮像した画像から顔領域を画像処理
により検出し、検出した顔領域を含む矩型領域をCIF
またはQCIF画素で切り出すことによって作成する。
また、従来では、ディジタル色分離の容易性から13.
5MHzまたは色副搬送波周波数fSC(3.58MH
z)の3または4倍の周波数でA/D変換を行っている
のに対し、本発明ではアナログ色分離を実施しているた
め上記周波数に依存せず、CIF画像の歪をなくすため
に適当な周波数を決定している。
In the prior art, CIF or QC
In order to create an IF image, reduction filters in horizontal and vertical directions are used to perform reduction conversion, whereas in the present invention, a face area is detected by image processing from an image picked up in advance at a wide angle, and the detected face area is detected. Rectangular area including
Alternatively, it is created by cutting out with QCIF pixels.
Further, in the conventional technique, 13.
5 MHz or color subcarrier frequency f SC (3.58 MH
While the A / D conversion is performed at a frequency three or four times that of z), the present invention does not depend on the above frequency because analog color separation is performed, and is suitable for eliminating distortion of a CIF image. Frequency is decided.

【0015】[0015]

【実施例】(実施例1)図2は本発明の第1の実施例で
あるNTSC方式からCIF画像を作成する方式を説明
する図であり、図中の符号1,2,3,8,9は図7に
対応し、更に10はアナログY/C分離部、11は動領
域検出部、12はCIF/QCIF画像切り出しアドレ
ス算出部、13はフレームメモリ部である。
(Embodiment 1) FIG. 2 is a diagram for explaining a method of creating a CIF image from the NTSC method according to the first embodiment of the present invention. Reference numerals 1, 2, 3, 8 in FIG. Reference numeral 9 corresponds to FIG. 7, 10 is an analog Y / C separation section, 11 is a moving area detection section, 12 is a CIF / QCIF image cutout address calculation section, and 13 is a frame memory section.

【0016】撮像部1により撮像されたNTSC方式の
テレビジョン信号は、アナログY/C分離部10に入力
され、輝度信号Y、色差信号C1 ,C2 のコンポーネン
ト信号に分離される。分離されたY,C1 ,C2 信号は
A/D変換の前にLPF部2を通過し帯域制限される。
帯域制限されたY,C1 ,C2 信号はA/D変換部3に
よりA/D変換される。ここで、A/D変換のサンプリ
ング周波数はCIFまたはQCIF画素で切り出された
時の画像の水平方向対垂直方向の物理的な大きさの比が
4:3になるように決定される。すなわちA/D変換に
よりサンプリングされた画像から水平、垂直方向のそれ
ぞれの走査線帰線期間を除いた有効画像と、CIFまた
はQCIF画素により作成された画像とが相似形である
ことが条件となる。具体的には、CIF画像の水平方
向、垂直方向の画素、ライン数をそれぞれ352画素、
288本、サンプリングする映像信号の水平方向、垂直
方向の有効画素、ライン数をそれぞれp画素、480本
とした場合、以下の関係が成り立つ。
An NTSC television signal picked up by the image pickup unit 1 is input to an analog Y / C separation unit 10 and separated into a luminance signal Y and component signals of color difference signals C 1 and C 2 . The separated Y, C 1 and C 2 signals pass through the LPF unit 2 before the A / D conversion and are band-limited.
The band-limited Y, C 1 and C 2 signals are A / D converted by the A / D converter 3. Here, the sampling frequency of the A / D conversion is determined so that the ratio of the physical size of the image in the horizontal direction to the vertical direction when cut out by the CIF or QCIF pixel is 4: 3. That is, it is required that the effective image obtained by removing the horizontal and vertical scanning line blanking periods from the image sampled by the A / D conversion and the image created by the CIF or QCIF pixel have similar shapes. .. Specifically, the horizontal and vertical pixels of the CIF image and the number of lines are 352 pixels each,
When 288 lines, the effective pixels in the horizontal direction and the vertical direction of the video signal to be sampled, and the number of lines are p pixels and 480 lines, respectively, the following relationships are established.

【0017】p:480=352:288 ∴p=587 従って、水平方向の有効画素数は587画素となり、水
平走査期間の83%を有効期間とした場合、水平走査期
間の画素数は707画素となる。これより、A/D変換
のサンプリング周波数は11.1MHzと決定すること
ができる。なお、色差信号C1 ,C2 は、輝度信号Yの
半分、すなわち5.56MHzでA/D変換される。
P: 480 = 352: 288 ∴p = 587 Therefore, the number of effective pixels in the horizontal direction is 587 pixels, and when 83% of the horizontal scanning period is the effective period, the number of pixels in the horizontal scanning period is 707 pixels. Become. From this, the sampling frequency for A / D conversion can be determined to be 11.1 MHz. The color difference signals C 1 and C 2 are A / D converted at half the luminance signal Y, that is, at 5.56 MHz.

【0018】サンプリング周波数11.1MHzまたは
5.56MHz、量子化ビット数8ビットでA/D変換
されたY信号を利用して動領域検出部11にて顔領域を
含むCIFまたはQCIF画像の矩型領域の中心座標が
決定される。また、同時にY,C1 ,C2 信号は2フィ
ールド毎にフレームメモリ部13に蓄積される。なお、
ノンインタレース変換処理は該フレームメモリに蓄積さ
れた奇数、偶数フィールドを一度に読み出すことにより
行う。決定されたCIFまたはQCIF画像の中心座標
はCIF/QCIF画像切り出しアドレス算出部12に
て、フレームメモリ部に蓄積されている、Y,C1 ,C
2 信号のそれぞれのフレーム画像から切り出すアドレス
を計算し、該アドレスに基づきCIFまたはQCIF画
像が読み出される。読み出されたCIFまたはQCIF
画像は、符号化処理部8、網インタフェース処理部9を
介して相手側に伝送される。
A quadrature type of a CIF or QCIF image including a face area in the moving area detecting section 11 using the Y signal A / D converted with a sampling frequency of 11.1 MHz or 5.56 MHz and a quantization bit number of 8 bits. The center coordinates of the area are determined. At the same time, the Y, C 1 and C 2 signals are stored in the frame memory unit 13 every two fields. In addition,
The non-interlaced conversion processing is performed by reading the odd and even fields stored in the frame memory at once. The determined center coordinates of the CIF or QCIF image are stored in the frame memory unit by the CIF / QCIF image cutout address calculation unit 12, Y, C 1 , C.
An address cut out from each frame image of the two signals is calculated, and a CIF or QCIF image is read based on the address. CIF or QCIF read
The image is transmitted to the other party via the encoding processing unit 8 and the network interface processing unit 9.

【0019】図3は図2の動領域検出部11の内容を詳
細に説明する図であり、背景参照画像を使用した背景差
分法による例を示す。ここで、14は背景差分算出部、
15は背景参照画像メモリ部、16はブロック化処理
部、17は2値化処理部、18は頭頂部座標算出部、1
9はCIF/QCIF画像切り出し用中心座標算出部で
ある。
FIG. 3 is a diagram for explaining in detail the contents of the moving area detecting section 11 of FIG. 2, and shows an example by the background subtraction method using the background reference image. Here, 14 is a background difference calculation unit,
Reference numeral 15 is a background reference image memory unit, 16 is a block processing unit, 17 is a binarization processing unit, 18 is a parietal coordinate calculation unit, 1
Reference numeral 9 denotes a CIF / QCIF image clipping center coordinate calculation unit.

【0020】あらかじめ、人物像や動物体を含まない背
景参照画像を撮像し、背景参照画像メモリ部15に蓄積
する。次に、人物が含まれた通常のテレビ電話画像を撮
像し、撮像された人物画像は背景差分算出部14に入力
される。背景差分算出部14では入力される人物画像の
フレーム毎に背景参照画像との差分信号を計算する。得
られた背景差分信号は、計算量の削減の為にブロック化
処理部16に入力され、例えば16×16画素等でブロ
ック化処理を行う。ブロック化された画像は2値化処理
部17に入力され、適当なしきい値で2値化され、背景
参照画像と人物画像の差分、すなわち人物が存在する領
域を抽出する。
A background reference image that does not include a human figure or a moving object is captured in advance and stored in the background reference image memory unit 15. Next, a normal videophone image including a person is captured, and the captured person image is input to the background difference calculation unit 14. The background difference calculation unit 14 calculates a difference signal from the background reference image for each frame of the input human image. The obtained background difference signal is input to the blocking processing unit 16 in order to reduce the amount of calculation, and is blocked by 16 × 16 pixels or the like, for example. The block image is input to the binarization processing unit 17, binarized with an appropriate threshold value, and the difference between the background reference image and the person image, that is, the region where the person exists is extracted.

【0021】図4は、ブロック化され、2値化された差
分画像の例を示す。ここで点p(x C ,yC )は人物頭
頂部座標、点q(XC ,YC )は切り出し中心座標であ
る。このように人物領域のみが差分として抽出される。
FIG. 4 shows a block and binarized difference.
The example of a minute image is shown. Where the point p (x C, YC) Is the person's head
Top coordinates, point q (XC, YC) Is the cutting center coordinate
It In this way, only the person area is extracted as the difference.

【0022】2値化処理部17で2値化された差分画像
は頭頂部座標算出部18に入力され頭頂部座標を算出す
る。頭頂部座標の算出法は、多種考えられるが、ここで
は最も簡単な方法である、人物頭頂部から頭頂部座標を
決定する方法について説明する。たとえば図4に示され
ているブロック差分画像から人物頭頂部を検出する方法
は、図4のブロック差分画像の左上から水平方向に走査
し、最初に差分を検出した位置を人物頭頂部座標
(xC ,yC )とすることにより求める。ここで、人物
頭頂部水平方向ブロックが1ブロックである場合には該
ブロックの中心点を、また2ブロック以上の場合には該
ブロックの平均座標位置を頭頂部水平方向座標点xC
する。頭頂部座標算出部18にて求められた座標はCI
F/QCIF画像切り出し範囲用中心座標算出部に入力
され、CIFまたはQCIF画像を切り出す際の切り出
し中心点が計算される。
The difference image binarized by the binarization processing unit 17 is input to the parietal coordinate calculation unit 18 to calculate parietal coordinates. Although various methods of calculating the parietal region coordinates are conceivable, a method for determining the parietal region coordinates from the person's parietal region, which is the simplest method, will be described here. For example, in the method of detecting the person's crown from the block difference image shown in FIG. 4, the block difference image of FIG. 4 is scanned horizontally from the upper left, and the position at which the difference is detected first is the person's crown coordinate (x C , y C ). Wherein the center point of the block, in the case of 2 or more blocks to the average coordinate position of the block and the head top portion horizontal coordinate point x C If the person parietal horizontal block is one block. The coordinates obtained by the parietal coordinate calculation unit 18 are CI
It is input to the F / QCIF image cutout range center coordinate calculation unit, and the cutout center point for cutting out the CIF or QCIF image is calculated.

【0023】具体的には、求められた頭頂部垂直方向座
標yC より適当なブロック上方、たとえば2ブロック上
方を切り出し用上方枠とし、この枠の位置から垂直方向
の切り出し中心座標YC を求める。また、頭頂部水平方
向座標はそのまま水平方向の切り出し中心座標XC とす
る。これによりCIFまたはQCIF画像切り出し範囲
用中心座標(XC ,YC )が求められる。求められた中
心座標は図2のCIF/QCIF画像切り出しアドレス
算出部12に入力される。
Specifically, a suitable block upper part, for example, two blocks upper part from the obtained vertical coordinate y C of the parietal region is set as an upper frame for cutting, and the vertical cutting center coordinate Y C is obtained from the position of this frame. .. Further, the horizontal coordinate of the top of the head is directly used as the horizontal cut-out center coordinate X C. Thereby, the center coordinates (X C , Y C ) for the CIF or QCIF image cutout range are obtained. The obtained center coordinates are input to the CIF / QCIF image cutout address calculation unit 12 in FIG.

【0024】図5は、水平方向587画素、垂直方向4
80ラインから、それぞれ352画素、288ラインを
切り出した例を示す。 (実施例2)図6は本発明の第2の実施例であるPAL
またはSECAM方式からCIF画像を作成する方式を
説明する図である。図中の符号1,2,3,4,8,
9,11,12,13は図2および図7に対応してい
る。撮像部1により撮像されたPALまたはSECAM
方式のテレビジョン信号は、LPF部2により帯域制限
されA/D変換部3に入力される。ここでNTSC方式
と同様にサンプリング周波数を決定する。PALまたは
SECAM方式の場合には垂直方向の有効ライン数が5
76本であるため、水平方向の有効画素数をp画素とす
ると、以下の関係が成り立つ。
FIG. 5 shows 587 pixels in the horizontal direction and 4 pixels in the vertical direction.
An example is shown in which 352 pixels and 288 lines are cut out from 80 lines, respectively. (Embodiment 2) FIG. 6 shows PAL which is a second embodiment of the present invention.
It is a figure explaining the method of creating a CIF image from the SECAM method. Reference numerals 1, 2, 3, 4, 8 in the figure
Reference numerals 9, 11, 12, and 13 correspond to FIGS. 2 and 7. PAL or SECAM imaged by the imaging unit 1
The system television signal is band-limited by the LPF unit 2 and input to the A / D conversion unit 3. Here, the sampling frequency is determined as in the NTSC system. In case of PAL or SECAM system, the number of effective lines in the vertical direction is 5
Since there are 76 pixels, the following relationship holds when the number of effective pixels in the horizontal direction is p pixels.

【0025】p:576=352:288 ∴p=704 この水平方向の画素数は13.5MHzでサンプリング
した場合の有効画素数と一致する。従って、PAL,S
ECAM方式の場合にはサンプリング周波数を13.5
MHzとし、以下の処理は上述したNTSC方式の場合
と同様となる。
P: 576 = 352: 288 ∴p = 704 The number of pixels in the horizontal direction coincides with the number of effective pixels when sampling is performed at 13.5 MHz. Therefore, PAL, S
In case of ECAM system, sampling frequency is 13.5
MHz, and the following processing is the same as in the case of the NTSC system described above.

【0026】[0026]

【発明の効果】以上説明したように、本発明によればC
IFまたはQCIF画像を作成するのにあらかじめ広角
で被写体人物像を撮像し、画像処理により人物顔領域を
検出して切り出し用中心座標を算出し、人物顔領域を含
む矩型範囲をCIFまたはQCIF画素で切り出し、顔
が動いた場合には撮像された範囲内で該顔領域の動きに
応じて切り出し範囲を変更して顔領域に追従して顔を表
示するため、カメラの画枠から顔領域が外れることな
く、常に顔領域を相手側に送信でき、その結果としてテ
レビ電話を介して良好な会話が実現できる利点がある。
As described above, according to the present invention, C
In order to create an IF or QCIF image, a subject person image is captured in advance at a wide angle, a human face area is detected by image processing, and the center coordinates for clipping are calculated, and a rectangular range including the human face area is divided into CIF or QCIF pixels. When the face is moved, the cutout range is changed according to the movement of the face area within the captured range and the face is displayed following the face area. There is an advantage that the face area can always be transmitted to the other party without being detached, and as a result, a good conversation can be realized via the videophone.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の原理構成図を示す。FIG. 1 shows a principle configuration diagram of the present invention.

【図2】本発明の第1の実施例であるNTSC方式から
CIF画像を作成する方式を説明する図である。
FIG. 2 is a diagram illustrating a method of creating a CIF image from the NTSC method that is the first embodiment of the present invention.

【図3】図2の動領域検出部の内容を詳細に説明する図
である。
FIG. 3 is a diagram illustrating in detail the content of a moving area detection unit in FIG.

【図4】ブロック化され、2値化された差分画像の例を
示す図である。
FIG. 4 is a diagram showing an example of a binarized difference image which is made into blocks.

【図5】切り出した例を示す。FIG. 5 shows an example of cutting out.

【図6】本発明の第2の実施例であるPALまたはSE
CAM方式からCIF画像を作成する方式を説明する図
である。
FIG. 6 is a second embodiment of the present invention, PAL or SE.
It is a figure explaining the system which produces a CIF image from a CAM system.

【図7】NTSC信号を13.5MHzで標本化し、デ
ィジタル色分離処理を行い、水平方向704画素、垂直
方向480ラインの画像を作成し、該画像からCIF画
像を作成する従来方式の例を示す図である。
FIG. 7 shows an example of a conventional method in which an NTSC signal is sampled at 13.5 MHz, digital color separation processing is performed, an image of 704 pixels in the horizontal direction and 480 lines in the vertical direction is created, and a CIF image is created from the image. It is a figure.

【符号の説明】[Explanation of symbols]

1 撮像部 2 帯域制限用ローパスフィルタ(LPF)部 3 A/D変換部 4 ディジタルY/C分離部 5 水平方向縮小フィルタ部 6 ノンインタレース変換部 7 垂直方向縮小フィルタ部 8 符号化処理部 9 網インタフェース処理部 10 アナログY/C分離部 11 動領域検出部 12 CIF/QCIF画像切り出しアドレス算出部 13 フレームメモリ部 14 背景差分算出部 15 背景参照画像メモリ部 16 ブロック化処理部 17 2値化処理部 18 頭頂部座標算出部 19 CIF/QCIF画像切り出し用中心座標算出部 DESCRIPTION OF SYMBOLS 1 Imaging unit 2 Low pass filter (LPF) unit for band limitation 3 A / D conversion unit 4 Digital Y / C separation unit 5 Horizontal reduction filter unit 6 Non-interlaced conversion unit 7 Vertical reduction filter unit 8 Encoding processing unit 9 Network interface processing unit 10 Analog Y / C separation unit 11 Moving area detection unit 12 CIF / QCIF image cutout address calculation unit 13 Frame memory unit 14 Background difference calculation unit 15 Background reference image memory unit 16 Blocking processing unit 17 Binarization processing Part 18 Parietal coordinate calculation unit 19 CIF / QCIF image clipping center coordinate calculation unit

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 テレビジョン信号からCIF画像を得る
テレビ電話用CIF画像変換方式において、 テレビジョン信号をA/D変換する処理手段と、 A/D変換された該テレビジョン信号をフレームメモリ
に蓄積する手段と、 該テレビジョン信号中の動領域を検出する手段と、 該フレームメモリに蓄積された信号から該検出された動
領域を含む矩型領域で切り出すためのアドレスを算出す
る手段を有することを特徴とするテレビ電話用CIF画
像変換方式。
1. A CIF image conversion system for a videophone for obtaining a CIF image from a television signal, processing means for A / D converting the television signal, and storing the A / D converted television signal in a frame memory. Means for detecting a moving area in the television signal, and means for calculating an address for cutting out a rectangular area including the detected moving area from the signal stored in the frame memory. CIF image conversion system for videophones.
【請求項2】 テレビジョン信号がNTSC方式の場
合、A/D変換時のサンプリング周波数を11.1MH
zとする請求項1記載のテレビ電話用CIF画像変換方
式。
2. When the television signal is the NTSC system, the sampling frequency for A / D conversion is 11.1 MH.
The CIF image conversion system for videophone according to claim 1, wherein z is z.
【請求項3】 テレビジョン信号がPALまたはSEC
AM方式の場合、A/D変換時のサンプリング周波数を
13.5MHzとする請求項1記載のテレビ電話用CI
F画像変換方式。
3. The television signal is PAL or SEC.
The videophone CI according to claim 1, wherein in the case of the AM system, the sampling frequency at the time of A / D conversion is 13.5 MHz.
F image conversion method.
JP3227626A 1991-09-09 1991-09-09 Cif image transforming system for video telephone Pending JPH0568241A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3227626A JPH0568241A (en) 1991-09-09 1991-09-09 Cif image transforming system for video telephone

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3227626A JPH0568241A (en) 1991-09-09 1991-09-09 Cif image transforming system for video telephone

Publications (1)

Publication Number Publication Date
JPH0568241A true JPH0568241A (en) 1993-03-19

Family

ID=16863871

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3227626A Pending JPH0568241A (en) 1991-09-09 1991-09-09 Cif image transforming system for video telephone

Country Status (1)

Country Link
JP (1) JPH0568241A (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0660580A2 (en) * 1993-12-24 1995-06-28 Sharp Kabushiki Kaisha Image-information format control device
US5585856A (en) * 1993-10-27 1996-12-17 Sharp Kabushiki Kaisha Image processing apparatus that can provide image data of high quality without deterioration in picture quality
JPH09298469A (en) * 1996-05-02 1997-11-18 Mega Chips:Kk Image communication system
JPH11187371A (en) * 1997-12-24 1999-07-09 Kyocera Corp Real-time image transmission method for videophone system
WO2000008586A2 (en) * 1998-08-07 2000-02-17 Korea Institute Of Science And Technology Apparatus and method for detecting a moving object in a sequence of color frame images
KR100312746B1 (en) * 1999-05-12 2001-11-03 강상훈 Apparatus and method for transmitting user-selected viewing region in video communication system
JP2003259322A (en) * 2002-03-01 2003-09-12 Sumitomo Electric Ind Ltd Image display method, display device, and interactive interactive system

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5585856A (en) * 1993-10-27 1996-12-17 Sharp Kabushiki Kaisha Image processing apparatus that can provide image data of high quality without deterioration in picture quality
EP0660580A2 (en) * 1993-12-24 1995-06-28 Sharp Kabushiki Kaisha Image-information format control device
EP0660580A3 (en) * 1993-12-24 1995-11-15 Sharp Kk Image-information format control device.
US5640198A (en) * 1993-12-24 1997-06-17 Sharp Kabushiki Kaisha Image-information format control device for controlling transmission of varied formats of image data stored in a single format
JPH09298469A (en) * 1996-05-02 1997-11-18 Mega Chips:Kk Image communication system
JPH11187371A (en) * 1997-12-24 1999-07-09 Kyocera Corp Real-time image transmission method for videophone system
WO2000008586A2 (en) * 1998-08-07 2000-02-17 Korea Institute Of Science And Technology Apparatus and method for detecting a moving object in a sequence of color frame images
WO2000008586A3 (en) * 1998-08-07 2001-09-20 Korea Inst Sci & Tech Apparatus and method for detecting a moving object in a sequence of color frame images
KR100312746B1 (en) * 1999-05-12 2001-11-03 강상훈 Apparatus and method for transmitting user-selected viewing region in video communication system
JP2003259322A (en) * 2002-03-01 2003-09-12 Sumitomo Electric Ind Ltd Image display method, display device, and interactive interactive system

Similar Documents

Publication Publication Date Title
EP0449555B1 (en) Image encoding apparatus
US5049993A (en) Format conversion preprocessing method and circuit
US6266093B1 (en) Color video camera method and system
GB2114848A (en) Color television signal line doubling circuit
JPH0250690A (en) Picture control method for picture communication equipment
WO2018040577A1 (en) Method and system for realizing adaptive screen rotation in image collection process
JP3046379B2 (en) Image coding device
JPH0568241A (en) Cif image transforming system for video telephone
EP0199964B1 (en) Method and system for decomposition of ntsc color video signals
JP3317327B2 (en) Moving picture coding method and apparatus
KR100452097B1 (en) Image data storing method using a change detection of image data
JPH07203436A (en) Image coder
JPH11234639A (en) Video telephone set
JPH0690444A (en) Portrait transmission system
JP2919236B2 (en) Image coding device
JP3724008B2 (en) Image information conversion device and coefficient data creation device
JP3572634B2 (en) High efficiency coding device
JP2701393B2 (en) Video encoding device
JPH07123369A (en) Image format converter
JPH0686130A (en) Picture processor
JPH08205130A (en) Image data transmission and reception device
JPH0564184A (en) Screen configuration method of TV conference system
JP2000106673A (en) Image-coding transmitter
JPS6382077A (en) Sequential scan converter
JPH06205360A (en) Image pickup recording device