[go: up one dir, main page]

JP2586715B2 - Video signal coding method - Google Patents

Video signal coding method

Info

Publication number
JP2586715B2
JP2586715B2 JP25290790A JP25290790A JP2586715B2 JP 2586715 B2 JP2586715 B2 JP 2586715B2 JP 25290790 A JP25290790 A JP 25290790A JP 25290790 A JP25290790 A JP 25290790A JP 2586715 B2 JP2586715 B2 JP 2586715B2
Authority
JP
Japan
Prior art keywords
block
effective
block map
map
invalid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP25290790A
Other languages
Japanese (ja)
Other versions
JPH04129491A (en
Inventor
淳一 大木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP25290790A priority Critical patent/JP2586715B2/en
Priority to DE69126585T priority patent/DE69126585T2/en
Priority to EP91115818A priority patent/EP0476603B1/en
Priority to CA002051891A priority patent/CA2051891C/en
Priority to US07/764,606 priority patent/US5177608A/en
Publication of JPH04129491A publication Critical patent/JPH04129491A/en
Application granted granted Critical
Publication of JP2586715B2 publication Critical patent/JP2586715B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Color Television Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、帯域圧縮技術を用いた動画像信号の符号化
方式に関する。
Description: TECHNICAL FIELD The present invention relates to a video signal encoding system using a band compression technique.

(従来の技術) 従来の帯域圧縮技術を用いた動画像信号の符号化方式
としては、たとえば1989年電予情報通信学会春季全国大
会、資料番号D−233に記載の「ISDN対応カラー動画像
テレビ電話装置」などが知られている。この動画像信号
の符号化方式では、画面における顔領域を抽出してマッ
プを作成する。そして、画像符号化部ではフレーム間フ
レーム内適応予測を行い、この時もし顔の領域であれば
最終段まで符号化をし、それ以外の領域であれば1つ前
の段階で符号化を止めることにより符号化量を減らして
いる。
(Prior Art) As a coding method of a moving image signal using a conventional band compression technique, for example, an "ISDN-compatible color moving image television" described in Document No. D-233, 1989, National Institute of Information and Communication Technology Spring Meeting. Telephone devices "are known. In this moving image signal encoding method, a map is created by extracting a face area on a screen. Then, the image encoding unit performs inter-frame intra-frame adaptive prediction. At this time, if the region is a face region, the encoding is performed up to the last stage, and if the region is other than the region, the encoding is stopped at the previous stage. This reduces the amount of coding.

(発明が解決しようとする課題) しかしながら上述した従来の動画像信号の符号化方式
では、顔以外の背景の部分も粗く符号化するから背景部
分の雑音により無駄な情報が発生してしまう。また、連
続する画面間で背景部分から顔部分に変化したとする
と、粗い符号化から細かい符号化に変るから、予測画素
信号がここでもかなり発生してしまい、無駄な情報を符
号化することになってしまう。その結果符号化効率が低
下してしまう。
(Problems to be Solved by the Invention) However, in the above-described conventional moving image signal encoding method, unnecessary portions are generated due to noise in the background portion because the background portion other than the face is roughly encoded. Also, if the background changes from a background portion to a face portion between successive screens, the coding changes from coarse coding to fine coding, so that a considerable amount of predicted pixel signals are generated here, resulting in coding of useless information. turn into. As a result, the coding efficiency decreases.

(課題を解決するための手段) 本発明の動画像信号の符号化方式は、画面間の相関を
利用した動画像信号の符号化方式であって、入力する動
画像信号の1画面を複数画素からなるブロックに分割
し、ブロック毎に前画面との差分を検出し、該差分値が
予め定められた第1の閾値以上のときには有効ブロック
とし、前記差分値が予め定められた第1の閾値未満のと
きには無効ブロックとしてフレーム毎に第1の有効ブロ
ックマップを作成する手段と、該第1の有効ブロックマ
ップに対して第1の重みづけを行う手段と、前画面にお
ける第6の有効ブロックマップに対して第2の重みづけ
を行う手段と、前記第1の重みづけを行った第1の有効
ブロックマップと、前記第2の重みづけを行った第6の
有効ブロックマップとを加算合成して重みづけが成され
た第2の有効ブロックマップを得る手段と、該第2の有
効ブロックマップに対して、各ブロックの近傍のブロッ
クを参照し、近傍のブロックおよび対象ブロックの値の
合計値が予め定められた第2の閾値以上のときには当該
対象ブロックを有効ブロックとし、第2の閾値未満のと
きには当該対象ブロックを無効ブロックとするセグメン
テーションを行って第3の有効ブロックマップを得る手
段と、該第3の有効ブロックマップ内の無効ブロックに
ついて、近傍のブロックを参照し、近傍のブロックの値
の合計値が予め定められた第3の閾値以上のときには当
該無効ブロックを有効ブロックに置き替え、第3の閾値
未満のときには当該無効ブロックを無効ブロックのまま
として第4の有効ブロックマップを得る手段と、該4の
有効ブロックマップの有効ブロック数が予め定められた
第4の閾値以上の場合は前記第4の有効ブロックマップ
の有効ブロックを全て無効ブロックに置き換えて第5の
有効ブロックマップとし、前記第4の有効ブロックマッ
プの有効ブロック数が予め定められた第4の閾値未満の
場合は前記第4の有効ブロックマップをそのままで第5
の有効ブロックマップとする手段と、該第5の有効ブロ
ックマップを1フレーム時間遅延させて第6の有効ブロ
ックマップを得る手段と、前記動画像信号の入力時から
前記第4の有効ブロックマップの生成時までの時間の遅
延を前記動画像信号に与える手段と、遅延を与えられた
前記動画像信号について、前記第4の有効ブロックマッ
プで有効ブロックとされた領域を、画面間の相関、画面
内の相関またはその両方を用いて符号化を行う手段とを
有する。
(Means for Solving the Problems) The moving picture signal encoding method of the present invention is a moving picture signal encoding method using correlation between screens, and one screen of an input moving image signal is composed of a plurality of pixels. , And a difference from the previous screen is detected for each block. When the difference value is equal to or greater than a predetermined first threshold value, the block is regarded as an effective block, and the difference value is set to a predetermined first threshold value. Means for creating a first effective block map for each frame as an invalid block when it is less than, means for performing a first weighting on the first effective block map, and a sixth effective block map on the previous screen. A second weighting means, a first effective block map having the first weighting, and a sixth effective block map having the second weighting are added and synthesized. Weight Means for obtaining a second effective block map in which is performed, and referring to blocks near each block with respect to the second effective block map, the total value of the values of the neighboring blocks and the target block is determined in advance. Means for obtaining a third valid block map by performing segmentation by setting the target block as an effective block when the target block is equal to or more than the second threshold and setting the target block as an invalid block when the target block is less than the second threshold; In the invalid block in the effective block map, the neighboring block is referred to, and when the total value of the neighboring blocks is equal to or more than a predetermined third threshold value, the invalid block is replaced with the valid block, Means for obtaining a fourth valid block map by keeping the invalid block as an invalid block when the value is less than the threshold value; If the number of valid blocks in the map is equal to or greater than a predetermined fourth threshold value, all valid blocks in the fourth valid block map are replaced with invalid blocks to form a fifth valid block map, and the fourth valid block map is used. If the number of effective blocks is less than a predetermined fourth threshold value, the fourth effective block map is used as it is in the fifth case.
Means for delaying the fifth effective block map by one frame time to obtain a sixth effective block map, and means for obtaining the sixth effective block map from the input of the moving image signal. Means for giving a delay of time until generation to the moving image signal, and, for the moving image signal with the delay, a region defined as an effective block in the fourth effective block map, Means for performing coding by using the correlation within or both.

(作用) テレビ電話などにおいては、背景部分は固定でおもに
話者が動くことから、話者の部分を切出して符号化を行
えば、背景などからの雑音によって発生する無駄な符号
化情報量を除去でき符号化能率を上げることができる。
(Operation) In a videophone or the like, since the background portion is fixed and the speaker mainly moves, if the speaker portion is cut out and encoded, the amount of useless encoded information generated due to noise from the background or the like is reduced. The coding efficiency can be improved.

本発明においては、話者の部分を切出して話者部分の
みを符号化することにより、符号化効率を高める。話者
の切出し方について図面を参照しながら詳細に説明す
る。第1図の時刻t0,t1,t2に示すように話者が動いたと
仮定する。そして、時刻t0および時刻t1の画面間での差
分を求めると第2図の斜線で示される領域が求められ、
背景部分の孤立した斜線部分は背景の雑音により発生し
た差分信号であるとする。次に、画面を水平方向n画素
×垂直方向n画素の複数の画素からなるブロックに分割
し、各ブロック内の差分信号の絶対値和が予め定められ
た第1の閾値以上のときには、そのブロックを有効ブロ
ックとし、差分信号の絶対値和が第1の閾値未満のとき
にはそのブロックを無効ブロックとする。以上の処理に
よって得られた時刻t1における有効ブロックマップを第
3図(B)に示す。第3図(B)の黒く塗られた部分が
有効ブロックである。第3図(A)は、時刻t0と時刻t0
よりも1画面前の時刻t0−1との画面間で求められた第
6の有効ブロックマップであるとする。そして、現画面
の有効ブロックマップ(第3図(B))すなわち第1の
有効ブロックマップに第一の重みづけを行い、前画面の
有効ブロックマップ(第3図(A))である第6の有効
ブロックマップに対しては、第2の重みづけを行う。以
下に重みづけの一例を示す。例えば、前フレームの有効
ブロックを1とし、無効ブロックを0とする。現フレー
ムの有効ブロックは2とし、現フレームの無効ブロック
は前フレームの無効ブロックと同様に0とする。この様
にして重みづけを行った前フレームの有効ブロックマッ
プと、現フレームの有効ブロックマップとを加算合成
し、第2の有効ブロックマップを得る。第2の有効ブロ
ックマップは、第3図(C)の様になる。次に第3図
(C)の加算合成された第2の有効ブロックマップに対
して、セグメンテーンションを行う。セグメンテーショ
ンの一例を第3図および第4図を参照しながら説明す
る。例えば、第4図のkをセグメンテーションの対象ブ
ロックとすると、ブロックkの近傍のブロックa,b,c,d,
e,f,g,hの値を参照する。すなわち第3図(C)の第2
の有効ブロックマップの値を参照する。近傍のブロック
a,b,c,d,e,f,g,hおよびブロックkの値の合計値が予め
定められた第2の閾値以上のときには、対象ブロックk
を有効ブロックとし、近傍のブロックa,b,c,d,e,f,g,h
およびブロックkの値の合計値が予め定められた第2の
閾値未満のときには、対象ブロックkを無効ブロックと
する。
In the present invention, the coding efficiency is increased by cutting out the speaker portion and coding only the speaker portion. The method of extracting a speaker will be described in detail with reference to the drawings. Assume that the speaker has moved as shown at times t0, t1, and t2 in FIG. Then, when the difference between the screens at the time t0 and the time t1 is obtained, an area shown by oblique lines in FIG. 2 is obtained,
It is assumed that an isolated hatched portion in the background is a difference signal generated by background noise. Next, the screen is divided into blocks each including a plurality of pixels of n pixels in the horizontal direction × n pixels in the vertical direction, and when the sum of absolute values of the difference signals in each block is equal to or larger than a predetermined first threshold value, Is an effective block, and when the sum of absolute values of the difference signal is less than the first threshold value, the block is regarded as an invalid block. FIG. 3B shows an effective block map at time t1 obtained by the above processing. The portion painted black in FIG. 3 (B) is an effective block. FIG. 3A shows time t0 and time t0.
It is assumed that it is the sixth effective block map obtained between the screens at time t0-1 one screen before. Then, first weighting is performed on the effective block map of the current screen (FIG. 3 (B)), that is, the first effective block map, and the sixth block which is the effective block map of the previous screen (FIG. 3 (A)) is obtained. The second weighting is performed for the effective block map. An example of weighting is shown below. For example, the valid block of the previous frame is set to 1 and the invalid block is set to 0. The number of valid blocks in the current frame is 2, and the number of invalid blocks in the current frame is 0, like the invalid blocks in the previous frame. The weighted effective block map of the previous frame and the weighted effective block map of the current frame are added and synthesized to obtain a second effective block map. The second effective block map is as shown in FIG. Next, segmentation is performed on the second effective block map obtained by addition and synthesis in FIG. 3 (C). An example of the segmentation will be described with reference to FIGS. 3 and 4. For example, if k in FIG. 4 is a target block for segmentation, blocks a, b, c, d,
Refer to the values of e, f, g, h. That is, the second of FIG.
Refer to the value of the effective block map. Nearby blocks
When the sum of the values of a, b, c, d, e, f, g, h and the block k is equal to or greater than a predetermined second threshold, the target block k
Is an effective block, and neighboring blocks a, b, c, d, e, f, g, h
When the sum of the values of the block k and the block k is smaller than a second predetermined threshold value, the target block k is regarded as an invalid block.

新たにセグメンテーションによって得られた第3の有
効ブロックマップを第3図(D)に示す。第3の有効ブ
ロックマップには場合によって、動き部分に孤立無効ブ
ロック領域が発生することがある。これは、第1の有効
ブロックマップを得る際、動き部分において画面間での
差分が第1の閾値よりも少し低かったブロックは、無効
ブロックとなるから、動き部分に孤立した無効ブロック
領域が発生する。孤立無効ブロック領域の一例を第5図
に示す。第5図の様に孤立無効ブロック領域を含む第3
の有効ブロックマップ内の有効ブロック領域のみ符号化
を実行させると、有効ブロック領域内の孤立した無効ブ
ロック領域は、符号化が行われないから無効ブロックの
部分と周囲の部分とで符号化画像の連続性がなくなり、
符号化歪が発生してしまう。その結果、非常に見苦しい
符号化画像となってしまうことがある。そこで、孤立無
効ブロック領域の除去を行う。孤立無効ブロック領域の
除去方法としては、セグメンテーションと同様な処理を
無効ブロックを対象に行う。すなわち無効ブロックの近
傍のブロックを参照し、近傍のブロックの合計値が予め
定められた第3の閾値以上のときに、その対象となる無
効ブロックを有効ブロックを示す値に置き替える。以上
の処理により第5図で孤立無効ブロックであった領域を
除去し、第4の有効ブロックマップを得る。第4の有効
ブロックマップを第3図(D)に示す。
FIG. 3D shows a third effective block map newly obtained by segmentation. In some cases, an isolated invalid block area may occur in a moving portion in the third valid block map. This is because when a first effective block map is obtained, a block in which a difference between screens in a moving portion is slightly lower than a first threshold value becomes an invalid block, and an isolated invalid block region occurs in the moving portion. I do. FIG. 5 shows an example of the isolated invalid block area. As shown in FIG. 5, the third area including the isolated invalid block area
When only the effective block area in the effective block map is encoded, the isolated invalid block area in the effective block area is not encoded. Loss of continuity,
Coding distortion occurs. As a result, the encoded image may be very unsightly. Therefore, the isolated invalid block area is removed. As a method for removing an isolated invalid block area, a process similar to the segmentation is performed on an invalid block. That is, a block near the invalid block is referred to, and when the total value of the blocks in the vicinity is equal to or larger than a predetermined third threshold, the target invalid block is replaced with a value indicating the valid block. By the above processing, the area which was the isolated invalid block in FIG. 5 is removed, and the fourth valid block map is obtained. FIG. 3D shows a fourth effective block map.

次に時刻t2における処理について説明する。時刻t1と
時刻t2の画面間での差分を求め、前記第1の閾値にした
がって有効無効判定を行うと、第6図(A)に示す第1
の有効ブロックマップが得られる。この第1の有効ブロ
ックマップに対して第1の重みづけを行う。そして前画
面である時刻t1の有効ブロックマップが第3図(D)で
あるから、第3図(D)の有効ブロックマップに対して
第2の重みづけを行って第1の重みづけを行った第1の
有効ブロックマップと加算合成すると、第6図(B)に
示す第2の有効ブロックマップが得られる。第6図
(B)の第2の有効ブロックマップに対して、第2の閾
値を用いて前記セグメンテーションを行うと、第6図
(C)に示す第3の有効ブロックマップが得られる。次
に、第3の有効ブロックマップに対して、孤立無効ブロ
ック領域の除去を行う。第6図(C)の第3の有効ブロ
ックマップには、孤立無効ブロック領域が存在していな
かったので、第3の有効ブロックマップがそのまま第4
の有効ブロックマップとされ、セグメンテーションによ
って得られた話者領域となる。時刻t2における実際の話
者領域は、画面のほぼ左半分であるのに対し、セグメン
テーションによって得られた話者領域は、画面の右半分
の背景部分にだいぶはみだしているから、第6図(C)
の第4の有効ブロックマップをこのまま用いると、背景
の雑音も符号化してしまう可能性があり、あまり好まし
くない。時刻t1,t2の場合の様に動きが大きく、セグメ
ンテーションで得られた有効ブロックの数が多い場合に
は、前画面における有効ブロックマップの影響を受け
て、前画面の話者領域にふくらんでしまうからである。
従って画面間での動きが大きい場合、すなわち第4の有
効ブロックマップの有効ブロック数が予め定められた第
4の閾値以上の場合には、第4の有効ブロックマップに
対してリセットを行い、第4の有効ブロックマップ内の
有効ブロックを全て無効ブロックに置き換えて第5の有
効ブロックマップとする。第5の有効ブロックマップ
は、1フレーム時間遅延されて第6の有効ブロックマッ
プとなり、次の時刻においてセグメンテーションに用い
られる。たとえば、第3図(A)を前フレームの第4の
有効ブロックマップとし、第3図(B)を現フレームの
有効ブロックマップすなわち第1の有効ブロックマップ
とする。そして、時刻t1において得られた第4の有効ブ
ロックマップの有効ブロック数が、前記第4の閾値以上
であったとすると、第4の有効ブロックマップ内の有効
ブロックを、全て無効ブロックに置き換えて第5の有効
ブロックマップとするから、第5の有効ブロックマップ
が1フレーム時間遅延されて得られる時刻t2における第
6の有効ブロックマップも全て無効ブロックとなる。そ
の結果、時刻t2における第1の有効ブロックマップが、
第6図(A)であったとすると、重みづけが行われた第
2の有効ブロックマップは第6図(D)の様になり、こ
の第2の有効ブロックマップに対して第2の閾値を用い
て前記セグメンテーションを行うと、第6図(A)に示
す様な第3の有効ブロックマップが得られる。この第3
の有効ブロックマップには孤立無効ブロック領域が含ま
れていなかったから、第3の有効ブロックマップがその
まま第4の有効ブロックマップとなり、背景部分を削除
することができる。
Next, the processing at time t2 will be described. When the difference between the screens at the time t1 and the time t2 is obtained, and the validity / invalidity determination is performed according to the first threshold, the first time shown in FIG.
Is obtained. The first weighting is performed on the first effective block map. Then, since the effective block map at the time t1, which is the previous screen, is that shown in FIG. 3D, the effective block map shown in FIG. 3D is subjected to the second weighting and the first weighting. The second effective block map shown in FIG. 6 (B) is obtained by addition and synthesis with the first effective block map. When the above-described segmentation is performed on the second effective block map of FIG. 6 (B) using the second threshold value, a third effective block map shown in FIG. 6 (C) is obtained. Next, an isolated invalid block area is removed from the third valid block map. Since the isolated invalid block area did not exist in the third valid block map of FIG. 6C, the third valid block map was used as it is in the fourth valid block map.
And a speaker area obtained by the segmentation. The actual speaker area at the time t2 is almost in the left half of the screen, whereas the speaker area obtained by the segmentation protrudes considerably into the background part of the right half of the screen. )
If the fourth effective block map is used as it is, the background noise may be coded, which is not preferable. When the motion is large and the number of effective blocks obtained by the segmentation is large as in the case of the times t1 and t2, the speaker area on the previous screen expands due to the effect of the effective block map on the previous screen. Because.
Therefore, when the movement between the screens is large, that is, when the number of effective blocks of the fourth effective block map is equal to or more than a predetermined fourth threshold value, the fourth effective block map is reset and the fourth effective block map is reset. All the valid blocks in the fourth effective block map are replaced with invalid blocks to form a fifth effective block map. The fifth effective block map is delayed by one frame time to become the sixth effective block map, and is used for segmentation at the next time. For example, FIG. 3A is a fourth effective block map of the previous frame, and FIG. 3B is an effective block map of the current frame, that is, a first effective block map. If the number of valid blocks in the fourth valid block map obtained at time t1 is equal to or greater than the fourth threshold, all valid blocks in the fourth valid block map are replaced with invalid blocks, and Since the fifth effective block map is the fifth effective block map, all the sixth effective block maps at time t2 obtained by delaying the fifth effective block map by one frame time are also invalid blocks. As a result, the first valid block map at time t2 is
6 (A), the weighted second effective block map is as shown in FIG. 6 (D), and a second threshold value is set for this second effective block map. When the above-described segmentation is performed, a third effective block map as shown in FIG. 6A is obtained. This third
Does not include an isolated invalid block area, the third valid block map becomes the fourth valid block map as it is, and the background portion can be deleted.

以上の様にして得た第4の有効ブロックマップの有効
ブロック領域内すなわち話者領域を、画面間の相関、画
面内の相関またはその両方を用いて符号化することによ
り、背景などの雑音により発生する無駄な情報を容易に
削除でき、符号化効率を高めることができる。
By coding the effective block area of the fourth effective block map obtained as described above, that is, the speaker area using the correlation between the screens, the correlation within the screen, or both, the noise caused by the background or the like is reduced. The generated unnecessary information can be easily deleted, and the encoding efficiency can be improved.

上記各閾値および重みづけの値については、予め統計
的に調べた最適値を用いる。また、セグメンテーション
および孤立無効ブロック除去における参照ブロックの配
置は、上記以外の配置およびブロック数でもかまわな
い。
As the above thresholds and weights, optimal values statistically checked in advance are used. The arrangement of the reference blocks in the segmentation and the removal of the isolated invalid block may be an arrangement other than the above and the number of blocks.

(実施例) 次に、図面を参照しながら本発明の一実施例について
詳細に説明する。第7図に本発明の一実施例を示す。入
力する動画像信号は、線100を介して有効無効判定部1
および遅延部11に供給される。有効無効判定部1は、前
画面の動画像信号を蓄えておき、この前画面における動
画像信号と新たに線100を介して入力された動画像信号
とのフレーム差分信号を求め、このフレーム差分信号を
水平方向n画素×垂直方向n画素の複数画素からなるブ
ロックに分割し、それぞれのブロック毎に、ブロック内
のフレーム差分値の絶対値和を求める。求められたフレ
ーム差分値の絶対値和が予め定められた第1の閾値以上
であればそのブロックを有効ブロックとし、フレーム差
分値の絶対値和が第1の閾値未満のときはそのブロック
を無効ブロックとして、第1の有効ブロックマップを得
る。有効無効判定部1で得られた第1の有効ブロックマ
ップは、重みづけ部2に与えられる。重みづけ部2は、
有効無効判定部1から与えられた第1の有効ブロックマ
ップに対して、予め定められた第1の重みづけを行う。
重みづけ部2で重みづけが成された第1の有効ブロック
マップは、加算器4に与えられる。加算器4は、重みづ
け部2から与えられた第1の有効ブロックマップと、重
みづけ部3から与えられる前画面における有効ブロック
マップである第6の有効ブロックマップとを加算し、重
みづけが成された第2の有効ブロックマップを得る。加
算器4で得られた第2の有効ブロックマップは、セグメ
ンテーション部5に与えられる。セグメンテーション部
5は、加算器4から与えられた第2の有効ブロックマッ
プ内の全てのブロックに対して、セグメンテーション処
理を行う。例えば、第4図に示す様にセグメンテーショ
ンの対象となるブロックをkとすると、kおよびkの近
傍のa,b,c,d,e,f,g,hのブロックの値を参照し、それら
の値の合計値が予め定められた第2の閾値以上であれば
そのブロックkを有効ブロックとし、近傍のブロックお
よびkの値が第2の閾値未満の場合にはそのブロックk
を無効ブロックとして第3の有効ブロックマップを得
る。セグメンテーション部5で得られた第3の有効ブロ
ックマップは、孤立無効ブロック除去部6に与えられ
る。孤立無効ブロック除去部6は、セグメンテーション
部5から与えられた第3の有効ブロックマップに含まれ
ている無効ブロックに対して孤立無効ブロック除去の処
理を用い、有効ブロックの連結を行う。孤立無効ブロッ
クの処理は、セグメンテーションと同様に対象となる無
効ブロックの近傍のブロックを参照し、その近傍のブロ
ックの値の合計値が予め定められた第3の閾値以上の場
合は、その孤立無効ブロックを有効ブロックとする。近
傍のブロックの値の合計値が予め定められた第3の閾値
未満の場合は、その無効ブロックは無効ブロックのまま
とし、以上の処理によって孤立無効ブロックの除去を行
った第4の有効ブロックマップを得る。孤立無効ブロッ
ク除去部6で得られた第4の有効ブロックマップは、有
効ブロック数判定部8、有効ブロックリセット部9およ
び符号化部7に与えられる。有効ブロック数判定部8
は、孤立無効ブロック除去部6から与えられた第4の有
効ブロックマップの有効ブロック数が予め定められた第
4の閾値以上の場合には、有効ブロックリセット部9に
リセット実行の指示を与える。また、有効ブロック数判
定部8は、孤立無効ブロック除去部6から与えられた第
4の有効ブロックマップの有効ブロック数が予め定めら
れた第4の閾値未満の場合には、有効ブロックリセット
部9にリセット停止の指示を与える。有効ブロックリセ
ット部9は、有効ブロック数判定部8からリセット実行
の指示が与えられた場合には、孤立無効ブロック除去部
6から与えられた第4の有効ブロックマップの有効ブロ
ックを、全て無効ブロックに置き換えて第5の有効ブロ
ックマップとする。また、有効ブロックリセット部9
は、有効ブロック数判定部8からリセット停止の指示が
与えられた場合には、孤立無効ブロック除去部6から与
えられた第4の有効ブロックマップに何の処理も行わず
にそのままで第5の有効ブロックマップとする。有効ブ
ロックリセット部9で得られた第5の有効ブロックマッ
プは、フレーム遅延部10に与えられる。フレーム遅延部
10は、有効ブロックリセット部9から与えられた第5の
有効ブロックマップを1フレーム時間遅延し、第6の有
効ブロックマップを得る。フレーム遅延部10で得られた
第6の有効ブロックマップは、重みづけ部3に与えられ
る。重みづけ部3は、フレーム遅延部10から与えられた
第6の有効ブロックマップに対して、第2の重みづけを
行って加算器4に重みづけが成された第4の有効ブロッ
クマップを与える。遅延部11は、入力した動画像信号に
対して入力動画像信号が供給されてから第4の有効ブロ
ックマップが符号化部7に与えられるまでの遅延時間補
償を行い、第4の有効ブロックマップと入力動画像信号
の時間合せを行う。遅延部11の出力の時間補償された動
画像信号は、符号化部7に与えられる。符号化部7は、
孤立無効ブロック除去部6から与えられた第4の有効ブ
ロックマップ内の有効ブロック領域すなわち話者領域で
あると示されている部分についてのみ、遅延11から与え
られた動画像信号の符号化を行い、無効ブロックで示さ
れる背景部分は符号化を行わない。
(Example) Next, an example of the present invention will be described in detail with reference to the drawings. FIG. 7 shows an embodiment of the present invention. The input moving image signal is sent to a valid / invalid determination unit 1 via a line 100.
And to the delay unit 11. The valid / invalid determination unit 1 stores a moving image signal of the previous screen, obtains a frame difference signal between the moving image signal on the previous screen and the moving image signal newly input via the line 100, and calculates the frame difference. The signal is divided into blocks each including a plurality of pixels of n pixels in the horizontal direction × n pixels in the vertical direction, and for each block, the sum of absolute values of frame difference values in the block is obtained. If the sum of absolute values of the obtained frame difference values is equal to or greater than a predetermined first threshold, the block is regarded as a valid block, and if the sum of absolute values of the frame difference values is less than the first threshold, the block is invalidated. As a block, a first valid block map is obtained. The first valid block map obtained by the valid / invalid determination unit 1 is provided to the weighting unit 2. The weighting unit 2
The first valid block map given by the valid / invalid determination unit 1 is subjected to a predetermined first weighting.
The first effective block map weighted by the weighting unit 2 is provided to the adder 4. The adder 4 adds the first effective block map provided from the weighting unit 2 and the sixth effective block map, which is an effective block map in the previous screen, provided from the weighting unit 3 and the weighting is performed. Obtain the generated second effective block map. The second effective block map obtained by the adder 4 is provided to the segmentation unit 5. The segmentation unit 5 performs a segmentation process on all blocks in the second effective block map provided from the adder 4. For example, if a block to be segmented is k as shown in FIG. 4, the values of blocks a, b, c, d, e, f, g, and h near k and k are referred to, and Is equal to or greater than a second predetermined threshold, the block k is regarded as an effective block. If the value of the neighboring blocks and the value of k are smaller than the second threshold, the block k is regarded as an effective block.
Is used as an invalid block to obtain a third valid block map. The third valid block map obtained by the segmentation unit 5 is provided to the isolated invalid block removal unit 6. The isolated and invalid block removing unit 6 connects the effective blocks to the invalid blocks included in the third valid block map provided from the segmentation unit 5 by using the isolated and invalid block removing process. The processing of an isolated invalid block refers to a block near the target invalid block in the same manner as the segmentation, and if the total value of the blocks in the vicinity is equal to or larger than a third threshold value, the isolated invalid block is determined. Let the block be a valid block. If the total value of the neighboring blocks is less than the third threshold value, the invalid block remains an invalid block, and the fourth valid block map from which the isolated invalid block has been removed by the above processing. Get. The fourth valid block map obtained by the isolated invalid block removing unit 6 is provided to the valid block number determining unit 8, the valid block reset unit 9, and the encoding unit 7. Effective block number determination unit 8
When the number of valid blocks in the fourth valid block map provided from the isolated invalid block removing unit 6 is equal to or larger than a predetermined fourth threshold value, the reset instruction is issued to the valid block reset unit 9. When the number of valid blocks in the fourth valid block map provided from the isolated / invalid block removing unit 6 is less than a predetermined fourth threshold, the valid block number determining unit 8 determines whether the valid block is a valid block reset unit 9. To stop resetting. When receiving an instruction to execute reset from the number of valid blocks determination unit 8, the valid block reset unit 9 replaces all valid blocks in the fourth valid block map supplied from the isolated invalid block removal unit 6 with invalid blocks. To obtain a fifth effective block map. Also, an effective block reset unit 9
When the reset stop instruction is given from the valid block number determining unit 8, the fifth valid block map supplied from the isolated invalid block removing unit 6 is directly processed in the fifth valid block map without performing any processing. This is an effective block map. The fifth effective block map obtained by the effective block reset unit 9 is provided to the frame delay unit 10. Frame delay section
The reference numeral 10 delays the fifth effective block map provided from the effective block reset unit 9 by one frame time to obtain a sixth effective block map. The sixth effective block map obtained by the frame delay unit 10 is provided to the weighting unit 3. The weighting unit 3 performs the second weighting on the sixth effective block map provided from the frame delay unit 10 and provides the weighted fourth effective block map to the adder 4. . The delay unit 11 performs delay time compensation for the input moving image signal from when the input moving image signal is supplied to when the fourth effective block map is supplied to the encoding unit 7, and outputs the fourth effective block map. And the input moving image signal. The time-compensated video signal output from the delay unit 11 is provided to the encoding unit 7. The encoding unit 7
The moving image signal given from the delay 11 is coded only for the effective block area in the fourth effective block map provided from the isolated invalid block removing unit 6, that is, for the portion indicated as the speaker area. , The background portion indicated by the invalid block is not coded.

符号化の方法としては、動き補償などの画面間の相関
を利用した方法、または直交交換などの画面内の相関を
利用した方法、あるいは画面間及画面内の両方の相関を
利用した符号化方法を用いる。
As a coding method, a method using correlation between screens such as motion compensation, a method using correlation within a screen such as orthogonal exchange, or an encoding method using correlation between both screens and within a screen Is used.

上記の各閾値および参照ブロック配置などについて
は、予め統計的に調べた最適値を用いる。一例として、
第1の重み付けで現フレームの有効ブロックを2、無効
ブロックを0とし、第2の重み付けで前フレームの有効
ブロックを1、無効ブロックを0とした場合には、第2
の閾値を8、第3の閾値を5とすることで実現できる。
For each of the threshold values and the reference block arrangement, an optimal value statistically checked in advance is used. As an example,
When the effective weight of the current frame is set to 2 and the invalid block is set to 0 by the first weight, and the valid block of the previous frame is set to 1 and the invalid block is set to 0 by the second weight, the second block is set.
Is set to 8 and the third threshold is set to 5.

(発明の効果) 以上に詳しく説明したように、本発明の動画像信号の
符号化方式は、セグメンテーションによって得た話者領
域内のみ符号化をすることにより、背景部分の雑音によ
り発生する無駄な情報を削除でき、符号化の効率を高め
ることができる。
(Effects of the Invention) As described in detail above, the moving picture signal encoding method according to the present invention encodes only the speaker region obtained by the segmentation, so that wasteful noise caused by background noise is generated. Information can be deleted, and coding efficiency can be improved.

【図面の簡単な説明】[Brief description of the drawings]

第1図、第2図、第3図、第4図、第5図および第6図
は本発明の作用を説明する図、第7図は本発明の一実施
例を示す図である。 1……有効無効判定部、2,3……重みづけ部、4……加
算器、5……セグメンテーション部、6……孤立無効ブ
ロック除去部、7……符号化部、8……有効ブロック数
判定部、9……有効ブロックリセット部、10……フレー
ム遅延部、11……遅延部。
FIG. 1, FIG. 2, FIG. 3, FIG. 4, FIG. 5, and FIG. 6 are diagrams for explaining the operation of the present invention, and FIG. 1 valid / invalid determination unit 2,3 weighting unit 4, adder 5, segmentation unit 6, isolated invalid block removal unit 7, coding unit 8, effective block Number judging section, 9 effective block reset section, 10 frame delay section, 11 delay section.

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】画面間の相関を利用した動画像信号の符号
化方式において、入力する動画像信号の1画面を複数画
素からなるブロックに分割し、ブロック毎に前画面との
差分を検出し、該差分値が予め定められた第1の閾値以
上のときには有効ブロックとし、前記差分値が予め定め
られた第1の閾値未満のときには無効ブロックとしてフ
レーム毎に第1の有効ブロックマップを作成する手段
と、該第1の有効ブロックマップに対して第1の重みづ
けを行う手段と、前画面における第6の有効ブロックマ
ップに対して第2の重みづけを行う手段と、前記第1の
重み付けを行った第1の有効ブロックマップと、前記第
2の重みづけを行った第6の有効ブロックマップとを加
算合成して重みづけが成された第2の有効ブロックマッ
プを得る手段と、該第2の有効ブロックマップに対し
て、各ブロックの近傍のブロックを参照し、近傍のブロ
ックおよび対象ブロックの値の合計値が予め定められた
第2の閾値以上のときには当該対象ブロックを有効ブロ
ックとし、第2の閾値未満のときには当該対象ブロック
を無効ブロックとするセグメンテーションを行って第3
の有効ブロックマップを得る手段と、該第3の有効ブロ
ックマップ内の無効ブロックについて近傍のブロックを
参照し、近傍のブロックの値の合計値が予め定められた
第3の閾値以上のときには当該無効ブロックを有効ブロ
ックに置き替え、第3の閾値未満のときには当該無効ブ
ロックを無効ブロックのままとして第4の有効ブロック
マップを得る手段と、該4の有効ブロックマップの有効
ブロック数が予め定められた第4の閾値以上の場合は前
記第4の有効ブロックマップの有効ブロックを全て無効
ブロックに置き換えて第5の有効ブロックマップとし、
前記第4の有効ブロックマップの有効ブロック数が予め
定められた第4の閾値未満の場合は前記第4の有効ブロ
ックマップをそのままで第5の有効ブロックマップとす
る手段と、該第5の有効ブロックマップを1フレーム時
間遅延させて第6の有効ブロックマップを得る手段と、
前記動画像信号の入力時から前記第4の有効ブロックマ
ップの生成時までの時間の遅延を前記動画像信号に与え
る手段と、遅延を与えられた前記動画像信号について、
前記第4の有効ブロックマップで有効ブロックとされた
領域を、画面間の相関、画面内の相関またはその両方を
用いて符号化を行う手段とを有することを特徴とする動
画像信号の符号化方式。
In a moving picture signal encoding method utilizing correlation between screens, one screen of an input moving picture signal is divided into blocks composed of a plurality of pixels, and a difference from a previous screen is detected for each block. When the difference value is equal to or greater than a predetermined first threshold, a first effective block map is created for each frame as an invalid block when the difference value is less than a first threshold. Means, means for performing a first weighting on the first effective block map, means for performing a second weighting on a sixth effective block map in the previous screen, and the first weighting Means for obtaining a weighted second effective block map by adding and combining the first effective block map having been subjected to the above and the sixth effective block map having been subjected to the second weighting; 2 for the effective block map, refer to the blocks near each block, and when the total value of the values of the neighboring blocks and the target block is equal to or greater than a predetermined second threshold, set the target block as an effective block; When the value is smaller than the second threshold value, the target block is segmented as an invalid block,
Means for obtaining an effective block map, and referring to a nearby block for an invalid block in the third effective block map, and when the total value of the neighboring blocks is equal to or more than a predetermined third threshold value, Means for obtaining a fourth valid block map by replacing the block with a valid block and leaving the invalid block as an invalid block when the value is less than a third threshold value, and the number of valid blocks in the fourth valid block map is predetermined. If it is equal to or greater than the fourth threshold, all effective blocks of the fourth effective block map are replaced with invalid blocks to form a fifth effective block map,
When the number of effective blocks in the fourth effective block map is less than a predetermined fourth threshold value, the fourth effective block map is used as it is as a fifth effective block map; Means for delaying the block map by one frame time to obtain a sixth effective block map;
Means for giving a delay of the time from the input of the video signal to the generation of the fourth effective block map to the video signal, and for the video signal given a delay,
Means for coding a region determined as an effective block in the fourth effective block map using a correlation between screens, a correlation within a screen or both of them. method.
JP25290790A 1990-09-20 1990-09-20 Video signal coding method Expired - Lifetime JP2586715B2 (en)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP25290790A JP2586715B2 (en) 1990-09-20 1990-09-20 Video signal coding method
DE69126585T DE69126585T2 (en) 1990-09-20 1991-09-18 Method and device for coding moving image signals
EP91115818A EP0476603B1 (en) 1990-09-20 1991-09-18 Method and apparatus for coding moving image signal
CA002051891A CA2051891C (en) 1990-09-20 1991-09-19 Method and apparatus for coding moving image signal
US07/764,606 US5177608A (en) 1990-09-20 1991-09-20 Method and apparatus for coding moving image signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25290790A JP2586715B2 (en) 1990-09-20 1990-09-20 Video signal coding method

Publications (2)

Publication Number Publication Date
JPH04129491A JPH04129491A (en) 1992-04-30
JP2586715B2 true JP2586715B2 (en) 1997-03-05

Family

ID=17243828

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25290790A Expired - Lifetime JP2586715B2 (en) 1990-09-20 1990-09-20 Video signal coding method

Country Status (1)

Country Link
JP (1) JP2586715B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04144496A (en) * 1990-10-05 1992-05-18 Nec Corp Device for separating and coding background in moving image signal
TW515192B (en) 2000-06-06 2002-12-21 Noa Kk Off Compression method of motion picture image data and system there for
US7085424B2 (en) 2000-06-06 2006-08-01 Kobushiki Kaisha Office Noa Method and system for compressing motion image information
CA2436437A1 (en) * 2001-01-30 2002-08-15 Kabushiki Kaisha Office Noa Moving picture information compressing method and its system
EP1453322A1 (en) * 2001-11-01 2004-09-01 Kabushiki Kaisha Office Noa Moving picture information compression method and system thereof

Also Published As

Publication number Publication date
JPH04129491A (en) 1992-04-30

Similar Documents

Publication Publication Date Title
US5177608A (en) Method and apparatus for coding moving image signal
JPH04334188A (en) Coding system for moving picture signal
US20220046266A1 (en) Image encoder and related non-transitory computer readable medium for image decoding
US20210400258A1 (en) Encoder, decoder, encoding method, and decoding method
US11425385B2 (en) Encoder, decoder, encoding method, and decoding method
US7822231B2 (en) Optical flow estimation method
JPS6152084A (en) Highly efficient encoder
WO2010082463A1 (en) Image encoding apparatus and image encoding method, image decoding apparatus and image decoding method
US11849147B2 (en) Encoding and decoding with merge mode and block partition index
JP2586715B2 (en) Video signal coding method
JP3086585B2 (en) Stereo image coding device
JP2586714B2 (en) Video signal coding method
JP2586720B2 (en) Video signal coding method
JPH0846961A (en) Method for encoding and decoding picture
JP2576704B2 (en) Video signal encoding device
JP2621626B2 (en) Background signal encoding device for image signals
JPH0691653B2 (en) Adaptive coding system
JPH06165164A (en) Dynamic picture processor
JP2000078572A (en) Object encoding device, frame omission control method for object encoding device and storage medium recording program
JP2621625B2 (en) Image signal encoding device
JPH04129490A (en) Coding system for moving picture signal
JPH04144496A (en) Device for separating and coding background in moving image signal
US11936893B2 (en) Encoder, decoder, encoding method, and decoding method
JPH04138790A (en) Encoding device for moving image signal
JPH04144495A (en) Encoder for image signal