[go: up one dir, main page]

JP2007149095A - 動画像の変化点検出方法及び装置 - Google Patents

動画像の変化点検出方法及び装置 Download PDF

Info

Publication number
JP2007149095A
JP2007149095A JP2006316460A JP2006316460A JP2007149095A JP 2007149095 A JP2007149095 A JP 2007149095A JP 2006316460 A JP2006316460 A JP 2006316460A JP 2006316460 A JP2006316460 A JP 2006316460A JP 2007149095 A JP2007149095 A JP 2007149095A
Authority
JP
Japan
Prior art keywords
moving image
change point
frame
image
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006316460A
Other languages
English (en)
Inventor
Akio Nagasaka
晃朗 長坂
Takafumi Miyatake
孝文 宮武
Kazuaki Tanaka
和明 田中
Takehiro Fujita
武洋 藤田
Shigeki Nagaya
茂喜 長屋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2006316460A priority Critical patent/JP2007149095A/ja
Publication of JP2007149095A publication Critical patent/JP2007149095A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management Or Editing Of Information On Record Carriers (AREA)
  • Image Analysis (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

【課題】検出感度を落とすことなく,瞬間的な画像の乱れに対する誤検出を抑制するとともに,対象の動画像の特性の変化に柔軟に対応して正しく変化点を検出できる動画像の変化点検出方法ならびに装置を提供することにある。
【解決手段】対象となる動画像をフレーム単位で時系列に処理装置に入力する手段と,処理装置において,各フレーム単位に該画像データが有する特徴量を計算する手段と,その特徴量と直前の複数枚のフレームの特徴量との間で各々相関係数を求める手段と,求められた相関係数の組み合わせのパターンから動画像の変化点か否かを判定する手段とを設ける。また,過去に計算された相関係数のうち,最近の値を常に保持する手段と,保持されている相関係数の値,もしくは過去のフレームの特徴量をもとに動的に変化点検出の基準を変化させる手段とを設ける。
【選択図】図2

Description

本発明は,ビデオや映画等の動画像をカット(1台のカメラで撮影された途切れのない
動画像区間)別に頭出しすることができる動画像編集システムや動画像のブラウジング方
法に係り,特にビデオテープやビデオディスクに格納された動画像からカット間の変わり
目を検出するための動画像変化点検出方法及び装置に関する。
近年,計算機の高速化と大容量化を背景にして,従来は扱えなかった映画やビデオなど
の動画像情報を扱うことのできるデータベースシステムやプレゼンテーションツールが注
目されている。しかしながら,膨大な情報量を有する動画像情報の中から必要な部分だけ
を探したり,それを加工したりするのは,ユーザにとって手間のかかる作業である。そこ
で,計算機による作業負担軽減方法として,例えば,情報処理学会論文誌 Vol.33, No.4,
「カラービデオ映像における自動索引付け法と物体探索法」や特開平4−111181
号公報「動画像の変化点検出方法」等で示された方法がある。これは,動画像をカット単
位に自動的に分割し,各カットを代表する画像の一覧を作成して,それを書籍の索引のよ
うに用いることで,動画像の検索や編集の一助とする方法である。これによれば,動画像
の中身が一覧上で一目で把握できるので所望の場面が見つかりやすく,また,カットとい
う区切れのよい単位で扱えるので大まかな編集が簡単にできる。
動画像をカット単位に分割するには,動画像の変化点,すなわちカットの変わり目を検
出する必要がある。従来の動画像の変化点検出方法は,例えば,前掲の特開平4−111
181号公報では,動画像中の連続する2枚のフレーム(動画像を構成する一枚一枚の静
止画。一般のテレビで秒30枚表示される)の間に画像的な相異が見られた場合,そのフ
レーム間に動画像の変化点,すなわちカットの変わり目があると判定することを基本にし
ている。
特開平4−111181号公報
しかしながら,上記の方法では,記者会見などの映像でしばしば見られる写真撮影のス
トロボ発光や,あるいは機器の障害等に起因する瞬間的な画像の乱れが生じた場合,それ
をも変化点として検出してしまう。こうした画像の乱れは,1つのカット中で連続して発
生する傾向があり,カットが不必要に分断されてしまう問題がある。また,夜間の場面な
ど全体に暗い画像が続く動画像区間では,連続するフレーム間の画像的相異度は,カット
の変わり目においても,明るい場面の相異度と比べて小さくなる傾向があるため,暗い場
面も明るい場面も同一の基準で変化点か否かの判定を行うと,明るい場面で誤って過剰に
変化点を検出したり,逆に暗い場面で検出漏れが生じる場合がある。
本発明の目的は,従来の方法よりも検出感度を落とすことなく,瞬間的な画像の乱れに
対する誤検出を抑制するとともに,対象の動画像の特性の変化に柔軟に対応して正しく変
化点を検出できる動画像の変化点検出方法及び装置を提供することにある。
上記目的を達成するため,本発明の一形態として,対象となる動画像をフレーム単位で
時系列に処理装置に入力する手段と,処理装置において各フレーム単位に該画像データが
有する特徴量を計算する手段と,その特徴量と直前の1枚以上のフレームの特徴量との間
で各々相関係数を求める手段と,求められた相関係数の組み合わせのパターンから動画像
の変化点か否かを判定する手段とを設ける。
また,過去に計算された相関係数のうち,最近の値を常に保持する手段と,保持されてい
る相関係数の値,もしくは過去のフレーム画像や音声情報の特徴量をもとに動的に変化点
検出の基準を変化させる手段とを設ける。
瞬間的な画像の乱れがあった場合,乱れたフレームと,その直前のフレームとの画像的
相異,ならびに直後のフレームとの画像的相異は大きくなるが,乱れたフレームを間に鋏
む2枚のフレームの間では画像的相異は小さくなるという特徴があるので,本発明によれ
ば,このような状態を示す相関係数の組み合わせパターンを検出した場合には,真の動画
像変化点ではないと正しく判定することができる。逆に,そのような画像の乱れの発生し
た部分だけを検出することもできる。また,直前の動画像の特徴に応じて変化点検出の閾
値を動的に変化させる手段によって,動画像の特徴に合わせた,きめ細かな変化点か否か
の判定ができ,誤検出を抑制することができる。
本発明によれば,瞬間的な画像の乱れと,カットの変わり目とを区別して検出できるの
で,乱れのある部分を変化点として間違って検出しないようにできるほか,乱れた部分だ
けを選び出すこともできる。また,直前の動画像の特徴に応じて変化点検出の閾値が動的
に変化するので,動画像の特徴に合った,きめ細かな変化点検出ができ,誤検出を抑制す
ることができる。
(実施例)
以下,本発明の1実施例を詳細に説明する。
図1は,本発明を実現するためのシステム構成の概略ブロック図の一例である。1はC
RT等のディスプレイ装置であり,コンピュータ4の出力画面を表示する。コンピュータ
4に対する命令は,キーボードやポインティングデバイス等の入力装置5を使って行うこ
とができる。10の動画像再生装置は,光ディスクやビデオデッキ等である。動画像再生
装置10から出力される映像信号は,逐次,3のA/D変換器によってデジタル画像デー
タに変換され,コンピュータ4に送られる。コンピュータ4内部では,デジタル画像デー
タは,インタフェース8を介してメモリ9に入り,メモリ9に格納されたプログラムに従
って,CPU7によって処理される。動画像再生装置10が扱う動画像の各フレームに,
動画像の先頭から順に番号(フレーム番号)が割り付けられている場合には,フレーム番
号を制御線2によって動画像再生装置10に送ることで,当該場面の動画像が再生される
。処理の必要に応じて,各種情報を6の外部情報記憶装置に蓄積することができる。メモ
リ9には,以下に説明する処理によって作成される各種のデータが格納され,必要に応じ
て参照される。
まず最初に,以下では,動画像の変化点検出にあたって,瞬間的な画像の乱れを間違っ
て変化点として検出することを防ぐことができる変化点検出方法について詳細に説明する
図2は,図1で示したシステム上で実行される,動画像の変化点検出プログラムのフロ
ーチャートの一例である。プログラムはメモリ9に格納され,CPU7はまず最初に初期
化処理として,現在の処理対象のフレーム番号を表す変数nを初期値にし,ヒストグラム
に用いるメモリ領域をリセットする(200)。nの初期値としては,処理対象の動画像
区間の先頭のフレーム番号が与えられる。次に,202でフレーム番号nのフレーム画像
fnを取り込み,fnの色ヒストグラムHnを作成する(204)。色ヒストグラムは,1枚の
フレーム画像全体における,同じ色を示す画素の出現頻度を求めたものである。例えば,
RGB各2ビット64色の色ヒストグラムを作成する場合,フレームの各画素のRGBカラー値
をそのRGB各上位2ビットのみで表現した6ビット64色に縮退し,64色のそれぞれにつ
いて,縮退によってその色を示す画素の数をカウントする。この場合,色ヒストグラムは
配列Hn(i)で表され,iは0から63の値をとる。例えば,iが0のときの度数Hn(0)は,RG
Bカラー値の上位2ビットがRGB各々全て0である画素がフレーム中に幾つあるかを示して
いる。続く処理206では,Hnと,1つ前のフレームfn-1の色ヒストグラムHn-1との間の
相異度R1nを求める。また,さらに1つ前のフレームfn-2の色ヒストグラムHn-2とHnとの
間の相異度R2nも計算する(208)。ヒストグラム間の相異度R1n及びR2nは,カイ二乗
検定等の計算式により求めることができる。計算式の種類は,前掲の文献に記載されてい
るので,詳細な説明は省略する。
図3は,瞬間的な画像の乱れが生じた場合のフレーム画像の時間変化を模式的に示した
図である。fn-1で乱れが生じている。この場合,fn-2とfn-1との相異度は大きくなり,R1
n-1は大きな値を示す。また,fn-1とfnも相異度が高く,R1nは大きな値を示す。しかし,
fn-2とfnとは良く似ているのでR2nは小さな値をとる。一方,図4は,通常のカットの変
わり目付近のフレーム画像の時間変化を模式的に示した図である。fn-2とfn-1の間でカッ
トが変わっている。このとき,fn-2とfn-1との相異度は大きくなり,R1n-1は大きな値を
示す。しかし,fn-1とfnは良く似ているのでR1nは小さな値をとる。また,fn-2とfnは相
異度が大きく,R2nは大きな値をとる。従来の方法では,R1nの値にのみ着目していたので
,図3の場合も図4の場合も区別がつかずに,fn-2とfn-1の間を動画像の変化点として検
出してしまっていた。R2nを判定に用いることにより,図3の場合と図4の場合とを区別
できるようになる。すなわち,R1n-1とR1nがともに閾値th4より大きく,R2nが閾値th5よ
り小さいときには,これを瞬間的な乱れが生じたものとして判定する(210)。そして
,R1n-1が閾値th1より大きく,かつR1nが閾値th2より小さく,かつR2nが閾値th3よりも大
きいときに,fn-2とfn-1の間にカットの変わり目があったとして判定し(214),変化
点検出に伴う各種処理を行う(216)。
もちろん,(1) R1n-1とR1nが両方とも大きいのか,(2) R1n-1が大きくてもR1nの方は小
さいのか,という条件だけでも,(1)は図3に示すように,(2)は図4に示すように区別で
きないことはない。しかしながら,R2nの値を併用することにより,乱れた後に確かに元
の画像に戻ったことが確認できるので判定の信頼性が極めて高い。処理210で瞬間的な
乱れと判定された場合,R1n-1とR1nを0にリセットする(212)。もし,0にリセット
しなければ,図3にあるように,R1nが大きく,かつR1n+1が小さく,かつR2n+1が大きい
という組み合わせが生じるため,次回すなわちn+1番目のフレームの処理において,処理
214でfn-1とfnの間をカットの変わり目として検出してしまうためである。
これらの処理により,瞬間的な画像の乱れに対しても安定して動画像の変化点を検出す
ることができる。あるいは,この判定条件を用いることにより,逆に瞬間的な乱れが生じ
た箇所だけを検出することもできる。瞬間的な乱れを起こす最も典型的なケースは,記者
会見等におけるカメラ撮影のストロボフラッシュである。ストロボフラッシュは,記者が
決定的な場面だと判断して撮影した場合に生じるものであるから,これが発生した箇所は
非常に重要な場面であることが多い。したがって,動画像中から重要な場面だけを選びだ
すための一つの手段として用いることができる。また,もう1つの典型的なケースは,サ
ブリミナル効果と呼ばれる,視聴者に対する不正な心理操作の場合がある。これは,動画
像中に一定時間ごとに1フレームだけ特殊な画像を挿入することで,その画像が視聴者の
気づかぬうちに深層心理に働きかけ,一種の暗示をかけることができるとされる。こうし
た不正な効果が含まれている動画像かどうかを自動的に判定し,そのような動画像の放送
を未然に阻止することができる。
上記の方法では,説明を簡単にするため,1フレームだけの乱れについて述べたが,R2
nを計算する際のフレーム間隔を長くとれば,任意のフレーム枚数分の乱れについても同
様の方法で対応できる。図5で示した例では,fn-1とfnの2フレームに乱れが生じている
が,それをまたぐ形で相違度を求めているR2n+1は,R1n-1, R1n, R1n+1が大きめの値をと
って推移するのに対して,小さな値をとる。
この組み合わせから画像の乱れなのか変化点なのかを判定することができる。このように
して,R2nの計算を,1フレーム飛びの場合,次いで2フレーム飛びの場合というように
,順に間隔を広げながら行っていくことで,任意のフレーム枚数分の乱れを変化点と区別
することができる。
最後に,処理218で,処理対象のフレーム番号値を1つ増やして次のフレーム取り込
みに備える。
次に,以下では,動画像の変化点検出にあたって,例えば,明るい場面での過剰な変化
点検出を抑制しながら,逆に暗い場面での検出漏れをも抑制するといったように,対象の
動画像の特性の変化に柔軟に対応して正しく変化点を検出する変化点検出方法について詳
細に説明する。
図6に,図1で示したシステム上で実行される,動画像の変化点検出プログラムのフロ
ーチャートの一例を示す。アルゴリズムの基本的な流れは前述の図2のフローチャートと
同様であるが,動画像変化点だと判定する閾値が図2では固定型だったのに対し,図6で
は変動型になっている。閾値を変動型にする利点を図7を使って説明する。図7は,明る
く動きの激しい場面(708),暗い場面1(710),暗い場面2(712)の3つの
カットが連続する動画像を例にとり,フレーム間相関係数の典型的な時間推移を示したも
のである。図中,702と704が各々カットの変わり目の位置である。
動きの激しい場面の場合,連続するフレーム間の画像的相異が大きい。したがって,7
08の区間では相関係数は比較的大きな値が続くことになる。一方,暗い場面では,その
フレーム画像を構成する色が,黒を中心とした少種類の色に集中するため,ヒストグラム
の形が類似し,710と712の区間で相関係数は小さな値をとる。この区間では,上記
の理由からカットの変わり目でも相関係数は小さめになる。このとき,カットの変わり目
として判定する閾値を,706の破線で示したような一定値に設定した場合,その値を高
めに設定すると704のような暗い場面間の変化点では検出漏れが生じ,逆に低めに設定
すると700のような動きの激しい区間の相関係数の一部に対して敏感に反応してしまう
。動きの激しい場面での過剰検出を抑制するための方法として,前述の特開平4−111
181号公報では,直前の相関係数の値と現在の相関係数の値との変化率を求め,その変
化率が許容値を超えた場合にカットの変わり目であると判定する方法が示されている。こ
の方法において,相関係数の値は単位時間あたりの画像変化量であるから,カメラや動画
像中の物体が動く速度に対応する。多くの場合,カメラや動画像中の物体の動き速度は,
それほど大きく変化しないので,変化率の値は動きのある場面でもない場面でも小さな値
をとり,カットの変わり目のときの値だけが突出して大きな値をとるようになる。このた
め,暗い場面でも動きのある場面でも同じ閾値で対応できることになる。しかしながら,
カメラのぶれや,物体がカメラの直前を通過した場合など,急激に変化する場合も少なく
なく,このような場合には,700のように直前の相関係数との変化率714が,暗い場
面での変化率716と同じかそれ以上の大きさになることもある。動画像の各場面の特性
の変化に柔軟に対応して閾値を変化させる必要がでてくる。
以下,再び図6のフローチャートに戻ってアルゴリズムを説明する。
まず最初に初期化処理として,現在の処理対象のフレーム番号を表す変数nを初期値に
し,ヒストグラムに用いるメモリ領域をリセットする(600)。nの初期値としては,
処理対象の動画像区間の先頭のフレーム番号が与えられる。次に,処理602でフレーム
番号nのフレーム画像fnを取り込み,fnの色ヒストグラムHnを作成する(604)。続い
て,処理606でfnの輝度平均Bnを求める。
処理606の詳細なフローチャートを図8に示す。フレーム画像fnのサイズは幅w, 高さh
であるとする。まず変数Bnを0にリセットする(800)。そして,fn中の各画素につい
て,その輝度Bp(x, y)を求める。ここで,(x, y)はfn内における画素の二次元平面座標を
表す。Bp(x, y)は,fnがモノクロ濃淡画像の場合には,その画素の明るさであり,カラー
画像の場合には,その画素の色の輝度成分である。色が,YUV表色系といった輝度成分が
分離された形で表現されている場合には,その輝度成分の値をそのまま,すなわちYUV表
色系の場合ではYの値を利用すればよい。計算機中で一般的に使用されているRGB表色系等
では,RGB各成分の値から計算によって輝度成分を求める必要がある。802で示した例
では,RGB各成分の最大値を輝度値としている。R(x, y)は,(x, y)の位置にある画素の赤
成分の値を表し,同様にG(x, y)は緑成分,B(x, y)は青成分の値である。画素の輝度は緑
成分にほぼ比例するので緑成分の値をBp(x, y)の値として近似的に用いてもよい。こうし
て求まったBp(x, y)の値をBnに足し込んでいき(804),最終的にフレーム全体の輝度
をBnに得る。以上の処理は,604の色ヒストグラムの計算と同時に行うことで,各画素
の値読み出しや変数xやyのインクリメント等の処理の重複を省くことができ,高速化が図
れる。
続く処理608では,直前のフレームのヒストグラムHn-1と現在のヒストグラムHnとの
相異度R1nを計算する。次いで,処理610では,直前の動画像の特徴に合わせた閾値の
変更を行う。この例では,直前の動画像の明るさと動きの大きさを特徴量とし,式th7 =
th6 + Bn-1*α+ R1n-1*βにより,新しい閾値th7を得る。ここで,th6には,明るさが標
準的で動きの少ない動画像に対して最もうまく機能する値を与える。αは,明るさの変化
に対してth6をどれくらい上下させるかの重み値であり,βは,同様に動きの大きさに対
してth6をどの程度変化させるかを決定する重み値である。このほかにも閾値を変更する
べきファクターがあれば,式に必要なだけ追加する。例えば,直前の動画像に対する処理
フレーム枚数も重要なファクターのひとつである。フレーム画像はNTSC方式の動画像の場
合で秒30枚あるが,計算機の能力によっては,フレーム間相関係数を求めている間に,
次のフレーム画像の取り込みタイミングを過ぎてしまう場合もある。このとき,動画像が
通常の速度で再生されていれば,当然ながら1フレーム飛びのフレーム間相関係数を求め
ていることになる。すなわち,処理フレーム枚数は,計算機の処理能力により秒30枚の
ケースも数枚程度のケースもありうる。比較するフレームの間隔が広がるほど画像的相異
は大きくなるので,相関係数の値も処理フレーム枚数の低い区間ほど大きな値をとる傾向
がある。したがって,このような区間では,閾値は高めにしたほうが過剰検出を抑制でき
る。プログラム実行中に処理フレーム枚数が大きく変動することがない場合には,計算機
の能力があらかじめわかっていれば,最初の段階でth6を変更しておくことにより,th7を
計算する時点で考慮する必要はなくなる。
以上のようにして求めたth7よりもR1nが大きいかどうかを判定し(612),大きい場
合,n-1番目とn番目のフレームの間にカットの変わり目があったとして検出処理を行う(
614)。最後に,処理616で,処理対象のフレーム番号値を1つ増やして次のフレー
ム取り込みに備える。
上記の例では,fnの直前の1フレーム分だけの特徴から閾値を変更していたが,直前の
任意枚数分のフレームの特徴の履歴から変更するようにしてもよい。例えば,動きの激し
さの尺度として,直前の数フレーム分の相関係数の平均値や最大値を,610の式におけ
るR1n-1のかわりに用いることができる。また,fnの直後のフレームfn+1, fn+2, ...の特
徴によってもR1nを判定する閾値に変更を加えてもよく,これによりR1nが閾値を超えた場
合には,時間を遡ってfn-1とfnの間にカットの変わり目があったと判定する。
さらに,上記の例では,閾値を変更していたが,閾値を定数にして,その替わりに相関
係数の値を変化させるようにしても構わない。
また,図2で示した方式と図6の方式とを組み合わせることにより,より信頼性の高い
動画像の変化点検出方法を実現することができる。図9にそのフローチャートの例を示す
。フローチャートを構成する各処理の内容は,上記で説明した通りである。まず最初に初
期化処理として,現在の処理対象のフレーム番号を表す変数nを初期値にし,ヒストグラ
ムに用いるメモリ領域をリセットする(900)。nの初期値としては,処理対象の動画
像区間の先頭のフレーム番号が与えられる。次に,処理902でフレーム番号nのフレー
ム画像fnを取り込み,fnの色ヒストグラムHnを作成する(904)。続いて,処理906
でfnの輝度平均Bnを求める。続く処理908では,Hnと,1つ前のフレームfn-1の色ヒス
トグラムHn-1との間の相異度R1nを求める。また,さらに1つ前のフレームfn-2の色ヒス
トグラムHn-2とHnとの間の相異度R2nも計算する(910)。次いで,処理912では,
直前の動画像の特徴に合わせ,閾値th8を計算する。R1n-1とR1nがともに閾値th4より大き
く,R2nが閾値th5より小さいときには,これを瞬間的な乱れが生じたものとして判定する
(914)。そして,R1n-1が閾値th8より大きく,かつR1nが閾値th2より小さく,かつR2
nが閾値th3よりも大きいときに,fn-2とfn-1の間にカットの変わり目があったとして判定
し(918),変化点検出に伴う各種処理を行う(920)。処理914で瞬間的な乱れ
と判定された場合,R1n-1とR1nを0にリセットする(916)。最後に,処理922で,
処理対象のフレーム番号値を1つ増やして次のフレーム取り込みに備える。
上記で説明した動画像の変化点検出方法において相関係数を求める際,前述の文献にも
記載されているように,フレーム画像を幾つかのブロックに分割して,分割した各ブロッ
クごとにヒストグラムを求めて相関係数を計算し,それらの相関係数の組み合わせを総合
的に判定することでフレーム全体の相関係数を求めてもよい。これにより,カットの変わ
り目とそうでない区間との相関係数の値の差が大きくなる効果も得られる。
一方,上記で説明した動画像の変化点検出方法を用いて検出される変化点のほかに,利
用者が,処理中の動画像を見ながら,その場の判断で変化点を追加登録したい場合もある
。しかし,人間の反応速度には限界があるので,利用者が変化点を見つけて登録したいと
思ってから計算機に指示が伝わるまでの間に相当の時間が過ぎていることが多い。その時
間遅れにより,指定された変化点位置は,当初意図していた変化点の位置とは許容できな
いほど違っている可能性がある。そこで,利用者の反応速度に応じて予め設定された時間
分を常に差し引いた変化点位置を登録する手段を設けると都合がよい。また,逆に予め設
定された時間分だけ足した位置を変化点として登録する方法も役に立つ。
変化点を検出することによって,動画像を部分部分の区間に分割するわけであるが,音
声に関係なく分割してしまうと,後々扱いにくいケースが生じる。例えば,ある人が話を
している途中で区間を分割すると,分割された1つの区間だけを見たのでは話が閉じなく
なる。変化点検出によって分割された各カットを単位として,取捨選択や並べ変えを行う
ような動画像編集システムにおいては,特に問題となる。そこで,変化点を検出した際に
は,そのときの音声信号も調べ,音声が入っているようならば,次に音声が途絶えた時点
,すなわち無音部を待って,その時点のほうを変化点として登録する。無音部か否かは,
音量から判定できる。図10に音声信号の典型的な例を示す。横軸が時間で,縦軸が音の
振幅を示す。音量は振幅の大きさであるから,振幅が予め設定した閾値よりも小さい場合
に,そこを無音部と判定できる。もちろん,音声のある区間でも振幅は瞬間的に小さい値
をとるので,それによって誤って判定しないように,一定時間分の振幅を調べて,振幅が
小さい状態が続いていることを確認した上で無音部の検出を行うようにする。この方法は
,計算機が自動的に変化点を検出する場合と,利用者の判断で変化点として検出する場合
とにかかわらず,利用可能であることは言うまでもない。
以上述べた方法によって動画像をカット分割すると,カットを単位とした検索や編集が
行えるようになる。こうしたカット単位の操作を利用者がもっと簡単に行えるようにする
ためには,そのカットの内容が絵で確認できるようになっていると都合がよい。そこで,
カットの変わり目が検出された時点で,そのときのフレーム画像を代表画像として抽出し
,その代表画像を,検索や編集のアプリケーションで扱いやすい大きさにサイズを変更し
て,ディスク等の記録装置にファイルとして格納しておき,必要に応じて呼び出せるよう
にする。こうした格納に関わる処理は,図2を例にとると216の処理の中で行われる。
もちろん,フレーム画像のような静止画だけではなく,変化点からはじまる一定時間の動
画像を同様に取り込んで記録してもよい。また,カットを代表する画像としては,カット
の変わったばかりの時点の画像よりも少し時間がたった時点の画像のほうが適切なことが
多いので,変化点から一定時間オフセットを加えた時点の画像を代表画像として使用して
もよい。しかしながら,図2や図9で述べた変化点検出方法を用いると,カットの変わり
目のフレームから数フレームを経た時点で初めて変化点か否かが判定されるので,判定が
定まったときに代表画像を抽出しようとすると,すでにして一定時間オフセットを加えた
時点の画像を取り込むことになる。
このとき,どうしても正確にカットの変わり目のフレーム画像を取り込みたい場合には,
フレーム画像を過去に遡って数フレーム分をバッファに蓄えておくとよい。バッファには
最新のフレーム画像が入り,1枚入るとバッファ中の最も古いフレーム画像が1枚消去さ
れる。
検索や編集にあたっては,代表画像で確認できたカットが,ビデオテープ等に記録され
ているオリジナルの動画像のどこにあるのかが,すぐに知れなくては意味がない。そこで
,オリジナルのビデオテープのフレーム番号やタイムコードを代表画像と関連づけて格納
する手段を設ける。また,そのカットがどれくらいの時間長なのか,テレビ等で放送され
た動画像ならば放送された実際の時刻や日付はいつなのか,といった関連情報も必要であ
る。時刻や日付は計算機に内蔵されている時計を読み出すことで簡単に得られるし,カッ
トの時間長は,隣接する2つの変化点の間の時刻もしくはフレーム番号の差分としてリア
ルタイムで計算できる。そこで,代表画像の格納の際に併せ,代表画像と関連づけて,こ
れらの情報も記憶するようにする。また,必要に応じて利用者が付加した各代表画像に対
応する属性情報も同じように,代表画像と関連づけて格納する。上記で示したような代表
画像と関連情報との関連づけは,例えば,一般的なディスクオペレーションシステム(DO
S)のファイル管理システムの下では,代表画像のファイルとファイル名が同じで拡張子
だけが異なるファイルを関連情報用に割り当てることで管理できる。具体的には,代表画
像をCUT00001.IMGで格納し,その画像に対応する時刻はCUT00001.TIM,時間長はCUT00001
.DURというように定義すればよい。
しかしながら,動画像は複数のカットから構成されるので,この方法では,ファイルの数
が多くなりすぎて管理しにくいという問題もある。そこで,単一のファイルの中で,これ
らの情報を管理するようにしてもよい。図11にファイル構造の例を示す。1100はヘ
ッダー情報であり,他のファイル形式との識別子や登録されているカットの総数といった
ファイル全体に関わる情報が入る。1102は,代表画像の格納アドレスのテーブルであ
り,各カットの代表画像のデータがファイル中のどの位置からに格納されているかを表す
オフセット値が,カットの総数分だけ順番に格納される。同様に,1104はタイムコー
ド,1106は属性情報に関するテーブルである。ほかにも関連情報を格納する場合には
,必要なだけ同様のテーブルが作成される。これらのテーブルの間では,それぞれのテー
ブルの先頭から数えて同じ位置に格納されているアドレス情報は,同じ代表画像に関する
情報となるように格納され,相互に対応がとれるようになっている。1108から111
8は,それぞれの情報を格納するデータ領域である。
ビデオや映画等の動画像をカット別に頭出しできる動画像編集システムの画面例を図1
2に示す。1はディスプレイ装置であり,1232は音声やBGM等を出力するスピーカ
,5はマウスやジョイステイツク等の間接的なポインティングデバイス,1234はキー
ボード,1230はタッチパネルのような直接的なポインティングデバイスである。
ディスプレイ装置1中のモニタウインドウ1210は,モニタ画面になっており,VT
Rと同形式の操作パネル1202があって,映像を自由に再生し視聴することができる。
モニタ画面に表示される映像が「本」における「本文」,パネル(ボタン)操作は「頁め
くり」に対応する。右下のウインドウ1208は,対象とする映像の各シーンの代表画像
のシーン一覧表示,右中のウインドウ1212は,その映像に登場する被写体の一覧表示
である。これらの一覧表示を総称して,「インデクス」と呼ぶ。ウインドウ1208のシ
ーン一覧表示は,本発明の動画像変化点検出方法を用いて,映像中の各シーンから典型的
なフレーム画像を選び,縮小して時間順にアイコン1210として一覧に並べたものであ
る。これらの画像はシーンの「見出し」に相当するものとして考えることができ,それら
を時系列に並べたシーン一覧は「本」の「目次」にあたる。一方,被写体は,シーンの重
要な構成要素の一つであり,その意味でテキストにおける「キーワード」に相当する。し
たがって,ウインドウ1212の被写体の一覧表示は,「索引」に当たる。シーン一覧表
示中のアイコン1210がマウスクリックされると,モニタ画面の映像が切り替わり,そ
のアイコンの示すシーンが再生される。被写体の一覧表示は,被写体が何であるかを示す
アイコン1214と,その右側の時間軸表示部(棒グラフ)1216から成る。時間軸表
示部(棒グラフ)は,左端が映像の先頭,右端が末尾を示す時間軸になっていて,棒とし
て表示された部分が,その被写体の現れている時間区間を示している。棒の部分をクリッ
クすると,その区間の映像をモニタ画面に表示する。尚,1204は,マウスのようなポ
インティングデバイスの動きに合わせて移動するカーソル,1206のウインドウは,映
像の各種関連情報を表示する汎用入出力ウインドウである。このような,GUIを用いる
ことにより,ユーザフレンドリな動画像編集が可能となる。
本発明は,放送局向けなどのハイエンドなシステムの他,ワークステーション(WS)
,パーソナルコンピュータ(PC)などに対しても,動画像編集プログラムの機能として
組込むことが出来る。また,VTRやTVなどの電子機器の一機能として実現することも
可能である。更に,ビデオオンデマンド(VOD)を実現する各種装置やシステムへの展
開も可能である。
本発明の実施例を実現するためのシステムブロック図である。 瞬間的な乱れにロバストな変化点検出アルゴリズムのフローチャートである。 瞬間的な乱れが発生した箇所を有する動画像の模式図である。 通常のカットの変わり目の箇所を有する動画像の模式図である。 複数のフレームに渡って乱れが発生した箇所を有する動画像の模式図である。 動画像の特徴に合わせて閾値が変化する変化点検出アルゴリズムのフローチャートである。 相関係数の時間推移の典型例を示した図である。 フレーム全体の明るさを求めるアルゴリズムのフローチャートである。 図2と図6のアルゴリズムを組み合わせた変化点検出アルゴリズムのフローチャートである。 音声信号の典型例を示した図である。 ファイル構造の例を示す図である。 動画像編集システムの画面例を示す図である。
符号の説明
1…ディスプレイ,2…制御信号線,3…A/D変換器,4…コンピュータ,5…入力
装置,6…外部情報記憶装置,7…CPU,8…接続インタフェース,9…メモリ,10
…動画像再生装置,1208…シーン一覧表示のためのウインドウ。

Claims (3)

  1. 連続する複数枚の画像よりなる動画像からカットの変わり目を検出する動画像の変化点検出装置において、
    対象となる動画像を処理装置に入力する手段と、
    前記入力されたフレーム毎に特徴量を取得する手段と、
    前記特徴量を用いてカットの変わり目を判定する判定手段と、
    上記カットの変わり目の判定がされた動画像を表示する表示手段と、
    前記表示手段に表示された動画像に対して、変化点の入力をさせる指示手段とを有することを特徴とする動画像の変化点検出装置。
  2. 請求項1に記載の動画像の変化点検出装置において、前記指示手段によって入力された前記変化点に対し、予め設定された時間分を差し引いた位置又は予め設定された時間分を足した位置を変化点として登録することを特徴とする動画像の変化点検出装置。
  3. 請求項1又は2に記載の動画像の変化点検出装置において、前記判定手段は、1のフレームの特徴量と直前のフレームで計算した特徴量との差分を第1の相関係数として求め、さらに該1のフレームの特徴量と2フレーム以上前のフレームで計算した特徴量との差分を第2の相関係数として求め、前記第1の相関係数と前記第2の相関係数の値が、所定の閾値を超えたとき、該1のフレームと2フレーム以上前のフレームとの間にカットの変わり目があったと判定することを特徴とする動画像の変化点検出装置。
JP2006316460A 2006-11-24 2006-11-24 動画像の変化点検出方法及び装置 Pending JP2007149095A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006316460A JP2007149095A (ja) 2006-11-24 2006-11-24 動画像の変化点検出方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006316460A JP2007149095A (ja) 2006-11-24 2006-11-24 動画像の変化点検出方法及び装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2004313212A Division JP3941808B2 (ja) 2004-10-28 2004-10-28 動画像の変化点検出方法及び装置

Publications (1)

Publication Number Publication Date
JP2007149095A true JP2007149095A (ja) 2007-06-14

Family

ID=38210376

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006316460A Pending JP2007149095A (ja) 2006-11-24 2006-11-24 動画像の変化点検出方法及び装置

Country Status (1)

Country Link
JP (1) JP2007149095A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009177550A (ja) * 2008-01-25 2009-08-06 Sony Corp シーン切り替わり点検出器、シーン切り替わり点検出方法、記録装置、イベント生成器、イベント生成方法、再生装置およびプログラム
JP2011165082A (ja) * 2010-02-12 2011-08-25 Omron Corp 監視装置および方法、並びにプログラム
JP2017110941A (ja) * 2015-12-14 2017-06-22 花王株式会社 評価方法、評価装置及びプログラム
US9691004B2 (en) 2014-07-02 2017-06-27 Fujitsu Limited Device and method for service provision according to prepared reference images to detect target object
KR101905128B1 (ko) 2017-03-13 2018-10-05 김창민 빛의 불규칙성을 기반으로 하는 동작영역 검출 제어 방법 및 그 방법을 이용한 동작영역 검출 장치

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009177550A (ja) * 2008-01-25 2009-08-06 Sony Corp シーン切り替わり点検出器、シーン切り替わり点検出方法、記録装置、イベント生成器、イベント生成方法、再生装置およびプログラム
US8320614B2 (en) 2008-01-25 2012-11-27 Sony Corporation Scene switching point detector, scene switching point detecting method, recording apparatus, event generator, event generating method, reproducing apparatus, and computer program
JP2011165082A (ja) * 2010-02-12 2011-08-25 Omron Corp 監視装置および方法、並びにプログラム
US9691004B2 (en) 2014-07-02 2017-06-27 Fujitsu Limited Device and method for service provision according to prepared reference images to detect target object
JP2017110941A (ja) * 2015-12-14 2017-06-22 花王株式会社 評価方法、評価装置及びプログラム
KR101905128B1 (ko) 2017-03-13 2018-10-05 김창민 빛의 불규칙성을 기반으로 하는 동작영역 검출 제어 방법 및 그 방법을 이용한 동작영역 검출 장치

Similar Documents

Publication Publication Date Title
JP3823333B2 (ja) 動画像の変化点検出方法、動画像の変化点検出装置、動画像の変化点検出システム
JP5539313B2 (ja) テレビジョン受像機および方法
US8935169B2 (en) Electronic apparatus and display process
JP4683031B2 (ja) 電子機器、コンテンツ分類方法及びそのプログラム
JPH09130732A (ja) シーンチェンジ検出方法および動画像編集装置
JP2007243699A (ja) 映像記録再生方法及び映像記録再生装置
US8363726B2 (en) Electronic apparatus, motion vector detecting method, and program therefor
KR20050026850A (ko) 이미지 디스플레이 방법, 이미지 디스플레이 프로그램 및이미지 디스플레이 장치
JPH0993588A (ja) 動画像処理方法
KR101318459B1 (ko) 수신기 상에서 오디오비주얼 문서를 시청하는 방법 및이러한 문서를 시청하기 위한 수신기
JP3240871B2 (ja) 映像要約方法
JP2007149095A (ja) 動画像の変化点検出方法及び装置
JP3941808B2 (ja) 動画像の変化点検出方法及び装置
JP2001119661A (ja) 動画編集システムおよび記録媒体
JP2016039496A (ja) 画像処理装置、画像処理システム、画像処理方法およびプログラム
JP4175622B2 (ja) 画像表示システム
US20180139493A1 (en) Method for setting the level of definition of the images of a multimedia programme
JP4205020B2 (ja) テレビカメラの制御方法及び画像記録装置の制御方法
JP2011101161A (ja) 撮像装置、その制御方法、再生装置およびプログラム
JP3906854B2 (ja) 動画像の特徴場面検出方法及び装置
JP3926497B2 (ja) インデックス画像表示装置
JPH0537853A (ja) 動画のカツト自動分割方法
KR101501244B1 (ko) 썸네일 생성 방법
JP2012222653A (ja) 映像再生装置、映像再生方法、および映像再生プログラム
JP4835540B2 (ja) 電子機器、映像特徴検出方法及びプログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080422

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080618

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080715

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080903

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081021

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090303