[go: up one dir, main page]

JP3636830B2 - Intelligent video camera and intelligent still camera - Google Patents

Intelligent video camera and intelligent still camera Download PDF

Info

Publication number
JP3636830B2
JP3636830B2 JP18069796A JP18069796A JP3636830B2 JP 3636830 B2 JP3636830 B2 JP 3636830B2 JP 18069796 A JP18069796 A JP 18069796A JP 18069796 A JP18069796 A JP 18069796A JP 3636830 B2 JP3636830 B2 JP 3636830B2
Authority
JP
Japan
Prior art keywords
representative image
image
recording
cut
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP18069796A
Other languages
Japanese (ja)
Other versions
JPH1028250A (en
Inventor
晃朗 長坂
孝文 宮武
勝美 谷口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP18069796A priority Critical patent/JP3636830B2/en
Publication of JPH1028250A publication Critical patent/JPH1028250A/en
Application granted granted Critical
Publication of JP3636830B2 publication Critical patent/JP3636830B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、ビデオカメラに係り、特に、撮影した映像内容を編集することが可能なデジタルビデオカメラに関する。
【0002】
【従来の技術】
子供の成長記録や各種行事の記録を主な目的として、家庭用ビデオカメラの普及が進んでいる。家庭用ビデオカメラでは、素人が撮影を行うため、必要以上に長く撮影したり、同じシーンを何度も撮り直したりして、非常に冗長で面白味のないテープができあがる場合が多い。そして、多くの人々は、後で改めて適当な編集を施すのが面倒なため、そのまま放置しているのが現状である。そのため、最近では、後で編集しなくてすむよう、撮影時から気を配る撮影技法が注目されている。また、業務用ビデオカメラにおいては、例えば、池上通信機からハードディスクに映像を記録するカメラが製品化され、撮影済みの映像を素早く呼び出して試し見できたり、不要なカット(ビデオカメラの録画スタートからストップまでの連続した一区間の映像をカットという。こうしたカットを複数撮影して組み合わせ、一本の映像作品を構成する)の削除といった簡易編集が可能となっている。
【0003】
【発明が解決しようとする課題】
しかしながら、編集を不要にする撮影技法は不慣れな人にはうまく行えず、また、上記業務用カメラの編集機能は、専門家が作業を効率的に行えるよう改善された程度で、まだ素人が使うには十分簡単とはいえない。また、撮影のときに、どのような映像の内容のカットを撮影したのか、または、どのカットが重要であるかは、紙などにメモしておく必要があり、その作業自体が煩雑であり、また、後で実際の録画テープとメモとの対応をとるのが更に面倒であった。
【0004】
ところで、静止画用のデジタルスチルカメラでは、すでに撮影した画像を縮小し、縮小した画像を複数まとめて画面に表示できるようなデジタルカメラが知られている。しかし、この従来技術では、撮影している画像を表示するモードと、縮小した画像を複数まとめて表示するモードとがあり、このモードをユーザが切り替え指示しなければ、縮小した画像を複数まとめて表示することができない。
【0005】
本発明の第一の目的は、撮影者が、撮影した映像もしくは静止画の内容を瞬時に把握できるようなインテリジェントビデオカメラ及びインテリジェントスチルカメラを提供することにある。
【0006】
本発明の第二の目的は、特別な編集機器を必要とせずに、インテリジェントビデオカメラ上で簡単に編集を行えるようにすることにある。
【0007】
【課題を解決するための手段】
上述した第一の目的を達成するため、本発明のインテリジェントビデオカメラは、任意の情景を動画として撮影する撮影手段と、前記撮影手段により撮影された動画を表示する表示手段と、前記撮影手段により撮影された動画を録画する録画手段と、前記録画手段により録画された動画から、当該動画の一部の静止画である代表画像を抽出する抽出手段と、前記抽出手段により抽出された代表画像を一覧にして表示する一覧表示手段とを設ける。
【0008】
本発明によれば、代表画像を一覧にして表示することができ、撮影者は代表画像をみることにより撮影した映像の内容を瞬時に把握することができる。
【0009】
また、本発明のインテリジェントスチルカメラは、任意の情景を静止画として撮影する撮影手段と、前記撮影手段により撮影された静止画を表示する表示手段と、前記撮影手段により撮影された静止画を記録する記録手段と、前記記録手段により記録された静止画を縮小する縮小手段と、前記縮小手段により縮小された静止画を一覧にして表示する一覧表示手段と、前記撮影手段の撮影の指示を受け付ける操作入力手段とを有し、前記縮小手段は、前記操作入力手段により前記撮影の指示が受け付けられたときに、前記撮影手段により撮影された新たな静止画を縮小し、前記一覧表示手段は、一覧にして表示している前記静止画のうちの一つを当該新たに縮小された静止画に更新する。
【0010】
本発明によれば、縮小画像を一覧にして表示することができ、撮影者は縮小画像をみることにより撮影した静止画の内容を瞬時に把握することができる。
【0011】
また、上述した第二の目的を達成するため、前記代表画像に関係する補助情報を作成する作成手段をさらに有し、前記一覧表示手段は、前記作成手段により作成された補助情報を、関係する当該代表画像に対応させて表示する。また、前記抽出手段は、前記操作入力手段により受け付けられた録画の開始の指示から終了の指示までに録画された一区間の動画であるカットから、前記代表画像を一つ抽出し、前記一覧表示手段により表示されている代表画像ごとに、当該代表画像に対応するカットの録画が有効であるか無効であるかを設定する設定手段をさらに有し、前記一覧表示手段は、前記設定手段により録画が有効であると設定されたカットに対応する代表画像に対応させて、当該カットの録画が有効であることを示す表示を行うことができる。また、前記録画手段により録画された動画の編集を行う編集手段と、前記編集手段により編集を行わせる旨の指示を受け付ける受付手段と、前記受付手段により前記指示が受け付けられたときに、前記編集手段の編集対象の代表画像を表示する編集対象表示手段とをさらに有するようにしてもよい。
【0012】
本発明によれば、インテリジェントビデオカメラ上で簡単に編集を行うことができる。
【0013】
【発明の実施の形態】
以下、本発明の第一の実施の形態を詳細に説明する。
【0014】
図1は、本発明を実現するためのシステム構成の概略ブロック図の一例を示している。図1に示す構成は、基本的には、現在汎用的に用いられているデジタルコンピュータ、特にノート型パソコンのシステム構成と同じように、CPU112、補助記憶装置110、メモリ114、ビデオメモリ116、D/Aコンバータ118、ディスプレイ120、及び、入力I/F122を備え、それに加わえて、撮影のためのレンズをはじめとする光学系100、光電変換素子などの撮像素子102、撮影した映像を圧縮伸張するためのデバイスである画像圧縮エンコーダ104及び画像伸長デコーダ106、及び、映像を外部に出力するためのアナログ出力124などが備わる。また、このようなシステム構成を備えるインテリジェントビデオカメラを、1つの筺体にコンパクトにまとめた場合の外観図を図2に示す。
【0015】
図1において、100は、光学系であり、撮影しようとする風景や人物などが撮像素子に正しく焦点を結ぶように調節する。この光学系には、ズームアップ撮影を行うための倍率調整機構も含まれる。どれだけのズーム倍率に設定したかなどの操作情報は、CPU112にも伝えられる。102は、撮像素子であり、光電変換を行って、撮影対象を電気的な信号に変える。104は、画像圧縮エンコーダであり、102で得られた電気信号を一枚の画像として取り込み、MPEGに代表される画像圧縮方法を用いてデータ量を削減し、圧縮後の画像を補助記憶装置110に格納させる。こうした画像の取り込みを、毎秒30回程度の頻度で繰り返すことで、連続的な動画として補助記憶装置に格納できる。音声については、マイク126とA/Dコンバータ128などによって取り込み、動画と対応づけて補助記憶装置110に格納することが可能である。光学系100、撮像素子102及び画像圧縮エンコーダ104により撮影手段を構成することができる。補助記憶装置110は、ハードディスク等の大容量記録装置であり、デジタルデータを半永久的に記録するための装置である。これは、PCMCIA方式のハードディスクカードのように記憶装置ごと本体から着脱できたり、あるいは、光磁気ディスク等のように、記録媒体のみを着脱できるタイプの記録装置であっても構わない。CPU112は、録画処理のスタート/ストップなどの制御をはじめ、本実施の形態で説明する機能を実現するためのソフトウエアプログラムを実行する。ソフトウエアプログラムは、メモリ114に常駐し、プログラムの実行に必要となる各種の変数の値やデータ類もここに必要に応じて格納される。ビデオメモリ116は、ディスプレイ120に表示される画像をデジタルデータとして格納している。118は、一般にRAMDACとも呼ばれている種類のD/Aコンバータであり、ビデオメモリ116に書かれたデータを走査線スピードに合わせて逐次読みとり、ディスプレイ120に描画する。したがって、ビデオメモリ116のデータを更新すると、その更新内容がディスプレイ120の表示内容に直ちに反映される。画像圧縮エンコーダ104に入力される撮影中の画像を、画像圧縮機能をバイパスして、直接、ビデオメモリ116に直接書き込むことも可能である。ディスプレイ120は、画像を表示するためのデバイスであり、例えば、小型のCRTやプラズマディスプレイであっても良いし、液晶タイプの表示デバイスであっても構わない。画像伸張デコーダ106は、補助記憶装置110に格納された圧縮された動画データを伸張し、伸長された画像としてビデオメモリ116上に展開する。また、アナログ出力124は、伸張した画像を、例えば、NTSC方式をはじめとする、テレビ受像機に広く用いられているアナログ映像信号に変換して出力する。この出力を現在、広く普及しているVHS方式などのビデオ機器に接続して記録することができる。音声も記録されている場合には、画像の伸張に同期させて、音声用D/Aコンバータ132及びスピーカー130などによって音声出力することもできる。入力I/F122は、情報入力デバイスであり、録画ボタンや再生ボタンなどのスイッチ類や、ディスプレイ120の表示面に貼られた透明なタッチパネルなどがある。入力I/F122を介して入力した入力情報は、CPU112に伝えられ、適宜処理される。108は、以上述べた各デバイス間を相互につなぐデータバスである。
【0016】
図2は、前述したように、インテリジェントビデオカメラの外観ならびに画面表示の一例を示している。図2において、インテリジェントビデオカメラ本体200は、レンズ部202と、表示機能とペン入力機能とを合わせ持った平面ディスプレイ206と、216などのボタン類の入力I/Fとを備える。レンズ部202により撮られた映像は、ディスプレイ206の中の部分領域208にそのまま表示され、撮影者が映像の内容を確認できるようになっている。レンズ部202を含む本体上部203は回転できるようになっていて、撮影者が、平面ディスプレイを見る角度を固定したまま、様々なアングルの情景や人物等を撮影することができる。また、204はズームを行うための操作スイッチであり、シーソースイッチになっていて、一方に倒すと連続的にズームアップし、もう一方に倒すと逆にワイド撮影になる。録画ボタン216を押すことで録画の開始/終了を指示でき、一度押すと録画が開始され、録画中にもう一度押すと録画が終了する。ディスプレイ右側の領域には、アイコン画像210が一覧になって表示される。これは、直前に撮影されたカットから各々一枚ずつ代表的なフレーム画像を選び、選んだフレーム画像を、代表画像としてアイコン化した画像である。このように、ディスプレイ206上に、録画中も常に直前に撮影したカットの一覧を表示しているので、これまでの撮影履歴が即座に確認でき、現在どういう形で撮影すればよいのかや、これからどういうカットを撮影していくべきかの判断が撮影しながら簡単にできる。また、第一の実施の形態においては、録画された時間やカットの時間長といった補助情報212をアイコンの下に合わせて表示し、そのカットがどういうカットかを思い起こすための情報を提供する。補助情報212としては、GPS(Global Positioning System)等により撮影した場所が得られる場合には、場所の情報を用いることができる。これらにより、素人でも無駄のない撮影が可能になり、後で大きな映像編集をしなくても、視聴に耐えられる映像が記録できるようになる。また、撮影した映像の流れを見失うことがないので、1つのカットの撮影中に次に撮るべきカットのイメージが浮かび、次のカットの撮影にスムーズに移行できて時間が節約できるとともに、ストーリーの流れにも破綻が生じにくい。一方、撮影中以外は、カーソルボタン218を使って、アイコン一覧の中から任意のアイコンを強調表示224に示すような強調表示にすることができる。カーソルボタン218を押すと、現在強調表示されているアイコンの強調表示が消え、押された方向に対応する隣り合う別のアイコンが強調表示される。このアイコンが強調表示された状態で右カーソルボタン218の操作等によって、映像のプレイバックが指示されると、強調表示されたアイコンに対応するカットが部分領域208にプレイバックされる。図2に示すインテリジェントビデオカメラの構成例では、220と222は汎用ボタンであり、カメラの各種の動作の決定に汎用的に用いることができる。214は、ペンであり、表示デバイス上の任意の位置をポイントしたり、後述する注釈情報を入力したりするのに用いる。ペンとタッチパネルとの組み合わせは、現在のパーソナルコンピュータで広く用いられているマウスなどのポインティングデバイスと基本的に等価であり、マウスとカーソル表示の組み合わせでも代替可能である。そのため、以下では、情報入力は、ペン入力だけに限定せず、ポインティングデバイスによる入力全般を考える。また、編集モードボタン226を押すと、後述する簡易編集モードになり、カットの並べ替えやトリミングといった簡単な編集ができる。
【0017】
図3は、図2に示すインテリジェントビデオカメラ200における主な処理の流れを表す状態遷移図である。これらの処理はプログラムとしてメモリ114に格納され、CPU112によって実行される。
【0018】
図3において、インテリジェントビデオカメラ200の電源が投入されると、まず初期化処理300によって、各種のデバイスの初期化が行われ、光学系から入力された映像がディスプレイにそのまま表示される状態にシステムを設定する。また、直前に撮影されたカットが補助記憶装置内に残っている場合には、それらのカットの各代表画像を一覧表示し、最も新しく撮られた代表画像に表示を更新し、最新の代表画像のアイコンを強調表示する。そして、302の待機状態では、いずれかのボタンが押されるか、ポインティングデバイスによる入力があるまで何もしない。録画ボタン216が押されると、カメラは録画状態304に遷移する。光学系から入力された映像を画像圧縮しながら補助記憶装置の所定の記憶領域に記録し続ける。空き領域がなくなれば警告を発して自動的に録画を終了する。補助記憶装置への記録方法については、ここでは現在のコンピュータが一般的に用いているディスクオペレーションシステム等のファイル管理方式に準拠するものとする。1つのカットの映像データは、補助記憶装置の中では1つのファイルとして記録される。
【0019】
図4に、カットごとにファイル管理を行う場合の管理テーブル1000を示す。図4において、カットごとにシリアルナンバーがカット番号1010として付加され、後述する、カットの映像データ及びその映像データに関する情報を記憶するための映像データ構造体500の記憶位置を示すポインタ1020と、そのカットにおける代表画像を識別するためのフレーム番号1030とがカットのシリアルナンバーに対応させて記憶される。この管理テーブル1000によりファイルを管理することができる。
【0020】
また、カットの映像に関する情報を記憶する補助記憶装置の映像データ構造体の一例を図5に示す。これを映像データ構造体500と称する。図5において、502は、映像のヘッダー情報であり、画像圧縮の方式、画像の縦横のサイズといった伸張に必要な情報が含まれる。504は、そのカットの録画が有効か無効かを示すフラグであり詳細については後述する。510は、映像データのデータ量を示し、このあとに続く映像データ512が何バイトあるのかを示す。これにより、映像の種類によって画像圧縮されたデータサイズが変化しても、映像データ512の後に記憶される注釈情報と記憶する注釈構造体関係のデータがどこに記録されているかが計算できる。映像データ512は、カットを構成する一枚一枚の静止画、すなわちフレーム画像と、音声のデータとを有する。各フレームには固有のシリアル番号(以下、フレーム番号と呼ぶ)が付けられており、そのフレーム番号も映像データに含まれる。トリミング開始点506及びトリミング終了点508は、カット中の映像の一区間を指定するために利用し、トリミング開始点506はカット中の映像の一区間の開始位置のフレーム番号を示し、トリミング終了点508は一区間の終了位置のフレーム番号を示す。フラグ504とトリミング開始点506とトリミング終了点508とは、後述する簡易映像編集の際に用いられる。簡易編集時に、トリミングされたカットの再生をするときには、カットの最初からではなく、トリミング開始点から終了点までの区間についてのみ再生を行う。514は、データ構造体で示されるカットに対応づけられた注釈の数であり、516は、その注釈情報のデータへのポインタである。注釈情報は1つずつファイルとして管理し、ポインタとは、具体的には、そのファイルの記憶位置を一意に特定するための識別コードである。
【0021】
注釈情報は、例えば、ポインティングデバイスを用いて表示画面上の任意位置に任意の線画図形を描くことで行う。線画図形の中には文字も含まれる。ポインティングデバイスが、特にペンデバイスの場合には、表示画像が印刷された一枚の紙の上にペンで絵を描くのと等価になる。こうした描画処理を行うプログラムそのものについては、市販の図形処理ソフトウエアを利用することができ、描画処理プログラムにより表示画面上の線図の色及び座標が描画情報として獲得される。
【0022】
この描画処理プログラムによって得られた描画情報を記録格納する注釈構造体400のデータ形式の例を図6に示す。図6において、対応フレーム番号402は、注釈が加えられたフレーム番号が入る。表示フラグ404は、カット再生中に注釈情報を表示するかどうかを示すフラグであり、フラグがセットされている場合に注釈情報を表示する。カットの再生中、CPU112は、カット中のどのフレームを現在伸張し表示しているかを管理しており、表示するフレーム番号が402に格納された値と一致した場合に、表示フラグ404がセットされているときに、408から420までのデータによって表現される注釈情報を表示画面上に重畳して描画することができる。表示時間406には、再生中のフレーム番号が対応フレーム番号402の値と一致してから、どれくらいの時間表示しつづけるかを示す値が入る。デフォルトは5秒程度の固定値を入れるようにし、ユーザが特に希望するときだけ変更できるインタフェースを別個設けることができる。例えば、注釈情報の入力時に汎用ボタン220を押下したときに、カーソルボタン218により表示時間406を5秒より長くしたり短くしたり設定するようにできる。408から420までのデータが描画する線画データであり、色コード408は描画する線の色を表すコード番号である。410〜416は、いわゆるポリゴンの座標データ列であり、線分区切り符号418が現れるまでに記述された座標を順番に直線で結ぶ。また、終端記号420が現れるまでに記述されたポリゴンの数だけ描画を行う。これらのポリゴンによって、任意の文字や図形を表現することができる。この注釈情報は、一種のテロップやタイトル文字としての利用ができる。通常のテロップは、映像そのものを書き換えることを前提にした合成方法であるが、こうしたテロップは映像そのものに変更を加えないので、簡単に合成内容の変更や取り消しができる。例えば、撮影現場でとりあえず付けた手書きの文字を、後から活字体に変更するといったことができる。
【0023】
また、注釈情報としては、線画図形のほか、図1に示すマイク126とA/Dコンバータ128とを使って入力できる音声を用いてもよい。具体的には、注釈をつけたいフレームで、ユーザがペンで描くかわりに、マイクで注釈を録音する。注釈構造体には、ポリゴンデータの代わりにデジタル音声データが入る。
【0024】
図3において、CPU112は、録画状態で録画ボタンが押されると直ちに録画を終了し、映像データサイズ510などの、録画が終了するまで確定しなかった情報を図5に示す映像データ構造体500内に記録する。次に、たった今録画が終了したカットについて代表画像を抽出し(306)、図4に示す管理テーブル1000の代表画像のフレーム番号1020に、抽出した代表画像のフレーム番号を記録する。つぎに、代表画像一覧表示において、最も長い時間表示している代表画像を最新に抽出した代表画像に更新して表示し、また、その更新した代表画像を強調表示し(308)、待機状態に戻る。代表画像としては、カットの先頭、末尾、もしくは半分の位置などの予め定めた位置のフレーム画像をデフォルトとして取得する。
【0025】
ここでは、録画終了後に代表画像の抽出および一覧表示への追加を行う例を示しているが、録画開始と同時にその先頭の画像を代表画像として抽出して一覧表示に加える形でもよい。
【0026】
図3において、待機状態(302)で上カーソルボタン218が押されると、一覧表示の中で強調表示されているカットの一つ上のカットに強調表示が移る(310)。逆に下カーソルボタンが押されると、同様に一つ下のカットに強調表示が移る。これにより一覧表示された任意のカットを強調表示させることができる。ここで、直前に撮影したカットの数が一覧表示用の画面領域に収まらない場合は、画面をスクロールさせることによって、表示しきれないカットの代表画像を表示できるようにする。
【0027】
また、待機状態(302)で右カーソルボタン218が押されると、再生が指示されたとして、強調表示された代表画像に対応するカットについて先頭から再生を開始する(312)。この再生状態でさらに右カーソルが押されると、早送りが指示されたとして、その再生位置から直ちに早送り再生に切り替わる(314)。この早送り再生の状態で、なにかボタンが押されるとその早送り再生から直ちに通常再生に戻る。また、通常再生状態(312)で、左カーソルボタンが押されると、一時停止が指示されたとして、そのときの再生位置でスチル(一時停止)状態になる(316)。このスチル状態でポインティングデバイスから入力があると、それを注釈情報とし、このときの再生位置のフレーム番号に対応づけて、注釈情報を図6に示す注釈構造体400に記録する(318)。スチル状態316で右カーソルボタンが押されると、再生が指示されたとして、その位置から通常再生に戻る。もし、右カーソルボタン以外のボタンが押されたのならば待機状態に戻る。カット再生中の状態(312、314)では、カットの最後まで再生が終わると直ちに待機状態に戻るほか、いずれの状態でも録画ボタンが押されると、304の録画状態に遷移する。
【0028】
第一の実施の形態におけるインテリジェントビデオカメラ200では、以上のように状態遷移して処理される。
【0029】
第一の実施の形態によれば、録画中も常に直前の撮影したカットの代表画像の一覧が表示されているので、これまでの撮影履歴が即座に確認でき、現在どういう形で撮影すればよいのかや、これからどういうカットを撮影していくべきかの判断が撮影しながら簡単にできる。また、撮影中に気になった事柄を、注釈として簡単に映像と対応づけて記述でき、また、その部分を素早く見つけられるので、後で編集を行いたい場合に、どのカットを使うかの判断がしやすくなるとともに、そのカットを即座に呼び出すことができる。
【0030】
また、ディスプレイ206に表示されるカットの一覧表示において、上述したように、代表画像として先頭や末尾といった固定位置のフレーム画像を用いることとしたが、もっとカットの内容を把握しやすい部分のフレーム画像を用いてもよい。例えば、注釈情報が付けられたフレームを代表画像に用い、さらに、その注釈情報をその代表画像に重畳表示する。注釈を付けたフレームは、カットの中でも、ユーザが特に重要であると判断したフレームであり、その画像が一覧に表示されているほうが、カットの中身が思い出しやすくなるからである。また、カットの中にズームなどのカメラ操作がある場合には、操作を行った後の安定して撮られた部分から代表画像を抽出したほうがよい。このようにするのは、そうしたカメラ操作を行った後には、撮影したい対象が定まって的確に撮影されている場合が多いためである。
【0031】
前述した実施の形態においては、カットの先頭、末尾、もしくは半分の位置などの予め定めた位置のフレーム画像を代表画像として抽出していたが、他の抽出方法を以下に示す。
【0032】
図7に、カメラ操作終了後の映像から代表画像を抽出する場合の処理の流れを示す。図7においては、カットの中にズーム操作があった後に、映像が安定している(映像が静止している状態に近い)部分から代表画像を抽出する場合の処理を示す。この場合、画像が安定している部分の画像を抽出するために、所定の時間差がある二つのフレーム画像間の相違度が予め定めた閾値より小さい場合の一つのフレーム画像を代表画像としている。
【0033】
図7において、変数frは、代表画像のフレーム番号を示し、初期値として先頭のフレーム番号0を代入することにより初期化処理を行う(ステップ600)。撮像素子から画像が入力されると(ステップ602)、CPU112によって入力されているカットのファイルを管理するために、図4に示す管理テーブル1000にカット番号1010および映像データ構造体のポインタ1020が登録される。また、画像の入力が始まると、画像圧縮処理(ステップ604)と、表示のためのビデオメモリへの転送処理(ステップ606)とを並行して行う。ステップ604とステップ606との処理は、CPU112を用いずに、専用のハードウエアで行うようにしてもよい。専用のハードウエアで行ったほうがパフォーマンスが良くなる。ステップ604で圧縮された画像データは、映像データ構造体のポインタ1020が示す補助記録装置の空き領域に映像データ構造体500に示すような形式で記録される(ステップ608)。そして、代表画像を決定するために、圧縮前の画像データを使って画像認識処理を行い、映像が静止して撮影されているかどうかを調べる。ここでは、圧縮される前の画像から色ヒストグラムを求め(ステップ610)、予め定めた時間であるt1秒前の撮影画像から同様にして求めた色ヒストグラムと比較する(ステップ612)。比較には、ヒストグラム間の各度数の自乗和等の予め定めた方法により相違度を求め、その相違度が予め設定した閾値より大きければ(ステップ614)、静止していないとして処理ステップ620に移る。相違度が小さければ、直前にズーム操作があったかどうかをチェックし(ステップ616)、あれば現在録画書き込み中のフレーム番号をfrに代入して代表画像とする(ステップ618)。直前にズーム操作があったかどうかは、ズームボタン204が押された時刻を記憶し、その時刻と現在の時刻との差分が十分小さいかどうかを判定することで知ることができる。もし録画終了の指示がなければ(ステップ620)、ステップ602に戻って録画処理を継続する。録画終了の指示があれば、フレーム番号frの画像を代表画像としてアイコン化する(ステップ622)。そして、代表画像の一覧表示に追加し、図2に示すような強調表示を行う。カットの中に、ズーム操作がない場合や、相違度が閾値より大きい場合には、初期値である先頭のフレーム番号0が代表画像とされる。
【0034】
このように処理することにより、カットの中にズーム操作があった後に、映像が安定している部分から代表画像を抽出することができる。
【0035】
図8は、図2に示すインテリジェントビデオカメラにおいて簡単な映像編集を行うための画面例である。図2に示す本体の編集ボタン226が押されると、簡易編集モードとなり、ディスプレイ画面206が図8に示すような表示に変わる。もう一度編集ボタン226を押すと、図2に示すような録画再生モードの表示に戻る。ここでは、カットの選択、並び替え及びトリミングの3点の編集操作について説明する。700は、モニタ領域であり、録画済みの任意のカットを再生表示する。702は、スクロールバー領域であり、この領域の横幅が、表示中のカットの全時間長に対応する。領域702の任意の位置を、ポインティングデバイスによりポイントすると、全幅とポイント位置との相対的な位置関係から、対応する位置のフレーム画像に表示が切り替わる。704は、録画済みのカットの各々の代表画像の一覧表示を行う表示領域である。カットの数がこの領域に表示しきれないほど多いときには、スクロールによって表示しきれなかった代表画像を適宜表示できるようスクロールバー706を用意する。表示領域704に表示される代表画像は、前述の注釈情報が対応づけられたフレームの画像であったり、カメラ操作が終わった後の安定して撮影された状態の画像であってもよい。あるいは、少なくとも1つは注釈情報が対応づけられているカットの代表画像を表示するようにして必要となるカットを探しやすくすることができる。同様の目的のため、すべてのカットの代表画像を一覧表示した場合に、注釈情報が対応づけられているカットの代表画像を強調表示712に示すように強調して表示するようにしてもよい。この場合、注釈情報がないカットの代表画像でも一覧にあるので、注釈情報がないカットの代表画像が見つからなくなる心配はない。最終的な編集映像の組み立ては編集領域708で行う。表示領域704に表示されている代表画像は、ポインティングデバイスによる、いわゆるドラッグ操作でグラフィカルに移動できるようにする。編集領域708は初期状態では空白領域であり、代表画像がドラッグされて移動してくるに従い、選ばれた代表画像だけから構成される代表画像列が形成される。編集領域に一覧に並べられた代表画像列の順番にしたがって代表画像に対応するカットを順次再生することで最終的な編集済み映像が得られる。選ばれた代表画像に対応するカットの映像データ構造体500には、有効フラグ504に有効を示す値がセットされる。例えば、選ばれなかった代表画像のカットの映像データ構造体500の有効フラグ504には、無効であることを示す値として0がセットされる。それ以上の数値ならば有効であると規定する。編集領域に並んだ代表画像をドラッグによって入れ替える場合には、編集映像上でのカットの再生の順番の並べ替えに対応させる。このときのカットの再生の順番は、代表画像列の並んだ順番に対応させて、例えば、有効フラグ504に1から順にシリアル番号を書き込んでおくことで記憶する。また、カットのトリミングを行う場合は、モニタ700で映像を確認しながらトリミングの開始点のフレーム画像をスクロールバー702を用いて選び、そのフレーム画像が表示されているときに、トリミング開始点を指示する予め定めた本体のボタン、例えば、図2に示す汎用ボタン220が押されると、そのフレーム画像をトリミングの開始点とする。その開始点のフレーム番号は、図5に示す映像データ構造体中のトリミング開始点506に記録される。同様に、モニタ700で映像を確認しながらトリミングの終了点のフレーム画像をスクロールバー702を用いて選び、そのフレーム画像が表示されているときに、トリミング終了点を指示する予め定めた本体のボタン、例えば、図2に示す汎用ボタン222が押されると、そのフレーム画像をトリミングの終了点とする。トリミング終了点のフレーム番号は、図5に示す映像データ構造体中のトリミング終了点508に記録される。トリミングされたカットの再生をするときには、カットの最初からではなく、トリミング開始点から終了点までの区間についてのみ行う。
【0036】
または、各々のカットごとに録画の有効/無効を指示するようにしてもよい。例えば、図8に示すモニタ領域700において、各カットをモニタして調べていき、再生中に、図2に示す汎用ボタン220が押されるとそのカットは有効であるとされ、図2に示す汎用ボタン222が押されるとそのカットは無効であるというように規定しておくことができる。
【0037】
さらに、編集の指示後に、録画再生モードに切り替わり、再度、簡易編集モードに切り替わったときには、映像データ構造体の有効フラグが0ならば領域704に代表画像を表示し、映像データ構造体の有効フラグが1以上ならば、編集領域708に代表画像を順番に表示していくようにすることができる。
【0038】
また、映像データを外部の映像編集システムに転送できるような出力手段をさらに備えることにより、外部の映像編集システムにおいて編集することも可能になる。この場合に、録画が有効であると設定されたカットのみを外部に出力するようにしてもよい。これにより、外部の映像編集システムでは有効なカットのみを編集することができる。
【0039】
以上説明したように、第一の実施の形態によれば、簡単な編集がビデオカメラ上で可能になる。
【0040】
以上で述べた例では、動画を記録するビデオカメラについて述べたが、本発明はそれに限定されるものではなく、例えば、静止画写真を電子的に記録するスチルカメラにも適用できる。この場合を第二の実施の形態として以下に説明する。第二の実施の形態では、上述した第一の実施の形態中のカットがスチルカメラで撮影された静止画に、その静止画を縮小して一覧に並べたものが代表画像一覧に対応する。この場合、スチルカメラは、任意の情景を静止画として撮影する撮影手段と、前記撮影手段により撮影された静止画を表示する表示手段と、前記撮影手段により撮影された静止画を記録する記録手段と、前記記録手段により記録された静止画を縮小する縮小手段と、前記縮小手段により縮小された静止画を一覧にして表示する一覧表示手段と、前記撮影手段の撮影の指示を受け付ける操作入力手段とを有し、前記縮小手段は、前記操作入力手段により前記撮影の指示が受け付けられたときに、前記撮影手段により撮影された新たな静止画を縮小し、前記一覧表示手段は、一覧にして表示している前記静止画のうちの一つを当該新たに縮小された静止画に更新する。
【0041】
第二の実施の形態によれば、静止画撮影の際も、直前に撮ったカメラアングルや被写体の表情を確認しながら、次の撮影イメージを決めることが可能になる。また、前述した実施の形態と同様に、注釈情報を入力させたり、補助情報を作成したり、簡易編集モードを備えるようにできる。これにより検索や写真整理が簡単になる。
【0042】
【発明の効果】
本発明によれば、録画中も常に直前の撮影したカットの代表画像の一覧が表示されているので、これまでの撮影履歴が即座に確認でき、現在どういう形で撮影すればよいのかや、これからどういうカットを撮影していくべきかの判断が撮影しながら簡単にできる。また、撮影中に気になった事柄を、注釈として簡単に映像と対応づけて記述でき、また、その部分を素早く見つけられるので、後で編集を行いたい場合に、どのカットを使うかの判断がしやすくなるとともに、そのカットを即座に呼び出すことができる。また、ビデオカメラにアイコンを使ったグラフィカルな編集機能を具備したことにより、ビデオカメラ上での編集が簡単に行えるようになる。
【図面の簡単な説明】
【図1】本発明を実現するためのシステム構成図の一例である。
【図2】本発明におけるシステムの外観ならびに画面表示の一例を表す図である。
【図3】本発明におけるシステムの動作フローを表す状態遷移図の一例を表す図である。
【図4】本発明におけるシステムで作成される管理テーブルの構造の一例を表す図である。
【図5】本発明におけるシステムで作成される映像データの構造の一例を表す図である。
【図6】本発明におけるシステムで作成される注釈のデータ構造の一例を表す図である。
【図7】代表画像を決定する処理のフローチャートの一例である。
【図8】編集用の画面表示図の一例である。
【符号の説明】
100…光学系、102…撮像素子、102…画像圧縮エンコーダ、106…画像伸張デコーダ、108…バス、110…補助記憶装置、112…CPU、114…メモリ、116…ビデオメモリ、118…D/Aコンバータ、120…ディスプレイ、122…入力I/F、124…アナログ出力。
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a video camera, and more particularly to a digital video camera capable of editing captured video content.
[0002]
[Prior art]
Household video cameras are becoming popular for the purpose of recording children's growth and various events. In home video cameras, amateurs often shoot, so often they take longer than necessary or re-take the same scene over and over, resulting in very redundant and uninteresting tapes. And since many people are troublesome to make appropriate edits later, they are left as they are. For this reason, recently, a photographing technique that pays attention to from the time of photographing has attracted attention so that it is not necessary to edit later. In commercial video cameras, for example, a camera that records video from Ikegami Tsushinki to the hard disk has been commercialized, and you can quickly call up video that has already been shot for trial viewing or unnecessary cuts (from video camera recording start) It is possible to make simple edits such as deleting a video from one continuous section until the stop, which is called “cut.”
[0003]
[Problems to be solved by the invention]
However, photography techniques that do not require editing cannot be performed well by inexperienced people, and the editing functions of the above-mentioned professional cameras have been improved so that specialists can work efficiently, and are still used by amateurs. It's not easy enough. In addition, it is necessary to make a note of what kind of video content was shot at the time of shooting, or which cut is important, on paper etc., and the work itself is complicated. Further, it was more troublesome to take correspondence between the actual recording tape and the memo later.
[0004]
By the way, as a digital still camera for still images, there is known a digital camera that can reduce an already captured image and display a plurality of reduced images collectively on a screen. However, in this prior art, there are a mode for displaying a photographed image and a mode for displaying a plurality of reduced images at a time. If the user does not instruct switching of this mode, a plurality of reduced images are collected at a time. It cannot be displayed.
[0005]
A first object of the present invention is to provide an intelligent video camera and an intelligent still camera that allow a photographer to instantly grasp the contents of a captured video or still image.
[0006]
A second object of the present invention is to enable easy editing on an intelligent video camera without the need for special editing equipment.
[0007]
[Means for Solving the Problems]
In order to achieve the first object described above, an intelligent video camera of the present invention includes a photographing unit that photographs an arbitrary scene as a moving image, a display unit that displays a moving image photographed by the photographing unit, and the photographing unit. Recording means for recording a captured video, extraction means for extracting a representative image that is a still image of a part of the moving picture from the video recorded by the recording means, and representative images extracted by the extraction means List display means for displaying as a list is provided.
[0008]
According to the present invention, it is possible to display a list of representative images, and the photographer can instantly grasp the contents of the captured video by viewing the representative images.
[0009]
In addition, the intelligent still camera of the present invention records a still image photographed by the photographing means for photographing an arbitrary scene as a still image, a display means for displaying a still image photographed by the photographing means, and the photographing means. Receiving means, a reduction means for reducing the still images recorded by the recording means, a list display means for displaying a list of still images reduced by the reduction means, and an instruction for shooting by the shooting means An operation input unit, and the reduction unit reduces a new still image shot by the shooting unit when the shooting instruction is received by the operation input unit, and the list display unit includes: One of the still images displayed as a list is updated to the newly reduced still image.
[0010]
According to the present invention, the reduced images can be displayed as a list, and the photographer can instantly grasp the content of the captured still image by viewing the reduced images.
[0011]
In order to achieve the second object described above, the information processing apparatus further includes creation means for creating auxiliary information related to the representative image, and the list display means relates to auxiliary information created by the creation means. The corresponding representative image is displayed. The extraction unit extracts one representative image from a cut that is a moving image of one section recorded from a recording start instruction to an end instruction received by the operation input unit, and displays the list display For each representative image displayed by the means, there is further provided a setting means for setting whether the recording of the cut corresponding to the representative image is valid or invalid, and the list display means is configured to record by the setting means. It is possible to display that the recording of the cut is effective in association with the representative image corresponding to the cut set to be effective. An editing unit that edits the video recorded by the recording unit; a receiving unit that receives an instruction to perform editing by the editing unit; and the editing unit that receives the instruction when the receiving unit receives the instruction. You may make it further have an edit object display means which displays the representative image of the edit object of a means.
[0012]
According to the present invention, editing can be easily performed on an intelligent video camera.
[0013]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, a first embodiment of the present invention will be described in detail.
[0014]
FIG. 1 shows an example of a schematic block diagram of a system configuration for realizing the present invention. The configuration shown in FIG. 1 is basically the same as the system configuration of a digital computer currently used for general purposes, in particular, a notebook personal computer, CPU 112, auxiliary storage device 110, memory 114, video memory 116, D An A / A converter 118, a display 120, and an input I / F 122, in addition to the optical system 100 including a lens for photographing, an imaging element 102 such as a photoelectric conversion element, and a compressed video. For example, an image compression encoder 104 and an image expansion decoder 106, and an analog output 124 for outputting video to the outside. Further, FIG. 2 shows an external view when intelligent video cameras having such a system configuration are compactly combined into one housing.
[0015]
In FIG. 1, reference numeral 100 denotes an optical system which adjusts so that a landscape or a person to be photographed correctly focuses on the image sensor. This optical system also includes a magnification adjustment mechanism for performing zoom-up photography. The operation information such as how much zoom magnification is set is also transmitted to the CPU 112. Reference numeral 102 denotes an image sensor, which performs photoelectric conversion to change an imaging target into an electrical signal. An image compression encoder 104 captures the electric signal obtained in 102 as a single image, reduces the amount of data using an image compression method typified by MPEG, and stores the compressed image in the auxiliary storage device 110. To store. By repeating such image capturing at a frequency of about 30 times per second, the image can be stored in the auxiliary storage device as a continuous moving image. The sound can be captured by the microphone 126 and the A / D converter 128 and stored in the auxiliary storage device 110 in association with the moving image. The optical system 100, the image sensor 102, and the image compression encoder 104 can constitute a photographing unit. The auxiliary storage device 110 is a large-capacity recording device such as a hard disk, and is a device for semi-permanently recording digital data. This may be a recording device that can be attached to and detached from the main body together with a storage device such as a PCMCIA hard disk card, or a type of recording device that can attach and detach only a recording medium such as a magneto-optical disk. The CPU 112 executes a software program for realizing the functions described in the present embodiment, including control such as start / stop of recording processing. The software program is resident in the memory 114, and various variable values and data necessary for the execution of the program are stored therein as necessary. The video memory 116 stores an image displayed on the display 120 as digital data. Reference numeral 118 denotes a D / A converter of a type generally called RAMDAC, which sequentially reads data written in the video memory 116 in accordance with the scanning line speed and draws it on the display 120. Therefore, when the data in the video memory 116 is updated, the updated content is immediately reflected in the display content on the display 120. It is also possible to directly write the image being shot input to the image compression encoder 104 directly into the video memory 116, bypassing the image compression function. The display 120 is a device for displaying an image, and may be, for example, a small CRT or a plasma display, or a liquid crystal type display device. The image expansion decoder 106 expands the compressed moving image data stored in the auxiliary storage device 110 and expands it on the video memory 116 as an expanded image. The analog output 124 converts the decompressed image into an analog video signal widely used in television receivers such as the NTSC system, and outputs the analog video signal. This output can be recorded by connecting to video equipment such as the VHS system that is currently widely used. When audio is also recorded, the audio can be output by the audio D / A converter 132 and the speaker 130 in synchronization with the expansion of the image. The input I / F 122 is an information input device, and includes switches such as a recording button and a playback button, a transparent touch panel pasted on the display surface of the display 120, and the like. The input information input via the input I / F 122 is transmitted to the CPU 112 and processed as appropriate. Reference numeral 108 denotes a data bus that interconnects the devices described above.
[0016]
FIG. 2 shows an example of the appearance and screen display of the intelligent video camera as described above. 2, the intelligent video camera body 200 includes a lens unit 202, a flat display 206 having both a display function and a pen input function, and an input I / F of buttons such as 216. The video taken by the lens unit 202 is displayed as it is in the partial area 208 in the display 206 so that the photographer can check the content of the video. The upper part 203 of the main body including the lens unit 202 can be rotated, and the photographer can photograph scenes and people at various angles while fixing the angle at which the flat display is viewed. Reference numeral 204 denotes an operation switch for zooming, which is a seesaw switch. When it is tilted to one side, it zooms in continuously, and when it is tilted to the other side, wide shooting is performed. By pressing the recording button 216, the start / end of recording can be instructed. When pressed once, recording starts, and when pressed again during recording, recording ends. In the area on the right side of the display, icon images 210 are displayed as a list. This is an image in which one representative frame image is selected from each of the cuts taken immediately before, and the selected frame image is converted into an icon as a representative image. In this way, since the list of cuts taken immediately before is always displayed on the display 206 during recording, the shooting history so far can be confirmed immediately, what form should be taken now, You can easily determine what kind of cut you should shoot while shooting. In the first embodiment, auxiliary information 212 such as the recorded time and the cut time length is displayed below the icon to provide information for recalling what kind of cut the cut is. As the auxiliary information 212, location information can be used when a location photographed by GPS (Global Positioning System) or the like is obtained. As a result, it is possible for even an amateur to shoot without waste, and it is possible to record a video that can be viewed without having to edit a large video later. Also, since you won't lose sight of the flow of the video you shot, the image of the next cut to be taken comes up during the shooting of one cut, and you can move smoothly to the next cut to save time and save time. The flow is also less likely to fail. On the other hand, when the camera is not being photographed, any icon can be highlighted from the icon list using the cursor button 218 as shown in the highlight display 224. When the cursor button 218 is pressed, the highlighted display of the currently highlighted icon disappears, and another adjacent icon corresponding to the pressed direction is highlighted. When video playback is instructed by operating the right cursor button 218 or the like with the icon highlighted, a cut corresponding to the highlighted icon is played back in the partial area 208. In the configuration example of the intelligent video camera shown in FIG. 2, reference numerals 220 and 222 denote general-purpose buttons, which can be used for general determination of various operations of the camera. Reference numeral 214 denotes a pen, which is used for pointing an arbitrary position on the display device and inputting annotation information to be described later. A combination of a pen and a touch panel is basically equivalent to a pointing device such as a mouse widely used in current personal computers, and can be replaced by a combination of a mouse and a cursor display. Therefore, in the following, information input is not limited to pen input, but general input by a pointing device is considered. When the edit mode button 226 is pressed, a simple edit mode described later is entered, and simple editing such as cut rearrangement and trimming can be performed.
[0017]
FIG. 3 is a state transition diagram showing a main processing flow in the intelligent video camera 200 shown in FIG. These processes are stored as a program in the memory 114 and executed by the CPU 112.
[0018]
In FIG. 3, when the intelligent video camera 200 is powered on, first, various devices are initialized by an initialization process 300, and the system enters a state in which video input from the optical system is displayed as it is on the display. Set. Also, if the cuts that were taken immediately before remain in the auxiliary storage device, each representative image of those cuts is displayed in a list, the display is updated to the latest representative image, and the latest representative image is displayed. Highlight the icon. In the standby state 302, nothing is performed until any button is pressed or an input is made by the pointing device. When the recording button 216 is pressed, the camera transitions to the recording state 304. The video input from the optical system is continuously recorded in a predetermined storage area of the auxiliary storage device while compressing the image. When there is no free space, a warning is issued and recording is automatically terminated. Here, the recording method to the auxiliary storage device is based on a file management method such as a disk operation system generally used by current computers. One cut of video data is recorded as one file in the auxiliary storage device.
[0019]
FIG. 4 shows a management table 1000 when file management is performed for each cut. In FIG. 4, a serial number is added as a cut number 1010 for each cut, and a pointer 1020 indicating a storage position of a video data structure 500 for storing video data of the cut and information related to the video data, which will be described later, The frame number 1030 for identifying the representative image in the cut is stored in correspondence with the serial number of the cut. Files can be managed by this management table 1000.
[0020]
FIG. 5 shows an example of a video data structure of an auxiliary storage device that stores information related to the cut video. This is referred to as a video data structure 500. In FIG. 5, reference numeral 502 denotes video header information, which includes information necessary for decompression, such as an image compression method and a vertical and horizontal size of an image. Reference numeral 504 denotes a flag indicating whether the recording of the cut is valid or invalid, and details thereof will be described later. 510 indicates the data amount of the video data, and indicates how many bytes of the video data 512 that follows. As a result, even if the data size of the compressed image changes depending on the type of video, it is possible to calculate where the annotation information stored after the video data 512 and the data related to the annotation structure to be stored are recorded. The video data 512 includes each still image constituting a cut, that is, a frame image and audio data. Each frame has a unique serial number (hereinafter referred to as a frame number), and the frame number is also included in the video data. The trimming start point 506 and the trimming end point 508 are used for designating one section of the video being cut. The trimming start point 506 indicates the frame number of the start position of one section of the video being cut, and the trimming end point. Reference numeral 508 denotes a frame number at the end position of one section. The flag 504, the trimming start point 506, and the trimming end point 508 are used for simple video editing described later. When replaying a trimmed cut during simple editing, only the section from the trimming start point to the end point is replayed, not from the beginning of the cut. 514 is the number of annotations associated with the cut indicated by the data structure, and 516 is a pointer to the data of the annotation information. The annotation information is managed as a file one by one, and the pointer is specifically an identification code for uniquely specifying the storage position of the file.
[0021]
The annotation information is performed, for example, by drawing an arbitrary line drawing figure at an arbitrary position on the display screen using a pointing device. Characters are also included in the line drawing figure. When the pointing device is a pen device in particular, it is equivalent to drawing a picture with a pen on a piece of paper on which a display image is printed. As the program itself for performing such drawing processing, commercially available graphic processing software can be used, and the color and coordinates of the diagram on the display screen are acquired as drawing information by the drawing processing program.
[0022]
FIG. 6 shows an example of the data format of the annotation structure 400 that records and stores drawing information obtained by this drawing processing program. In FIG. 6, a corresponding frame number 402 is a frame number to which an annotation is added. A display flag 404 is a flag indicating whether or not annotation information is displayed during cut reproduction. When the flag is set, the annotation information is displayed. During playback of the cut, the CPU 112 manages which frame being cut is currently expanded and displayed. When the frame number to be displayed matches the value stored in 402, the display flag 404 is set. The annotation information represented by the data from 408 to 420 can be drawn superimposed on the display screen. In the display time 406, a value indicating how long the display is continued after the frame number being reproduced matches the value of the corresponding frame number 402 is entered. The default is set to a fixed value of about 5 seconds, and a separate interface that can be changed only when the user specifically desires can be provided. For example, when the general-purpose button 220 is pressed when inputting the annotation information, the display time 406 can be set longer or shorter than 5 seconds by the cursor button 218. Data 408 to 420 are line drawing data to be drawn, and a color code 408 is a code number representing the color of the line to be drawn. Reference numerals 410 to 416 denote so-called polygon coordinate data strings, in which coordinates described before the line segment delimiter code 418 appears are connected in a straight line in order. Further, drawing is performed for the number of polygons described until the terminal symbol 420 appears. Arbitrary characters and figures can be expressed by these polygons. This annotation information can be used as a kind of telop or title character. Ordinary telop is a composition method based on the premise that the video itself is rewritten. However, since such telop does not change the video itself, the composition content can be easily changed or canceled. For example, handwritten characters added at the shooting site can be changed to a typeface later.
[0023]
In addition to the line drawing figure, the annotation information may be voice that can be input using the microphone 126 and the A / D converter 128 shown in FIG. Specifically, in the frame to be annotated, the user records the annotation with a microphone instead of drawing with a pen. The annotation structure contains digital audio data instead of polygon data.
[0024]
In FIG. 3, the CPU 112 immediately ends the recording when the recording button is pressed in the recording state, and stores information such as the video data size 510 that has not been determined until the recording ends in the video data structure 500 shown in FIG. 5. To record. Next, a representative image is extracted for the cut that has just been recorded (306), and the frame number of the extracted representative image is recorded in the frame number 1020 of the representative image in the management table 1000 shown in FIG. Next, in the representative image list display, the representative image that has been displayed for the longest time is updated and displayed as the latest extracted representative image, and the updated representative image is highlighted (308) to enter a standby state. Return. As a representative image, a frame image at a predetermined position such as the top, end, or half position of a cut is acquired as a default.
[0025]
Here, an example is shown in which the representative image is extracted and added to the list display after the end of recording. However, the head image may be extracted as a representative image and added to the list display simultaneously with the start of recording.
[0026]
In FIG. 3, when the up cursor button 218 is pressed in the standby state (302), the highlighted display moves to a cut one higher than the cut highlighted in the list display (310). On the contrary, when the down cursor button is pressed, the highlighted display moves to the next lower cut in the same manner. As a result, any cut displayed in a list can be highlighted. Here, when the number of cuts taken immediately before does not fit in the list display screen area, the representative image of the cut that cannot be displayed can be displayed by scrolling the screen.
[0027]
When the right cursor button 218 is pressed in the standby state (302), it is assumed that the reproduction is instructed, and the reproduction corresponding to the highlighted representative image is started from the beginning (312). When the right cursor is further pressed in this playback state, it is assumed that fast forward is instructed, and the playback position is immediately switched to fast forward playback (314). In this fast forward playback state, when any button is pressed, normal playback is immediately resumed from the fast forward playback. If the left cursor button is pressed in the normal reproduction state (312), it is assumed that a pause is instructed, and a still (pause) state is set at the reproduction position at that time (316). When there is an input from the pointing device in this still state, it is used as annotation information, and the annotation information is recorded in the annotation structure 400 shown in FIG. 6 in association with the frame number of the reproduction position at this time (318). When the right cursor button is pressed in the still state 316, it is assumed that the reproduction is instructed, and the normal reproduction is resumed from that position. If any button other than the right cursor button is pressed, the process returns to the standby state. In the state during the cut reproduction (312, 314), when the reproduction is completed to the end of the cut, the state immediately returns to the standby state, and when the recording button is pressed in any state, the recording state transitions to 304.
[0028]
In the intelligent video camera 200 in the first embodiment, the state transition is performed as described above.
[0029]
According to the first embodiment, since a list of representative images of the last shot taken is always displayed during recording, the shooting history so far can be checked immediately, and what type of shooting should be taken now You can easily determine what kind of cut you should shoot while shooting. Also, you can easily describe what you were interested in as an annotation by associating it with the video, and you can quickly find that part, so you can decide which cut to use when you want to edit later. This makes it easier to remove and allows you to call the cut immediately.
[0030]
In the list display of cuts displayed on the display 206, as described above, a frame image at a fixed position such as the beginning or end is used as a representative image. However, a frame image of a portion that makes it easier to grasp the contents of the cut. May be used. For example, a frame with annotation information is used as a representative image, and the annotation information is superimposed on the representative image. This is because the annotated frame is a frame that the user determines to be particularly important in the cut, and the contents of the cut are easier to remember when the image is displayed in the list. In addition, when there is a camera operation such as zooming in the cut, it is better to extract the representative image from the stably taken part after the operation. This is because, after such a camera operation is performed, the target to be photographed is often determined and photographed accurately.
[0031]
In the above-described embodiment, a frame image at a predetermined position such as the top, end, or half position of a cut is extracted as a representative image. Other extraction methods are described below.
[0032]
FIG. 7 shows the flow of processing when a representative image is extracted from the video after the camera operation is completed. FIG. 7 shows processing when a representative image is extracted from a portion where the video is stable (close to the state where the video is still) after the zoom operation is performed in the cut. In this case, in order to extract an image of a portion where the image is stable, one frame image when the difference between two frame images having a predetermined time difference is smaller than a predetermined threshold is used as a representative image.
[0033]
In FIG. 7, a variable fr indicates the frame number of the representative image, and initialization processing is performed by substituting the first frame number 0 as an initial value (step 600). When an image is input from the image sensor (step 602), a cut number 1010 and a video data structure pointer 1020 are registered in the management table 1000 shown in FIG. 4 in order to manage the cut file input by the CPU 112. Is done. When image input starts, image compression processing (step 604) and transfer processing to a video memory for display (step 606) are performed in parallel. The processing in step 604 and step 606 may be performed by dedicated hardware without using the CPU 112. Performance will be better if you use dedicated hardware. The image data compressed in step 604 is recorded in the free space of the auxiliary recording device indicated by the video data structure pointer 1020 in the format as shown in the video data structure 500 (step 608). Then, in order to determine the representative image, an image recognition process is performed using the image data before compression, and it is checked whether or not the video is taken still. Here, a color histogram is obtained from the image before compression (step 610), and compared with a color histogram obtained in the same manner from a photographed image t1 seconds before the predetermined time (step 612). For comparison, the degree of difference is obtained by a predetermined method such as the sum of squares of the frequencies between histograms. If the degree of difference is larger than a preset threshold value (step 614), the process proceeds to processing step 620 as not stationary. . If the dissimilarity is small, it is checked whether or not there has been a zoom operation immediately before (step 616). If the difference is small, the frame number currently being recorded is substituted for fr to be a representative image (step 618). Whether or not the zoom operation has been performed immediately before can be known by storing the time when the zoom button 204 is pressed and determining whether or not the difference between the time and the current time is sufficiently small. If there is no instruction to end recording (step 620), the process returns to step 602 to continue the recording process. If there is an instruction to end the recording, the image of the frame number fr is iconified as a representative image (step 622). Then, in addition to the list display of representative images, highlighting as shown in FIG. 2 is performed. If there is no zoom operation in the cut or if the degree of difference is greater than the threshold, the initial frame number 0, which is the initial value, is set as the representative image.
[0034]
By performing processing in this way, a representative image can be extracted from a portion where the video is stable after a zoom operation is performed in the cut.
[0035]
FIG. 8 shows an example of a screen for performing simple video editing in the intelligent video camera shown in FIG. When the edit button 226 on the main body shown in FIG. 2 is pressed, the simple edit mode is entered, and the display screen 206 changes to a display as shown in FIG. When the edit button 226 is pressed again, the display returns to the recording / reproducing mode as shown in FIG. Here, a description will be given of three-point editing operations of cut selection, rearrangement, and trimming. Reference numeral 700 denotes a monitor area, which reproduces and displays an arbitrary recorded cut. Reference numeral 702 denotes a scroll bar area, and the horizontal width of this area corresponds to the total time length of the cut being displayed. When an arbitrary position in the area 702 is pointed by the pointing device, the display is switched to the frame image at the corresponding position from the relative positional relationship between the full width and the point position. A display area 704 displays a list of representative images of each recorded cut. When the number of cuts is too large to be displayed in this area, a scroll bar 706 is prepared so that a representative image that cannot be displayed by scrolling can be displayed as appropriate. The representative image displayed in the display area 704 may be an image of a frame associated with the above-described annotation information, or an image in a stably captured state after the camera operation is finished. Alternatively, it is possible to make it easy to find a necessary cut by displaying a representative image of the cut to which at least one annotation information is associated. For the same purpose, when the representative images of all the cuts are displayed as a list, the representative images of the cuts associated with the annotation information may be highlighted and displayed as shown in the highlight display 712. In this case, since the representative images of cuts without annotation information are also in the list, there is no concern that the representative images of cuts without annotation information will not be found. The final editing video is assembled in the editing area 708. The representative image displayed in the display area 704 can be moved graphically by a so-called drag operation using a pointing device. The editing area 708 is a blank area in the initial state, and as the representative image is dragged and moved, a representative image sequence including only the selected representative image is formed. A final edited video is obtained by sequentially reproducing the cuts corresponding to the representative images according to the order of the representative image sequences arranged in the list in the editing area. In the cut video data structure 500 corresponding to the selected representative image, a value indicating validity is set in the validity flag 504. For example, 0 is set as a value indicating invalidity in the valid flag 504 of the video data structure 500 of the representative image cut that has not been selected. It is stipulated that it is effective if the value is higher than that. When the representative images lined up in the editing area are replaced by dragging, the order of cut reproduction on the edited video is rearranged. The order of cut reproduction at this time is stored by, for example, writing serial numbers in order from 1 in the valid flag 504 in correspondence with the order in which the representative image sequences are arranged. When trimming a cut, the frame image at the trimming start point is selected using the scroll bar 702 while confirming the video on the monitor 700, and the trimming start point is indicated when the frame image is displayed. When a predetermined body button such as the general-purpose button 220 shown in FIG. 2 is pressed, the frame image is set as a trimming start point. The frame number of the start point is recorded at the trimming start point 506 in the video data structure shown in FIG. Similarly, a frame image at the end point of trimming is selected using the scroll bar 702 while checking the video on the monitor 700, and a button of a predetermined main body for instructing the end point of trimming when the frame image is displayed. For example, when the general-purpose button 222 shown in FIG. 2 is pressed, the frame image is set as the trimming end point. The frame number of the trimming end point is recorded at the trimming end point 508 in the video data structure shown in FIG. When the trimmed cut is reproduced, it is performed not only from the beginning of the cut but only from the trimming start point to the end point.
[0036]
Alternatively, it may be instructed to enable / disable recording for each cut. For example, in the monitor area 700 shown in FIG. 8, each cut is monitored and examined, and when the general-purpose button 220 shown in FIG. 2 is pressed during playback, the cut is considered to be valid. It can be specified that when the button 222 is pressed, the cut is invalid.
[0037]
Further, after the editing instruction, when switching to the recording / playback mode and switching to the simple editing mode again, if the valid flag of the video data structure is 0, the representative image is displayed in the area 704, and the valid flag of the video data structure is displayed. If the value is 1 or more, the editing area 70 8 The representative images can be displayed in order.
[0038]
Further, by further providing an output means that can transfer the video data to an external video editing system, it is possible to perform editing in the external video editing system. In this case, only the cut set as valid for recording may be output to the outside. Thereby, only an effective cut can be edited in the external video editing system.
[0039]
As described above, according to the first embodiment, simple editing can be performed on the video camera.
[0040]
In the example described above, a video camera that records a moving picture has been described. However, the present invention is not limited to this, and can be applied to, for example, a still camera that electronically records a still picture. This case will be described below as a second embodiment. In the second embodiment, the representative image list corresponds to a still image obtained by cutting the still image in the first embodiment described above with a still camera and reducing the still image in a list. In this case, the still camera includes an imaging unit that captures an arbitrary scene as a still image, a display unit that displays a still image captured by the imaging unit, and a recording unit that records the still image captured by the imaging unit. A reduction unit that reduces the still image recorded by the recording unit, a list display unit that displays a list of still images reduced by the reduction unit, and an operation input unit that receives a shooting instruction from the imaging unit The reduction means reduces a new still image taken by the photographing means when the photographing instruction is received by the operation input means, and the list display means makes a list. One of the displayed still images is updated to the newly reduced still image.
[0041]
According to the second embodiment, it is possible to determine the next photographed image while confirming the camera angle taken immediately before and the facial expression of the subject during still image photography. Further, as in the embodiment described above, it is possible to input annotation information, create auxiliary information, and provide a simple editing mode. This makes it easy to search and organize photos.
[0042]
【The invention's effect】
According to the present invention, since a list of representative images of the last shot taken is always displayed even during recording, the shooting history so far can be confirmed immediately, what form should be taken now, and You can easily determine what kind of cut you should shoot while shooting. Also, you can easily describe what you were interested in as an annotation by associating it with the video, and you can quickly find that part, so you can decide which cut to use when you want to edit later. This makes it easier to remove and allows you to call the cut immediately. In addition, since the video camera has a graphical editing function using icons, editing on the video camera can be easily performed.
[Brief description of the drawings]
FIG. 1 is an example of a system configuration diagram for realizing the present invention;
FIG. 2 is a diagram illustrating an example of an appearance of a system and a screen display in the present invention.
FIG. 3 is a diagram illustrating an example of a state transition diagram representing an operation flow of a system according to the present invention.
FIG. 4 is a diagram showing an example of the structure of a management table created by the system according to the present invention.
FIG. 5 is a diagram illustrating an example of the structure of video data created by the system according to the present invention.
FIG. 6 is a diagram illustrating an example of a data structure of an annotation created by the system according to the present invention.
FIG. 7 is an example of a flowchart of processing for determining a representative image.
FIG. 8 is an example of a screen display diagram for editing.
[Explanation of symbols]
DESCRIPTION OF SYMBOLS 100 ... Optical system, 102 ... Image pick-up element, 102 ... Image compression encoder, 106 ... Image expansion decoder, 108 ... Bus, 110 ... Auxiliary storage device, 112 ... CPU, 114 ... Memory, 116 ... Video memory, 118 ... D / A Converter 120 ... Display 122 ... Input I / F 124 ... Analog output

Claims (4)

任意の情景を動画として撮影する撮影手段と、
前記撮影手段により撮影された動画を撮影中に表示する表示手段と、
前記撮影手段により撮影された動画を録画する録画手段と、
前記録画手段の録画の開始と終了との指示を受け付ける操作入力手段と、
前記操作入力手段により受け付けられた録画の開始の指示から終了の指示までに録画された一区間の動画であるカットの中から、静止画である代表画像を抽出する抽出手段と、
前記操作入力手段により録画の開始と終了との指示を受け付けるごとに、前記抽出手段により抽出された代表画像を一覧にして、上記撮影された動画とともに上記表示手段に表示する一覧表示手段と、
操作者より受け付けた前記一覧表示手段に表示されている代表画像を選択する行為に従って、前記一覧表示手段に表示されている代表画像ごとに、当該選択された代表画像に対応するカットの録画を外部に出力する旨の指示を受け付ける編集指示入力手段と、
前記編集指示入力手段において選択された代表画像に対応するカットのみを外部に出力する出力手段とを有することを特徴とするインテリジェントビデオカメラ。
Photographing means for photographing an arbitrary scene as a movie;
Display means for displaying a moving picture taken by the photographing means during photographing ;
Recording means for recording the moving picture taken by the photographing means;
Operation input means for accepting instructions to start and end recording by the recording means;
An extraction means for extracting a representative image that is a still image from a cut that is a moving image of one section recorded from an instruction to start recording to an instruction to end received by the operation input means;
A list display means for displaying a list of representative images extracted by the extraction means and displaying them on the display means together with the captured moving image each time an instruction to start and end recording is received by the operation input means;
In accordance with the act of selecting the representative image displayed on the list display means received from the operator, the recording of the cut corresponding to the selected representative image is externally recorded for each representative image displayed on the list display means. Editing instruction input means for receiving an instruction to output to,
An intelligent video camera comprising: output means for outputting only a cut corresponding to the representative image selected by the editing instruction input means to the outside.
請求項1において、
操作者より受け付けた前記一覧表示手段により表示されている代表画像を選択する行為に従って、前記一覧表示手段に表示されている代表画像から、当該代表画像に対応するカットの再生を受け付ける再生指示入力手段と、
前記再生指示入力手段において選択された代表画像に対応するカットを再生する再生手段とをさらに有することを特徴とするインテリジェントビデオカメラ。
In claim 1,
Reproduction instruction input means for accepting reproduction of a cut corresponding to the representative image from the representative image displayed on the list display means in accordance with an action of selecting the representative image displayed by the list display means received from an operator When,
An intelligent video camera, further comprising: a reproducing unit that reproduces a cut corresponding to the representative image selected by the reproduction instruction input unit.
請求項1又は2において、前記代表画像に関係する補助情報を作成する作成手段をさらに有し、
前記一覧表示手段は、前記作成手段により作成された補助情報を、関係する当該代表画像に対応させて表示することを特徴とするインテリジェントビデオカメラ。
In Claim 1 or 2, it further has a creation means for creating auxiliary information related to the representative image,
The intelligent video camera characterized in that the list display means displays the auxiliary information created by the creating means in correspondence with the related representative image.
請求項1、2又は3において、前記抽出手段は、前記操作入力手段により録画の開始もしくは終了の指示が受け付けられたときに、新たな代表画像を抽出し、前記一覧表示手段は、一覧にして表示している前記代表画像のうち、最も長い時間表示している前記代表画像を、前記抽出手段により新たに抽出された当該代表画像に更新することを特徴とするインテリジェントビデオカメラ。4. The method according to claim 1, wherein the extraction unit extracts a new representative image when an instruction to start or end recording is received by the operation input unit, and the list display unit makes a list. An intelligent video camera characterized in that, among the displayed representative images, the representative image displayed for the longest time is updated to the representative image newly extracted by the extracting means.
JP18069796A 1996-07-10 1996-07-10 Intelligent video camera and intelligent still camera Expired - Fee Related JP3636830B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP18069796A JP3636830B2 (en) 1996-07-10 1996-07-10 Intelligent video camera and intelligent still camera

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP18069796A JP3636830B2 (en) 1996-07-10 1996-07-10 Intelligent video camera and intelligent still camera

Publications (2)

Publication Number Publication Date
JPH1028250A JPH1028250A (en) 1998-01-27
JP3636830B2 true JP3636830B2 (en) 2005-04-06

Family

ID=16087735

Family Applications (1)

Application Number Title Priority Date Filing Date
JP18069796A Expired - Fee Related JP3636830B2 (en) 1996-07-10 1996-07-10 Intelligent video camera and intelligent still camera

Country Status (1)

Country Link
JP (1) JP3636830B2 (en)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3590826B2 (en) 1996-09-18 2004-11-17 株式会社ニコン Video equipment
JP4697273B2 (en) * 1998-09-04 2011-06-08 株式会社日立製作所 Recording apparatus, recording method, reproducing apparatus, reproducing method, and recording medium
US6424795B1 (en) 1999-07-05 2002-07-23 Hitachi, Ltd. Method and apparatus for recording and reproducing video data, and recording medium
JP2001134253A (en) * 1999-11-02 2001-05-18 Plus Property Corp Image display device having editing function
JP2001313861A (en) * 2000-02-21 2001-11-09 Fujitsu Ltd Image capturing device, data management device, medium, and program
JP4497761B2 (en) * 2001-07-18 2010-07-07 キヤノン株式会社 Image processing apparatus and index creation method
JP4217472B2 (en) 2002-12-13 2009-02-04 キヤノン株式会社 Image processing apparatus, image processing method, and computer-readable storage medium
JP2004304642A (en) 2003-03-31 2004-10-28 Casio Comput Co Ltd Electronic camera and image reproducing device
JP2005311878A (en) * 2004-04-23 2005-11-04 Olympus Corp Camera and its control method
JP2006174188A (en) 2004-12-17 2006-06-29 Casio Comput Co Ltd Motion picture recording apparatus and motion picture recording method
JP2006288912A (en) * 2005-04-14 2006-10-26 Ge Medical Systems Global Technology Co Llc Ultrasonic diagnostic device and image display method
US8732175B2 (en) 2005-04-21 2014-05-20 Yahoo! Inc. Interestingness ranking of media objects
US10210159B2 (en) 2005-04-21 2019-02-19 Oath Inc. Media object metadata association and ranking
JP4637045B2 (en) * 2006-03-27 2011-02-23 三洋電機株式会社 Imaging device
CN101867679B (en) 2006-03-27 2013-07-10 三洋电机株式会社 Thumbnail generating apparatus and image shooting apparatus
JP4998026B2 (en) 2007-03-15 2012-08-15 ソニー株式会社 Image processing apparatus, imaging apparatus, image display control method, and computer program
JP5092469B2 (en) 2007-03-15 2012-12-05 ソニー株式会社 Imaging apparatus, image processing apparatus, image display control method, and computer program
JP4743264B2 (en) * 2008-12-08 2011-08-10 株式会社ニコン Recording / playback device
KR101452667B1 (en) 2011-03-16 2014-10-22 페킹 유니버시티 Superimposed annotation output
JP5889028B2 (en) 2012-02-13 2016-03-22 キヤノン株式会社 Moving picture recording apparatus, control method therefor, computer program, and storage medium
JP5920785B2 (en) * 2012-12-20 2016-05-18 日本電信電話株式会社 Experience record system, experience record method, and experience record program
JP6150538B2 (en) * 2013-01-30 2017-06-21 キヤノン株式会社 Movie recording apparatus and control method thereof

Also Published As

Publication number Publication date
JPH1028250A (en) 1998-01-27

Similar Documents

Publication Publication Date Title
JP3636830B2 (en) Intelligent video camera and intelligent still camera
US6683649B1 (en) Method and apparatus for creating a multimedia presentation from heterogeneous media objects in a digital imaging device
US8127232B2 (en) Method and apparatus for editing heterogeneous media objects in a digital imaging device
JP3192663B2 (en) Video collection device
JP3715690B2 (en) Multimedia data filing system
JP5701017B2 (en) Movie playback apparatus, movie playback method, computer program, and storage medium
JP6367334B2 (en) Video processing method, apparatus, and playback apparatus
JP3708854B2 (en) Media production support device and program
KR100967551B1 (en) Method and device for linking multimedia data
JP4892074B2 (en) Electronic device, image output method and program
JP3919237B2 (en) Image recording / reproducing apparatus, image reproducing apparatus, and method thereof
JP2002176613A (en) Moving image editing unit, moving image editing method and recording medium
JP3870123B2 (en) Image processing apparatus, image processing method, program, and recording medium
US20020197058A1 (en) Recording apparatus
US7058286B2 (en) Information input apparatus
JP2006101076A (en) Method and device for moving picture editing and program
JP3287814B2 (en) Video playback device
CN113261302B (en) Electronic device
JP2006173795A (en) Edit apparatus, edit method, and edit program
JP4314527B2 (en) Editing apparatus, editing method, and editing program
JP2009047721A (en) Display control device, display control method and program
JP3426997B2 (en) Editing video shooting method and apparatus with subject information acquisition function, and storage medium storing program describing the method
JP3103442B2 (en) Electronic still camera and playback device thereof
JP2002016871A (en) Video editing method and video editing apparatus, and recording medium storing computer program for performing video editing
JPH11177928A (en) Information recording and reproducing device

Legal Events

Date Code Title Description
A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050106

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080114

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090114

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090114

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100114

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110114

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110114

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120114

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130114

Year of fee payment: 8

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

LAPS Cancellation because of no payment of annual fees