JP4427600B1 - 映像解析装置およびプログラム - Google Patents
映像解析装置およびプログラム Download PDFInfo
- Publication number
- JP4427600B1 JP4427600B1 JP2008305359A JP2008305359A JP4427600B1 JP 4427600 B1 JP4427600 B1 JP 4427600B1 JP 2008305359 A JP2008305359 A JP 2008305359A JP 2008305359 A JP2008305359 A JP 2008305359A JP 4427600 B1 JP4427600 B1 JP 4427600B1
- Authority
- JP
- Japan
- Prior art keywords
- still image
- section
- content
- boundary
- detection means
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
- G11B27/034—Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/35—Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
- H04H60/37—Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for identifying segments of broadcast information, e.g. scenes or extracting programme ID
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/56—Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
- H04H60/58—Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54 of audio
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/56—Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
- H04H60/59—Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54 of video
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Television Signal Processing For Recording (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
Abstract
【課題】テレビ放送において本編であってもチャンネルロゴなどの静止画がない部分がある場合であっても、コンテンツの内容の種類(コンテンツの本編またはコマーシャルメッセージ)が変化する位置を正確に検出する。
【解決手段】コンテンツの映像フレームに出現する略同一な静止画の群である静止画グループが存在する区間または静止画グループが存在しない区間であるかどうかに加えて、コンテンツを構成する映像フレームのうち単一色の映像フレームとコンテンツを構成する音声の音量が一定の閾値を下回る無音区間との少なくとも一方の情報も用いて、コンテンツの内容の種類が変化する位置を検出する。これにより、テレビ放送において本編であってもチャンネルロゴなどの静止画がない部分がある場合であっても、コンテンツの内容の種類(コンテンツの本編またはコマーシャルメッセージ)が変化する位置を正確に検出することができる。
【選択図】 図7
【解決手段】コンテンツの映像フレームに出現する略同一な静止画の群である静止画グループが存在する区間または静止画グループが存在しない区間であるかどうかに加えて、コンテンツを構成する映像フレームのうち単一色の映像フレームとコンテンツを構成する音声の音量が一定の閾値を下回る無音区間との少なくとも一方の情報も用いて、コンテンツの内容の種類が変化する位置を検出する。これにより、テレビ放送において本編であってもチャンネルロゴなどの静止画がない部分がある場合であっても、コンテンツの内容の種類(コンテンツの本編またはコマーシャルメッセージ)が変化する位置を正確に検出することができる。
【選択図】 図7
Description
本発明は、テレビ番組の録画時にコマーシャルメッセージを録画しないようにするCMカットに用いられる映像解析機能を有する映像解析装置およびプログラムに関する。
テレビ番組の前後や番組の途中に、短い広告放送であるコマーシャルメッセージ(CM:commercial message)が流されることは、民間放送においては一般的なこととなっている。例えば、日本のテレビ放送における個々のCMの長さは、15秒、30秒、60秒など15秒を基本としている。
一方、近年においては、磁気ディスク等の記憶媒体に対して効率良く記憶するなどの目的で、テレビ番組の録画時にCMを録画しないようにするCMカット機能を備えた録画装置が開発されている(例えば、特許文献1参照)。
特許文献1記載の録画装置によれば、画像にチャンネルロゴなどの静止画が含まれている区間をテレビ番組の本編と判断してそれ以外をCMと判断するようにしている。これにより、CM時間が日本のように15秒、30秒のように規則的ではないヨーロッパ諸国などにおけるテレビ放送においてもCMカット機能を実現することができる。
ところで、実際のテレビ放送においては、本編でもチャンネルロゴなどの静止画がない部分がある。そのため、特許文献1記載の録画装置に開示された技術では、本編でもチャンネルロゴなどの静止画がない部分については、テレビ番組の本編にもかかわらず静止画がないためにCMと誤判定してしまう、という問題がある。
本発明は、上記に鑑みてなされたものであって、テレビ放送において本編であってもチャンネルロゴなどの静止画がない部分がある場合であっても、コンテンツの内容の種類(コンテンツの本編またはコマーシャルメッセージ)が変化する位置を正確に検出することができる映像解析装置およびプログラムを提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明の映像解析装置は、映像および音声で構成されるコンテンツの映像フレームに出現する一定期間継続して表示される表示画像である静止画を検出し、検出した略同一な前記静止画が出現する区間を静止画グループとしてまとめる静止画検出手段と、前記コンテンツを構成する前記映像フレームのうち単一色の映像フレームを検出する単色検出手段と、前記コンテンツを構成する音声の音量が一定の閾値を下回る無音区間を検出する無音検出手段との少なくともいずれか一方を実行する特徴検出手段と、前記静止画グループが存在する区間と前記静止画グループが存在しない区間とのそれぞれに含まれる前記単一色の映像フレームまたは前記無音区間の少なくとも一方の情報から、前記コンテンツの内容の種類が変化する位置を検出する境界位置検出手段と、を備える。
また、本発明のプログラムは、コンピュータを、映像および音声で構成されるコンテンツの映像フレームに出現する一定期間継続して表示される表示画像である静止画を検出し、検出した略同一な前記静止画が出現する区間を静止画グループとしてまとめる静止画検出手段と、前記コンテンツを構成する前記映像フレームのうち単一色の映像フレームを検出する単色検出手段と、前記コンテンツを構成する音声の音量が一定の閾値を下回る無音区間を検出する無音検出手段との少なくともいずれか一方を実行する特徴検出手段と、前記静止画グループが存在する区間と前記静止画グループが存在しない区間とのそれぞれに含まれる前記単一色の映像フレームまたは前記無音区間の少なくとも一方の情報から、前記コンテンツの内容の種類が変化する位置を検出する境界位置検出手段と、として機能させる。
本発明によれば、テレビ放送において本編であってもチャンネルロゴなどの静止画がない部分がある場合であっても、コンテンツの内容の種類(コンテンツの本編またはコマーシャルメッセージ)が変化する位置を正確に検出することができる、という効果を奏する。
以下に添付図面を参照して、この発明にかかる映像解析装置およびプログラムの最良な実施の形態を詳細に説明する。
本発明の実施の一形態を図1ないし図10に基づいて説明する。本実施の形態は映像解析装置としてパーソナルコンピュータを適用した例である。
図1は、本発明の実施の一形態にかかる映像解析装置100の構成を示すブロック図である。映像解析装置100は、情報処理を行うCPU(Central Processing Unit)101、BIOSなどを記憶した読出し専用メモリであるROM(Read Only Memory)102、各種データを書換え可能に記憶するRAM(Random Access Memory)103、各種データベースとして機能するとともに各種のプログラムを格納するHDD(Hard Disk Drive)104、記憶媒体110を用いて情報を保管したり外部に情報を配布したり外部から情報を入手するためのDVDドライブ等の媒体読取装置105、ネットワーク200を介して外部の他のコンピュータと通信により情報を伝達するための通信制御装置106、処理経過や結果等を操作者に表示するLCD(Liquid Crystal Display)等の表示部107、並びに操作者がCPU101に命令や情報等を入力するためのキーボードやマウス等の入力部108等から構成されており、これらの各部間で送受信されるデータをバスコントローラ109が調停して動作する。
このような映像解析装置100では、ユーザが電源を投入するとCPU101がROM102内のローダーというプログラムを起動させ、HDD104よりOS(Operating System)というコンピュータのハードウェアとソフトウェアとを管理するプログラムをRAM103に読み込み、このOSを起動させる。このようなOSは、ユーザの操作に応じてプログラムを起動したり、情報を読み込んだり、保存を行ったりする。OSのうち代表的なものとしては、Windows(登録商標)等が知られている。これらのOS上で走る動作プログラムをアプリケーションプログラムと呼んでいる。なお、アプリケーションプログラムは、所定のOS上で動作するものに限らず、後述の各種処理の一部の実行をOSに肩代わりさせるものであってもよいし、所定のアプリケーションソフトやOSなどを構成する一群のプログラムファイルの一部として含まれているものであってもよい。
ここで、映像解析装置100は、アプリケーションプログラムとして、映像解析プログラムをHDD104に記憶している。この意味で、HDD104は、映像解析プログラムを記憶する記憶媒体として機能する。
また、一般的には、映像解析装置100のHDD104にインストールされるアプリケーションプログラムは、DVDなどの各種の光ディスク、各種光磁気ディスク、フレキシブルディスクなどの各種磁気ディスク、半導体メモリ等の各種方式のメディア等の記憶媒体110に記憶され、この記憶媒体110に記憶された動作プログラムがHDD104にインストールされる。このため、DVD等の光情報記憶メディアやFD等の磁気メディア等の可搬性を有する記憶媒体110も、アプリケーションプログラムを記憶する記憶媒体となり得る。さらには、アプリケーションプログラムは、例えば通信制御装置106を介して外部のネットワーク200から取り込まれ、HDD104にインストールされても良い。
映像解析装置100は、OS上で動作する映像解析プログラムが起動すると、この映像解析プログラムに従い、CPU101が各種の演算処理を実行して各部を集中的に制御する。映像解析装置100のCPU101が実行する各種の演算処理のうち、本実施の形態の特長的な処理について以下に説明する。
図2は、映像解析装置100の概略的な機能構成を示すブロック図である。図2に示すように、映像解析装置100は、映像解析プログラムに従うことにより、コンテンツ情報解析部1と、境界位置検出手段として機能する境界位置検出部2と、を備える。
以下において、映像解析装置100の特徴的な機能を有する各部について説明する。
まず、コンテンツ情報解析部1について説明する。コンテンツ情報解析部1は、アンテナおよび受信装置(いずれも図示せず)を介して入力されたコンテンツの映像および音声を解析する。より詳細には、コンテンツ情報解析部1は、コンテンツの映像上に合成される静止画が存在する区間を検出する静止画検出手段である静止画検出部11と、映像フレームが単一の色からなる区間を検出する単色検出手段(特徴検出手段)である単色検出部12と、音量が一定の閾値を下回る区間を検出する無音検出手段(特徴検出手段)である無音検出部13とを備えている。
静止画検出部11は、図3に示すように、映像フレーム上に出現する静止画のうち、画面の端に長時間表示される静止画Xを検出する。テレビ番組のコンテンツの本編中に一定期間継続して表示される表示画像である静止画Xとしては、テレビ局のロゴマークやテレビ局名である場合が多い。ただし、コンテンツの本編中に継続して表示される静止画ならば、上述のものに限定されない。なお、静止画(例えば、ロゴマーク)Xを検出する方法は広く知られているが、例えば特開2007−274154号公報に開示されている方法を使うことができる。
ところで、コンテンツの本編の冒頭や末尾などのような映像フレームの種類が切り替わる付近では、静止画(例えば、ロゴマーク)の位置や形が変わることが多い。そこで、静止画検出部11は、静止画を検出する既存の方法に加え、以下に示すような方法(図4参照)を用い、静止画の位置や形が変わっていても、同一種類の静止画として検出できるようにしたものである。
1.検出された複数の静止画(例えば、ロゴマーク)であって同時刻に出現していないものについて、出現座標を比較する。ここで、図4は、コンテンツから3種類の映像フレームを抽出した例である。図4に示す映像フレームのうち、静止画X1、静止画X2はテレビ局のロゴであり、同時刻には出現していないが、似た場所に出現している。このように、静止画X1と静止画X2との出現位置の差異が予め定めた閾値以内ならば、たとえ静止画X1から静止画X2へのように変化していたとしても、同じ箇所に出現した静止画としてまとめ、1つの静止画グループG1とする。一方、静止画X3は、異なる位置に出現しているため異なる静止画グループG2とする。
2.各静止画グループについて出現した時間長を算出し、時間長が所定の閾値に満たないならば排除する。図4に示す例によれば、静止画X3はコマーシャルメッセージ中に出現した静止画である。通常コマーシャルメッセージは短いため、静止画グループG2の時間長が閾値に満たない(すなわち、出現している時間が短い)ならばコマーシャルメッセージ中に出現した静止画と判断して、静止画グループG2を排除する。例えば、静止画グループG2の時間長が1分以下であれば、CMと判断する。この処理を行うことで、コマーシャルメッセージ中の静止画を検出した場合でも、コンテンツの本編であると誤検出しなくなる。
3.検出した静止画グループをまとめる。より詳細には、図5に示す例によれば、静止画X1、X2から静止画グループG1が構成され、静止画X4から静止画グループG3が構成される。静止画グループG1、G3のように時刻が重なっているグループをまとめ、静止画の出現区間を作成する。なお、図5に示す例で静止画グループG3が静止画グループG1よりも先に出現しているのは、本編に入ってもしばらくの間はテレビ局のロゴマークが出現しなかったためである。
1.検出された複数の静止画(例えば、ロゴマーク)であって同時刻に出現していないものについて、出現座標を比較する。ここで、図4は、コンテンツから3種類の映像フレームを抽出した例である。図4に示す映像フレームのうち、静止画X1、静止画X2はテレビ局のロゴであり、同時刻には出現していないが、似た場所に出現している。このように、静止画X1と静止画X2との出現位置の差異が予め定めた閾値以内ならば、たとえ静止画X1から静止画X2へのように変化していたとしても、同じ箇所に出現した静止画としてまとめ、1つの静止画グループG1とする。一方、静止画X3は、異なる位置に出現しているため異なる静止画グループG2とする。
2.各静止画グループについて出現した時間長を算出し、時間長が所定の閾値に満たないならば排除する。図4に示す例によれば、静止画X3はコマーシャルメッセージ中に出現した静止画である。通常コマーシャルメッセージは短いため、静止画グループG2の時間長が閾値に満たない(すなわち、出現している時間が短い)ならばコマーシャルメッセージ中に出現した静止画と判断して、静止画グループG2を排除する。例えば、静止画グループG2の時間長が1分以下であれば、CMと判断する。この処理を行うことで、コマーシャルメッセージ中の静止画を検出した場合でも、コンテンツの本編であると誤検出しなくなる。
3.検出した静止画グループをまとめる。より詳細には、図5に示す例によれば、静止画X1、X2から静止画グループG1が構成され、静止画X4から静止画グループG3が構成される。静止画グループG1、G3のように時刻が重なっているグループをまとめ、静止画の出現区間を作成する。なお、図5に示す例で静止画グループG3が静止画グループG1よりも先に出現しているのは、本編に入ってもしばらくの間はテレビ局のロゴマークが出現しなかったためである。
単色検出部12は、映像フレームの色情報を解析し、映像フレームが単一の色(例えば、全画面が黒一色のブラックフレーム)から構成されているかどうかを判定する。これは、ヨーロッパ諸国などにおけるテレビ放送において、CMの開始位置に「ブラックフレーム」が挿入されることが多いからである。また、単一の色の映像フレームとしては、黒一色のブラックフレームに限るものではなく、青一色や白一色などの映像フレームであっても良い。また、映像フレームの全領域を解析しても良いが、画像の端にはノイズが含まれることが多いので、映像フレームの中心部分のみを解析するようにしても良い。
無音検出部13は、コンテンツの音量を解析して無音状態(音量が一定の閾値を下回る区間)を検出するものである。音量の計算方法はデコードしたPCMレベルから計算しても良いし、デコード前の音声スペクトル情報から計算したものでも良い。なお、コンテンツの音量の検出手法は、上述のものに限定されるものではない。これは、ヨーロッパ諸国などにおけるテレビ放送において、CMの開始位置が無音(または、無音に近い)である場合が多いからである。
なお、単色検出部12による処理を実行した後、無音検出部13の処理を実行するようにしたほうが、高精度な検出が可能になる。
次に、境界位置検出部2について説明する。境界位置検出部2は、コンテンツ情報解析部1における解析の結果として得られた情報から、内容の種類が変化する位置を計算する。本実施の形態における内容の種類とは、コンテンツの本編とコマーシャルメッセージである。ただし、内容の種類として、この2種類に限定されるものではない。境界位置検出部2は、区間種類判定手段として機能する区間種類判定部21と、境界位置補正手段として機能する境界位置補正部22とを備えている。
区間種類判定部21は、図6に示すように、コンテンツ中で静止画が出現した区間A,C、出現しなかった区間Bによってコンテンツを複数のセグメント(S1、S2、S3)に分割する。
そして、区間種類判定部21は、静止画検出部11によって静止画が検出された区間および静止画がされなかった区間それぞれについて、その区間内に含まれる映像、音声の情報から内容の種類(コンテンツの本編またはコマーシャルメッセージ)を判定する。
ここで、映像種類の判定について詳述する。具体的には、図7に示すように、セグメント(S1、S2、S3)の中に含まれる単色(a,b,c,d)や無音(e,f,g)などの映像、音声の情報を用いてセグメントの種類を計算する。図7に示す静止画が表示されているセグメント(S1、S3)は本編である確率が高く、単色や無音が多く出現しているセグメント(S2)はコマーシャルメッセージである確率が高い。この特性から、セグメント中の静止画の有無、セグメント中に含まれる単色、無音の数を使い、セグメントが本編である確率を計算する。
ここで、セグメントが本編である確率の計算例について説明する。
1.セグメント中に、静止画と単色かつ無音の部分の両方が存在する場合、1分当たりの単色かつ無音数を算出し、閾値と比較し、本編とコマーシャルメッセージとでどちらの確率が高いかを決定する。単色かつ無音の数が多ければコマーシャルメッセージ(本編の確率は0%)とし、そうでない場合は本編とする。
2.セグメント中に、静止画はないが、単色かつ無音の部分がある場合、本編を含むCM区間と考え、本編の確率を20%とする。
3.セグメント中の静止画の有無に関わらず、単色かつ無音がなければ100%の確率で本編とする。
4.セグメント毎に本編である確率が計算できたら、隣接するセグメントで確率が大きく変化する境界を、本編とコマーシャルメッセージの境界とする。
1.セグメント中に、静止画と単色かつ無音の部分の両方が存在する場合、1分当たりの単色かつ無音数を算出し、閾値と比較し、本編とコマーシャルメッセージとでどちらの確率が高いかを決定する。単色かつ無音の数が多ければコマーシャルメッセージ(本編の確率は0%)とし、そうでない場合は本編とする。
2.セグメント中に、静止画はないが、単色かつ無音の部分がある場合、本編を含むCM区間と考え、本編の確率を20%とする。
3.セグメント中の静止画の有無に関わらず、単色かつ無音がなければ100%の確率で本編とする。
4.セグメント毎に本編である確率が計算できたら、隣接するセグメントで確率が大きく変化する境界を、本編とコマーシャルメッセージの境界とする。
静止画は多くの場合コンテンツの本編中に表示されているが、コマーシャルメッセージ中にも同一箇所に長時間表示されることがある。テレビ局の番組宣伝にテレビ局のロゴマークが連続して表示される場合などである。単色や無音といった情報を使うとこのような場合でも正しくコマーシャルメッセージであると判定できる。
境界位置補正部22は、区間種類判定部21で判定された種類と、単色検出部12で検出された単色の映像フレームと、無音検出部13で検出された無音または無音に近い情報とを用い、内容の種類が変化する位置(境界)をより正しいと判定される位置に補正する。
ここで、区間種類判定部21で検出した内容の種類が変化する位置(境界)を、境界位置補正部22がコマーシャルメッセージと本編との正確な境界に補正する方法について詳述する。具体的には、図8に示すように、静止画は正確なコマーシャルメッセージと本編の境界からずれて表示されることが多く、コマーシャルメッセージ間際では静止画が消失しているなど、セグメントの境界は基本的に本編側にずれていることが多い。すなわち、本編からコマーシャルメッセージに変わる境界では、正確な境界よりも前側に、コマーシャルメッセージから本編に変わる境界では、正確な境界よりも後ろ側にずれる傾向がある。図8に示す例では、区間D,Fは本編であると検出された区間であり、区間Eはコマーシャルメッセージであると検出された区間である。なお、区間D,E,Fは、同種類の複数のセグメントから構成されていることもある。静止画の有無で検出された本編からコマーシャルメッセージに変わる位置(境界)が符号Oで示す位置であり、コマーシャルメッセージから本編に変わる位置(境界)が符号Rで示す位置である。符号h,i,jは検出された単色であり、符号k,l,m,nは検出された無音である。境界位置補正部22は、図8で例示する単色と無音が同時に検出された符号P,Qで示す位置に注目する。符号Pで示す位置は符号Oで示す位置に最も近い時刻に検出された単色と無音の時刻で、符号Oで示す位置よりもコマーシャルメッセージ側にあるものである。符号Qで示す位置は符号Rで示す位置に最も近い時刻に検出された単色と無音の時刻で、符号Rで示す位置よりもコマーシャルメッセージ側にあるものである。本編とコマーシャルメッセージの境界には単色と無音が同時に出現するなど、映像・音声に特徴がある。本編からコマーシャルメッセージに変わる境界では後側の映像、音声の特徴を優先して、コマーシャルメッセージから本編に変わる境界では、正確な境界よりも前側の映像、音声の特徴を優先して探せばよいため、境界位置補正部22は、符号Oで示す位置、符号Rで示す位置を取り消し、符号P示す位置および符号Qで示す位置を新たな境界とする。
これにより、静止画のみによる境界位置検出で若干のずれが発生してしまうような場合であっても、より正確に境界位置を検出することができる。
次に、静止画の有無で検出された境界よりも検出された単色と無音の時刻が本編側にある場合について図9を参照して説明する。
図9に示す例では、区間G,Iは本編であると検出された区間であり、区間Hはコマーシャルメッセージであると検出された区間である。なお、区間G,H,Iは、同種類の複数のセグメントから構成されていることもある。静止画の有無で検出された本編からコマーシャルメッセージに変わる位置(境界)が符号Tで示す位置であり、コマーシャルメッセージから本編に変わる位置(境界)が符号Uで示す位置である。符号o,p,qは検出された単色であり、符号r,s,t,uは検出された無音である。図9に示す例では、境界位置補正部22は、単色と無音が同時に検出された符号S,Vで示す位置に注目する。符号Sで示す位置は符号Tで示す位置に最も近い時刻に検出された単色と無音の時刻で、符号Tで示す位置より本編側にあるものである。符号Vで示す位置は符号Uで示す位置に最も近い時刻に検出された単色と無音の時刻で、符号Uで示す位置より本編側にあるものである。映像と音声の特徴はコマーシャルメッセージ側に近いほうに検出されることが多いため、図9に示す例のように逆方向に映像と音声の特徴が出現している場合は慎重に判断する必要がある。境界位置補正部22は、符号Sで示す位置と符号Tで示す位置、および、符号Uで示す位置と符号Vで示す位置の時間間隔を計算し、その値が閾値以内ならば映像と音声の特徴がある時刻を新たな境界とする。図9に示す例では、符号Sで示す位置と符号Tで示す位置は時間的に近接しているため、例えばCM中に本編と同じ位置にロゴマークがあったとして符号Tで示す位置を取り消し、符号Sで示す位置を新たな境界とする。一方、符号Uで示す位置と符号Vで示す位置は時間的に閾値以上離れているために符号Vで示す位置を新たな境界とせず、符号Uで示す位置を保持する。
なお、図8および図9に示す例では、単色と無音が同時に発生した時刻に補正したが、単色と無音のどちらかが検出された時刻に検出された時刻を補正対象としても良い。
次いで、上述したような映像解析装置100のCPU101が実行する特徴的な処理である映像解析処理について図10のフローチャートを参照して説明する。
まず、アンテナおよび受信装置(いずれも図示せず)を介して入力された映像および音声を含むコンテンツについて、静止画検出部11による静止画検出、単色検出部12による単色検出、無音検出部13による無音検出といった映像および音声解析を行う(ステップS1)。
次いで、区間種類判定部21が、静止画が出現した区間、静止画が出現しなかった区間でセグメントを定義する(ステップS2)。
全てのセグメントについての処理が終了していなければ(ステップS3のNo)、処理対象のセグメントを1つ選び(ステップS4)、区間種類判定部21は、セグメントの中に存在する無音(音量が一定の閾値を下回る区間)の数、単色の数、単色かつ無音(音量が一定の閾値を下回る区間)の数をカウントする(ステップS5)。
選択したセグメントに単色かつ無音(音量が一定の閾値を下回る区間)がない場合は(ステップS6のYes)、区間種類判定部21は、そのセグメントを本編であると判定する(ステップS9)。
一方、セグメントに単色かつ無音(音量が一定の閾値を下回る区間)はあるが、静止画はない場合は(ステップS6のNo,ステップS7のYes)、区間種類判定部21は、そのセグメントをコマーシャルメッセージと判定する(ステップS10)。
セグメントに単色かつ無音(音量が一定の閾値を下回る区間)も、静止画もある場合は(ステップS6のNo,ステップS7のNo)、1分あたりの単色かつ無音(音量が一定の閾値を下回る区間)の数を計算した値と閾値を比較し、閾値を上回れば(ステップS8のYes)、区間種類判定部21は、そのセグメントをコマーシャルメッセージと判定する(ステップS10)。閾値を下回れば(ステップS8のNo)、区間種類判定部21は、そのセグメントを本編であると判定する(ステップS9)。
なお、図10に示すフローチャートでは、本編である確率を100%か0%かで計算したが、細かく計算するよう変更しても良い。
以上によりセグメントの種類が判定できたので、直前に判定したセグメントの種類と比較する(ステップS11)。
直前に判定したセグメントの種類と種類が変わっている場合には(ステップS11のYes)、境界位置補正部22は、内容の種類が変化する位置(境界)をより正しいと判定される位置に補正する。具体的には、コマーシャルメッセージから本編に変化する位置(境界)ならば(ステップS12のYes)、セグメントの前側近傍に単色かつ無音(音量が一定の閾値を下回る区間)があれば、その位置に境界を補正する(ステップS14)。
一方、境界位置補正部22は、本編からコマーシャルメッセージに変化する位置(境界)ならば(ステップS12のNo)、セグメントの後側近傍に単色かつ無音(音量が一定の閾値を下回る区間)があれば、その位置に境界を補正する(ステップS13)。
以上ステップS4〜S14の処理は、全てのセグメントについての処理が終了するまで(ステップS3のYes)、繰り返される。
なお、図10のフローチャートでは単色と無音が同時に発生した時刻に補正したが、単色と無音のどちらかが検出された時刻に検出された時刻を補正対象としても良い。
また、セグメント毎に上記の処理を実行するのではなく、コンテンツの先頭から末尾までの情報を全て保持し、まとめて処理しても良いし、セグメントを検出して必要な情報がたまった都度、逐次的に処理しても良い。
このように本実施の形態によれば、コンテンツの映像フレームに出現する略同一な静止画の群である静止画グループが存在する区間または静止画グループが存在しない区間であるかどうかに加えて、コンテンツを構成する映像フレームのうち単一色の映像フレームとコンテンツを構成する音声の音量が一定の閾値を下回る無音区間との少なくとも一方の情報も用いて、コンテンツの内容の種類が変化する位置を検出することにより、テレビ放送において本編であってもチャンネルロゴなどの静止画がない部分がある場合であっても、コンテンツの内容の種類(コンテンツの本編またはコマーシャルメッセージ)が変化する位置を正確に検出することができる。
なお、本実施の形態においては、映像解析装置100としてパーソナルコンピュータを適用したが、これに限るものではなく、テレビ、HDDレコーダ、ワンセグ搭載端末などにも適用可能である。
2 境界位置検出手段
11 静止画検出手段
12 単色検出手段、特徴検出手段
13 無音検出手段、特徴検出手段
21 区間種類判定手段
22 境界位置補正手段
100 映像解析装置
11 静止画検出手段
12 単色検出手段、特徴検出手段
13 無音検出手段、特徴検出手段
21 区間種類判定手段
22 境界位置補正手段
100 映像解析装置
Claims (10)
- 映像および音声で構成されるコンテンツの映像フレームに出現する一定期間継続して表示される表示画像である静止画を検出し、検出した略同一な前記静止画が出現する区間を静止画グループとしてまとめる静止画検出手段と、
前記コンテンツを構成する前記映像フレームのうち単一色の映像フレームを検出する単色検出手段と、前記コンテンツを構成する音声の音量が一定の閾値を下回る無音区間を検出する無音検出手段との少なくともいずれか一方を実行する特徴検出手段と、
前記静止画グループが存在する区間と前記静止画グループが存在しない区間とのそれぞれに含まれる前記単一色の映像フレームまたは前記無音区間の少なくとも一方の情報から、前記コンテンツの内容の種類が変化する位置を検出する境界位置検出手段と、
を備えることを特徴とする映像解析装置。 - 前記境界位置検出手段は、
前記静止画グループが存在する区間と前記静止画グループが存在しない区間とのそれぞれについて、前記映像または前記音声から前記コンテンツの内容の種類を判定する区間種類判定手段と、
判定された前記コンテンツの内容の種類と、前記単一色の映像フレームまたは前記無音区間の少なくとも一方の情報とを用い、前記コンテンツの内容の種類が変化する位置をより正しいと判定される位置に補正する境界位置補正手段と、
を備えることを特徴とする請求項1記載の映像解析装置。 - 前記特徴検出手段は、前記単色検出手段を実行した後、前記無音検出手段を実行する、
ことを特徴とする請求項1記載の映像解析装置。 - 前記静止画検出手段は、検出された複数の前記静止画であって同時刻に出現していないものについて出現座標を比較し、出現位置の差異が予め定めた閾値以内ならば、同じ箇所に出現した複数の前記静止画が出現する区間を前記静止画グループとしてまとめる、
ことを特徴とする請求項1記載の映像解析装置。 - 前記静止画検出手段は、前記静止画グループについて出現した時間長を算出し、時間長が所定の閾値に満たない前記静止画グループを排除する、
ことを特徴とする請求項1記載の映像解析装置。 - 前記静止画検出手段は、時刻が重なっている前記静止画グループをまとめ、前記静止画の出現区間を作成する、
ことを特徴とする請求項1記載の映像解析装置。 - 前記区間種類判定手段は、前記各区間中の前記静止画の有無、前記各区間中に含まれる前記単一色の映像フレームまたは前記無音区間の少なくとも一方の情報を用いて前記コンテンツの内容の種類を判定する、
ことを特徴とする請求項1記載の映像解析装置。 - 前記境界位置補正手段は、前記静止画グループが存在する区間から前記静止画グループが存在しない区間に変わる境界では当該境界以後の前記単一色の映像フレームまたは前記無音区間の少なくとも一方の情報を優先し、前記静止画グループが存在しない区間から前記静止画グループが存在する区間に変わる境界では当該境界よりも以前の前記単一色の映像フレームまたは前記無音区間の少なくとも一方の情報を優先する、
ことを特徴とする請求項1記載の映像解析装置。 - 前記境界位置補正手段は、前記静止画グループが存在する区間内に前記単一色の映像フレームまたは前記無音区間の少なくとも一方の情報が存在する場合には、前記静止画グループが存在する区間と前記静止画グループが存在しない区間との境界位置と、前記単一色の映像フレームまたは前記無音区間の少なくとも一方の情報が存在する位置との時間間隔を計算し、その値が閾値以内ならば前記単一色の映像フレームまたは前記無音区間の少なくとも一方の情報がある時刻を新たな境界とする、
ことを特徴とする請求項1記載の映像解析装置。 - コンピュータを、
映像および音声で構成されるコンテンツの映像フレームに出現する一定期間継続して表示される表示画像である静止画を検出し、検出した略同一な前記静止画が出現する区間を静止画グループとしてまとめる静止画検出手段と、
前記コンテンツを構成する前記映像フレームのうち単一色の映像フレームを検出する単色検出手段と、前記コンテンツを構成する音声の音量が一定の閾値を下回る無音区間を検出する無音検出手段との少なくともいずれか一方を実行する特徴検出手段と、
前記静止画グループが存在する区間と前記静止画グループが存在しない区間とのそれぞれに含まれる前記単一色の映像フレームまたは前記無音区間の少なくとも一方の情報から、前記コンテンツの内容の種類が変化する位置を検出する境界位置検出手段と、
として機能させることを特徴とするプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008305359A JP4427600B1 (ja) | 2008-11-28 | 2008-11-28 | 映像解析装置およびプログラム |
US12/487,617 US8009965B2 (en) | 2008-11-28 | 2009-06-18 | Video analyzer and computer program product |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008305359A JP4427600B1 (ja) | 2008-11-28 | 2008-11-28 | 映像解析装置およびプログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009278778A Division JP2010130700A (ja) | 2009-12-08 | 2009-12-08 | 映像解析装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP4427600B1 true JP4427600B1 (ja) | 2010-03-10 |
JP2010130563A JP2010130563A (ja) | 2010-06-10 |
Family
ID=42072722
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008305359A Expired - Fee Related JP4427600B1 (ja) | 2008-11-28 | 2008-11-28 | 映像解析装置およびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8009965B2 (ja) |
JP (1) | JP4427600B1 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110082735A1 (en) * | 2009-10-06 | 2011-04-07 | Qualcomm Incorporated | Systems and methods for merchandising transactions via image matching in a content delivery system |
US8578407B1 (en) * | 2012-07-10 | 2013-11-05 | Joao Redol | Real time automated unobtrusive ancilliary information insertion into a video |
KR101677406B1 (ko) * | 2012-11-13 | 2016-11-29 | 인텔 코포레이션 | 차세대 비디오용 비디오 코덱 아키텍처 |
CN104704827B (zh) | 2012-11-13 | 2019-04-12 | 英特尔公司 | 用于下一代视频的内容自适应变换译码 |
US8826325B2 (en) * | 2012-12-08 | 2014-09-02 | Joao Redol | Automated unobtrusive ancilliary information insertion into a video |
CN104885470B (zh) | 2013-01-30 | 2018-08-07 | 英特尔公司 | 用于下一代视频的预测和编码的内容自适应划分 |
US8645984B1 (en) * | 2013-02-05 | 2014-02-04 | Samsung Electronics Co., Ltd. | Method and system for verifying content authenticity in smart TV |
US9743124B2 (en) | 2013-09-12 | 2017-08-22 | Wideorbit Inc. | Systems and methods to deliver a personalized mediacast with an uninterrupted lead-in portion |
WO2016200793A1 (en) * | 2015-06-08 | 2016-12-15 | Wideorbit Inc. | Content management and provisioning system |
JP7268848B2 (ja) * | 2019-02-28 | 2023-05-08 | 大学共同利用機関法人情報・システム研究機構 | コマーシャル検出装置 |
WO2023107725A1 (en) * | 2021-12-09 | 2023-06-15 | Verance Corporation | System and method for the detection of audio watermark loss |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006109126A (ja) * | 2004-10-06 | 2006-04-20 | Sony Corp | 情報処理装置および方法、並びにプログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5987210A (en) * | 1993-01-08 | 1999-11-16 | Srt, Inc. | Method and apparatus for eliminating television commercial messages |
JP4178629B2 (ja) * | 1998-11-30 | 2008-11-12 | ソニー株式会社 | 情報処理装置および方法、並びに記録媒体 |
JP4300697B2 (ja) | 2000-04-24 | 2009-07-22 | ソニー株式会社 | 信号処理装置及び方法 |
JP3894940B2 (ja) | 2005-08-11 | 2007-03-22 | 三菱電機株式会社 | 映像音声記録装置 |
US20070242926A1 (en) | 2006-04-13 | 2007-10-18 | Huang Chen-Hsiu | Video Program Processing Method and System |
-
2008
- 2008-11-28 JP JP2008305359A patent/JP4427600B1/ja not_active Expired - Fee Related
-
2009
- 2009-06-18 US US12/487,617 patent/US8009965B2/en not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006109126A (ja) * | 2004-10-06 | 2006-04-20 | Sony Corp | 情報処理装置および方法、並びにプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20100134691A1 (en) | 2010-06-03 |
US8009965B2 (en) | 2011-08-30 |
JP2010130563A (ja) | 2010-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4427600B1 (ja) | 映像解析装置およびプログラム | |
JP5057918B2 (ja) | 電子機器およびシーン種類表示方法 | |
EP3361740B1 (en) | Display device and method for replacing advertisement | |
EP2109313B1 (en) | Television receiver and method | |
JP4613867B2 (ja) | コンテンツ処理装置及びコンテンツ処理方法、並びにコンピュータ・プログラム | |
JP5685224B2 (ja) | コンテキスト適応型ユーザインターフェイスシステム | |
US20150213836A1 (en) | Apparatus and method for editing | |
JP4267649B2 (ja) | ビデオ番組の処理方法、関連装置及び関連媒体 | |
JP2009177411A (ja) | 電子機器および画像表示方法 | |
JP2007241410A (ja) | 表示装置及び表示制御方法 | |
US20050063677A1 (en) | Image display method, image display program, and image display apparatus | |
US20080172406A1 (en) | Preference data generation device, content display device, preference data generation method and recording medium | |
RU2646532C2 (ru) | Способ представления цифрового мультимедийного контента и устройство | |
JP2004364234A (ja) | 放送番組内容メニュー作成装置及び方法 | |
EP1906661A2 (en) | Picture recorder and commercial message detection method | |
US20070140648A1 (en) | Electronic device and scene skipping method | |
US7450752B2 (en) | System and method for automatic detection of the end of a video stream | |
US20090226144A1 (en) | Digest generation device, digest generation method, recording medium storing digest generation program thereon and integrated circuit used for digest generation device | |
JP2010130700A (ja) | 映像解析装置およびプログラム | |
CN117745589A (zh) | 水印去除方法、装置及设备 | |
JP2008199464A (ja) | テロップ再生装置、プログラムおよびテロップ再生方法 | |
KR101086434B1 (ko) | 비디오 데이터 디스플레이 방법 및 장치 | |
JP4929127B2 (ja) | Cm検出方法及びこれを用いた動画再生装置 | |
JP2007300158A (ja) | 単色フレーム検出方法 | |
US20100201715A1 (en) | Method for controlling output of display unit and system enabling of the method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091214 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121218 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |