[go: up one dir, main page]

WO2007039995A1 - ダイジェスト作成装置およびそのプログラム - Google Patents

ダイジェスト作成装置およびそのプログラム Download PDF

Info

Publication number
WO2007039995A1
WO2007039995A1 PCT/JP2006/316512 JP2006316512W WO2007039995A1 WO 2007039995 A1 WO2007039995 A1 WO 2007039995A1 JP 2006316512 W JP2006316512 W JP 2006316512W WO 2007039995 A1 WO2007039995 A1 WO 2007039995A1
Authority
WO
WIPO (PCT)
Prior art keywords
content
digest
section
scene
partial
Prior art date
Application number
PCT/JP2006/316512
Other languages
English (en)
French (fr)
Inventor
Shinya Hashimoto
Harumi Nakamura
Original Assignee
Pioneer Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Corporation filed Critical Pioneer Corporation
Priority to EP06796676A priority Critical patent/EP1942671A4/en
Priority to JP2007538661A priority patent/JPWO2007039995A1/ja
Publication of WO2007039995A1 publication Critical patent/WO2007039995A1/ja

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/738Presentation of query results
    • G06F16/739Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7834Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal

Definitions

  • the high sound pressure section (first large scene) that became the reference for extracting it is used.
  • Priorities proportional to the section length (hll, hl2) of the sound pressure section and the second loud sound pressure section) are assigned, and the starting point of the partial scene to be extracted is determined (S17). That is, in the example of FIG. 2, [DPs2, DPsl] is determined.
  • the end point (DPe) of the partial scene is determined from the one with the highest priority and is incorporated into the digest (incorporated into the digest playback information, S18). That is, in the example of FIG. 2, [DPe2] is first determined, and the second partial scene is incorporated into the digest.
  • the last extracted partial scenes are rearranged according to the time series (S21), and the processing ends. That is, in the case of the example in Fig. 2, the second partial scene is followed by the first partial scene. The power that will be incorporated into the digest This is rearranged in the order of the first partial scene and then the second partial scene.
  • the start point (DPs) is a point that is a predetermined time ta after the start point (DHs) of the high sound pressure interval, and the start point (DHs) force of the high sound pressure interval is also the predetermined time tb (however, ta > tb ⁇ 0)
  • the section (section length: tp) with the end point (DPe) as the end point (DPe) as a partial scene to be included in the digest the scene before the highlight scene, that is, the user is most interested Intriguing and exciting scenes can be incorporated into the digest.
  • the highlight scene itself for example, the result of a sport game or the end of a drama
  • the user's willingness to view is not impaired by viewing the created digest.
  • the extracted partial scene is included in the target section, and the target section is included, only part of the partial scene is included in the target section (in other words, Even when a part of the partial scene is not included in the target section), the start point to the end point of the partial scene may be extracted. Conversely, if the entire partial scene is not included in the target section, the partial scene may not be extracted. Furthermore, it may be determined whether or not the extraction power is based on a ratio of a part of the partial scene included in the target section.
  • the start point (DPs) of the partial scene is the time point that is a predetermined time ta from the start point (DHs) of the sound pressure interval (see Fig. 2).
  • the points (DPs) may be determined in proportion to the section length hi of the high sound pressure section that is a reference for extraction. This is because the no-light scene is long, and in general, the preceding scene is also considered long.
  • the predetermined time ta ′ for determining the start point (DPs) of the partial scene is, as shown in FIG. 5, from the start point (DHs) of the high sound pressure section to the section length hl ( hl> 0) and a constant ⁇ (0 ⁇ 1).
  • the second half of the first partial scene (section length: tpl, shown in the lower left slanted line in the figure) extracted based on the first loud sound pressure section (section length: hll)
  • the first half of the second partial scene (section length: tp2) extracted based on the second loud sound pressure section (section length: hl2, downward slanted diagonal line in the figure) overlaps.
  • the priority order is the third partial scene ⁇ the second partial scene ⁇ the first partial scene. According to this configuration, it is possible to determine a partial scene to be extracted according to the degree of swelling that occurs only by the length of the swell.
  • the partial scene is extracted while avoiding the high sound pressure section.
  • one or more partial scenes can be arbitrarily selected from the target section regardless of the high sound pressure section.
  • FIG. 8 is a block configuration diagram according to the present embodiment
  • FIG. 9 illustrates the present embodiment. It shows a sound pressure level waveform as an example.
  • the recording / playback apparatus 10 according to the present embodiment is provided with a non-main-scene extraction unit 36 in the control unit 30 and a small sound in the audio analysis unit 40 as compared with the block configuration diagram of the first embodiment.
  • the difference is that a pressure section search unit 42 is provided, and the storage unit 50 further includes a low sound pressure section storage unit 55 and a non-program main scene storage unit 56.
  • the non-program main scene storage unit 56 stores the extraction result of the non-main program scene extraction unit 36, that is, data indicating the address of the start point of each non-main program scene and its section length.
  • the non-main scene refers to sections that are not considered the main part of the content, such as weather forecasts and warp corners.
  • the partial scene extraction unit 34 determines that the content type determination unit 32 determines a predetermined content type (for example, animation), as shown in FIG.
  • a predetermined section immediately after the non-program scene extracted by the scene extraction unit 36 is extracted as an important part scene (section length: tpi, start point: DPis, end point: DPie).
  • a partial scene is extracted based on only a high sound pressure section as shown in the first embodiment.
  • the high sound pressure section included in the non-program main scene (A and B in the figure) is excluded from the partial scene extraction target.
  • the digest creation unit 35 creates digest playback information by setting the priority of the important partial scene immediately after the above-mentioned non-main-scene scene to the maximum value (incorporated into the digest). .
  • the priority are determined in chronological order. In other words, when a program from 0:00 to 1:00 is recorded, the entire section is the target section (when the content type is other than movies, dramas, and sports), and a commercial is performed every 15 minutes.
  • the scene immediately after the commercial broadcast near 0:15 was extracted as an important partial scene with the highest priority and was broadcast near 0:30.
  • the scene immediately after the commercial is extracted as an important partial scene having the next highest priority.
  • the digest creation process starts with the start of content recording (S31). Then, until the end of recording, search for a high sound pressure section where the sound pressure level of the content is higher than the high sound threshold (THb) and a low sound pressure section where the sound pressure level is higher than the low sound threshold (THs). (S32, S33).
  • the partial scene is extracted, the priority is given to the partial scene, and the important partial scene is also extracted by the detection result power of the non-program main scene.
  • the priority is set to the maximum, and the starting point (DPs, DPis) of each partial scene is determined according to the priority (S39).
  • the end point (DPe, DPie) of the partial scene is determined from the one with the higher priority, and is incorporated into the digest (S40). That is, in the case of the example in FIG. 9, first, the start point [DPis] of the important partial scene and the end point [DPie] of the important partial scene are determined, and the important partial scene is incorporated into the digest.
  • the scene immediately after the non-program main scene extracted based on the search result of the low sound pressure section is set as the important partial scene.
  • Preferentially included in the digest Preferentially included in the digest. Therefore, for example, when the content is animation, an appropriate digest can be created according to the content type, such as preferentially including the scene immediately after the commercial in the digest.
  • the target section is set to all content sections (S35), but it may not be preferable if the result is included in the animation as in a movie or a drama. Therefore, the target section may be narrowed down to P1 (see S37).
  • a section in which low sound pressure sections exist at a predetermined interval is extracted as a scene outside the main story, but various commercial detection methods proposed in the past are applied.
  • a scene outside the main story may be extracted.
  • a commercial scene detected based on a scene change based on video information or a broadcast mode may be extracted as a non-main-scene scene. .
  • the digest of the content when the content type is a predetermined type (in the case of a movie, drama, sports, etc.), the digest of the content Since the target section is determined according to the content type, for example, the extraction target section of the partial scene that is the element for creating the content is the first half of the content, a digest suitable for the content type can be created.
  • a predetermined type the same type as the above-mentioned predetermined type or a different type may be used
  • a commercial scene since the scene immediately after) is extracted as an important partial scene, a digest suitable for the content type can be created.
  • each unit and each function in the recording / reproducing apparatus 10 shown in each of the above embodiments can be provided as a program. It is also possible to provide the program stored in a recording medium (not shown).
  • CD-ROM, flash ROM, memory card (compact flash (registered trademark), smart media, memory stick, etc.), compact disc, magneto-optical disc, digital versatile disc, flexible disc, and node disc are available as recording media. Can be used.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Television Signal Processing For Recording (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Abstract

 コンテンツ種別に応じて、適切なダイジェストを作成可能なダイジェスト作成装置およびそのプログラムを提供することを課題とする。  映像情報と音声情報の少なくともいずれか一方を含むコンテンツと、当該コンテンツに付帯されているコンテンツ付帯情報とを取得するコンテンツ取得部20と、コンテンツ付帯情報に基づいて、コンテンツの内容毎に分類されるコンテンツ種別を判別するコンテンツ種別判別部32と、その判別結果に応じて、コンテンツの全コンテンツ区間から、対象区間を決定する対象区間決定部33と、決定した対象区間の中から、コンテンツのダイジェストを作成するための要素となる部分シーンを抽出する部分シーン抽出部34と、抽出した部分シーンを用いてダイジェストを作成するダイジェスト作成部35と、を備えたものである。

Description

明 細 書
ダイジェスト作成装置およびそのプログラム
技術分野
[0001] 本発明は、映像情報と音声情報の少なくともいずれか一方を含むコンテンツのダイ ジェストを作成するダイジェスト作成装置およびそのプログラムに関するものである。 背景技術
[0002] 近年、映像情報や音声情報を含むコンテンツ (テレビ放送番組など)を記録'再生 可能な記録再生装置にお 、て、記録したコンテンツを要約したダイジェストを作成し、 これを再生するものが知られている。このダイジェスト再生は、記録したコンテンツ中 のハイライトシーンなど特徴的なシーンを中心に再生させることができるため、ユーザ が短時間で大まかなコンテンツの内容を把握した!/、場合や、見た 、番組を検索する 場合に利用される。
[0003] ところで、ダイジェストを作成するに当たって、その特徴的なシーンを抽出する方法 として、各種提案が為されている。例えば、特許文献 1や特許文献 2では、画像の顔 領域が存在するフレーム、画像の連続性が無 、フレーム(シーンチェンジ後のフレー ム)等に応じて代表フレームを抽出し、当該代表フレームを先頭としてダイジェスト再 生を行うようにしている。また、特許文献 3では、コンテンツに含まれる音声情報に着 目し、基準となる基準音声レベルよりも大きい区間が所定時間継続した場合に、その 基準音声レベルより大きい区間を抽出してダイジェスト再生を行うようにしている。 特許文献 1:特開 2003— 283993号公報
特許文献 2 :特開平 9一 312827号公報
特許文献 3:特開平 10— 32776号公報
発明の開示
発明が解決しょうとする課題
[0004] し力しながら、上記の特許文献に記載されたダイジェスト再生方法は、顔領域が存 在するフレームや音声レベルが大きい区間など、いずれも特徴的なシーンを抽出し ているため、番糸且の内容によっては、ユーザが望まないシーンを含むダイジェストを 再生してしまう恐れがある。例えば、スポーツ番組を記録した際に、試合結果がダイ ジェストに含まれていたり、ドラマを記録した際に、その結末がダイジェストに含まれて いたりするような場合である。このため、ストーリー性のある番組のダイジェストとしては 、コンテンツの結果が判らない範囲で、いわゆる番組予告編に近いものを再生するこ とが望まれている。
[0005] そこで、本発明は、コンテンツの内容やジャンルに応じて、適切なダイジェストを作 成可能なダイジェスト作成装置およびそのプログラムを提供することを目的とする。 課題を解決するための手段
[0006] 本発明のダイジェスト作成装置は、映像情報と音声情報の少なくともいずれか一方 を含むコンテンツと、当該コンテンツに付帯されて ヽるコンテンツ付帯情報とを取得す るコンテンツ取得手段と、コンテンツ付帯情報に基づいて、コンテンツの内容毎に分 類されるコンテンツ種別を判別するコンテンツ種別判別手段と、コンテンツ種別判別 手段による判別結果に応じて、コンテンツの時間軸上における全コンテンツ区間から 、その一部または全体となる対象区間を決定する対象区間決定手段と、決定した対 象区間の中から、コンテンツのダイジェストを作成するための要素となる部分シーンを 抽出する部分シーン抽出手段と、抽出した部分シーンを用いて、ダイジェストを作成 するダイジェスト作成手段と、を備えて 、ることを特徴とする。
[0007] この構成によれば、コンテンツのダイジェストを作成する場合に、ダイジェストの要素 となる部分シーンの抽出対象区間を、コンテンツ種別に応じて決定することができる。 従って、例えばスポーツ番組やドラマなど、ストーリー性のあるコンテンツの場合は、 コンテンツの前半部分を対象区間とすることで、それらの結末がダイジェストに含まれ ることを避けることができる。すなわち、コンテンツ種別に応じて、適切なダイジェストを 作成することができる。
[0008] なお、「コンテンツ」には、映像情報および音声情報から成るもの (テレビジョン番組 など)、映像情報だけのもの(例えば無声映画など)、並びに音声情報だけのもの(例 えば音楽やラジオ番組など)が含まれる。また、「コンテンツ種別」とは、コンテンツの 内容、ジャンル、出演者、コンテンツの放送日時など、種々の基準で分類されるもの である。また、「ダイジェスト」とは、コンテンツの内容を要約した要約情報を指す。 [0009] 上記のダイジェスト作成装置にぉ 、て、対象区間は、コンテンツの開始点から、全コ ンテンッ区間と定数 (0< j8≤1)とを乗算して得られる時間だけ経過した時点まで の区間であり、対象区間決定手段は、コンテンツ種別判別手段により判別されたコン テンッ種別に応じて可変する定数 ι8の値に基づいて、対象区間を決定することが好 ましい。
[0010] この構成によれば、例えばストーリー性のあるコンテンツの場合、部分シーンを抽出 する対象区間を、定数 j8によって定まる前半部分に絞ることができる。また、定数 の値はコンテンッ種別に応じて可変するため、コンテンッの内容等に応じた適切な対 象区間に決定することができる。
[0011] 上記のダイジェスト作成装置において、部分シーン抽出手段は、所定時間 tp (tp> 0)の区間長を有する部分シーンを抽出し、当該所定時間 tpの値は、コンテンツ種別 判別手段により判別されたコンテンツ種別に応じて可変することが好ましい。
[0012] この構成によれば、コンテンツの内容等に応じた適切な長さの部分シーンを抽出す ることができる。例えば、コンテンツが音楽番組である場合は、部分シーンが 3〜5秒 程度の長さであれば、出演しているアーティストを把握することができる。また、コンテ ンッがスポーツ番組なら、部分シーンが 10秒程度であれば、パスの流れや投球シー ン、解説者の話など力も流れを理解することができる。
[0013] 上記のダイジェスト作成装置において、全コンテンツ区間から、映像情報と音声情 報の少なくともいずれか一方に基づいて、ハイライトシーンを含むハイライト区間を検 索するハイライト区間検索手段をさらに備え、部分シーン抽出手段は、対象区間から ノ、イライト区間を除いた残区間の中から、部分シーンを抽出することが好ましい。
[0014] この構成によれば、全コンテンツ区間からハイライトシーンを含むハイライト区間を 除!、た残区間の中力 部分シーンを抽出するため、ダイジェストの中にハイライトシ一 ンが含まれることがない。従って、作成されたダイジェストを視聴することによって、そ のコンテンツの結果が判ってしま 、、視聴者の視聴意欲を損ねると 、つたことがな ヽ
。なお、「ハイライトシーン」とは、スポーツ番組の試合結果やドラマの結末など、視聴 者が最も興味をそそられるシーンや盛り上がるシーンなど、そのコンテンツの特徴的 なシーンを指す。また、ハイライトシーン (ハイライト区間)の検索は、例えば映像に顔 領域が含まれて 、るシーンを抽出する方法や、音声レベルや音圧レベルが基準値を 超えているシーンを抽出する方法など、従来技術を適用可能である。
[0015] 上記のダイジェスト作成装置において、取得したコンテンツを記録するコンテンツ記 録手段と、記録したコンテンツを再生する再生手段と、をさらに備え、部分シーン抽 出手段は、記録したコンテンツが未再生である力否かを判別し、未再生であると判別 した場合に、対象区間からハイライト区間を除いた残区間の中から部分シーンを抽出 し、再生済みであると判別した場合は、ハイライト区間を含む部分シーンを抽出する ことが好ましい。
[0016] この構成によれば、記録したコンテンツが再生済みである力否かに応じて、部分シ ーンの抽出の仕方を変えることができる。すなわち、未再生の場合は、視聴意欲を損 ねないように、ハイライトシーンを避けて部分シーンを抽出し、再生済みの場合は、内 容をより把握できるように、ノ、イライトシーンを含む部分シーンを抽出するため、再生 済みであるか否かに応じて適切なダイジェストを作成することができる。
[0017] 上記のダイジェスト作成装置において、ダイジェストを再生するダイジェスト再生手 段をさらに備え、ダイジェスト作成手段は、抽出した部分シーンの開始点を示すアド レスと当該部分シーンの区間長とを示す区間データ力 成るダイジェスト再生情報を 作成し、ダイジェスト再生手段は、コンテンツ記録手段によるコンテンツの記録データ と、ダイジェスト再生情報とに基づ 、てダイジェストを再生することが好ま U、。
[0018] この構成によれば、コンテンツの記録データの中力 ダイジェスト再生情報に該当 する部分シーンを読み出すことによって、ダイジェストを再生することができる。すなわ ち、コンテンツの記録データの一部を抽出したダイジェスト用のデータを、コンテンツ の記録データとは別に保存しておくといった必要が無ぐ部分シーンの開始点を示す アドレスとその区間長とを示す区間データを保存しておくだけで良いため、ダイジエス ト保存用のメモリ使用量を少なくすることができる。
[0019] 上記のダイジェスト作成装置にぉ 、て、コンテンツ取得手段は、コンテンツ付帯情 報の少なくとも一部として、コンテンツのシーン毎に記録されたメタデータを取得する ことが好ましい。
[0020] この構成によれば、少なくともメタデータに基づ 、て、コンテンツ種別を判別すること ができる。なお、「メタデータ」とは、コンテンツ全体の内容に関する記述、制作者、著 作権などに関する情報などの他、コンテンツに含まれる各シーンの詳細な情報を含 むものである。
[0021] 上記のダイジェスト作成装置において、 EPGデータを受信する EPG受信手段をさ らに備え、コンテンツ取得手段は、コンテンツ付帯情報の少なくとも一部として、 EPG データに含まれる番組情報を取得することが好ましい。
[0022] この構成によれば、少なくとも EPGデータ(電子番組ガイド表)に含まれる番組情報
(番組配列情報)に基づいて、コンテンツ種別を判別することができる。
[0023] なお、この場合、コンテンツは、音声情報を含むものであり、音圧レベルが所定の小 音閾値以下となる小音圧区間を検索する小音圧区間検索手段と、小音区間検索手 段との検索結果に基づいて、コマーシャルシーンを含む本編外シーンを抽出する本 編外シーン抽出手段と、をさらに備え、部分シーン抽出手段は、コンテンツ種別判別 手段により、取得したコンテンツが所定のコンテンツ種別であると判別された場合、抽 出した本編外シーンの直後の所定区間を、部分シーンとして抽出しても良い。
[0024] この構成によれば、検索した小音圧区間に基づいて、コマーシャルシーンを含む本 編外シーンを抽出し、コンテンツ種別に応じて、その本編外シーンの直後の所定区 間を対象区間とすることができる。例えば、コンテンツ種別がアニメの場合などは、コ マーシャル直後にアニメの題目やテロップが表示されることが多いが、そのコマーシ ャル直後の所定区間を部分シーンとして抽出してダイジェストに含めることで、視聴者 はより的確に内容を把握することができる。
[0025] 上記のダイジェスト作成装置にぉ 、て、ダイジェスト作成手段は、複数の部分シー ンを用いてダイジェストを作成する場合、当該複数の部分シーンを、時系列に従って 並び替えることが好ましい。
[0026] この構成によれば、抽出した複数の部分シーンを時系列に従って並び替えるため、 ダイジェストを再生する際に、連続して再生される部分シーンが時間的に前後すると いった違和感を無くすことができる。また、番組予告編に近いダイジェストを作成する ことができる。
[0027] 本発明のプログラムは、上記のダイジェスト作成装置における各手段として機能さ せるためのものであることを特徴とする。
[0028] このプログラムを用いることにより、コンテンツの内容やジャンルに応じて、適切なダ イジエストを作成可能なダイジェスト作成装置を実現することができる。
図面の簡単な説明
[0029] [図 1]本発明の一実施形態に係る録音再生装置のブロック構成図である。
[図 2]対象区間力 の部分シーンの抽出方法を説明する音圧レベル波形図である。
[図 3]大音圧区間の検索処理を示すフローチャートである。
[図 4]第 1実施形態に係るダイジェスト作成処理を示すフローチャートである。
[図 5]部分シーンを抽出する他の方法を説明する音圧レベル波形図である。
[図 6]重複する部分シーンの抽出方法を説明する音圧レベル波形図である。
[図 7]部分シーンの優先度を決定する他の方法を説明する図である。
[図 8]第 2実施形態に係る録音再生装置のブロック構成図である。
[図 9]第 2実施形態に係る本編外シーン直後の重要部分シーンの抽出方法を説明す る音圧レベル波形図である。
[図 10]第 2実施形態に係るダイジェスト作成処理を示すフローチャートである。
符号の説明
[0030] 10:録音再生装置, 20:コンテンツ取得部, 30:制御部, 40:音声解析部, 50:記 憶部, 60:再生部, 61:コンテンツ再生部, 62:ダイジェスト再生部, 81:受信アンテ ナ, 82:外部機器, 91:表示装置, 92:UI入力装置, DCs:本編外シーンの開始点 , DCe:本編外シーンの終了点, Ds:全コンテンツの区間の開始点, De:全コンテン ッの区間の終了点, DHs:大音圧区間の開始点, DHe:大音圧区間の終了点, DPs :部分シーンの開始点, DPe:部分シーンの終了点, DPis:重要部分シーンの開始 点, DPie:重要部分シーンの終了点, hi:大音圧区間の区間長, tp:部分シーンの 区間長, T:全コンテンツの区間長, THb:大音閾値, THs:小音閾値
発明を実施するための最良の形態
[0031] 以下、添付の図面を参照して、本発明の一実施形態に係るダイジェスト作成装置 およびそのプログラムについて説明する。本発明は、映像情報(映像信号)および/ または音声情報 (音声信号)を含むコンテンツのコンテンツ種別に応じて、そのコンテ ンッのダイジェストを作成するための要素となる部分シーンの抽出対象区間を決定す ることを特徴とするものである。そこで、本発明のダイジェスト作成装置を、映像情報 および音声情報を含むコンテンツの記録および再生を行う記録再生装置に適用した 場合を例に挙げて説明する。
[0032] 図 1は、本発明の一実施形態に係る記録再生装置 10のブロック構成図である。同 図に示すように、記録再生装置 10は、外部から、映像情報および音声情報を含むコ ンテンッと当該コンテンツに関連するコンテンツ付帯情報 (メタデータなど)とを取得 するコンテンツ取得部 20と、各種制御を行う制御部 30と、音声情報に基づく解析を 行う音声解析部 40と、各種情報を記憶する記憶部 50と、コンテンツやダイジェストの 再生を行う再生部 60と、カゝら成る。なお、「ダイジェスト」とは、コンテンツの内容を要 約した要約情報を指す。
[0033] コンテンツ取得部 20は、受信アンテナ 81から、地上波、 BS、 CS等のテレビジョン 放送を受信する場合、いわゆるチューナが主要構成要素となる。また、外部機器 82 ( 外部出力端子を有するテレビ、ビデオ再生機、 DVD再生機、パーソナルコンビユー タ、各種チューナ等)からコンテンツを取得する場合は、外部入力端子が主要構成要 素となる。なお、特に図示しないが、コンテンツ取得部 20は、インターネットなどの通 信網を介して配信される映像 Z音楽データをコンテンツとして取得することも可能で あり、その場合にはインターネット接続部分が主要構成要素となる。また、コンテンツ 取得部 20として各種半導体メモリや各種光ディスクの読み取り装置を搭載している場 合は、それらに記録されているコンテンツを取得することも可能である。
[0034] また、コンテンツ取得部 20は、映像情報および音声情報を含むコンテンツの取得 時において、同時にそのコンテンツ種別(映画、ドラマ、スポーツ番組、ニュース番組 、音楽番組等のジャンル情報)を判別 (識別)するためのコンテンツ付帯情報を取得 する。コンテンツ付帯情報としては、メタデータ (コンテンツ全体の内容に関する記述 、制作者、著作権などに関する情報などの他、コンテンツに含まれる各シーンの詳細 な情報)や、テレビジョン放送にぉ 、てコンテンツと共に配信される EPGデータ (電子 番組ガイド表)の番組情報 (番組配列情報)が含まれる。
[0035] 従って、本実施形態では、受信アンテナ 81を介して受信したコンテンツ、外部機器 82から取得したコンテンツ、インターネットなどの通信網を介して配信されたコンテン ッ、各種半導体メモリや各種光ディスクの読み取り装置によって読み取られたコンテ ンッ、の全てに、メタデータ、 EPGデータの番組情報、その他コンテンツ種別を判別 するための情報のうち少なくともいずれか 1つが付帯されていることが前提である。
[0036] 制御部 30は、記録再生装置 10の各部を統括して各種制御を行うものであり、具体 的には、取得したコンテンツを記録するコンテンツ記録部 31と、コンテンツと共に取 得したコンテンツ付帯情報に基づ!/ヽてコンテンッ種別を判別するコンテンッ種別判別 部 32と、コンテンツ種別に応じて部分シーン (ダイジェストを作成するための要素とな るシーン)を抽出するための対象区間を決定する対象区間決定部 33と、対象区間か ら部分シーンを抽出する部分シーン抽出部 34と、抽出した部分シーンに基づいてダ イジエストを再生するための情報 (以下、「ダイジェスト再生情報」と称する)を作成する ダイジェスト作成部 35と、を備えている。
[0037] 音声解析部 40は、コンテンツの中からハイライトシーン(=ハイライト区間 =大音圧 区間)を検索する大音圧区間検索部 41を備えている。この「ハイライトシーン」とは、ス ポーッ番組の試合結果やドラマの結末など、視聴者が最も興味をそそられるシーン や盛り上がるシーンなど、そのコンテンツの特徴的なシーンを指す。本実施形態では 、このハイライトシーンを音声情報に基づいて検索する。すなわち、音声によって盛り 上がりを判断する。
[0038] 音声解析部 40は、コンテンツに含まれる音声情報 (音声波形情報)を解析して、単 位時間あたりの平均音圧レベル (以下、単に「音圧レベル」と称する)を算出し、図 2 等に示すような音圧レベル波形を生成する。そして、大音圧区間検索部 41は、この 生成された音圧レベル波形に基づいて、所定の閾値 (以下、「大音閾値」と称する) 以上となる区間 (以下、「大音圧区間」と称する)を検索する。
[0039] 記憶部 50は、上記のコンテンツ記録部 31によって記録されたコンテンツの記録デ ータ(以下、「コンテンツ記録データ」と称する)を記憶するコンテンツ記録データ記憶 部 51と、大音圧区間検索部 41の検索結果を記憶する大音圧区間記憶部 52と、対 象区間決定部 33によって決定された対象区間の開始点のアドレスと対象区間の区 間長とを示すデータを記憶する対象区間記憶部 53と、ダイジェスト作成部 35によつ て作成されたダイジェスト再生情報を記憶するダイジェスト再生情報記憶部 54と、を 備えている。なお、記憶部 50は、ハードディスク、各種半導体メモリ、各種光ディスク 等により構成可能であり、その種類は問わない。
[0040] 再生部 60は、記録したコンテンツを再生するコンテンツ再生部 61と、ダイジェストを 再生するダイジェスト再生部 62と、を備えている。コンテンツ再生部 61は、上記のコ ンテンッ記録データ記憶部 51から読み出したコンテンッ記録データに基づ!/、てコン テンッを再生し、表示装置 91に表示させる。また、ダイジェスト再生部 62は、上記の ダイジェスト再生情報記憶部 54から読み出したダイジェスト再生情報と、上記のコン テンッ記録データとに基づいてダイジェストを再生し、同じく表示装置 91に表示させ る。
[0041] ここで、上記のとおり構成された記録再生装置 10の一連の処理について、図 2に示 す音圧レベル波形の一例を参照して説明する。例えば、リモコン等の UI (ユーザイン ターフェース)入力装置 92を用いて、ユーザ (視聴者)力もコンテンツの記録が指示さ れた場合、記録再生装置 10は、コンテンツ取得部 20を介してコンテンツを取得し、コ ンテンッ記録部 31によってこの取得したコンテンツを記録する。
[0042] また、記録再生装置 10は、コンテンツの記録に同期して、大音圧区間検索部 41に より大音圧区間を検索する。具体的には、音圧レベルが大音閾値 (THb)以上となる 大音圧区間を検索し、その開始点 (DHs)のアドレスとその区間長 (hi)とを示すデー タを取得する。すなわち、図 2に示す例の場合、第 1大音圧区間、第 2大音圧区間、 第 3大音圧区間の開始点(DHsl, DHs2, DHs3)のアドレスと、その区間長(hll, h 12, hl3)とを示すデータを、大音圧区間記憶部 52に記憶する。
[0043] コンテンツの記録を終了すると、そのコンテンツ記録データはコンテンツ記録データ 記憶部 51に格納しておく。また、コンテンツ種別判別部 32により、コンテンツと共に 取得したコンテンツ付帯情報 (メタデータや、 EPGデータの番組情報など)に基づい てコンテンツ種別を判別し、その判別結果に基づいて、対象区間決定部 33により、 部分シーンの抽出対象となる対象区間を決定する。また、決定した対象区間の開始 点のアドレスとその区間長とを示すデータを、対象区間記憶部 53に記憶する。
[0044] ここでは、コンテンツの種別(ジャンル)力 映画、ドラマ、スポーツなどストーリー性 のあるものである場合、全コンテンツ区間(コンテンツの録音時間に相当)の前半部 分を対象区間とする。これは、ストーリー性のあるコンテンツの場合、その結果がダイ ジェストに含まれないようにするためである。具体的には、図 2に示すように、コンテン ッの全コンテンツ区間(区間長: T,開始点: Ds,終了点: De)の開始点 Dsから、全コ ンテンッ区間の区間長 Tと定数 |8 (0< j8≤1)とを乗算して得られる時間だけ経過し た時点までの区間(区間長: P1 =T* )を対象区間として決定する。なお、このよう にストーリー性のあるコンテンツの場合、 βの値は 0. 5〜0. 7程度であることが好まし い。また、コンテンツ種別が映画、ドラマ、スポーツ以外の場合は、全コンテンツ区間 を対象区間とする( β = 1とする)。
[0045] 続いて、部分シーン抽出部 34により、大音圧区間記憶部 52に記憶されているデー タに基づいて、ダイジェストに含めるための部分シーンを抽出する。図 2の場合、大音 圧区間が 3つ存在するが (第 1大音圧区間〜第 3大音圧区間)、各大音圧区間の開 始点(DHsl, DHs2, DHs3)に基づいて、 3つの部分シーンを抽出することとなる。 但し、上記のとおり、コンテンツ種別が映画、ドラマ、スポーツの場合は、部分シーン を抽出する対象区間がコンテンツの開始点から区間長 P1の区間となるため、その区 間長 P1内に存在する部分シーンのみが抽出対象となる。
[0046] 従って、図 2の例の場合、部分シーンとしては、第 1大音圧区間の開始点(DHsl) 力も所定時間 ta遡った時点を開始点 (DPsl)とすると共に、第 1大音圧区間の開始 点(DHsl)から所定時間 tb (但し、 ta>tb≥0)遡った時点を終了点(DPel)とする 区間(区間長: tpl)の第 1部分シーンと、第 2大音圧区間の開始点 (DHs2)から所定 時間 ta遡った時点を開始点 (DPs2)とすると共に、第 2大音圧区間の開始点 (DHs2 )力も所定時間 tb遡った時点を終了点 (DPe2)とする区間(区間長: tp2)の第 2部分 シーン (いずれも、図示斜線部)を抽出することとなる。なお、 ta, tbの値は定数であ るため、抽出される部分シーンの区間長 tpは、いずれも tp = ta— tbである。
[0047] 続いて、ダイジェスト作成部 35により、部分シーン抽出部 34の抽出結果に基づい て、ダイジェスト再生情報を作成する。ダイジェスト作成部 35では、部分シーン抽出 部 34により複数の部分シーンが抽出された場合、各部分シーンを抽出する基準とな る大音圧区間の区間長 (hi)に応じて、優先順位を付け、優先順位の高いものからダ イジヱストに組み込んでいく。例えば、図 2に示すように、 2つの部分シーン (第 1部分 シーン,第 2部分シーン)を抽出した場合、各部分シーンに対応する大音圧区間 (第 1大音圧区間,第 2大音圧区間)の区間長の長い順 (hl2→hll)にダイジェストに組 み込んでいく。従って、部分シーンの優先順位は、第 2部分シーン→第 1部分シーン となり、各部分シーンの開始点(DPs2, DPsl)のアドレスと区間長(tp2, tpl)とを示 す区
間データを、ダイジェスト再生情報として、ダイジェスト再生情報記憶部 54に記憶する
[0048] 一方、ユーザが見た 、番組を検索するために、 UI入力装置 92を用いて、ダイジェ ストの再生を指示した場合、ダイジェスト再生部 62は、コンテンツ記録データ記憶部 5 1力 読み出したコンテンツ記録データの中から、ダイジェスト再生情報に含まれる区 間データに該当する区間を読み出して、ダイジェストを再生する。なお、ダイジェスト 再生情報とコンテンツ記録データとに基づ 、てダイジェストを作成するのではなく、ダ イジエストを作成するためのデータを別途作成し、そのデータに基づ 、てダイジェスト を再生することも可能である。
[0049] また、ユーザにより、ダイジェストの再生中において、コンテンツの再生指示が為さ れた場合は、そのダイジェストを作成する基となったコンテンツを、コンテンツ再生部 6 1により再生する。なお、必ずしもダイジェストを再生させる必要はなぐ表示装置 91 にコンテンツリストを表示しておき、その中力もユーザが選択したコンテンツを再生す ることち可會である。
[0050] また、ユーザは、 UI入力装置 92を用いて、大音圧区間を検索するための基準とな る大音閾値 (THb)の値を設定することが可能である。設定された大音閾値の値は、 記憶部 50内に記憶され、大音圧区間検索部 41の検索時において参照される。なお 、大音閾値以外にも、ユーザは UI入力装置 92を用いて、作成するダイジェストの全 体長さや、抽出する部分シーンの開始点や終了点を決定するための値 (ta, tb)を設 定可能となっている。但し、これら大音閾値、ダイジェストの全体長さ、 ta, tbの値は、 ユーザによって特に設定されな!ヽ場合、デフォルトの設定値を利用する。
[0051] 次に、図 3のフローチャートを参照し、大音圧区間検索部 41による大音圧区間の検 索処理について説明する。当該処理は、コンテンツの記録に同期して、単位時間毎( 例えば 1Z60秒毎)に実行される。同図に示すように、まず単位時間における音圧レ ベルが、設定されている大音閾値以上であるか否かを判別する(S01)。大音閾値以 上でない場合(SOI :No)、 1つ前の単位時間は大音閾値以上であつたか否かを判 別し (S02)、大音閾値以上であった場合は (S02 :Yes)、大音圧区間の終了点を設 定する(S03)。
[0052] 一方、 S01において、今回検索対象となっている単位時間の音圧レベルが大音閾 値以上であると判別した場合は(S01: Yes)、 1つ前の単位時間も大音閾値以上で あった力否かを判別し (S04)、大音閾値以上でな力つた場合は(S04 : No)、大音圧 区間の開始点を設定する (S05)。
[0053] 大音圧区間の開始点または終了点の設定後、若しくは S04において、 1つ前の単 位時間が大音閾値以上であつたと判別した場合や(S04 : Yes)、 S02において、 1つ 前の単位時間が大音閾値以上でな力つたと判別した場合は(S02 :No)、コンテンツ の記録を終了した力否かを判別し(S06)、終了していない場合は(S06 : No)、上記 の処理を繰り返す。
[0054] また、記録を終了した場合は(S06: Yes)、 S05で大音圧区間の開始点を設定して V、れば大音圧区間の終了点が設定されて 、る力否かを判別し (S07)、設定されて!、 ない場合は(S07 :No)、大音圧区間の終了点を設定して (S08)、処理を終了する。 すなわち、大音圧区間の終了点が設定されないまま記録を終えた場合は終了点を 設定して、処理を終了する。
[0055] 次に、図 4のフローチャートを参照し、ダイジェスト作成部 35による本実施形態のダ イジェスト作成処理について説明する。上記のとおり、ダイジェスト作成処理はコンテ ンッの記録開始 (ユーザによる記録指示、若しくは予約記録の場合はその指定時間 の計時)に伴って、処理を開始する(Sl l)。そして、周期的に記録終了か否かを判 別し (S12)、記録終了でない場合は(S12 :No)、コンテンツの音圧レベル力 大音 閾値 (THb)以上となる大音圧区間を検索する(S13)。なお、これら S12および S13 の処理は、図 3に示した大音圧区間の検索処理に相当するものである。
[0056] この検索を記録終了まで繰り返すと(S12: Yes)、取得したコンテンツ付帯情報に 基づいて、コンテンツ種別が映画、ドラマ、スポーツのいずれであるかを判別する(S1 4)。ここで、コンテンツ種別がこれらに該当すると判別した場合は(S14 :Yes)、対象 区間の区間長 P1を、 Pl =全コンテンツ区間 T*定数 |8の計算式力 求め、コンテン ッの開始点 Dsから区間長 P1の時点までを対象区間として決定する(S15)。一方、コ ンテンッ種別がこれらに該当しないと判別した場合は(S14 :No)、全コンテンツ区間 (区間長: T)を対象区間として決定する (S16)。
[0057] そして、対象区間に存在する部分シーン(図 2の例の場合、第 1部分シーン,第 2部 分シーン)に対し、それを抽出する基準となった大音圧区間 (第 1大音圧区間,第 2 大音圧区間)の区間長 (hll, hl2)に比例した優先度をつけ、抽出する部分シーンの 開始点を決定する(S 17)。すなわち、図 2の例の場合、 [DPs2, DPsl]を決定する 。さらに、優先度の高いものから、部分シーンの終了点(DPe)を決定し、ダイジェスト に組み込む (ダイジェスト再生情報に組み込む, S18)。すなわち、図 2の例の場合、 まず [DPe2]を決定し、第 2部分シーンをダイジェストに組み込む。
[0058] さらに、ダイジェストに組み込む度に、抽出した部分シーンの合計(区間長の合計) 力 ダイジェストの全体長さ (ダイジェストの全再生時間)を超えているか否かを判別し (S19)、超えていない場合は(S19 :No)、次に優先度の高い部分シーンの終了点 を決定し、その部分シーンをダイジェストに組み込んでいく(S18)。
[0059] また、抽出した部分シーンの合計力 ダイジェストの全体長さを超えた場合は(S19 : Yes)、最後にダイジェストにカ卩えた部分シーンを削除する(S20)。これは、ダイジェ ストの全体長さが予め所定時間内に定められているためであり、時間に制限が無い 場合は (ユーザの設定により、ダイジェストの再生時間の制限を無くすことも可能であ る)、 S19および S20に代えて、抽出した全ての部分シーンをダイジェストに組み込む 。また、ダイジェストの全体長さが予め所定時間内に定められている場合でも、全て の部分シーンの組み込みを終了した場合(図 2の例の場合、第 2部分シーンと第 1部 分シーンの組み込みを終了した場合)は、ダイジェストの全体長さとして定められてい る所定時間に達しなくとも、次の工程 (S21)に移行する。
[0060] そして、最後に抽出した部分シーンを時系列に従って並び替えを行い(S21)、処 理を終了する。すなわち、図 2の例の場合、第 2部分シーン→第 1部分シーンの順に ダイジェストに組み込まれることとなる力 これを第 1部分シーン→第 2部分シーンの 順に並び替える。
[0061] 以上のとおり、本実施形態によれば、コンテンツ種別(ジャンル)に応じて、コンテン ッのダイジェストを作成するための要素となる部分シーンの抽出対象区間を決定する ことができる。従って、例えばスポーツ番組やドラマなど、ストーリー性のあるコンテン ッの場合は、コンテンツの前半部分を対象区間とすることで、それらの結末がダイジ ェストに含まれることを避けることができ、コンテンツ種別に応じた適切なダイジェスト を作成することができる。
[0062] また、大音圧区間の開始点 (DHs)から所定時間 ta遡った時点を開始点 (DPs)と すると共に、大音圧区間の開始点 (DHs)力も所定時間 tb (但し、 ta>tb≥0)遡った 時点を終了点(DPe)とする区間(区間長: tp)を、ダイジェストに組み込むための部分 シーンとして抽出するため、ハイライトシーン前のシーン、すなわちユーザが最も興味 をそそられるシーンや盛り上がるシーンをダイジェストに組み込むことができる。また、 ハイライトシーンそのもの(例えば、スポーツの試合結果やドラマの結末な)をダイジェ ストに含めないため、作成されたダイジェストの視聴によって、ユーザの視聴意欲が 損なわれることがない。
[0063] また、ダイジェスト作成処理にぉ 、ては、コンテンツの記録に伴って大音圧区間を 検索するため、記録終了時には、大音圧区間の検索を終えた状態となる。従って、コ ンテンッの記録後に、再度コンテンツを読み出して大音圧区間を検索する必要が無 ぐその分ダイジェストの作成に要する時間を短縮することができる。
[0064] また、ダイジェストの再生は、コンテンツ記録データの中力 ダイジェスト再生情報( 1以上の区間データ (部分シーンの開始点を示すアドレスとその区間長とを示すデー タ)から成る)に該当する部分シーンを読み出すことによって行うため、コンテンツ記 録データの一部を抽出したダイジェスト用のデータを作成して、コンテンツ記録デー タとは別に保存しておくといった必要が無い。このため、ダイジェスト保存用のメモリ( ダイジェスト再生情報記憶部 54)としては、ダイジェスト再生情報を保存するだけの容 量で済む。
[0065] また、ダイジェストに組み込む部分シーンは、これを抽出した基準となる大音圧区間 の区間長に応じた優先順位に従って決定するため、ハイライトシーンの長いもの、す なわち盛り上がりのより大きいシーンを優先的にダイジェストに組み込むことができ、 ひいてはユーザの視聴意欲をより高めることができる。
[0066] また、抽出した複数の部分シーンは、時系列に従って並び替えるため、ダイジェスト を再生する際に、連続して再生される部分シーンが時間的に前後するといつた違和 感を無くし、より番組予告編に近いダイジェストを作成することができる。
[0067] なお、上記の例では、コンテンツ種別として、コンテンツのジャンルが、映画、ドラマ 、スポーツのいずれかに該当するか否かによって対象区間を決定した力 ジャンル毎 に βの値を決定しても良い。すなわち、ジャンル毎に対象区間を決定しても良い。ま た、ジャンル別に分類するのではなぐコンテンツの内容 (番組検索を行う場合のキー ワードなど)、出演者、コンテンツの放送日時、コンテンツの放送曜日など、種々の基 準で分類したコンテンツ種別に応じて対象区間( βの値)を決定しても良い。
[0068] また、上記の例では、対象区間は、コンテンツの開始点から区間長 PI (P1 =Τ* β )経過した時点までであるものとした力 コンテンツの中盤、さらには後半など、任意の 区間を対象区間とすることも可能である。また、対象区間は 1区間に限らず、複数の 区間を対象区間とすることも可能である。
[0069] また、上記の例では、部分シーンの区間長 tpは、コンテンツ種別に拘わらず一定の 長さ(tp=ta—tb)であるものとした力 コンテンツ種別に応じて taおよび tbの値を可 変するようにしても良い。例えば、コンテンツが音楽番組である場合は、部分シーンが 3〜5秒程度の長さであれば、出演しているアーティストを把握することができ、コンテ ンッがスポーツ番組なら、 10秒程度でパスの流れや、投球シーン、解説者の話など 力 流れを理解することができる力 このように部分シーンの区間長をコンテンツ種別 に応じて異なる長さとすることで、コンテンツの内容等に応じた適切な長さの部分シ ーンを抽出することができる。
[0070] また、上記の例では、大音圧区間の前のシーンを部分シーンとして抽出するものと したが、記録したコンテンツが再生済みであるか否かに応じて、部分シーンの抽出の 仕方を変えるようにしても良い。この場合、記録したコンテンツが未再生である場合は 、対象区間力 大音圧区間を除いた残区間の中から部分シーンを抽出し、記録した コンテンツが再生済みである場合は、大音圧区間を含む部分シーンを抽出すること が好ましい。すなわち、未再生の場合は、視聴意欲を損ねないように、ハイライトシ一 ン (大音圧区間)を避けて部分シーンを抽出し、再生済みの場合は、内容をより把握 できるように、ノ、イライトシーンを含む部分シーンを抽出することにより、再生済みであ る力否かに応じて適切なダイジェストを作成することができる。但し、この場合は、コン テンッの再生に伴って、コンテンツ記録終了後に作成したダイジェスト再生情報 (未 再生時に用いられるダイジェスト用)を更新する力 コンテンツ記録終了時に、未再生 時用と再生済み用の 2つのダイジェスト再生情報を作成しておく必要がある。
[0071] また、上記の例では、大音圧区間、対象区間、部分シーン (ダイジェスト再生情報) など、各区間の開始点のアドレスとその区間長とを示すデータを記憶するものとした 力 これに代えて各区間の開始点と終了点のアドレスを記憶しても良い。
[0072] また、上記の例では、コンテンツとコンテンツ付帯情報とを同時に取得するものとし た力 これらを異なる時間に取得しても良い。例えば、コンテンツのみを先に取得し、 インターネット等の通信網を介して所定の Webサイトから、取得したコンテンツのコン テンッ付帯情報を読み出すようにしても良い。また、コンテンツ付帯情報を取得する のではなぐコンテンツに含まれる映像情報および/または音声情報に基づいて、コ ンテンッ種別を推定するようにしても良い。当該コンテンツ種別の推定は、映像解析 技術または音声解析技術を用いて、予め用意してお!、たコンテンツジャンルの特徴 量との比較によって実現可能である。
[0073] また、上記の例では、抽出した部分シーンが対象区間に含まれるものを、抽出対象 とするものとした力 仮に部分シーンの一部だけが対象区間に含まれる場合は (言い 換えれば部分シーンの一部が対象区間に含まれない場合でも)、その部分シーンの 開始点から終了点までを、抽出するようにしても良い。また、逆に部分シーンの全体 が対象区間に含まれな 、場合は、その部分シーンの抽出を行わな 、ようにしても良 い。さらに、部分シーンの一部が対象区間に含まれる割合によつて抽出する力否か を決定しても良い。
[0074] さらに、部分シーンではなぐ大音圧区間が対象区間に含まれる否かによって抽出 するカゝ否かを決定しても良い。例えば、大音圧区間の全体が対象区間に含まれるも のを抽出対象とする場合、図 2に示した例では、第 2大音圧区間(開始点 DHs2,終 了点 DHe2)の全体が対象区間に含まれないため、対象区間内に存在する第 1大音 圧区間(開始点 DHsl,終了点 DHel)に基づく第 1部分シーン(区間長: tpl,開始 点 DPsl,終了点 DPel)のみを抽出することとなる。
[0075] また、上記の例では、音圧区間の開始点 (DHs)から所定時間 ta遡った時点を部分 シーンの開始点(DPs)としたが(図 2参照)、抽出する部分シーンの開始点(DPs)を 、抽出する基準となる大音圧区間の区間長 hiに比例して、決定しても良い。これは、 ノ、イライトシーンが長 、場合は、一般にその前段となるシーンも長 、と考えられるため である。この場合、部分シーンの開始点(DPs)を決定するための所定時間 ta'は、図 5に示すように、大音圧区間の開始点 (DHs)から、大音圧区間の区間長 hl (hl>0) と、定数 α (0< α≤1)とを乗算した値により決定することができる。
[0076] 一方、上記の例では、大音圧区間の開始点 (DHs)から所定時間 tb遡った時点を 部分シーンの終了点(DPe)とするものとした力 図 5に示すように、部分シーンの終 了点は、部分シーンの開始点(DPs)から、当該部分シーンの区間長に相当する所 定時間 tp' (tp,≤hl* α )だけ経過した時点として、決定するようにしても良い。この 構成によれば (図 2の例の場合も同様であるが)、大音圧区間の長さに関わらず、一 定の長さ(区間長: tp' )の部分シーンを抽出することになるため、ダイジェストに複数 の部分シーンが含まれる場合、シーン長が一定のバランスの良いダイジェストを作成 することができる。
[0077] 一方、部分シーンの区間長を一定とするのではなぐ大音圧区間の区間長 hiに応 じて部分シーンの区間長を可変しても良い。この場合、例えば部分シーンの開始点( DPs)を、大音圧区間の区間長 hiに応じて決定し (大音圧区間の開始点 (DHs)から (hi * α )だけ遡った時点)、部分シーンの終了点 (DPe)を、大音圧区間の開始点( DHs)から一定時間 tbだけ遡った時点として決定しても良い(図示省略)。また、この 場合、所定時間 tbの値を 0とすれば、大音圧区間の区間長 hiに比例して部分シーン の区間長を決定することができる。これらの構成によれば、ハイライトシーンの長さに 応じて、興味深いと考えられる部分シーンをより長ぐダイジェストの 1シーンとして再 生させることができる。 [0078] また、上記の例では、大音圧区間の開始点 (DHs)を基準にして、部分シーンを抽 出しているため、所定時間 ta, tbの値や音圧レベル波形によっては、抽出した部分 シーンが重なってしまう場合がある。図 6は、その一例を示したものであるが、第 1大 音圧区間(区間長: hll)に基づいて抽出した第 1部分シーン(区間長: tpl,図示左 下がり斜線部)の後半と、第 2大音圧区間(区間長: hl2,図示右下がり斜線部)に基 づ 、て抽出した第 2部分シーン(区間長: tp2)の前半が重なって 、る。このような場 合、第 1部分シーンの開始点(DPsl)力も第 2部分シーンの終了点(DPe2)までを、 1つの部分シーンとして抽出することが好ましい(図示(1)参照)。
[0079] 但し、同図の例の場合、第 2部分シーン(開始点: DPs2,終了点: DPe2)が第 1大 音圧区間(開始点: DHsl,終了点: DHel)と重なっているため、その重複した区間( DHsl〜DHel)は、部分シーンから削除することが好ま 、(図示(2)参照)。
[0080] さらに、この削除によって、抽出される部分シーンは、 DPsl〜DHsl, DHel〜DP e2までとなる力 DHel〜DPe2のように、抽出した部分シーンの区間長がごく僅かと なる場合 (人間が視聴してその内容を把握できない程度、例えば 2秒以下など)は、 部分シーンとして抽出しないことが好ましい。従って、図 6に示す例の場合、最終的に 区間 DPsl〜DHslを部分シーン(区間長: tp,開始点: DPs,終了点: DPe)として 抽出することが好ま U、(図示 (3)参照)。
[0081] これらの構成によれば、抽出した部分シーンが重なってしまった場合でも、ダイジェ スト中に同じシーンが含まれることがない。また、抽出した部分シーンに大音圧区間 が含まれるような場合は、その大音圧区間と重なるシーンを削除するため、コンテンツ の結果が判ってしまうようなことが無ぐユーザの視聴意欲を損ねることがない。また、 ごく僅かなシーンの抽出を無くすことができるため、ユーザに違和感を与えないダイ ジェストを作成することができる。
[0082] また、上記の例では、図 2に示すように、大音圧区間の区間長の長いものから、部 分シーンの優先度を決定するものとしたが、逆に大音圧区間の区間長の短いものを 優先しても良い。この構成によれば、ハイライトシーンの長さの短いものを優先的にダ イジェストに組み込むことで、コンテンツの結末がより想定しづら 、ダイジェストを作成 することができる。 [0083] 一方、図 7に示すように、区間長 hiの長いものを優先とするだけでなぐ大音閾値( THb)を超えた音圧レベルの値も考慮して、優先度を決定するようにしても良い。す なわち、大音圧区間における単位時間あたりの音圧レベルの累計(図示網掛部 HI, H2, H3の面積に相当)によって、優先度を決定しても良い。従って、図 7に示す例 では、優先順位が、第 3部分シーン→第 2部分シーン→第 1部分シーンとなる。この 構成によれば、盛り上がりの長さだけでなぐ盛り上がりの程度に応じて、抽出する部 分シーンを決定することができる。
[0084] また、上記の例では、音圧レベルに基づいて、大音圧区間を検索するものとしたが 、コンテンツ付帯情報にメタデータが含まれる場合、当該メタデータも考慮して、ハイ ライトシーンを検索するようにしても良い。例えば、コンテンツが、サッカーの試合映像 の場合、メタデータは、シュート 'コーナーキックなどの試合の動きを示す情報がシー ン毎に記録されているため、この各シーンの詳細情報を利用して、ハイライトシーンを 検索し、そのハイライトシーンに基づいて部分シーンを抽出するようにしても良い。こ の構成によれば、より的確にハイライトシーンを検索することができる。
[0085] また、メタデータ以外にも、映像情報も考慮して、ハイライトシーンを検索するように しても良い。この場合、例えば映像に顔領域が含まれているシーン、シーンチェンジ が早 、シーン、テロップなど文字情報が表示されて 、るシーンなどを画像解析によつ て調査し、それらのシーンを優先的に部分シーンに含めることが好ましい。
[0086] また、上記の例では、大音圧区間を避けて部分シーンを抽出するものとしたが、大 音圧区間か否かに拘わらず、対象区間内から 1以上の部分シーンを任意に抽出する ことも当然可能である。
[0087] 次に、図 8ないし図 10を参照し、本発明の第 2実施形態について説明する。上記の 第 1実施形態では、取得したコンテンツのコンテンツ種別に応じて、部分シーンを抽 出する対象区間を決定するものとした力 本実施形態では、コンテンツが所定のコン テンッ種別である場合、コマーシャルシーンを含む本編外シーンの直後の所定区間 を、部分シーンとして優先的に抽出することを特徴とする。そこで、上記実施形態と異 なる点を中心に説明する。
[0088] 図 8は、本実施形態に係るブロック構成図であり、図 9は、本実施形態を説明するた めの一例となる音圧レベル波形を示したものである。図 8に示すように、本実施形態 に係る録音再生装置 10は、第 1実施形態のブロック構成図と比較すると、制御部 30 に本編外シーン抽出部 36を備え、音声解析部 40に小音圧区間検索部 42を備え、 さらに記憶部 50に小音圧区間記憶部 55と、本編外シーン記憶部 56とを備えた点で 異なる。
[0089] 小音圧区間検索部 42は、コンテンツの中から、音声情報に基づいて算出した音圧 レベルが、所定の小音閾値 (THs)以下となる小音圧区間を検索する(図 9参照)。当 該所定の小音閾値 (THs)は、ユーザの設定によって変更可能であるが、特に設定 が為されていない場合はデフォルト値を用いる。なお、小音圧区間検索部 42におけ る処理は、図 3に示した大音圧区間の検索処理において、「大音圧区間」を「小音圧 区間」に、また「大音閾値以上」を「小音閾値以下」に読み替えた処理に相当する。す なわち、実質的な処理内容は同様であるため、詳細な説明は省略する。
[0090] また、小音圧区間記憶部 55は、小音圧区間検索部 42の検索結果、すなわち各小 音圧区間の開始点のアドレスとその区間長とを示すデータを記憶する。
[0091] 本編外シーン抽出部 36は、大音圧区間検索部 41と、小音区間検索部 42との検索 結果に基づいて、全コンテンツ区間から、本編外シーンを抽出する。具体的には、小 音圧区間記憶部 55に記憶されているデータに基づいて、小音圧区間が所定間隔( 例えば 15秒間隔など)で存在する区間を、コマーシャルシーンと判断し、最初の小音 圧区間の開始点 (DCs)から最後の小音圧区間の終了点 (DCe)までを本編外シー ンとして抽出する(図 9参照)。
[0092] 本編外シーン記憶部 56は、本編外シーン抽出部 36の抽出結果、すなわち各本編 外シーンの開始点のアドレスとその区間長とを示すデータを記憶する。なお、本編外 シーンとは、コマーシャルシーンの他、天気予報や番糸且コーナーなど、コンテンツの 本編ではないと考えられる区間を指す。
[0093] そして、本実施形態に係る部分シーン抽出部 34は、コンテンツ種別判別部 32によ り所定のコンテンツ種別(例えば、アニメなど)と判別した場合、図 9に示すように、本 編外シーン抽出部 36により抽出された本編外シーンの直後の所定区間を、重要部 分シーン(区間長: tpi,開始点: DPis,終了点: DPie)として抽出する。なお、所定の コンテンツ種別でないと判別した場合は、第 1実施形態で示したように、大音圧区間 のみに基づいて部分シーンを抽出する。但し、本実施形態では本編外シーンに含ま れる大音圧区間は(図示 A, B)、部分シーンの抽出対象外とする。
[0094] さらに、本実施形態に係るダイジェスト作成部 35は、上記の本編外シーン直後の重 要部分シーンの優先度を最大値に設定して、ダイジェスト再生情報を作成する (ダイ ジェストに組み込む)。これは、コンテンツ種別がアニメの場合、コマーシャル直後に アニメの題目やテロップが表示されることが多いため、これをダイジェストに含めること で、ユーザがより的確に内容を把握できるようにするためである。なお、対象区間から 、複数の重要部分シーンを抽出した場合は、時系列順に優先度が決定される。すな わち、 0時から 1時までの番組を記録した場合であって、その全区間が対象区間であ り(コンテンツ種別が映画、ドラマ、スポーツ以外の場合)、且つ 15分おきにコマーシ ャルが放送されるような場合は、 0時 15分付近で放送されたコマーシャルの直後のシ ーンを、最も優先度が高い重要部分シーンとして抽出し、 0時 30分付近で放送され たコマーシャルの直後のシーンを、次に優先度が高い重要部分シーンとして抽出す ることとなる。
[0095] ここで、図 10のフローチャートを参照し、ダイジェスト作成部 35による本実施形態の ダイジェスト作成処理について説明する。なお、各工程に括弧書きで示した参照番 号は、図 4のフローチャートに示した参照番号と同様の処理であることを意味するもの であり、それらの詳細な説明は適宜省略する。
[0096] 本実施形態にぉ 、ても、コンテンツの記録開始に伴って、ダイジェスト作成処理を 開始する(S31)。そして、記録終了となるまで、コンテンツの音圧レベルが大音閾値 ( THb)以上となる大音圧区間と、音圧レベルが小音閾値 (THs)以上となる小音圧区 間とを検索する(S32, S33)。
[0097] 記録を終了すると(S32 : Yes)、コンテンツ種別がアニメである力否かを判別し(S3 4)、アニメである場合は(S34 : Yes)、全コンテンツ区間(区間長: P1)を対象区間( 区間長: T)と決定する。また、小音圧区間の検索結果に基づいて、本編外シーンを 抽出し、その後の所定区間を優先度最大の部分シーンとして決定する(S35)。なお 、図 9の例は、コンテンツ種別がアニメである場合を示したものである。 [0098] 一方、コンテンツ種別がアニメでない場合は(S34 :No)、さらにコンテンツ種別が、 映画、ドラマ、スポーツであるか否かを判別し (S36)、コンテンツ種別がこれらに該当 する場合は(S36 : Yes)、対象区間の区間長 P1を、 P1 =全コンテンツ区間 T*定数 βの計算式から求め、コンテンツの開始点 Dsから区間長 P1の時点までを対象区間 として決定する(S37)。一方、コンテンツ種別がこれらに該当しないと判別した場合 は(S36 :No)、全コンテンツ区間(区間長: T)を対象区間として決定する(S38)。
[0099] そして、大音圧区間の検索結果に基づいて、部分シーンを抽出すると共に当該部 分シーンに優先度を付け、さらに本編外シーンの検出結果力 も重要部分シーンを 抽出して、その優先度を最大に設定し、各部分シーンの開始点(DPs, DPis)を優先 度に従って決定する(S39)。続いて、優先度の高いものから、部分シーンの終了点( DPe, DPie)を決定し、ダイジェストに組み込む(S40)。すなわち、図 9の例の場合、 まず重要部分シーンの開始点 [DPis]と重要部分シーンの終了点 [DPie]を決定し、 重要部分シーンをダイジェストに組み込む。
[0100] そして、抽出した部分シーンの合計(区間長の合計)が、ダイジェストの全体長さを 超える力否かを判別し (S41)、超えていない場合は(S41: No)、次に優先度の高い 部分シーンの終了点を決定し、ダイジェストに組み込む(S40)。すなわち、図 9の例 の場合、部分シーンの開始点 [DPs]と部分シーンの終了点 [DPe]を決定し、部分シ ーンをダイジェストに糸且み込む。
[0101] このようにして、抽出した部分シーンの合計力 ダイジェストの全体長さを超えた場 合 (S41 : Yes)、最後にダイジェストに加えた部分シーンを削除する(S42)。また、全 ての重要部分シーンまたは部分シーンの組み込みを終了した場合は、 S41および S 42を省略して S43に移行する。さらに、抽出した重要部分シーンおよび Zまたは部 分シーンを時系列に従って並び替えを行い(S43)、処理を終了する。
[0102] 以上のとおり、本実施形態によれば、コンテンツ種別が所定のものである場合、小 音圧区間の検索結果に基づいて抽出された本編外シーンの直後のシーンを重要部 分シーンとして優先的にダイジェストに含めることができる。従って、例えばコンテンツ がアニメの場合に、コマーシャル直後のシーンを優先的にダイジェストに含めるなど、 コンテンツ種別に応じて、適切なダイジェストを作成することができる。 [0103] なお、上記の例では、コンテンツ種別がアニメの場合、対象区間を全コンテンツ区 間としたが(S 35)、アニメにおいても映画やドラマのように結果が含まれると好ましく ない場合があるため、対象区間を P1に絞っても良い(S37参照)。
[0104] また、上記の例では、小音圧区間が所定間隔で存在する区間を、本編外シーンと して抽出するものとしたが、過去に提案されている各種コマーシャル検出方法を適用 して、本編外シーンを抽出するようにしても良い。すなわち、映像情報に基づくシーン チェンジや、放送モード(2力国語放送である力否力、ステレオ放送である力否かなど )に基づいて検出したコマーシャルシーンを、本編外シーンとして抽出しても良い。
[0105] また、上記の例では、コンテンツ種別に応じて、部分シーンを抽出する対象区間と、 部分シーンの抽出の仕方 (本編外シーン直後の所定区間を抽出する力否力)との両 方を替えるものとした力 コンテンツ種別に拘わらず、対象区間を全て全コンテンツ区 間としても良い。すなわち、コンテンツ種別に応じて、部分シーンの抽出の仕方だけ を替えるようにしても良い。
[0106] その他、上記の第 1実施形態にお!、て記載した種々の変形例を、本実施形態にも 適用可能である。
[0107] 以上、第 1実施形態および第 2実施形態において説明したとおり、本発明によれば 、コンテンツ種別が所定のものである場合(映画、ドラマ、スポーツの場合など)は、コ ンテンッのダイジェストを作成するための要素となる部分シーンの抽出対象区間をコ ンテンッの前半部分とするなど、コンテンツ種別に応じて対象区間を決定するため、 コンテンツ種別に適したダイジェストを作成することができる。また、例えばコンテンツ 種別が所定のもの(上記の所定のものと同一の種別であっても良いし異なる種別であ つても良い)である場合 (アニメの場合など)は、コマーシャルシーン (本編外シーン) の直後のシーンを重要部分シーンとして抽出するため、さらにコンテンツ種別に適し たダイジェストを作成することができる。
[0108] なお、上記の各実施形態では、映像情報および音声情報の両方を含むコンテンツ のダイジェストを作成する場合を例示したが、コンテンツ付帯情報を有するものであ れば、音声情報しカゝ含まないコンテンツ (例えば音楽やラジオ番組など)にも本発明 は適用可能である。また、逆に音声情報を含まず、映像情報し力含まないコンテンツ (例えば無声映画など)〖こも本発明は適用可能である。但し、映像情報しか含まない コンテンツの場合は、第 1実施形態の後半部分にて説明した映像情報の画像解析結 果、および/またはメタデータに基づいて、ノ、イライトシーンを検出し、その検出結果 に基づいて部分シーンを抽出することとなる。
[0109] また、上記の各実施形態に示した録音再生装置 10における各部、並びに各機能 をプログラムとして提供することも可能である。また、そのプログラムを記録媒体(図示 省略)に格納して提供することも可能である。記録媒体としては、 CD— ROM、フラッ シュ ROM、メモリカード (コンパクトフラッシュ(登録商標)、スマートメディア、メモリー スティック等)、コンパクトディスク、光磁気ディスク、デジタルバーサタイルディスク、フ レキシブルディスクおよびノヽードディスク等を利用することができる。
[0110] また、上述した実施例によらず、装置構成や処理工程等について、本発明の要旨 を逸脱しない範囲で、適宜変更も可能である。また、録音再生装置 10以外にも、ビ デォレコーダ、 DVDレコーダ、パーソナルコンピュータ等に本発明のダイジェスト作 成機能を搭載可能である。

Claims

請求の範囲
[1] 映像情報と音声情報の少なくともいずれか一方を含むコンテンツと、当該コンテンツ に付帯されているコンテンツ付帯情報とを取得するコンテンツ取得手段と、 前記コンテンツ付帯情報に基づいて、前記コンテンツの内容毎に分類されるコンテ ンッ種別を判別するコンテンツ種別判別手段と、
前記コンテンツ種別判別手段による判別結果に応じて、前記コンテンツの時間軸 上における全コンテンツ区間から、その一部または全体となる対象区間を決定する対 象区間決定手段と、
決定した前記対象区間の中から、前記コンテンツのダイジェストを作成するための 要素となる部分シーンを抽出する部分シーン抽出手段と、
抽出した前記部分シーンを用いて、前記ダイジェストを作成するダイジェスト作成手 段と、を備えていることを特徴とするダイジェスト作成装置。
[2] 前記対象区間は、前記コンテンツの開始点から、前記全コンテンツ区間と定数 β ( 0< j8≤1)とを乗算して得られる時間だけ経過した時点までの区間であり、
前記対象区間決定手段は、前記コンテンツ種別判別手段により判別された前記コ ンテンッ種別に応じて可変する前記定数 の値に基づいて、前記対象区間を決定 することを特徴とする請求項 1に記載のダイジェスト作成装置。
[3] 前記部分シーン抽出手段は、所定時間 tp (tp >0)の区間長を有する部分シーンを 抽出し、当該所定時間 tpの値は、前記コンテンツ種別判別手段により判別された前 記コンテンツ種別に応じて可変することを特徴とする請求項 1に記載のダイジェスト作 成装置。
[4] 前記全コンテンツ区間から、前記映像情報と前記音声情報の少なくともいずれか一 方に基づいて、ハイライトシーンを含むハイライト区間を検索するハイライト区間検索 手段をさらに備え、
前記部分シーン抽出手段は、前記対象区間から前記ハイライト区間を除いた残区 間の中から、前記部分シーンを抽出することを特徴とする請求項 1に記載のダイジェ スト作成装置。
[5] 取得した前記コンテンツを記録するコンテンツ記録手段と、 記録した前記コンテンツを再生する再生手段と、をさらに備え、
前記部分シーン抽出手段は、記録したコンテンツが未再生である力否かを判別し、 未再生であると判別した場合に、前記対象区間から前記ハイライト区間を除いた残区 間の中から前記部分シーンを抽出し、再生済みであると判別した場合は、前記ハイラ イト区間を含む部分シーンを抽出することを特徴とする請求項 4に記載のダイジェスト 作成装置。
[6] 前記ダイジェストを再生するダイジェスト再生手段をさらに備え、
前記ダイジェスト作成手段は、抽出した前記部分シーンの開始点を示すアドレスと 当該部分シーンの区間長とを示す区間データ力 成るダイジェスト再生情報を作成 し、
前記ダイジェスト再生手段は、前記コンテンツ記録手段による前記コンテンツの記 録データと、前記ダイジェスト再生情報とに基づ 、て前記ダイジェストを再生すること を特徴とする請求項 1に記載のダイジェスト作成装置。
[7] 前記コンテンツ取得手段は、前記コンテンツ付帯情報の少なくとも一部として、前記 コンテンツのシーン毎に記録されたメタデータを取得することを特徴とする請求項 1に 記載のダイジェスト作成装置。
[8] EPGデータを受信する EPG受信手段をさらに備え、
前記コンテンツ取得手段は、前記コンテンツ付帯情報の少なくとも一部として、前記
EPGデータに含まれる番組情報を取得することを特徴とする請求項 1に記載のダイ ジ スト作成装置。
[9] 前記ダイジェスト作成手段は、複数の部分シーンを用いて前記ダイジェストを作成 する場合、当該複数の部分シーンを、時系列に従って並び替えることを特徴とする請 求項 1に記載のダイジェスト作成装置。
[10] コンピュータを、請求項 1ないし 9のいずれ力 1項に記載のダイジェスト作成装置に おける各手段として機能させるためのプログラム。
PCT/JP2006/316512 2005-09-30 2006-08-23 ダイジェスト作成装置およびそのプログラム WO2007039995A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
EP06796676A EP1942671A4 (en) 2005-09-30 2006-08-23 DEVICE FOR GENERATING A SUMMARY AND PROGRAM THEREFOR
JP2007538661A JPWO2007039995A1 (ja) 2005-09-30 2006-08-23 ダイジェスト作成装置およびそのプログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2005-287325 2005-09-30
JP2005287325 2005-09-30

Publications (1)

Publication Number Publication Date
WO2007039995A1 true WO2007039995A1 (ja) 2007-04-12

Family

ID=37906039

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2006/316512 WO2007039995A1 (ja) 2005-09-30 2006-08-23 ダイジェスト作成装置およびそのプログラム

Country Status (3)

Country Link
EP (1) EP1942671A4 (ja)
JP (1) JPWO2007039995A1 (ja)
WO (1) WO2007039995A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009033413A (ja) * 2007-07-26 2009-02-12 Sony Corp 情報処理装置及び情報処理方法、並びにプログラム
JP2013015726A (ja) * 2011-07-05 2013-01-24 Yamaha Corp 音声記録サーバ装置及び音声記録システム
WO2023249034A1 (ja) * 2022-06-23 2023-12-28 ダイキン工業株式会社 画像処理方法、コンピュータプログラム及び画像処理装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111681640B (zh) * 2020-05-29 2023-09-15 阿波罗智联(北京)科技有限公司 播报文本的确定方法、装置、设备和介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09312827A (ja) 1996-05-22 1997-12-02 Sony Corp 記録再生装置
JPH1032776A (ja) 1996-07-18 1998-02-03 Matsushita Electric Ind Co Ltd 映像表示方法及び記録再生装置
JP2001352506A (ja) * 2000-06-07 2001-12-21 Canon Inc 録画装置及び方法及び記録装置
JP2002044572A (ja) * 2000-07-21 2002-02-08 Sony Corp 情報信号処理装置及び情報信号処理方法および情報信号記録装置
JP2003101939A (ja) * 2001-07-17 2003-04-04 Pioneer Electronic Corp 映像情報要約装置、映像情報要約方法及び映像情報要約プログラム
JP2003283993A (ja) 2002-03-27 2003-10-03 Sanyo Electric Co Ltd 映像情報記録再生装置及び映像情報記録再生方法
JP2005293212A (ja) * 2004-03-31 2005-10-20 Toshiba Corp 要約映像生成装置、要約映像生成方法及びプログラム
JP2006135808A (ja) * 2004-11-08 2006-05-25 Toshiba Corp 再生装置及びその方法
JP2006211311A (ja) * 2005-01-28 2006-08-10 Victor Co Of Japan Ltd ダイジェスト映像生成装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI259719B (en) * 2004-01-14 2006-08-01 Mitsubishi Electric Corp Apparatus and method for reproducing summary

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09312827A (ja) 1996-05-22 1997-12-02 Sony Corp 記録再生装置
JPH1032776A (ja) 1996-07-18 1998-02-03 Matsushita Electric Ind Co Ltd 映像表示方法及び記録再生装置
JP2001352506A (ja) * 2000-06-07 2001-12-21 Canon Inc 録画装置及び方法及び記録装置
JP2002044572A (ja) * 2000-07-21 2002-02-08 Sony Corp 情報信号処理装置及び情報信号処理方法および情報信号記録装置
JP2003101939A (ja) * 2001-07-17 2003-04-04 Pioneer Electronic Corp 映像情報要約装置、映像情報要約方法及び映像情報要約プログラム
JP2003283993A (ja) 2002-03-27 2003-10-03 Sanyo Electric Co Ltd 映像情報記録再生装置及び映像情報記録再生方法
JP2005293212A (ja) * 2004-03-31 2005-10-20 Toshiba Corp 要約映像生成装置、要約映像生成方法及びプログラム
JP2006135808A (ja) * 2004-11-08 2006-05-25 Toshiba Corp 再生装置及びその方法
JP2006211311A (ja) * 2005-01-28 2006-08-10 Victor Co Of Japan Ltd ダイジェスト映像生成装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP1942671A4

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009033413A (ja) * 2007-07-26 2009-02-12 Sony Corp 情報処理装置及び情報処理方法、並びにプログラム
US8234278B2 (en) 2007-07-26 2012-07-31 Sony Corporation Information processing device, information processing method, and program therefor
JP2013015726A (ja) * 2011-07-05 2013-01-24 Yamaha Corp 音声記録サーバ装置及び音声記録システム
WO2023249034A1 (ja) * 2022-06-23 2023-12-28 ダイキン工業株式会社 画像処理方法、コンピュータプログラム及び画像処理装置
JP7429016B2 (ja) 2022-06-23 2024-02-07 ダイキン工業株式会社 画像処理方法、コンピュータプログラム及び画像処理装置

Also Published As

Publication number Publication date
EP1942671A1 (en) 2008-07-09
EP1942671A4 (en) 2010-01-27
JPWO2007039995A1 (ja) 2009-04-16

Similar Documents

Publication Publication Date Title
JP4757876B2 (ja) ダイジェスト作成装置およびそのプログラム
JP4317127B2 (ja) 音楽ビデオを索引化して要約するシステム及び方法
JP4000171B2 (ja) 再生装置
JP4615166B2 (ja) 映像情報要約装置、映像情報要約方法及び映像情報要約プログラム
US7058278B2 (en) Information signal processing apparatus, information signal processing method, and information signal recording apparatus
JP4247638B2 (ja) 記録再生装置および記録再生方法
JPWO2005069172A1 (ja) 要約再生装置および要約再生方法
KR20040040480A (ko) 비디오 세그먼트 우선순위에 기초하여 기록된 비디오의감소된 재생을 위한 시스템 및 방법
JP2003087728A (ja) 映像情報要約装置、映像情報要約方法および映像情報要約処理プログラム
KR20110097858A (ko) 프로그램 데이터 처리 장치, 프로그램 데이터 처리 방법, 및 프로그램을 기록한 컴퓨터 판독가능한 기록 매체
JP4735413B2 (ja) コンテンツ再生装置およびコンテンツ再生方法
JP4387408B2 (ja) Avコンテンツ処理装置、avコンテンツ処理方法、avコンテンツ処理プログラムおよびavコンテンツ処理装置に用いる集積回路
JP2008193585A (ja) 放送番組記録再生装置および放送番組記録再生方法
WO2007039995A1 (ja) ダイジェスト作成装置およびそのプログラム
JP2007294020A (ja) 記録再生方法、記録再生装置、記録方法、記録装置、再生方法および再生装置
JP2007288300A (ja) 映像音声再生装置
JP2007066409A (ja) 記録再生装置および記録再生方法
JP2001320674A (ja) 映像記録再生方法、及び映像記録再生装置
JP2003224810A (ja) 音声/映像データ記録再生装置および方法、音声/映像データ記録再生装置および方法により記録が行われた記録媒体、音声/映像データ再生装置、音声/映像データ記録再生システムおよび方法、音声/映像データ記録再生システムおよび方法により記録が行われた記録媒体、ならびにデータ構造体
JP4669592B2 (ja) 録画装置
JP2008206076A (ja) 再生装置および方法、並びにプログラム
WO2007039998A1 (ja) 本編外シーン抽出装置およびそのプログラム
JP2001006346A (ja) 番組録再装置及び番組録再方法
JP2006054631A (ja) 番組の編集再生方法、番組の編集再生システム、及び番組の編集再生プログラム
JP2007095135A (ja) 映像記録再生装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application
DPE1 Request for preliminary examination filed after expiration of 19th month from priority date (pct application filed from 20040101)
WWE Wipo information: entry into national phase

Ref document number: 2007538661

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2006796676

Country of ref document: EP