JP2007027990A - 動画データから字幕を作成する装置及び方法、プログラム、並びに記憶媒体 - Google Patents
動画データから字幕を作成する装置及び方法、プログラム、並びに記憶媒体 Download PDFInfo
- Publication number
- JP2007027990A JP2007027990A JP2005204736A JP2005204736A JP2007027990A JP 2007027990 A JP2007027990 A JP 2007027990A JP 2005204736 A JP2005204736 A JP 2005204736A JP 2005204736 A JP2005204736 A JP 2005204736A JP 2007027990 A JP2007027990 A JP 2007027990A
- Authority
- JP
- Japan
- Prior art keywords
- balloon
- speaker
- data
- face
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Studio Circuits (AREA)
- Television Signal Processing For Recording (AREA)
- Image Analysis (AREA)
Abstract
【解決手段】動画データは顔検出手段103に入力されて顔特徴量と顔位置が検出され、音声識別手段104に入力されて音声特徴量が検出される。検出された各特徴量は話者特定手段107に送られ、音声・顔対応データ記憶手段106に登録されている話者の特徴量と比較されて特定話者の位置が特定される。特定された話者の音声は、音声認識手段105によりテキスト化される。話者の位置とテキストデータにより吹き出し作成手段112により吹き出しが作成され、動画像作成手段114により動画データと音声データと吹き出しデータとをまとめて新たな動画データが作成される。
【選択図】 図1
Description
撮影画像から顔領域を検出し、予め作成したテキストデータを吹き出しとして、検出された顔の口元付近に表示する方法(例えば、特許文献1の請求項10)やマイク等の音声入力端末に対して発言者が対応付けされており、音声からテキストへの変換を自動的に行い、発言者の顔を検出し、変換したテキストデータを吹き出しとして発言者の顔付近に表示する方法(例えば、特許文献2の請求項2)が提案されている。これらを支える技術として、顔領域の特徴量から特定の顔を識別する方法(例えば、特許文献3)や入力音声に含まれる特徴量を抽出し、予め登録されている音声の特徴量とのパターンマッチングを行う方法(例えば、特許文献4)、入力音声からテキスト化を行い、議事録を作成する方法(例えば、特許文献5)が提案されている。
図1は本発明に係る実施形態の自動吹き出し作成・編集処理機能を実現するためのブロック図である。
図17は本発明に係る実施形態の自動吹き出し作成・編集処理機能を実現するソフトウェアを備える動画像データ編集装置を例示している。
以上、本発明に係る実施形態について具体例を用いて詳述したが、本発明は、例えば、システム、装置、方法、プログラム若しくは記憶媒体(記録媒体)等としての実施態様をとることが可能であり、具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
101 動画入力部
102 音声入力部
103 顔検出部
104 音声識別部
105 音声認識部
106 音声・顔対応部
107 話者特定部
108 テキスト化部
109 位置特定部
110 同期部
111 画像データ部
112 吹き出し作成部
113 音声データ部
114 動画像作成部
200 映像記録・編集装置
201 カメラ部
202 映像系A/D変換部
203 画像処理部
204 マイク入力部
205 音声系A/D変換部
206 音声信号処理部
207 制御装置
208 操作部材
209 同期部
210 記録装置
211 動画像・吹き出し合成処理部
212 スピーカー
213 表示装置
300 映像記録・編集装置
301 撮影ボタン
302 接眼レンズ(ファインダー)
303 撮影レンズ
304 液晶ファインダー、再生画面
305 操作ボタン
406 吹き出し(A子)
407 吹き出し(B子)
408 字幕スーパー(C子)
501 映像領域
503,504,505 話者情報
510 音声信号レベル
511 発声開始タイムコード
512 発声終了タイムコード
513 現在の表示映像タイムコード
514 動作状態
515 開始ボタン
516 プレビューボタン
520 音声・顔登録画面
521 人物名入力フィールド
522 顔表示領域
525 音声レベル表示領域
526 顔画像取り込みボタン
527 音声取り込みボタン
530 吹き出しプロパティ設定画面
541 吹き出し編集画面
542 画像確認領域
543 テキスト表示・編集領域
544 スライダ
549 音声再認識ボタン
550 音声再生ボタン
551 確認ボタン
561 字幕スーパー設定画面
562 画像確認領域
563 テキスト表示・編集領域
564 スライダ
569 音声再認識ボタン
570 音声再生ボタン
571 確認ボタン
580 映像領域
581 映像のタイムコード
582 直前の発声開始タイムコードへの移動ボタン
583 巻き戻しボタン
584 再生ボタン
585 早送りボタン
586 直後の発声開始タイムコードへの移動ボタン
588 タイムコードスケール
589 インデックス画像
590 吹き出し情報表示
591 字幕スーパー情報表示
592 スライダ
600 パーソナルコンピュータ
601 表示装置(ディスプレイ)
602 キーボード
603 マウス
Claims (26)
- 画像及び音声を含む動画データから字幕を作成する装置であって、
前記動画データの画像部分から顔の特徴量を検出する顔検出手段と、
前記動画データの音声部分から音声の特徴量を検出する音声識別手段と、
前記顔検出手段により検出された顔の特徴量及び前記音声識別手段により検出された音声の特徴量を、予め準備された特定話者の声を識別する音声特徴量及び当該話者の顔を識別する顔特徴量と比較して話者を特定する話者特定手段と、
特定された前記話者の顔位置を特定する位置特定手段と、
特定された前記話者の音声から文字列を認識し、当該文字列のテキストデータを生成する音声認識手段と、
前記位置特定手段により得られる顔位置と、前記音声認識手段により生成されたテキストデータとに基づいて、特定話者から発声された文字列のテキストデータを画像中に表示するための吹き出しデータを作成する吹き出し作成手段と、
前記画像データと前記音声データに前記吹き出しデータとをまとめて新たに動画データを作成する動画像作成手段と、を具備することを特徴とする装置。 - 前記画像及び音声を同期させて話者の発声開始から発声終了までを管理する同期手段を更に備え、
前記吹き出し作成手段は、前記位置特定手段により得られる顔位置と、前記音声認識手段により生成されたテキストデータと、前記同期手段より得られる発声開始から発声終了までの時間とに基づいて、前記吹き出しデータを作成することを特徴とする請求項1に記載の装置。 - 前記顔検出手段は、前記画像部分から顔の向きと口の位置を検出し、
前記位置特定手段は、前記吹き出しデータを前記顔の向きに合わせて表示できるように、前記話者の顔の向きと口の位置を特定することを特徴とする請求項1に記載の装置。 - 前記吹き出し作成手段は、前記話者特定手段により特定された話者に対応した吹き出しの形、色、柄、大きさ、文字の色、大きさ、字体の少なくともいずれかを編集可能な手段を有することを特徴とする請求項1に記載の装置。
- 前記吹き出し作成手段は、前記位置特定手段により特定された顔位置及び大きさに合わせて吹き出しの大きさと文字の大きさを変更することを特徴とする請求項1に記載の装置。
- 前記吹き出し作成手段は、前記話者特定手段において話者の音声を認識したが顔が認識できない場合に、所定の表示位置に字幕スーパとして文字列のみを表示するための吹き出しデータを作成することを特徴とする請求項1に記載の装置。
- 前記吹き出し作成手段は、前記発声開始から発声終了までの間に、話者の顔が認識できなくなった場合、当該認識できなくなった時点から所定の表示位置に字幕スーパとして文字列のみを表示するための吹き出しデータを作成することを特徴とする請求項1に記載の装置。
- 前記吹き出し作成手段は、前記発声開始から発声終了までの間に、前記顔検出手段により話者の顔を追跡し、当該話者の顔が認識できなくなった場合、頭部を追跡して発声終了までの吹き出しデータを作成することを特徴とする請求項1に記載の装置。
- 前記吹き出し作成手段は、前記発声開始から発声終了までの間に、話者が画面内において予め設定された移動量を超えて移動した場合、所定の表示位置に字幕スーパとして文字列のみを表示するための吹き出しデータを作成することを特徴とする請求項1に記載の装置。
- 前記吹き出しデータの文字列は、テキストデータで記述されるメタデータを含む言語で記述されることを特徴とする請求項1に記載の装置。
- 前記動画データを撮影又は外部から入力可能な動画入力手段を更に備えることを特徴とする請求項1乃至10のいずれか1項に記載の装置。
- 動画データを記録する記録手段を更に備え、
前記動画像作成手段は、前記動画入力手段により入力された動画データから前記吹き出しデータを生成し、当該吹き出しデータを付加して作成された動画データを前記記録手段に順次記録することを特徴とする請求項11に記載の装置。 - 画像及び音声を含む動画データから字幕を作成する方法であって、
前記動画データの画像部分から顔の特徴量を検出する顔検出工程と、
前記動画データの音声部分から音声の特徴量を検出する音声識別工程と、
前記顔検出工程にて検出された顔の特徴量及び前記音声識別工程にて検出された音声の特徴量を、予め準備された特定話者の声を識別する音声特徴量及び当該話者の顔を識別する顔特徴量と比較して話者を特定する話者特定工程と、
特定された前記話者の顔位置を特定する位置特定工程と、
特定された前記話者の音声から文字列を認識し、当該文字列のテキストデータを生成する音声認識工程と、
前記位置特定工程により得られる顔位置と、前記音声認識工程により生成されたテキストデータとに基づいて、特定話者から発声された文字列のテキストデータを画像中に表示するための吹き出しデータを作成する吹き出し作成工程と、
前記画像データと前記音声データに前記吹き出しデータとをまとめて新たに動画データを作成する動画像作成工程と、を備えることを特徴とする方法。 - 前記画像及び音声を同期させて話者の発声開始から発声終了までを管理する同期工程を更に備え、
前記吹き出し作成工程では、前記位置特定工程により得られる顔位置と、前記音声認識工程により生成されたテキストデータと、前記同期工程より得られる発声開始から発声終了までの時間とに基づいて、前記吹き出しデータを作成することを特徴とする請求項13に記載の方法。 - 前記顔検出工程では、前記画像データ中の顔の向きと口の位置を検出し、
前記位置特定工程では、前記吹き出しデータを前記顔の向きに合わせて表示できるように、前記話者の顔の向きと口の位置を特定することを特徴とする請求項13に記載の方法。 - 前記吹き出し作成工程では、前記話者特定工程により特定された話者に対応した吹き出しの形、色、柄、大きさ、文字の色、大きさ、字体の少なくともいずれかを編集可能であることを特徴とする請求項13に記載の方法。
- 前記吹き出し作成工程では、前記位置特定工程により特定された顔位置及び大きさに合わせて吹き出しの大きさと文字の大きさを変更することを特徴とする請求項13に記載の方法。
- 前記吹き出し作成工程では、前記話者特定工程において話者の音声を認識したが顔が認識できない場合に、所定の表示位置に字幕スーパとして文字列のみを表示するための吹き出しデータを作成することを特徴とする請求項13に記載の方法。
- 前記吹き出し作成工程では、前記発声開始から発声終了までの間に、話者の顔が認識できなくなった場合、当該認識できなくなった時点から所定の表示位置に字幕スーパとして文字列のみを表示するための吹き出しデータを作成することを特徴とする請求項13に記載の方法。
- 前記吹き出し作成工程では、前記発声開始から発声終了までの間に、前記顔検出工程により話者の顔を追跡し、当該話者の顔が認識できなくなった場合、頭部を追跡して発声終了までの吹き出しデータを作成することを特徴とする請求項13に記載の方法。
- 前記吹き出し作成工程では、前記発声開始から発声終了までの間に、話者が画面内において予め設定された移動量を超えて移動した場合、所定の表示位置に字幕スーパとして文字列のみを表示するための吹き出しデータを作成することを特徴とする請求項13に記載の方法。
- 前記吹き出しデータの文字列は、テキストデータで記述されるメタデータを含む言語で記述されることを特徴とする請求項13に記載の方法。
- 前記動画データを撮影又は外部から入力可能な動画入力工程を更に備えることを特徴とする請求項13乃至22のいずれか1項に記載の方法。
- 動画データを記録手段に記録する記録工程を更に備え、
前記動画像作成工程では、前記動画入力工程により入力された動画データから前記吹き出しデータを生成し、
前記記録工程では、当該吹き出しデータを付加して作成された動画データを前記記録手段に順次記録することを特徴とする請求項23に記載の方法。 - 請求項13乃至24のいずれか1項に記載の方法をコンピュータに実行させるためのプログラム。
- 請求項25に記載のプログラムを記憶したことを特徴とするコンピュータ可読記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005204736A JP4599244B2 (ja) | 2005-07-13 | 2005-07-13 | 動画データから字幕を作成する装置及び方法、プログラム、並びに記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005204736A JP4599244B2 (ja) | 2005-07-13 | 2005-07-13 | 動画データから字幕を作成する装置及び方法、プログラム、並びに記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007027990A true JP2007027990A (ja) | 2007-02-01 |
JP4599244B2 JP4599244B2 (ja) | 2010-12-15 |
Family
ID=37788190
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005204736A Expired - Fee Related JP4599244B2 (ja) | 2005-07-13 | 2005-07-13 | 動画データから字幕を作成する装置及び方法、プログラム、並びに記憶媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4599244B2 (ja) |
Cited By (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008035704A1 (fr) * | 2006-09-21 | 2008-03-27 | Panasonic Corporation | Dispositif de génération de sous-titre, procédé de génération de sous-titre, et programme de génération de sous-titre |
JP2009020457A (ja) * | 2007-07-13 | 2009-01-29 | Univ Waseda | 音声処理装置およびプログラム |
JP2009165002A (ja) * | 2008-01-09 | 2009-07-23 | Panasonic Corp | 画像符号化装置及び画像符号化方法 |
WO2009101819A1 (ja) * | 2008-02-14 | 2009-08-20 | Panasonic Corporation | 再生装置、集積回路、再生方法、プログラム、コンピュータ読取可能な記録媒体 |
JP2010021991A (ja) * | 2008-06-09 | 2010-01-28 | Sony Corp | 情報提示装置および情報提示方法 |
JP2010081457A (ja) * | 2008-09-29 | 2010-04-08 | Hitachi Ltd | 情報記録再生装置およびビデオカメラ |
JP2010134507A (ja) * | 2008-12-02 | 2010-06-17 | Canon Inc | 再生装置 |
WO2010073432A1 (ja) * | 2008-12-24 | 2010-07-01 | 株式会社ソニー・コンピュータエンタテインメント | 画像処理装置および画像処理方法 |
JP2010148132A (ja) * | 2010-01-20 | 2010-07-01 | Casio Computer Co Ltd | 撮像装置、画像検出装置及びプログラム |
JP2010152556A (ja) * | 2008-12-24 | 2010-07-08 | Sony Computer Entertainment Inc | 画像処理装置および画像処理方法 |
JP2010176224A (ja) * | 2009-01-27 | 2010-08-12 | Nikon Corp | 画像処理装置およびデジタルカメラ |
WO2010109274A1 (en) * | 2009-03-23 | 2010-09-30 | Sony Ericsson Mobile Communications Ab | Voice-controlled image editing |
JP2010233045A (ja) * | 2009-03-27 | 2010-10-14 | Brother Ind Ltd | 会議支援装置、会議支援方法、会議システム、会議支援プログラム |
JP2011043716A (ja) * | 2009-08-21 | 2011-03-03 | Sharp Corp | 情報処理装置、会議システム、情報処理方法及びコンピュータプログラム |
JP2012008973A (ja) * | 2010-06-28 | 2012-01-12 | Brother Ind Ltd | 情報処理プログラムおよび情報処理装置 |
EP2426646A1 (en) * | 2010-09-06 | 2012-03-07 | Sony Corporation | Image processing device, program, and image processing method |
EP2426645A1 (en) * | 2010-09-06 | 2012-03-07 | Sony Corporation | Image processing device, program, and image processing method |
JP2012065002A (ja) * | 2010-09-14 | 2012-03-29 | Casio Comput Co Ltd | 画像合成装置、画像合成方法及びプログラム |
JP2012146302A (ja) * | 2011-01-11 | 2012-08-02 | Hon Hai Precision Industry Co Ltd | 音声をテキストに変換する装置及び方法 |
US8411160B2 (en) | 2007-08-31 | 2013-04-02 | Casio Computer Co., Ltd. | Apparatus including function to specify image region of main subject from obtained image, method to specify image region of main subject from obtained image and computer readable storage medium storing program to specify image region of main subject from obtained image |
JP2013122695A (ja) * | 2011-12-12 | 2013-06-20 | Honda Motor Co Ltd | 情報提示装置、情報提示方法、情報提示プログラム、及び情報伝達システム |
JP2013172411A (ja) * | 2012-02-22 | 2013-09-02 | Nec Corp | 音声認識システム、音声認識方法および音声認識プログラム |
JP2014038429A (ja) * | 2012-08-14 | 2014-02-27 | Zenrin Datacom Co Ltd | 画像処理装置、画像処理方法および画像処理プログラム |
WO2014049461A1 (en) * | 2012-09-26 | 2014-04-03 | International Business Machines Corporation | Captioning using socially derived acoustic profiles |
CN104036789A (zh) * | 2014-01-03 | 2014-09-10 | 北京智谷睿拓技术服务有限公司 | 多媒体处理方法及多媒体装置 |
JP2014195267A (ja) * | 2014-05-02 | 2014-10-09 | Nec Corp | 映像音響処理システム、映像音響処理方法及びプログラム |
KR20150041894A (ko) * | 2013-10-10 | 2015-04-20 | 주식회사 엘지유플러스 | 동영상 녹음 장치 및 방법 |
JP2015106014A (ja) * | 2013-11-29 | 2015-06-08 | 本田技研工業株式会社 | 会話支援装置、会話支援装置の制御方法、及び会話支援装置のプログラム |
KR101529927B1 (ko) * | 2008-12-22 | 2015-06-18 | 엘지전자 주식회사 | 단말기 및 그 제어 방법 |
JP2016127463A (ja) * | 2015-01-06 | 2016-07-11 | セイコーエプソン株式会社 | 頭部装着型表示装置、頭部装着型表示装置の制御方法、情報システム、および、コンピュータープログラム |
US20160211001A1 (en) * | 2015-01-20 | 2016-07-21 | Samsung Electronics Co., Ltd. | Apparatus and method for editing content |
JPWO2014199596A1 (ja) * | 2013-06-10 | 2017-02-23 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 話者識別方法、話者識別装置及び話者識別システム |
JP2018110312A (ja) * | 2016-12-28 | 2018-07-12 | 株式会社ミクシィ | 情報処理装置,情報処理装置の制御方法及び制御プログラム |
WO2019230225A1 (ja) * | 2018-05-29 | 2019-12-05 | ソニー株式会社 | 画像処理装置、画像処理方法、プログラム |
JPWO2019160100A1 (ja) * | 2018-02-16 | 2021-02-04 | 日本電信電話株式会社 | 非言語情報生成装置、非言語情報生成モデル学習装置、方法、及びプログラム |
JPWO2019160105A1 (ja) * | 2018-02-16 | 2021-02-04 | 日本電信電話株式会社 | 非言語情報生成装置、非言語情報生成モデル学習装置、方法、及びプログラム |
JP2021033048A (ja) * | 2019-08-23 | 2021-03-01 | サウンドハウンド,インコーポレイテッド | 車載装置、発声を処理する方法およびプログラム |
CN112887779A (zh) * | 2021-01-20 | 2021-06-01 | 杭州小众圈科技有限公司 | 基于语音节奏进行自动滚动字幕的方法、系统及装置 |
JP2021093618A (ja) * | 2019-12-10 | 2021-06-17 | 株式会社リチカ | 情報処理装置及びプログラム |
JP2021135453A (ja) * | 2020-02-28 | 2021-09-13 | パナソニックIpマネジメント株式会社 | テキスト音源位置表示システムおよびテキスト音源位置表示装置 |
US11257493B2 (en) | 2019-07-11 | 2022-02-22 | Soundhound, Inc. | Vision-assisted speech processing |
WO2022054453A1 (ja) * | 2020-09-08 | 2022-03-17 | ソニーグループ株式会社 | 撮像装置、撮像システム、及び撮像装置の設定方法 |
JP2022529225A (ja) * | 2019-04-04 | 2022-06-20 | グーグル エルエルシー | ビデオ時間調節アンカー |
WO2023203924A1 (ja) * | 2022-04-18 | 2023-10-26 | 国立研究開発法人情報通信研究機構 | 同時通訳装置、同時通訳システム、同時通訳処理方法、および、プログラム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11261890A (ja) * | 1998-03-11 | 1999-09-24 | Nippon Telegr & Teleph Corp <Ntt> | 映像字幕挿入方法および装置並びに該映像字幕挿入方法を記録した記録媒体 |
JP2004056286A (ja) * | 2002-07-17 | 2004-02-19 | Fuji Photo Film Co Ltd | 画像表示方法 |
JP2004343488A (ja) * | 2003-05-16 | 2004-12-02 | Nec Corp | 字幕挿入方法、字幕挿入システム、および字幕挿入プログラム |
JP2005124169A (ja) * | 2003-09-26 | 2005-05-12 | Matsushita Electric Ind Co Ltd | 吹き出し字幕付き映像コンテンツ作成装置、送信装置、再生装置、提供システムならびにそれらで用いられるデータ構造および記録媒体 |
-
2005
- 2005-07-13 JP JP2005204736A patent/JP4599244B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11261890A (ja) * | 1998-03-11 | 1999-09-24 | Nippon Telegr & Teleph Corp <Ntt> | 映像字幕挿入方法および装置並びに該映像字幕挿入方法を記録した記録媒体 |
JP2004056286A (ja) * | 2002-07-17 | 2004-02-19 | Fuji Photo Film Co Ltd | 画像表示方法 |
JP2004343488A (ja) * | 2003-05-16 | 2004-12-02 | Nec Corp | 字幕挿入方法、字幕挿入システム、および字幕挿入プログラム |
JP2005124169A (ja) * | 2003-09-26 | 2005-05-12 | Matsushita Electric Ind Co Ltd | 吹き出し字幕付き映像コンテンツ作成装置、送信装置、再生装置、提供システムならびにそれらで用いられるデータ構造および記録媒体 |
Cited By (75)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008079018A (ja) * | 2006-09-21 | 2008-04-03 | Matsushita Electric Ind Co Ltd | 字幕生成装置、字幕生成方法および字幕生成プログラム |
WO2008035704A1 (fr) * | 2006-09-21 | 2008-03-27 | Panasonic Corporation | Dispositif de génération de sous-titre, procédé de génération de sous-titre, et programme de génération de sous-titre |
US8223269B2 (en) | 2006-09-21 | 2012-07-17 | Panasonic Corporation | Closed caption production device, method and program for synthesizing video, sound and text |
JP2009020457A (ja) * | 2007-07-13 | 2009-01-29 | Univ Waseda | 音声処理装置およびプログラム |
US8411160B2 (en) | 2007-08-31 | 2013-04-02 | Casio Computer Co., Ltd. | Apparatus including function to specify image region of main subject from obtained image, method to specify image region of main subject from obtained image and computer readable storage medium storing program to specify image region of main subject from obtained image |
JP2009165002A (ja) * | 2008-01-09 | 2009-07-23 | Panasonic Corp | 画像符号化装置及び画像符号化方法 |
WO2009101819A1 (ja) * | 2008-02-14 | 2009-08-20 | Panasonic Corporation | 再生装置、集積回路、再生方法、プログラム、コンピュータ読取可能な記録媒体 |
US8428437B2 (en) | 2008-02-14 | 2013-04-23 | Panasonic Corporation | Reproduction device, integrated circuit, reproduction method, program, and computer-readable recording medium |
JP2010021991A (ja) * | 2008-06-09 | 2010-01-28 | Sony Corp | 情報提示装置および情報提示方法 |
JP4618384B2 (ja) * | 2008-06-09 | 2011-01-26 | ソニー株式会社 | 情報提示装置および情報提示方法 |
JP2010081457A (ja) * | 2008-09-29 | 2010-04-08 | Hitachi Ltd | 情報記録再生装置およびビデオカメラ |
JP2010134507A (ja) * | 2008-12-02 | 2010-06-17 | Canon Inc | 再生装置 |
KR101529927B1 (ko) * | 2008-12-22 | 2015-06-18 | 엘지전자 주식회사 | 단말기 및 그 제어 방법 |
JP2010152556A (ja) * | 2008-12-24 | 2010-07-08 | Sony Computer Entertainment Inc | 画像処理装置および画像処理方法 |
US10216987B2 (en) | 2008-12-24 | 2019-02-26 | Sony Interactive Entertainment Inc. | Image processing device and image processing method |
WO2010073432A1 (ja) * | 2008-12-24 | 2010-07-01 | 株式会社ソニー・コンピュータエンタテインメント | 画像処理装置および画像処理方法 |
JP2010176224A (ja) * | 2009-01-27 | 2010-08-12 | Nikon Corp | 画像処理装置およびデジタルカメラ |
WO2010109274A1 (en) * | 2009-03-23 | 2010-09-30 | Sony Ericsson Mobile Communications Ab | Voice-controlled image editing |
JP2012521705A (ja) * | 2009-03-23 | 2012-09-13 | ソニーモバイルコミュニケーションズ, エービー | 音声制御画像編集 |
JP2010233045A (ja) * | 2009-03-27 | 2010-10-14 | Brother Ind Ltd | 会議支援装置、会議支援方法、会議システム、会議支援プログラム |
JP2011043716A (ja) * | 2009-08-21 | 2011-03-03 | Sharp Corp | 情報処理装置、会議システム、情報処理方法及びコンピュータプログラム |
CN101998107A (zh) * | 2009-08-21 | 2011-03-30 | 夏普株式会社 | 信息处理装置、会议系统和信息处理方法 |
CN101998107B (zh) * | 2009-08-21 | 2013-05-29 | 夏普株式会社 | 信息处理装置、会议系统和信息处理方法 |
JP2010148132A (ja) * | 2010-01-20 | 2010-07-01 | Casio Computer Co Ltd | 撮像装置、画像検出装置及びプログラム |
US8611724B2 (en) | 2010-06-28 | 2013-12-17 | Brother Kogyo Kabushiki Kaisha | Computer readable medium, information processing apparatus and method for processing moving image and sound |
JP2012008973A (ja) * | 2010-06-28 | 2012-01-12 | Brother Ind Ltd | 情報処理プログラムおよび情報処理装置 |
EP2426646A1 (en) * | 2010-09-06 | 2012-03-07 | Sony Corporation | Image processing device, program, and image processing method |
JP2012060240A (ja) * | 2010-09-06 | 2012-03-22 | Sony Corp | 画像処理装置、プログラム及び画像処理方法 |
EP2426645A1 (en) * | 2010-09-06 | 2012-03-07 | Sony Corporation | Image processing device, program, and image processing method |
US9865068B2 (en) | 2010-09-06 | 2018-01-09 | Sony Corporation | Image processing device, and image procesing method |
US9741141B2 (en) | 2010-09-06 | 2017-08-22 | Sony Corporation | Image processing device, program, and image processing method |
EP2570994A1 (en) * | 2010-09-06 | 2013-03-20 | Sony Corporation | Image processing device, program, and image processing method |
JP2012065002A (ja) * | 2010-09-14 | 2012-03-29 | Casio Comput Co Ltd | 画像合成装置、画像合成方法及びプログラム |
JP2012146302A (ja) * | 2011-01-11 | 2012-08-02 | Hon Hai Precision Industry Co Ltd | 音声をテキストに変換する装置及び方法 |
JP2013122695A (ja) * | 2011-12-12 | 2013-06-20 | Honda Motor Co Ltd | 情報提示装置、情報提示方法、情報提示プログラム、及び情報伝達システム |
US8990078B2 (en) | 2011-12-12 | 2015-03-24 | Honda Motor Co., Ltd. | Information presentation device associated with sound source separation |
JP2013172411A (ja) * | 2012-02-22 | 2013-09-02 | Nec Corp | 音声認識システム、音声認識方法および音声認識プログラム |
JP2014038429A (ja) * | 2012-08-14 | 2014-02-27 | Zenrin Datacom Co Ltd | 画像処理装置、画像処理方法および画像処理プログラム |
US8983836B2 (en) | 2012-09-26 | 2015-03-17 | International Business Machines Corporation | Captioning using socially derived acoustic profiles |
WO2014049461A1 (en) * | 2012-09-26 | 2014-04-03 | International Business Machines Corporation | Captioning using socially derived acoustic profiles |
GB2526929A (en) * | 2012-09-26 | 2015-12-09 | Ibm | Captioning using socially derived acoustic profiles |
GB2526929B (en) * | 2012-09-26 | 2016-12-28 | Ibm | Captioning using socially derived acoustic profiles |
JPWO2014199596A1 (ja) * | 2013-06-10 | 2017-02-23 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 話者識別方法、話者識別装置及び話者識別システム |
KR20150041894A (ko) * | 2013-10-10 | 2015-04-20 | 주식회사 엘지유플러스 | 동영상 녹음 장치 및 방법 |
KR102155915B1 (ko) * | 2013-10-10 | 2020-09-14 | 주식회사 엘지유플러스 | 동영상 녹음 장치 및 방법 |
JP2015106014A (ja) * | 2013-11-29 | 2015-06-08 | 本田技研工業株式会社 | 会話支援装置、会話支援装置の制御方法、及び会話支援装置のプログラム |
US9691387B2 (en) | 2013-11-29 | 2017-06-27 | Honda Motor Co., Ltd. | Conversation support apparatus, control method of conversation support apparatus, and program for conversation support apparatus |
CN104036789A (zh) * | 2014-01-03 | 2014-09-10 | 北京智谷睿拓技术服务有限公司 | 多媒体处理方法及多媒体装置 |
JP2014195267A (ja) * | 2014-05-02 | 2014-10-09 | Nec Corp | 映像音響処理システム、映像音響処理方法及びプログラム |
JP2016127463A (ja) * | 2015-01-06 | 2016-07-11 | セイコーエプソン株式会社 | 頭部装着型表示装置、頭部装着型表示装置の制御方法、情報システム、および、コンピュータープログラム |
US20160211001A1 (en) * | 2015-01-20 | 2016-07-21 | Samsung Electronics Co., Ltd. | Apparatus and method for editing content |
US10373648B2 (en) * | 2015-01-20 | 2019-08-06 | Samsung Electronics Co., Ltd. | Apparatus and method for editing content |
US10971188B2 (en) | 2015-01-20 | 2021-04-06 | Samsung Electronics Co., Ltd. | Apparatus and method for editing content |
JP2018110312A (ja) * | 2016-12-28 | 2018-07-12 | 株式会社ミクシィ | 情報処理装置,情報処理装置の制御方法及び制御プログラム |
JP7280512B2 (ja) | 2018-02-16 | 2023-05-24 | 日本電信電話株式会社 | 非言語情報生成装置及びプログラム |
JPWO2019160100A1 (ja) * | 2018-02-16 | 2021-02-04 | 日本電信電話株式会社 | 非言語情報生成装置、非言語情報生成モデル学習装置、方法、及びプログラム |
JPWO2019160105A1 (ja) * | 2018-02-16 | 2021-02-04 | 日本電信電話株式会社 | 非言語情報生成装置、非言語情報生成モデル学習装置、方法、及びプログラム |
JP7157340B2 (ja) | 2018-02-16 | 2022-10-20 | 日本電信電話株式会社 | 非言語情報生成装置、非言語情報生成モデル学習装置、方法、及びプログラム |
EP3787285A4 (en) * | 2018-05-29 | 2021-03-03 | Sony Corporation | IMAGE PROCESSING DEVICE, IMAGE PROCESSING METHOD, AND PROGRAM |
US11450352B2 (en) | 2018-05-29 | 2022-09-20 | Sony Corporation | Image processing apparatus and image processing method |
JPWO2019230225A1 (ja) * | 2018-05-29 | 2021-07-15 | ソニーグループ株式会社 | 画像処理装置、画像処理方法、プログラム |
WO2019230225A1 (ja) * | 2018-05-29 | 2019-12-05 | ソニー株式会社 | 画像処理装置、画像処理方法、プログラム |
JP7272356B2 (ja) | 2018-05-29 | 2023-05-12 | ソニーグループ株式会社 | 画像処理装置、画像処理方法、プログラム |
US11823716B2 (en) | 2019-04-04 | 2023-11-21 | Google Llc | Video timed anchors |
JP7350883B2 (ja) | 2019-04-04 | 2023-09-26 | グーグル エルエルシー | ビデオ時間調節アンカー |
JP2022529225A (ja) * | 2019-04-04 | 2022-06-20 | グーグル エルエルシー | ビデオ時間調節アンカー |
US11257493B2 (en) | 2019-07-11 | 2022-02-22 | Soundhound, Inc. | Vision-assisted speech processing |
JP2021033048A (ja) * | 2019-08-23 | 2021-03-01 | サウンドハウンド,インコーポレイテッド | 車載装置、発声を処理する方法およびプログラム |
JP2021093618A (ja) * | 2019-12-10 | 2021-06-17 | 株式会社リチカ | 情報処理装置及びプログラム |
JP2021135453A (ja) * | 2020-02-28 | 2021-09-13 | パナソニックIpマネジメント株式会社 | テキスト音源位置表示システムおよびテキスト音源位置表示装置 |
WO2022054453A1 (ja) * | 2020-09-08 | 2022-03-17 | ソニーグループ株式会社 | 撮像装置、撮像システム、及び撮像装置の設定方法 |
EP4203457A4 (en) * | 2020-09-08 | 2024-01-24 | Sony Group Corporation | Image capturing device, image capturing system, and image capturing device setting method |
CN112887779B (zh) * | 2021-01-20 | 2022-11-18 | 杭州小众圈科技有限公司 | 基于语音节奏进行自动滚动字幕的方法、系统及装置 |
CN112887779A (zh) * | 2021-01-20 | 2021-06-01 | 杭州小众圈科技有限公司 | 基于语音节奏进行自动滚动字幕的方法、系统及装置 |
WO2023203924A1 (ja) * | 2022-04-18 | 2023-10-26 | 国立研究開発法人情報通信研究機構 | 同時通訳装置、同時通訳システム、同時通訳処理方法、および、プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4599244B2 (ja) | 2010-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4599244B2 (ja) | 動画データから字幕を作成する装置及び方法、プログラム、並びに記憶媒体 | |
JP4683116B2 (ja) | 情報処理装置、情報処理方法、情報処理プログラムおよび撮像装置 | |
JP5144424B2 (ja) | 撮像装置及び情報処理方法 | |
JP2000350159A (ja) | 視覚画像編集システム | |
JP2014011676A (ja) | コンテンツ再生制御装置、コンテンツ再生制御方法及びプログラム | |
JP2004056286A (ja) | 画像表示方法 | |
JPH086182A (ja) | 吹き替えシステムおよびビデオ画像表示システム | |
CN101715142A (zh) | 信息记录再现装置和视频摄像机 | |
JP5137031B2 (ja) | 台詞音声作成装置、発話音声収録装置、及びコンピュータプログラム | |
JPH10243351A (ja) | 映像再生装置 | |
JP4086532B2 (ja) | 動画再生装置、動画再生方法及びそのコンピュータ・プログラム | |
JP2007101945A (ja) | 音声付き映像データ処理装置、音声付き映像データ処理方法及び音声付き映像データ処理用プログラム | |
JP5310682B2 (ja) | カラオケ装置 | |
JP4086886B2 (ja) | 動画再生装置、動画再生方法及びそのコンピュータ・プログラム | |
JP4455644B2 (ja) | 動画再生装置、動画再生方法及びそのコンピュータ・プログラム | |
CN115514987B (zh) | 通过使用脚本注释进行自动叙事视频制作的系统和方法 | |
JP4052561B2 (ja) | 映像付帯音声データ記録方法、映像付帯音声データ記録装置および映像付帯音声データ記録プログラム | |
Tsioustas et al. | Innovative applications of natural language processing and digital media in theatre and performing arts | |
JP4235635B2 (ja) | データ検索装置及びその制御方法 | |
JP4509188B2 (ja) | 動画再生装置、動画再生方法及びそのコンピュータ・プログラム | |
JP2002084505A (ja) | 映像閲覧時間短縮装置及び方法 | |
JP3970080B2 (ja) | 動画再生装置、動画再生方法及びそのコンピュータ・プログラム | |
JP4353084B2 (ja) | 映像再生方法及び装置及びプログラム | |
JP2006339817A (ja) | 情報処理装置およびその表示方法 | |
JP2019213160A (ja) | 動画編集装置、動画編集方法、及び動画編集プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070926 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080128 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080328 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080630 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080724 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20080904 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20081226 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100927 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4599244 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131001 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |