JP7532963B2 - 画像処理装置および画像処理方法 - Google Patents
画像処理装置および画像処理方法 Download PDFInfo
- Publication number
- JP7532963B2 JP7532963B2 JP2020117846A JP2020117846A JP7532963B2 JP 7532963 B2 JP7532963 B2 JP 7532963B2 JP 2020117846 A JP2020117846 A JP 2020117846A JP 2020117846 A JP2020117846 A JP 2020117846A JP 7532963 B2 JP7532963 B2 JP 7532963B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- situation
- data
- image processing
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- User Interface Of Digital Computer (AREA)
- Television Signal Processing For Recording (AREA)
- Studio Devices (AREA)
- Time Recorders, Dirve Recorders, Access Control (AREA)
Description
たとえば特許文献1の記載には、画像に含まれる音声から単語を抽出し、単語の使用頻度に応じて字幕の表示態様を決定する表示態様決定装置が開示されている。
また、車両の車室内の画像に限らず、各種移動体の室内の画像またはその他の空間を撮影した画像を出来事の記録として保存する場合についても同様である。
まず図1~9を用いて、本発明の実施形態1について説明する。図1は、実施形態1にかかる画像処理システム1の構成の一例を示すブロック図である。画像処理システム1は、人物を含む対象空間を撮影した画像に対して、字幕付与等の画像処理を行い、ダイジェスト画像を生成するコンピュータシステムである。本実施形態1では、対象空間は、乗員がいる車両の室内空間(以下、車室内と呼ぶことがある)を示す。しかしこれに限らず、対象空間は、乗員がいる船若しくは飛行機等のその他の移動体の室内、または人物がいる建物の屋内若しくは屋外の空間であってもよい。
画像評価部13は、取得部11が取得した画像データに基づいて、評価対象状況に関連する各表情の表情評価統計値を算出する。より詳しくは、画像評価部13は、画像データに画像認識処理を施して画像データに含まれる人物を認識し、また、認識した人物の表情を認識して、「笑い」、「悲しみ」、「怒り」および「眠気」などの表情の種別として評価する。画像認識処理は、機械学習などの公知の技術が用いられる。
ここで表情評価値は、表情の種別に応じて定められ、定められた表情に個々の乗員の表情がどの程度関連しているかを示す指標である。表情評価値は、画像データに写る乗員ごとに算出される。たとえば表情評価値は、顔の各部の大きさ、位置、形状または顔若しくは首の角度に関して、画像データから取得した実績値と予め定められた参照値との間の差分に基づいて算出されてよい。また表情評価値は、被写体として様々な表情の人物が写る画像を教師データとして学習した表情評価モデルにより算出されてもよい。 表情評価統計値は、画像データに写る全ての乗員の表情評価値に基づいて、算出される。表情評価統計値は、閾値以上の表情評価値を有する乗員の数であってもよく、全ての乗員のうち、閾値以上の表情評価値を有する乗員の割合であってもよい。また表情評価統計値は、閾値以上の表情評価値を有する乗員の数や割合が予め定められる閾値を超えているか否かの判定結果であってもよい。また表情評価統計値は、表情評価値の合計値または平均値であってもよい。たとえば「笑い」の表情評価統計値は、「笑い」の表情評価値が高い乗員の数が多いほど、高い値を有してよい。このように表情評価統計値を状況評価値として用いることで、車室内の全体の状況をより正確に評価することが可能となる。
状況テーブル19は、状況識別情報(状況ID)と、その状況の内容と、状況評価値の種別およびイベント閾値とを関連付ける。
まずステップS10において、画像処理装置10の取得部11は、車室内の音声データおよび画像データを、マイク40およびカメラ30からそれぞれ取得する。取得部11は、取得した音声データおよび画像データを、状況評価部12および音声認識部15に供給する。
画像処理部16は、画像処理態様テーブル20の、状況ID8に基づいた画像データ、例えば睡眠中の擬音を表す「zzz」マーク画像MK1および鼻風船の画像MK2を生成し、睡眠中のターゲット乗員の顔のズームアップ画像に対して重畳させる。
そして画像処理部16は、他の乗員の発話内容である音声データをテキストデータに変換した「起きないね。」という字幕画像データを生成し、SB1を画像の下部に重畳させる。
画像処理部16は、悲しんでいるターゲット乗員の顔のズームアップ画像に対して、その目の周辺に悲しんでいることを表す涙マーク画像MK3を生成して重畳させ、額周辺に縦斜線マークMK4を重畳させる。
そして画像処理部16は、ターゲット乗員の発話内容である音声データをテキストデータに変換した「ひいいい」という字幕画像SB2を生成し、その乗員の左側に重畳させる。
画像処理部16は、怒っているターゲット乗員の顔のズームアップ画像に対して、その額の周辺に怒っていることを表す怒りマーク画像MK5を生成して重畳させる。
そして画像処理部16は、ターゲット乗員の発話内容である音声データをテキストデータに変換した「何だとっ!」という字幕画像SB3を生成し、怒っていることを表す吹き出しとともにその乗員の右側に重畳させる。
次に図10~14を用いて、本発明の実施形態2について説明する。実施形態2は、状況評価部が、画像データに加えて音声データに基づいて、対象空間の状況を評価することに特徴を有する。
状況ID9~10の状況の内容は、状況に関連する表情に加えて、発話態様またはこれらの組み合わせを示す。
たとえば状況ID9の状況の内容は、笑顔の乗員がいて、かつ乗員が所定値以上の声量(大声)で発話していることを示す。この場合、画像データに基づく第1表情評価統計値と、音声データに基づく第1音声評価値とが、状況評価値とされる。
また状況ID10の状況の内容は、笑顔の乗員がいる期間中に、所定頻度以上で繰り返し発話される単語を示す高頻出キーワードがあることを示す。この場合、画像データに基づく第1表情評価統計値と、音声データに基づく第2音声評価値とが、状況評価値とされる。
画像処理態様テーブル20aは、画像処理態様テーブル20に加えて、状況ID9~10の状況のレコードを含む。
状況のイベントが発生したか否かを判定する。状況評価部12aは、イベントが発生した
と判定した場合(ステップS42でYes)、状況評価値の情報を画像処理部16に供給
し、処理をステップS43に進める。一方、状況評価部12aは、そうでない場合(ステップS42でNo)、処理をステップS10に戻す。
このような画像が動画として再生された場合、黒ベタ画像に上述した重畳画像データを重畳した画像を再生するとともに、対応する音声が再生されてよい。またこのときに、高頻出キーワードの音量を大きくする、周波数を変換する、等によって強調する態様で音声を再生させてもよい。
(付記)
(付記1)
対象空間の音声データおよび画像データを取得する取得部と、
前記音声データをテキストデータに変換する音声認識部と、
前記画像データに基づいて前記対象空間の状況を評価し、前記対象空間における前記状況の状況評価値を算出する状況評価部と、
前記状況評価値が予め定められた条件を満たす状況を示すイベントが発生した場合、前記イベントが発生している期間を含む予め定められた期間の前記画像データの画像に、前記テキストデータに基づく画像および前記状況に関連する画像のうち少なくとも一方を重畳させた重畳画像データを生成する画像処理部と
を備える画像処理システム。
(付記2)
前記状況評価部は、前記画像データに基づいて撮像された人物の表情を評価し、前記対象空間における前記状況に関連する表情の表情評価統計値を算出し、
前記状況評価値は、前記表情評価統計値を含む
付記1に記載の画像処理システム。
(付記3)
前記画像処理部は、前記状況評価値に基づいて、重畳される前記テキストデータに基づく画像の態様を決定する
付記1または2に記載の画像処理システム。
(付記4)
前記音声データから取得される特徴に基づいて音声評価値を算出する音声評価部をさらに備え、
前記状況評価値は、前記音声評価値を含む、
付記1から3のいずれか一項に記載の画像処理システム。
(付記5)
対象空間の音声データおよび画像データを取得する段階と、
前記音声データをテキストデータに変換する段階と、
前記画像データに基づいて前記対象空間の状況を評価し、前記対象空間における前記状況の状況評価値を算出する段階と、
前記状況評価値が予め定められた条件を満たす状況を示すイベントが発生した場合、前記イベントが発生している期間を含む予め定められた期間の前記画像データの画像に、前記テキストデータに基づく画像および前記状況に関連する画像のうち少なくとも一方を重畳させた重畳画像データを生成する段階と
を備える画像処理方法。
10,10a 画像処理装置
11 取得部
12,12a 状況評価部
13 画像評価部
14 音声評価部
15 音声認識部
16 画像処理部
17 画像記録部
18 テーブル記憶部
19,19a 状況テーブル
20,20a 画像処理態様テーブル
30 カメラ
40 マイク
Claims (5)
- 移動体の室内である対象空間の音声データおよび画像データを取得する取得部と、
前記音声データをテキストデータに変換する音声認識部と、
前記画像データに基づいて前記対象空間の状況を評価し、前記対象空間における前記状況の状況評価値を算出する状況評価部と、
前記移動体に異常が発生した際の画像を予め記録する画像記憶部と、
前記状況評価値が予め定められた条件を満たす状況を示すイベントが発生した場合、前記イベントが発生している期間を含む予め定められた期間の前記画像データの画像に、前記テキストデータに基づく画像および前記状況に関連する画像のうち少なくとも一方を重畳させた重畳画像データを生成し、前記予め記録された前記移動体に異常が発生した際の画像とは区別して前記重畳画像データを前記画像記憶部に記録する画像処理部と
を備える画像処理装置。 - 前記取得部は、前記対象空間に存在する人物を撮像した画像データを取得し、
前記画像処理部は、前記画像データから、前記人物をズームアップした画像を生成し、前記テキストデータに基づく画像および前記状況に関連する画像のうち少なくとも一方を、前記ズームアップした画像に重畳させた重畳画像データを生成する、
請求項1に記載の画像処理装置。 - 前記画像処理部は、前記状況評価値に基づいて、重畳される前記テキストデータに基づく画像の態様を決定する
請求項1または2に記載の画像処理装置。 - 前記音声データから取得される特徴に基づいて音声評価値を算出する音声評価部をさらに備え、
前記状況評価値は、前記音声評価値を含む、
請求項1から3のいずれか一項に記載の画像処理装置。 - 移動体の室内である対象空間の音声データおよび画像データを取得する段階と、
前記音声データをテキストデータに変換する段階と、
前記画像データに基づいて前記対象空間の状況を評価し、前記対象空間における前記状況の状況評価値を算出する段階と、
前記状況評価値が予め定められた条件を満たす状況を示すイベントが発生した場合、前記イベントが発生している期間を含む予め定められた期間の前記画像データの画像に、前記テキストデータに基づく画像および前記状況に関連する画像のうち少なくとも一方を重畳させた重畳画像データを生成し、画像記憶部に予め記録された前記移動体に異常が発生した際の画像とは区別して前記重畳画像データを前記画像記憶部に記録する段階と
を備える画像処理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020117846A JP7532963B2 (ja) | 2020-07-08 | 2020-07-08 | 画像処理装置および画像処理方法 |
JP2024122207A JP2024149535A (ja) | 2020-07-08 | 2024-07-29 | 画像処理装置および画像処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020117846A JP7532963B2 (ja) | 2020-07-08 | 2020-07-08 | 画像処理装置および画像処理方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024122207A Division JP2024149535A (ja) | 2020-07-08 | 2024-07-29 | 画像処理装置および画像処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022015167A JP2022015167A (ja) | 2022-01-21 |
JP7532963B2 true JP7532963B2 (ja) | 2024-08-14 |
Family
ID=80120620
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020117846A Active JP7532963B2 (ja) | 2020-07-08 | 2020-07-08 | 画像処理装置および画像処理方法 |
JP2024122207A Pending JP2024149535A (ja) | 2020-07-08 | 2024-07-29 | 画像処理装置および画像処理方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024122207A Pending JP2024149535A (ja) | 2020-07-08 | 2024-07-29 | 画像処理装置および画像処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (2) | JP7532963B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024062779A1 (ja) * | 2022-09-22 | 2024-03-28 | ソニーグループ株式会社 | 情報処理装置、および情報処理システム、並びに情報処理方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007266793A (ja) | 2006-03-28 | 2007-10-11 | Casio Comput Co Ltd | 画像加工装置 |
JP2010066844A (ja) | 2008-09-09 | 2010-03-25 | Fujifilm Corp | 動画コンテンツの加工方法及び装置、並びに動画コンテンツの加工プログラム |
JP2011182109A (ja) | 2010-02-26 | 2011-09-15 | Sony Corp | コンテンツ再生装置 |
WO2013008300A1 (ja) | 2011-07-11 | 2013-01-17 | トヨタ自動車株式会社 | 車両の緊急退避装置 |
CN104077820A (zh) | 2014-07-02 | 2014-10-01 | 东南大学 | 基于物联网的驾驶人行为识别监测系统 |
JP2018063486A (ja) | 2016-10-11 | 2018-04-19 | 本田技研工業株式会社 | サービス提供装置、サービス提供方法およびサービス提供プログラム |
JP2018073253A (ja) | 2016-11-01 | 2018-05-10 | パナソニックIpマネジメント株式会社 | 運転手モニタ装置及び運転手モニタ方法 |
JP2019504532A (ja) | 2016-03-14 | 2019-02-14 | テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド | 情報処理方法及び端末 |
JP2019158975A (ja) | 2018-03-08 | 2019-09-19 | トヨタ自動車株式会社 | 発話システム |
WO2019230225A1 (ja) | 2018-05-29 | 2019-12-05 | ソニー株式会社 | 画像処理装置、画像処理方法、プログラム |
-
2020
- 2020-07-08 JP JP2020117846A patent/JP7532963B2/ja active Active
-
2024
- 2024-07-29 JP JP2024122207A patent/JP2024149535A/ja active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007266793A (ja) | 2006-03-28 | 2007-10-11 | Casio Comput Co Ltd | 画像加工装置 |
JP2010066844A (ja) | 2008-09-09 | 2010-03-25 | Fujifilm Corp | 動画コンテンツの加工方法及び装置、並びに動画コンテンツの加工プログラム |
JP2011182109A (ja) | 2010-02-26 | 2011-09-15 | Sony Corp | コンテンツ再生装置 |
WO2013008300A1 (ja) | 2011-07-11 | 2013-01-17 | トヨタ自動車株式会社 | 車両の緊急退避装置 |
CN104077820A (zh) | 2014-07-02 | 2014-10-01 | 东南大学 | 基于物联网的驾驶人行为识别监测系统 |
JP2019504532A (ja) | 2016-03-14 | 2019-02-14 | テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド | 情報処理方法及び端末 |
JP2018063486A (ja) | 2016-10-11 | 2018-04-19 | 本田技研工業株式会社 | サービス提供装置、サービス提供方法およびサービス提供プログラム |
JP2018073253A (ja) | 2016-11-01 | 2018-05-10 | パナソニックIpマネジメント株式会社 | 運転手モニタ装置及び運転手モニタ方法 |
JP2019158975A (ja) | 2018-03-08 | 2019-09-19 | トヨタ自動車株式会社 | 発話システム |
WO2019230225A1 (ja) | 2018-05-29 | 2019-12-05 | ソニー株式会社 | 画像処理装置、画像処理方法、プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2022015167A (ja) | 2022-01-21 |
JP2024149535A (ja) | 2024-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Agarwal et al. | Protecting world leaders against deep fakes. | |
US8494338B2 (en) | Electronic apparatus, video content editing method, and program | |
KR101445263B1 (ko) | 맞춤형 콘텐츠 제공 시스템 및 방법 | |
US8611724B2 (en) | Computer readable medium, information processing apparatus and method for processing moving image and sound | |
US6928231B2 (en) | Method and system for video recording and computer program storing medium thereof | |
US8270806B2 (en) | Information processing apparatus and method of controlling same | |
US8645121B2 (en) | Language translation of visual and audio input | |
US11860925B2 (en) | Human centered computing based digital persona generation | |
JP4641389B2 (ja) | 情報処理方法、情報処理装置 | |
JP2024149535A (ja) | 画像処理装置および画像処理方法 | |
CN106162073A (zh) | 通信设备 | |
JP2004056286A (ja) | 画像表示方法 | |
US12198198B2 (en) | Method and apparatus for accidental negligence evaluation of accident image using deep learning | |
CN110378587A (zh) | 智能质检方法、系统、介质以及设备 | |
JP7459866B2 (ja) | 記録システム、及び、記録方法 | |
JP6451721B2 (ja) | 記録装置、再生方法、及びプログラム | |
JP2007101945A (ja) | 音声付き映像データ処理装置、音声付き映像データ処理方法及び音声付き映像データ処理用プログラム | |
EP4528655A1 (en) | Digital human driving method, digital human driving device and storage medium | |
Gadkar et al. | Online Examination Auto-Proctoring System | |
CN114821552A (zh) | 桌面背景动态展示方法、装置、设备及存储介质 | |
KR101462249B1 (ko) | 비디오 컨텐츠의 시청각 정보 출력 오류를 검출하는 장치 및 방법 | |
KR20190054721A (ko) | 동영상을 이용한 카툰 생성장치 및 방법 | |
KR20190000087A (ko) | 얼굴 표정 인식을 활용한 멀티미디어 가공 방법 및 시스템 | |
CN113191209A (zh) | 基于深度学习的智能预警方法 | |
Marteau et al. | Level fusion analysis of recurrent audio and video neural network for violence detection in railway |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230331 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240313 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240326 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240523 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240702 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240715 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7532963 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |