JP4830763B2 - 画像処理システムおよび画像処理プログラム - Google Patents
画像処理システムおよび画像処理プログラム Download PDFInfo
- Publication number
- JP4830763B2 JP4830763B2 JP2006268529A JP2006268529A JP4830763B2 JP 4830763 B2 JP4830763 B2 JP 4830763B2 JP 2006268529 A JP2006268529 A JP 2006268529A JP 2006268529 A JP2006268529 A JP 2006268529A JP 4830763 B2 JP4830763 B2 JP 4830763B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- area
- image
- pattern
- display
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Digital Computer Display Output (AREA)
- Facsimile Image Signal Circuits (AREA)
- Controls And Circuits For Display Device (AREA)
- Character Input (AREA)
Description
これらに関する技術として、例えば、特許文献1には、静止画や動画に文字を重ねて表示する際に視認性を向上させることを課題とし、CPUは、撮影した静止画像や動画像、フラッシュメモリに記録されている静止画像、動画像などを再生する際に、音声認識処理部により変換され、テキスト分割処理部により分割されたテキストを、表示装置に再生中の静止画像や動画像上に重ねて表示し、このとき、テキスト長が画面サイズより小さい場合には、そのままセンタリング表示や縦書き表示し、また、テキスト長が画面サイズより大きい(画面に入りきらない)場合には、テキスト文字のフォントを小さいものに変換したり、テキストの語彙を短縮語彙に変換したり、スクロールしたりするなどして表示することが開示されている。
[1] 画像を文字が含まれる文字領域と絵柄が含まれる絵柄領域に分離する領域分離手段と、
前記領域分離手段によって分離された絵柄領域を表示し、該絵柄領域の表示の上に前記領域分離手段によって分離された文字領域を重ねて表示する表示手段と、
前記領域分離手段によって分離された絵柄領域が複数ある場合は、該絵柄領域の中から表示する絵柄領域を選択する絵柄領域選択手段と、
前記領域分離手段によって分離された文字領域に対して文字認識を行う文字認識手段と、
文字と該文字が表す内容である画像の画像特徴量とを対応して記憶する特徴量記憶手段
を具備し、
前記絵柄領域選択手段は、前記文字認識手段による認識結果である文字に対応する画像の画像特徴量を前記特徴量記憶手段から抽出し、前記絵柄領域の画像特徴量を抽出し、該特徴量記憶手段から抽出した画像特徴量と該絵柄領域の画像特徴量を比較して、文字領域の文字に対応した絵柄領域を選択し、
前記表示手段は、前記絵柄領域選択手段によって選択された絵柄領域を表示する
ことを特徴とする画像処理システム。
ことを特徴とする[1]に記載の画像処理システム。
ことを特徴とする[1]に記載の画像処理システム。
ことを特徴とする[2]に記載の画像処理システム。
(1)文字が黒以外の文字であれば、該文字が前記絵柄領域の中央付近に位置したときに、該文字を変形する処理、
(2)スクロール表示している文字列が前記絵柄領域の中央付近に位置したときに、その文字列を変形する処理、
(3)予め記憶されている文字と同じ文字を表示しようとした場合に、該文字を変形する処理、
(4)前記絵柄領域の色と表示しようとする文字の色が類似している場合は、異なる色に変更する処理、
(5)文字列の高さ又は幅をそろえる変形をする処理、
のいずれかの処理を行うことを特徴とする[4]に記載の画像処理システム。
画像を文字が含まれる文字領域と絵柄が含まれる絵柄領域に分離する領域分離機能と、
前記領域分離機能によって分離された絵柄領域を表示し、該絵柄領域の表示の上に前記領域分離機能によって分離された文字領域を重ねて表示する表示機能と、
前記領域分離機能によって分離された絵柄領域が複数ある場合は、該絵柄領域の中から表示する絵柄領域を選択する絵柄領域選択機能と、
前記領域分離機能によって分離された文字領域に対して文字認識を行う文字認識機能と、
文字と該文字が表す内容である画像の画像特徴量とを対応して記憶する特徴量記憶機能
を実現させ、
前記絵柄領域選択機能は、前記文字認識機能による認識結果である文字に対応する画像の画像特徴量を前記特徴量記憶機能から抽出し、前記絵柄領域の画像特徴量を抽出し、該特徴量記憶機能から抽出した画像特徴量と該絵柄領域の画像特徴量を比較して、文字領域の文字に対応した絵柄領域を選択し、
前記表示機能は、前記絵柄領域選択機能によって選択された絵柄領域を表示する
ことを特徴とする画像処理プログラム。
各図は一実施の形態を示している。図1は、本発明の一実施の形態の概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはプログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、プログラム、システムおよび方法の説明をも兼ねている。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散または並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続を含む。
また、システムとは、複数のコンピュータ、ハードウェア、装置等がネットワーク等で接続されて構成されるほか、1つのコンピュータによって実現される場合も含まれる。
画像入力モジュール110は、図1に示すように、領域分離モジュール120と接続されており、対象とする画像を入力する。そして、入力した画像を領域分離モジュール120へ渡す。より具体的には、画像を電子的イメージとして入力するものにスキャナ、ファックス等が該当する。また、アプリケーション作成文書を入力するものとして、文書データベース等の記憶装置からの読み出しモジュール、通信回線を介して、他のシステムから受信する受信モジュール等が該当する。ここで、入力する画像は1枚の画像であってもよいし、複数ページからなる画像であってもよい。
また、その領域の属性として、文字が含まれている文字領域、絵柄が含まれている絵柄領域を少なくとも識別する。また、この他に、表が含まれている表領域等も識別してもよい。なお、絵柄領域には、文字領域以外であって、写真等の自然画が含まれている写真領域、CG(Computer Graphics)により描かれる図形等が含まれる図形領域などが含まれる。領域の属性の識別は、領域ごとに特徴抽出を行い、その特徴空間において、その属性の特徴を典型的に表すモデルとの距離に応じて、属性を定めることによって行う。特徴抽出以外に、他の既存の方法を用いてもよい。
文字整形モジュール140は、図1に示すように、文字認識モジュール130、表示モジュール150と接続されており、文字認識モジュール130によって認識された文字を整形処理する。その整形した文字を表示モジュール150へ渡す。
また、文字認識モジュール130が文字認識を行わなかった場合、文字を行毎に分ける、または文字毎に分けることを行い、その文字画像に対して整形処理を行う。以下に説明する整形処理において、文字または文字列とは、文字認識処理後の文字(テキスト)または文字列の他に、文字画像または文字列画像をも含むものとする。
ここで、整形処理とは、以下のような処理をいう。
(1)文字列の横幅が絵柄領域の幅よりも長い場合には、その絵柄領域の幅以内に収まるように、文字の大きさを縮小する(文字がテキストの場合は、文字のポイントを小さくする)。
(2)文字列の縦長が絵柄領域の縦よりも長い場合には、その絵柄領域の幅以内に収まるように、文字の大きさを縮小する(文字がテキストの場合は、文字のポイントを小さくする)。
(3)文字列の横幅が絵柄領域の幅よりも長い場合には、その絵柄領域の幅以内に収まるように、文字列を複数列に分ける(文字がテキストの場合は、改行を挿入する)。
また、文字認識モジュール130が文字認識を行わなかった場合、文字毎または行毎の文字画像を文字または文字列として扱うことができる。ここで説明する表示モジュール150内の処理において、文字または文字列とは、文字認識処理後の文字(テキスト)または文字列の他に、文字画像または文字列画像をも含むものとする。
絵柄領域選択モジュール151は、領域分離モジュール120によって分離された領域のうち、絵柄領域が複数ある場合に、その絵柄領域の中から表示する絵柄領域を選択する。選択の基準として、例えば、そのページの中で最大の大きさの絵柄領域を選択するようにしてもよい。
文字変形モジュール152は、スクロール表示モジュール153と連携しており、文字をスクロール表示する場合に、以下のような文字の変形処理を行う。この処理によって、重要な言葉(キーワード)の場合は、閲覧者の注意を引くことができるようになる。
(1)元の文字が黒以外(例えば、赤等)の文字であれば、その文字が絵柄領域のほぼ中央に位置したときに、この文字を変形する。変形には、拡大、色変更、スタイル変更、フォント変更、縁取り等の処理を含む。以下、同じである。
(2)スクロール表示している文字列が絵柄領域のほぼ中央に位置したときに、その文字列を変形する。
(3)キーワードDB160に格納されている文字と同じ文字(テキストの場合)を表示しようとした場合に、その文字を変形する。なお、キーワードDB160はサーバーとして、通信回線を介して、遠隔地にあるものであってもよい。
(4)絵柄領域の色と表示しようとする文字の色が類似している場合は、異なる色に変更する。スクロールしているので、絵柄領域内でも表示する位置(背景色)によって、色を変更することもできる。
(5)文字列の高さをそろえる変形をする。または、文字列の幅をそろえる変形をする。
図2は文字認識モジュール130によって文字認識処理を行った場合の処理であり、図3は文字認識モジュール130がない場合または文字認識モジュール130によって文字認識処理が行われなかった場合の処理である。
図2に示したフローチャートについて、図5、図6を用いて説明する。
ステップS200では、画像入力モジュール110が対象とする画像(原稿)を入力する。例えば、図5に示した画像500をスキャナ等を用いて入力する。
ステップS206では、絵柄領域選択モジュール151が複数の絵柄領域の中から表示する絵柄領域を選択する。図5の例では、絵柄領域は1つであるので、絵柄領域502が選択される。なお絵柄画像が複数あった場合には、画像サイズが一番大きい絵柄画像を選択してもよいし、操作者が選択するようにしてもよい。また、文字領域の文字の内容と絵柄画像の内容が一致した絵柄画像を選択してもよい。文字領域の文字の内容と絵柄画像の内容が一致した画像を選択するとは、絵柄画像に対して画像認識処理を行って抽出した、色の分布、エッジの強さ、エッジの方向などの前記絵柄画像の画像特徴量と前記文字領域の文字の内容に対応する画像の特徴量が登録されているデータベースの画像特徴量から、前記文字領域の文字の内容に対応する画像の特徴量と前記絵柄画像の画像特徴量が一番近い画像を選択することをいう。
ステップS208では、スクロール表示モジュール153がステップS204での認識結果とステップS206で選択した絵柄領域とを合成する。つまり、文字を表示するための画像を作成し、その文字画像と絵柄領域の画像との論理和合成、文字画像を薄くした上での論理和合成、文字画像と絵柄領域の画像との排他的論理和合成、文字部分のみの書き込み(つまり、背景部分は透明)等を行う。
ステップS210では、スクロール表示モジュール153がステップS208で作成した合成画像をディスプレイに表示する。表示している例を図6に示す。絵柄領域502の上面に(つまり、絵柄領域502を背景にして)文字領域501を合成してスクロール表示している例である。文字色を白色にして、文字部分のみの書き込みを行い、下から上へ文字領域501がスクロールしている。
このようにすることによって、ディスプレイが携帯電話に用いられているような小さな画面であっても、絵柄領域を判別できる程度に表示することができ、文字についてはスクロール表示するようにしているので、より多くの情報量を得ることができるようになる。
ステップS300は、ステップS200と同様である。
ステップS302は、ステップS202と同様である。
ステップS304は、ステップS206と同様である。
ステップS306では、ステップS304で選択された絵柄領域とステップS302で分離された文字領域とを画像として合成する。また、文字画像から文字列または文字毎の画像を取り出すこともできるので、合成処理としてはステップS208と同様の処理ができる。
ステップS308は、ステップS210と同様である。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去および書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、上記のプログラムまたはその一部は、上記記録媒体に記録して保存や流通等させることが可能である。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにはこれらの組合せ等の伝送媒体を用いて伝送することが可能であり、また、搬送波に乗せて搬送することも可能である。
さらに、上記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。
120…領域分離モジュール
130…文字認識モジュール
140…文字整形モジュール
150…表示モジュール
151…絵柄領域選択モジュール
152…文字変形モジュール
153…スクロール表示モジュール
160…キーワードDB
Claims (6)
- 画像を文字が含まれる文字領域と絵柄が含まれる絵柄領域に分離する領域分離手段と、
前記領域分離手段によって分離された絵柄領域を表示し、該絵柄領域の表示の上に前記領域分離手段によって分離された文字領域を重ねて表示する表示手段と、
前記領域分離手段によって分離された絵柄領域が複数ある場合は、該絵柄領域の中から表示する絵柄領域を選択する絵柄領域選択手段と、
前記領域分離手段によって分離された文字領域に対して文字認識を行う文字認識手段と、
文字と該文字が表す内容である画像の画像特徴量とを対応して記憶する特徴量記憶手段
を具備し、
前記絵柄領域選択手段は、前記文字認識手段による認識結果である文字に対応する画像の画像特徴量を前記特徴量記憶手段から抽出し、前記絵柄領域の画像特徴量を抽出し、該特徴量記憶手段から抽出した画像特徴量と該絵柄領域の画像特徴量を比較して、文字領域の文字に対応した絵柄領域を選択し、
前記表示手段は、前記絵柄領域選択手段によって選択された絵柄領域を表示する
ことを特徴とする画像処理システム。 - 前記表示手段は、前記領域分離手段によって分離された絵柄領域を表示し、該絵柄領域の表示の上に前記文字認識手段によって認識を行った文字を重ねて表示する
ことを特徴とする請求項1に記載の画像処理システム。 - 前記表示手段は、絵柄領域の上に文字領域を重ねて表示する場合に、該絵柄領域に応じて該文字領域を変形して表示する
ことを特徴とする請求項1に記載の画像処理システム。 - 前記表示手段は、絵柄領域の上に文字を重ねて表示する場合に、該絵柄領域に応じて該文字を変形して表示する
ことを特徴とする請求項2に記載の画像処理システム。 - 前記表示手段は、文字の変形として、
(1)文字が黒以外の文字であれば、該文字が前記絵柄領域の中央付近に位置したときに、該文字を変形する処理、
(2)スクロール表示している文字列が前記絵柄領域の中央付近に位置したときに、その文字列を変形する処理、
(3)予め記憶されている文字と同じ文字を表示しようとした場合に、該文字を変形する処理、
(4)前記絵柄領域の色と表示しようとする文字の色が類似している場合は、異なる色に変更する処理、
(5)文字列の高さ又は幅をそろえる変形をする処理、
のいずれかの処理を行うことを特徴とする請求項4に記載の画像処理システム。 - コンピュータに、
画像を文字が含まれる文字領域と絵柄が含まれる絵柄領域に分離する領域分離機能と、
前記領域分離機能によって分離された絵柄領域を表示し、該絵柄領域の表示の上に前記領域分離機能によって分離された文字領域を重ねて表示する表示機能と、
前記領域分離機能によって分離された絵柄領域が複数ある場合は、該絵柄領域の中から表示する絵柄領域を選択する絵柄領域選択機能と、
前記領域分離機能によって分離された文字領域に対して文字認識を行う文字認識機能と、
文字と該文字が表す内容である画像の画像特徴量とを対応して記憶する特徴量記憶機能
を実現させ、
前記絵柄領域選択機能は、前記文字認識機能による認識結果である文字に対応する画像の画像特徴量を前記特徴量記憶機能から抽出し、前記絵柄領域の画像特徴量を抽出し、該特徴量記憶機能から抽出した画像特徴量と該絵柄領域の画像特徴量を比較して、文字領域の文字に対応した絵柄領域を選択し、
前記表示機能は、前記絵柄領域選択機能によって選択された絵柄領域を表示する
ことを特徴とする画像処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006268529A JP4830763B2 (ja) | 2006-09-29 | 2006-09-29 | 画像処理システムおよび画像処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006268529A JP4830763B2 (ja) | 2006-09-29 | 2006-09-29 | 画像処理システムおよび画像処理プログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2008090449A JP2008090449A (ja) | 2008-04-17 |
JP2008090449A5 JP2008090449A5 (ja) | 2010-08-26 |
JP4830763B2 true JP4830763B2 (ja) | 2011-12-07 |
Family
ID=39374553
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006268529A Expired - Fee Related JP4830763B2 (ja) | 2006-09-29 | 2006-09-29 | 画像処理システムおよび画像処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4830763B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6433887B2 (ja) * | 2012-05-23 | 2018-12-05 | フレックスエネーブル リミティッド | 電子表示装置及びその駆動方法 |
US12165243B2 (en) | 2021-03-30 | 2024-12-10 | Snap Inc. | Customizable avatar modification system |
US12175570B2 (en) | 2021-03-31 | 2024-12-24 | Snap Inc. | Customizable avatar generation system |
CN117597690B (zh) * | 2021-06-30 | 2024-11-22 | 斯纳普公司 | 用于可定制媒体的混合搜索系统 |
US11941227B2 (en) * | 2021-06-30 | 2024-03-26 | Snap Inc. | Hybrid search system for customizable media |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04122991A (ja) * | 1990-09-14 | 1992-04-23 | Hitachi Ltd | 画像と文字の合成方法 |
JP2002351779A (ja) * | 2001-05-22 | 2002-12-06 | Minolta Co Ltd | データ表示システム、データ送信装置、携帯端末、データ表示方法、データ表示プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
-
2006
- 2006-09-29 JP JP2006268529A patent/JP4830763B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008090449A (ja) | 2008-04-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH10240220A (ja) | 注釈表示機能を持つ情報処理機器 | |
JP4623169B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5321109B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP4830763B2 (ja) | 画像処理システムおよび画像処理プログラム | |
JP2009251872A (ja) | 情報処理装置及び情報処理プログラム | |
JP2009223477A (ja) | 情報処理装置及び情報処理プログラム | |
JP6221220B2 (ja) | 画像処理装置及び画像処理プログラム | |
US8749854B2 (en) | Image processing apparatus, method for performing image processing and computer readable medium | |
CN101097518B (zh) | 用于识别光学字符的系统和方法 | |
JP4687625B2 (ja) | 画像処理システムおよび画像処理プログラム | |
EP3113031B1 (en) | Image processing device, image processing method, and program | |
US11206336B2 (en) | Information processing apparatus, method, and non-transitory computer readable medium | |
JP2009289197A (ja) | 情報処理装置、情報処理システム及び情報処理プログラム | |
JP3171626B2 (ja) | 文字認識の処理領域・処理条件指定方法 | |
JP6030915B2 (ja) | 画像再配置方法、画像再配置システム、および画像再配置プログラム | |
JP6682827B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP2008083898A (ja) | 情報処理システムおよび情報処理プログラム | |
JP4974367B2 (ja) | 領域分割方法及び装置、並びにプログラム | |
JP6003677B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4501731B2 (ja) | 画像処理装置 | |
JP5062076B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP2008090574A (ja) | 画像処理システムおよび画像処理プログラム | |
JP5720166B2 (ja) | 画像処理装置及び画像処理プログラム | |
JPH11187231A (ja) | 画像検索装置及び画像検索方法 | |
JP2008046832A (ja) | 画像処理システムおよび画像処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090210 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100713 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110421 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110426 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110513 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110607 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110613 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110823 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110905 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4830763 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140930 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees | ||
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R370 | Written measure of declining of transfer procedure |
Free format text: JAPANESE INTERMEDIATE CODE: R370 |