JP4578638B2 - 画像認識方法 - Google Patents
画像認識方法 Download PDFInfo
- Publication number
- JP4578638B2 JP4578638B2 JP2000233816A JP2000233816A JP4578638B2 JP 4578638 B2 JP4578638 B2 JP 4578638B2 JP 2000233816 A JP2000233816 A JP 2000233816A JP 2000233816 A JP2000233816 A JP 2000233816A JP 4578638 B2 JP4578638 B2 JP 4578638B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- closed curve
- recognition
- energy
- recognition object
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Image Analysis (AREA)
Description
【発明の属する技術分野】
本発明は、画像認識方法に関するものであり、特に、動的輪郭抽出方法におけるエネルギー制御方法に関するものである。
【0002】
【従来の技術】
画像に含まれる特定の認識対象物の輪郭を抽出する方法として、動的輪郭抽出方法(Snakes: “active contour model” ,International Journal of Computer Vision ,Vol.1, No.4, pp.321-331, 1988)が知られている。
【0003】
この方法は、画像に含まれる特定の認識対象物に対して変形可能な閉曲線を設定し、その閉曲線のエネルギーを定義することにより、その閉曲線の状態を定量的に評価するものである。閉曲線のエネルギーは閉曲線が認識対象物の輪郭に一致した場合に最も小さくなるように定義されるものであり、このことから閉曲線をそのエネルギーが最小となるように変形させることで認識対象物の輪郭を抽出することができる。なお、閉曲線はその閉曲線を形成する離散的に配置された制御点を連結したものである。従って、上述の閉曲線を変形させる処理とは、閉曲線のエネルギーが最小となるように閉曲線上の各制御点を移動させることを意味する。具体的には、閉曲線の状態に対応して定義される、内部エネルギー(内部スプラインエネルギー)、画像エネルギー、および外部エネルギー、の3つのエネルギーの和が最小になるように閉曲線上の制御点v(s)を移動させることにより、認識対象物の輪郭を抽出する。この時の閉曲線のエネルギーは[数1]に示すような式で表せられる。
【数1】
【0004】
なお、内部スプラインエネルギーは、制御点の1次微分および2次微分からなり、閉曲線を収縮させ、さらに滑らかにする力を作用させるエネルギーで、[数2]に示す式で表せられる。
【数2】
【0005】
また、画像エネルギーは、制御点座標における画像の微分により与えられ、閉曲線を画像のエッジに張り付かせる力を作用させるエネルギーで、[数3]に示すような式で表せられる。
【数3】
【0006】
また、外部エネルギーは、外部から閉曲線に対しエネルギーを与え、閉曲線を収縮あるいは膨張させる力を作用させるエネルギーで、[数4]に示す式で表せられる。
【数4】
【0007】
【発明が解決しようとする課題】
従来の動的輪郭抽出方法において、閉曲線は、縮小方向への変形か、あるいは膨張方向への変形のどちらか一方向の変形しか行うことができない。よって、画像認識処理を開始する際、閉曲線を縮小方向へ変形する制御を行う場合は、認識対象物を囲むように閉曲線を配置する必要がある。また、閉曲線を膨張方向へ変形する制御を行う場合は、認識対象物の中に全ての線分が含まれるように閉曲線を初期設定する必要がある。仮に閉曲線の初期設定を認識対象領域と交差するように設定してしまうと、閉曲線は認識対象物の全周におけるエッジに貼りつかず認識に失敗する。すなわち、図3に示すように、制御点330〜343を連結して形成した初期閉曲線320を認識対象物310と交差するように設定した場合、縮小制御を行うと初期閉曲線320は閉曲線330へと変形することから、閉曲線330は認識対象物310の全周におけるエッジに貼りつかず、認識対象物310を正確に認識することができない。つまり、従来の動的輪郭抽出方法において画像中の認識対象物を認識する精度は、閉曲線の初期座標に大きく依存した結果となり、閉曲線の初期設定の状態によっては認識対象物の認識を行うことができない可能性が生じる。
【0008】
また、従来の動的輪郭抽出方法を適用したコンピュータシステムによる画像認識処理において、その処理速度を高速化する場合に生じる問題点について以下に述べる。図4に、一般的なコンピュータシステムにより画像処理を行う場合のデータフロ−を示す。コンピュータシステム400において各種画像処理を行う場合、画像処理に必要なデータは、ハードディスク440やCCDカメラ等のセンサから、メインメモリ430に読み込まれ、そのデータはCPU420に転送され、その後キャッシュメモリ410に格納される。キャッシュメモリ410に既に必要なデータが転送されている場合は、CPU420がキャッシュメモリ410からそのデータの読み込みを行う。この時、一般にキャッシュメモリ410へのアクセス速度は高速であり、これに対しメインメモリ430へのアクセス速度は低速である。しかしキャッシュメモリ410は高価であるためコンピュータシステムにおいては少量サイズしか搭載しておらず、これに対し安価なメインメモリ430は大容量搭載されているのが一般的である。
【0009】
上記コンピュータ構造から、画像処理の処理速度を高速化させるためには、高速なデータアクセスが可能なキャッシュメモリ410を有効活用することが重要となる。CPU420の必要なデータがキャッシュメモリ410に存在することを現す比率をヒット率と総称するが、このヒット率を向上させることが高速化に直結する。動的輪郭抽出方法を適用したコンピュータシステムにおいてヒット率を向上させる方法としては、画像データを小領域に分割して閉曲線を決定し、その領域毎に対象を認識することにより、処理対象データの容量を少量に抑える方法が考えられる。しかし上述のように、従来の動的輪郭抽出方法においては、閉曲線を配置する際に、その閉曲線を認識対象領域と交差しないように初期設定する必要がある。しかしながら、図5のように画像500上に認識対象物520が配置されていると、画像500を分割する分割線510は複雑な配置となり、閉曲線を容易に決定することができないという問題が生じる。また分割線510により画像を分割し、閉曲線を決定できた場合においても、この分割線の配置問題を解決するための処理時間がオーバーヘッドとなる。
【0010】
よって、本発明では、画像に含まれる特定の認識対象物の輪郭を抽出する動的輪郭抽出方法において、認識対象物に対して配置する閉曲線の初期設定条件を求めることなく、認識対象物を正確に認識することのできる画像認識方法を提供することを目的とする。
【0011】
【課題を解決するための手段】
請求項1に記載の画像認識方法は、画像上に閉曲線を配置し、曲線の滑らかさを示す内部エネルギーと、前記画像の濃度勾配を示す画像エネルギーと、外部からの外部エネルギーとを用いて、前記閉曲線の縮小処理あるいは膨張処理を行い、前記画像に含まれる認識対象物の輪郭を抽出する動的輪郭抽出方法において、前記画像は認識対象物と背景部とを含む2値画像であり、初期閉曲線を認識対象物と交差するように設定し、前記認識対象物における前記外部エネルギーを前記閉曲線が膨張する方向へ、前記背景部における前記外部エネルギーを前記閉曲線が縮小する方向へ、前記画像の濃度値に応じて動的に変化させることを特徴とする。
【0012】
請求項2に記載の画像認識方法は、画像上に閉曲線を配置し、曲線の滑らかさを示す内部エネルギーと、前記画像の濃度勾配を示す画像エネルギーと、外部からの外部エネルギーとを用いて、前記閉曲線の縮小処理あるいは膨張処理を行い、前記画像に含まれる認識対象物の輪郭を抽出する動的輪郭抽出方法において、前記画像は認識対象物と背景部とを含む2値画像であり、初期閉曲線を、複数のタイル状に分割してなる各分割領域の周縁に一致するように配置し、前記認識対象物における前記外部エネルギーを前記閉曲線が膨張する方向へ、前記背景部における前記外部エネルギーを前記閉曲線が縮小する方向へ、前記画像の濃度値に応じて動的に変化させることを特徴とする
【0014】
【発明の実施の形態】
(実施の形態1)
以下、実施の形態1に係る画像認識方法について図1を用いて説明する。
図1において、2値画像100は認識処理対象となる認識対象物110と認識対象物の外部(背景部)160からなり、認識対象物110の濃度値(画素値)を1の値に、また背景部160の画素値を0の値に設定したものである。
【0015】
以下、図1に示す2値画像100中の認識対象物110を閉曲線120により認識する方法について説明する。
まず、図1に示すように、初期閉曲線120を認識対象物110と交差するように設定する。ここで閉曲線とは、その閉曲線上に離散的に配置した制御点(130〜137,140,141)を連結したもののことを指す。この各制御点を連結する処理においては、方向性を有するものとし、半時計周りを正とする。閉曲線120の基本制御は、[数1]に示す閉曲線のエネルギーESNAKE(v)が最小となるように各制御点を移動制御することによって行う。
【0016】
次に、閉曲線120上の各制御点が、認識対象物110の内側に位置するか、または外側に位置するかの判定を行う。この判定は各制御点座標における2値画像100の画素値により行い、制御点座標における画素値が1の場合には認識対象物110の内側に位置すると判定し、一方、制御点座標における画素値が0の場合には認識対象物110の外側、すなわち背景部160に位置すると判定する。なお、図1においては、認識対象物110の外側にある制御点を黒丸(130〜137)で示し、内側にある制御点を白丸(140,141)で示している。
【0017】
次に、外部エネルギーを動的に変化させ、閉曲線120上の各制御点の移動方向を決定する。認識対象物110の外側にある制御点に対しては、対象とする制御点の前後の制御点を結ぶことで得られるベクトルを90度回転させたベクトルを外部エネルギーとして作用させる。また、認識対象物110の内側にある制御点に対しては、対象とする制御点の前後の制御点を結ぶことで得られるベクトルをマイナス90度回転させたベクトルを外部エネルギーとして作用させる。なお、ベクトルの絶対値は正規化した値を用いてもよい。
【0018】
具体的には、例えば、移動制御対象の制御点を図1に示す制御点131とした場合、制御点131は認識対象物110の外側に存在するため、制御点131の前後に位置する制御点130と制御点132とを結ぶことで得られるベクトル145を90度回転させ、外部エネルギー146を生成する。この生成した外部エネルギー146は制御点131に対して認識対象物110の外側から内側へ作用する。そして、制御点131は、外部エネルギー146に従って認識対象物110の外側から内側、すなわち閉曲線120が縮小する方向へ移動する。以上のようにして、認識対象物110の外側に位置する制御点(130〜137)に対しては認識対象物110の外側から内側に外部エネルギーを作用させ、これにより制御点(130〜137)を閉曲線120が縮小する方向に移動させるようにする。また、認識対象物110の内側に位置する制御点(140,141)に対しては、認識対象物110の内側から外側に外部エネルギーを作用させ、これにより制御点(140,141)を閉曲線120が膨張する方向へ移動させるようにする。その結果、初期閉曲線120は、閉曲線150へと変形して認識対象物310の全周におけるエッジに貼りつき、認識対象物110の輪郭が認識される。
【0019】
以上のように、実施の形態1の画像認識方法によれば、2値画像100に含まれる認識対象物110の輪郭を認識する際に、2値画像100の画像値に応じて外部エネルギーを動的に変化させ、閉曲線120上の各制御点を、この外部エネルギーに従って閉曲線120が縮小・膨張する方向に移動させるようにしたことから、閉曲線120を認識対象物110と交差するように初期設定した場合においても認識対象物110の輪郭を正確に認識することができる。
【0020】
(実施の形態2)
以下、実施の形態2に係る画像認識方法について図2を用いて説明する。
本実施の形態2に係る画像認識方法は、画像に含まれる特定の認識対象物を認識する際に、その処理速度を高速化するために、画像を小領域に分割し、領域分割毎に認識対象物を認識することを特徴とする。
【0021】
具体的には、まず、画像200を分割線210により小領域に分割し、閉曲線(231〜238)を決定する。このような処理を行うことにより、図2に示すように、画像200に対して複数の閉曲線がタイル状に配置された状態になる。
【0022】
次に、各分割領域毎に実施の形態1の画像認識方法を用いて認識対象物220の認識を行う。なお、本実施の形態2では、各分割領域毎に実施の形態1の画像認識方法を用いて認識対象物220の認識を行うことから、画像200に対して複数の閉曲線をタイル状に配置する際に、認識対象物220が閉曲線(231〜238)と交差しないように初期設定する必要がない。
【0023】
以上のように本実施の形態2の画像認識方法によれば、画像200に複数の閉曲線(231〜238)をタイル状に配置し、その領域毎に認識対象物220を実施の形態1の画像認識方法を用いて認識していることから、認識対象物220に対する閉曲線の初期設定条件を求めることなく、画像200を単純にタイル状に分割して、その領域毎に認識対象物220を認識することができ、認識対象物220の認識処理速度を向上させることが可能となる。
【0024】
【発明の効果】
以上のように請求項1に記載の画像認識方法によれば、画像上に閉曲線を配置し、曲線の滑らかさを示す内部エネルギーと、前記画像の濃度勾配を示す画像エネルギーと、外部からの外部エネルギーとを用いて、前記閉曲線の縮小処理あるいは膨張処理を行い、前記画像に含まれる認識対象物の輪郭を抽出する動的輪郭抽出方法において、前記画像は認識対象物と背景部とを含む2値画像であり、初期閉曲線を認識対象物と交差するように設定し、前記認識対象物における前記外部エネルギーを前記閉曲線が膨張する方向へ、前記背景部における前記外部エネルギーを前記閉曲線が縮小する方向へ、前記画像の濃度値に応じて動的に変化させるようにしたことから、前記閉曲線の縮小及び膨張制御を前記画像の画素値に応じて行うことができ、認識対象物に対して配置する閉曲線の初期設定条件を求めることなく、正確に画像中に含まれる認識対象物の輪郭を認識することが可能となる。
【0025】
また、請求項2に記載の画像認識方法によれば、画像上に閉曲線を配置し、曲線の滑らかさを示す内部エネルギーと、前記画像の濃度勾配を示す画像エネルギーと、外部からの外部エネルギーとを用いて、前記閉曲線の縮小処理あるいは膨張処理を行い、前記画像に含まれる認識対象物の輪郭を抽出する動的輪郭抽出方法において、前記画像は認識対象物と背景部とを含む2値画像であり、初期閉曲線を、複数のタイル状に分割してなる各分割領域の周縁に一致するように配置し、前記認識対象物における前記外部エネルギーを前記閉曲線が膨張する方向へ、前記背景部における前記外部エネルギーを前記閉曲線が縮小する方向へ、前記画像の濃度値に応じて動的に変化させるようにしたことから、認識対象物に対して配置する閉曲線の初期設定条件を求めることなく、画像を単純に分割線で小領域に分割し、その領域毎に認識対象物を正確に認識することができ、画像に含まれる認識対象物の認識処理速度を向上させることが可能となる。
【図面の簡単な説明】
【図1】本実施の形態1に係る画像認識方法の動作概要を説明するための図である
【図2】本実施の形態2に係る画像認識方法の動作概要を説明するための図である。
【図3】従来の動的輪郭抽出方法の動作制御を説明するための図である。
【図4】一般的なコンピュータにより画像処理を行う場合のデータフローを示す図である。
【図5】従来の動的輪郭抽出方法において、画像認識処理の処理速度を高速化する際の問題点を説明するための図である。
【符号の説明】
100 2値画像
110,220,310 認識対象物
120,150,320,330 閉曲線
130,131,132,133,134,135,136,137,140,141,330,331,332,333,334,335,336,337,338,339,340,341,342,343 制御点
145 ベクトル
146 外部エネルギー
160 背景部
200,500 画像
210,510 分割線
400 コンピュータシステム
410 キャッシュメモリ
420 CPU
430 メインメモリ
440 ハードディスク
Claims (2)
- 画像上に閉曲線を配置し、曲線の滑らかさを示す内部エネルギーと、前記画像の濃度勾配を示す画像エネルギーと、外部からの外部エネルギーとを用いて、前記閉曲線の縮小処理あるいは膨張処理を行い、前記画像に含まれる認識対象物の輪郭を抽出する動的輪郭抽出方法において、
前記画像は認識対象物と背景部とを含む2値画像であり、
初期閉曲線を認識対象物と交差するように設定し、
前記認識対象物における前記外部エネルギーを前記閉曲線が膨張する方向へ、前記背景部における前記外部エネルギーを前記閉曲線が縮小する方向へ、前記画像の濃度値に応じて動的に変化させることを特徴とする画像認識方法。 - 画像上に閉曲線を配置し、曲線の滑らかさを示す内部エネルギーと、前記画像の濃度勾配を示す画像エネルギーと、外部からの外部エネルギーとを用いて、前記閉曲線の縮小処理あるいは膨張処理を行い、前記画像に含まれる認識対象物の輪郭を抽出する動的輪郭抽出方法において、
前記画像は認識対象物と背景部とを含む2値画像であり、
初期閉曲線を、複数のタイル状に分割してなる各分割領域の周縁に一致するように配置し、
前記認識対象物における前記外部エネルギーを前記閉曲線が膨張する方向へ、前記背景部における前記外部エネルギーを前記閉曲線が縮小する方向へ、前記画像の濃度値に応じて動的に変化させることを特徴とする画像認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000233816A JP4578638B2 (ja) | 2000-08-02 | 2000-08-02 | 画像認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000233816A JP4578638B2 (ja) | 2000-08-02 | 2000-08-02 | 画像認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002049922A JP2002049922A (ja) | 2002-02-15 |
JP4578638B2 true JP4578638B2 (ja) | 2010-11-10 |
Family
ID=18726284
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000233816A Expired - Fee Related JP4578638B2 (ja) | 2000-08-02 | 2000-08-02 | 画像認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4578638B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3936683B2 (ja) | 2003-08-04 | 2007-06-27 | 株式会社デンソー | 道路位置検出装置及びプログラム |
JP2006252400A (ja) * | 2005-03-14 | 2006-09-21 | Keyence Corp | 画像処理装置及び画像処理における登録データ生成方法 |
JP6599697B2 (ja) | 2015-08-31 | 2019-10-30 | 株式会社ミツトヨ | 画像測定装置及びその制御プログラム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10143634A (ja) * | 1996-11-12 | 1998-05-29 | Fuji Photo Film Co Ltd | 円形照射野認識方法および装置 |
JP2000048212A (ja) * | 1998-07-31 | 2000-02-18 | Canon Inc | 画像処理方法及び装置、記録媒体 |
-
2000
- 2000-08-02 JP JP2000233816A patent/JP4578638B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2002049922A (ja) | 2002-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liu et al. | eslam: An energy-efficient accelerator for real-time orb-slam on fpga platform | |
JP4756660B2 (ja) | 画像処理装置および画像処理方法 | |
CN108765315B (zh) | 图像补全方法、装置、计算机设备及存储介质 | |
EP2165311A1 (en) | Information processing method and apparatus, program, and storage medium | |
JP2001357399A (ja) | 画像処理装置及び方法 | |
CN102063727B (zh) | 一种基于协方差匹配的主动轮廓跟踪方法 | |
TWI815351B (zh) | 目標追蹤方法及目標追蹤裝置 | |
JPH1139493A (ja) | 距離及び方向に鑑みたパターン整合装置及びその方法 | |
CN110288517A (zh) | 基于投影匹配组的骨架线提取方法 | |
JP4578638B2 (ja) | 画像認識方法 | |
JP6210953B2 (ja) | 画像処理装置および画像処理方法 | |
CN115761826A (zh) | 掌静脉有效区域提取方法、系统、介质及电子设备 | |
CN112990207A (zh) | 车牌图像提取方法、装置、系统、存储介质和计算机设备 | |
CN118315030A (zh) | 一种基于隐私保护的医疗图像处理方法、装置及设备 | |
JP2015026117A (ja) | 画像処理方法、画像処理装置、プログラム及び記録媒体 | |
CN116485759A (zh) | 一种超声影像中目标边界识别方法、系统及电子设备 | |
JP3638845B2 (ja) | 画像処理装置及び方法 | |
WO2020255645A1 (ja) | 3次元データ更新装置、顔向き推定装置、3次元データ更新方法およびコンピュータ読み取り可能な記録媒体 | |
CN115564728A (zh) | 一种图像角点检测方法、装置、设备及应用 | |
JP2010009437A (ja) | パターンの消失に対応したマッチング方式及びそれを用いた検査装置 | |
JP2004178210A (ja) | 画像処理方法及び画像認識方法並びにこれらの方法をコンピュータにより実行させるプログラム | |
CN117994224B (zh) | 一种基于各向异性结构边缘的椭圆检测方法及系统 | |
CN110658783A (zh) | 一种五轴加工刀轴可行域的求解方法及系统 | |
WO2020184066A1 (ja) | 関節位置推定装置、関節位置推定方法およびコンピュータ読み取り可能な記録媒体 | |
CN113744312B (zh) | 运动控制和纹理显示的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070621 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100416 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100511 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100709 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100727 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100825 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130903 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |