[go: up one dir, main page]

JP5725576B2 - パターン認識及びその学習方法 - Google Patents

パターン認識及びその学習方法 Download PDF

Info

Publication number
JP5725576B2
JP5725576B2 JP2013143460A JP2013143460A JP5725576B2 JP 5725576 B2 JP5725576 B2 JP 5725576B2 JP 2013143460 A JP2013143460 A JP 2013143460A JP 2013143460 A JP2013143460 A JP 2013143460A JP 5725576 B2 JP5725576 B2 JP 5725576B2
Authority
JP
Japan
Prior art keywords
category
pattern recognition
learning
identification
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013143460A
Other languages
English (en)
Other versions
JP2015018312A (ja
Inventor
健 星野
健 星野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Platforms Ltd
Original Assignee
NEC Platforms Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Platforms Ltd filed Critical NEC Platforms Ltd
Priority to JP2013143460A priority Critical patent/JP5725576B2/ja
Publication of JP2015018312A publication Critical patent/JP2015018312A/ja
Application granted granted Critical
Publication of JP5725576B2 publication Critical patent/JP5725576B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Description

本発明はパターン認識の学習装置、学習方法及び学習プログラム、並びに学習機能を備えたパターン認識装置に関する。
パターン認識では、ニューラルネットのパーセプトロンなどを用いて音声、文字、画像などのデータから特定のパターンを認識する。パターン認識では、認識対象のデータを特定の種類のパターンに対応付ける識別関数が用いられる。識別関数はパターンの種類毎に識別境界によってデータ空間を分割し、分割された領域に属するデータが当該種類のパターンに対応する。例えば、対象データが2次元データの場合には、識別関数が与える識別境界は識別線になり、3次元データの場合には識別面になり、一般にn次元データの場合には識別n次平面(「識別高次平面」ともいう)になる。
例えば、2次元データの場合、パターン認識装置は、識別関数が与える識別線によって、複数の点からなる一つのデータ群(「カテゴリ」ともいう)を他のデータ群から分離し、2次元データ面上にそのデータ群の領域を作る。そして、新たに未知のデータが入力されると、そのデータが分離された領域内に存在するかどうか確認し、領域内に存在する場合、未知のデータは事前に分離したデータ群と同じ種類であると識別される。もし、領域外である場合は、別の種類であると識別される。
図1は、データ群Aをデータ群Bとデータ群Cから分離する識別線を表しており、図中の未知データは、識別線よりデータ群A側の領域に存在するため、データ群Aのデータであると識別される。
関連技術では、パーセプトロンの学習完了時、識別関数が与える識別高次平面は、学習データ(「学習パターン」ということがある)の近傍に配置されることが多く、すなわち、未知のデータを入力した際に間違えやすい位置に配置され、必ずしも識別能力の高い位置に配置されなかった。そのため、カルバック・ライブラー・ダイバージェンスや距離関数等を用いて、学習完了後の識別高次平面を学習データから遠ざけるような識別能力向上法が用いられてきた。例えば、特許文献1には、クロスエントロピー誤差を最小化するようにパターン認識システムのトレーニング可能パラメータを更新することが開示されている。
しかし、その際、各学習データ群の中間位置に識別高次平面を配置しようとするため、大きく分散の異なるデータ群を分離する識別高次平面の場合、最適な位置に配置されない場合があった。例えば、図2に示されるように、識別高次平面に対して、垂直方向に分散が大きい学習データ群(カテゴリk)と、垂直方向に分散が小さい学習データ群(カテゴリk’)の中央に識別高次平面を配置した場合、カテゴリkの未知データは、識別高次平面に対して垂直方向に散らばったデータ(すなわち、図2において点線で表される領域に存在するデータ)となることが予想されるため、カテゴリk’と誤認識される可能性があった。
特開2003−296737号公報
関連技術の方法では、カテゴリ内の学習データの分散を考慮せずに、識別高次平面を設定していたため、最適な位置に識別高次平面が設定されず、未知データを正しく判定できないという問題があった。
本発明は、上記問題を解決し、パターン認識の識別関数を最適化することを目的とする。
本発明のパターン認識学習装置は、パターン認識を学習するためのパターン認識学習装置であって、パターン認識の学習データから各学習データのカテゴリを識別する識別関数を決定する決定手段と、前記カテゴリにおける学習データの分散特性を考慮して前記識別関数を最適化する最適化手段と、を含み、前記最適化手段は、前記識別関数が与えるカテゴリの識別境界から該カテゴリに属する学習データまでの距離の分散を考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする。
本発明のパターン認識学習方法は、パターン認識の識別関数を決定する決定手段と、前記識別関数を最適化する最適化手段とを有するパターン認識学習装置におけるパターン認識を学習するパターン認識学習方法であって、前記決定手段において、パターン認識の学習データから各学習データのカテゴリを識別する前記識別関数を決定する決定ステップと、前記最適化手段において、前記カテゴリにおける学習データの分散特性を考慮して前記識別関数を最適化する最適化ステップと、を含み、前記最適化ステップでは、前記識別関数が与えるカテゴリの識別境界から該カテゴリに属する学習データまでの距離の分散を考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする。
本発明のプログラムは、コンピュータを、パターン認識を学習するためのパターン認識学習装置として機能させるためのプログラムであって、前記コンピュータを、パターン認識の学習データから各学習データのカテゴリを識別する識別関数を決定する決定手段、及び前記カテゴリにおける学習データの分散特性を考慮して前記識別関数を最適化する最適化手段、として機能させ、前記最適化手段により、前記識別関数が与えるカテゴリの識別境界から該カテゴリに属する学習データまでの距離の分散を考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする
本発明により、パターン認識の識別関数を最適化することができる。
パターン認識における識別線の説明図である。 パターン認識において起こり得る誤認識の説明図である。 パターン認識装置の構成例を示すブロック図である。 記憶部の構成例を示すブロック図である。 パターン認識の学習方法のフローチャートである。 学習完了直後(最適化前)の識別高次平面の配置を示す。 識別能力評価関数のグラフである。 カテゴリ間の中央付近に識別高次平面が存在する場合を示す(最適化前)。 カテゴリの重心間の距離についての説明図である。 最適化後の識別高次平面の配置を示す。
以下、本発明の実施の形態について図面を参照して説明する。
図3は本発明の実施の形態におけるパターン認識装置の構成を示すブロック図である。パターン認識装置100は、データ入力部110とデータ処理部120とデータ出力部130と記憶部140とを備える。
データ入力部110は、認識対象のデータ、学習データ、及び必要に応じて各種パラメータを受け取り、必要に応じて記憶部140に記憶する。データ処理部120はパターン認識学習部122とパターン認識部124とを備える。パターン認識学習部122は、学習段階において、学習データから識別関数を取得すると共に、識別関数の最適化を行う。パターン認識部124は、データ入力部110で受けた認識対象データについて、記憶部140に記憶された識別関数に関する情報を用いてパターン認識を行い、認識結果をデータ出力部130に送る。データ出力部130は、認識結果を表示器(図示せず)等に送る。
図3では、データ処理部120がパターン認識部124を含んでいるが、パターン認識部124を含まない構成、あるいはパターン認識部124の機能をパターン認識学習部122に含める構成とすることもできる。この場合には、パターン認識装置100は、学習によりパターン認識用の識別関数を取得する機能を有するパターン認識学習装置となる。
図4に示すように、記憶部140は、結合係数記憶部142、閾値記憶部144、学習データ記憶部146、カテゴリ重心記憶部148、パーセプトロン出力データ記憶部150、正解信号記憶部152などを必要に応じて備え、識別関数の取得や最適化において使用する。また、記憶部140は最適化された識別関数(又は識別高次平面)を記憶するための識別関数記憶部(図示せず)を備える構成とし、パターン認識部124がパターン認識を実行する際に使用するようにしてもよい。
本発明の実施の形態におけるパターン認識器は、例えば、顔画像を認識するために、画像データが学習データとして記憶されているパーソナルコンピュータ上などに構築することが可能である。この場合、データ処理部120はCPU、RAM、ROMなどから構成でき、記憶部140はRAM、ROMなどから構成できる。
(原理及び動作の説明)
C個の学習データ群(カテゴリ)に属する複数の学習データをカテゴリ毎に分離する課題を例として、図5のフローチャートを参照して、本発明の原理及び動作を説明する。ここでは、C個のカテゴリに分類されるN個のデータを学習データI(n=1,…,N)で表す。
カテゴリcを分離する識別高次平面の式を式(1)に示す。式(1)中、w(c)はパーセプトロンの結合係数、θ(c)は閾値、u(c)は出力を表す。
例として、図6は、2次元平面上の3個のカテゴリについてパーセプトロンで学習処理を行い、カテゴリkを線形分離した状態を示す(図5のステップS10)。パーセプトロンは、識別能力を考慮せずカテゴリの分離のみを行うため、学習完了直後は、図6に示されるように識別高次平面が学習データの近傍に配置されてしまい、未知データを誤認識しやすくなる。
学習データの近傍に存在している識別高次平面を学習データから遠ざけて識別能力を向上させるために、パーセプトロンで線形分離した識別高次平面を、カルバック・ライブラー・ダイバージェンスを用いて再配置する。
具体的には、識別能力評価関数Eとして、式(2)を定義し、Eを最大化することによって、識別高次平面を各学習データから遠ざけることが出来る。
式(2)中、r (c)は下記式(3)のシグモイド関数値、u (c)は下記式(4)で算出されるパーセプトロンの出力である。t (c)は正解信号を表し、学習データIがカテゴリcに属する場合は“1”、カテゴリc以外に属する場合は“0”となる。
識別能力評価関数E(式(2))のΣ中の項をグラフに表すと、図7に示すようなグラフになる。このグラフは、出力と正解信号との絶対誤差と共に単調減少する関数であることがわかる。
上記識別能力評価関数を表す式(2)に対して、最大傾斜法を用いて、結合係数w(c)及び閾値θ(c)を逐次計算し、識別能力評価関数Eの値を最大化する。実際の計算では、式(5)及び(6)を用いて、逐次結合係数と閾値を変化させて、識別能力評価関数値を最大化する。ここで、εは1回で更新する割合を決めるパラメータであり、状況に応じて調節する。
ここで、上記の識別能力評価関数の式(2)を最大化するように識別高次平面を移動すると、図8に示すように各カテゴリ間の中央付近に識別高次平面が存在してしまうという問題が発生する。図8を見てみると、カテゴリkは、識別高次平面に対して垂直方向に分散が大きく、カテゴリk’は、識別高次平面に対して平行方向に分散が大きくなっている。この様な場合、カテゴリkに属する未知のデータは、識別高次平面に対して垂直方向へ散らばったデータになり、逆にカテゴリk’に属する未知のデータは、識別高次平面に対して水平方向に散らばったデータになると考えられる。したがって、このようなカテゴリ間の中央に、識別高次平面を配置することは、識別能力の点から最適ではない。そこで、本実施形態では、カテゴリkを分離する識別高次平面から最も近いカテゴリk’に着目し、カテゴリkとカテゴリk’の分散値に応じて、識別能力評価関数E(式(2))を変形し、識別高次平面を最適な位置に移動する方法を採る。
まず、各カテゴリの重心g(c)を式(7)で計算し、次に図9に示すように、識別高次平面によって分離されているカテゴリkの重心g(k)からカテゴリk以外のカテゴリの重心g(c)までの距離l (k)を式(8)で算出する。式(7)で、M(c)は、カテゴリcに属する学習データの個数を示す。この距離l (k)のうち、最小の値を持つカテゴリをカテゴリk’とする(図5のステップS20)。
次に、カテゴリkとk’に属する全学習データについて、カテゴリkを分離する識別高次平面からの距離p (k),p (k’)を式(10)及び(11)により算出する。ここで、<・>は、内積を表す。
求めた距離p (k),p (k’)から標本分散s(k)2,s(k’)2を式(12)及び(13)により算出する(図5のステップS30)。ここで、μ(k),μ(k’)は、それぞれカテゴリk,k’に属する学習データの識別高次平面からの距離の平均を示す。
上記の標本分散を用いて、識別能力評価関数の式(2)を、式(14)のような式に変更することによって、分散を考慮した識別能力評価関数(「分散考慮型カルバック・ライブラ・ダイバージェンス」ともいう)になる。
式(14)の識別能力評価関数を式(5)及び式(6)で最大化することによって、分散を考慮した最適な位置に識別高次平面を移動させることが出来る(図5のステップS40)。この例では、図10に示すように若干カテゴリk’に近い位置に識別高次平面が配置される。
以上述べたように、本発明の実施形態では、一つのデータ群(カテゴリ)を複数のデータ群から分離する識別境界(識別線や識別高次平面)を決定する方式のパターン認識装置において、識別境界によるデータ群の分離後、識別境界をデータ群から遠ざけるような処理(識別能力向上処理)を行い、その際、各データ群に属するデータの分散度合いを考慮して、識別境界を各データ群に最適な位置に配置することによって、より高い識別能力を得ることができる。
具体的には、ニューラルネットのパーセプトロンを用いたパターン認識学習装置において、識別線を高次元化した識別高次平面による高次元データ群分離後、各学習データの分散を考慮したカルバック・ライブラー・ダイバージェンス(式(14))に対して最大傾斜法を用いて、識別高次平面を学習データ群から遠ざけることにより、高い識別能力を得ることができる。
(発明の他の実施形態)
上記実施形態では、識別高次平面に最も近いカテゴリを1つ選択したが、識別高次平面に近いカテゴリを複数選択することによって、更に識別能力の高い位置へ識別高次平面を設定することが可能となる。例えば、特定のカテゴリに近いもの順に所定個数の複数のカテゴリを選択してもよい。識別能力評価関数は、特定のカテゴリの識別境界から、そのカテゴリに属する学習データまでの距離の分散と、選択した複数のカテゴリに属する学習データまでの距離の分散とを考慮したものに変更し得る。
また、上記実施形態では、識別能力評価関数としてカルバック・ライブラー・ダイバージェンスを用いたが、識別高次平面から学習データへのユークリッド距離の総和の逆数を識別能力評価関数として用いることも可能である。
また、上記実施形態では、顔認証を例に説明したが、画像データから2次元バーコードを解析する際に、初期処理段階で上記実施形態の手法を用いて、コード種類を大分類することによって、その後の処理を簡略化でき、バーコード解析処理を高速化することが可能となる。
また、上記実施形態では、顔認証を例に説明したが、上記実施形態の手法によって、文字認識用のパーセプトロンの識別能力を向上させておくことによって、画像データから抽出された、汚れや書き損じがある文字を認識する装置を構築することが可能となる。
顔認証以外の上記適用例においても、パーセプトロンを用いて識別高次平面を決定した後、分散を考慮したカルバック・ライブラー・ダイバージェンスを用い、カテゴリ内の学習データの分散が異なっているデータ群に対し、識別高次平面を最適な位置に再設定することによって、識別能力を向上することが可能となる。
なお、上記のパターン認識学習装置及びパターン認識装置の全部又は一部は、ハードウェア、ソフトウェア又はこれらの組合せにより実現することができる。また、上記のパターン認識学習方法及びパターン認識方法も、ハードウェア、ソフトウェア又はこれらに組合せにより実現することができる。ここで、ソフトウェアによって実現されるとは、コンピュータがプログラムを読み込んで実行することにより実現されることを意味する。
プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えば、フレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば、光磁気ディスク)、CD−ROM(Read Only Memory)、CD−R、CD−R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(random access memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
パターン認識を学習するためのパターン認識学習装置であって、
パターン認識の学習データから各学習データのカテゴリを識別する識別関数を決定する決定手段と、
前記カテゴリにおける学習データの分散特性を考慮して前記識別関数を最適化する最適化手段と、
を含むことを特徴とするパターン認識学習装置。
(付記2)
前記最適化手段は、前記識別関数が与えるカテゴリの識別境界から該カテゴリに属する学習データまでの距離の分散を考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記1に記載のパターン認識学習装置。
(付記3)
前記識別能力評価関数として前記分散を考慮したカルバック・ライブラー・ダイバージェンスを用いることを特徴とする付記2に記載のパターン認識学習装置。
(付記4)
前記識別能力評価関数として前記カテゴリの識別境界から該カテゴリに属する学習データまでのユークリッド距離の総和の逆数を用いることを特徴とする付記2に記載のパターン認識学習装置。
(付記5)
前記最適化手段は、前記カテゴリのうち特定のカテゴリに最も近い別カテゴリを決定し、前記特定のカテゴリの識別境界から前記特定のカテゴリに属する学習データまでの距離の分散と、前記識別境界から前記別カテゴリに属する学習データまでの距離の分散とを考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記2〜4のいずれか1に記載のパターン認識学習装置。
(付記6)
前記最適化手段は、前記カテゴリのうち特定のカテゴリに近いもの順に所定個数の複数の別カテゴリを決定し、前記特定のカテゴリの識別境界から前記特定のカテゴリに属する学習データまでの距離の分散と、前記識別境界から前記複数の別カテゴリに属する学習データまでの距離の分散とを考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記2〜4のいずれか1に記載のパターン認識学習装置。
(付記7)
前記最適化手段は、前記特定のカテゴリの重心と前記特定のカテゴリ以外のカテゴリの重心との距離に基づいてカテゴリ間の近さを判定することを特徴とする付記5又は6に記載のパターン認識学習装置。
(付記8)
前記最適化手段は、最大傾斜法に基づいて前記識別能力評価関数の値が最大化するように前記識別境界を移動させることを特徴とする付記2〜7のいずれか1に記載のパターン認識学習装置。
(付記9)
前記決定手段は、パーセプトロンを用いて前記識別関数を決定することを特徴とする付記1〜8のいずれか1に記載のパターン認識学習装置。
(付記10)
付記1〜9のいずれか1に記載のパターン認識学習装置と、
前記最適化手段により最適化された識別関数を用いて入力データのパターン認識を行うパターン認識手段と、
を含むことを特徴とするパターン認識装置。
(付記11)
パターン認識を学習するパターン認識学習方法であって、
パターン認識の学習データから各学習データのカテゴリを識別する識別関数を決定する決定ステップと、
前記カテゴリにおける学習データの分散特性を考慮して前記識別関数を最適化する最適化ステップと、
を含むことを特徴とするパターン認識学習方法。
(付記12)
前記最適化ステップでは、前記識別関数が与えるカテゴリの識別境界から該カテゴリに属する学習データまでの距離の分散を考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記11に記載のパターン認識学習方法。
(付記13)
前記識別能力評価関数として前記分散を考慮したカルバック・ライブラー・ダイバージェンスを用いることを特徴とする付記12に記載のパターン認識学習方法。
(付記14)
前記識別能力評価関数として前記カテゴリの識別境界から該カテゴリに属する学習データまでのユークリッド距離の総和の逆数を用いることを特徴とする付記12に記載のパターン認識学習方法。
(付記15)
前記最適化ステップでは、前記カテゴリのうち特定のカテゴリに最も近い別カテゴリを決定し、前記特定のカテゴリの識別境界から前記特定のカテゴリに属する学習データまでの距離の分散と、前記識別境界から前記別カテゴリに属する学習データまでの距離の分散とを考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記12〜14のいずれか1に記載のパターン認識学習方法。
(付記16)
前記最適化ステップは、前記カテゴリのうち特定のカテゴリに近いもの順に所定個数の複数の別カテゴリを決定し、前記特定のカテゴリの識別境界から前記特定のカテゴリに属する学習データまでの距離の分散と、前記識別境界から前記複数の別カテゴリに属する学習データまでの距離の分散とを考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記12〜14のいずれか1に記載のパターン認識学習方法。
(付記17)
前記最適化ステップでは、前記特定のカテゴリの重心と前記特定のカテゴリ以外のカテゴリの重心との距離に基づいてカテゴリ間の近さを判定することを特徴とする付記15又は16に記載のパターン認識学習方法。
(付記18)
前記最適化ステップでは、最大傾斜法に基づいて前記識別能力評価関数の値が最大化するように前記識別境界を移動させることを特徴とする付記12〜17のいずれか1に記載のパターン認識学習方法。
(付記19)
前記決定ステップでは、パーセプトロンを用いて前記識別関数を決定することを特徴とする付記11〜18のいずれか1に記載のパターン認識学習方法。
(付記20)
付記11〜19のいずれか1に記載のパターン認識学習方法に加え、
前記最適化ステップにより最適化された識別関数を用いて入力データのパターン認識を行うパターン認識ステップ、
を含むことを特徴とするパターン認識方法。
(付記21)
コンピュータを、パターン認識を学習するためのパターン認識学習装置として機能させるためのプログラムであって、
前記コンピュータを、
パターン認識の学習データから各学習データのカテゴリを識別する識別関数を決定する決定手段、及び
前記カテゴリにおける学習データの分散特性を考慮して前記識別関数を最適化する最適化手段、
として機能させるためのプログラム。
(付記22)
前記最適化手段は、前記識別関数が与えるカテゴリの識別境界から該カテゴリに属する学習データまでの距離の分散を考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記21に記載のプログラム。
(付記23)
前記識別能力評価関数として前記分散を考慮したカルバック・ライブラー・ダイバージェンスを用いることを特徴とする付記22に記載のプログラム。
(付記24)
前記識別能力評価関数として前記カテゴリの識別境界から該カテゴリに属する学習データまでのユークリッド距離の総和の逆数を用いることを特徴とする付記22に記載のプログラム。
(付記25)
前記最適化手段は、前記カテゴリのうち特定のカテゴリに最も近い別カテゴリを決定し、前記特定のカテゴリの識別境界から前記特定のカテゴリに属する学習データまでの距離の分散と、前記識別境界から前記別カテゴリに属する学習データまでの距離の分散とを考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記22〜24のいずれか1に記載のプログラム。
(付記26)
前記最適化手段は、前記カテゴリのうち特定のカテゴリに近いもの順に所定個数の複数の別カテゴリを決定し、前記特定のカテゴリの識別境界から前記特定のカテゴリに属する学習データまでの距離の分散と、前記識別境界から前記複数の別カテゴリに属する学習データまでの距離の分散とを考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記22〜24のいずれか1に記載のプログラム。
(付記27)
前記最適化手段は、前記特定のカテゴリの重心と前記特定のカテゴリ以外のカテゴリの重心との距離に基づいてカテゴリ間の近さを判定することを特徴とする付記25又は26に記載のプログラム。
(付記28)
前記最適化手段は、最大傾斜法に基づいて前記識別能力評価関数の値が最大化するように前記識別境界を移動させることを特徴とする付記22〜27のいずれか1に記載のプログラム。
(付記29)
前記決定手段は、パーセプトロンを用いて前記識別関数を決定することを特徴とする付記21〜28のいずれか1に記載のプログラム。
(付記30)
付記21〜29のいずれか1に記載のプログラムにおいて、
前記コンピュータを、更に、
前記最適化手段により最適化された識別関数を用いて入力データのパターン認識を行うパターン認識手段として機能させることを特徴とするプログラム。
本発明は画像認識、音声認識、文字認識などのパターン認識に利用できる。
100 パターン認識装置
110 データ入力部
120 データ処理部
122 パターン認識学習部
124 パターン認識部
130 データ出力部
140 記憶部

Claims (9)

  1. パターン認識を学習するためのパターン認識学習装置であって、
    パターン認識の学習データから各学習データのカテゴリを識別する識別関数を決定する決定手段と、
    前記カテゴリにおける学習データの分散特性を考慮して前記識別関数を最適化する最適化手段と、
    を含み、
    前記最適化手段は、前記識別関数が与えるカテゴリの識別境界から該カテゴリに属する学習データまでの距離の分散を考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とするパターン認識学習装置。
  2. 前記識別能力評価関数として前記分散を考慮したカルバック・ライブラー・ダイバージェンスを用いることを特徴とする請求項に記載のパターン認識学習装置。
  3. 前記識別能力評価関数として前記カテゴリの識別境界から該カテゴリに属する学習データまでのユークリッド距離の総和の逆数を用いることを特徴とする請求項に記載のパターン認識学習装置。
  4. 前記最適化手段は、前記カテゴリのうち特定のカテゴリに最も近い別カテゴリを決定し、前記特定のカテゴリの識別境界から前記特定のカテゴリに属する学習データまでの距離の分散と、前記識別境界から前記別カテゴリに属する学習データまでの距離の分散とを考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする請求項のいずれか1項に記載のパターン認識学習装置。
  5. 前記最適化手段は、前記カテゴリのうち特定のカテゴリに近いもの順に所定個数の複数の別カテゴリを決定し、前記特定のカテゴリの識別境界から前記特定のカテゴリに属する学習データまでの距離の分散と、前記識別境界から前記複数の別カテゴリに属する学習データまでの距離の分散とを考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする請求項のいずれか1項に記載のパターン認識学習装置。
  6. 前記最適化手段は、前記特定のカテゴリの重心と前記特定のカテゴリ以外のカテゴリの重心との距離に基づいてカテゴリ間の近さを判定することを特徴とする請求項又はに記載のパターン認識学習装置。
  7. 請求項1〜のいずれか1項に記載のパターン認識学習装置と、
    前記最適化手段により最適化された識別関数を用いて入力データのパターン認識を行うパターン認識手段と、
    を含むことを特徴とするパターン認識装置。
  8. パターン認識の識別関数を決定する決定手段と、前記識別関数を最適化する最適化手段とを有するパターン認識学習装置におけるパターン認識を学習するパターン認識学習方法であって、
    前記決定手段において、パターン認識の学習データから各学習データのカテゴリを識別する前記識別関数を決定する決定ステップと、
    前記最適化手段において、前記カテゴリにおける学習データの分散特性を考慮して前記識別関数を最適化する最適化ステップと、
    を含み、
    前記最適化ステップでは、前記識別関数が与えるカテゴリの識別境界から該カテゴリに属する学習データまでの距離の分散を考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とするパターン認識学習方法。
  9. コンピュータを、パターン認識を学習するためのパターン認識学習装置として機能させるためのプログラムであって、
    前記コンピュータを、
    パターン認識の学習データから各学習データのカテゴリを識別する識別関数を決定する決定手段、及び
    前記カテゴリにおける学習データの分散特性を考慮して前記識別関数を最適化する最適化手段、
    として機能させ
    前記最適化手段により、前記識別関数が与えるカテゴリの識別境界から該カテゴリに属する学習データまでの距離の分散を考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とするプログラム。
JP2013143460A 2013-07-09 2013-07-09 パターン認識及びその学習方法 Active JP5725576B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013143460A JP5725576B2 (ja) 2013-07-09 2013-07-09 パターン認識及びその学習方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013143460A JP5725576B2 (ja) 2013-07-09 2013-07-09 パターン認識及びその学習方法

Publications (2)

Publication Number Publication Date
JP2015018312A JP2015018312A (ja) 2015-01-29
JP5725576B2 true JP5725576B2 (ja) 2015-05-27

Family

ID=52439268

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013143460A Active JP5725576B2 (ja) 2013-07-09 2013-07-09 パターン認識及びその学習方法

Country Status (1)

Country Link
JP (1) JP5725576B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7198432B2 (ja) * 2019-01-30 2023-01-04 京セラドキュメントソリューションズ株式会社 画像処理装置、画像読取装置、画像形成装置、画像処理方法及び画像処理プログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005198970A (ja) * 2004-01-19 2005-07-28 Konica Minolta Medical & Graphic Inc 医用画像処理装置

Also Published As

Publication number Publication date
JP2015018312A (ja) 2015-01-29

Similar Documents

Publication Publication Date Title
CN110362677B (zh) 文本数据类别的识别方法及装置、存储介质、计算机设备
US9002101B2 (en) Recognition device, recognition method, and computer program product
JP6760318B2 (ja) 顔画像識別システム、識別器生成装置、識別装置、画像識別システム、及び識別システム
US9600745B2 (en) Image recognition system, image recognition method, and non-transitory computer readable medium storing image recognition program
US11935298B2 (en) System and method for predicting formation in sports
JP5214760B2 (ja) 学習装置、方法及びプログラム
US11126827B2 (en) Method and system for image identification
US11449706B2 (en) Information processing method and information processing system
JP6003492B2 (ja) 文字認識装置及びプログラム
KR20160011916A (ko) 얼굴 인식을 통한 사용자 식별 방법 및 장치
JPWO2008059624A1 (ja) 2クラス分類予測モデルの作成方法、分類予測モデル作成のためのプログラムおよび2クラス分類予測モデルの作成装置
JP2018026122A (ja) 情報処理装置、情報処理方法及びプログラム
JP6128910B2 (ja) 学習装置、学習方法及びプログラム
KR20170108339A (ko) 영상에서 다수의 객체를 인식하는 방법
US10943099B2 (en) Method and system for classifying an input data set using multiple data representation source modes
JPWO2015146113A1 (ja) 識別辞書学習システム、識別辞書学習方法および識別辞書学習プログラム
JP2015225410A (ja) 認識装置、方法及びプログラム
WO2021111622A1 (ja) パラメータ決定装置、パラメータ決定方法、及び、非一時的なコンピュータ可読媒体
US8755594B2 (en) Information processing device and method, and program
KR101521136B1 (ko) 얼굴 인식 방법 및 얼굴 인식 장치
US10007842B2 (en) Same person determination device and method, and control program therefor
JP5725576B2 (ja) パターン認識及びその学習方法
CN113762005B (zh) 特征选择模型的训练、对象分类方法、装置、设备及介质
CN113947209A (zh) 基于云边协同的集成学习方法、系统及存储介质
JP2017084006A (ja) 画像処理装置およびその方法

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141023

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150303

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150326

R150 Certificate of patent or registration of utility model

Ref document number: 5725576

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150