JP5725576B2 - パターン認識及びその学習方法 - Google Patents
パターン認識及びその学習方法 Download PDFInfo
- Publication number
- JP5725576B2 JP5725576B2 JP2013143460A JP2013143460A JP5725576B2 JP 5725576 B2 JP5725576 B2 JP 5725576B2 JP 2013143460 A JP2013143460 A JP 2013143460A JP 2013143460 A JP2013143460 A JP 2013143460A JP 5725576 B2 JP5725576 B2 JP 5725576B2
- Authority
- JP
- Japan
- Prior art keywords
- category
- pattern recognition
- learning
- identification
- function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Image Analysis (AREA)
Description
本発明はパターン認識の学習装置、学習方法及び学習プログラム、並びに学習機能を備えたパターン認識装置に関する。
パターン認識では、ニューラルネットのパーセプトロンなどを用いて音声、文字、画像などのデータから特定のパターンを認識する。パターン認識では、認識対象のデータを特定の種類のパターンに対応付ける識別関数が用いられる。識別関数はパターンの種類毎に識別境界によってデータ空間を分割し、分割された領域に属するデータが当該種類のパターンに対応する。例えば、対象データが2次元データの場合には、識別関数が与える識別境界は識別線になり、3次元データの場合には識別面になり、一般にn次元データの場合には識別n次平面(「識別高次平面」ともいう)になる。
例えば、2次元データの場合、パターン認識装置は、識別関数が与える識別線によって、複数の点からなる一つのデータ群(「カテゴリ」ともいう)を他のデータ群から分離し、2次元データ面上にそのデータ群の領域を作る。そして、新たに未知のデータが入力されると、そのデータが分離された領域内に存在するかどうか確認し、領域内に存在する場合、未知のデータは事前に分離したデータ群と同じ種類であると識別される。もし、領域外である場合は、別の種類であると識別される。
図1は、データ群Aをデータ群Bとデータ群Cから分離する識別線を表しており、図中の未知データは、識別線よりデータ群A側の領域に存在するため、データ群Aのデータであると識別される。
関連技術では、パーセプトロンの学習完了時、識別関数が与える識別高次平面は、学習データ(「学習パターン」ということがある)の近傍に配置されることが多く、すなわち、未知のデータを入力した際に間違えやすい位置に配置され、必ずしも識別能力の高い位置に配置されなかった。そのため、カルバック・ライブラー・ダイバージェンスや距離関数等を用いて、学習完了後の識別高次平面を学習データから遠ざけるような識別能力向上法が用いられてきた。例えば、特許文献1には、クロスエントロピー誤差を最小化するようにパターン認識システムのトレーニング可能パラメータを更新することが開示されている。
しかし、その際、各学習データ群の中間位置に識別高次平面を配置しようとするため、大きく分散の異なるデータ群を分離する識別高次平面の場合、最適な位置に配置されない場合があった。例えば、図2に示されるように、識別高次平面に対して、垂直方向に分散が大きい学習データ群(カテゴリk)と、垂直方向に分散が小さい学習データ群(カテゴリk’)の中央に識別高次平面を配置した場合、カテゴリkの未知データは、識別高次平面に対して垂直方向に散らばったデータ(すなわち、図2において点線で表される領域に存在するデータ)となることが予想されるため、カテゴリk’と誤認識される可能性があった。
関連技術の方法では、カテゴリ内の学習データの分散を考慮せずに、識別高次平面を設定していたため、最適な位置に識別高次平面が設定されず、未知データを正しく判定できないという問題があった。
本発明は、上記問題を解決し、パターン認識の識別関数を最適化することを目的とする。
本発明のパターン認識学習装置は、パターン認識を学習するためのパターン認識学習装置であって、パターン認識の学習データから各学習データのカテゴリを識別する識別関数を決定する決定手段と、前記カテゴリにおける学習データの分散特性を考慮して前記識別関数を最適化する最適化手段と、を含み、前記最適化手段は、前記識別関数が与えるカテゴリの識別境界から該カテゴリに属する学習データまでの距離の分散を考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする。
本発明のパターン認識学習方法は、パターン認識の識別関数を決定する決定手段と、前記識別関数を最適化する最適化手段とを有するパターン認識学習装置におけるパターン認識を学習するパターン認識学習方法であって、前記決定手段において、パターン認識の学習データから各学習データのカテゴリを識別する前記識別関数を決定する決定ステップと、前記最適化手段において、前記カテゴリにおける学習データの分散特性を考慮して前記識別関数を最適化する最適化ステップと、を含み、前記最適化ステップでは、前記識別関数が与えるカテゴリの識別境界から該カテゴリに属する学習データまでの距離の分散を考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする。
本発明のプログラムは、コンピュータを、パターン認識を学習するためのパターン認識学習装置として機能させるためのプログラムであって、前記コンピュータを、パターン認識の学習データから各学習データのカテゴリを識別する識別関数を決定する決定手段、及び前記カテゴリにおける学習データの分散特性を考慮して前記識別関数を最適化する最適化手段、として機能させ、前記最適化手段により、前記識別関数が与えるカテゴリの識別境界から該カテゴリに属する学習データまでの距離の分散を考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする。
本発明により、パターン認識の識別関数を最適化することができる。
以下、本発明の実施の形態について図面を参照して説明する。
図3は本発明の実施の形態におけるパターン認識装置の構成を示すブロック図である。パターン認識装置100は、データ入力部110とデータ処理部120とデータ出力部130と記憶部140とを備える。
データ入力部110は、認識対象のデータ、学習データ、及び必要に応じて各種パラメータを受け取り、必要に応じて記憶部140に記憶する。データ処理部120はパターン認識学習部122とパターン認識部124とを備える。パターン認識学習部122は、学習段階において、学習データから識別関数を取得すると共に、識別関数の最適化を行う。パターン認識部124は、データ入力部110で受けた認識対象データについて、記憶部140に記憶された識別関数に関する情報を用いてパターン認識を行い、認識結果をデータ出力部130に送る。データ出力部130は、認識結果を表示器(図示せず)等に送る。
図3では、データ処理部120がパターン認識部124を含んでいるが、パターン認識部124を含まない構成、あるいはパターン認識部124の機能をパターン認識学習部122に含める構成とすることもできる。この場合には、パターン認識装置100は、学習によりパターン認識用の識別関数を取得する機能を有するパターン認識学習装置となる。
図4に示すように、記憶部140は、結合係数記憶部142、閾値記憶部144、学習データ記憶部146、カテゴリ重心記憶部148、パーセプトロン出力データ記憶部150、正解信号記憶部152などを必要に応じて備え、識別関数の取得や最適化において使用する。また、記憶部140は最適化された識別関数(又は識別高次平面)を記憶するための識別関数記憶部(図示せず)を備える構成とし、パターン認識部124がパターン認識を実行する際に使用するようにしてもよい。
本発明の実施の形態におけるパターン認識器は、例えば、顔画像を認識するために、画像データが学習データとして記憶されているパーソナルコンピュータ上などに構築することが可能である。この場合、データ処理部120はCPU、RAM、ROMなどから構成でき、記憶部140はRAM、ROMなどから構成できる。
(原理及び動作の説明)
C個の学習データ群(カテゴリ)に属する複数の学習データをカテゴリ毎に分離する課題を例として、図5のフローチャートを参照して、本発明の原理及び動作を説明する。ここでは、C個のカテゴリに分類されるN個のデータを学習データIn(n=1,…,N)で表す。
C個の学習データ群(カテゴリ)に属する複数の学習データをカテゴリ毎に分離する課題を例として、図5のフローチャートを参照して、本発明の原理及び動作を説明する。ここでは、C個のカテゴリに分類されるN個のデータを学習データIn(n=1,…,N)で表す。
カテゴリcを分離する識別高次平面の式を式(1)に示す。式(1)中、w(c)はパーセプトロンの結合係数、θ(c)は閾値、u(c)は出力を表す。
例として、図6は、2次元平面上の3個のカテゴリについてパーセプトロンで学習処理を行い、カテゴリkを線形分離した状態を示す(図5のステップS10)。パーセプトロンは、識別能力を考慮せずカテゴリの分離のみを行うため、学習完了直後は、図6に示されるように識別高次平面が学習データの近傍に配置されてしまい、未知データを誤認識しやすくなる。
学習データの近傍に存在している識別高次平面を学習データから遠ざけて識別能力を向上させるために、パーセプトロンで線形分離した識別高次平面を、カルバック・ライブラー・ダイバージェンスを用いて再配置する。
具体的には、識別能力評価関数Eとして、式(2)を定義し、Eを最大化することによって、識別高次平面を各学習データから遠ざけることが出来る。
式(2)中、rn (c)は下記式(3)のシグモイド関数値、un (c)は下記式(4)で算出されるパーセプトロンの出力である。tn (c)は正解信号を表し、学習データInがカテゴリcに属する場合は“1”、カテゴリc以外に属する場合は“0”となる。
識別能力評価関数E(式(2))のΣ中の項をグラフに表すと、図7に示すようなグラフになる。このグラフは、出力と正解信号との絶対誤差と共に単調減少する関数であることがわかる。
上記識別能力評価関数を表す式(2)に対して、最大傾斜法を用いて、結合係数w(c)及び閾値θ(c)を逐次計算し、識別能力評価関数Eの値を最大化する。実際の計算では、式(5)及び(6)を用いて、逐次結合係数と閾値を変化させて、識別能力評価関数値を最大化する。ここで、εは1回で更新する割合を決めるパラメータであり、状況に応じて調節する。
ここで、上記の識別能力評価関数の式(2)を最大化するように識別高次平面を移動すると、図8に示すように各カテゴリ間の中央付近に識別高次平面が存在してしまうという問題が発生する。図8を見てみると、カテゴリkは、識別高次平面に対して垂直方向に分散が大きく、カテゴリk’は、識別高次平面に対して平行方向に分散が大きくなっている。この様な場合、カテゴリkに属する未知のデータは、識別高次平面に対して垂直方向へ散らばったデータになり、逆にカテゴリk’に属する未知のデータは、識別高次平面に対して水平方向に散らばったデータになると考えられる。したがって、このようなカテゴリ間の中央に、識別高次平面を配置することは、識別能力の点から最適ではない。そこで、本実施形態では、カテゴリkを分離する識別高次平面から最も近いカテゴリk’に着目し、カテゴリkとカテゴリk’の分散値に応じて、識別能力評価関数E(式(2))を変形し、識別高次平面を最適な位置に移動する方法を採る。
まず、各カテゴリの重心g(c)を式(7)で計算し、次に図9に示すように、識別高次平面によって分離されているカテゴリkの重心g(k)からカテゴリk以外のカテゴリの重心g(c)までの距離lc (k)を式(8)で算出する。式(7)で、M(c)は、カテゴリcに属する学習データの個数を示す。この距離lc (k)のうち、最小の値を持つカテゴリをカテゴリk’とする(図5のステップS20)。
次に、カテゴリkとk’に属する全学習データについて、カテゴリkを分離する識別高次平面からの距離pm (k),pm (k’)を式(10)及び(11)により算出する。ここで、<・>は、内積を表す。
求めた距離pm (k),pm (k’)から標本分散s(k)2,s(k’)2を式(12)及び(13)により算出する(図5のステップS30)。ここで、μ(k),μ(k’)は、それぞれカテゴリk,k’に属する学習データの識別高次平面からの距離の平均を示す。
上記の標本分散を用いて、識別能力評価関数の式(2)を、式(14)のような式に変更することによって、分散を考慮した識別能力評価関数(「分散考慮型カルバック・ライブラ・ダイバージェンス」ともいう)になる。
式(14)の識別能力評価関数を式(5)及び式(6)で最大化することによって、分散を考慮した最適な位置に識別高次平面を移動させることが出来る(図5のステップS40)。この例では、図10に示すように若干カテゴリk’に近い位置に識別高次平面が配置される。
以上述べたように、本発明の実施形態では、一つのデータ群(カテゴリ)を複数のデータ群から分離する識別境界(識別線や識別高次平面)を決定する方式のパターン認識装置において、識別境界によるデータ群の分離後、識別境界をデータ群から遠ざけるような処理(識別能力向上処理)を行い、その際、各データ群に属するデータの分散度合いを考慮して、識別境界を各データ群に最適な位置に配置することによって、より高い識別能力を得ることができる。
具体的には、ニューラルネットのパーセプトロンを用いたパターン認識学習装置において、識別線を高次元化した識別高次平面による高次元データ群分離後、各学習データの分散を考慮したカルバック・ライブラー・ダイバージェンス(式(14))に対して最大傾斜法を用いて、識別高次平面を学習データ群から遠ざけることにより、高い識別能力を得ることができる。
(発明の他の実施形態)
上記実施形態では、識別高次平面に最も近いカテゴリを1つ選択したが、識別高次平面に近いカテゴリを複数選択することによって、更に識別能力の高い位置へ識別高次平面を設定することが可能となる。例えば、特定のカテゴリに近いもの順に所定個数の複数のカテゴリを選択してもよい。識別能力評価関数は、特定のカテゴリの識別境界から、そのカテゴリに属する学習データまでの距離の分散と、選択した複数のカテゴリに属する学習データまでの距離の分散とを考慮したものに変更し得る。
上記実施形態では、識別高次平面に最も近いカテゴリを1つ選択したが、識別高次平面に近いカテゴリを複数選択することによって、更に識別能力の高い位置へ識別高次平面を設定することが可能となる。例えば、特定のカテゴリに近いもの順に所定個数の複数のカテゴリを選択してもよい。識別能力評価関数は、特定のカテゴリの識別境界から、そのカテゴリに属する学習データまでの距離の分散と、選択した複数のカテゴリに属する学習データまでの距離の分散とを考慮したものに変更し得る。
また、上記実施形態では、識別能力評価関数としてカルバック・ライブラー・ダイバージェンスを用いたが、識別高次平面から学習データへのユークリッド距離の総和の逆数を識別能力評価関数として用いることも可能である。
また、上記実施形態では、顔認証を例に説明したが、画像データから2次元バーコードを解析する際に、初期処理段階で上記実施形態の手法を用いて、コード種類を大分類することによって、その後の処理を簡略化でき、バーコード解析処理を高速化することが可能となる。
また、上記実施形態では、顔認証を例に説明したが、上記実施形態の手法によって、文字認識用のパーセプトロンの識別能力を向上させておくことによって、画像データから抽出された、汚れや書き損じがある文字を認識する装置を構築することが可能となる。
顔認証以外の上記適用例においても、パーセプトロンを用いて識別高次平面を決定した後、分散を考慮したカルバック・ライブラー・ダイバージェンスを用い、カテゴリ内の学習データの分散が異なっているデータ群に対し、識別高次平面を最適な位置に再設定することによって、識別能力を向上することが可能となる。
なお、上記のパターン認識学習装置及びパターン認識装置の全部又は一部は、ハードウェア、ソフトウェア又はこれらの組合せにより実現することができる。また、上記のパターン認識学習方法及びパターン認識方法も、ハードウェア、ソフトウェア又はこれらに組合せにより実現することができる。ここで、ソフトウェアによって実現されるとは、コンピュータがプログラムを読み込んで実行することにより実現されることを意味する。
プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えば、フレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば、光磁気ディスク)、CD−ROM(Read Only Memory)、CD−R、CD−R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(random access memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
パターン認識を学習するためのパターン認識学習装置であって、
パターン認識の学習データから各学習データのカテゴリを識別する識別関数を決定する決定手段と、
前記カテゴリにおける学習データの分散特性を考慮して前記識別関数を最適化する最適化手段と、
を含むことを特徴とするパターン認識学習装置。
パターン認識を学習するためのパターン認識学習装置であって、
パターン認識の学習データから各学習データのカテゴリを識別する識別関数を決定する決定手段と、
前記カテゴリにおける学習データの分散特性を考慮して前記識別関数を最適化する最適化手段と、
を含むことを特徴とするパターン認識学習装置。
(付記2)
前記最適化手段は、前記識別関数が与えるカテゴリの識別境界から該カテゴリに属する学習データまでの距離の分散を考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記1に記載のパターン認識学習装置。
前記最適化手段は、前記識別関数が与えるカテゴリの識別境界から該カテゴリに属する学習データまでの距離の分散を考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記1に記載のパターン認識学習装置。
(付記3)
前記識別能力評価関数として前記分散を考慮したカルバック・ライブラー・ダイバージェンスを用いることを特徴とする付記2に記載のパターン認識学習装置。
前記識別能力評価関数として前記分散を考慮したカルバック・ライブラー・ダイバージェンスを用いることを特徴とする付記2に記載のパターン認識学習装置。
(付記4)
前記識別能力評価関数として前記カテゴリの識別境界から該カテゴリに属する学習データまでのユークリッド距離の総和の逆数を用いることを特徴とする付記2に記載のパターン認識学習装置。
前記識別能力評価関数として前記カテゴリの識別境界から該カテゴリに属する学習データまでのユークリッド距離の総和の逆数を用いることを特徴とする付記2に記載のパターン認識学習装置。
(付記5)
前記最適化手段は、前記カテゴリのうち特定のカテゴリに最も近い別カテゴリを決定し、前記特定のカテゴリの識別境界から前記特定のカテゴリに属する学習データまでの距離の分散と、前記識別境界から前記別カテゴリに属する学習データまでの距離の分散とを考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記2〜4のいずれか1に記載のパターン認識学習装置。
前記最適化手段は、前記カテゴリのうち特定のカテゴリに最も近い別カテゴリを決定し、前記特定のカテゴリの識別境界から前記特定のカテゴリに属する学習データまでの距離の分散と、前記識別境界から前記別カテゴリに属する学習データまでの距離の分散とを考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記2〜4のいずれか1に記載のパターン認識学習装置。
(付記6)
前記最適化手段は、前記カテゴリのうち特定のカテゴリに近いもの順に所定個数の複数の別カテゴリを決定し、前記特定のカテゴリの識別境界から前記特定のカテゴリに属する学習データまでの距離の分散と、前記識別境界から前記複数の別カテゴリに属する学習データまでの距離の分散とを考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記2〜4のいずれか1に記載のパターン認識学習装置。
前記最適化手段は、前記カテゴリのうち特定のカテゴリに近いもの順に所定個数の複数の別カテゴリを決定し、前記特定のカテゴリの識別境界から前記特定のカテゴリに属する学習データまでの距離の分散と、前記識別境界から前記複数の別カテゴリに属する学習データまでの距離の分散とを考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記2〜4のいずれか1に記載のパターン認識学習装置。
(付記7)
前記最適化手段は、前記特定のカテゴリの重心と前記特定のカテゴリ以外のカテゴリの重心との距離に基づいてカテゴリ間の近さを判定することを特徴とする付記5又は6に記載のパターン認識学習装置。
前記最適化手段は、前記特定のカテゴリの重心と前記特定のカテゴリ以外のカテゴリの重心との距離に基づいてカテゴリ間の近さを判定することを特徴とする付記5又は6に記載のパターン認識学習装置。
(付記8)
前記最適化手段は、最大傾斜法に基づいて前記識別能力評価関数の値が最大化するように前記識別境界を移動させることを特徴とする付記2〜7のいずれか1に記載のパターン認識学習装置。
前記最適化手段は、最大傾斜法に基づいて前記識別能力評価関数の値が最大化するように前記識別境界を移動させることを特徴とする付記2〜7のいずれか1に記載のパターン認識学習装置。
(付記9)
前記決定手段は、パーセプトロンを用いて前記識別関数を決定することを特徴とする付記1〜8のいずれか1に記載のパターン認識学習装置。
前記決定手段は、パーセプトロンを用いて前記識別関数を決定することを特徴とする付記1〜8のいずれか1に記載のパターン認識学習装置。
(付記10)
付記1〜9のいずれか1に記載のパターン認識学習装置と、
前記最適化手段により最適化された識別関数を用いて入力データのパターン認識を行うパターン認識手段と、
を含むことを特徴とするパターン認識装置。
付記1〜9のいずれか1に記載のパターン認識学習装置と、
前記最適化手段により最適化された識別関数を用いて入力データのパターン認識を行うパターン認識手段と、
を含むことを特徴とするパターン認識装置。
(付記11)
パターン認識を学習するパターン認識学習方法であって、
パターン認識の学習データから各学習データのカテゴリを識別する識別関数を決定する決定ステップと、
前記カテゴリにおける学習データの分散特性を考慮して前記識別関数を最適化する最適化ステップと、
を含むことを特徴とするパターン認識学習方法。
パターン認識を学習するパターン認識学習方法であって、
パターン認識の学習データから各学習データのカテゴリを識別する識別関数を決定する決定ステップと、
前記カテゴリにおける学習データの分散特性を考慮して前記識別関数を最適化する最適化ステップと、
を含むことを特徴とするパターン認識学習方法。
(付記12)
前記最適化ステップでは、前記識別関数が与えるカテゴリの識別境界から該カテゴリに属する学習データまでの距離の分散を考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記11に記載のパターン認識学習方法。
前記最適化ステップでは、前記識別関数が与えるカテゴリの識別境界から該カテゴリに属する学習データまでの距離の分散を考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記11に記載のパターン認識学習方法。
(付記13)
前記識別能力評価関数として前記分散を考慮したカルバック・ライブラー・ダイバージェンスを用いることを特徴とする付記12に記載のパターン認識学習方法。
前記識別能力評価関数として前記分散を考慮したカルバック・ライブラー・ダイバージェンスを用いることを特徴とする付記12に記載のパターン認識学習方法。
(付記14)
前記識別能力評価関数として前記カテゴリの識別境界から該カテゴリに属する学習データまでのユークリッド距離の総和の逆数を用いることを特徴とする付記12に記載のパターン認識学習方法。
前記識別能力評価関数として前記カテゴリの識別境界から該カテゴリに属する学習データまでのユークリッド距離の総和の逆数を用いることを特徴とする付記12に記載のパターン認識学習方法。
(付記15)
前記最適化ステップでは、前記カテゴリのうち特定のカテゴリに最も近い別カテゴリを決定し、前記特定のカテゴリの識別境界から前記特定のカテゴリに属する学習データまでの距離の分散と、前記識別境界から前記別カテゴリに属する学習データまでの距離の分散とを考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記12〜14のいずれか1に記載のパターン認識学習方法。
前記最適化ステップでは、前記カテゴリのうち特定のカテゴリに最も近い別カテゴリを決定し、前記特定のカテゴリの識別境界から前記特定のカテゴリに属する学習データまでの距離の分散と、前記識別境界から前記別カテゴリに属する学習データまでの距離の分散とを考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記12〜14のいずれか1に記載のパターン認識学習方法。
(付記16)
前記最適化ステップは、前記カテゴリのうち特定のカテゴリに近いもの順に所定個数の複数の別カテゴリを決定し、前記特定のカテゴリの識別境界から前記特定のカテゴリに属する学習データまでの距離の分散と、前記識別境界から前記複数の別カテゴリに属する学習データまでの距離の分散とを考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記12〜14のいずれか1に記載のパターン認識学習方法。
前記最適化ステップは、前記カテゴリのうち特定のカテゴリに近いもの順に所定個数の複数の別カテゴリを決定し、前記特定のカテゴリの識別境界から前記特定のカテゴリに属する学習データまでの距離の分散と、前記識別境界から前記複数の別カテゴリに属する学習データまでの距離の分散とを考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記12〜14のいずれか1に記載のパターン認識学習方法。
(付記17)
前記最適化ステップでは、前記特定のカテゴリの重心と前記特定のカテゴリ以外のカテゴリの重心との距離に基づいてカテゴリ間の近さを判定することを特徴とする付記15又は16に記載のパターン認識学習方法。
前記最適化ステップでは、前記特定のカテゴリの重心と前記特定のカテゴリ以外のカテゴリの重心との距離に基づいてカテゴリ間の近さを判定することを特徴とする付記15又は16に記載のパターン認識学習方法。
(付記18)
前記最適化ステップでは、最大傾斜法に基づいて前記識別能力評価関数の値が最大化するように前記識別境界を移動させることを特徴とする付記12〜17のいずれか1に記載のパターン認識学習方法。
前記最適化ステップでは、最大傾斜法に基づいて前記識別能力評価関数の値が最大化するように前記識別境界を移動させることを特徴とする付記12〜17のいずれか1に記載のパターン認識学習方法。
(付記19)
前記決定ステップでは、パーセプトロンを用いて前記識別関数を決定することを特徴とする付記11〜18のいずれか1に記載のパターン認識学習方法。
前記決定ステップでは、パーセプトロンを用いて前記識別関数を決定することを特徴とする付記11〜18のいずれか1に記載のパターン認識学習方法。
(付記20)
付記11〜19のいずれか1に記載のパターン認識学習方法に加え、
前記最適化ステップにより最適化された識別関数を用いて入力データのパターン認識を行うパターン認識ステップ、
を含むことを特徴とするパターン認識方法。
付記11〜19のいずれか1に記載のパターン認識学習方法に加え、
前記最適化ステップにより最適化された識別関数を用いて入力データのパターン認識を行うパターン認識ステップ、
を含むことを特徴とするパターン認識方法。
(付記21)
コンピュータを、パターン認識を学習するためのパターン認識学習装置として機能させるためのプログラムであって、
前記コンピュータを、
パターン認識の学習データから各学習データのカテゴリを識別する識別関数を決定する決定手段、及び
前記カテゴリにおける学習データの分散特性を考慮して前記識別関数を最適化する最適化手段、
として機能させるためのプログラム。
コンピュータを、パターン認識を学習するためのパターン認識学習装置として機能させるためのプログラムであって、
前記コンピュータを、
パターン認識の学習データから各学習データのカテゴリを識別する識別関数を決定する決定手段、及び
前記カテゴリにおける学習データの分散特性を考慮して前記識別関数を最適化する最適化手段、
として機能させるためのプログラム。
(付記22)
前記最適化手段は、前記識別関数が与えるカテゴリの識別境界から該カテゴリに属する学習データまでの距離の分散を考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記21に記載のプログラム。
前記最適化手段は、前記識別関数が与えるカテゴリの識別境界から該カテゴリに属する学習データまでの距離の分散を考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記21に記載のプログラム。
(付記23)
前記識別能力評価関数として前記分散を考慮したカルバック・ライブラー・ダイバージェンスを用いることを特徴とする付記22に記載のプログラム。
前記識別能力評価関数として前記分散を考慮したカルバック・ライブラー・ダイバージェンスを用いることを特徴とする付記22に記載のプログラム。
(付記24)
前記識別能力評価関数として前記カテゴリの識別境界から該カテゴリに属する学習データまでのユークリッド距離の総和の逆数を用いることを特徴とする付記22に記載のプログラム。
前記識別能力評価関数として前記カテゴリの識別境界から該カテゴリに属する学習データまでのユークリッド距離の総和の逆数を用いることを特徴とする付記22に記載のプログラム。
(付記25)
前記最適化手段は、前記カテゴリのうち特定のカテゴリに最も近い別カテゴリを決定し、前記特定のカテゴリの識別境界から前記特定のカテゴリに属する学習データまでの距離の分散と、前記識別境界から前記別カテゴリに属する学習データまでの距離の分散とを考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記22〜24のいずれか1に記載のプログラム。
前記最適化手段は、前記カテゴリのうち特定のカテゴリに最も近い別カテゴリを決定し、前記特定のカテゴリの識別境界から前記特定のカテゴリに属する学習データまでの距離の分散と、前記識別境界から前記別カテゴリに属する学習データまでの距離の分散とを考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記22〜24のいずれか1に記載のプログラム。
(付記26)
前記最適化手段は、前記カテゴリのうち特定のカテゴリに近いもの順に所定個数の複数の別カテゴリを決定し、前記特定のカテゴリの識別境界から前記特定のカテゴリに属する学習データまでの距離の分散と、前記識別境界から前記複数の別カテゴリに属する学習データまでの距離の分散とを考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記22〜24のいずれか1に記載のプログラム。
前記最適化手段は、前記カテゴリのうち特定のカテゴリに近いもの順に所定個数の複数の別カテゴリを決定し、前記特定のカテゴリの識別境界から前記特定のカテゴリに属する学習データまでの距離の分散と、前記識別境界から前記複数の別カテゴリに属する学習データまでの距離の分散とを考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする付記22〜24のいずれか1に記載のプログラム。
(付記27)
前記最適化手段は、前記特定のカテゴリの重心と前記特定のカテゴリ以外のカテゴリの重心との距離に基づいてカテゴリ間の近さを判定することを特徴とする付記25又は26に記載のプログラム。
前記最適化手段は、前記特定のカテゴリの重心と前記特定のカテゴリ以外のカテゴリの重心との距離に基づいてカテゴリ間の近さを判定することを特徴とする付記25又は26に記載のプログラム。
(付記28)
前記最適化手段は、最大傾斜法に基づいて前記識別能力評価関数の値が最大化するように前記識別境界を移動させることを特徴とする付記22〜27のいずれか1に記載のプログラム。
前記最適化手段は、最大傾斜法に基づいて前記識別能力評価関数の値が最大化するように前記識別境界を移動させることを特徴とする付記22〜27のいずれか1に記載のプログラム。
(付記29)
前記決定手段は、パーセプトロンを用いて前記識別関数を決定することを特徴とする付記21〜28のいずれか1に記載のプログラム。
前記決定手段は、パーセプトロンを用いて前記識別関数を決定することを特徴とする付記21〜28のいずれか1に記載のプログラム。
(付記30)
付記21〜29のいずれか1に記載のプログラムにおいて、
前記コンピュータを、更に、
前記最適化手段により最適化された識別関数を用いて入力データのパターン認識を行うパターン認識手段として機能させることを特徴とするプログラム。
付記21〜29のいずれか1に記載のプログラムにおいて、
前記コンピュータを、更に、
前記最適化手段により最適化された識別関数を用いて入力データのパターン認識を行うパターン認識手段として機能させることを特徴とするプログラム。
本発明は画像認識、音声認識、文字認識などのパターン認識に利用できる。
100 パターン認識装置
110 データ入力部
120 データ処理部
122 パターン認識学習部
124 パターン認識部
130 データ出力部
140 記憶部
110 データ入力部
120 データ処理部
122 パターン認識学習部
124 パターン認識部
130 データ出力部
140 記憶部
Claims (9)
- パターン認識を学習するためのパターン認識学習装置であって、
パターン認識の学習データから各学習データのカテゴリを識別する識別関数を決定する決定手段と、
前記カテゴリにおける学習データの分散特性を考慮して前記識別関数を最適化する最適化手段と、
を含み、
前記最適化手段は、前記識別関数が与えるカテゴリの識別境界から該カテゴリに属する学習データまでの距離の分散を考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とするパターン認識学習装置。 - 前記識別能力評価関数として前記分散を考慮したカルバック・ライブラー・ダイバージェンスを用いることを特徴とする請求項1に記載のパターン認識学習装置。
- 前記識別能力評価関数として前記カテゴリの識別境界から該カテゴリに属する学習データまでのユークリッド距離の総和の逆数を用いることを特徴とする請求項1に記載のパターン認識学習装置。
- 前記最適化手段は、前記カテゴリのうち特定のカテゴリに最も近い別カテゴリを決定し、前記特定のカテゴリの識別境界から前記特定のカテゴリに属する学習データまでの距離の分散と、前記識別境界から前記別カテゴリに属する学習データまでの距離の分散とを考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする請求項1〜3のいずれか1項に記載のパターン認識学習装置。
- 前記最適化手段は、前記カテゴリのうち特定のカテゴリに近いもの順に所定個数の複数の別カテゴリを決定し、前記特定のカテゴリの識別境界から前記特定のカテゴリに属する学習データまでの距離の分散と、前記識別境界から前記複数の別カテゴリに属する学習データまでの距離の分散とを考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とする請求項1〜3のいずれか1項に記載のパターン認識学習装置。
- 前記最適化手段は、前記特定のカテゴリの重心と前記特定のカテゴリ以外のカテゴリの重心との距離に基づいてカテゴリ間の近さを判定することを特徴とする請求項4又は5に記載のパターン認識学習装置。
- 請求項1〜6のいずれか1項に記載のパターン認識学習装置と、
前記最適化手段により最適化された識別関数を用いて入力データのパターン認識を行うパターン認識手段と、
を含むことを特徴とするパターン認識装置。 - パターン認識の識別関数を決定する決定手段と、前記識別関数を最適化する最適化手段とを有するパターン認識学習装置におけるパターン認識を学習するパターン認識学習方法であって、
前記決定手段において、パターン認識の学習データから各学習データのカテゴリを識別する前記識別関数を決定する決定ステップと、
前記最適化手段において、前記カテゴリにおける学習データの分散特性を考慮して前記識別関数を最適化する最適化ステップと、
を含み、
前記最適化ステップでは、前記識別関数が与えるカテゴリの識別境界から該カテゴリに属する学習データまでの距離の分散を考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とするパターン認識学習方法。 - コンピュータを、パターン認識を学習するためのパターン認識学習装置として機能させるためのプログラムであって、
前記コンピュータを、
パターン認識の学習データから各学習データのカテゴリを識別する識別関数を決定する決定手段、及び
前記カテゴリにおける学習データの分散特性を考慮して前記識別関数を最適化する最適化手段、
として機能させ、
前記最適化手段により、前記識別関数が与えるカテゴリの識別境界から該カテゴリに属する学習データまでの距離の分散を考慮した識別能力評価関数の値を最大化するように前記識別境界を移動させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013143460A JP5725576B2 (ja) | 2013-07-09 | 2013-07-09 | パターン認識及びその学習方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013143460A JP5725576B2 (ja) | 2013-07-09 | 2013-07-09 | パターン認識及びその学習方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015018312A JP2015018312A (ja) | 2015-01-29 |
JP5725576B2 true JP5725576B2 (ja) | 2015-05-27 |
Family
ID=52439268
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013143460A Active JP5725576B2 (ja) | 2013-07-09 | 2013-07-09 | パターン認識及びその学習方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5725576B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7198432B2 (ja) * | 2019-01-30 | 2023-01-04 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置、画像読取装置、画像形成装置、画像処理方法及び画像処理プログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005198970A (ja) * | 2004-01-19 | 2005-07-28 | Konica Minolta Medical & Graphic Inc | 医用画像処理装置 |
-
2013
- 2013-07-09 JP JP2013143460A patent/JP5725576B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015018312A (ja) | 2015-01-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110362677B (zh) | 文本数据类别的识别方法及装置、存储介质、计算机设备 | |
US9002101B2 (en) | Recognition device, recognition method, and computer program product | |
JP6760318B2 (ja) | 顔画像識別システム、識別器生成装置、識別装置、画像識別システム、及び識別システム | |
US9600745B2 (en) | Image recognition system, image recognition method, and non-transitory computer readable medium storing image recognition program | |
US11935298B2 (en) | System and method for predicting formation in sports | |
JP5214760B2 (ja) | 学習装置、方法及びプログラム | |
US11126827B2 (en) | Method and system for image identification | |
US11449706B2 (en) | Information processing method and information processing system | |
JP6003492B2 (ja) | 文字認識装置及びプログラム | |
KR20160011916A (ko) | 얼굴 인식을 통한 사용자 식별 방법 및 장치 | |
JPWO2008059624A1 (ja) | 2クラス分類予測モデルの作成方法、分類予測モデル作成のためのプログラムおよび2クラス分類予測モデルの作成装置 | |
JP2018026122A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP6128910B2 (ja) | 学習装置、学習方法及びプログラム | |
KR20170108339A (ko) | 영상에서 다수의 객체를 인식하는 방법 | |
US10943099B2 (en) | Method and system for classifying an input data set using multiple data representation source modes | |
JPWO2015146113A1 (ja) | 識別辞書学習システム、識別辞書学習方法および識別辞書学習プログラム | |
JP2015225410A (ja) | 認識装置、方法及びプログラム | |
WO2021111622A1 (ja) | パラメータ決定装置、パラメータ決定方法、及び、非一時的なコンピュータ可読媒体 | |
US8755594B2 (en) | Information processing device and method, and program | |
KR101521136B1 (ko) | 얼굴 인식 방법 및 얼굴 인식 장치 | |
US10007842B2 (en) | Same person determination device and method, and control program therefor | |
JP5725576B2 (ja) | パターン認識及びその学習方法 | |
CN113762005B (zh) | 特征选择模型的训练、对象分类方法、装置、设备及介质 | |
CN113947209A (zh) | 基于云边协同的集成学习方法、系统及存储介质 | |
JP2017084006A (ja) | 画像処理装置およびその方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141023 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150303 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150326 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5725576 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |