JP5640773B2 - 情報照合装置、情報照合方法および情報照合プログラム - Google Patents
情報照合装置、情報照合方法および情報照合プログラム Download PDFInfo
- Publication number
- JP5640773B2 JP5640773B2 JP2011017220A JP2011017220A JP5640773B2 JP 5640773 B2 JP5640773 B2 JP 5640773B2 JP 2011017220 A JP2011017220 A JP 2011017220A JP 2011017220 A JP2011017220 A JP 2011017220A JP 5640773 B2 JP5640773 B2 JP 5640773B2
- Authority
- JP
- Japan
- Prior art keywords
- teacher
- records
- rule
- name identification
- positive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/0265—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/086—Learning methods using evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/126—Evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図17は、学習による照合を説明する図である。図17に示すように、学習部(SVM)100は、名寄せ対象項目毎の評価関数fa〜fcの結果(評価値)を素性として教師例s0による学習を行い、識別面を求めることによって、素性とした各評価値に対する重みa1〜a3と総合評価値に対する判定に用いる閾値v0を導出する。SVM100は、導出した重みa1〜a3および閾値v0を学習結果として出力する。そして、名寄せ処理は、名寄せ元Jについて、名寄せ先Mとの間の学習結果を使用した名寄せを行う。すなわち、名寄せ処理は、名寄せ対象項目毎に学習結果として出力された重みa1〜a3を使用した照合を行い、照合の結果得られた判定対象となる総合評価値を学習で導出した識別面との距離として計算し、総合評価値に対して閾値による判定を行う。なお、識別面については、後述するものとする。
図1は、実施例に係る情報照合装置の構成を示す機能ブロック図である。情報照合装置1は、項目に対応する値の集合から構成される複数のレコードについて、レコード間を照合し、レコード間の同一性、類似性および関連性を判定する装置である。図1に示すように、情報照合装置1は、記憶部11および制御部12を有する。
名寄せ元.氏名=名寄せ先.氏名 AND 名寄せ元.住所=名寄せ先.住所
名寄せ元.氏名とは、名寄せ元DB111の氏名の項目を指す。名寄せ先.氏名とは、名寄せ先DB112の氏名の項目を指す。名寄せ元.住所は、名寄せ元DB111の住所の項目を指す。名寄せ先.住所は、名寄せ先DB112の住所の項目を指す。
名寄せ元.氏名=名寄せ先.氏名 AND 名寄せ元.生年月日≠名寄せ先.生年月日
名寄せ元.生年月日とは、名寄せ元DB111の生年月日の項目を指す。名寄せ先.生年月日とは、名寄せ先DB112の生年月日の項目を指す。また、複数の教師例ルールを含む場合には、各教師例ルールをORで結合して記述(解釈)される。
次に、実施例に係る教師例生成処理の手順を、図2を参照しながら説明する。図2は、実施例に係る教師例生成処理の手順を示すフローチャートである。
次に、実施例に係る教師例検証処理の手順を、図3を参照しながら説明する。図3は、実施例に係る教師例検証処理の手順を示すフローチャートである。
次に、実施例に係る名寄せ結果判定処理の手順を、図4を参照しながら説明する。図4は、実施例に係る名寄せ結果判定処理の手順を示すフローチャートである。
次に、教師例の保守手順について、図5Aおよび図5Bを参照しながら説明する。図5Aは、実施例に係る教師例の保守手順の一例を示すフローチャートであり、図5Bは、実施例に係る判定不能の名寄せ結果を教師例に反映して教師例を保守する手順の一例を示すフローチャートである。
次に、教師例生成部124によって生成された教師例を用いた名寄せについて、図6を参照しながら説明する。図6は、教師例生成部によって生成された教師例を用いた名寄せについて説明する図であり、図6(A)では、教師例生成部によって生成された教師例を用いた学習結果を示し、図6(B)では、学習結果を用いた照合結果を示す。図6(A)に示すように、正例の教師例ルールには、正例ルールAおよび正例ルールBが設定され、負例の教師例ルールには、負例ルールCおよび負例ルールDが設定される。これらの教師例ルールは、教師例ルール設定部123によって教師例生成部124に設定される。そして教師例生成部124は、設定された教師例ルールから教師例を生成する。ここでは、正例ルールAから教師例A1、A2が生成され、正例ルールBから教師例B1、B2が生成され、負例ルールCから教師例C1、C2が生成され、負例ルールDから教師例D1、D2が生成される。そして、学習部122が、生成された正例の教師例および負例の教師例を用いて学習を行い、教師例の正例および負例をより適切に判別できる識別面S3に基づく学習結果を導出する。
ここで、教師例の矛盾解消の効果を確認するための実験例について、図8を参照しながら説明する。図8は、教師例の矛盾解消の効果を確認するための実験例を説明する図である。図8(A)は、名寄せ対象のデータを示す。実験で使用されたデータベースは、200万件の顧客表111Aのデータベースである。実験では、名寄せ元および名寄せ先を同じ対象データとして、対象データの重複を除去する目的で、学習を利用した自己名寄せが行われる。なお、名寄せ対象項目は、氏名、住所および生年月日であるものとする。
図8(A)で示された名寄せ対象のデータおよび図8(B)で示される矛盾のある教師例を用いた、教師例検証部125による教師例検証の具体例を、図9を参照しながら説明する。図9は、実施例に係る教師例検証の具体例を説明する図である。ここで、図9では、教師例ルール設定部123によって設定される正例ルールは、氏名が一致し、かつ生年月日が一致しているものとする。さらに、暗黙の正例ルールとして、名寄せ対象項目の全項目の一致を正例とする旨を適用する。また、教師例ルール設定部123によって設定される負例ルールは、氏名が一致していても、生年月日が不一致であるものとする。さらに、暗黙の負例ルールとして、名寄せ対象項目の全項目の不一致を負例とする旨を適用する。したがって、教師例ルールのうち正例ルールは、教師例ルール設定部123によって設定される正例ルールa1および暗黙の正例ルールa2を含むルールとなり、以下のようになる。
「(元.氏名=先.氏名 AND 元.生年月日=先.生年月日) OR (元.氏名=先.氏名 AND 元.生年月日=先.生年月日 AND 元.住所=先.住所)」
また、教師例ルールのうち負例ルールは、教師例ルール設定部123によって設定される負例ルールb1および暗黙の負例ルールb2を含むルールとなり、以下のようになる。
「(元.氏名=先.氏名 AND 元.生年月日≠先.生年月日) OR (元.氏名≠先.氏名 AND 元.生年月日≠先.生年月日 AND 元.住所≠先.住所)」
なお、教師例ルールの中で使用される「元」は名寄せ元、「先」は名寄せ先を略記したものであり、ここでは、名寄せ元、名寄せ先とも顧客表111Aを指す。
図8(A)で示された名寄せ対象のデータを用いた、教師例生成部124による教師例生成の具体例を、図10を参照しながら説明する。図10は、実施例に係る教師例生成の具体例を説明する図である。ここで、図10では、正例ルールおよび負例ルールを図9と同じルールとし、その説明を省略する。
上記実施例によれば、情報照合装置1が、名寄せの判定基準を教師あり学習で学習するために使用される教師例の条件を規定する教師例ルールを設定する。すなわち、情報照合装置1は、同一と判定すべきレコードの組である正例の教師例および異なると判定すべきレコードの組である負例の教師例の条件を規定する教師例ルールを設定する。そして、情報照合装置1が、名寄せ元のレコードについて、正例の教師例の条件を規定する教師例ルールである正例ルールを用いて名寄せ先のレコードを検索することで正例の教師例を生成する。また、情報照合装置1が、名寄せ元のレコードについて、負例の教師例の条件を規定する教師例ルールである負例ルールを用いて名寄せ先のレコードを検索することで負例の教師例を生成する。
なお、情報照合装置1は、既知のパーソナルコンピュータ、ワークステーション等の情報照合装置に、上記した記憶部11、制御部12等の各機能を搭載することによって実現することができる。
前記判定で用いられる判定基準を教師あり学習で学習するために使用される教師データであって、同一と判定すべきレコードの組である正例の教師データおよび異なると判定すべきレコードの組である負例の教師データの条件を規定するルールを設定する教師例ルール設定部と、
照合元のレコードについて、前記教師例ルール設定部によって設定された、正例の教師データの条件を規定するルールである正例のルールを用いて照合先のレコードを検索することで正例の教師データを生成し、前記教師例ルール設定部によって設定された、負例の教師データの条件を規定するルールである負例のルールを用いて照合先のレコードを検索することで負例の教師データを生成する教師例生成部と
を有することを特徴とする情報照合装置。
レコード間の照合対象の項目に対応した値が全て一致する旨の条件を正例の教師データの条件とし、レコード間の照合対象の項目に対応した値が全て不一致となる旨の条件を負例の教師データの条件とし、いずれかの条件を含むルールを設定することを特徴とする付記1に記載の情報照合装置。
生成された正例の教師データについて、前記負例のルールに合致しないことを判定し、生成された負例の教師データについて、前記正例のルールに合致しないことを判定し、前記判定でルールに合致した場合に、ルールに合致した教師データを削除することを特徴とする付記1または付記2に記載の情報照合装置。
前記判定で用いられる判定基準を教師あり学習で学習するために使用される教師データであって、同一と判定すべきレコードの組である正例の教師データおよび異なると判定すべきレコードの組である負例の教師データの条件を規定するルールを設定する教師例ルール設定部と、
正例または負例の教師データを取得し、取得した教師データについて、前記教師例ルール設定部によって設定されたルールであって、当該教師データが有する正例または負例の区別と逆の区別のルールに合致しないことを判定する教師例検証部と
を有することを特徴とする情報照合装置。
さらに、当該教師データが有する正例または負例の区別のルールに合致することを判定することを特徴とする付記4に記載の情報照合装置。
前記判定で用いられる判定基準を教師あり学習で学習するために使用される教師データであって、同一と判定すべきレコードの組である正例の教師データおよび異なると判定すべきレコードの組である負例の教師データの条件を規定するルールを設定する教師例ルール設定部と、
前記判定結果として判定不能と判定されたレコードの組について、前記教師例ルール設定部によって設定されたルールに基づいて、同一である、異なる、判定不能の区別を判定する名寄せ結果判定部と
を有することを特徴とする情報照合装置。
前記判定で用いられる判定基準を教師あり学習で学習するために使用される教師データであって、同一と判定すべきレコードの組である正例の教師データおよび異なると判定すべきレコードの組である負例の教師データの条件を規定するルールを設定し、
照合元のレコードについて、該設定した、正例の教師データの条件を規定するルールである正例のルールを用いて照合先のレコードを検索することで正例の教師データを生成し、該設定した、負例の教師データの条件を規定するルールである負例のルールを用いて照合先のレコードを検索することで負例の教師データを生成する
ことを特徴とする情報照合方法。
前記判定で用いられる判定基準を教師あり学習で学習するために使用される教師データであって、同一と判定すべきレコードの組である正例の教師データおよび異なると判定すべきレコードの組である負例の教師データの条件を規定するルールを設定し、
正例または負例の教師データを取得し、取得した教師データについて、該設定したルールであって、当該教師データが有する正例または負例の区別と逆の区別のルールに合致しないことを判定する
ことを特徴とする情報照合方法。
前記判定で用いられる判定基準を教師あり学習で学習するために使用される教師データであって、同一と判定すべきレコードの組である正例の教師データおよび異なると判定すべきレコードの組である負例の教師データの条件を規定するルールを設定し、
前記判定結果として判定不能と判定されたレコードの組について、該設定したルールに基づいて、同一である、異なる、判定不能の区別を判定する
ことを特徴とする情報照合方法。
前記判定で用いられる判定基準を教師あり学習で学習するために使用される教師データであって、同一と判定すべきレコードの組である正例の教師データおよび異なると判定すべきレコードの組である負例の教師データの条件を規定するルールを設定し、
照合元のレコードについて、該設定した、正例の教師データの条件を規定するルールである正例のルールを用いて照合先のレコードを検索することで正例の教師データを生成し、該設定した、負例の教師データの条件を規定するルールである負例のルールを用いて照合先のレコードを検索することで負例の教師データを生成する
処理を実行させる情報照合プログラム。
前記判定で用いられる判定基準を教師あり学習で学習するために使用される教師データであって、同一と判定すべきレコードの組である正例の教師データおよび異なると判定すべきレコードの組である負例の教師データの条件を規定するルールを設定し、
正例または負例の教師データを取得し、取得した教師データについて、該設定したルールであって、当該教師データが有する正例または負例の区別と逆の区別のルールに合致しないことを判定する
処理を実行させる情報照合プログラム。
前記判定で用いられる判定基準を教師あり学習で学習するために使用される教師データであって、同一と判定すべきレコードの組である正例の教師データおよび異なると判定すべきレコードの組である負例の教師データの条件を規定するルールを設定し、
前記判定結果として判定不能と判定されたレコードの組について、該設定したルールに基づいて、同一である、異なる、判定不能の区別を判定する
処理を実行させる情報照合プログラム。
11 記憶部
12 制御部
111 名寄せ元DB
112 名寄せ先DB
113 名寄せ定義
114 教師例
121 教師例設定部
122 学習部
123 教師例ルール設定部
124 教師例生成部
125 教師例検証部
126 名寄せ部
127 名寄せ結果判定部
Claims (9)
- 複数の項目それぞれに対応する値をそれぞれに含む複数のレコードについて、レコード間を照合し、レコード間の同一性、類似性、関連性の少なくともいずれかを判定する情報照合装置であって、
前記判定で用いられる判定基準の学習に使用される教師データであって、同一レコードと判定すべきレコードの組である正例の教師データの条件として前記複数の項目のうちレコード間で値が一致すべき項目を規定する正例ルールと、異なるレコードと判定すべきレコードの組である負例の教師データの条件として前記複数の項目のうちレコード間で値が一致すべき項目とレコード間で値が不一致となるべき項目とを規定する負例ルールと、を記憶する記憶部と、
照合元のレコードについて、前記正例ルールを用いて照合先のレコードを検索して、前記正例ルールを用いた検索の結果抽出された照合先のレコードと前記照合元のレコードとを組とする正例の教師データを生成し、前記負例ルールを用いて前記照合先のレコードを検索して、前記負例ルールを用いた検索の結果抽出された照合先のレコードと前記照合元のレコードとを組とする負例の教師データを生成する教師例生成部と
を有することを特徴とする情報照合装置。 - 前記負例ルールで規定される前記レコード間で値が一致すべき項目は、前記正例ルールで規定される前記レコード間で値が一致すべき項目に含まれることを特徴とする請求項1に記載の情報照合装置。
- 前記記憶部は、
レコード間の照合対象の項目に対応した値が全て一致する旨の条件を正例の教師データの条件として、レコード間の照合対象の項目に対応した値が全て不一致となる旨の条件を負例の教師データの条件として、前記値が全て一致または不一致となる旨のいずれかの条件を含むルールをさらに記憶することを特徴とする請求項1または請求項2に記載の情報照合装置。 - 前記教師例生成部は、
生成された正例の教師データについて、前記負例ルールに合致しないことを判定し、生成された負例の教師データについて、前記正例ルールに合致しないことを判定し、前記正例の教師データが前記負例ルールに合致した場合または前記負例の教師データが前記正例ルールに合致した場合に、前記合致した教師データを削除することを特徴とする請求項1〜請求項3のいずれか一つに記載の情報照合装置。 - 複数の項目それぞれに対応する値をそれぞれに含む複数のレコードについて、レコード間を照合し、レコード間の同一性、類似性、関連性の少なくともいずれかを判定する情報照合装置であって、
前記判定で用いられる判定基準の学習に使用される教師データであって、同一レコードと判定すべきレコードの組である正例の教師データの条件として前記複数の項目のうちレコード間で値が一致すべき項目を規定する正例ルールと、異なるレコードと判定すべきレコードの組である負例の教師データの条件として前記複数の項目のうちレコード間で値が一致すべき項目とレコード間で値が不一致となるべき項目とを規定する負例ルールと、を記憶する記憶部と、
正例または負例の教師データを取得し、取得した教師データについて、前記記憶部に記憶されたルールであって、当該教師データが有する正例または負例の区別と逆の区別のルールに合致しないことを判定する教師例検証部と
を有することを特徴とする情報照合装置。 - 前記教師例検証部は、
さらに、当該教師データが有する正例または負例の区別のルールに合致することを判定することを特徴とする請求項5に記載の情報照合装置。 - 複数の項目それぞれに対応する値をそれぞれに含む複数のレコードについて、レコード間を照合し、レコード間の同一性、類似性、関連性の少なくともいずれかを判定する情報照合装置であって、
前記判定で用いられる判定基準を教師あり学習で学習するために使用される教師データであって、同一と判定すべきレコードの組である正例の教師データおよび異なると判定すべきレコードの組である負例の教師データの条件を規定するルールを設定する教師例ルール設定部と、
前記判定結果として判定不能と判定されたレコードの組について、前記教師例ルール設定部によって設定されたルールに基づいて、同一である、異なる、判定不能の区別を判定する名寄せ結果判定部と
を有することを特徴とする情報照合装置。 - 複数の項目それぞれに対応する値をそれぞれに含む複数のレコードについて、レコード間を照合し、レコード間の同一性、類似性、関連性の少なくともいずれかを判定する情報照合装置によって実行する情報照合方法であって、
前記判定で用いられる判定基準の学習に使用される教師データであって、同一レコードと判定すべきレコードの組である正例の教師データの条件として前記複数の項目のうちレコード間で値が一致すべき項目を規定する正例ルールと、異なるレコードと判定すべきレコードの組である負例の教師データの条件として前記複数の項目のうちレコード間で値が一致すべき項目とレコード間で値が不一致となるべき項目とを規定する負例ルールと、を記憶し、
照合元のレコードについて、前記正例ルールを用いて照合先のレコードを検索して、前記正例ルールを用いた検索の結果抽出された照合先のレコードと前記照合元のレコードとを組とする正例の教師データを生成し、前記負例ルールを用いて前記照合先のレコードを検索して、前記負例ルールを用いた検索の結果抽出された照合先のレコードと前記照合元のレコードとを組とする負例の教師データを生成する
ことを特徴とする情報照合方法。 - 複数の項目それぞれに対応する値をそれぞれに含む複数のレコードについて、レコード間を照合し、レコード間の同一性、類似性、関連性の少なくともいずれかを判定する情報照合装置に、
前記判定で用いられる判定基準の学習に使用される教師データであって、同一レコードと判定すべきレコードの組である正例の教師データの条件として前記複数の項目のうちレコード間で値が一致すべき項目を規定する正例ルールと、異なるレコードと判定すべきレコードの組である負例の教師データの条件として前記複数の項目のうちレコード間で値が一致すべき項目とレコード間で値が不一致となるべき項目とを規定する負例ルールと、を記憶し、
照合元のレコードについて、前記正例ルールを用いて照合先のレコードを検索して、前記正例ルールを用いた検索の結果抽出された照合先のレコードと前記照合元のレコードとを組とする正例の教師データを生成し、前記負例ルールを用いて前記照合先のレコードを検索して、前記負例ルールを用いた検索の結果抽出された照合先のレコードと前記照合元のレコードとを組とする負例の教師データを生成する
処理を実行させる情報照合プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011017220A JP5640773B2 (ja) | 2011-01-28 | 2011-01-28 | 情報照合装置、情報照合方法および情報照合プログラム |
US13/307,050 US20120197826A1 (en) | 2011-01-28 | 2011-11-30 | Information matching apparatus, method of matching information, and computer readable storage medium having stored information matching program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011017220A JP5640773B2 (ja) | 2011-01-28 | 2011-01-28 | 情報照合装置、情報照合方法および情報照合プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012159884A JP2012159884A (ja) | 2012-08-23 |
JP5640773B2 true JP5640773B2 (ja) | 2014-12-17 |
Family
ID=46578197
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011017220A Expired - Fee Related JP5640773B2 (ja) | 2011-01-28 | 2011-01-28 | 情報照合装置、情報照合方法および情報照合プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20120197826A1 (ja) |
JP (1) | JP5640773B2 (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5640774B2 (ja) * | 2011-01-28 | 2014-12-17 | 富士通株式会社 | 情報照合装置、情報照合方法および情報照合プログラム |
CN105095240B (zh) * | 2014-05-04 | 2018-11-27 | 中国银联股份有限公司 | 数据库的数据样本采集 |
JP6775935B2 (ja) | 2015-11-04 | 2020-10-28 | 株式会社東芝 | 文書処理装置、方法、およびプログラム |
JP6602243B2 (ja) | 2016-03-16 | 2019-11-06 | 株式会社東芝 | 学習装置、方法、及びプログラム |
US10681391B2 (en) * | 2016-07-13 | 2020-06-09 | Oath Inc. | Computerized system and method for automatic highlight detection from live streaming media and rendering within a specialized media player |
CN106557747B (zh) * | 2016-11-15 | 2018-06-22 | 平安科技(深圳)有限公司 | 识别保险单号码的方法及装置 |
JP6622172B2 (ja) * | 2016-11-17 | 2019-12-18 | 株式会社東芝 | 情報抽出支援装置、情報抽出支援方法およびプログラム |
CN108664497B (zh) * | 2017-03-30 | 2020-11-03 | 大有秦鼎(北京)科技有限公司 | 数据匹配的方法和装置 |
JP7060369B2 (ja) * | 2017-12-08 | 2022-04-26 | Nttテクノクロス株式会社 | 名寄せ支援装置、名寄せ支援方法及びプログラム |
JP7103868B2 (ja) * | 2018-06-27 | 2022-07-20 | Nttテクノクロス株式会社 | 管理装置、管理方法及びプログラム |
CN109670190B (zh) * | 2018-12-25 | 2023-05-16 | 北京百度网讯科技有限公司 | 翻译模型构建方法和装置 |
US11373298B2 (en) * | 2019-03-28 | 2022-06-28 | Canon Medical Systems Corporation | Apparatus and method for training neural networks using small, heterogeneous cohorts of training data |
CN113711196A (zh) | 2019-04-12 | 2021-11-26 | 美国控股实验室公司 | 用于为临床试验提供记录选择的基于地理聚类数据的数据库缩减 |
JP7207143B2 (ja) * | 2019-05-09 | 2023-01-18 | 富士通株式会社 | ルール提示方法、ルール提示プログラムおよびルール提示装置 |
JP7123326B1 (ja) * | 2021-10-22 | 2022-08-23 | 稔功 金子 | 情報処理方法、情報処理プログラム、情報処理装置及び学習モデルの生成方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2940933B2 (ja) * | 1989-05-20 | 1999-08-25 | 株式会社リコー | パターン認識方式 |
JPH08221275A (ja) * | 1995-02-10 | 1996-08-30 | Meidensha Corp | 帰納学習における述語論理ルール生成方法 |
JP4065936B2 (ja) * | 2001-10-09 | 2008-03-26 | 独立行政法人情報通信研究機構 | 機械学習法を用いた言語解析処理システムおよび機械学習法を用いた言語省略解析処理システム |
JP5137567B2 (ja) * | 2007-12-28 | 2013-02-06 | 三菱電機株式会社 | 検索フィルタリング装置及び検索フィルタリングプログラム |
US8458520B2 (en) * | 2008-12-01 | 2013-06-04 | Electronics And Telecommunications Research Institute | Apparatus and method for verifying training data using machine learning |
WO2010119615A1 (ja) * | 2009-04-15 | 2010-10-21 | 日本電気株式会社 | 学習データ生成装置、及び固有表現抽出システム |
-
2011
- 2011-01-28 JP JP2011017220A patent/JP5640773B2/ja not_active Expired - Fee Related
- 2011-11-30 US US13/307,050 patent/US20120197826A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
JP2012159884A (ja) | 2012-08-23 |
US20120197826A1 (en) | 2012-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5640773B2 (ja) | 情報照合装置、情報照合方法および情報照合プログラム | |
JP5640774B2 (ja) | 情報照合装置、情報照合方法および情報照合プログラム | |
WO2022134575A1 (zh) | 业务关键词的提取方法、装置、设备及存储介质 | |
Uludag et al. | Biometric template selection and update: a case study in fingerprints | |
Ortega-Garcia et al. | The multiscenario multienvironment biosecure multimodal database (BMDB) | |
EP2633445A1 (en) | Cost-sensitive alternating decision trees for record linkage | |
US7813531B2 (en) | Methods and apparatus for clustering templates in non-metric similarity spaces | |
US20070288452A1 (en) | System and Method for Rapidly Searching a Database | |
Erbilek et al. | Framework for managing ageing effects in signature biometrics | |
US11507901B1 (en) | Apparatus and methods for matching video records with postings using audiovisual data processing | |
WO2008047136A1 (en) | Biometric matching method and apparatus | |
JP5764942B2 (ja) | 情報照合装置、情報照合システム、情報照合方法および情報照合プログラム | |
WO2011018867A1 (ja) | 情報分類装置、情報分類方法、及びコンピュータ読み取り可能な記録媒体 | |
US9436780B2 (en) | Constructing incremental tree model for vein image recognition and authentication | |
Makri et al. | Towards a more accurate and fair SVM-based record linkage | |
CN110795561B (zh) | 一种电子卷宗材料类型自动识别系统及其自主学习方法 | |
KR100734837B1 (ko) | 다중 생체 인식 시스템 및 그 방법 | |
Bartz et al. | Finding similar failures using callstack similarity | |
Moulinier | A framework for comparing text categorization approaches | |
Stein et al. | Density-based cluster algorithms in low-dimensional and high-dimensional applications | |
JP2020144502A (ja) | 分類システム | |
CN117708683A (zh) | 基于对抗神经网络实现数据共享授权信息管理的方法、装置、处理器及其存储介质 | |
US20220156271A1 (en) | Systems and methods for determining the probability of an invention being granted a patent | |
KR20240079338A (ko) | 식물 정보 분류 결과 제공 시스템 및 방법 | |
US20170109439A1 (en) | Document classification based on multiple meta-algorithmic patterns |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20131007 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140408 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140609 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140930 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141013 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5640773 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |