[go: up one dir, main page]

JP2018097397A - ルールセットを選択可能な推論エンジンを有するプログラム、装置及び方法 - Google Patents

ルールセットを選択可能な推論エンジンを有するプログラム、装置及び方法 Download PDF

Info

Publication number
JP2018097397A
JP2018097397A JP2016238031A JP2016238031A JP2018097397A JP 2018097397 A JP2018097397 A JP 2018097397A JP 2016238031 A JP2016238031 A JP 2016238031A JP 2016238031 A JP2016238031 A JP 2016238031A JP 2018097397 A JP2018097397 A JP 2018097397A
Authority
JP
Japan
Prior art keywords
category
rule
engine
machine learning
target data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016238031A
Other languages
English (en)
Other versions
JP6224811B1 (ja
Inventor
尚三 竹岡
Shozo Takeoka
尚三 竹岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Takeoka Lab Corp
Original Assignee
Takeoka Lab Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Takeoka Lab Corp filed Critical Takeoka Lab Corp
Priority to JP2016238031A priority Critical patent/JP6224811B1/ja
Application granted granted Critical
Publication of JP6224811B1 publication Critical patent/JP6224811B1/ja
Priority to US16/464,752 priority patent/US11443199B2/en
Priority to PCT/JP2017/043817 priority patent/WO2018105656A1/ja
Publication of JP2018097397A publication Critical patent/JP2018097397A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/042Backward inferencing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/107Computer-aided management of electronic mailing [e-mailing]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/027Frames

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Human Resources & Organizations (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Computer Hardware Design (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

【課題】様々な用途に対しても、できる限り小さいルール集合を用いて推論することができる推論エンジンを有するプログラム、装置及び方法を提供する。【解決手段】カテゴリ毎に分類された教師データの群によって、各カテゴリに応じた学習モデルを構築した分類型の機械学習エンジンと、カテゴリ毎に異なるルールセットを予め記憶したルールベースとを有する。機械学習エンジンは、対象データを入力し、学習モデルを用いてカテゴリを出力する。また、機械学習エンジンから出力された当該カテゴリに対応するルールセットを、ルールベースから選択するルールセット選択手段と、対象データを入力し、ルールセット選択手段によって選択された当該ルールセットを用いて推論結果を出力するルールエンジンとを有する。【選択図】図2

Description

本発明は、推論エンジンの構成技術に関する。
近年、AI(Artificial Intelligence)技術が様々な用途に適用されてきている。特に、サポートベクタマシンのような統計分析知能や、ニューラルネットワークのような計算知能としての機械学習エンジンが注目されてきている。これらは、大量の教師データを用いることによって統計的に処理しようとするものであって、専門的且つ論理的に判断するものではない。
一方で、専門的且つ論理的な判断を要する実用的用途では、エキスパートシステムのようなルール分析知能が適用されている。エキスパートシステムは、特定分野に関して予め記述されたルール(ロジック)を蓄積したルールベースと、ルールとのマッチングを繰り返す推論エンジンとからなる。ルールは、「if〜then〜」の自然言語形式で記述されたものである。エキスパートシステムによれば、例えばユーザとの対話インタフェースのような言語処理にも適している。
従来、エキスパートシステムとして、前向き推論及び後向き推論を統合させる技術がある(例えば特許文献1参照)。この技術によれば、ルールが存在しない場合に、後向き推論を実行し、ルールの存在を検出した場合に、前向き推論を実行させるものである。
また、if-thenルールを自己増殖型ニューラルネットワークによって学習させる技術もある(例えば特許文献2参照)。この技術によれば、if-thenルールを入力パターンとして学習し、その学習結果を用いて推論する。
特許第2853818号公報 特開2008−305129号公報
「日本語形態素解析システム JUMAN」、京都大学 大学院情報学研究科 知能情報学専攻 知能メディア講座 言語メディア分野、黒橋・河原研究室、[online]、[平成28年10月14日]、インターネット<URL:http://nlp.ist.i.kyoto-u.ac.jp/index.php?JUMAN> 「日本語構文・格・照応解析システム KNP」、京都大学 大学院情報学研究科 知能情報学専攻 知能メディア講座 言語メディア分野、黒橋・河原研究室、[online]、[平成28年10月14日]、インターネット<URL: http://nlp.ist.i.kyoto-u.ac.jp/index.php?KNP>
ルールベースを用いた推論エンジンによれば、多様な状況に対応するべく、1つのルールベースに大量のルールを蓄積する必要がある。これらルールは、適用される専門分野が広くなる(絞り込まれていない)ほど、多様なルールを考慮する必要があるために、そのルールの量も増大する。ルールの量の増加は、推論エンジンにおける探索時間や計算量、メモリ量の増大を招く。
同時に、大量のルールが用いられるほど、専門的且つ論理的な推論結果も曖昧なものとなる。
また、推論エンジンが、高速大容量のサーバに限られず、ユーザによって所持されるスマートフォンや、IoT(Internet of Things)に代表される組込機器に搭載される場合、その探索時間や計算量、メモリ量をできる限り小さくすることが望まれる。
そこで、本発明は、様々な用途に対しても、できる限り小さいルールセット(ルール集合)を用いて推論することができる推論エンジンを有するプログラム、装置及び方法を提供することを目的とする。
本発明によれば、入力された対象データに対する推論結果を出力するようにコンピュータを機能させるプログラムにおいて、
カテゴリ毎に分類された教師データの群によって、各カテゴリに応じた学習モデルを構築した分類型の機械学習エンジンと、
カテゴリ毎に異なるルールセットを予め記憶したルールベースと
を有し、
機械学習エンジンは、対象データを入力し、学習モデルを用いてカテゴリを出力し、
機械学習エンジンから出力された当該カテゴリに対応するルールセットを、ルールベースから選択するルールセット選択手段と、
対象データを入力し、ルールセット選択手段によって選択された当該ルールセットを用いて推論結果を出力するルールエンジンと
してコンピュータを機能させることを特徴とする。
本発明のプログラムにおける他の実施形態によれば、
機械学習エンジンは、カテゴリ毎の複数のサポートベクタマシンを備えており、
サポートベクタマシンは、
学習段階として、担当カテゴリに属するか否かと、教師データとを入力して学習モデルを構築し、
運用段階として、対象データを入力し、学習モデルを用いて担当カテゴリに属するか否かを出力する
ようにコンピュータを機能させることも好ましい。
本発明のプログラムにおける他の実施形態によれば、
対象データ及び教師データは、テキストであり、
テキストから形態素の群を出力する前処理手段を更に有し、
対象データの形態素の群は、機械学習エンジン及びルールエンジンの両方へ入力され、
教師データの形態素の群は、機械学習エンジンへ入力される
ようにコンピュータを機能させることも好ましい。
本発明のプログラムにおける他の実施形態によれば、
前処理手段からの対象データの形態素の群を入力し、異なる目的に応じた複数の中間項文を、対象データとしてルールエンジンへ出力する中間項文生成手段を更に有し、
ルールエンジンは、複数の中間項文を入力し、選択されたルールセットを用いて後向き推論に基づく推論結果を出力することも好ましい。
本発明のプログラムにおける他の実施形態によれば、
中間項文生成手段は、式指向の手続型の関数プログラミングのLISPに基づくものであることも好ましい。
本発明のプログラムにおける他の実施形態によれば、
対象データ及び教師データは、メール文章であり、
カテゴリは、自動配信メールか否か、ビジネスメールか否か、又は、プライベートメールか否かに基づくものであることも好ましい。
本発明のプログラムにおける他の実施形態によれば、
ルールエンジンは、式指向の非手続型の論理プログラミングのPrologに基づくものであることも好ましい。
本発明のプログラムにおける他の実施形態によれば、
対象データ及び教師データは、マルチメディアデータであり、
マルチメディアデータに付与されたテキスト要素の群を出力する前処理手段を更に有し、
対象データのテキスト要素の群は、機械学習エンジン及びルールエンジンの両方へ入力され、
教師データのテキスト要素の群は、機械学習エンジンへ入力される
ようにコンピュータを機能させることも好ましい。
本発明のプログラムにおける他の実施形態によれば、
対象データ及び教師データは、センサ種別及び計測値であり、
対象データのセンサ種別及び計測値の群は、機械学習エンジン及びルールエンジンの両方へ入力され、
教師データのセンサ種別及び計測値の群は、機械学習エンジンへ入力される
ようにコンピュータを機能させることも好ましい。
本発明によれば、入力された対象データに対する推論結果を出力する推論装置において、
カテゴリ毎に分類された教師データの群によって、各カテゴリに応じた学習モデルを構築した機械学習エンジンと、
カテゴリ毎に異なるルールセットを予め記憶したルールベースと
を有し、
機械学習エンジンは、対象データを入力し、学習モデルを用いてカテゴリを出力し、
機械学習エンジンから出力された当該カテゴリに対応するルールセットを、ルールベースから選択するルールセット選択手段と、
対象データを入力し、ルールセット選択手段によって選択された当該ルールセットを用いて推論結果を出力するルールエンジンと
を有することを特徴とする。
本発明によれば、入力された対象データに対する推論結果を出力する装置の推論方法において、
装置は、
カテゴリ毎に分類された教師データの群によって、各カテゴリに応じた学習モデルを構築した機械学習エンジンと、
カテゴリ毎に異なるルールセットを予め記憶したルールベースと
を有し、
装置は、
機械学習エンジンが、対象データを入力し、学習モデルを用いてカテゴリを出力する第1のステップと、
機械学習エンジンから出力された当該カテゴリに対応するルールセットを、ルールベースから選択する第2のステップと、
対象データを入力し、第2のステップによって選択された当該ルールセットを用いて推論結果を出力する第3のステップと
を実行することを特徴とする。
本発明のプログラム、装置及び方法によれば、様々な用途に対しても、できる限り小さいルールセットを用いて推論することができる。
本発明のシステム構成図である。 本発明のプログラムにおける学習段階の機能構成図である。 機械学習エンジン内で抽出される特徴パラメータを表す説明図である。 本発明のプログラムにおける運用段階の機能構成図である。 ビジネスメールに対する機能構成の処理の流れを表す説明図である。 プライベートメールに対する機能構成の処理の流れを表す説明図である。 ルールエンジンから出力されたコマンドを表す説明図である。
以下、本発明の実施の形態について、図面を用いて詳細に説明する。
図1は、本発明のシステム構成図である。
本発明の推論機能としてのプログラムは、入力された対象データに対する推論結果を出力するものであって、推論装置に搭載されたコンピュータを機能させるものである。図1によれば、本発明のプログラムは、ユーザが所持する端末1に搭載されている。端末1は、例えば、ユーザに基づくメールソフトをインストールしており、様々なメールを受信することができる。メールのカテゴリとしては、例えばビジネスメールもあれば、プライベートメールもあり、メルマガのような自動配信メールもある。これら受信したメールの内容を適切に推論することができれば、自動的に様々なアクションをとることができる。
例えばメール自動配信サーバから受信したメールに対しては、ユーザ自身も自動的に応答メールを返信することもできる。
また、ユーザに対してアポイントを要求するようなメール内容に対しては、ユーザのスケジューラに自動的に登録することもできる。
更に、ユーザに対してビジネスで重要なメール内容に対しては、ユーザにアラートを通知することもできる。
更に、ユーザにとって重要情報を通知するメール内容に対しては、自動的にデータベースに登録することもできる。
このように、メール内容を推論することができれば、様々な用途に利用することができる。
本発明によれば、以下の2つの段階を要する。
<学習段階>教師データを入力し、学習モデルを構築する。
(教師データには、対象データ及びカテゴリが対応付けられている)
<運用段階>対象データを入力し、学習モデルを用いてカテゴリを出力する。
本発明の実施形態としては、メール文章をとしての対象データを入力し、その対象データから推論されたアクションをアプリケーションへ出力するものである。また、メール文章としては、ビジネスメールとプライベートメールとが混在しているとする。この場合、本発明によれば、対象データに対してビジネスメール用か又はプライベート用かを判定し、その判定に応じて異なるルールセットを用いてアクションを推論する。
<学習段階>
図2は、本発明のプログラムにおける学習段階の機能構成図である。
図2によれば、推論装置1は、学習段階では、教師データ群を入力する前処理部11と、機械学習エンジン12とを有する。これら機能構成部は、装置に搭載されたコンピュータを機能させるプログラムを実行することによって実現される。また、これら機能構成部の処理の流れは、装置の学習方法としても理解できる。
[前処理部11]
前処理部11は、教師データに対する前処理を実行する。教師データとしては、例えば以下のような場合がある。
(テキスト)例えばメール文章
(マルチメディアデータ)例えばテキスト要素が付加されている画像や映像
(センサ計測値)例えばスマートフォンに搭載されているセンサによって計測された、センサ種別及び計測値
前処理部11は、教師データがテキストである場合、テキストから形態素の群を出力する。前処理部11は、文章毎に、形態素解析によって形態素に区分する。形態素解析とは、文法及び単語辞書を情報源として用いて、自然言語で書かれた文を言語として意味を持つ最小単位である形態素(Morpheme)に分割する技術をいう。また、形態毎の品詞も判別して蓄積する。
そして、前処理部11は、教師データのテキストに基づく形態素の群を、機械学習エンジン12へ出力する。
前処理部11は、具体的には京都大学で開発されたフリーソフトを用いる。これは、形態素解析にはJUMANを用い(例えば非特許文献1参照)、構文解析にKNPを用いる(例えば非特許文献2参照)。例えばmbox形式のメールについて、1文ずつ、JUMAN及びKNPによって解析し、その解析結果をS式(Symbol-expression)で出力する。S式とは、2分木又はリスト構造の形式的な記述方式であり、一般にLISPで用いられる。
前処理部11は、教師データがマルチメディアデータである場合、マルチメディアデータに付与されたテキスト要素の群を、機械学習エンジン12へ出力する。
また、前処理部11は、教師データがセンサ計測値である場合、センサ種別及び計測値の群を、機械学習エンジン12へ出力する。
[機械学習エンジン12]
機械学習エンジン12は、カテゴリ毎に分類された教師データの群によって、各カテゴリに応じた学習モデルを構築した分類型のものである。
ここで、機械学習エンジンは、カテゴリ毎の複数のサポートベクタマシンであってもよい。「サポートベクタマシン(Support Vector Machine)」は、教師有り学習を用いるパターン認識モデルであって、分類型のものである。サポートベクタマシンは、線形入力素子を用いて2クラスのパターン識別器を構成するものであって、教師データ毎に各特徴値との距離を算出することによって、線形入力素子のパラメータを学習する。サポートベクタマシンによれば、未学習データに対して高い識別性能を得ることができるが、教師データの信頼性がそのまま学習結果の信頼性に影響する。
例えば、ビジネスメールとプライベートメールとを、サポートベクタマシンによって分類したいとする。
この場合、教師データとしては、ビジネスメールのメール文章及びカテゴリ識別子と、プライベートメールのメール文章及びカテゴリ識別子とを入力する。カテゴリ識別子は、ビジネスメールかプライベートメールかを表す識別子である。
これに対し、機械学習エンジン12としてのサポートベクタマシンも、ビジネスメール用の第1のサポートベクタマシンと、プライベートメール用の第2のサポートベクタマシンとを有する。そして、第1のサポートベクタマシンには、ビジネスメールのメール文章が入力され、第1の学習モデルを構築する。同様に、第2のサポートベクタマシンには、プライベートメールのメール文章が入力され、第2の学習モデルを構築する。
これによって、第1の機械学習エンジンは、ビジネスメールか否かを分類することができ、第2の機械学習エンジンは、プライベートメールか否かを分類することができる。
また、サポートベクタマシンは、正否を分類する際に、その信頼度を出力することもできる。そのために、複数のサポートベクタマシンからの出力の中で、最も信頼度が高いカテゴリ識別子を選択することができる。
図3は、機械学習エンジン内で抽出される特徴パラメータを表す説明図である。
サポートベクタマシンは、教師データのテキストから抽出可能な特徴パラメータを用いて、学習するものであってもよい。図3によれば、例えば188次元のベクトルとしての特徴パラメータが抽出されている。
<運用段階>
図4は、本発明のプログラムにおける運用段階の機能構成図である。
図5は、ビジネスメールに対する機能構成の処理の流れを表す説明図である。
図6は、プライベートメールに対する機能構成の処理の流れを表す説明図である。
図4によれば、推論装置1は、運用段階では、ルールベース10と、前処理部11と、機械学習エンジン12と、ルールセット選択部13と、中間項文生成部14と、ルールエンジン15とを有する。これら機能構成部は、装置に搭載されたコンピュータを機能させるプログラムを実行することによって実現される。また、これら機能構成部の処理の流れは、装置の推論方法としても理解できる。
[前処理部11]
運用段階の前処理部11も、対象データに対する前処理を実行するものであって、前述した学習段階の前処理部11と同様に機能する。
前処理部11によって抽出された要素の群は、機械学習エンジン12及びルールエンジン15の両方へ出力される。
図5によれば、前処理部11には、対象データとして、10時からの会議を予定するメールが入力されている。
また、図6によれば、前処理部11に、対象データとして、プライベートの内容のメールが入力されている。
[機械学習エンジン12]
運用段階の機械学習エンジン12は、前述した学習段階の機械学習エンジン12によって構築された学習モデルを組み込んだものである。運用段階の機械学習エンジン12は、対象データを入力し、学習モデルを用いてカテゴリを出力する。
図5によれば、機械学習エンジン12は、前処理部11から出力されたビジネスメールの形態素群を入力し、カテゴリ「ビジネス」か否か、「プライベート」か否かが出力される。サポートベクタマシンは、カテゴリの信頼度も出力する。図5によれば、カテゴリ「ビジネス」の信頼度0.98であり、カテゴリ「プライベート」の信頼度0.57である。ここでは、カテゴリ「ビジネス」が、ルールセット選択部13へ出力される。
図6によれば、機械学習エンジン12は、前処理部11から出力されたプライベートメールの形態素群を入力し、カテゴリ「ビジネス」か否か、「プライベート」か否かが出力される。図6によれば、カテゴリ「プライベート」の信頼度0.98であり、カテゴリ「ビジネス」の信頼度0.21である。ここでは、カテゴリ「プライベート」が、ルールセット選択部13へ出力される。
[ルールベース10]
ルールベース10は、カテゴリ毎に異なるルールセットを予め記憶したものである。ルールセットとは、問題解決のための知識(knowledge)として、以下のようなプロダクションルールの集合をいう。
「if 条件 then 結論」
また、図5及び図6によれば、ルールベース10は、ビジネスメール用のルールセットと、プライベートメール用のルールセットとを有するものとする。
[ルールセット選択部13]
ルールセット選択部13は、機械学習エンジン12から出力された当該カテゴリに対応するルールセットを、ルールベース10から選択する。
図5及び図6によれば、具体的には、ルールセット選択部13は、機械学習エンジン12によってカテゴリ「ビジネス」と判定された場合、ルールベース10から「ビジネス」用のルールセットを選択する。
また、ルールセット選択部13は、機械学習エンジン12によってカテゴリ「プライベート」と判定された場合、ルールベース10から「プライベート」用のルールセットを選択する。
このように、機械学習エンジン12から出力されたカテゴリに応じて、ルールベース10のルールセットを切り替える。
[中間項文生成部14]
中間項文生成部14は、前処理部11からの対象データの形態素の群を入力し、異なる目的に応じた複数の中間項文(又は中間ゴール)を、対象データとしてルールエンジン15へ出力する。
中間項文生成部14は、具体的には、式指向の手続型の関数プログラミングのLISPに基づくものである。
図4によれば、ビジネスメールの中間項文の例が表されている。
図5によれば、プライベートメールの中間項文が表されている。
中間項文は、前処理部11から出力された形態素の群に対して、パターンマッチングによって生成された項文である。例えば、各単語に付与された品詞に基づいて、主語(S)、述語(V)、補語(C)、目的語(O)などを推論し、SVO, SVC, SVOO, SVOC等に相当する形式にマッチングさせて、中間項文を生成する。主に、メール文章内に出現する重要単語などに注目して、中間項文が生成される。具体的には、メール毎に、そのヘッダや本文(例えば「通信メタ情報」と称される)をリストにする。
[ルールエンジン15]
ルールエンジン15は、対象データを入力し、ルールセット選択部13によって選択された当該ルールセットを用いて推論結果を出力する。ルールエンジン15は、具体的には、式指向の非手続型の論理プログラミングのPrologに基づくものである
ルールエンジン15は、複数の中間項文を入力し、選択されたルールセットを用いて後向き推論(backward chaining)に基づく推論結果を出力する。
「後向き推論」とは、原因と結果が仮定されている事象について、その結果が原因から導き出されるか否かを、結果から遡って成立条件(アサーション)や推論規則(ルール)を見出す技術をいう。後向き推論によれば、まず結果(結論)について第1の成立条件を抽出し、次に第1の成立条件について第2の成立条件が抽出される。これを繰り返し最終的に抽出された成立条件が仮定された原因と一致するならば、仮定された原因は正しいと推論する。逆に、成立条件や推論規則が途中で見出されなくなった場合には、仮定された原因は誤りであると推論する。
アサーションは、ワーキングメモリ(working memory)に保存され、適宜、選択されたルールセットの各ルールをマッチングしていく。ルールエンジン15は、アサーションに対してルールのif(条件)をマッチングさせて、一致したifに対するthen(結論)がトリガ(triggered)され、トリガされた複数のルールの集合から新たにルールが発火(fired)し、ルールがアサーションとしてワーキングメモリに保存される。これを繰り返す。
前述した図4〜図6によれば、中間項文生成部14(LISPエンジン)と、ルールエンジン(Prologエンジン)とによって、ダブル記号推論エンジンとして機能している。これに加えて、本発明によれば、ダブル記号推論エンジンと、機械学習エンジン(サポートベクタマシン)とからなるハイブリッド推論エンジンとして機能する。
図7は、ルールエンジンから出力されたコマンドを表す説明図である。
図7によれば、ルールエンジン15は、ビジネスメールから推論された会議の日時を、スケジューラに自動的に登録すべきコマンドを出力している。ここでは、ビジネスメールに適したルールセットを用いて推論されている。
ルールエンジン15は、様々な用途のメール文章であっても、カテゴリに応じたルールセットで推論することができる。ルールセットによっては、メール内容によって、相手から見た自分に対する好感度を推論することもできる。また、メール内容から直接的に読み取ることができない情報を推論することもできる。
以上、詳細に説明したように、本発明のプログラム、装置及び方法によれば、様々な用途に対しても、できる限り小さいルール集合を用いて推論することができる推論エンジンを有することができる。
前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
1 端末、推論装置
10 ルールベース
11 前処理部
12 機械学習エンジン
13 ルールセット選択部
14 中間項文生成部
15 ルールエンジン

Claims (11)

  1. 入力された対象データに対する推論結果を出力するようにコンピュータを機能させるプログラムにおいて、
    カテゴリ毎に分類された教師データの群によって、各カテゴリに応じた学習モデルを構築した分類型の機械学習エンジンと、
    カテゴリ毎に異なるルールセットを予め記憶したルールベースと
    を有し、
    前記機械学習エンジンは、対象データを入力し、前記学習モデルを用いてカテゴリを出力し、
    前記機械学習エンジンから出力された当該カテゴリに対応するルールセットを、前記ルールベースから選択するルールセット選択手段と、
    前記対象データを入力し、前記ルールセット選択手段によって選択された当該ルールセットを用いて推論結果を出力するルールエンジンと
    してコンピュータを機能させることを特徴とするプログラム。
  2. 前記機械学習エンジンは、カテゴリ毎の複数のサポートベクタマシンを備えており、
    前記サポートベクタマシンは、
    学習段階として、担当カテゴリに属するか否かと、教師データとを入力して学習モデルを構築し、
    運用段階として、対象データを入力し、前記学習モデルを用いて担当カテゴリに属するか否かを出力する
    ようにコンピュータを機能させることを特徴とする請求項1に記載のプログラム。
  3. 前記対象データ及び前記教師データは、テキストであり、
    前記テキストから形態素の群を出力する前処理手段を更に有し、
    前記対象データの形態素の群は、前記機械学習エンジン及び前記ルールエンジンの両方へ入力され、
    前記教師データの形態素の群は、前記機械学習エンジンへ入力される
    ようにコンピュータを機能させることを特徴とする請求項1又は2に記載のプログラム。
  4. 前記前処理手段からの前記対象データの形態素の群を入力し、異なる目的に応じた複数の中間項文を、前記対象データとして前記ルールエンジンへ出力する中間項文生成手段を更に有し、
    前記ルールエンジンは、複数の中間項文を入力し、選択された前記ルールセットを用いて後向き推論に基づく推論結果を出力する
    ことを特徴とする請求項3に記載のプログラム。
  5. 前記中間項文生成手段は、式指向の手続型の関数プログラミングのLISPに基づくものである
    ことを特徴とする請求項4に記載のプログラム。
  6. 前記対象データ及び前記教師データは、メール文章であり、
    前記カテゴリは、自動配信メールか否か、ビジネスメールか否か、又は、プライベートメールか否かに基づくものである
    ことを特徴とする請求項3に記載のプログラム。
  7. 前記ルールエンジンは、式指向の非手続型の論理プログラミングのPrologに基づくものである
    ことを特徴とする請求項1から6のいずれか1項に記載のプログラム。
  8. 前記対象データ及び前記教師データは、マルチメディアデータであり、
    前記マルチメディアデータに付与されたテキスト要素の群を出力する前処理手段を更に有し、
    前記対象データのテキスト要素の群は、前記機械学習エンジン及び前記ルールエンジンの両方へ入力され、
    前記教師データのテキスト要素の群は、前記機械学習エンジンへ入力される
    ようにコンピュータを機能させることを特徴とする請求項1又は2に記載のプログラム。
  9. 前記対象データ及び前記教師データは、センサ種別及び計測値であり、
    前記対象データのセンサ種別及び計測値の群は、前記機械学習エンジン及び前記ルールエンジンの両方へ入力され、
    前記教師データのセンサ種別及び計測値の群は、前記機械学習エンジンへ入力される
    ようにコンピュータを機能させることを特徴とする請求項1又は2に記載のプログラム。
  10. 入力された対象データに対する推論結果を出力する推論装置において、
    カテゴリ毎に分類された教師データの群によって、各カテゴリに応じた学習モデルを構築した機械学習エンジンと、
    カテゴリ毎に異なるルールセットを予め記憶したルールベースと
    を有し、
    前記機械学習エンジンは、前記対象データを入力し、前記学習モデルを用いてカテゴリを出力し、
    前記機械学習エンジンから出力された当該カテゴリに対応するルールセットを、前記ルールベースから選択するルールセット選択手段と、
    前記対象データを入力し、前記ルールセット選択手段によって選択された当該ルールセットを用いて推論結果を出力するルールエンジンと
    を有することを特徴とする推論装置。
  11. 入力された対象データに対する推論結果を出力する装置の推論方法において、
    前記装置は、
    カテゴリ毎に分類された教師データの群によって、各カテゴリに応じた学習モデルを構築した機械学習エンジンと、
    カテゴリ毎に異なるルールセットを予め記憶したルールベースと
    を有し、
    前記装置は、
    前記機械学習エンジンが、前記対象データを入力し、前記学習モデルを用いてカテゴリを出力する第1のステップと、
    前記機械学習エンジンから出力された当該カテゴリに対応するルールセットを、前記ルールベースから選択する第2のステップと、
    前記対象データを入力し、第2のステップによって選択された当該ルールセットを用いて推論結果を出力する第3のステップと
    を実行することを特徴とする推論方法。

JP2016238031A 2016-12-07 2016-12-07 ルールセットを選択可能な推論エンジンを有するプログラム、装置及び方法 Active JP6224811B1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2016238031A JP6224811B1 (ja) 2016-12-07 2016-12-07 ルールセットを選択可能な推論エンジンを有するプログラム、装置及び方法
US16/464,752 US11443199B2 (en) 2016-12-07 2017-12-06 Program storage medium, apparatus and method provided with ruleset-selectable inference engine
PCT/JP2017/043817 WO2018105656A1 (ja) 2016-12-07 2017-12-06 ルールセットを選択可能な推論エンジンを有するプログラム記録媒体、装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016238031A JP6224811B1 (ja) 2016-12-07 2016-12-07 ルールセットを選択可能な推論エンジンを有するプログラム、装置及び方法

Publications (2)

Publication Number Publication Date
JP6224811B1 JP6224811B1 (ja) 2017-11-01
JP2018097397A true JP2018097397A (ja) 2018-06-21

Family

ID=60206000

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016238031A Active JP6224811B1 (ja) 2016-12-07 2016-12-07 ルールセットを選択可能な推論エンジンを有するプログラム、装置及び方法

Country Status (3)

Country Link
US (1) US11443199B2 (ja)
JP (1) JP6224811B1 (ja)
WO (1) WO2018105656A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020161011A (ja) * 2019-03-28 2020-10-01 キヤノンマーケティングジャパン株式会社 情報処理装置、制御方法、プログラム
JPWO2022003790A1 (ja) * 2020-06-29 2022-01-06

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6720402B2 (ja) * 2017-03-21 2020-07-08 株式会社Preferred Networks サーバ装置、学習済モデル提供プログラム、学習済モデル提供方法及び学習済モデル提供システム
JP6884685B2 (ja) * 2017-12-08 2021-06-09 三菱重工業株式会社 制御装置、無人システム、制御方法及びプログラム
JP6606651B1 (ja) * 2018-06-28 2019-11-20 株式会社ラクロー 労務管理システム
US11159551B2 (en) * 2019-04-19 2021-10-26 Microsoft Technology Licensing, Llc Sensitive data detection in communication data
DE112020006796T5 (de) * 2020-02-26 2022-12-29 Mitsubishi Electric Corporation Inferenzvorrichtung, fahrassistenzvorrichtung, inferenzverfahren und server
CN111882072B (zh) * 2020-07-09 2023-11-14 北京华如科技股份有限公司 一种与规则对弈的智能模型自动化课程训练方法
CN112667413A (zh) * 2020-12-19 2021-04-16 前海飞算科技(深圳)有限公司 业务规则引擎的访问控制方法、系统及可读存储介质
CN114187259A (zh) * 2021-12-10 2022-03-15 北京达佳互联信息技术有限公司 视频质量分析引擎的创建方法、视频质量分析方法及设备
CN114997399A (zh) * 2022-04-25 2022-09-02 北京计算机技术及应用研究所 基于边端数据推理模式下的任务推送方法
JP7350145B1 (ja) 2022-11-25 2023-09-25 Kddi株式会社 情報処理装置、情報処理方法及びプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05204406A (ja) * 1992-01-28 1993-08-13 Hitachi Ltd プロセス制御装置
JP2005258588A (ja) * 2004-03-09 2005-09-22 Denso Corp 推論システム、及びルール群の視覚的表現方法
JP2011113099A (ja) * 2009-11-21 2011-06-09 Kddi R & D Laboratories Inc 未知語を含む文章を修正するための文章修正プログラム、方法及び文章解析サーバ

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5119470A (en) 1990-04-27 1992-06-02 Ibm Corporation Computer based inference engine device and method thereof for integrating backward chaining and forward chaining reasoning
US7668824B2 (en) 2004-03-01 2010-02-23 Denso Corporation Interface device, inferring system, and visual expression method
US20080071714A1 (en) * 2006-08-21 2008-03-20 Motorola, Inc. Method and apparatus for controlling autonomic computing system processes using knowledge-based reasoning mechanisms
JP5126949B2 (ja) 2007-06-07 2013-01-23 国立大学法人東京工業大学 推論装置、推論方法、及びプログラム
US9916538B2 (en) * 2012-09-15 2018-03-13 Z Advanced Computing, Inc. Method and system for feature detection
GB2520987B (en) * 2013-12-06 2016-06-01 Cyberlytic Ltd Using fuzzy logic to assign a risk level profile to a potential cyber threat

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05204406A (ja) * 1992-01-28 1993-08-13 Hitachi Ltd プロセス制御装置
JP2005258588A (ja) * 2004-03-09 2005-09-22 Denso Corp 推論システム、及びルール群の視覚的表現方法
JP2011113099A (ja) * 2009-11-21 2011-06-09 Kddi R & D Laboratories Inc 未知語を含む文章を修正するための文章修正プログラム、方法及び文章解析サーバ

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
久兼 大知 外2名: "「学習者回答判別に対する信頼度分類を用いた事例研修のための助言ルール選択方式」", 電気学会論文誌C, vol. 第135巻,第6号, JPN6017037872, 1 June 2015 (2015-06-01), pages 594 - 601, ISSN: 0003653551 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020161011A (ja) * 2019-03-28 2020-10-01 キヤノンマーケティングジャパン株式会社 情報処理装置、制御方法、プログラム
JP7273293B2 (ja) 2019-03-28 2023-05-15 キヤノンマーケティングジャパン株式会社 情報処理装置、制御方法、プログラム
JPWO2022003790A1 (ja) * 2020-06-29 2022-01-06
JP7452654B2 (ja) 2020-06-29 2024-03-19 日本電気株式会社 情報処理装置、制御方法及びプログラム

Also Published As

Publication number Publication date
US11443199B2 (en) 2022-09-13
WO2018105656A1 (ja) 2018-06-14
US20190385068A1 (en) 2019-12-19
JP6224811B1 (ja) 2017-11-01

Similar Documents

Publication Publication Date Title
JP6224811B1 (ja) ルールセットを選択可能な推論エンジンを有するプログラム、装置及び方法
Sudhir et al. Comparative study of various approaches, applications and classifiers for sentiment analysis
Windiatmoko et al. Developing facebook chatbot based on deep learning using rasa framework for university enquiries
Setyawan et al. Comparison of multinomial naive bayes algorithm and logistic regression for intent classification in chatbot
US11734519B2 (en) Systems and methods for slot relation extraction for machine learning task-oriented dialogue systems
KR20230128492A (ko) 설명 가능 트랜스듀서 변환기
CN110516697B (zh) 基于证据图聚合与推理的声明验证方法及系统
Shah et al. Arabic sentiment analysis and sarcasm detection using probabilistic projections-based variational switch transformer
CN110751188A (zh) 基于多标记学习的用户标签预测方法、系统及存储介质
Singh et al. Deep learning approach for hand drawn emoji identification
Li et al. Nlp-adbench: Nlp anomaly detection benchmark
Asmitha et al. Exploration of automatic spam/ham message classifier using nlp
Yahav From programs to interpretable deep models and back
Zhang et al. Predicting and visualizing consumer sentiments in online social media
US11222177B2 (en) Intelligent augmentation of word representation via character shape embeddings in a neural network
Nayak et al. Feasibility study of machine learning & AI algorithms for classifying software requirements
Sharma et al. Weighted Ensemble LSTM Model with Word Embedding Attention for E-Commerce Product Recommendation
Regi et al. Enhancing Aspect Based Sentiment Analysis Using BERT and Capsule Networks
Kausar et al. Emotion Detection Using Sentiment Analysis
Bushra et al. Recognizing sentimental emotions in text by using Machine Learning
Zapata Recommendation of text properties for short texts with the use of machine learning: A comparative study of state-of-the-art techniques including bert and gpt-2
Battula Cyberbullying (hate Speech and Offensive Language) Detection Using Machine Learning
Jessica et al. A Hybrid Deep Learning Techniques Using BERT and CNN for Toxic Comments Classification
Chawla et al. Counsellor chatbot
Kadiri et al. Detecting Cyberbullying through social media: A Deep Learning Approach

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171003

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171005

R150 Certificate of patent or registration of utility model

Ref document number: 6224811

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250