[go: up one dir, main page]

JP7237878B2 - ドメイン知識活用支援装置、プログラムおよびドメイン知識活用支援方法 - Google Patents

ドメイン知識活用支援装置、プログラムおよびドメイン知識活用支援方法 Download PDF

Info

Publication number
JP7237878B2
JP7237878B2 JP2020049826A JP2020049826A JP7237878B2 JP 7237878 B2 JP7237878 B2 JP 7237878B2 JP 2020049826 A JP2020049826 A JP 2020049826A JP 2020049826 A JP2020049826 A JP 2020049826A JP 7237878 B2 JP7237878 B2 JP 7237878B2
Authority
JP
Japan
Prior art keywords
sentence
domain
words
information database
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020049826A
Other languages
English (en)
Other versions
JP2021149637A (ja
Inventor
一則 和久井
博章 三沢
博基 古川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Industry and Control Solutions Co Ltd
Original Assignee
Hitachi Industry and Control Solutions Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Industry and Control Solutions Co Ltd filed Critical Hitachi Industry and Control Solutions Co Ltd
Priority to JP2020049826A priority Critical patent/JP7237878B2/ja
Publication of JP2021149637A publication Critical patent/JP2021149637A/ja
Application granted granted Critical
Publication of JP7237878B2 publication Critical patent/JP7237878B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

本発明は、ドメイン知識活用支援装置、プログラムおよびドメイン知識活用支援方法に関する。
従来までのテキスト分類やテキスト検索などの自然言語処理では、個々のテキストに含まれる単語(語)に注目している。例えば、特許文献1に記載のテキストを分類する方法では、テキストに含まれる語や語の関係性(語の並び、係り受け)を利用してテキストを分類している。
特表2015-511733号公報
従来技術では、テキスト内の語や語の関係性を利用しているが、テキストに含まれる他の情報を利用しておらず、テキスト分類やテキスト検索などにおいて精度向上の余地を残している。テキスト分類やテキスト検索に限らず、多数のデータを基に機械学習技術を用いた翻訳などを含めた自然言語処理においても同様であり、精度や品質の向上の可能性がある。未利用の情報として、例えば、テキストが係るドメイン(業種)における語のカテゴリがある。
本発明は、このような背景を鑑みてなされたものであり、テキストに含まれるドメインに係る特徴の抽出を可能とするドメイン知識活用支援装置、プログラムおよびドメイン知識活用支援方法を提供することを課題とする。
上記課題を解決するため、本発明に係るドメイン知識活用支援装置は、テキストを文に分割するテキスト分割部と、前記文が係るドメインを判定するドメイン判定部と、語と前記ドメインと当該語の含意とを関連付けて記憶する含意情報データベースを参照して、前記文の述語となる語の含意を抽出する含意抽出部と、ドメイン別に語と当該語のカテゴリとを関連付けて記憶するドメイン別カテゴリ情報データベースを参照して、前記文から語と当該語のカテゴリとを抽出するドメイン情報抽出部と、前記テキストを木に変換する構造化部とを備え、前記木は、根が、前記テキストに対応し、当該根の下位ノードは、当該テキストに含まれる文に対応するとともに、前記含意抽出部が抽出した当該文の含意を示すノードであり、当該文の含意を示すノードの下位ノードは、ドメインのノードであり、当該ドメインのノードの下位ノードは、前記ドメイン情報抽出部が抽出した当該文に含まれる語のカテゴリを示すノードを含むことを特徴とする。
本発明によれば、テキストに含まれるドメインに係る特徴の抽出を可能とするドメイン知識活用支援装置、プログラムおよびドメイン知識活用支援方法を提供することができる。
本実施形態に係るドメイン知識活用支援装置の機能ブロック図である。 本実施形態に係る含意情報データベースのデータ構成を示す図である。 本実施形態に係るドメイン別カテゴリ情報データベースのデータ構成を示す図である。 本実施形態に係る一般情報データベースのデータ構成を示す図である。 本実施形態に係る含意のイメージ変換情報データベースのデータ構成図である。 本実施形態に係るカテゴリのイメージ変換情報データベースのデータ構成図である。 本実施形態に係る品詞のイメージ変換情報データベースのデータ構成図である。 本実施形態を説明するために用いるテキストの例である。 本実施形態に係る含意抽出部、ドメイン情報抽出部、および一般情報抽出部の動作を説明するための図である。 本実施形態に係る構造化部が生成した木である。 本実施形態に係るイメージ化部が生成した画像である。 本実施形態に係るドメイン知識活用支援装置が実行する情報抽出処理のフローチャートである。
以下に、本発明を実施するための形態(実施形態)におけるドメイン知識活用支援装置について説明する。ドメイン知識活用支援装置は、語と含意とが関連付けられた含意情報データベース、ドメイン(業種)別に、語とカテゴリとが関連付けられたドメイン別カテゴリ情報データベース、および、特定のドメインには含まれない一般的な語と品詞とが関連付けられた一般情報データベースを備える。ドメイン知識活用支援装置は、入力されたテキストを文に分割し、文から含意や語、語のカテゴリを抽出する。次に、ドメイン知識活用支援装置は、テキストを、抽出した含意や語、語のカテゴリを含む木(木構造データ)や画像に変換して出力する。
木には、テキストに含まれる文の含意やドメイン別の語のカテゴリが含まれている。語を抽出する従来技術に比べて、より多くの情報を抽出することができる。また、ドメイン知識活用支援装置は、テキストに関連するドメインに応じて語からカテゴリを抽出しており、ドメインに応じて情報を抽出することができるようになる。この抽出した情報を用いることで、テキスト分類やテキスト検索、翻訳などにおける精度や品質が向上する。
≪ドメイン知識活用支援装置の構成≫
図1は、本実施形態に係るドメイン知識活用支援装置100の機能ブロック図である。ドメイン知識活用支援装置100は、制御部110、記憶部120、および入出力部180を含んで構成される。入出力部180は、ディスプレイやキーボード、マウスなどのユーザインタフェースの他、他の装置との通信インタフェースを備える。
記憶部120には、プログラム121、含意情報データベース130(後記する図2参照)、ドメイン別カテゴリ情報データベース140(後記する図3参照)、一般情報データベース150(後記する図4参照)、およびイメージ変換情報データベース160(後記する図5~図7参照)が記憶される。プログラム121は、制御部110が実行する情報抽出処理(後記する図12参照)の手順を含む。
≪ドメイン知識活用支援装置の構成:含意情報データベース≫
図2は、本実施形態に係る含意情報データベース130のデータ構成を示す図である。含意とは、文が含む意味であり、文の述語の意味である。含意情報データベース130は、例えば表形式のデータであって、1つの行(レコード)は含意を示し、含意131、ドメイン132、および語133を含む。
含意131は、文の述語となっている語133のドメイン132における含意である。ドメイン132は、農業、建設業、製造業、小売業などの業種(産業)である。同じ語であっても、文が係るドメインによって含意が異なる場合がある。本実施形態では、文の述語(述部)となる語、および文が係る業種によって文の含意が決まるとする。なお、ドメイン132が「一般」である場合には、含意131は、ドメイン(業種)共通の含意である。
レコード139は、「製造業」に係る文の述語が「原因となる」である場合には、当該文の含意は「要因」であることを示している。
≪ドメイン知識活用支援装置の構成:ドメイン別カテゴリ情報データベース≫
図3は、本実施形態に係るドメイン別カテゴリ情報データベース140のデータ構成を示す図である。図3に示した例は、「製造業」ドメインのドメイン別カテゴリ情報データベース140である。
ドメイン別カテゴリ情報データベース140は、ドメイン(業種)ごとに語のカテゴリ(語の意味の種類)が記憶される。ドメイン別カテゴリ情報データベース140は、例えば表形式のデータであって、1つの行(レコード)は語を示し、語141、カテゴリ142、および関連語143を含む。
語141は、見出しとなる語である。カテゴリ142は、語141のカテゴリである。関連語143は、語141の関連語であり、同じカテゴリ142である。レコード149は、「製造業」のドメインにおいては、「製造現場」は「業態」というカテゴリに属する語(「業態」に係る語)であって、関連する語に「生産現場」、「生産ライン」などがあることを示している。「生産現場」、「生産ライン」も「業態」というカテゴリに属する語である。
≪ドメイン知識活用支援装置の構成:一般情報データベース≫
図4は、本実施形態に係る一般情報データベース150のデータ構成を示す図である。一般情報データベースには、ドメイン固有ではない語が含まれる。一般情報データベース150は、例えば表形式のデータであって、1つの行(レコード)は語を示し、語151、および品詞152を含む。
品詞152は、語151の品詞であって、例えば、動詞や形容詞などである。品詞152には、語151によっては、肯定的(+)か否定的(-)かの属性が付与される。レコード159は、「美味しい」という語は、肯定的な形容詞であることを示している。なお、固有名詞については、人、国、組織、車など何の名前なのかを示す属性が付与されてもよい。また、名詞については、動物、体の部位、抽象概念など何の種別かを示す属性が付与されてもよい。
≪ドメイン知識活用支援装置の構成:イメージ変換情報データベース≫
図5は、本実施形態に係る含意のイメージ変換情報データベース161のデータ構成図である。図6は、本実施形態に係るカテゴリのイメージ変換情報データベース166のデータ構成図である。図7は、本実施形態に係る品詞のイメージ変換情報データベース171のデータ構成図である。イメージ変換情報データベース160(図1参照)には、含意のイメージ変換情報データベース161、カテゴリのイメージ変換情報データベース166、および品詞のイメージ変換情報データベース171が備わる。
含意のイメージ変換情報データベース161は、例えば表形式のデータであって、含意情報データベース130(図2参照)の含意131に対応する含意162に割り当てられた色163が記憶される。
カテゴリのイメージ変換情報データベース166は、例えば表形式のデータであって、ドメイン別カテゴリ情報データベース140(図3参照)のカテゴリ142に対応するカテゴリ167に割り当てられた色168が記憶される。
品詞のイメージ変換情報データベース171は、例えば表形式のデータであって、一般情報データベース150(図4参照)の品詞152に対応する品詞172に割り当てられた色173が記憶される。
≪ドメイン知識活用支援装置の構成:制御部≫
図1に戻って、制御部110はCPU(Central Processing Unit)から構成され、テキスト分割部111、ドメイン判定部112、含意抽出部113、ドメイン情報抽出部114、一般情報抽出部115、構造化部116、およびイメージ化部117を備える。
図8は、本実施形態を説明するために用いるテキスト210の例である。テキスト210は、2つの段落、2つの文から構成される。テキスト210を例に、制御部110に備わる各機能部を説明する。
テキスト分割部111は、入出力部180から入力されたテキストを段落や文に分割する。例えば、テキスト分割部111は、入力されたテキスト210を2つの文に分割する。
ドメイン判定部112は、段落や文のドメイン(業種)を判定する。ドメイン判定部112は、文に含まれる語や語間の係り受けなどから文のドメインを判定する。
含意抽出部113は、文から含意を抽出する。詳しくは、含意抽出部113は、含意情報データベース130(図2参照)のレコードであって、文の述語を語133に含み、ドメイン判定部112が判定した文のドメインをドメイン132とするレコードを特定して、当該レコードの含意131を抽出する。
ドメイン情報抽出部114は、文に含まれる語で、文のドメインに対応するドメイン別カテゴリ情報データベース140に記憶されている語を抽出する。一般情報抽出部115は、文に含まれる語で、一般情報データベース150に記憶されている語(一般語)を抽出する。
図9は、本実施形態に係る含意抽出部113、ドメイン情報抽出部114、および一般情報抽出部115の動作を説明するための図である。文220は、テキスト210(図8参照)の第1文である。
文220の破線の下線が施された語は、含意抽出部113が抽出した語である。文220の実線の下線が施された語は、ドメイン情報抽出部114が抽出した語である。また、文220の点線の下線が施された語は、一般情報抽出部115が抽出した語である。
破線の下線の下に、含意抽出部113が抽出した文の含意を記載している。実線の下線の下に、ドメイン情報抽出部114が抽出した語のカテゴリを記載している。
図1に戻って、構造化部116は、テキスト210を木(木構造データ)に変換する。
図10は、本実施形態に係る構造化部116が生成した木300である。木300の根(ルートとなるノード301)はテキスト210を示す。根の葉(下位ノード)は文であり、木300では含意抽出部113が抽出した文の含意をラベルとするノード311,312である。テキスト210の第1の文220がノード311に対応し、第2の文がノード312に対応する。第1の文220の述語は「提供しています」であり、その含意は「影響」となる(図2参照)。以下では、第1の文220に対応するノード311を根とする木について説明する。
文のノード311の下位ノードは、ドメインのノード321、および一般のノード322である。ドメインのノード321の下位は、ノード311に対応する文からドメイン情報抽出部114が抽出したカテゴリのノード331である。カテゴリのノード331の下位には、当該カテゴリに対応する語(文に含まれる語)のノード341である。一般のノード322の下位となるノードは、一般情報抽出部115が抽出した語(一般語)のノード332である。第2の文のドメインは、第1の文220のドメイン(製造業)とは異なっており、カテゴリも異なっている。
図1に戻って、イメージ化部117は、テキスト210を画像に変換する。
図11は、本実施形態に係るイメージ化部117が生成した画像400である。画像400には、テキスト200の第1の文に対応する領域410と、第2の文に対応する領域450とが含まれる。また、画像400には、テキストに含まれる文の含意に対応する矩形420,460、各文の含まれる語のカテゴリに対応する矩形430,470、および各文に含まれる一般語の品詞に対応する矩形440,480が含まれる。文の含意、語のカテゴリ、および一般語の品詞は、矩形の色で表現される。
文の含意に対応する矩形の色については、イメージ化部117は、含意のイメージ変換情報データベース161(図5参照)を参照して決定する。例えば、「影響」の含意の色は灰であって、図11では、ドットのパターンで示している。
語のカテゴリに対応する矩形の色については、イメージ化部117は、カテゴリのイメージ変換情報データベース166(図6参照)を参照して決定する。例えば、「業種」のカテゴリの色は黄緑であって、図11では、横線のパターンで示している。
一般語の品詞に対応する矩形の色については、イメージ化部117は、品詞のイメージ変換情報データベース171(図7参照)を参照して決定する。例えば、人に相当する名詞のカテゴリの色はオレンジであって、図11では、市松模様のパターンで示している。
≪情報抽出処理≫
図12は、本実施形態に係るドメイン知識活用支援装置100が実行する情報抽出処理のフローチャートである。
ステップS11においてテキスト分割部111は、入出力部180から入力されたテキストを文に分割する。
ステップS12においてドメイン判定部112は、文に係るドメイン(業種)を判定する。
ステップS13において含意抽出部113は、文の述語を抽出し、含意情報データベース130(図2参照)を参照して、文の含意を抽出する。次に、ドメイン情報抽出部114は、ステップS12で判定されたドメインに対応するドメイン別カテゴリ情報データベース140を参照して、文に含まれる語のカテゴリを抽出する。続いて、一般情報抽出部115は、一般情報データベース150を参照して、文に含まれる語の品詞を抽出する。
ステップS14において構造化部116は、テキストを木(図10参照)に変換して出力する。出力先は入出力部180に備わるディスプレイであってもよいし、他の装置に送信してもよい。
ステップS15においてイメージ化部117は、テキストを画像(図11参照)に変換する。出力先は入出力部180に備わるディスプレイであってもよいし、他の装置に送信してもよい。
≪情報抽出処理の特徴≫
ドメイン知識活用支援装置100は、テキストに含まれる文について、ドメインを取得して、含意、語のカテゴリ、および語(一般語)の品詞を抽出する。抽出された情報は、木300(図10参照)および画像400(図11参照)の形式で出力される。
出力された木や画像には、テキストに含まれる語の情報だけではなく、文のドメインによって決まる文の含意や語のカテゴリ、語の属性(肯定的か否か)が含まれている。同じ述語や語であっても、ドメインによって含意やカテゴリが異なり、木や画像には単に含意やカテゴリ、属性の他に、ドメインによる曖昧性も含まれることになる。これらの情報(テキストの特徴)を利用することで、従来技術に見られる語や語の関係性(語の並び、係り受け)を利用したテキスト検索やテキスト分類、翻訳などに比べて、精度や品質の向上が見込まれる。
≪変形例:木≫
木300(図10参照)において、文に対応する含意のノード311の下位ノードは、ドメインのノード321、および一般のノード322である。これに替えて、含意のノード311の下位ノードをカテゴリのノード331としてもよい。
また、文に含まれる語のノード341,332をなくした木としてもよい。語をなくすことで、含まれる情報量は減少するが、木が単純化され見やすくなる。
≪変形例:画像≫
イメージ化部117が生成する画像400(図11参照)は、矩形から構成されているが、楕円や多角形など他の図形であってもよい。また、画像400に含まれる矩形は、含意やカテゴリ、品詞に対応していて、矩形の数と文や語(含意とカテゴリと品詞)は一致しているが、食い違ってもよい。例えば、同じカテゴリや品詞が多数あれば、他より大きい1つの矩形にまとめてもよい。また、含意とカテゴリと品詞(属性が付与された品詞)とは、色で表現しているが、図11に示すように模様(パターン)で示してもよいし、色と模様の組み合わせ、その他の形式で示してもよい。
画像において、語に対応する矩形をなくしてもよい。語をなくすことで、含まれる情報量は減少するが、画像が単純化され見やすくなる。
≪変形例:文と文との関係≫
上記した実施形態では、ドメインに応じた文の含意を抽出している。これに加えて、例えば接続詞に注目して、接続関係抽出部が、文と文との関係(順接、逆接、転換などの接続関係)を抽出して、構造化部116やイメージ化部117が、接続関係を木や画像に含めるようにしてもよい。例えば、木において、テキストに対応するルートのノードとその下位の文に対応するノードとの間に、文と前の文との接続関係を示すノードを設けるようにしてもよい。イメージ変換情報データベース160は、接続関係と接続関係に割り当てられた色との関連を記憶する接続関係のイメージ変換情報データベースを備え、画像400(図11参照)において、文に対応する矩形に隣接して、文と前の文との関係を示す矩形を配置してもよい。
テキストに含まれる文の情報だけではなく、木や画像には文と文との関係まで含まれており、テキスト検索や分類、翻訳おいてさらなる精度や品質の向上が見込める。
≪その他の変形例≫
本実施形態で例示するドメイン知識活用支援装置100の構成は、上記した形態に限られず、同様の効果や機能を奏し得る範囲において、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、含意情報データベース130やドメイン別カテゴリ情報データベース140、一般情報データベース150などは、別の装置に記憶され、ドメイン知識活用支援装置100は、この別の装置にアクセスして情報抽出処理を実行してもよい。
上記した実施形態では、ドメインは業種(産業)としたが、他のドメインであってもよい。例えば、入力されるテキストが技術に関するものであれば、計測、光デバイス、動力機械、熱機器、金属、有機化学、高分子、情報処理、デジタル通信などのドメインであってもよく、入力されるテキストに応じて分類された分野/区分け/類型/ジャンルであってもよい。
以上、本発明のいくつかの実施形態について説明したが、これらの実施形態は、例示に過ぎず、本発明の技術的範囲を限定するものではない。本発明はその他の様々な実施形態を取ることが可能であり、さらに、本発明の要旨を逸脱しない範囲で、省略や置換等種々の変更を行うことができる。これら実施形態やその変形は、本明細書等に記載された発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
100 ドメイン知識活用支援装置
111 テキスト分割部
112 ドメイン判定部
113 含意抽出部
114 ドメイン情報抽出部
115 一般情報抽出部
116 構造化部
117 イメージ化部
120 記憶部
121 プログラム
130 含意情報データベース
140 ドメイン別カテゴリ情報データベース
150 一般情報データベース
160 イメージ変換情報データベース
300 木(木構造データ)
400 画像

Claims (9)

  1. テキストを文に分割するテキスト分割部と、
    前記文が係るドメインを判定するドメイン判定部と、
    語と前記ドメインと当該語の含意とを関連付けて記憶する含意情報データベースを参照して、前記文の述語となる語の含意を抽出する含意抽出部と、
    ドメイン別に語と当該語のカテゴリとを関連付けて記憶するドメイン別カテゴリ情報データベースを参照して、前記文から語と当該語のカテゴリとを抽出するドメイン情報抽出部と、
    前記テキストを木に変換する構造化部とを備え、
    前記木は、
    根が、前記テキストに対応し、
    当該根の下位ノードは、当該テキストに含まれる文に対応するとともに、前記含意抽出部が抽出した当該文の含意を示すノードであり、
    当該文の含意を示すノードの下位ノードは、ドメインのノードであり、
    当該ドメインのノードの下位ノードは、前記ドメイン情報抽出部が抽出した当該文に含まれる語のカテゴリを示すノードを含む
    とを特徴とするドメイン知識活用支援装置。
  2. 前記文に含まれる接続詞を参照して、当該文と当該文の前の文との接続関係を抽出する接続関係抽出部をさらに備え、
    前記構造化部は、
    前記木の根と当該根の下位ノードである前記文の含意を示すノードと間に、当該文と当該文の前の文との接続関係を示すノードを加える
    ことを特徴とする請求項1に記載のドメイン知識活用支援装置。
  3. 語と当該語の品詞とを関連付けて記憶する一般情報データベースを参照して、前記文から前記一般情報データベースに記憶される語を抽出する一般情報抽出部を備え、
    前記木は、
    前記文の含意を示すノードの下位ノードが、前記ドメインのノードに加えて、一般のノードであり、
    当該一般のノードの下位ノードは、前記一般情報抽出部が抽出した語を示すノードを含む
    ことを特徴とする請求項1に記載のドメイン知識活用支援装置。
  4. 前記カテゴリと前記含意との配色を記憶するイメージ変換情報データベースを参照して、前記テキストに含まれる文それぞれについて、前記文の含意を示す色の矩形と、当該矩形の下に横に並んだ、当該文に含まれる語のカテゴリを示す色の矩形とを含む図形を生成し、
    前記テキストに含まれる文それぞれについて生成された前記図形が縦に並んだ画像を生成するイメージ化部を備える
    ことを特徴とする請求項1に記載のドメイン知識活用支援装置。
  5. 前記文に含まれる接続詞を参照して、当該文と当該文の前の文との接続関係を抽出する接続関係抽出部をさらに備え、
    前記イメージ変換情報データベースには、前記接続関係の配色が記憶され、
    前記イメージ化部は、
    前記画像のなかに、前記文の含意を示す色の矩形に隣接して、当該文と当該文の前の文との接続関係を示す色の矩形を配置する
    ことを特徴とする請求項4に記載のドメイン知識活用支援装置。
  6. 語と当該語の品詞とを関連付けて記憶する一般情報データベースを参照して、前記文から前記一般情報データベースに記憶される語を抽出する一般情報抽出部を備え、
    前記イメージ変換情報データベースには、前記品詞の配色が記憶され、
    前記イメージ化部は、
    前記文それぞれについて生成された図形のなかに、前記文に含まれる語のカテゴリを示す色の矩形の下に横に並んだ、前記一般情報抽出部が抽出した当該文に含まれる語の品詞を示す色の矩形を配置する
    ことを特徴とする請求項4に記載のドメイン知識活用支援装置。
  7. 前記一般情報データベースに記憶される品詞にはプラスとマイナスとを含む属性が付与され、
    前記イメージ変換情報データベースには、前記属性が付与された品詞の配色が記憶され、
    前記一般情報抽出部が抽出した前記文に含まれる語の品詞を示す色は、前記属性が付与された品詞の配色の色である
    ことを特徴とする請求項6に記載のドメイン知識活用支援装置。
  8. コンピュータを、請求項1~7の何れか1項に記載のドメイン知識活用支援装置として
    機能させるためのプログラム。
  9. ドメイン知識活用支援装置のドメイン知識活用支援方法であって、
    前記ドメイン知識活用支援装置は、
    語とドメインと当該語の含意とを関連付けて記憶する含意情報データベース、および、
    ドメイン別に語と当該語のカテゴリとを関連付けて記憶するドメイン別カテゴリ情報データベースが記憶される記憶部を備え、
    テキストを文に分割するステップと、
    前記文が係るドメインを判定するステップと、
    前記文の述語となる語の含意を抽出するステップと、
    前記文から語と当該語のカテゴリとを抽出するステップと、
    前記テキストを木に変換するステップとを実行し、
    前記木は、
    根が、前記テキストに対応し、
    当該根の下位ノードは、当該テキストに含まれる文に対応するとともに、抽出された当該文の含意を示すノードであり、
    当該文の含意を示すノードの下位ノードは、ドメインのノードであり、
    当該ドメインのノードの下位ノードは、抽出された当該文に含まれる語のカテゴリを示すノードを含む
    とを特徴とするドメイン知識活用支援方法。
JP2020049826A 2020-03-19 2020-03-19 ドメイン知識活用支援装置、プログラムおよびドメイン知識活用支援方法 Active JP7237878B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020049826A JP7237878B2 (ja) 2020-03-19 2020-03-19 ドメイン知識活用支援装置、プログラムおよびドメイン知識活用支援方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020049826A JP7237878B2 (ja) 2020-03-19 2020-03-19 ドメイン知識活用支援装置、プログラムおよびドメイン知識活用支援方法

Publications (2)

Publication Number Publication Date
JP2021149637A JP2021149637A (ja) 2021-09-27
JP7237878B2 true JP7237878B2 (ja) 2023-03-13

Family

ID=77849258

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020049826A Active JP7237878B2 (ja) 2020-03-19 2020-03-19 ドメイン知識活用支援装置、プログラムおよびドメイン知識活用支援方法

Country Status (1)

Country Link
JP (1) JP7237878B2 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008146150A (ja) 2006-12-06 2008-06-26 Honda Motor Co Ltd 言語理解装置、言語理解方法、及び、コンピュータプログラム
US20190385611A1 (en) 2018-06-18 2019-12-19 Sas Institute Inc. System for determining user intent from text

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008146150A (ja) 2006-12-06 2008-06-26 Honda Motor Co Ltd 言語理解装置、言語理解方法、及び、コンピュータプログラム
US20190385611A1 (en) 2018-06-18 2019-12-19 Sas Institute Inc. System for determining user intent from text

Also Published As

Publication number Publication date
JP2021149637A (ja) 2021-09-27

Similar Documents

Publication Publication Date Title
WO2018207723A1 (ja) 要約生成装置、要約生成方法及びコンピュータプログラム
Dellert et al. NorthEuraLex: A wide-coverage lexical database of Northern Eurasia
US7840891B1 (en) Method and system for content extraction from forms
US7885807B2 (en) Text analysis, transliteration and translation method and apparatus for hieroglypic, hieratic, and demotic texts from ancient Egyptian
US20140351228A1 (en) Dialog system, redundant message removal method and redundant message removal program
List et al. Using phylogenetic networks to model Chinese dialect history
Beermann et al. TypeCraft collaborative databasing and resource sharing for linguists
KR20100038378A (ko) 지능적인 텍스트 주석을 위한 방법, 시스템 및 컴퓨터 프로그램
JP2021064143A (ja) 文作成装置、文作成方法および文作成プログラム
JP2013250925A (ja) 回答タイプ推定装置、方法、及びプログラム
Medrano Khipu transcription typologies: A corpus-based study of the Textos Andinos
Villa et al. Conversational agent development through large language models: Approach with gpt
CN112182204A (zh) 构建中文命名实体标注的语料库的方法、装置
Gillis-Webber et al. The shortcomings of language tags for linked data when modeling lesser-known languages
JPWO2016067396A1 (ja) 文の並び替え方法および計算機
JP7237878B2 (ja) ドメイン知識活用支援装置、プログラムおよびドメイン知識活用支援方法
Léon et al. SILKNOW. Designing a thesaurus about historical silk for small and medium-sized textile museums
WO2010103916A1 (ja) 文書の特徴語提示装置及び特徴語の優先度付与プログラム
JP5877775B2 (ja) コンテンツ管理装置、コンテンツ管理システム、コンテンツ管理方法、プログラム、及び記憶媒体
JP5085584B2 (ja) 記事特徴語抽出装置、記事特徴語抽出方法及びプログラム
Chatzipanagiotou et al. Automated recognition of geographical named entities in titles of Ukiyo-e prints
Mahato et al. Heuristic algorithm for resolving pronominal anaphora in Hindi dialects
Cappelle et al. Taking a look at the support verb construction V a look: A demonstration of methodology
CN114722827B (zh) 任务处理模型的模型训练方法、装置、设备及存储介质
Melinamath Handling of Auxiliaries in Kannada Morphology

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220114

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221012

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221216

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230214

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230301

R150 Certificate of patent or registration of utility model

Ref document number: 7237878

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150