JP2008204133A - 回答検索装置及びコンピュータプログラム - Google Patents
回答検索装置及びコンピュータプログラム Download PDFInfo
- Publication number
- JP2008204133A JP2008204133A JP2007038932A JP2007038932A JP2008204133A JP 2008204133 A JP2008204133 A JP 2008204133A JP 2007038932 A JP2007038932 A JP 2007038932A JP 2007038932 A JP2007038932 A JP 2007038932A JP 2008204133 A JP2008204133 A JP 2008204133A
- Authority
- JP
- Japan
- Prior art keywords
- case
- case frame
- search
- nouns
- question
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004590 computer program Methods 0.000 title claims description 12
- 238000000034 method Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 8
- 230000014509 gene expression Effects 0.000 description 8
- 239000002245 particle Substances 0.000 description 3
- 239000000470 constituent Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】質問に対しその周辺の概念を用いて回答する回答検索装置を提供する。
【解決手段】回答検索装置44は、用言と名詞概念との意味的関係を記述した格フレームレコードを含む格フレーム辞書群40と、質問受付処理部100と、質問中の単語を主格とするレコードを格フレーム辞書群40内で検索する一致格フレーム検索部102と、検索されたレコード内の用言と、目的格となる名詞との組合せのうち、出現頻度が最も高いものを選択する格フレーム選択処理部108と、選択された組合せをもつレコードを格フレーム辞書群40内からユーザに合わせて選択された格フレーム辞書内において検索する類似格フレーム検索処理部110と、検索されたレコードに含まれる主格の名詞のうち、出現頻度の最も高いものを選択する単語選択処理部116と、選択された名詞を用いて質問に対する回答を生成する出力作成処理部120とを含む。
【選択図】 図4
【解決手段】回答検索装置44は、用言と名詞概念との意味的関係を記述した格フレームレコードを含む格フレーム辞書群40と、質問受付処理部100と、質問中の単語を主格とするレコードを格フレーム辞書群40内で検索する一致格フレーム検索部102と、検索されたレコード内の用言と、目的格となる名詞との組合せのうち、出現頻度が最も高いものを選択する格フレーム選択処理部108と、選択された組合せをもつレコードを格フレーム辞書群40内からユーザに合わせて選択された格フレーム辞書内において検索する類似格フレーム検索処理部110と、検索されたレコードに含まれる主格の名詞のうち、出現頻度の最も高いものを選択する単語選択処理部116と、選択された名詞を用いて質問に対する回答を生成する出力作成処理部120とを含む。
【選択図】 図4
Description
この発明は、ユーザによる質問に対する回答を検索する装置に関し、特に、簡単な質問に対し、ユーザにとって分かりやすい適切な回答を検索するための回答検索装置に関する。
コンピュータが提供する機能の1つに、多量のデータの中から望みのデータを検索するという検索機能がある。典型的な検索システムは、1個または複数個のキーワードを入力し、そのキーワードのすべて、またはいずれかを含む文書を検索し、表示する、というものである。しかしこのようなシステムでは、質問者の意図とは別に単純にキーワードが含まれているか否かによって文書を検索しているため、ユーザの望むような文書を的確に選択することができないという問題がある。
こうした問題を解決するための1つの手段として、自然言語による質問文を入力し、言語解析を行なって解析結果に基づき文書を検索するという方法がある。しかしこのような方法でも、基本的にはある単語が文書内に含まれているか否かによって文書を検索するため、キーワードを用いるときと同様の問題が生じている。
さらに、ある概念に対し複数個の読み方が存在することを考慮し、入力されたキーワードに対しシソーラスを用いた同義語の検索を行ない、その結果を用いて文書を検索するという方法もある。しかしこの場合、検索される文書の数がさらに多くなってしまい、的確な文書を提示することができないという問題がある。
こうした問題を解決するための1つの方法が、後掲の特許文献1に開示されている。特許文献1に開示のシステムでは、入力質問に基づいて検索処理を実行し、その結果に基づいて初期回答候補を抽出する。抽出された回答候補をキーワードとしたクエリを行なうことによって回答候補ごとに関連する文書を検索する。関連する文書に含まれる文の構成語が、入力質問の構成語の語彙意味と同様の語彙意味を有するか否かを判定し、同様の語彙意味を有すると判定された回答候補を、入力質問に対する回答として選択する。
特開2006−293830号公報
しかし、上記した特許文献1に開示されたシステムでは、単に入力質問に対する解説として適切と思われる文が選択されるに留まり、入力された質問をいかに利用者にとってわかりやすく提示するか、という視点からの解決は行なわれていない。また、質問の中には、入力された質問に対する解説ではなく、その質問に対する周辺の話題を求めようとするものもある。特許文献1に開示のシステムでは、そのような質問に答えることはできない。
すなわち、ある種の質問に関しては、その質問そのものに対する解説よりも、意味的及び概念的にその質問を中心とする周辺の概念を提示したり、そのような概念または事物を説明したりすることのほうが重要である場合がある。従来技術では、そのような視点からの回答検索が行なわれていなかった。
それゆえにこの発明の目的は、単に質問そのものに対する解説を提供するわけではなく、その質問を中心とする周辺の概念を用いて質問に回答することが可能な回答検索装置を提供することである。
本発明の第1の局面に係る回答検索装置は、用言と、当該用言に意味的に接続可能な名詞概念と、それらの間の格関係とを記述した格フレームレコードを多数含む第1及び第2の格フレーム辞書を記憶するための第1の記憶手段と、名詞からなる質問の入力を受けるための質問入力手段と、質問入力手段により入力された単語を主格とする格フレームレコードを第1の記憶手段に記憶された第1の格フレーム辞書内で検索するための第1の検索手段と、第1の検索手段により検索された格フレームレコードの用言と、もしあれば当該用言に対する目的格となる名詞との組合せのうち、第1の検索手段により検索された格フレームレコードのうちで出現頻度が最も高いものを選択するための第1の選択手段と、第1の選択手段により選択された用言と名詞との組合せをもつ格フレームレコードを第1の記憶手段内に記憶された第2の格フレーム辞書内において検索するための第2の検索手段と、第2の検索手段により検索された格フレームレコードに含まれる主格の名詞のうち、出現頻度の最も高い所定個数を選択するための第2の選択手段と、第2の選択手段により選択された所定個数の主格の名詞を用いて質問に対する回答を生成し出力するための回答出力手段とを含む。
この回答検索装置においては、質問入力手段が質問の入力を受けると、第1の検索手段が、その質問に含まれる単語を主格とする格フレームレコードを第1の格フレーム辞書の中で検索する。第1の選択手段が、検索された格フレームレコードに含まれる用言と、(もしあれば)その目的格となる名詞との組合せのうち、検索された中で最も頻度が高いものを選択する。第2の検索手段が、この組合せを用言と目的語との組合せとして持つ格フレームレコードを第2の格フレーム辞書の中で検索する。検索された格フレームレコードの中で主格となっている名詞のうち、出現頻度が最も高い所定個数の名詞が、第2の選択手段により選択される。回答出力手段は、この所定個数の主格の名詞を用いて、質問に対する回答を生成し出力する。
入力された質問に対して、その質問に含まれる名詞を含む文書を直接に検索して回答とするのではなく、その名詞と関連してよく出現する用言及び(もしあれば)その目的格となる名詞との組合せを格フレーム辞書で検索し、その中で頻度が最も高い組合せを用いて逆に第2の格フレーム辞書においてその組合せを持つ格フレームレコードを検索する。こうして検索された格フレームレコードのうちの主格となる名詞について、最も頻度が高い所定個数の名詞が最終的に選択され、回答の生成に使用される。用言及びその目的格となる名詞を媒介として、質問中の単語と関連が高い名詞が検索され回答に使用されるので、質問に対する直接の回答ではなく、別の側面からの回答を作成することができる。すなわち、利用者の質問に対して多様な回答が得られる。その結果、質問を中心とする周辺の概念を用いて質問に回答することが可能な回答検索装置を提供することができる。
好ましくは、第1の記憶手段は、それぞれ対象読者領域の異なった文書から得られた複数個の領域別格フレーム辞書を記憶し、回答検索装置はさらに、質問を入力するユーザのプロフィールに基づき、複数個の領域別格フレーム辞書のうちで当該プロフィールが合致する対象読者領域の文書から得られた領域別格フレーム辞書を第2の格フレーム辞書として選択するための手段とを含む。
第2の格フレーム辞書として、ユーザプロフィールに合致する対象読者領域の文書から得られた領域別格フレーム辞書を用いる。そのため、回答としてユーザに提示される単語は、ユーザにとってなじみがあるものとなり、より分かりやすい回答を生成できる。
好ましくは、第2の選択手段は、第2の検索手段により検索された格フレームレコードに含まれる主格の名詞のうち、出現頻度の最も高い1つの名詞を選択するための手段を含み、回答出力手段は、質問に含まれる名詞と、第2の選択手段により選択される1つの名詞とを用い、質問に含まれる名詞を、1つの名詞を用いた比喩によって説明する回答を生成し出力するための手段を含む。
質問に含まれる単語に対し、その単語と関連して使用される頻度の高い用言及び目的格の名詞の組合せが第1の格フレーム辞書から求められ、その組合せを媒介として、同様にその組合せとともに主格として用いられる頻度が高い別の名詞が第2の格フレーム辞書から選択される。選択された名詞は、質問中の単語と意味的に特に関連があると考えられ、質問中の単語を、関連の深い別の単語によって言換えることができる。この際、単語の言換えを比喩とし、それを回答とすることで、ユーザにとってより理解しやすい形での回答を生成できる。
第2の選択手段は、第2の検索手段により検索された格フレームレコードに含まれる主格の名詞のうち、出現頻度の最も高いものから複数個の名詞を選択するための手段を含み、回答出力手段は、質問に含まれる名詞と、複数個の名詞とを用い、質問に含まれる名詞に対する代替候補として示す回答を生成し出力するための手段を含むようにしてもよい。
入力された質問中の単語と同時に使用される頻度の高い用言・目的格の名詞が求められ、それらとともに主格として使用される頻度の高い複数個の名詞が求められる。これらはいずれも質問中の単語に対し意味的に深い関連があると考えられ、これらを複数個ユーザに提示することにより、ユーザにとっては質問に含まれる名詞に対する選択肢が与えられることになる。これらの中からユーザの望むものを選択することが可能になり、ユーザにとって有益な回答を提供することができる。
好ましくは、回答検索装置は、用言及び名詞に対する類義語を含むシソーラスを記憶するための第2の記憶手段と、第1の選択手段により選択された組合せに含まれる用言に対する類義語、及び当該用言に対する目的格となる名詞の類義語を、シソーラスにより検索するための類義語検索手段と、類義語検索手段により検索された用言に対する類義語と、名詞の類義語との組合せの各々について、当該組合せを持つ格フレームレコードを第1の記憶手段内に記憶された第2の格フレーム辞書内において検索するための第3の検索手段とをさらに含み、第2の選択手段は、第2の検索手段及び第3の検索手段により検索された格フレームレコードに含まれる主格の名詞のうち、出現頻度の最も高い所定個数を選択するための頻度順選択手段を含む。
質問中の名詞を主格として用いられることが多い用言及び目的格の名詞の組合せだけでなく、それらの類義語の組合せについても、それらとともに主格として用いられる頻度の高い名詞を第2の格フレーム辞書から検索できる。検索される名詞の候補の範囲がより広くなり、より適切な回答が得られる可能性が高くなる。
さらに好ましくは、頻度順選択手段は、第2の検索手段及び第3の検索手段により検索された格フレームレコードに含まれる主格の名詞のうち、第2の検索手段により検索されたものの出現頻度に対し、第3の検索手段により検索されたものの出現頻度を相対的に小さく換算して各主格の名詞の出現頻度の和を算出し、出現頻度の最も高い所定個数の主格の名詞を選択するための手段を含む。
類義語を含む組合せは、質問に対しある関係を有するものの、元の組合せよりは質問に対する関係が薄くなると考えられる。従って、類義語を含む組合せに対して検索される名詞の頻度には、元の組合せよりも小さな重みを付与することが、質問に対する回答を探す際には合理的である。このような重みを用いることにより、検索範囲を広げて候補となる名詞の数を増大させながら、重要な名詞が他のあまり重要でない名詞に埋もれて検索結果から漏れてしまう可能性を小さくすることができる。その結果、質問に対し適切な回答を与えることができる回答検索装置を提供できる。
本発明の第2の局面に係るコンピュータプログラムは、コンピュータにより実行されると、当該コンピュータを、上記したいずれかの回答検索手段の各手段として機能させるコンピュータプログラムである。
このコンピュータプログラムをコンピュータにより実行させることにより、当該コンピュータは、上記したいずれかの回答検索装置の各手段として機能する。その結果、そのコンピュータにより、上記した回答検索装置と同様の効果を得ることができる。
[第1の実施の形態]
図1は、本発明の第1の実施の形態に係る回答検索装置である、比喩による語句解説システム30の概略構成を示すブロック図である。図1を参照して、このシステム30は、用言と、その用言と関連する名詞との関係を示す格フレームと呼ばれる構造を多数記憶するデータベースである格フレーム辞書を複数個含む格フレーム辞書群40と、日本語単語につき、類義語を階層的にまとめたシソーラス42と、利用者が質問を入力したり、システム30からの回答が表示されたりする入出力装置46と、入出力装置46から与えられる質問に対し、格フレーム辞書群40及びシソーラス42を用い、その質問に対して比喩による語句解説を生成し、入出力装置46を介して質問者に提示するための比喩による語句解説装置44とを含む。
図1は、本発明の第1の実施の形態に係る回答検索装置である、比喩による語句解説システム30の概略構成を示すブロック図である。図1を参照して、このシステム30は、用言と、その用言と関連する名詞との関係を示す格フレームと呼ばれる構造を多数記憶するデータベースである格フレーム辞書を複数個含む格フレーム辞書群40と、日本語単語につき、類義語を階層的にまとめたシソーラス42と、利用者が質問を入力したり、システム30からの回答が表示されたりする入出力装置46と、入出力装置46から与えられる質問に対し、格フレーム辞書群40及びシソーラス42を用い、その質問に対して比喩による語句解説を生成し、入出力装置46を介して質問者に提示するための比喩による語句解説装置44とを含む。
「格フレーム」とは、自然言語処理の分野において、動詞、形容詞、及び形容動詞等の用言の意味的構造を表現する際に使用されるものである(「岩波情報科学辞典」(長尾等編集、岩波書店、1990年発行)の第109頁参照)。「格フレーム」はいくつかの「格スロット」を持ち、「格スロット」は行為者格(主格)、対象格(目的格)、及び場所格等の内容を表す。
本実施の形態では、図1に示すように、質問画面50は、入力単語を入れる入力フィールド60と、比喩による語句解説装置44に対しこの単語を質問として与えるためにユーザが操作する質問ボタン62とを含む。入力フィールド60に質問となる単語を入力し、質問ボタン62を押すことにより、入力フィールド60に入力された単語が質問として比喩による語句解説装置44に与えられる。語句解説装置44は、この単語に対し、格フレーム辞書群40及びシソーラス42を用いて比喩による語句解説を生成し、入出力装置46に与える。
入出力装置46に表示される比喩による語句解説画面52は、解説が表示されるフィールド70と、次の質問を行なうためにユーザが操作する質問ボタン72とを含む。質問ボタン72を押すと、画面は質問画面50に遷移する。
格フレーム辞書群40は複数の格フレームレコードを含むテーブルからなるデータベースである。「格フレームレコード」とは、格フレーム辞書を構成するデータベースのテーブル中の一つの単位のことをいう。本実施の形態における格フレームレコードの構成については後述する。格フレームレコードの各々は、一般的に、用言と、その用言に関連する名詞との間の関係構造を示す。図2を参照して、たとえば動詞「代表する」は、1つの例として主格に「大統領」を取り、目的格に「国」を取る。日本語の場合にはさらに、それぞれ主格及び目的格を表わす助詞「は」及び「を」が付される。同様に「治める」という動詞も、主格として「大統領」を、目的格として「国」をそれぞれ取ることができる。格フレーム辞書群40の格フレームレコードには、このように1つの動詞と、用例から得られたその動詞に対する主格の名詞及びもしあれば目的格の名詞が1つの組となって格納される。一般的には、1つの動詞に対し、このような格フレームレコードが格フレーム辞書に多数格納されている。
動詞だけではなく、形容詞、または形容動詞に対しても格フレーム辞書を作成することができる。たとえば形容詞「渋い」に対し、意味上の主格として「銀閣寺」及び「縁側」を考えることができる。実際に「銀閣寺は渋い」及び「縁側は渋い」という用例が、格フレーム辞書を作成するときの知識源の中に存在していたならば、格フレーム辞書の中にはこうした格フレームの見出しも格納されることになる。形容動詞についても同様である。
また、目的格を持たない格フレーム構造もあり得る。たとえば「ほっこりする」、及び「渋い」という語は、その意味からいって、図2に示すように、「銀閣寺」及び「縁側」の双方ともその主格として取り得る。この場合、図2に示されるようにこの2つの用例に対応する格構造が格フレーム辞書に格納されることになる。
図2の下段を参照して、本実施の形態における格フレーム辞書の格フレームレコード80は、見出しとなる用言(「代表する」)と、品詞ラベル(たとえば「動詞」)と、品詞に特有のデータ構造とを含む。品詞に特有のデータ構造とは、動詞、形容詞及び形容動詞のそれぞれによって取り得る格フレーム構造が異なるため、予めそれぞれの品詞に応じて別々に定義されたデータ構造をいう。たとえば動詞のときには、主語と目的語を取るものであれば、第1の関連語(たとえば「大統領」)と、その格ラベル(たとえば「主格」)と、その品詞(たとえば「名詞」)と、その単語に付される助詞(たとえば「は」)と、第2の関連語(たとえば「国」)と、その格ラベル(たとえば「目的格」)と、その品詞(たとえば「名詞」)と、助詞(たとえば「を」)とを含む。
形容詞及び形容動詞のときも同様にこうしたデータ構造を考えることができる。ただし形容詞及び形容動詞の場合は動詞と比較してさらに簡単な構造となる。
本実施の形態では、格フレーム辞書群40として、複数の格フレーム辞書が準備される。それら格フレーム辞書はそれぞれ、たとえば技術分野、質問者の年齢層、職業などに応じて適切な分野の知識源から作成されたものである。たとえば対象知識層が小学生である場合は、小学校で使用される教科書に出てくる文から用例を収集し、格フレーム辞書を作成すればよい。同様にある技術分野については、その技術分野の論文集などから用例を収集し、格フレーム辞書を作成すればよい。
格フレーム辞書の構造としては種々あり得るが、本実施の形態では、図2に示されるように、用言と、その用言に関連する名詞との間の文構造上の関係がわかるような形式であり、かつ元の用例が復元できるような形でのデータ構造を持てばよい。
図3に、格フレーム辞書群40に含まれるある格フレーム辞書90の内容につき、その見出しを構成する用言と、その用言に対応する用例との組がどのような形式で蓄積されているかを例示する。図3を参照して、たとえば第1の用言V1に関するレコードは、「X1はN1をV1する」という形の用例から得られたものであり、図2の格フレームレコード80に示されるものと同様の構造を持っている。用言V2も同様である。用言V1と用言V2とは、互いに一致することもあり得る。
図4に、図1に示す比喩による語句解説装置44の詳細な構成をブロック図形式で示す。図4を参照して、語句解説装置44は、入出力装置46からの質問者の質問(単語)を受付けるための質問受付処理部100と、質問受付処理部100が受付けた質問単語と一致する単語を主格として持つエントリを格フレーム辞書群40の中から検索するための一致格フレーム検索部102と、一致格フレーム検索部102によって検索された格フレームの見出しを蓄積するための一致格フレーム蓄積部104とを含む。本実施の形態では、一致格フレーム検索部102は、予め入力されているユーザのプロフィールに基づき、格フレーム辞書群40の中から、ユーザプロフィールに合致した適切な格フレーム辞書を選択して検索に用いるものとする。
ここで「ユーザプロフィールに合致する格フレーム辞書」とは、ユーザプロフィール内の項目を基準としてユーザを複数のカテゴリに分類したときに、そのカテゴリに対して適切であるとして予め割当てられた格フレーム辞書のことをいう。例えば、ユーザを年齢又は学年で分類することができる。この場合には、その年齢又は学年の児童、生徒又は学生向けの文書から作成した格フレーム辞書を準備し、ユーザプロフィール内の年齢又は学年の項目の値に従って適切な格フレーム辞書を選択できる。ユーザをその職業で分類するときには、専門分野別の文書から作成した格フレーム辞書を準備しておき、ユーザの職業に応じて適切なものを選択できる。さらに、ユーザプロフィールの複数の項目に従って、ユーザを分類することもできる。その場合には、その複数の項目に従って予め文書を分類したものから格フレーム辞書を作成しておき、それらの中から、ユーザプロフィールの上記複数の項目の値の組合せに応じて適切なものを選択できる。
「比喩」とは、あるものごとを説明するときに、そのものごとと共通する性質を有する別のものごとを借りて表現することをいう。特に、身近でないものごとを説明するときに、身近なものごとを用いた比喩で表現すると、聞く人によって理解しやすいといわれている。
語句解説装置44はさらに、一致格フレーム蓄積部104に蓄積された格フレームレコードの中で、主格の部分を除き一致するレコードの出現頻度を算出するための頻度算出処理部106と、一致格フレーム蓄積部104に蓄積されたレコードのうちで、頻度算出処理部106により算出された頻度が最も高いものを選択し、出力するための格フレーム選択処理部108とを含む。
語句解説装置44はさらに、格フレーム選択処理部108により選択された格フレームレコードに含まれる用言及び目的格と一致する用言及び目的格を持つ格フレームレコードと、それら用言及び目的格の名詞の同義語をそれぞれ用言及び目的格として持つレコードを、格フレーム辞書群40から検索し、出力するための類似格フレーム検索処理部110と、類似格フレーム検索処理部110により検索されたレコードに含まれる主格の単語を蓄積するための主格単語蓄積部112と、主格単語蓄積部112により蓄積された主格の単語の出現頻度を算出するための頻度算出処理部114と、主格単語蓄積部112に蓄積された単語のうち、頻度算出処理部114により算出された頻度が最も高い単語を選択し出力するための単語選択処理部116とを含む。なお類似格フレーム検索処理部110は、用言及び目的格の単語の類義語をシソーラス42から得る。
語句解説装置44はさらに、比喩による解説の際に用いられる定型表現を記憶するための定型表現記憶部118と、単語選択処理部116により選択された単語、質問受付処理部100によって質問者から受付けた質問単語、及び格フレーム選択処理部108により選択された格フレームレコードに基づき、質問単語に対する比喩を用いた解説を生成し、入出力部46(図1参照)に出力するための出力作成処理部120とを含む。
図5に、「大統領」(って何ですか?)という質問を例として、語句解説装置40によりどのようなレコードが検索され、どのようにして比喩が生成されるかを概略的に示す。図5を参照して、「大統領」という単語が入力されると、一致格フレーム検索部102は格フレーム辞書群40のうち、ユーザプロフィールに従って選択された格フレーム辞書から、入力された質問単語と一致する名詞を主格に有する格フレームレコードを検索する(処理132)。この検索処理132により検索された格フレームレコードの例を図5のブロック134に示す。続いてこれら格フレームレコードのうち、用言及び目的語が一致するものの各々につき、その出現頻度を算出し、最も出現頻度の高いものを選択する処理136が行なわれる。ここでは「(大統領は)国を治める」という用言及び目的格の名詞の組合せが選択されたものとする。
続いて図4に示す類似格フレーム検索処理部110により、選択された格フレームレコードの用言及び目的格の名詞の組合せと同じ用言及び目的格の名詞の組合せを有する格フレームレコードを格フレーム辞書から検索する処理139が実行される。この処理により検索された格フレームレコードの例をブロック140に示す。同様にして類似格フレーム検索処理部110は、シソーラス42を用いることにより、格フレーム選択処理部108により選択された格フレームレコード138の用言及び目的格の名詞の各々につき、類義語を求め、それら類義語を用言及びその目的格の名詞として持つ格フレームレコードを格フレーム辞書から検索する処理144を実行する。この結果得られた格フレームレコード群をブロック146に示す。
ブロック140に示される格フレームレコード群と、ブロック146に示される格フレームレコード群とは、図4に示す主格単語蓄積部112にそれぞれ区別されて蓄積されている。
続いて頻度算出処理部114が、ブロック140及びブロック146に示される格フレームレコードにつき、主格の単語の出現頻度を算出する(処理148)。このとき、ブロック140に出現する単語については重み=1とし、ブロック146に出現する主格単語については重み=0.7として頻度計算を行なう。
単語選択処理部116は、このようにして重み付きで行なわれた頻度計算の結果、最も頻度が高い主格単語150を選択し、出力作成処理部120に出力する。この例の場合、「王様」という単語150がこの処理の結果選択されたものとする。
出力作成処理部120は、定型表現記憶部118に記憶されている、定型表現152のうち、主語を表わす部分の空白部154に質問文として入力された単語(例えば「大統領」)を挿入する。さらに、空白部158に単語選択処理部116によって選択された単語150(例えば「王様」)を、空白部156に格フレーム選択処理部108によって選択された格フレームレコードの用言及び目的格の名詞の組合せからなる表現(例えば「国を治める」)をそれぞれ挿入し、図1に示す出力画面50を作成して入出力装置46に与える。
この結果、たとえば「大統領って何ですか?」という質問を入力した質問者は、「大統領は国を治めるという意味で王様のようなものだよ」という、比喩による解説を得ることができる。この例では、質問者が小学生であることを想定したため、類似格フレーム検索処理部110において検索に用いる格フレーム辞書は、格フレーム辞書群40の中から、ユーザプロフィールに従って選択した小学生向けの辞書を用いる。こうすることにより、ユーザプロフィールに応じた形で、ユーザにとって理解のしやすい単語を用いた比喩で、質問に対する回答を生成することができる。
後述するように、本実施の形態に係る語句解説装置44は、コンピュータハードウェアと、このコンピュータハードウェア上で実行されるコンピュータプログラムとにより実現することができる。コンピュータハードウェアについては後述することとして、図6に、この実施の形態に係る語句解説装置44を実現するためのコンピュータプログラムの制御構造をフローチャート形式で示す。
図6を参照してこのプログラムは、図1に示す質問画面50においてユーザが入力フィールド60に単語を入力し、質問ボタン62を押すことにより起動される。この際、入力フィールド60に入力された単語がこのプログラムに引数として渡される。
このプログラムは、予め記録されているユーザプロフィールから、格フレーム辞書群40の中のどの格フレーム辞書を使用するかを決定するステップ180と、入力された質問単語を主格に持つ動詞を全格フレーム辞書の中で検索するステップ182と、ステップ182で検索された格フレームレコードのうち、同じ用言と同じ目的格の名詞とを持つ格フレームレコードの出現頻度を算出するステップ184と、ステップ184で算出された頻度のうち、最高の頻度を有する格フレームレコードを選択し、記憶するステップ186とを含む。
このプログラムはさらに、ステップ186で検索された格フレームレコードの用言及び目的語と同じ用言及び目的語を含む格フレームレコードを、ユーザプロフィールに合致するように選択した格フレーム辞書の中から検索するステップ187と、ステップ186で選択された格フレームレコードの用言の類義語をシソーラス42から検索するステップ188と、ステップ186で選択された格フレームレコードの目的語である名詞の類義語をシソーラス42から検索するステップ190と、ステップ188及びステップ190で検索された用言及び目的語の類義語の組合せを持つ格フレームレコードを、ステップ180でユーザプロフィールに合致するように選択した格フレーム辞書の中から検索し、その主格の単語を含めて蓄積するステップ192とを含む。
このプログラムはさらに、ステップ192で蓄積された格フレームレコードに出現する主格である単語ごとに、その出現頻度を算出するステップ194を含む。このステップ194ではステップ187で検索された格フレームレコードについては重みを1とし、ステップ192で検索された格フレームレコードについては重みを0.7として頻度を求め、それらの和を算出する。
このプログラムはさらに、ステップ194で算出された頻度が最も高い主格の単語である名詞を選択するステップ196と、ステップ196で選択された単語と、このプログラムの起動時に引数として渡された質問単語と、ステップ186で選択された格フレームレコードの用言及び目的格の名詞とを用い、予め格納されている定型表現にこれら単語を挿入することにより比喩による解説を作成するステップ198と、ステップ198で作成された解説文を入出力装置46に出力するステップ200とを含む。ステップ200が終了するとこのプログラムは終了する。
図6に示すような制御構造を有するプログラムをコンピュータハードウェアで実行することにより、この第1の実施の形態に係る語句解説装置44を実現することができる。
[第2の実施の形態]
図7は、本発明の第2の実施の形態に係る回答検索装置である観光施設推薦システム230の概略のブロック図である。図7を参照して、この観光施設推薦システム230は、第1の実施の形態で用いたものと同様の格フレーム辞書群40と、シソーラス42と、第1の実施の形態で用いられた語句解説装置44とよく似た構成を有する観光施設推薦装置244と、観光施設推薦装置244に接続された入出力装置46とを含む。
図7は、本発明の第2の実施の形態に係る回答検索装置である観光施設推薦システム230の概略のブロック図である。図7を参照して、この観光施設推薦システム230は、第1の実施の形態で用いたものと同様の格フレーム辞書群40と、シソーラス42と、第1の実施の形態で用いられた語句解説装置44とよく似た構成を有する観光施設推薦装置244と、観光施設推薦装置244に接続された入出力装置46とを含む。
図7を参照して、この観光施設推薦システム230は、利用者が何らかの語句を入力して、その語句と関連した施設、または類似した施設を推薦するためのものである。図7に示すように、このシステム230における入力画面250は、施設名を入力する入力フィールド260と、ユーザが施設を推薦してもらうときにクリックする推薦ボタン262とを含む。入力画面250には、予め「どんなところに行きたいですか。」という文が表示されており、この文に続いて入力フィールド260が設けられている。入力フィールド260の後には「のようなところ」という語句が表示されるため、入力フィールド260には、何らかの場所または施設の名前を入力するものであることがユーザに容易にわかる。
図7に示されるように、このシステム230の出力画面252は推薦する行き先を列挙するフィールド270と、別の施設を挙げて類似の施設の推薦を受けるためにユーザが操作するボタン272とを含む。
図8は、図7に示す観光施設推薦装置244の概略のブロック図である。図8において、図4と同じ機能を持つブロックには同じ参照符号を付してある。それらの名称及び機能も同一である。従ってそれらについての詳しい説明は繰返さない。
図8に示す観光施設推薦装置244が図4に示す語句解説装置44と異なるのは、図4に示す質問受付処理部100に代えて、図7に示す入力画面250を用いて観光施設の例示を受ける質問受付処理部300を含むことと、図4に示す単語選択処理部116に代えて、主格単語蓄積部112に蓄積されている格フレームレコードのうち、頻度算出処理部114によって算出された頻度の上位のものから所定の複数個を選択するための、単語選択処理部302を含むことと、図4に示す出力作成処理部120に代えて、単語選択処理部302によって選択された複数個の単語と、定型表現記憶部118に記憶された施設推薦のための定型文とを持ち、図7に示す出力画面252を作成し出力するための出力作成処理部306とを含む点である。
質問受付処理部300は、図1に示す質問画面50に代えて、図7に示す入力画面250を用いる点を除き、図4に示す質問受付処理部100と同様の機能を有する。
図8に示す単語選択処理部302は、図4に示す単語選択処理部116に代えて、頻度の上位から複数個の単語を選択する点を除き、図4に示す単語選択処理部116と同様の機能を有する。
図8に示す出力作成処理部300は、図4に示す出力作成処理部120と異なり、図7に示す出力画面252を単語選択処理部302から与えられた複数個の単語を使用して作成する。
図9に、この第2の実施の形態に係る観光施設推薦装置244を実現するためのコンピュータプログラムのフローチャートを示す。図9に示されるプログラムは、図7に示す入力画面250において、ユーザが入力フィールド260に何らかの値を入力し、推薦ボタン262をクリックすることにより起動される。このプログラムには、入力フィールド260への入力テキストがパラメータとして与えられる。
図9において、図6に示す各ステップと同じステップには同じ参照符号を付してある。それらのステップで行なわれる処理は、図6において対応するステップで実行される処理と同様である。従ってここではそれらについての詳しい説明は繰返さない。
図9が図6と異なるのは、図6に示すステップ196、198及び200に代えて、ステップ350、352及び354を含む点である。
図9に示すステップ350では、ステップ194において算出された頻度の降順で、主格として現れる単語をソートする。続いてステップ352で、ソート後の主格の語のリストの先頭から予め定められた複数個の語を用い、図7の出力画面252に示すような推薦文(推薦画面)を作成する。そしてステップ354で、このようにして生成された推薦画面を入出力装置46に対して出力する。
この第2の実施の形態に係る装置では、たとえば利用者が「博物館」のようなところ、と入力して観光施設の推薦を依頼した場合、格フレーム辞書群40の中で、その博物館を主格として持つ用言の格フレームレコードがすべて検索される。そのようにして検索された格フレームレコードのうちで、用言ともしあれば目的格となる単語との組合せのうちで最も頻度が高いものが選択される。さらに、格フレーム辞書群40の中で、ユーザプロフィールに応じて選択された格フレーム辞書につき、選択された組合せ、並びにそれらを構成する用言の類義語と目的格の名詞の類義語との組合せを持つ格フレームレコードが検索される。それら格フレームレコードの中で、主格となっている名詞の出現頻度を算出する。この場合、格フレーム選択処理部108で選択された用言及び目的格の単語の組と、シソーラス42によって検索された類義語を用いて得られた格フレームレコードとでは、それぞれ重みを異ならせる。このようにして主格の語の出現頻度を算出した後、単語選択処理部302がこの単語のリストを頻度順に降順でソートし、頻度の大きいものから所定の複数個を選択して出力作成処理部306に与える。出力作成処理部306は、これら単語を用いて図7に示す出力画面252を作成する。
なお、出力画面252において、推薦された観光施設の名称には、その施設をより詳しく解説したウェブページ等へのリンクを埋め込むようにすると、ユーザにとって便利である。そのためには、格フレーム辞書内に出現する観光施設について、予めそのURL(Universal Resource Locator)を保持したデータベースを作成しておき、出力作成処理部306において出力画面252を作成する際に、そのURLへのリンクを各観光施設の名称のテキストに付与するようにすればよい。
このように、第1の実施の形態とほぼ同様の仕組みを用い、第1の実施の形態のように比喩を用いた語句解説をする装置ではなく、入力された単語に基づいて、観光施設を推薦する装置を実現することができる。この処理では、入力された観光施設名を主格の語として持つ用言(及び目的格となる単語の組合せ)が検索され、さらにその用言(及び目的語の組合せ)を持つ主格の単語が、ユーザプロフィールに応じて選択された格フレーム辞書から検索される。こうして検索された単語群のうち、出現頻度が最も高いものから複数個がユーザに対して推薦される。
こうすることにより、ユーザが入力した施設名と概念的に深い関係を持つと思われる用言を中心に、その用言と深い関係を持つ他の観光施設名が検索される。その結果、ユーザが好む観光施設と同様の性質を持った観光施設を選択し、ユーザに提示することができる。
なお、上記した実施の形態では、いずれも類似格フレーム検索処理部110による検索の際、一致格フレーム検索部102による検索に用いられる格フレーム辞書群40の中から、ユーザプロフィールに合致するものを用いている。しかし本発明はそのような実施の形態には限定されない。例えば類似格フレーム検索処理部110による検索の際には、格フレーム辞書群40とは全く別の格フレーム辞書を用いるようにしてもよい。
さらに、上記実施の形態では、用言と名詞との意味的関係を記述するデータベースを「格フレーム辞書」と読んでおり、その形態は図2及び図3に示したとおりである。しかし本発明はそのような実施の形態には限定されない。用言と、その用言に対し主格となる名詞及び(もしあれば)目的格となる名詞との関係が分かるようなデータベースであればどのような形式のものを使用してもよい。
また、上記実施の形態では、質問として単に単語を受け入れているだけである。これは、このようにすることにより、回答の検索が簡単に行なえるためである。しかし、文構造の解析処理により、文の中心的意味を担う単語を抽出するようにすれば、単語ではなく質問文自体を入力として受けるようにすることも可能である。
<コンピュータによる実現>
図10は、上記した第1の実施の形態に係る語句解説システム30及び第2の実施の形態に係る観光施設推薦システム230を、それぞれ図6及び図9に示す制御構造を有するコンピュータプログラムを実行することにより実現するコンピュータシステム530の外観を示し、図11はコンピュータシステム530の内部構成をブロック図形式で示す。
図10は、上記した第1の実施の形態に係る語句解説システム30及び第2の実施の形態に係る観光施設推薦システム230を、それぞれ図6及び図9に示す制御構造を有するコンピュータプログラムを実行することにより実現するコンピュータシステム530の外観を示し、図11はコンピュータシステム530の内部構成をブロック図形式で示す。
図10を参照して、このコンピュータシステム530は、メモリドライブ552及びDVD(Digital Versatile Disc)ドライブ550を有するコンピュータ540と、キーボード546と、マウス548と、モニタ542と、マイクロフォン570と、一対のスピーカ572とを含む。
図11を参照して、コンピュータ540は、メモリドライブ552及びDVDドライブ550に加えて、CPU(中央処理装置)556と、CPU556、メモリドライブ552及びDVDドライブ550に接続されたバス566と、ブートアッププログラム等を記憶する読出専用メモリ(ROM)558と、バス566に接続され、プログラム命令、システムプログラム、及び作業データ等を記憶するランダムアクセスメモリ(RAM)560と、バス566に接続された不揮発性の外部記憶装置であるハードディスク554とを含む。
コンピュータ540はさらにローカルエリアネットワーク(LAN)574への接続を提供するネットワークアダプタ576を含む。
コンピュータシステム530に語句解説システム30又は観光施設推薦システム230としての動作を行なわせるためのコンピュータプログラムは、DVDドライブ550又はメモリドライブ552に挿入されるDVD562又は不揮発性メモリ564に記憶され、さらにハードディスク554に転送される。又は、プログラムはネットワーク574を通じてコンピュータ540に送信されハードディスク554に記憶されてもよい。プログラムは実行の際にRAM560にロードされる。DVD562から、不揮発性メモリ564から、又はネットワーク574を介して、直接にRAM560にプログラムをロードしてもよい。
図1等に示す格フレーム辞書群40、シソーラス42及びユーザプロフィールは、ハードディスク554上に格納され、プログラムの実行の際にRAM560にロードされる。CPU556は、図示しないプログラムカウンタレジスタにより示される、RAM560上のアドレスから命令を読出し、命令をデコードし、RAM560又はハードディスク554の、デコード結果により特定されるアドレスからデータを読出して命令に従い処理し、デコード結果によって特定されるアドレスに処理結果を格納する。CPU556はこうした処理を繰返す事により、質問に対する回答を生成し提示する処理を行なう。
図1及び図7に示す入出力装置46は、図10及び図11に示すモニタ542、キーボード546、マウス548等により実現される。当業者であれば容易に分かるように、生成された回答を合成音声で出力するようにしてもよい。この場合には、スピーカ572を出力装置として用いることができる。
このプログラムは、コンピュータ540に上記実施の形態に係るシステム30又は230としての動作を行なわせる複数の命令を含む。この動作を行なわせるのに必要な基本的機能のいくつかはコンピュータ540上で動作するオペレーティングシステム(OS)若しくはサードパーティのプログラム、又はコンピュータ540にインストールされる各種ツールキットのモジュールにより提供される。従って、このプログラムは上記した実施の形態のシステムを実現するのに必要な機能全てを必ずしも含まなくてよい。このプログラムは、命令のうち、所望の結果が得られる様に制御されたやり方で適切な機能又は「ツール」を呼出す事により、上記したシステム30又は230としての動作を実行する命令のみを含んでいればよい。なお、ここでいう「ツール」とは、ある目的に適した定型的な処理をコンピュータに行なわせる比較的小規模なプログラムのことをいう。「ツールキット」とは、これらツールを多数集め、外部から利用可能にしたプログラムのセットのことをいう。
コンピュータシステム530の動作は周知であるので、ここでは繰返さない。
今回開示された実施の形態は単に例示であって、本発明が上記した実施の形態のみに制限されるわけではない。本発明の範囲は、発明の詳細な説明の記載を参酌した上で、特許請求の範囲の各請求項によって示され、そこに記載された文言と均等の意味及び範囲内でのすべての変更を含む。
30 比喩による語句解説システム
40 格フレーム辞書群
42 シソーラス
44 比喩による語句解説装置
46 入出力装置
100、300 質問受付処理部
102 一致格フレーム検索部
104 一致格フレーム蓄積部
106、114 頻度算出処理部
108 格フレーム選択処理部
110 類似格フレーム検索処理部
112 主格単語蓄積部
116、302 単語選択処理部
118 定型表現記憶部
120、306 出力作成処理部
40 格フレーム辞書群
42 シソーラス
44 比喩による語句解説装置
46 入出力装置
100、300 質問受付処理部
102 一致格フレーム検索部
104 一致格フレーム蓄積部
106、114 頻度算出処理部
108 格フレーム選択処理部
110 類似格フレーム検索処理部
112 主格単語蓄積部
116、302 単語選択処理部
118 定型表現記憶部
120、306 出力作成処理部
Claims (7)
- 用言と、当該用言に意味的に接続可能な名詞概念と、それらの間の格関係とを記述した格フレームレコードを多数含む第1及び第2の格フレーム辞書を記憶するための第1の記憶手段と、
名詞からなる質問の入力を受けるための質問入力手段と、
前記質問入力手段により入力された単語を主格とする格フレームレコードを前記第1の記憶手段に記憶された前記第1の格フレーム辞書内で検索するための第1の検索手段と、
前記第1の検索手段により検索された格フレームレコードの用言と、もしあれば当該用言に対する目的格となる名詞との組合せのうち、前記第1の検索手段により検索された格フレームレコードのうちで出現頻度が最も高いものを選択するための第1の選択手段と、
前記第1の選択手段により選択された用言と名詞との組合せをもつ格フレームレコードを前記第1の記憶手段内に記憶された前記第2の格フレーム辞書内において検索するための第2の検索手段と、
前記第2の検索手段により検索された格フレームレコードに含まれる主格の名詞のうち、出現頻度の最も高い所定個数を選択するための第2の選択手段と、
前記第2の選択手段により選択された前記所定個数の主格の名詞を用いて前記質問に対する回答を生成し出力するための回答出力手段とを含む、回答検索装置。 - 前記第1の記憶手段は、それぞれ対象読者領域の異なった文書から得られた複数個の領域別格フレーム辞書を記憶し、
前記回答検索装置はさらに、予め記憶されたユーザのプロフィールに基づき、複数個の領域別格フレーム辞書のうちで当該プロフィールが合致する対象読者領域の文書から得られた領域別格フレーム辞書を前記第2の格フレーム辞書として選択するための手段とを含む、請求項1に記載の回答検索装置。 - 前記第2の選択手段は、前記第2の検索手段により検索された格フレームレコードに含まれる主格の名詞のうち、出現頻度の最も高い1つの名詞を選択するための手段を含み、
前記回答出力手段は、前記質問に含まれる前記名詞と、前記第2の選択手段により選択される前記1つの名詞とを用い、前記質問に含まれる前記名詞を、前記1つの名詞を用いた比喩によって説明する回答を生成し出力するための手段を含む、請求項1又は請求項2に記載の回答検索装置。 - 前記第2の選択手段は、前記第2の検索手段により検索された格フレームレコードに含まれる主格の名詞のうち、出現頻度の最も高いものから複数個の名詞を選択するための手段を含み、
前記回答出力手段は、前記質問に含まれる前記名詞と、前記複数個の名詞とを用い、前記質問に含まれる前記名詞に対する代替候補として示す回答を生成し出力するための手段を含む、請求項1又は請求項2に記載の回答検索装置。 - 用言及び名詞に対する類義語を含むシソーラスを記憶するための第2の記憶手段と、
前記第1の選択手段により選択された前記組合せに含まれる用言に対する類義語、及び当該用言に対する目的格となる名詞の類義語を、前記シソーラスにより検索するための類義語検索手段と、
前記類義語検索手段により検索された前記用言に対する類義語と、前記名詞の類義語との組合せの各々について、当該組合せを持つ格フレームレコードを前記第1の記憶手段内に記憶された前記第2の格フレーム辞書内において検索するための第3の検索手段とをさらに含み、
前記第2の選択手段は、前記第2の検索手段及び前記第3の検索手段により検索された格フレームレコードに含まれる主格の名詞のうち、出現頻度の最も高い所定個数を選択するための頻度順選択手段を含む、請求項1又は請求項2に記載の回答検索装置。 - 前記頻度順選択手段は、前記第2の検索手段及び前記第3の検索手段により検索された格フレームレコードに含まれる主格の名詞のうち、前記第2の検索手段により検索されたものの出現頻度に対し、前記第3の検索手段により検索されたものの出現頻度を相対的に小さく換算して各主格の名詞の出現頻度の和を算出し、出現頻度の最も高い所定個数の主格の名詞を選択するための手段を含む、請求項5に記載の回答検索装置。
- コンピュータにより実行されると、当該コンピュータを、請求項1〜請求項6のいずれかに記載の各手段として機能させる、コンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007038932A JP2008204133A (ja) | 2007-02-20 | 2007-02-20 | 回答検索装置及びコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007038932A JP2008204133A (ja) | 2007-02-20 | 2007-02-20 | 回答検索装置及びコンピュータプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008204133A true JP2008204133A (ja) | 2008-09-04 |
Family
ID=39781582
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007038932A Pending JP2008204133A (ja) | 2007-02-20 | 2007-02-20 | 回答検索装置及びコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008204133A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010122982A (ja) * | 2008-11-20 | 2010-06-03 | Nec Corp | 言語解析システム、言語解析方法、プログラム及び機械翻訳システム、言語解析方法、プログラム |
JP2012146082A (ja) * | 2011-01-11 | 2012-08-02 | Toshiba Corp | 回答検索装置、方法、及びプログラム |
JP2015079383A (ja) * | 2013-10-17 | 2015-04-23 | 日本電信電話株式会社 | 発話生成装置、方法、及びプログラム |
WO2015107741A1 (ja) * | 2014-01-15 | 2015-07-23 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10207910A (ja) * | 1997-01-16 | 1998-08-07 | Fuji Xerox Co Ltd | 関連語辞書作成装置 |
-
2007
- 2007-02-20 JP JP2007038932A patent/JP2008204133A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10207910A (ja) * | 1997-01-16 | 1998-08-07 | Fuji Xerox Co Ltd | 関連語辞書作成装置 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010122982A (ja) * | 2008-11-20 | 2010-06-03 | Nec Corp | 言語解析システム、言語解析方法、プログラム及び機械翻訳システム、言語解析方法、プログラム |
JP2012146082A (ja) * | 2011-01-11 | 2012-08-02 | Toshiba Corp | 回答検索装置、方法、及びプログラム |
JP2015079383A (ja) * | 2013-10-17 | 2015-04-23 | 日本電信電話株式会社 | 発話生成装置、方法、及びプログラム |
WO2015107741A1 (ja) * | 2014-01-15 | 2015-07-23 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
US9965463B2 (en) | 2014-01-15 | 2018-05-08 | Sony Corporation | Information processing apparatus and information processing method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10579657B2 (en) | Answering questions via a persona-based natural language processing (NLP) system | |
Baker | Glossary of corpus linguistics | |
Malandrakis et al. | Distributional semantic models for affective text analysis | |
US20040167875A1 (en) | Information processing method and system | |
KR20040025642A (ko) | 확인 문장을 검색하기 위한 방법 및 시스템 | |
JP2007531065A (ja) | 言語処理方法および装置 | |
JP2007141090A (ja) | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム | |
JP2001075966A (ja) | データ分析システム | |
JP4347226B2 (ja) | 情報抽出プログラムおよびその記録媒体、情報抽出装置ならびに情報抽出規則作成方法 | |
Tami et al. | Automated question generation for science tests in arabic language using nlp techniques | |
JP2008204133A (ja) | 回答検索装置及びコンピュータプログラム | |
KR102687103B1 (ko) | 질의어를 처리하는 장치, 방법 및 컴퓨터 프로그램 | |
Alarcón et al. | Hulat-ALexS CWI Task-CWI for Language and Learning Disabilities Applied to University Educational Texts. | |
Filho et al. | Crawling by readability level | |
JP2007047974A (ja) | 情報抽出装置および情報抽出方法 | |
JP4428703B2 (ja) | 情報検索方法及びそのシステム並びにコンピュータプログラム | |
WO2007105530A1 (ja) | 関連用語取得装置、関連用語取得方法、技術動向情報作成装置、技術動向情報作成方法、及びプログラム | |
Jaćimović | Textometric methods and the TXM platform for corpus analysis and visual presentation | |
JP2007241900A (ja) | ネーミングシステム及びネーミング自動化方法 | |
CN118886519B (zh) | 模型训练方法、数据处理方法、电子设备及存储介质 | |
Kaveh et al. | The effects of the challenges in the transliteration of Persian names into English on the recall of retrieved results in the web of science | |
JP2600081B2 (ja) | 自然言語対話装置 | |
JP2009059290A (ja) | 外国語文書作成支援装置、外国語文書作成支援方法および外国語文書作成支援プログラム | |
Dou et al. | Building an Oranian-English parallel corpus for automated translation training | |
Hetsevich et al. | CLARIN Knowledge Centre for Belarusian text and speech processing (K-BLP) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100215 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120322 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120417 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120911 |