JP2010256977A - Information retrieval device and program - Google Patents
Information retrieval device and program Download PDFInfo
- Publication number
- JP2010256977A JP2010256977A JP2009103067A JP2009103067A JP2010256977A JP 2010256977 A JP2010256977 A JP 2010256977A JP 2009103067 A JP2009103067 A JP 2009103067A JP 2009103067 A JP2009103067 A JP 2009103067A JP 2010256977 A JP2010256977 A JP 2010256977A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- search
- search request
- paraphrase
- partial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、検索要求として入力された文と類似する文を検索する情報検索装置およびプログラムに関する。 The present invention relates to an information retrieval apparatus and a program for retrieving a sentence similar to a sentence input as a retrieval request.
近年では、文書等のデータを検索するために様々な検索技術が提供され、広く普及している。例えばインターネットの検索エンジンでは、利用者からの検索要求(検索条件)に適合する文書を検索し、当該検索した文書を類似度に応じてランキングしている。 In recent years, various search techniques have been provided and widely used for searching data such as documents. For example, an Internet search engine searches for documents that match a search request (search condition) from a user, and ranks the searched documents according to the degree of similarity.
この文書検索では、例えば利用者によって検索要求として指定されたキーワードまたは文(以下、検索要求文と表記)から切り出されたキーワードに基づいて文書が検索される。しかしながら、自然言語においては、これらのキーワードと同じ意味を別の言葉で表現することが可能である。 In this document search, for example, a document is searched based on a keyword extracted from a keyword or sentence specified as a search request by a user (hereinafter referred to as a search request sentence). However, in natural language, the same meaning as these keywords can be expressed in different words.
利用者から例えば「読みを送信する」という検索要求文(入力文)を含む文書の検索要求が行われた場合を想定する。この「読みを送信する」という検索要求文に基づいて検索処理が実行された場合、当該検索要求文が言い換えられた例えば「読みを付与し送信を実行する」という文(以下、文Aと表記)を含む文書は、当該文Aが当該検索要求文と同様の意味を有するにもかかわらず検索(検出)されない。 A case is assumed in which a search request for a document including a search request sentence (input sentence) such as “send reading” is made by a user. When search processing is executed based on the search request sentence “send reading”, the search request sentence is rephrased, for example, a sentence “send reading and execute” (hereinafter referred to as sentence A). ) Is not searched (detected) even though the sentence A has the same meaning as the search request sentence.
このため、利用者が「読みを送信する」という検索要求文に含まれる「読み」および「送信」をキーワードとして指定して、文書を検索することも考えられる。このようなキーワード検索が行われた場合、上記した文Aを含む文書については検索される。しかしながら、この場合、上記した検索要求文と全く意味が異なる例えば「読みを文字列から生成し、音声の送信を実行する」という文(以下、文Bと表記)を含む文書についても検索されることになる。 For this reason, it is also conceivable that the user searches for a document by specifying “reading” and “transmission” included in a search request sentence “transmit reading” as keywords. When such a keyword search is performed, a document including the above sentence A is searched. However, in this case, a document including a sentence (hereinafter referred to as sentence B) having a meaning completely different from the above-described search request sentence, for example, “Generate a reading from a character string and execute voice transmission” is also searched. It will be.
つまり、このような場合には利用者が意図しない文書についても検索されることになるため、例えば検索結果として提示された文書の中から利用者が所望する文書を特定することが困難になる。このように、キーワードによる検索では、上記した文Aおよび文Bを区別することが困難である。 That is, in such a case, since a document that is not intended by the user is also searched, for example, it becomes difficult to specify a document desired by the user from documents presented as a search result. As described above, it is difficult to distinguish the sentence A and the sentence B in the search using the keyword.
そこで、例えば利用者によって指定された検索要求文を同じ意味内容であって異なる表現に変換し、当該変換された表現を用いて検索処理を実行することで、より適切な検索結果を得ることが考えられる。 Therefore, for example, it is possible to obtain a more appropriate search result by converting a search request sentence specified by the user into a different expression having the same meaning and executing a search process using the converted expression. Conceivable.
以下、上記した「読みを送信する」という文を「読みを文字列に付与し送信を実行する」という文のような同じ意味内容であって異なる表現にする変換(言い換え)を、「パラフレーズ」と称する。 Hereinafter, the conversion (paraphrase) that makes the above-mentioned sentence “send reading” the same semantic content and different expressions like the sentence “giving the reading to the character string and execute transmission” is referred to as “paraphrase”. ".
また、ある表現から、同じ意味内容であって別の表現(パラフレーズ表現)の候補を生成することをパラフレーズ表現の生成手法と称する。 In addition, generating a candidate for another expression (paraphrase expression) having the same semantic content from a certain expression is referred to as a paraphrase expression generation method.
このパラフレーズ表現の生成手法としては、予め保持されている置換ルールに基づいて、ある表現を部分的に置換して別の表現を生成する手法がある。 As a method for generating this paraphrase expression, there is a technique in which a certain expression is partially replaced and another expression is generated based on a replacement rule stored in advance.
例えば複数種類の言い換えが必要な文または文章を、目的とする文または文章に簡単に変換することができる技術(以下、先行技術と表記)が開示されている(例えば、特許文献1を参照)。この先行技術によれば、複数の置換ルール(変形規則)を適用して置換候補が生成される。 For example, a technique (hereinafter referred to as prior art) that can easily convert a sentence or sentence that requires multiple types of paraphrasing into a target sentence or sentence is disclosed (for example, see Patent Document 1). . According to this prior art, replacement candidates are generated by applying a plurality of replacement rules (deformation rules).
このようなパラフレーズ表現の生成手法を検索処理に応用した場合、例えば検索要求として指定された検索要求文が言い換えられた言い換え文を当該検索要求文から生成し、当該生成された言い換え文が検索要求文と類似している場合に、当該言い換え文に基づいて検索を行うことが考えられる。 When such a paraphrase expression generation method is applied to search processing, for example, a paraphrase text in which a search request text specified as a search request is paraphrased is generated from the search request text, and the generated paraphrase text is searched. When the request sentence is similar to the request sentence, it is conceivable to perform a search based on the paraphrase sentence.
上記したようにパラフレーズ表現の生成手法を用いて検索を行う場合、検索要求として入力された検索要求文では検索できない文書であっても、当該検索要求文と同様の意味を有する文を含む文書であれば検索できる。また、パラフレーズ表現の生成手法では、検索要求文を同じ意味内容であって異なる表現に言い換えるため、キーワード検索のように検索要求文と全く意味が異なる文(を含む文書)が検索されることを回避することができる。このため、パラフレーズ表現の生成手法を検索処理に応用した場合、検索性能の向上が期待できる。 When searching using the paraphrase expression generation method as described above, even if the search request text input as a search request cannot be searched, the document contains a sentence having the same meaning as the search request text Can be searched. In addition, in the paraphrase expression generation method, the search request sentence is paraphrased into a different expression with the same semantic content, so that a sentence (including a document) having a completely different meaning from the search request sentence such as a keyword search is searched. Can be avoided. For this reason, when the paraphrase expression generation method is applied to the search processing, an improvement in search performance can be expected.
しかしながら、上記した先行技術においては、置換ルールにより文言の変更を行っているが、例えば自立語の数が変わるような複雑なパラフレーズを行うことはできない。 However, in the above-described prior art, the wording is changed by the replacement rule, but a complicated paraphrase that changes the number of free words cannot be performed, for example.
つまり、上記した「読みを送信する」という検索要求文と「読みを文字列に付与し送信を実行する」という文Aとの間のパラフレーズを行うことはできない。 That is, the paraphrase between the search request sentence “send reading” and the sentence A “add reading to the character string and execute transmission” cannot be performed.
したがって、上記した先行技術を用いて「読みを送信する」という検索要求文から言い換え文を生成し、当該言い換え文を用いて検索処理を実行したとしても、「読みを付与し送信を実行する」という文A(を含む文書)を検索することができない場合がある。つまり、上記した先行技術を検索処理に応用した場合であっても、適切な検索結果を得ることができない場合がある。 Therefore, even if the paraphrase text is generated from the search request sentence “send reading” using the above-described prior art, and the search processing is executed using the paraphrase text, “add reading and execute transmission” May not be retrieved. That is, even when the above-described prior art is applied to search processing, an appropriate search result may not be obtained.
そこで、本発明の目的は、利用者からの検索要求文に基づいて適切な検索結果を得ることができる情報検索装置およびプログラムを提供することにある。 Accordingly, an object of the present invention is to provide an information search apparatus and a program that can obtain an appropriate search result based on a search request sentence from a user.
本発明の1つの態様によれば、自立語を含む検索対象文および当該検索対象文に含まれる自立語間の係り受け構造を示す第1の構文解析結果を対応づけて格納する検索対象文格納手段と、複数の自立語間の係り受け構造を示す第1の部分構文木パタンおよび当該第1の部分構文木パタンの言い換えとなる自立語間の係り受け構造を示すとともに当該第1の部分構文木パタンより自立語の数が少ない第2の部分構文木パタンを対応づけて格納する言い換えパタン格納手段と、ユーザによって指定された自立語を含む検索要求文を入力する入力手段と、前記入力された検索要求文を構文解析することにより、当該検索要求文に含まれる自立語間の係り受け構造を示す第2の構文解析結果を取得する構文解析手段と、前記取得された第2の構文解析結果を格納する検索要求文解析結果格納手段と、前記入力された検索要求文に含まれる自立語を含む検索対象文を前記検索対象文格納手段から検索する検索手段と、前記検索要求文解析結果格納手段に格納された第2の構文解析結果によって示される自立語間の係り受け構造において、前記言い換えパタン格納手段に格納されている前記第1の部分構文木パタンによって示される複数の自立語間の係り受け構造と一致する部分を当該第1の部分構文木パタンに対応づけて前記言い換えパタン格納手段に格納されている第2の部分構文木パタンによって示される自立語間の係り受け構造に置換することにより、前記入力された検索要求文の部分検索要求文を生成する第1の生成手段と、前記第1の生成手段によって生成された部分検索要求文に含まれる自立語に基づいて、前記検索された検索対象文に対応づけて前記検索対象文格納手段に格納されている第1の構文解析結果によって示される自立語間の係り受け構造において、前記言い換えパタン格納手段に格納されている前記第1の部分構文木パタンによって示される複数の自立語間の係り受け構造と一致する部分を当該第1の部分構文木パタンに対応づけて前記言い換えパタン格納手段に格納されている第2の部分構文木によって示される自立語間の係り受け構造に置換することにより、前記検索された検索対象文の言い換え文を生成する第2の生成手段と、前記第1の生成手段によって生成された部分検索要求文に含まれる自立語間の係り受け構造および前記第2の生成手段によって生成された検索対象文の言い換え文に含まれる自立語間の係り受け構造を比較することにより、当該部分検索要求文および当該検索対象文の言い換え文が類似するかを判定する判定手段と、前記部分検索要求文および前記検索対象文の言い換え文が類似すると判定された場合、前記検索された検索対象文を前記入力された検索要求文に対する検索結果として決定する決定手段とを具備することを特徴とする情報検索装置が提供される。 According to one aspect of the present invention, a search target sentence storage that stores a search target sentence including an independent word and a first parsing result indicating a dependency structure between the independent words included in the search target sentence in association with each other. And a first partial syntax tree pattern indicating a dependency structure between a plurality of independent words and a dependency structure between independent words as a paraphrase of the first partial syntax tree pattern and the first partial syntax The paraphrase pattern storage means for storing the second partial syntax tree pattern having a smaller number of independent words than the tree pattern in association with each other, the input means for inputting the search request sentence including the independent words designated by the user, and the input A syntactic analysis unit for acquiring a second parsing result indicating a dependency structure between independent words included in the search request sentence by parsing the retrieved request sentence, and the acquired second syntactic analysis Search request sentence analysis result storage means for storing results, search means for searching for a search target sentence including independent words included in the input search request sentence from the search target sentence storage means, and the search request sentence analysis result In a dependency structure between independent words indicated by the second parsing result stored in the storage means, a plurality of independent words indicated by the first partial syntax tree pattern stored in the paraphrase pattern storage means The part that matches the dependency structure is replaced with the dependency structure between independent words indicated by the second partial syntax tree pattern stored in the paraphrase pattern storage means in association with the first partial syntax tree pattern. The first generation means for generating a partial search request sentence of the input search request sentence, and the partial search request sentence generated by the first generation means In the dependency structure between independent words indicated by the first syntax analysis result stored in the search target sentence storage means in association with the searched search target sentence based on the independent words to be turned The paraphrase pattern storage means in which a portion that matches a dependency structure between a plurality of independent words indicated by the first partial syntax tree pattern stored in the pattern storage means is associated with the first partial syntax tree pattern. 2nd generation means for generating a paraphrase sentence of the searched retrieval target sentence by replacing with a dependency structure between independent words indicated by the second partial syntax tree stored in Included in the dependency structure between independent words included in the partial search request sentence generated by the generation means and the paraphrase sentence of the search target sentence generated by the second generation means A determination means for determining whether the partial search request sentence and the paraphrase text of the search target sentence are similar by comparing dependency structures between independent words, and paraphrase of the partial search request sentence and the search target sentence When it is determined that the sentences are similar, there is provided an information search apparatus comprising: a determination unit that determines the searched search target sentence as a search result for the input search request sentence.
本発明は、利用者からの検索要求文に基づいて適切な検索結果を得ることを可能とする。 The present invention makes it possible to obtain an appropriate search result based on a search request sentence from a user.
以下、図面を参照して、本発明の実施形態について説明する。 Embodiments of the present invention will be described below with reference to the drawings.
図1は、本実施形態に係る情報検索装置のハードウェア構成を示すブロック図である。図1に示すように、コンピュータ10は、例えばハードディスクドライブ(HDD:Hard Disk Drive)のような外部記憶装置20と接続されている。この外部記憶装置20は、コンピュータ10によって実行されるプログラム21を格納する。コンピュータ10および外部記憶装置20は、情報検索装置30を構成する。
FIG. 1 is a block diagram showing a hardware configuration of the information search apparatus according to the present embodiment. As shown in FIG. 1, the
図2は、図1に示す情報検索装置30の主として機能構成を示すブロック図である。図2に示すように、情報検索装置30は、入力処理部31、構文解析部32、一次検索部33、部分検索要求生成部34、言い換え検索部35、検索結果決定部36および出力処理部37を含む。本実施形態において、これらの各部31乃至37は、図1に示すコンピュータ10が外部記憶装置20に格納されているプログラム21を実行することにより実現されるものとする。このプログラム21は、コンピュータ読み取り可能な記憶媒体に予め格納して頒布可能である。また、このプログラム21が、例えばネットワークを介してコンピュータ10にダウンロードされても構わない。
FIG. 2 is a block diagram mainly showing a functional configuration of the
また、情報検索装置30は、検索要求文解析結果格納部22、検索対象文格納部23、言い換えパタン格納部24、一次検索結果格納部25、部分検索要求格納部26および言い換え検索結果格納部27を含む。本実施形態において、これらの各部22乃至27は、例えば外部記憶装置20に格納される。
The
入力処理部31は、ユーザ(利用者)によって検索要求として指定された文(以下、検索要求文と表記)を入力する。検索要求文は例えば複数の文節から構成され、当該文節には自立語が含まれる。なお、自立語には、例えば名詞、動詞および形容動詞等が含まれる。入力処理部31は、ユーザの指示または入力を処理する機能を有する。
The
構文解析部32は、入力処理部31によって入力された検索要求文に対して構文解析を実行する。これにより、構文解析部32は、入力処理部によって入力された検索要求文の構文解析結果(第2の構文解析結果)を取得する。構文解析部32によって取得される検索要求文の構文解析結果は、当該検索要求文に含まれる自立語間の係り受け構造を示す。
The
検索要求文解析結果格納部22には、入力処理部31によって入力された検索要求文および構文解析部32によって取得された当該検索要求文の構文解析結果が格納される。
The search request sentence analysis
検索対象文格納部23には、情報検索装置30における検索処理の対象となる文書を構成する文(以下、検索対象文と表記)および当該検索対象文の構文解析結果(第1の構文解析結果)が予め対応づけて格納される。
The search target
検索対象文格納部23に格納されている検索対象文は例えば複数の文節から構成され、当該文節には自立語が含まれる。
The search target sentence stored in the search target
また、検索対象文格納部23に格納されている検索対象文の構文解析結果は、当該検索対象文に含まれる自立語間の係り受け構造を示す。
Further, the syntax analysis result of the search target sentence stored in the search target
言い換えパタン格納部24には、複数の自立語間の係り受け構造を示す対象パタン(第1の部分構文木パタン)および当該対象パタン(によって示される自立語間の係り受け構造)の言い換えとなる自立語間の係り受け構造を示すとともに当該対象パタンより自立語の数が少ない置換パタン(第2の部分構文木パタン)が予め対応づけて格納される。
The paraphrase
一次検索部33は、入力処理部31によって入力された検索要求文に含まれる自立語(単語)に基づいて、検索対象文格納部23に格納されている検索対象文をキーワード検索する。具体的には、一次検索部33は、検索対象文格納部23に格納されている検索対象文の構文解析結果および検索要求文解析結果格納部22に格納されている検索要求文の構文解析結果に基づいて、入力処理部31によって入力された検索要求文に含まれる自立語を含む検索対象文を検索対象文格納部23から検索する。
The
一次検索部33は、入力処理部31によって入力された検索要求文に含まれる自立語を含む1の文書において連続する2つの検索対象文のペア(第1および第2の検索対象文)を検索する。つまり、一次検索部33は、1の文書において連続する2つの検索対象文の各々は検索要求文に含まれる自立語の全てを含まないが、当該2つの検索対象文で当該自立語の全てを含む場合に、当該2つの検索対象文のペアを検索する。
The
一次検索結果格納部25には、一次検索部33による検索結果が格納される。一次検索結果格納部25に格納される検索結果には、一次検索部33によって検索された検索対象文の構文解析結果が含まれる。また、一次検索結果格納部25には、入力処理部31によって入力された検索要求文に関する情報(当該検索要求文の構文解析結果等)が格納される。
In the primary search
部分検索要求生成部34は、一次検索結果格納部25(検索要求文解析結果格納部22)に格納された検索要求文の構文解析結果に基づいて、入力処理部31によって入力された検索要求文から部分検索要求文を生成する。部分検索要求生成部34は、一次検索結果格納部25に格納された検索要求文の構文解析結果によって示される自立語間の係り受け構造において、言い換えパタン格納部24に格納されている対象パタンによって示される複数の自立語間の係り受け構造と一致する部分を当該対象パタンに対応づけて言い換えパタン格納部24に格納されている置換パタンによって示される自立語間の係り受け構造に置換することにより、部分検索要求文を生成する。
The partial search
部分検索要求生成部34は、検索要求文に動詞が複数含まれる場合には、当該動詞毎に部分検索要求文を生成する。部分検索要求生成部34は、検索要求文の構文解析結果によって示される自立語間の係り受け構造において検索要求文に含まれる動詞と係り受け関係にある自立語に基づいて部分検索要求文を生成する。
When a plurality of verbs are included in the search request sentence, the partial search
また、部分検索要求生成部34は、1の文書において連続する2つの検索対象文(第1および第2の検索対象文)が一次検索部33によって検索された場合、当該検索対象文毎に部分検索要求文(第1および第2の部分検索要求文)を生成する。部分検索要求生成部34は、入力処理部31によって入力された検索要求文に含まれる自立語のうち第1の検索対象文に含まれる自立語に基づいて、当該検索要求文の第1の部分検索要求文を生成する。部分検索要求生成部34は、入力処理部31によって入力された検索要求文に含まれる自立語のうち第2の検索対象文に含まれる自立語に基づいて、当該検索要求文の第2の部分検索要求文を生成する。
Also, the partial search
なお、部分検索要求生成部34によって生成された部分検索要求文は、部分検索要求格納部26に格納される。
Note that the partial search request text generated by the partial search
言い換え検索部35は、部分検索要求生成部34によって生成された部分検索要求文(部分検索要求格納部26に格納された部分検索要求文)を用いて、言い換え検索処理を実行する。
The paraphrase
言い換え検索部35は、部分検索要求生成部34によって生成された部分検索要求文および一次検索部33によって検索された検索対象文の構文解析結果に基づいて、当該検索対象文から当該検索対象文の言い換え文を生成する。言い換え検索部35は、部分検索要求格納部26に格納された部分検索要求文に含まれる自立語に基づいて、一次検索部33によって検索された検索対象文の構文解析結果によって示される自立語間の係り受け構造において、言い換えパタン格納部24に格納されている対象パタンによって示される複数の自立語間の係り受け構造と一致する部分を当該対象パタンに対応づけて言い換えパタン格納部24に格納されている置換パタンによって示される自立語間の係り受け構造に置換することにより、当該検索対象文の言い換え文を生成する。
The paraphrase
言い換え検索部35は、部分検索要求生成部34によって検索要求文に含まれる動詞毎に部分検索要求文が生成された場合、一次検索部33によって検索された検索対象文の言い換え文を当該部分検索要求文毎に生成する。このとき、言い換え検索部35は、部分検索要求生成部34によって検索要求文に含まれる動詞毎に生成された部分検索要求文に含まれる自立語に基づいて当該部分検索要求文に対応する検索対象文の言い換え文を生成する。
When the partial search request sentence is generated for each verb included in the search request sentence by the partial search
また、言い換え検索部35は、1の文書において連続する2つの検索対象文(第1および第2の検索対象文)毎に部分検索要求生成部34によって部分検索要求文(第1および第2の部分検索要求文)が生成された場合、当該部分検索要求文毎に当該検索対象文の言い換え文を生成する。つまり、言い換え検索部35は、第1の部分検索要求文に含まれる自立語に基づいて、一次検索部33によって検索された第1の検索対象文の言い換え文を生成する。言い換え検索部35は、第2の部分検索要求文に含まれる自立語に基づいて、一次検索部33によって検索された第2の検索対象文の言い換え文を生成する。
In addition, the paraphrase
言い換え検索部35は、部分検索要求格納部26に格納された部分検索要求文に含まれる自立語間の係り受け構造および当該部分検索要求文に基づいて生成された検索対象文の言い換え文に含まれる自立語間の係り受け構造を比較することにより、当該部分検索要求文および当該検索対象文の言い換え文が類似するか否かを判定する。
The paraphrase
言い換え検索部35は、一次検索部33によって検索された検索対象文および判定結果を言い換え検索結果格納部27に格納する。
The paraphrase
検索結果決定部36は、言い換え検索結果格納部27に格納された判定結果に基づいて、一次検索部33によって検索された検索対象文を入力処理部31によって入力された検索要求文に対する検索結果として決定する。
Based on the determination result stored in the paraphrase search
出力処理部37は、検索結果決定部36によって検索結果として決定された検索対象文を出力する。出力処理部37は、検索対象文を例えば表示装置(図示せず)に表示することにより、ユーザに対して当該検索対象文を検索結果として提示する。
The
図3は、図2に示す検索要求文解析結果格納部22のデータ構造の一例を示す。検索要求文解析結果格納部22には、検索要求文および当該検索要求文の構文解析結果が格納される。
FIG. 3 shows an example of the data structure of the search request sentence analysis
図3に示すように、検索要求文解析結果格納部22には、検索要求文、文節ID、文節の自立語、品詞、親IDおよび関係が対応づけて格納される。つまり、検索要求文の構文解析結果には、文節ID、文節の自立語、品詞、親IDおよび関係が含まれる。この文節ID、文節の自立語、品詞、親IDおよび関係により検索要求文に含まれる自立語間の係り受け構造が示される。
As shown in FIG. 3, the search request sentence analysis
文節IDは、入力処理部31によって入力された検索要求文を構成する各文節を識別するための識別子である。文節の自立語は、文節IDによって識別される文節に含まれる自立語を示す。品詞は、文節の自立語の品詞を示す。親IDは、文節の自立語と係り受け関係にある自立語を含む文節(親の文節)を識別するための文節IDを示す。関係は、文節IDによって識別される文節(に含まれる自立語)と親IDによって識別される文節(に含まれる自立語)との係り受け関係を示す。
The phrase ID is an identifier for identifying each phrase constituting the search request sentence input by the
図3に示す例では、検索要求文解析結果格納部22には、検索要求文が「容器に入れたインクを移動する」である場合の検索要求文の構文解析結果が格納されている。
In the example illustrated in FIG. 3, the search request sentence analysis
検索要求文解析結果格納部22には、文節ID「1」、文節の自立語「容器」、品詞「名詞」、親ID「2」および関係「に」が対応づけて格納されている。検索要求文解析結果格納部22には、文節ID「2」、文節の自立語「入れる」、品詞「動詞」、親ID「3」および関係「を_埋め込み」が対応づけて格納されている。また、検索要求文解析結果格納部22には、文節ID「3」、文節の自立語「インク」、品詞「名詞」、親ID「4」および関係「を」が対応づけて格納されている。更に、検索要求文解析結果格納部22には、文節ID「4」、文節の自立語「移動」、品詞「動詞」が対応づけて格納されている。
The search request sentence analysis
この例によると、検索要求文「容器に入れたインクを移動する」は4つの文節を含み、名詞「容器」が動詞「入れる」に「に」の関係で係り、動詞「入れる」が名詞「インク」に「を_埋め込み」の関係で係り、名詞「インク」が動詞「移動」に「を」の関係で係ることが示されている。 According to this example, the search request sentence “move ink contained in the container” includes four clauses, the noun “container” is related to the verb “enter” in relation to “ni”, and the verb “enter” is the noun “ It is shown that the relationship “ink” is related to “ink”, and the noun “ink” is related to the verb “move” in the relationship “”.
図4は、図3に示す検索要求文解析結果格納部22に格納されている検索要求文「容器に入れたインクを移動する」の構文解析結果をいわゆる依存構造の構文木の形式で示す図である。
FIG. 4 is a view showing the syntax analysis result of the search request sentence “move ink contained in the container” stored in the search request sentence analysis
図4に示す構文木は、図3に示す検索要求文解析結果格納部22に格納されている文節の自立語、親IDおよび関係に基づいて構文木構造が実現される。図4に示す構文木においては、「移動」の下に「インク」が関係「を」で関連付けられており、「インク」の下に「入れる」が関係「を_埋め込み」で関連付けられており、「入れる」の下に「容器」が関係「に」で関連付けられている。
The syntax tree shown in FIG. 4 has a syntax tree structure based on the independent words, parent IDs, and relationships of clauses stored in the search request sentence analysis
後述する処理では、このような構文木構造を用いて検索要求文および検索対象文の言い換え処理(パラフレーズ処理)が実行される。 In the process described later, the paraphrase process (paraphrase process) of the search request sentence and the search target sentence is executed using such a syntax tree structure.
図5は、図2に示す検索対象文格納部23のデータ構造の一例を示す。検索対象文格納部23には、検索対象文および当該検索対象文の構文解析結果が対応づけて格納される。
FIG. 5 shows an example of the data structure of the search target
図5に示すように、検索対象文格納部23には、文書ID、文ID、検索対象文、文節ID、文節の自立語、品詞、親IDおよび関係が対応づけて格納される。つまり、上記した検索要求文の構文解析結果と同様に、検索対象文の構文解析結果には、文節ID、文節の自立語、品詞、親IDおよび関係が含まれる。この文節ID、文節の自立語、品詞、親IDおよび関係により検索対象文に含まれる自立語間の係り受け構造が示される。
As shown in FIG. 5, in the search target
文書IDは、検索対象文によって構成される文書を識別するための識別子である。文IDは、検索対象文書を識別するための識別子である。 The document ID is an identifier for identifying a document configured by a search target sentence. The sentence ID is an identifier for identifying the search target document.
文節IDは、検索対象文を構成する各文節を識別するための識別子である。文節の自立語は、文節IDによって識別される文節に含まれる自立語を示す。品詞は、文節の自立語の品詞を示す。親IDは、文節の自立語と係り受け関係にある自立語を含む文節(親の文節)を識別するための文節IDを示す。関係は、文節IDによって識別される文節(に含まれる自立語)と親IDによって識別される文節(に含まれる自立語)との係り受け関係を示す。 The phrase ID is an identifier for identifying each phrase constituting the search target sentence. The phrase independent word indicates an independent word included in the phrase identified by the phrase ID. The part of speech indicates the part of speech of the independent word of the phrase. The parent ID indicates a phrase ID for identifying a phrase (parent phrase) including an independent word that has a dependency relationship with the independent word of the phrase. The relationship indicates a dependency relationship between the phrase identified by the phrase ID (independent words included in the phrase) and the phrase identified by the parent ID (independent words included in the phrase ID).
図5に示す例では、検索対象文格納部23には、文書ID「1」、文ID「1−1」、検索対象文「インクを入れた容器を高速で移動する」が対応づけて格納されている。これによれば、文書ID「1」によって識別される文書を構成する文ID「1−1」によって識別される検索対象文が「インクを入れた容器を高速で移動する」であることが示される。
In the example illustrated in FIG. 5, the search target
また、検索対象文格納部23には、文節ID「1」、文節の自立語「インク」、品詞「名詞」、親ID「2」および関係「を」が対応づけて格納されている。検索対象文格納部23には、文節ID「2」、文節の自立語「入れる」、品詞「動詞」、親ID「3」および関係「に_埋め込み」が対応づけて格納されている。検索対象文格納部23には、文節ID「3」、文節の自立語「容器」、品詞「名詞」、親ID「5」および関係「を」が対応づけて格納されている。検索対象文格納部23には、文節ID「4」、文節の自立語「高速」、品詞「形容動詞」、親ID「5」および関係「副詞句」が対応づけて格納されている。また検索対象文格納部23には、文節ID「5」、文節の自立語「移動」および品詞「名詞」が対応づけて格納されている。
The search target
この例によると、検索対象文「インクを入れた容器を高速で移動する」は5つの文節を含み、名詞「インク」が動詞「入れる」に「を」の関係で係り、動詞「入れる」が名詞「容器」に「に_埋め込み」の関係で係り、名詞「容器」が動詞「移動」に「を」の関係で係り、形容動詞「高速」が動詞「移動」に「副詞句」の関係で係ることが示されている。 According to this example, the search target sentence “moving at high speed in a container containing ink” includes five clauses, the noun “ink” is related to the verb “insert” in the relationship of “to”, and the verb “insert” is The noun “container” is related to “ni_embedded”, the noun “container” is related to the verb “move” to “wo”, and the adjective verb “fast” is related to the verb “move” to “adverb phrase”. It is shown that
ここでは、検索対象文格納部23に格納されている検索対象文のうち検索対象文「インクを入れた容器を高速で移動する」について説明したが、他の検索対象文についても同様である。
Here, among the search target sentences stored in the search target
なお、図5に示す例において、例えば文ID「1−1」および「1−2」によって識別される2つの検索対象文は、文書ID「1」によって識別される文書を構成する文である。文ID「1−1」および「1−2」によって識別される2つの検索対象文は、文書ID「1」によって識別される文書において連続する文である。 In the example shown in FIG. 5, for example, two search target sentences identified by sentence IDs “1-1” and “1-2” are sentences constituting a document identified by document ID “1”. . The two search target sentences identified by the sentence IDs “1-1” and “1-2” are consecutive sentences in the document identified by the document ID “1”.
文ID「2−1」、「2−2」および「2−3」によって識別される3つの検索対象文は、文書ID「2」によって識別される文書を構成する文である。文ID「2−1」および「2−2」によって識別される2つの検索対象文、または、文ID「2−2」および「2−3」によって識別される2つの検索対象文は、文書ID「2」によって識別される文書において連続する文である。 The three search target sentences identified by the sentence IDs “2-1”, “2-2”, and “2-3” are sentences constituting the document identified by the document ID “2”. The two search target sentences identified by the sentence IDs “2-1” and “2-2” or the two search target sentences identified by the sentence IDs “2-2” and “2-3” This is a continuous sentence in the document identified by the ID “2”.
文ID「3−1」および「3−2」によって識別される2つの検索対象文は、文書ID「3」によって識別される文書を構成する文である。文ID「3−1」および「3−2」によって識別される2つの検索対象文は、文書ID「3」によって識別される文書において連続する文である。 The two search target sentences identified by the sentence IDs “3-1” and “3-2” are sentences constituting the document identified by the document ID “3”. The two search target sentences identified by the sentence IDs “3-1” and “3-2” are consecutive sentences in the document identified by the document ID “3”.
図6は、図2に示す言い換えパタン格納部24のデータ構造の一例を示す。上記したように言い換えパタン格納部24には、言い換え処理に用いられる置換ルール(言い換えパタン)が格納される。図6に示すように、言い換えパタン格納部24に格納される置換ルールには、分類ID、ルールID、対象パタン、置換パタン、係り受け条件、品詞条件および一致条件/保護条件が対応づけて含まれる。なお、分類とは、文の区切りとなる所定のまとまりを指す。本実施形態では、分類として、名詞句、動詞句、格共有等が挙げられる。
FIG. 6 shows an example of the data structure of the paraphrase
分類IDは、上記した分類毎に割り当てられた識別子である。ルールIDは、分類毎に設定された各置換ルールに割り当てられた識別子である。なお、ルールIDの値が小さい方については、係り受け構造等が複雑な置換ルールが設定され、ルールIDの値が大きい方については、係り受け構造等が簡単な置換ルールが設定される。 The classification ID is an identifier assigned for each classification described above. The rule ID is an identifier assigned to each replacement rule set for each classification. A replacement rule with a complicated dependency structure is set for a smaller rule ID value, and a replacement rule with a simple dependency structure is set for a larger rule ID value.
つまり、本実施形態では、情報検索装置30は、例えば検索要求文および検索対象文のような言い換え処理の対象となる文(言い換え対象文)において複雑な置換ルールに一致すれば当該置換ルールと対応づけられた置換を行い、複雑な置換ルールに一致しない場合には単純な置換ルールと一致するか否かの判定を行い、当該単純な置換ルールと一致した場合に当該置換ルールと対応づけられた置換を行う。このように、情報検索装置30が複雑な置換ルールから順に言い換え対象文が一致するか否かを判定することで、構文木を置換する精度を向上させることができる。
In other words, in the present embodiment, the
対象パタンは、言い換え対象文に対して適用される自立語間の係り受け構造を示す構文木のパタンである。置換パタンは、言い換え対象文に含まれる部分構文木が対象パタンと一致するとともに後述する置換条件を満足した場合に実行される置換処理後の構文木のパタンである。対象パタンおよび置換パタンの「−」は、2つの単語(自立語)間に係り受け関係が存在していることを示す。 The target pattern is a syntax tree pattern indicating a dependency structure between independent words applied to the paraphrase target sentence. The replacement pattern is a pattern of a syntax tree after replacement processing that is executed when a partial syntax tree included in the paraphrase target sentence matches the target pattern and satisfies a replacement condition described later. “-” In the target pattern and the replacement pattern indicates that a dependency relationship exists between two words (independent words).
図6に示すように、対象パタンより置換パタンの方が自立語の数(ノード数)が少なく設定されている。なお、対象パタンの構文木と置換パタンの構文木は、ノード数こそ異なるが意味的には言い換えとなるものである。これにより、複数のパタンを用いて言い換え対象文を置換しても言い換え関係が成立する。 As shown in FIG. 6, the replacement pattern is set to have fewer independent words (number of nodes) than the target pattern. Note that the syntax tree of the target pattern and the syntax tree of the replacement pattern are different in terms of the number of nodes but are semantically different. Thus, the paraphrase relationship is established even if the paraphrase target sentence is replaced using a plurality of patterns.
係り受け条件、品詞条件および一致条件/保護条件は、言い換え対象文において、当該言い換え対象文に含まれる自立語を残すとともに対象パタンを置換パタンに置換するための置換条件として設定される。これら全ての置換条件を満たした場合、言い換え対象文に対して置換処理が行われる。 The dependency condition, the part-of-speech condition, and the matching condition / protection condition are set as replacement conditions for leaving the independent words included in the paraphrase target sentence and replacing the target pattern with the replacement pattern in the paraphrase target sentence. When all these replacement conditions are satisfied, a replacement process is performed on the paraphrase target sentence.
係り受け条件は、文節間の係り受け(関係)についての条件を示す。例えば図6に示す言い換えパタン格納部24を用いた場合、文節B−A間の係り受けが「の」または「隣」の場合には条件を満たしていると判定される。品詞条件は、各文節の自立語の品詞の条件を示す。一致条件/保護条件は、言い換え対象文の各文節の自立語が後述する「保護」と設定されているか否かという条件を示す。
The dependency condition indicates a condition regarding dependency (relationship) between phrases. For example, when the paraphrase
つまり、図6に示す例えば分類ID「2」およびルールID「1」を含む置換ルールにおいては、名詞Bが名詞Aに係り、名詞Aが単語(品詞は任意の単語)Cに係るパタンが言い換え対象文に含まれる場合であって、これら文節(に含まれる自立語)間において名詞Bと名詞Aの関係が「の」または「隣」であり、名詞Bが「保護」と設定され、名詞Aが「保護」と設定されていない場合には、置換条件を満たしていると判定される。この場合、言い換え対象文の名詞Bが名詞Aに係り、名詞Aが単語Cに係るパタン(対象パタン)が、名詞Bが単語Cに係るパタン(置換パタン)に置換される。 That is, in the replacement rule including, for example, the classification ID “2” and the rule ID “1” illustrated in FIG. 6, the noun B is related to the noun A, and the noun A is a word related to the word (part of speech is an arbitrary word) C. In the case where it is included in the target sentence, the relationship between the noun B and the noun A is “no” or “neighbor” between these phrases (independent words included in), and the noun B is set as “protection”. If A is not set to “protect”, it is determined that the replacement condition is satisfied. In this case, the noun B of the paraphrase target sentence relates to the noun A, and the pattern in which the noun A relates to the word C (target pattern) is replaced with the pattern in which the noun B relates to the word C (substitution pattern).
次に、図7のフローチャートを参照して、本実施形態に係る情報検索装置30の処理手順について説明する。
Next, a processing procedure of the
まず、情報検索装置30に含まれる入力処理部31は、ユーザによって検索要求として指定された検索要求文を入力する(ステップS1)。検索要求文には、複数の自立語が含まれる。
First, the
次に、構文解析部32は、入力処理部31によって入力された検索要求文を構文解析する(ステップS2)。これにより、構文解析部32は、入力処理部31によって入力された検索要求文に含まれる自立語間の係り受け構造を示す構文解析結果を取得する。
Next, the
構文解析部32は、取得された検索要求文の構文解析結果を検索要求文解析結果格納部22に格納する(ステップS3)。
The
一次検索部33は、検索要求文解析結果22に格納された検索要求文の構文解析結果および検索対象文格納部23に格納されている検索対象文の構文解析結果に基づいて、一次検索処理を実行する(ステップS4)。一次検索部33は、一次検索処理により、検索要求文に含まれる自立語を含む検索対象文を検索対象文格納部23から検索する。一次検索部33は、一次検索処理における検索結果(一次検索結果)を一次検索結果格納部25に格納する。一次検索結果格納部25に格納される検索結果には、一次検索部33によって検索された検索対象文および当該検索対象文の構文解析結果が含まれる。また、一次検索結果格納部25には、検索要求文の情報(検索要求文情報)が格納される。なお、一次検索処理の詳細については後述する。
The
上記した一次検索処理が実行されると、部分検索要求生成部34、言い換え検索部35および検索結果決定部36によって検索結果決定処理が実行される(ステップS5)。この検索結果決定処理においては、言い換えパタン格納部24および一次検索結果格納部25を参照して、上記した一次検索部33によって検索された検索対象文の中から入力処理部31によって入力された検索要求文に対する検索結果となる検索対象文(ユーザに対して提示される検索対象文)が決定される。なお、検索結果決定処理の詳細については後述する。
When the primary search process described above is executed, the search result determination process is executed by the partial
出力処理部37は、上記した検索結果決定処理において検索結果として決定された検索対象文を出力(ユーザに対して提示)する(ステップS6)。
The
次に、図8のフローチャートを参照して、上記した一次検索処理(図7に示すステップS4の処理)の処理手順について説明する。 Next, the procedure of the primary search process (the process of step S4 shown in FIG. 7) will be described with reference to the flowchart of FIG.
まず、一次検索部33は、検索要求文解析結果格納部22から検索要求文の構文解析結果を取得する(ステップS11)。この検索要求文の構文解析結果には、上述した図3に示すように文節ID、文節の自立語、品詞、親IDおよび関係が含まれる。
First, the
次に、一次検索部33は、取得された検索要求文の構文解析結果に含まれる各自立語を含む検索対象文を検索対象文格納部23に格納されている検索対象文の構文解析結果に基づいて特定する(ステップS12)。
Next, the
一次検索部33は、特定された検索対象文を識別するための文IDを検索対象文格納部23から取得する。一次検索部33は、検索要求文を構成する文節を識別する文節ID(当該文節に含まれる自立語)毎に、取得された文ID(当該自立語を含む検索対象文を識別するための文ID)を第1のリストに追加する(ステップS13)。一次検索部33は、第1のリストを一次検索結果格納部25に格納する。
The
ここで、図9は、一次検索結果格納部25に格納された第1のリストのデータ構造の一例を示す。図9に示すように、第1のリストには、文節ID、文節の自立語および文IDが保持される。
Here, FIG. 9 shows an example of the data structure of the first list stored in the primary search
文節IDは、検索要求文を構成する文節を識別するための識別子である。文節の自立語は、文節IDによって識別される文節に含まれる自立語を示す。文IDは、文節の自立語を含む検索対象文を識別するための識別子である。 The phrase ID is an identifier for identifying a phrase constituting the search request sentence. The phrase independent word indicates an independent word included in the phrase identified by the phrase ID. The sentence ID is an identifier for identifying a search target sentence including an independent word of a phrase.
図9に示す例では、第1のリストには、文節ID「1」、文節の自立語「容器」、文ID「1−1」、「2−2」、「2−3」および「3−1」が保持されている。これによれば、検索要求文を構成する文節ID「1」によって識別される文節に含まれる自立語「容器」は、文ID「1−1」、「2−2」、「2−3」および「3−1」によって識別される検索対象文に含まれることが示される。 In the example illustrated in FIG. 9, the first list includes a phrase ID “1”, a phrase independent word “container”, sentence IDs “1-1”, “2-2”, “2-3”, and “3”. -1 "is held. According to this, the independent words “containers” included in the phrase identified by the phrase ID “1” constituting the search request sentence are sentence IDs “1-1”, “2-2”, “2-3”. And “3-1” indicates that the sentence is included in the search target sentence.
第1のリストには、文節ID「2」、文節の自立語「入れる」、文ID「1−1」、「2−2」および「3−2」が保持されている。これによれば、検索要求文を構成する文節ID「2」によって識別される文節に含まれる自立語「入れる」は、文ID「1−1」、「2−2」および「3−2」によって識別される検索対象文に含まれることが示される。 The first list holds a phrase ID “2”, a phrase independent word “put”, and sentence IDs “1-1”, “2-2”, and “3-2”. According to this, the independent word “enter” included in the phrase identified by the phrase ID “2” constituting the search request sentence is the sentence IDs “1-1”, “2-2”, and “3-2”. Is included in the search target sentence identified by.
第1のリストには、文節ID「3」、文節の自立語「インク」、文ID「1−1」、「2−1」、「2−2」および「3−2」が保持されている。これによれば、検索要求文を構成する文節ID「3」によって識別される文節に含まれる自立語「インク」は、文ID「1−1」、「2−1」、「2−2」および「3−2」によって識別される検索対象文に含まれることが示される。 In the first list, the phrase ID “3”, the phrase independent word “ink”, the sentence IDs “1-1”, “2-1”, “2-2”, and “3-2” are held. Yes. According to this, the independent words “ink” included in the phrase identified by the phrase ID “3” constituting the search request sentence are sentence IDs “1-1”, “2-1”, “2-2”. And “3-2” indicate that the sentence is included in the search target sentence.
また、第1のリストには、文節ID「4」、文節の自立語「移動」、文ID「1−1」、「2−3」および「3−1」が保持されている。これによれば、検索要求文を構成する文節ID「4」によって識別される文節に含まれる自立語「移動」は、文ID「1−1」、「2−3」および「3−1」によって識別される検索対象文に含まれることが示される。 The first list holds a phrase ID “4”, a phrase independent word “move”, and sentence IDs “1-1”, “2-3”, and “3-1”. According to this, the independent words “move” included in the phrase identified by the phrase ID “4” constituting the search request sentence are sentence IDs “1-1”, “2-3”, and “3-1”. Is included in the search target sentence identified by.
再び図8に戻ると、一次検索部33は、一次検索結果格納部25に格納された第1のリストを参照して、第1のリストに保持されている文IDを一致文IDとして第2のリストに追加する(ステップS14)。第2のリストに追加される一致文IDには、第1のリストに保持されている単独の文IDまたは当該第1のリストに保持されている文IDのうち同一の文書において連続する検索対象文(第1および第2の検索対象文)を識別するための文IDのペア(2つの文IDのペア)が含まれる。
Returning again to FIG. 8, the
次に、一次検索部33は、第2のリストに追加された一致文IDに対応づけて当該一致文IDに該当する文節ID(以下、該当文節IDと表記)を当該第2のリストに追加する(ステップS15)。ここで、該当文節IDとは、第2のリストに追加された一致文IDに対応づけて第1のリストに保持されている文節IDである。なお、第2のリストには、該当文節IDが1つしか存在しない検索対象文(つまり、検索要求文に含まれる自立語を1つしか含まない検索対象文)を識別するための文ID(以下、1語一致文IDと表記)が保持される。一次検索部33は、第2のリストを一次検索結果格納部25に格納する。
Next, the
一次検索部33は、一次検索結果格納部25に格納された第2のリストを参照して、当該第2のリストに保持されている一致文ID毎に、当該一致文ID(によって識別される検索対象文)が検索結果となるか否かを判定する処理(以下、検索結果判定処理と表記)を実行する(ステップS16)。
The
次に、図10のフローチャートを参照して、上記した検索結果判定処理(図8に示すステップS16の処理)の処理手順について説明する。 Next, with reference to the flowchart of FIG. 10, the processing procedure of the search result determination process (the process of step S16 shown in FIG. 8) will be described.
まず、検索結果判定処理においては、上記した第2のリストに保持されている一致文IDの各々について後述するステップS21以降の処理が実行される。以下、処理の対象となる一致文IDを対象一致文IDと称する。なお、対象一致文IDには、上記したように単独の文IDまたは2つの文ID(のペア)が含まれる。 First, in the search result determination process, the process after step S21 to be described later is executed for each of the matching sentence IDs held in the second list. Hereinafter, the matching sentence ID to be processed is referred to as a target matching sentence ID. The target matching sentence ID includes a single sentence ID or two sentence IDs (a pair thereof) as described above.
一次検索部33は、検索要求文を構成する文節を識別するための文節IDの全てが該当文節IDとして対象一致文IDに対応づけて第2のリストに保持されているか否かを判定する(ステップS21)。つまり、ステップS21においては、対象一致文IDによって識別される検索対象文に検索要求文に含まれる全ての自立語が含まれているか否かが判定される。
The
文節IDの全てが第2のリストに保持されていると判定された場合(ステップS21のYES)、一次検索部33は、対象一致文IDに1語一致文IDがあるか否かを判定する(ステップS22)。このステップS22は対象一致文IDに2つの文IDが含まれる場合を想定しており、当該2つの文IDのいずれかが1語一致文IDである場合には、対象一致文IDに1語一致文IDがあると判定される。
When it is determined that all the phrase IDs are held in the second list (YES in step S21), the
対象一致文IDに1語一致文IDがないと判定された場合(ステップS22のNO)、一次検索部33は、対象一致文ID(によって識別される検索対象文)に対する検索結果判定処理の結果(検索結果)をOKとする(ステップS23)。この場合、対象一致文IDに対応づけて結果「OK」が第2のリストに追加される。
When it is determined that there is no one-word matching sentence ID in the target matching sentence ID (NO in step S22), the
一方、ステップS21において文節IDの全てが第2のリストに保持されていないと判定された場合、または、ステップS22において対象一致文IDが1語一致文IDであると判定された場合、一次検索部33は、対象一致文IDを検索結果としない、つまり、当該対象一致文IDに対する検索結果判定処理の結果をNGとする(ステップS24)。この場合、対象一致文IDに対応づけて結果「NG」が第2のリストに追加される。
On the other hand, when it is determined in step S21 that all the phrase IDs are not held in the second list, or when it is determined in step S22 that the target matching sentence ID is a one-word matching sentence ID, a primary search is performed. The
ステップS23またはステップS24の処理が実行されると、一次検索部33は、第2のリストに保持されている一致文ID(一致文IDのペア)の全てについて上記した処理が実行されたか否かを判定する(ステップS25)。
When the process of step S23 or step S24 is executed, the
第2のリストに保持されている一致文IDの全てについて処理が実行されていないと判定された場合(ステップS25のNO)、ステップS21に戻って処理が繰り返される。この場合、処理が実行されていない一致文IDを対象一致文IDとして処理が実行される。 If it is determined that the process has not been executed for all the matching sentence IDs held in the second list (NO in step S25), the process returns to step S21 and is repeated. In this case, the process is executed with the matching sentence ID that has not been processed as the target matching sentence ID.
一方、第2のリストに保持されている一致文IDの全てについて処理が実行されたと判定された場合、ステップS26の処理が実行される。 On the other hand, when it is determined that the process has been executed for all the matching sentence IDs held in the second list, the process of step S26 is executed.
ここで、図11は、検索結果判定処理における判定結果(上記したステップS23またはステップS24の結果)が追加された第2のリストのデータ構造の一例を示す。図11に示すように、第2のリストには、一致文ID、該当文節ID、1語一致文IDおよび結果(検索結果判定処理における判定結果)が保持される。 Here, FIG. 11 shows an example of the data structure of the second list to which the determination result in the search result determination process (the result of step S23 or step S24 described above) is added. As shown in FIG. 11, the second list holds a matching sentence ID, a corresponding phrase ID, a one-word matching sentence ID, and a result (determination result in the search result determination process).
図11に示す例では、第2のリストには、一致文ID「1−1」および該当文節ID「1,2,3,4」が対応づけて保持されている。これによれば、一致文IDに含まれる単独の文ID「1−1」によって識別される検索対象文には、検索要求文を構成する文節のうち文節ID「1」、「2」、「3」および「4」によって識別される文節に含まれる自立語が含まれることが示される。この場合、一致文IDに含まれる単独の文ID「1−1」によって識別される検索対象文には、検索要求文に含まれる自立語の全てが含まれており、当該文ID「1−1」は1語一致文IDでないため、第2のリストには、一致文ID「1−1」に対応づけて当該検索対象文が検索結果となる旨を示す結果「OK」が保持されている。 In the example illustrated in FIG. 11, the second list holds the matching sentence ID “1-1” and the corresponding phrase ID “1, 2, 3, 4” in association with each other. According to this, for the search target sentence identified by the single sentence ID “1-1” included in the matching sentence ID, the phrase IDs “1”, “2”, “ It is shown that free words included in the phrase identified by “3” and “4” are included. In this case, the search target sentence identified by the single sentence ID “1-1” included in the matching sentence ID includes all the independent words included in the search request sentence, and the sentence ID “1- Since “1” is not a one-word match sentence ID, the second list holds a result “OK” indicating that the search target sentence becomes a search result in association with the match sentence ID “1-1”. Yes.
第2のリストには、一致文ID「2−1」、該当文節ID「1」および1語一致文ID「2−1」が対応づけて保持されている。これによれば、一致文IDに含まれる単独の文ID「2−1」によって識別される検索対象文には、検索要求文を構成する文節のうち文節ID「1」によって識別される文節に含まれる自立語が含まれることが示される。この場合、一致文IDに含まれる文ID「2−1」によって識別される検索対象文には検索要求文に含まれる自立語の全てが含まれておらず、当該文ID「2−1」は1語一致文IDであるため、第2のリストには、一致文ID「2−1」に対応づけて当該検索対象文が検索結果とならない旨を示す結果「NG」が保持されている。 In the second list, the matching sentence ID “2-1”, the corresponding phrase ID “1”, and the one-word matching sentence ID “2-1” are stored in association with each other. According to this, the search target sentence identified by the single sentence ID “2-1” included in the matching sentence ID includes the phrase identified by the phrase ID “1” among the phrases constituting the search request sentence. It is shown that the included independent words are included. In this case, the search target sentence identified by the sentence ID “2-1” included in the matching sentence ID does not include all the independent words included in the search request sentence, and the sentence ID “2-1”. Is a one-word match sentence ID, the second list holds a result “NG” indicating that the search target sentence does not become a search result in association with the match sentence ID “2-1”. .
第2のリストには、一致文ID「2−1,2−2(2つの文IDのペア)」、該当文節ID「1,2,3」および1語一致文ID「2−1」が保持されている。これによれば、一致文IDに含まれる2つの文ID「2−1」および「2−2」によって識別される検索対象文(のペア)には、検索要求文を構成する文節のうち文節ID「1」、「2」および「3」によって識別される文節に含まれる自立語が含まれることが示される。この場合、一致文IDに含まれる2つの文ID「2−1」および「2−2」によって識別される検索対象文には検索要求文に含まれる自立語の全てが含まれておらず、当該文ID「2−1」は1語一致文IDであるため、第2のリストには、一致文ID「2−1,2−2」に対応づけて当該検索対象文(のペア)が検索結果とはならない旨を示す結果「NG」が保持されている。 In the second list, the matching sentence ID “2-1, 2-2 (a pair of two sentence IDs)”, the corresponding phrase ID “1, 2, 3”, and the one-word matching sentence ID “2-1” are included. Is retained. According to this, in the search target sentence (pair) identified by the two sentence IDs “2-1” and “2-2” included in the matching sentence ID, the phrase among the phrases constituting the search request sentence is included. It is indicated that an independent word included in the phrase identified by the IDs “1”, “2”, and “3” is included. In this case, the search target sentence identified by the two sentence IDs “2-1” and “2-2” included in the matching sentence ID does not include all the independent words included in the search request sentence. Since the sentence ID “2-1” is a one-word matching sentence ID, the search target sentence (a pair) is associated with the matching sentence ID “2-1, 2-2” in the second list. A result “NG” indicating that the search result is not obtained is held.
また、第2のリストには、一致文ID「2−2,2−3」および該当文節ID「1,2,3,4」が保持されている。これによれば、一致文IDに含まれる2つの文ID「2−2」および「2−3」によって識別される検索対象文には、検索要求文を構成する文節のうち文節ID「1」、「2」、「3」および「4」によって識別される文節に含まれる自立語が含まれることが示される。この場合、一致文IDに含まれる2つの文ID「2−1」および「2−2」によって識別される検索対象文には検索要求文に含まれる自立語の全てが含まれており、当該文ID「2−2」および「2−3」は1語一致文IDでないため、一致文ID「2−1,2−2」に対応づけて当該検索対象文(のペア)が検索結果となる旨を示す結果「OK」が保持されている。 The second list holds the matching sentence ID “2-2, 2-3” and the corresponding phrase ID “1, 2, 3, 4”. According to this, in the search target sentence identified by the two sentence IDs “2-2” and “2-3” included in the matching sentence ID, the phrase ID “1” among the phrases constituting the search request sentence. , “2”, “3”, and “4” are indicated to include independent words included in the clauses identified. In this case, the search target sentence identified by the two sentence IDs “2-1” and “2-2” included in the matching sentence ID includes all the independent words included in the search request sentence. Since the sentence IDs “2-2” and “2-3” are not one-word matching sentence IDs, the search target sentence (a pair) is associated with the search result in association with the matching sentence IDs “2-1, 2-2”. The result “OK” indicating that is held is held.
なお、上記説明した一致文ID以外についても同様であるため、その詳しい説明を省略する。 Since the same applies to other than the coincidence sentence ID described above, detailed description thereof is omitted.
つまり、一次検索部33は、対象一致文IDに単独の文IDが含まれるときは、当該文IDによって識別される検索対象文に検索要求文に含まれる自立語の全てが含まれている場合に当該検索対象文を検索結果とする。また、一次検索部33は、対象一致文IDに2つの文IDが含まれるときは、当該文IDの各々によって識別される2つの検索対象文が検索要求文に含まれる自立語の全てを含み、かつ、当該検索対象文の各々が当該検索要求文に含まれる自立語を2以上含む場合に当該2つの検索対象文(第1および第2の検索対象文)を検索結果とする。
That is, when the target matching sentence ID includes a single sentence ID, the
再び図10に戻ると、一次検索部33は、上記した第2のリストにおいて結果「OK」に対応づけられている一致文IDによって識別される検索対象文を検索結果として一次検索格納部25に格納する(ステップS26)。
Returning again to FIG. 10, the
また、一次検索部33は、検索結果に対応する検索要求文の情報(以下、検索要求文情報と表記)を一次検索結果格納部25に格納する(ステップS27)。
Further, the
ここで、図12は、図10に示すステップS26において一次検索結果格納部25に格納された検索結果のデータ構造の一例を示す。
Here, FIG. 12 shows an example of the data structure of the search result stored in the primary search
図12に示すように、一次検索結果格納部25に格納された検索結果には、検索結果番号、検索結果ID、一次検索部33によって検索された検索対象文(文IDおよび検索対象文)および当該検索対象文の構文解析結果(文節ID、文節の自立語、品詞、親IDおよび関係)が対応づけて含まれる。
As shown in FIG. 12, the search result stored in the primary search
検索結果番号は、検索結果毎に付与される当該検索結果を識別するための識別番号である。検索結果IDは、検索結果番号によって識別される検索結果に含まれる検索対象文毎に付与される識別子である。なお、検索結果が1文(1つの検索対象文)である場合には、検索結果IDとして、検索結果番号と同一の値が付与される。一方、検索結果が2文(2つの検索対象文)である場合には、検索結果IDとして、一方の検索対象文に「検索結果番号−1」、他方の検索対象文に「検索結果番号−2」が付与される。 The search result number is an identification number for identifying the search result given for each search result. The search result ID is an identifier assigned to each search target sentence included in the search result identified by the search result number. When the search result is one sentence (one search target sentence), the same value as the search result number is assigned as the search result ID. On the other hand, when the search result is two sentences (two search target sentences), the search result ID is “search result number-1” for one search target sentence and “search result number− 2 "is given.
図12に示す例では、一次検索結果格納部25に格納された検索結果には、検索結果番号「1」、検索結果ID「1」、文ID「1−1」、検索対象文「インクを入れた容器を高速で移動する」および当該検索対象文の構文解析結果が含まれる。これによれば、検索結果番号「1」によって識別される検索結果が、検索結果ID「1」が付与された検索対象文「インクを入れた容器を高速で移動する」である旨が示されている。なお、検索対象文「インクを入れた容器を高速で移動する」は、文ID「1−1」によって識別される検索対象文である。
In the example shown in FIG. 12, the search result stored in the primary search
一次検索結果格納部25に格納された検索結果には、検索結果番号「2」、検索結果ID「2−1」、文ID「2−2」、検索対象文「インクを容器に入れる」および当該検索対象文の構文解析結果が含まれる。また、一次検索結果格納部25に格納された検索結果には、検索結果番号「2」、検索結果ID「2−2」、文ID「2−3」、検索対象文「容器を高速で移動する」および当該検索対象文の構文解析結果が含まれる。これによれば、検索結果番号「2」によって識別される検索結果が、検索結果ID「2−1」が付与された検索対象文「インクを容器に入れる」および検索結果ID「2−2」が付与された検索対象文「容器を高速で移動する」である旨が示されている。なお、検索対象文「インクを容器に入れる」は、文ID「2−2」によって識別される検索対象文である。また、検索対象文「容器を高速で移動する」は、文ID「2−3」によって識別される検索対象文である。
The search results stored in the primary search
また、一次検索結果格納部25に格納された検索結果には、検索結果番号「3」、検索結果ID「3−1」、文ID「3−1」、検索対象文「容器を高速で移動する」および当該検索対象文の構文解析結果が含まれる。また、一次検索結果格納部25に格納された検索結果には、検索結果番号「3」、文ID「3−2」、検索結果ID「3−2」、検索対象文「インクにペン先を入れる」および当該検索対象文の構文解析結果が含まれる。これによれば、検索結果番号「3」によって識別される検索結果が、検索結果ID「3−1」が付与された検索対象文「容器を高速で移動する」および検索結果ID「3−2」が付与された検索対象文「インクにペン先を入れる」である旨が示されている。なお、検索対象文「容器を高速で移動する」は、文ID「3−1」によって識別される検索対象文である。また、検索対象文「インクにペン先を入れる」は、文ID「3−2」によって識別される検索対象文である。
The search result stored in the primary search
図13は、図10に示すステップS27において一次検索結果格納部25に格納された検索要求文情報のデータ構造の一例を示す。
FIG. 13 shows an example of the data structure of the search request statement information stored in the primary search
図13に示すように、一次検索結果格納部25に格納された検索要求文情報には、検索結果ID、一致文ID、検索要求文および当該検索要求文の構文解析結果が対応づけて含まれる。
As shown in FIG. 13, the search request sentence information stored in the primary search
検索結果IDは、上記した図12に示す検索結果に含まれる検索結果IDである。一致文IDは、検索結果IDに対応づけて上記した図12に示す検索結果に含まれる検索対象文を識別するための文IDである。つまり、一致文IDは、検索結果IDが付与された検索対象文を識別するための文IDである。 The search result ID is a search result ID included in the search result shown in FIG. The matching sentence ID is a sentence ID for identifying the search target sentence included in the search result shown in FIG. 12 described above in association with the search result ID. That is, the matching sentence ID is a sentence ID for identifying the search target sentence to which the search result ID is assigned.
図13に示す例では、一次検索結果格納部25に格納された検索要求文情報には、検索結果ID「1」、一致文ID「1−1」、検索要求文「容器に入れたインクを移動する」および当該検索要求文の構文解析結果が含まれる。これによれば、検索要求文「容器に入れたインクを移動する」によって検索された検索対象文であって検索結果ID「1」が付与された検索対象文が、一致文ID「1−1」によって識別される検索対象文(つまり、図12に示す検索結果において文ID「1−1」に対応づけられている検索対象文)であることが示される。
In the example shown in FIG. 13, the search request sentence information stored in the primary search
一次検索結果格納部25に格納された検索要求文情報には、検索結果ID「2−1」、一致文ID「2−2」、検索要求文「容器に入れたインクを移動する」および当該検索要求文の構文解析結果が含まれる。これによれば、検索要求文「容器に入れたインクを移動する」によって検索された検索対象文であって検索結果ID「2−1」が付与された検索対象文が、一致文ID「2−2」によって識別される検索対象文(つまり、図12に示す検索結果において文ID「2−2」に対応づけられている検索対象文)であることが示される。
The search request sentence information stored in the primary search
一次検索結果格納部25に格納された検索要求文情報には、検索結果ID「2−2」、一致文ID「2−3」、検索要求文「容器に入れたインクを移動する」および当該検索要求文の構文解析結果が含まれる。これによれば、検索要求文「容器に入れたインクを移動する」によって検索された検索対象文であって検索結果ID「2−2」が付与された検索対象文が、一致文ID「2−3」によって識別される検索対象文(つまり、図12に示す検索結果において文ID「2−3」に対応づけられている検索対象文)であることが示される。
The search request sentence information stored in the primary search
一次検索結果格納部25に格納された検索要求文情報には、検索結果ID「3−1」、一致文ID「3−1」、検索要求文「容器に入れたインクを移動する」および当該検索要求文の構文解析結果が含まれる。これによれば、検索要求文「容器に入れたインクを移動する」によって検索された検索対象文であって検索結果ID「3−1」が付与された検索対象文が、一致文ID「3−1」によって識別される検索対象文(つまり、図12に示す検索結果において文ID「3−1」に対応づけられている検索対象文)であることが示される。
The search request sentence information stored in the primary search
また、一次検索結果格納部25に格納された検索要求文情報には、検索結果ID「3−2」、一致文ID「3−2」、検索要求文「容器に入れたインクを移動する」および検索要求文の構文解析結果が含まれる。これによれば、検索要求文「容器に入れたインクを移動する」によって検索された検索対象文であって検索結果ID「3−2」が付与された検索対象文が、一致文ID「3−2」によって識別される検索対象文(つまり、図12に示す検索結果において文ID「3−2」に対応づけられている検索対象文)であることが示される。
The search request text information stored in the primary search
なお、図13に示すように、一次検索結果格納部25に格納された検索要求文情報には、検索要求文の構文解析結果に含まれる各文節IDに対応づけて一致文節IDが含まれる。この一致文節IDは、検索要求文情報に含まれる検索結果IDが付与された検索対象文を構成する文節であって、対応づけられている文節IDによって識別される検索要求文の文節に一致する当該検索対象文の文節(当該検索要求文の文節に含まれる自立語を含む検索対象文の文節)を識別するための文節IDである。
As shown in FIG. 13, the search request sentence information stored in the primary search
次に、図14のフローチャートを参照して、上述した検索結果決定処理(図7に示すステップS5の処理)の処理手順について説明する。なお、検索結果決定処理においては、上記した図13に示す検索要求文情報に含まれる検索結果ID(図12に示す検索結果に含まれる検索結果ID)毎に、後述するステップS31〜ステップS36の処理が実行される。以下、処理の対象となる検索結果IDを対象検索結果IDと称する。 Next, the processing procedure of the above-described search result determination process (the process of step S5 shown in FIG. 7) will be described with reference to the flowchart of FIG. In the search result determination process, for each search result ID (search result ID included in the search result shown in FIG. 12) included in the search request sentence information shown in FIG. Processing is executed. Hereinafter, the search result ID to be processed is referred to as a target search result ID.
まず、部分検索要求生成部34は、対象検索結果IDに基づいて、当該対象検索結果IDを含む検索結果(に含まれる検索対象文)が1文であるか否かを判定する(ステップS31)。この場合、対象検索結果IDが上記したように「検索結果番号−1」または「検索結果番号−2」であれば、検索結果に含まれる検索対象文が1文でないと判定する。
First, based on the target search result ID, the partial search
検索結果に含まれる検索対象文が1文でないと判定された場合(ステップS31のNO)、部分検索要求生成部34は、検索要求文を構成する文節のうち、対象検索結果IDが付与された検索対象文を構成する文節と一致する文節(当該検索対象文に含まれる自立語を含む検索要求文の文節)に一致文節IDを設定する(ステップS32)。部分検索要求生成部34は、一次検索結果格納部25において対象検索結果IDに対応づけて検索要求文情報に含まれる一致文節IDに基づいて設定処理を実行する。
When it is determined that the search target sentence included in the search result is not one sentence (NO in step S31), the partial search
部分検索要求生成部34は、設定された一致文節IDを部分検索要求格納部26に格納する。
The partial search
部分検索要求生成部34は、部分検索要求格納部26を参照して、ステップS32において一致文節IDが設定された検索要求文の文節を保護に設定する(ステップS33)。
The partial search
次に、部分検索要求生成部34は、検索要求文を構成する文節のうち、保護に設定されていない各文節(検索要求文の保護未設定の各文節)に対してステップS34の処理を実行する。
Next, the partial search
部分検索要求生成部34は、検索要求文の保護未設定の文節に含まれる単語(自立語)に対して言い換えパタン格納部24に格納されている置換ルール(言い換えパタン)を適用する(ステップS34)。
The partial search
このステップS34の処理が検索要求文の保護未設定の文節(に含まれる単語)の全てに対して実行されることにより、検索要求文の言い換え処理が実行される。 By executing the process of step S34 for all the unprotected clauses (words included) in the search request sentence, the search request sentence paraphrase process is executed.
ここで、言い換え処理の詳細について説明する。言い換え処理においては、言い換え対象文(ここでは、検索要求文)の文節(の自立語)を含む構文木について、言い換えパタン格納部24に格納されている置換ルール(言い換えパタン)の条件と一致するか否かが判定される。このとき、言い換え対象文を構成する文節を含む構文木について、対象パタンの係り受け構造が成り立つとともに、言い換え対象文の文節が当該対象パタンと対応づけられている係り受け条件、品詞条件、および一致条件/保護条件を満足している場合に、言い換え対象文の各文節が置換ルールの置換条件と一致すると判定される。この場合、言い換え処理においては、置換ルールと対応づけられた対象パタンと一致する部分構文木を当該置換ルールと対応づけられた置換パタンに一致する構文木に置換する。これにより、言い換え対象文を言い換えることができる。なお、以下の言い換え処理についても同様であるため、その詳しい説明は省略する。
Here, the details of the paraphrase process will be described. In the paraphrase process, the syntax tree including the clause (independent word) of the paraphrase target sentence (here, the search request sentence) matches the condition of the substitution rule (paraphrase pattern) stored in the paraphrase
上記したような言い換え処理が検索要求文に対して実行されると、当該検索要求文の部分検索要求文が生成される。 When the paraphrase process as described above is executed on the search request sentence, a partial search request sentence of the search request sentence is generated.
なお、検索要求文の部分検索要求文の生成に伴い、当該部分検索要求文の構文解析結果が取得される。検索要求文の部分検索要求文および当該部分検索要求文の構文解析結果は、部分検索要求格納部26に格納される。
In addition, with the generation of the partial search request sentence of the search request sentence, the parsing result of the partial search request sentence is acquired. The partial search request sentence of the search request sentence and the parsing result of the partial search request sentence are stored in the partial search
部分検索要求生成部34は、ステップS35の処理が実行されていない検索要求文の保護未設定の文節があるか否かを判定する(ステップS35)。
The partial search
ステップS34の処理が実行されていない検索要求文の保護未設定の文節があると判定された場合(ステップS35のYES)、当該文節に含まれる単語に対してステップS34の処理が実行される。 If it is determined that there is an unprotected phrase of the search request sentence for which the process of step S34 has not been executed (YES in step S35), the process of step S34 is executed for the word included in the phrase.
一方、ステップS35の処理が実行されていない検索要求文の保護未設定の文節がないと判定された場合(ステップS35のNO)、複数用言処理が実行される(ステップS36)。複数用言処理においては、上記したように生成された検索要求文の部分検索要求文を用いて、一次検索結果格納部25に格納された対象検索結果IDが付与された検索対象文に対して言い換え検索処理が実行される。この言い換え検索結果は、後述する検索結果管理リストに追加される。検索結果管理リストは、言い換え検索結果格納部27にその領域が確保されている。なお、複数用言処理の詳細については後述する。
On the other hand, if it is determined that there is no unprotected phrase for the search request sentence for which the process of step S35 has not been executed (NO in step S35), a multiple precaution process is executed (step S36). In the multiple predicate processing, using the partial search request sentence of the search request sentence generated as described above, for the search target sentence assigned the target search result ID stored in the primary search result storage unit 25 A paraphrase search process is executed. This paraphrase search result is added to a search result management list described later. The area of the search result management list is secured in the paraphrase search
次に、一次検索結果格納部25に格納された検索要求文情報に含まれる検索結果IDの全てについて上記したステップS31〜ステップS36の処理が実行されたか否かが判定される(ステップS37)。 Next, it is determined whether or not the above-described steps S31 to S36 have been executed for all the search result IDs included in the search request statement information stored in the primary search result storage unit 25 (step S37).
検索要求文情報に含まれる検索結果IDの全てについてステップS31〜ステップS36の処理が実行されていないと判定された場合(ステップS37のNO)、ステップS31に戻って処理が繰り返される。この場合、処理が実行されていない検索結果IDを対象検索結果IDとしてステップS31の処理が実行される。 If it is determined that the processing in steps S31 to S36 has not been executed for all the search result IDs included in the search request text information (NO in step S37), the processing returns to step S31 and is repeated. In this case, the process of step S31 is executed with the search result ID that has not been processed as the target search result ID.
一方、検索要求文情報に含まれる検索結果IDの全てについてステップS31〜ステップS36の処理が実行されたと判定された場合(ステップS37のYES)、検索結果決定部36は、複数用言処理において検索結果管理リストに追加された言い換え検索結果に基づいて、一次検索結果格納部25に格納された検索結果の中からユーザに提示される検索結果を決定する(ステップS38)。この検索結果の決定処理は、一次検索結果格納部25に格納されて検索結果に含まれる検索結果番号毎に実行される。
On the other hand, when it is determined that the processing of step S31 to step S36 has been executed for all the search result IDs included in the search request text information (YES in step S37), the search
なお、ステップS31において検索結果に含まれる検索対象文が1文でない(つまり、2文である)と判定された場合、ステップS36の処理が実行される。この場合、複数用言処理においては、検索要求文を用いて処理が実行される。 When it is determined in step S31 that the search target sentence included in the search result is not one sentence (that is, two sentences), the process of step S36 is executed. In this case, in the multiple predicate processing, the processing is executed using the search request sentence.
次に、図15のフローチャートを参照して、上記した複数用言処理(図13に示すステップS36の処理)の処理手順について説明する。 Next, with reference to the flowchart of FIG. 15, a processing procedure of the above-mentioned plural precaution processing (the processing of step S <b> 36 shown in FIG. 13) will be described.
複数用言処理においては、上記した図14に示す検索結果決定処理に応じて検索要求文または当該検索要求文の部分検索要求文が用いられる。以下、複数用言処理において用いられる検索要求文または当該検索要求文の部分検索要求文を複数用言処理における入力文(以下、単に入力文と表記)として説明する。 In the multiple predicate processing, a search request sentence or a partial search request sentence of the search request sentence is used according to the search result determination process shown in FIG. Hereinafter, a search request sentence used in the multiple predicate process or a partial search request sentence of the search request sentence will be described as an input sentence (hereinafter simply referred to as an input sentence) in the multiple predicate process.
なお、上記した図14に示す検索結果決定処理と同様に、処理の対象となる検索結果IDを対象検索結果IDと称する。 Similar to the search result determination process shown in FIG. 14 described above, the search result ID to be processed is referred to as a target search result ID.
まず、部分検索要求生成部34は、入力文に含まれる自立語の中から、動詞の数Nをカウントする(ステップS41)。部分検索要求生成部34は、一次検索結果格納部25に格納された検索要求文情報に含まれる検索要求文の構文解析結果に基づいて、入力文の動詞の数Nをカウントする。
First, the partial search
次に、部分検索要求生成部34は、カウントされた入力文の動詞の数Nが1以下であるか否かを判定する(ステップS42)。
Next, the partial search
カウントされた入力文の動詞の数Nが1以下でないと判定された場合(ステップS42のNO)、部分検索要求生成部34は、Mの値を1(つまり、M=1)とする(ステップS43)。
When it is determined that the counted number N of input verbs is not 1 or less (NO in step S42), the partial search
部分検索要求生成部34は、入力文の情報を複数用言リストに追加する(ステップS44)。このとき、部分検索要求生成部34は、入力文の情報として、入力文、検索要求IDおよび当該入力文の構文解析結果を複数用言リストに追加する。また、複数用言リストに追加される入力文の情報には、図14に示す検索結果決定処理における対象検索結果ID、当該対象検索結果IDに対応づけて検索要求文情報に含まれる一致文IDおよび一致文節IDが含まれる。
The partial search
このとき、複数用言リストに追加される検索要求IDは、図14に示す検索結果決定処理における対象検索結果IDに基づいて、「(対象)検索結果ID−M」とする。 At this time, the search request ID to be added to the plural prescriptive list is “(target) search result ID-M” based on the target search result ID in the search result determination process shown in FIG.
また、入力文が検索要求文である場合には、一次検索結果格納部25に格納された検索要求文情報に含まれる検索要求文および検索要求文の構文解析結果が複数用言リストに追加される。一方、入力文が部分検索要求文である場合には、当該部分検索要求文および当該部分検索要求文の生成に伴って取得された当該部分検索要求文の構文解析結果(部分検索要求格納部26に格納された当該部分検索要求文の構文解析結果)が複数用言リストに追加される。なお、複数用言リストは、部分検索要求格納部26にその領域が確保されている。
When the input sentence is a search request sentence, the search request sentence included in the search request sentence information stored in the primary search
部分検索要求生成部34は、複数用言リストに追加された入力文の構文解析結果に基づいて、入力文に含まれる動詞のうちのM番目の動詞および当該動詞と係り受け関係にある単語(自立語)を保護に設定する(ステップS45)。
The partial search
次に、部分検索要求生成部34は、複数用言リストを参照して、入力文に対する言い換え処理を実行する(ステップS46)。このとき、部分検索要求生成部34は、入力文に含まれる自立語であって保護に設定されていない自立語に対して言い換えパタン格納部24に格納されている置換ルールを適用することにより上記した言い換え処理を実行する。
Next, the partial search
部分検索要求生成部34は、言い換え処理により、入力文が言い換えられた文(入力文の言い換え文)を当該入力文の部分検索要求文として生成する。なお、入力文の部分検索要求文の生成に伴い、当該部分検索要求文の構文解析結果が取得される。
The partial search
部分検索要求生成部34は、生成された入力文の部分検索要求文(言い換え処理結果)を複数検索要求リストに追加する(ステップS47)。複数検索要求リストには、入力文の部分検索要求文以外に、上記した複数用言リストに保持されている検索結果ID、一致文IDおよび検索要求IDが保持される。なお、複数検索要求リストは、言い換え検索結果格納部27にその領域が確保されている。
The partial
次に、言い換え検索部35は、複数検索要求リストに追加された入力文の部分検索要求文を用いて、対象検索結果IDが付与された検索対象文に対して言い換え検索処理を実行する(ステップS48)。
Next, the paraphrase
言い換え検索処理においては、言い換え検索部35は、一次検索結果格納部25に格納された検索結果に含まれる対象検索結果IDが付与された検索対象文の構文解析結果に基づいて、当該検索対象文に含まれる自立語のうち入力文の部分検索要求に含まれる自立語を保護に設定する。
In the paraphrase search process, the paraphrase
言い換え検索部35は、対象検索結果IDが付与された検索対象文に含まれる自立語であって保護に設定されていない自立語に対して言い換えパタン格納部24に格納されている置換ルールを適用することにより言い換え処理を実行する。
The paraphrase
言い換え検索部35は、この言い換え処理により、対象検索IDが付与された検索対象文が言い換えられた文(当該検索対象文の言い換え文)を生成する。なお、検索対象文の言い換え文の生成に伴い、当該検索対象文の言い換え文の構文解析結果が取得される。
The paraphrase
言い換え検索部35は、複数検索要求リストに追加された入力文の部分検索要求文および生成された検索対象文の言い換え文の構文解析結果を比較することにより、当該部分検索要求文および当該検索対象文の言い換え文が類似するか否かを判定する。具体的には、言い換え検索部35は、部分検索要求文および検索対象文の言い換え文に含まれる自立語間の係り受け構造が一致する場合には、当該部分検索要求文および当該検索対象文の言い換え文が類似すると判定する。
The paraphrase
言い換え検索部35は、上記した言い換え検索処理における判定結果(言い換え検索結果)を複数検索要求リストに追加する(ステップS49)。言い換え検索処理において部分検索要求文および検索対象文の言い換え文が類似すると判定された場合、言い換え検索結果として例えばOKが複数検索要求リストに追加される。一方、言い換え検索処理において部分検索要求文および検索対象文の言い換え文が類似しないと判定された場合、言い換え検索結果として例えばNGが複数検索要求リストに追加される。なお、言い換え検索結果は、上記した複数検索要求リストに保持されている対象検索結果ID、一致文ID、検索要求IDおよび部分検索要求文に対応づけて複数検索要求リストに追加される。
The paraphrase
次に、部分検索要求生成部34は、MをM+1(つまり、M=M+1)とする(ステップS50)。
Next, the partial search
ステップS50の処理が実行されると、部分検索要求生成部34は、MがN以下であるか否かを判定する(ステップS51)。
When the process of step S50 is executed, the partial search
MがN以下であると判定された場合(ステップS51のYES)、上記したステップS44に戻って処理が繰り返される。 When it is determined that M is equal to or less than N (YES in step S51), the process returns to step S44 described above and the process is repeated.
MがN以下でないと判定された場合(ステップS51のNO)、後述するステップS55の処理が実行される。 When it is determined that M is not N or less (NO in step S51), a process in step S55 described later is executed.
このように、ステップS44〜ステップS51の処理が繰り返されることにより、入力文に含まれる動詞毎に部分検索要求文が生成され、言い換え検索処理が実行される。 As described above, by repeating the processes in steps S44 to S51, a partial search request sentence is generated for each verb included in the input sentence, and the paraphrase search process is executed.
一方、上記したステップS42において入力文の動詞の数Nが1以下でない(つまり、Nが2以上である)と判定された場合、部分検索要求生成部34は、入力文(および当該入力文の構文解析結果)を複数用言リストに追加する(ステップS52)。
On the other hand, when it is determined in step S42 that the number N of verbs in the input sentence is not 1 or less (that is, N is 2 or more), the partial search
次に、言い換え検索部35は、複数用言リストに追加された入力文を用いて、対象検索結果IDが付与された検索対象文に対して言い換え検索処理を実行する(ステップS53)。なお、ステップS53の処理は、上記したステップS48の処理における入力文の部分検索要求文の代わりに入力文自体を用いる点以外は、当該ステップS48の処理と同様であるためその詳しい説明は省略する。つまり、ステップS53の処理においては、入力文および検索対象文(対象検索結果IDが付与された検索対象文)の言い換え文が類似するか否かが判定される。
Next, the paraphrase
言い換え検索部35は、上記したステップS53の言い換え検索処理における判定結果(言い換え検索結果)を複数検索要求リストに追加する(ステップS54)。言い換え検索処理において入力文および検索対象文の言い換え文が類似すると判定された場合、言い換え検索結果として例えばOKが複数検索要求リストに追加される。一方、言い換え検索処理において入力文および検索対象文の言い換え文が類似しないと判定された場合、言い換え検索結果として例えばNGが複数検索要求リストに追加される。
The paraphrase
上記したステップS51においてMがN以下でないと判定された場合、または、上記したステップS54の処理が実行された場合、部分検索要求生成部34は、複数検索要求リストに保持されている言い換え検索結果の全てがOKであるか否かを判定する(ステップS55)。
When it is determined in step S51 that M is not less than or equal to N, or when the process of step S54 described above is executed, the partial search
言い換え検索結果の全てがOKであると判定された場合(ステップS55のYES)、部分検索要求生成部34は、対象検索結果ID(が付与された検索対象文)に対するマッチ結果をOKとする(ステップS56)。
When it is determined that all of the paraphrase search results are OK (YES in step S55), the partial search
一方、言い換え検索結果の全てがOKでないと判定された場合(ステップS55のNO)、部分検索要求生成部34は、対象検索結果ID(が付与された検索対象文)に対するマッチ結果をNGとする(ステップS57)。
On the other hand, if it is determined that all of the paraphrase search results are not OK (NO in step S55), the partial search
ステップS56またはステップS57の処理が実行されると、部分検索要求生成部34は、マッチ結果(OKまたはNG)を検索結果管理リストに追加する(ステップS58)。このとき、部分検索要求生成部34は、対象検索結果IDに対応づけて検索結果に含まれる検索結果番号、当該対象検索結果ID、当該対象検索結果IDが付与された検索対象文の文ID(当該対象検索結果IDに対応づけて検索要求文情報に含まれる一致文ID)および当該検索対象文(対象検索結果IDが付与された検索対象文)に対応づけてマッチ結果を検索結果管理リストに追加する。
When the process of step S56 or step S57 is executed, the partial
上記したように図15に示す複数用言処理は、検索要求文情報に含まれる検索結果ID毎に実行されるため、検索結果管理リストには、検索結果ID(が付与された検索対象文)毎にマッチ結果が保持される。これにより、検索結果決定部36は、検索結果管理リストに保持されている検索結果番号によって識別される検索結果に含まれる検索結果IDの全てに対してマッチ結果としてOKが保持されている場合、当該検索結果に含まれる検索対象文をユーザに提示される検索結果として決定する。つまり、検索結果管理リストにおいて検索結果番号毎に対応づけられているマッチ結果の全てがOKである場合に、当該検索結果番号によって識別される検索結果に含まれる検索対象文が検索結果として決定される。
As described above, the multiple predicate processing shown in FIG. 15 is executed for each search result ID included in the search request sentence information. Therefore, the search result management list includes a search result ID (search target sentence to which is assigned). Each match result is retained. Thereby, the search
以下、図14および図15を用いて、上述した検索結果決定処理および複数用言処理について具体的に説明する。ここでは、図8および図10に示す一次検索処理の結果として図12に示す検索結果および図13に示す検索要求文情報が一次検索結果格納部25に格納されているものとする。
Hereinafter, the above-described search result determination process and multiple precaution process will be specifically described with reference to FIGS. 14 and 15. Here, it is assumed that the search result shown in FIG. 12 and the search request text information shown in FIG. 13 are stored in the primary search
上記したように検索結果決定処理(および複数用言処理)においては、一次検索結果格納部25に格納されている検索要求文情報(検索結果)に含まれる検索結果ID毎に図14に示すステップS31〜ステップS36の処理が実行される。つまり、図13に示す検索要求文情報に含まれる検索結果ID「1」、「2−1」、「2−2」、「3−1」および「3−2」の各々に対して図14に示すステップS31〜ステップS36の処理が実行される。
As described above, in the search result determination process (and the plural predicate process), the steps shown in FIG. 14 for each search result ID included in the search request sentence information (search result) stored in the primary search
まず、検索結果決定処理においては、図13に示す検索要求文情報が部分検索要求部34に引き渡される。
First, in the search result determination process, the search request text information shown in FIG. 13 is delivered to the partial
ここで、図13に示す検索要求文情報に含まれる検索結果ID「1」に対する処理(ステップS31〜ステップS36の処理)について説明する。つまり、検索結果ID「1」が上記した対象検索結果IDである場合の処理について説明する。 Here, the process for the search result ID “1” included in the search request text information shown in FIG. 13 (the process in steps S31 to S36) will be described. That is, a process when the search result ID “1” is the above-described target search result ID will be described.
なお、図12に示すように、検索結果ID「1」を含む検索結果を識別するための検索結果番号は検索結果番号「1」であり、当該検索結果ID「1」が付与された検索対象文は「インクを入れた容器を高速で移動する」である。 As shown in FIG. 12, the search result number for identifying the search result including the search result ID “1” is the search result number “1”, and the search target to which the search result ID “1” is assigned. The sentence is “moving at high speed a container containing ink”.
部分検索要求生成部34は、検索要求文情報に含まれる検索結果ID「1」に基づいて、当該検索結果IDを含む検索結果(図12に示す検索結果)に含まれる検索対象文が1文であるか否かを判定する(ステップS31)。この場合、検索結果IDが検索結果ID「1」であるため、検索結果に含まれる検索対象文が1文であると判定される。
Based on the search result ID “1” included in the search request sentence information, the partial search
検索結果に含まれる検索対象文が1文であると判定された場合(ステップS31のYES)、図15に示す複数用言処理が実行される(ステップS36)。この複数用言処理においては、図13に示す検索要求文情報に含まれる検索要求文「容器に入れたインクを移動する」を入力文として処理が実行される。 When it is determined that the search target sentence included in the search result is one sentence (YES in step S31), the multiple precaution processing shown in FIG. 15 is executed (step S36). In this multiple predicate process, the process is executed with the search request sentence “move ink contained in the container” included in the search request sentence information shown in FIG. 13 as an input sentence.
部分検索要求生成部34は、検索要求文(入力文)に含まれる自立語の中から、動詞の数Nをカウントする(ステップS41)。図13に示す検索要求文の構文解析結果によれば、検索要求文の動詞の数Nは2(「入れる」および「移動」)である。
The partial search
この場合、カウントされた検索要求文の動詞の数Nは1以下でないため(ステップS42のNO)、M=1とする(ステップS43)。 In this case, since the counted number N of search request verbs is not 1 or less (NO in step S42), M = 1 is set (step S43).
部分検索要求生成部34は、検索要求文の情報を複数用言リストに追加する(ステップS44)。部分検索要求生成部34は、検索要求文の情報として、検索要求ID「1−1」、検索要求文および当該検索要求文の構文解析結果を複数用言リストに追加する。また、複数用言リストに追加される検索要求文の情報には、検索結果ID「1」、当該検索結果ID「1」に対応づけて検索要求文情報に含まれる一致文IDおよび一致文節IDが含まれる。
The partial search
なお、複数用言リストに追加される検索要求IDは、「検索結果ID−M」であるため、ここでは検索要求ID「1−1」である。 Note that the search request ID added to the plural prescriptive list is “search result ID-M”, and is the search request ID “1-1” here.
部分検索要求生成部34は、複数用言リストに追加された検索要求文の構文解析結果に基づいて、当該検索要求文に含まれる動詞のうちのM番目(ここでは、1番目)の動詞および当該動詞と係り受け関係にある単語(自立語)を保護に設定する(ステップS45)。
The partial search
この場合、入力文である検索要求文に含まれる動詞のうちの1番目の動詞は「入れる」であり、当該動詞「入れる」と係り受け関係にある自立語は「容器」および「インク」である。よって、部分検索要求生成部34は、複数用言リストにおいて検索要求文に含まれる自立語「容器」、「入れる」および「インク」を保護に設定する。
In this case, the first verb among the verbs included in the search request sentence that is the input sentence is “put”, and the independent words that are dependent on the verb “put” are “container” and “ink”. is there. Therefore, the partial search
ここで、図16は、検索要求ID「1−1」が追加された複数用言リストのデータ構造の一例を示す。図16に示すように、複数用言リストには、検索結果ID「1」、一致文ID「1−1」、検索要求文「容器に入れたインクを移動する」、検索要求ID「1−1」、当該検索要求文の構文解析結果(文節ID、文節、品詞、親ID、関係)および一致文節IDが保持されている。また、図16に示す複数用言リストにおいては、上記したように検索要求文に含まれる自立語「容器」、「入れる」および「インク」に保護が設定されている。 Here, FIG. 16 shows an example of the data structure of the multiple prescriptive list to which the search request ID “1-1” is added. As shown in FIG. 16, a search result ID “1”, a matching sentence ID “1-1”, a search request sentence “move ink in a container”, and a search request ID “1- 1 ”, the parsing result (phrase ID, clause, part of speech, parent ID, relationship) and matching clause ID of the search request sentence are held. Further, in the plural prescriptive list shown in FIG. 16, as described above, protection is set for the independent words “container”, “put”, and “ink” included in the search request sentence.
次に、部分検索要求生成部34は、図16に示す複数用言リストを参照して、検索要求文に対する言い換え処理を実行する(ステップS46)。部分検索要求生成部34は、検索要求文に含まれる自立語であって保護に設定されていない自立語に対して言い換えパタン格納部24に格納されている置換ルールを適用することにより言い換え処理を実行する。これにより、検索要求文の部分検索要求文(以下、単に部分検索要求文と表記)が生成される。
Next, the partial search
ここで、図17は、検索結果ID「1」に対する処理における検索要求ID「1−1」の場合の検索要求文の言い換え処理結果を示す。図17において、言い換え回数0として示されている文は、言い換え処理の対象となる文(つまり、検索要求文)である。また、言い換え回数1として示されている文は、検索要求文に対して言い換えパタン(置換ルール)を1回適用することによって生成された言い換え文(部分検索要求文)である。図17に示すように、言い換え処理によって検索要求文「容器に入れたインクを移動する」から部分検索要求文「容器に入れたインク」が生成される。また、図17に示すように、言い換え処理によって部分検索要求文の構文解析結果(文節ID、文節の自立語、品詞、親IDおよび関係)が取得される。
Here, FIG. 17 shows the paraphrase process result of the search request sentence in the case of the search request ID “1-1” in the process for the search result ID “1”. In FIG. 17, a sentence indicated as paraphrase
部分検索要求生成部34は、言い換え処理結果として生成された部分検索要求文「容器に入れたインク」を複数検索要求リストに追加する(ステップS47)。部分検索要求生成部34は、図16に示す複数用言リストに保持されている検索結果ID、一致文IDおよび検索要求IDに対応づけて部分検索要求文を複数検索要求リストに追加する。
The partial search
次に、言い換え検索部35は、複数検索要求リストに追加された部分検索要求文を用いて、検索結果ID「1」が付与された検索対象文に対して言い換え検索処理を実行する(ステップS48)。この場合、言い換え検索部35は、一次検索結果格納部25に格納されている検索結果ID「1」が付与された検索対象文「インクを入れた容器を高速で移動する」の構文解析結果に基づいて、当該検索対象文に含まれる自立語のうち複数検索要求リストに追加された部分検索要求文「容器に入れたインク」に含まれる自立語を保護に設定する。ここでは、検索対象文に含まれる自立語のうち自立語「インク」、「入れた」および「容器」に保護が設定される。
Next, the paraphrase
言い換え検索部35は、検索結果ID「1」が付与された検索対象文に含まれる自立語であって保護に設定されていない自立語に対して言い換えパタン格納部24に格納されている置換ルールを適用することにより言い換え処理を実行する。
The paraphrase
ここで、図18は、部分検索要求文「容器に入れたインク」に対する検索結果ID「1」が付与された検索対象文の言い換え処理結果を示す。図18に示すように、言い換え処理によって検索対象文「インクを入れた容器を高速で移動する」から当該検索対象文の言い換え文「インクを入れた容器」が生成される。また、図18に示すように、言い換え処理によって検索対象文の言い換え文の構文解析結果(文節ID、文節の自立語、品詞、親IDおよび関係)が取得される。 Here, FIG. 18 shows the paraphrase processing result of the search target sentence to which the search result ID “1” is assigned to the partial search request sentence “ink contained in the container”. As shown in FIG. 18, the paraphrase sentence “container with ink” of the search target sentence is generated from the search target sentence “moves the container with ink at high speed” by the paraphrase process. Also, as shown in FIG. 18, the parsing process obtains the parsing result of the paraphrase sentence of the search target sentence (phrase ID, phrase independent word, part of speech, parent ID, and relationship).
言い換え検索部35は、複数検索要求リストに追加された部分検索要求文「容器に入れたインク」および生成された検索対象文の言い換え文「インクを入れた容器」の構文解析結果を比較することにより、当該部分検索要求文および当該検索対象文の言い換え文が類似するか否かを判定する。
The paraphrase
ここで、図19は、部分検索要求文「容器に入れたインク」および検索対象文の言い換え文「インクを入れた容器」が類似するか否かの判定結果を示す。図19に示す左側から1〜3カラムは部分検索要求文「容器に入れたインク」の各部分木を示し、4〜6カラムは検索対象文の言い換え文「インクを入れた容器」の各部分木を示す。また、図19において、部分検索要求文の一つの部分木と検索対象文の言い換え文の一つの部分木が一致する場合、7カラム目の結果がOKとなる。部分検索要求文の全ての部分木に対する結果がOKである場合、部分検索要求文および検索対象文の言い換え文(の表現)は同じ意味内容を示している(つまり、類似する)と判定される。つまり、図19においては、部分検索要求文「容器に入れたインク」および検索対象文の言い換え文「インクを入れた容器」は類似するとの判定結果(言い換え検索結果)が示されている。
Here, FIG. 19 shows a determination result of whether or not the partial search request sentence “ink contained in a container” and the paraphrase sentence “container containing ink” of the search target sentence are similar.
言い換え検索部35は、上記した言い換え検索処理における言い換え検索結果(ここでは、OK)を複数検索要求リストに追加する(ステップS49)。言い換え検索結果は、上記した複数検索要求リストに保持されている検索結果ID「1」、一致文ID「1−1」および部分検索要求文「容器に入れたインク」に対応づけて複数検索要求リストに追加される。
The paraphrase
次に、部分検索要求生成部34は、MをM+1(ここでは、M=2)とする(ステップS50)。ここで、M(=2)は上記したN(ここでは、2)以下である。この場合、M=2として上述した図15に示すステップS44〜ステップS49の処理が実行される。
Next, the partial search
ここで、図20〜図23を参照して、M=2とした場合のステップS44〜ステップS49の処理について説明する。なお、上記したM=1である場合の処理と同様の部分についてはその詳しい説明を省略する。 Here, with reference to FIG. 20 to FIG. 23, processing in steps S44 to S49 when M = 2 is described. The detailed description of the same parts as those in the case where M = 1 is omitted.
部分検索要求生成部34は、検索要求文の情報を複数用言リストに追加する(ステップS44)。この場合、複数用言リストに追加される検索要求IDは、検索要求ID「1−2」である。
The partial search
また、部分検索要求生成部34は、複数用言リストに追加された検索要求文の構文解析結果に基づいて、当該検索要求文に含まれる動詞のうちのM番目(ここでは、2番目)の動詞(ここでは、「移動」)および当該動詞と係り受け関係にある単語(自立語)を複数用言リストにおいて保護に設定する。
Further, the partial search
図20は、検索要求ID「1−2」が追加された複数用言リストのデータ構造の一例を示す。図20に示すように、複数用言リストには、検索結果ID「1」、一致文ID「1−1」、検索要求文「容器に入れたインクを移動する」、検索要求ID「1−2」、当該検索要求文の構文解析結果および一致文節IDが保持されている。また、図20に示す複数用言リストにおいては、上記したように検索要求文に含まれる自立語「インク」および「移動」(2番目の動詞「移動」および当該動詞と係り受け関係にある自立語「インク」)に保護が設定されている。 FIG. 20 shows an example of the data structure of the multiple predicate list to which the search request ID “1-2” is added. As illustrated in FIG. 20, a search result ID “1”, a matching sentence ID “1-1”, a search request sentence “move ink in a container”, and a search request ID “1- 2 ”, the parsing result of the search request sentence and the matching phrase ID are held. In the plural prescriptive list shown in FIG. 20, as described above, the independent words “ink” and “move” included in the search request sentence (the second verb “move” and the independent words that are in a dependency relationship with the verb). The word “ink” is protected.
次に、部分検索要求生成部34は、図20に示す複数用言リストを参照して、検索要求文に対する言い換え処理を実行する(ステップS46)。
Next, the partial search
図21は、検索結果ID「1」に対する処理における検索要求ID「1−2」の場合の検索要求文の言い換え処理結果を示す。ここでは、図21に示すように検索要求文に対して言い換えパタン(置換ルール)を2回適用することによって検索要求文「容器に入れたインクを移動する」から部分検索要求文「インクを移動する」が生成される。 FIG. 21 shows the paraphrase process result of the search request sentence in the case of the search request ID “1-2” in the process for the search result ID “1”. Here, as shown in FIG. 21, by applying the paraphrase pattern (replacement rule) twice to the search request sentence, the partial search request sentence “moving ink” from the search request sentence “moving ink contained in the container”. Will be generated.
部分検索要求生成部34は、言い換え処理結果として生成された部分検索要求文「インクを移動する」を複数検索要求リストに追加する(ステップS47)。
The partial search
言い換え検索部35は、複数検索要求リストに追加された部分検索要求文を用いて、検索結果ID「1」が付与された検索対象文に対して言い換え検索処理を実行する(ステップS48)。この場合、言い換え検索部35は、検索結果ID「1」が付与された検索対象文「インクを入れた容器を高速で移動する」の構文解析結果に基づいて、当該検索対象文に含まれる自立語のうち複数検索要求リストに追加された部分検索要求文「インクを移動する」に含まれる自立語を保護に設定する。ここでは、検索対象文に含まれる自立語のうち自立語「インク」および「移動」に保護が設定される。
The paraphrase
言い換え検索部35は、検索結果ID「1」が付与された検索対象文に含まれる自立語であって保護に設定されていない自立語に対して言い換えパタン格納部24に格納されている置換ルールを適用することにより言い換え処理を実行する。
The paraphrase
ここで、図22は、部分検索要求文「インクを移動する」に対する検索結果ID「1」が付与された検索対象文の言い換え処理結果を示す。図22に示すように、言い換え処理によって検索対象文「インクを入れた容器を高速で移動する」から当該検索対象文の言い換え文「インクを高速で移動する」が生成される。 Here, FIG. 22 shows the paraphrase processing result of the search target sentence to which the search result ID “1” is assigned to the partial search request sentence “move ink”. As shown in FIG. 22, the paraphrase sentence “moving ink at high speed” of the search target sentence is generated from the search target sentence “moving the ink-filled container at high speed” by the paraphrase processing.
言い換え検索部35は、複数検索要求リストに追加された部分検索要求文「インクを移動する」および生成された検索対象文の言い換え文「インクを高速で移動する」の構文解析結果を比較することにより、当該部分検索要求文および当該検索対象文の言い換え文が類似するか否かを判定する。
The paraphrase
ここで、図23は、部分検索要求文「容器に入れたインク」および検索対象文の言い換え文「インクを高速で移動する」が類似するか否かの判定結果を示す。図23においては、部分検索要求文「インクを移動する」および検索対象文の言い換え文「インクを高速で移動する」は類似するとの判定結果(言い換え検索結果)が示されている。 Here, FIG. 23 shows a determination result of whether or not the partial search request sentence “ink placed in the container” and the paraphrase sentence “moving ink at high speed” of the search target sentence are similar. FIG. 23 shows a determination result (paraphrase search result) that the partial search request sentence “move ink” and the paraphrase sentence “move ink at high speed” of the search target sentence are similar.
言い換え検索部35は、上記した言い換え検索処理における言い換え検索結果(ここでは、OK)を複数検索要求リストに追加する(ステップS49)。言い換え検索結果は、上記した複数検索要求リストに保持されている検索結果ID「1」、一致文ID「1−1」および部分検索要求文「インクを移動する」に対応づけて複数検索要求リストに追加される。
The paraphrase
次に、部分検索要求生成部34は、MをM+1(ここでは、M=3)とする(ステップS50)。この場合、M(=3)は上記したN(ここでは、2)以下でないため、ステップS55の処理が実行される。
Next, the partial search
部分検索要求生成部34は、複数検索要求リストに保持されている言い換え検索結果の全てがOKであるか否かを判定する(ステップS55)。
The partial search
ここで、図24は、検索結果ID「1」に対する処理における言い換え検索結果を保持する複数検索要求リストのデータ構造の一例を示す。図24に示すように、上記したM=1の場合における言い換え検索結果(検索要求ID「1−1」に対応づけられている言い換え検索結果)は、OKである。また、上記したM=2の場合における言い換え検索結果(検索要求ID「1−2」に対応づけられている言い換え検索結果)は、OKである。 Here, FIG. 24 shows an example of the data structure of the multiple search request list that holds the paraphrase search result in the process for the search result ID “1”. As shown in FIG. 24, the paraphrase search result (the paraphrase search result associated with the search request ID “1-1”) in the case of M = 1 described above is OK. In addition, the paraphrase search result (the paraphrase search result associated with the search request ID “1-2”) in the case of M = 2 described above is OK.
したがって、部分検索要求生成部34は、複数検索要求リストに保持されている言い換え検索結果の全てがOKであると判定する(ステップS55のYES)。
Therefore, the partial search
この場合、部分検索要求生成部34は、検索結果ID「1」(が付与された検索対象文)に対するマッチ結果をOKとする(ステップS56)。
In this case, the partial search
つまり、上記したように検索要求文に複数の動詞が含まれる場合には、当該動詞毎に部分検索要求文が生成され、当該部分検索要求文の各々に対応する検索対象文の言い換え文が生成される。言い換え検索処理においては、これらの動詞毎に生成された部分検索要求文および当該部分検索要求文に対応する検索対象文の言い換え文(当該部分検索要求を用いて生成された検索対象文の言い換え文)の全てが類似すると判定された場合(つまり、全ての言い換え検索結果がOKである場合)にマッチ結果がOKとされる。 That is, as described above, when a search request sentence includes a plurality of verbs, a partial search request sentence is generated for each verb, and a paraphrase sentence of a search target sentence corresponding to each of the partial search request sentences is generated. Is done. In the paraphrase search process, the partial search request sentence generated for each of these verbs and the paraphrase sentence of the search target sentence corresponding to the partial search request sentence (the paraphrase sentence of the search target sentence generated using the partial search request) ) Are determined to be similar (that is, when all the paraphrase search results are OK), the match result is determined to be OK.
部分検索要求生成部34は、マッチ結果「OK」を検索結果管理リストに追加する(ステップS58)。このマッチ結果「OK」は、検索結果ID「1」に対応づけて検索結果に含まれる検索結果番号「1」、当該検索結果ID「1」、当該検索結果ID「1」が付与された検索対象文の文ID「1−1」(当該検索結果ID「1」に対応づけて検索要求文情報に含まれる一致文ID「1−1」)および当該検索対象文「インクを入れた容器を高速で移動する」に対応づけて検索結果管理リストに追加される。
The partial search
上記したようにステップS58の処理が実行されると、検索結果ID「1」に対する処理は終了される。 When the process of step S58 is executed as described above, the process for the search result ID “1” is terminated.
次に、検索結果ID「1」に対する処理が終了されると、部分検索要求生成部34は、検索要求文情報に含まれる検索結果IDの全てについて図14に示すステップS31〜ステップS36の処理が実行されたか否かを判定する(ステップS37)。
Next, when the process for the search result ID “1” is completed, the partial search
ここでは、検索結果ID「1」については処理が実行されたが、検索結果ID「2−1」、「2−2」、「3−1」および「3−2」については処理が実行されていないため、ステップS31に戻って処理が繰り返される。この場合、検索結果ID「2−1」に対する処理が実行されることになる。 Here, the process is executed for the search result ID “1”, but the process is executed for the search result IDs “2-1”, “2-2”, “3-1”, and “3-2”. Therefore, the process returns to step S31 and is repeated. In this case, the process for the search result ID “2-1” is executed.
次に、図13に示す検索要求文情報に含まれる検索結果ID「2−1」に対する処理について説明する。なお、図12に示すように、検索結果ID「2−1」を含む検索結果を識別するための検索結果番号は検索結果番号「2」であり、当該検索結果ID「2−1」が付与された検索対象文は「インクを容器に入れる」である。 Next, processing for the search result ID “2-1” included in the search request text information shown in FIG. 13 will be described. As shown in FIG. 12, the search result number for identifying the search result including the search result ID “2-1” is the search result number “2”, and the search result ID “2-1” is assigned. The retrieved text is “put ink into the container”.
まず、部分検索要求生成部34は、検索要求文情報に含まれる検索結果ID「2−1」に基づいて、当該検索結果IDを含む検索結果(図12に示す検索結果)に含まれる検索対象文が1文であるか否かを判定する(ステップS31)。この場合、検索結果IDが「2−1」であるため、検索結果に含まれる検索対象文が1文でないと判定される。
First, based on the search result ID “2-1” included in the search request statement information, the partial search
検索結果に含まれる検索対象文が1文でないと判定された場合(ステップS31のNO)、部分検索要求生成部34は、検索要求文を構成する文節のうち、検索結果ID「2−1」が付与された検索対象文を構成する文節と一致する文節に一致文節IDを設定する(ステップS32)。このとき、部分検索要求生成部34は、図13に示す検索要求文情報において検索結果ID「2−1」に対応づけられている一致文節IDに基づいて設定処理を実行する。
When it is determined that the search target sentence included in the search result is not one sentence (NO in step S31), the partial search
この場合、検索要求文を構成する文節のうち、文節ID「1」、「2」および「3」によって識別される文節に一致文節IDが設定される。 In this case, the matching phrase ID is set to the phrase identified by the phrase IDs “1”, “2”, and “3” among the phrases constituting the search request sentence.
部分検索要求生成部34は、検索要求文を構成する文節のうち、一致文節IDが設定された文節(ここでは、文節ID「1」、「2」および「3」によって識別される文節)を保護に設定する(ステップS33)。
The partial search
次に、部分検索要求生成部34は、検索要求文の保護未設定の文節に含まれる単語(ここでは、自立語「移動」)に対して言い換えパタン格納部24に格納されている置換ルールを適用する(ステップS34)。これにより、部分検索要求生成部34は、検索要求文の言い換え処理を行う。検索要求文の言い換え処理が実行されると、当該検索要求文の部分検索要求文が生成される。
Next, the partial search
ここで、図25は、検索結果ID「2−1」に対する処理における検索要求文の言い換え処理結果を示す。ここでは、図25に示すように検索要求文に対して言い換えパタン(置換ルール)を1回適用することによって検索要求文「容器に入れたインクを移動する」から部分検索要求文「容器に入れたインク」が生成される。また、図25に示すように、言い換え処理によって部分検索要求文「容器に入れたインク」の構文解析結果が取得される。 Here, FIG. 25 shows the paraphrase process result of the search request sentence in the process for the search result ID “2-1”. Here, as shown in FIG. 25, by applying the paraphrase pattern (replacement rule) once to the search request sentence, the search request sentence “move the ink in the container” to the partial search request sentence “put in the container”. Ink "is generated. Further, as shown in FIG. 25, the parsing result of the partial search request sentence “ink placed in the container” is acquired by the paraphrase process.
ステップS34の処理が実行されていない検索要求文の保護未設定の文節はないため(ステップS35のNO)、図15に示す複数用言処理が実行される(ステップS36)。この複数用言処理においては、上記した部分検索要求文「容器に入れたインク」を入力文として処理が実行される。 Since there is no unset clause in the search request sentence for which the process in step S34 has not been executed (NO in step S35), the multiple precaution process shown in FIG. 15 is executed (step S36). In this plural prescriptive process, the process is executed with the partial search request sentence “ink placed in the container” as an input sentence.
部分検索要求生成部34は、部分検索要求文(入力文)に含まれる自立語の中から、動詞の数Nをカウントする(ステップS41)。図25に示す部分検索要求文の構文解析結果によれば、当該部分検索要求文の動詞は「入れる」のみであるため、当該動詞の数Nは1である。
The partial search
この場合、カウントされた部分検索要求文の動詞の数Nは1以下であるため(ステップS42のYES)、部分検索要求生成部34は、部分検索要求文(および当該部分検索要求文の構文解析結果)を複数用言リストに追加する(ステップS52)。
In this case, since the counted number N of verbs in the partial search request sentence is 1 or less (YES in step S42), the partial
次に、言い換え検索部35は、複数用言リストに追加された部分検索要求文を用いて、検索結果ID「2−1」が付与された検索対象文に対して言い換え検索処理を実行する(ステップS53)。この場合、言い換え検索部35は、一次検索結果格納部25に格納されている検索結果ID「2−1」が付与された検索対象文「インクを容器に入れる」の構文解析結果に基づいて、当該検索対象文に含まれる自立語のうち部分検索要求文に含まれる自立語を保護に設定する。ここでは、検索対象文に含まれる自立語「インク」、「容器」および「入れる」の全てに保護が設定される。
Next, the paraphrase
言い換え検索部35は、検索結果ID「2−1」が付与された検索対象文に含まれる自立語であって保護に設定されていない自立語に対して言い換えパタン格納部24に格納されている置換ルールを適用することにより言い換え処理を実行する。
The paraphrase
ここで、図26は、検索結果ID「2−1」が付与された検索対象文の言い換え処理結果を示す。上記したように検索結果ID「2−1」が付与された検索対象文に含まれる自立語の全てに保護が設定されているため、図26に示すように言い換えパタン格納部24に格納されている置換ルールは適用されない。したがって、検索対象文に対しては言い換え処理が実行されず、当該検索対象文のまま以降の処理が実行される。このように、検索対象文および保護が設定された自立語によっては、言い換え処理が実行されない場合がある。
Here, FIG. 26 shows the paraphrase processing result of the search target sentence assigned the search result ID “2-1”. As described above, since protection is set for all of the free words included in the search target sentence to which the search result ID “2-1” is assigned, as shown in FIG. 26, the words are stored in the paraphrase
言い換え検索部35は、複数用言リストに追加された部分検索要求文「容器に入れたインク」および検索対象文「インクを容器に入れる」の構文解析結果を比較することにより、当該部分検索要求文および検索対象文の言い換え文が類似するか否かを判定する。
The paraphrase
ここで、図27は、部分検索要求文「容器に入れたインク」および検索対象文「インクを容器に入れる」が類似するか否かの判定結果を示す。図27においては、部分検索要求文「容器に入れたインク」および検索対象文「インクを容器に入れる」は類似するとの判定結果(言い換え検索結果)が示されている。 Here, FIG. 27 shows a determination result of whether or not the partial search request sentence “ink placed in the container” and the search target sentence “put ink into the container” are similar. FIG. 27 shows a determination result (in other words, a search result) that the partial search request sentence “ink placed in the container” and the search target sentence “put ink into the container” are similar.
言い換え検索部35は、言い換え検索処理における言い換え検索結果(ここでは、OK)を複数検索要求リストに追加する(ステップS54)。言い換え検索結果は、例えば検索結果ID「2−1」等に対応づけて複数検索要求リストに追加される。
The paraphrase
次に、部分検索要求生成部34は、複数検索要求リストに保持されている言い換え検索結果の全てがOKであるか否かを判定する(ステップS55)。
Next, the partial search
この場合、上記した複数検索要求リストにおいては、検索結果ID「2−1」に対応づけられている言い換え検索結果は1つであり、当該言い換え検索結果はOKである。 In this case, in the multiple search request list described above, there is one paraphrase search result associated with the search result ID “2-1”, and the paraphrase search result is OK.
したがって、部分検索要求生成部34は、複数検索要求リストに保持されている言い換え検索結果の全てがOKであると判定する(ステップS55のYES)。
Therefore, the partial search
この場合、部分検索要求生成部34は、検索結果ID「2−1」(が付与された検索対象文)に対するマッチ結果をOKとする(ステップS56)。
In this case, the partial search
部分検索要求生成部34は、マッチ結果「OK」を検索結果管理リストに追加する(ステップS58)。このマッチ結果「OK」は、検索結果ID「2−1」に対応づけて検索結果に含まれる検索結果番号「2」、当該検索結果ID「2−1」、当該検索結果ID「2−1」が付与された検索対象文の文ID「2−2」(当該検索結果ID「2−1」に対応づけて検索要求文情報に含まれる一致文ID「2−2」)および当該検索対象文「インクを容器に入れる」に対応づけて検索結果管理リストに追加される。
The partial search
上記したようにステップS58の処理が実行されると、検索結果ID「2−1」に対する処理は終了される。 When the process of step S58 is executed as described above, the process for the search result ID “2-1” is terminated.
検索結果ID「2−1」に対する処理が終了されると、同様に、検索結果ID「2−2」、「3−1」および「3−2」に対する処理が順次実行される。 When the process for the search result ID “2-1” is completed, the processes for the search result IDs “2-2”, “3-1”, and “3-2” are sequentially executed.
以下、検索結果ID「2−2」、「3−1」および「3−2」に対する処理(図14に示すステップS31〜ステップS36の処理)について簡単に説明する。なお、上記した検索結果ID「2−1」に対する処理と同様の部分についてはその詳しい説明を省略する。 In the following, processing for the search result IDs “2-2”, “3-1”, and “3-2” (steps S31 to S36 shown in FIG. 14) will be briefly described. The detailed description of the same part as the process for the search result ID “2-1” is omitted.
まず、図28〜図30を用いて、検索結果ID「2−2」に対する処理について説明する。なお、図12に示すように、検索結果ID「2−2」に対応づけられている検索結果番号は検索結果番号「2」であり、当該検索結果ID「2−2」が付与された検索対象文は「容器を高速で移動する」である。 First, processing for the search result ID “2-2” will be described with reference to FIGS. 28 to 30. As shown in FIG. 12, the search result number associated with the search result ID “2-2” is the search result number “2”, and the search with the search result ID “2-2” is assigned. The target sentence is “moving the container at high speed”.
まず、部分検索要求生成部34は、検索要求文情報に含まれる検索結果ID「2−2」に基づいて、検索結果に含まれる検索対象文が1文であるか否かを判定する(ステップS31)。この場合、検索結果IDが「2−2」であるため、検索結果に含まれる検索対象文が1文でないと判定される。
First, the partial search
検索結果に含まれる検索対象文が1文でないと判定された場合(ステップS31のNO)、部分検索要求生成部34は、検索要求文を構成する文節のうち、検索結果ID「2−2」が付与された検索対象文を構成する文節と一致する文節に一致文節IDを設定する(ステップS32)。この場合、検索要求文を構成する文節のうち、文節ID「1」および「4」によって識別される文節に一致文節IDが設定される。
When it is determined that the search target sentence included in the search result is not one sentence (NO in step S31), the partial search
部分検索要求生成部34は、検索要求文を構成する文節のうち、一致文節IDが設定された文節(ここでは、文節ID「1」および「4」によって識別される文節)を保護に設定する(ステップS33)。
The partial search
次に、部分検索要求生成部34は、検索要求文の保護未設定の文節に含まれる単語(ここでは、自立語「入れる」および「インク」)の各々に対して言い換えパタン格納部24に格納されている置換ルールを適用する(ステップS34、S35)。これにより、部分検索要求生成部34は、検索要求文の言い換え処理を行う。検索要求文の言い換え処理が実行されると、当該検索要求文の部分検索要求文が生成される。
Next, the partial search
ここで、図28は、検索結果ID「2−2」に対する処理における検索要求文の言い換え処理結果を示す。ここでは、図28に示すように検索要求文に対して言い換えパタン(置換ルール)が2回適用されることによって検索要求文「容器に入れたインクを移動する」から部分検索要求文「容器を移動する」が生成される。 Here, FIG. 28 shows the paraphrase process result of the search request sentence in the process for the search result ID “2-2”. Here, as shown in FIG. 28, by applying the paraphrase pattern (replacement rule) twice to the search request sentence, the partial search request sentence “container container” is changed from the search request sentence “moving ink contained in the container”. "Move" is generated.
上記した言い換え処理が実行されると、図15に示す複数用言処理が実行される(ステップS36)。この複数用言処理においては、上記した部分検索要求文「容器を移動する」を入力文として処理が実行される。 When the above paraphrasing process is executed, the plural prescriptive process shown in FIG. 15 is executed (step S36). In this multiple predicate process, the above-described partial search request sentence “move container” is executed as an input sentence.
部分検索要求生成部34は、部分検索要求文(入力文)に含まれる自立語の中から、動詞の数Nをカウントする(ステップS41)。図28に示す部分検索要求文の構文解析結果によれば、当該部分検索要求文の動詞の数Nは1である。
The partial search
この場合、カウントされた部分検索要求文の動詞の数Nは1以下であるため(ステップS42のYES)、部分検索要求生成部34は、部分検索要求文(および当該部分検索要求文の構文解析結果)を複数用言リストに追加する(ステップS52)。
In this case, since the counted number N of verbs in the partial search request sentence is 1 or less (YES in step S42), the partial
次に、言い換え検索部35は、複数用言リストに追加された部分検索要求文を用いて、検索結果ID「2−2」が付与された検索対象文に対して言い換え検索処理を実行する(ステップS53)。この場合、言い換え検索部35は、一次検索結果格納部25に格納されている検索結果ID「2−2」が付与された検索対象文「容器を高速で移動する」の構文解析結果に基づいて、当該検索対象文に含まれる自立語のうち部分検索要求文に含まれる自立語を保護に設定する。ここでは、検索対象文に含まれる自立語「容器」および「移動」に保護が設定される。
Next, the paraphrase
言い換え検索部35は、検索結果ID「2−2」が付与された検索対象文に含まれる自立語であって保護に設定されていない自立語に対して言い換え処理を実行する。
The paraphrase
ここで、図29は、検索結果ID「2−2」が付与された検索対象文の言い換え処理結果を示す。図29に示すように検索対象文には、言い換えパタン格納部24に格納されている置換ルールが適用されないため、当該検索対象文に対しては言い換え処理が実行されず、当該検索対象文のまま以降の処理が実行される。
Here, FIG. 29 shows the paraphrase processing result of the search target sentence assigned the search result ID “2-2”. As shown in FIG. 29, since the replacement rule stored in the paraphrase
言い換え検索部35は、複数用言リストに追加された部分検索要求文「容器を移動する」および検索対象文「容器を高速で移動する」の構文解析結果を比較することにより、当該部分検索要求文および検索対象文の言い換え文が類似するか否かを判定する。
The paraphrase
ここで、図30は、部分検索要求文「容器を移動する」および検索対象文「容器を高速で移動する」が類似するか否かの判定結果を示す。図30においては、部分検索要求文「容器を移動する」および検索対象文「容器を高速で移動する」は類似するとの判定結果(言い換え検索結果)が示されている。 Here, FIG. 30 shows a determination result of whether or not the partial search request sentence “move the container” and the search target sentence “move the container at high speed” are similar. FIG. 30 shows a determination result (in other words, a search result) that the partial search request sentence “move the container” and the search target sentence “move the container at high speed” are similar.
言い換え検索部35は、言い換え検索処理における言い換え検索結果(ここでは、OK)を複数検索要求リストに追加する(ステップS54)。言い換え検索結果は、例えば検索結果ID「2−2」等に対応づけて複数検索要求リストに追加される。
The paraphrase
次に、部分検索要求生成部34は、複数検索要求リストに保持されている言い換え検索結果の全てがOKであるか否かを判定する(ステップS55)。
Next, the partial search
この場合、上記したように複数検索要求リストにおいては、検索結果ID「2−2」に対応づけられている言い換え検索結果は1つであり、当該言い換え検索結果はOKである。 In this case, as described above, in the multiple search request list, there is one paraphrase search result associated with the search result ID “2-2”, and the paraphrase search result is OK.
したがって、部分検索要求生成部34は、複数検索要求リストに保持されている言い換え検索結果の全てがOKであると判定する(ステップS55のYES)。
Therefore, the partial search
この場合、部分検索要求生成部34は、検索結果ID「2−2」(が付与された検索対象文)に対するマッチ結果をOKとする(ステップS56)。
In this case, the partial search
部分検索要求生成部34は、マッチ結果「OK」を検索結果管理リストに追加する(ステップS58)。このマッチ結果「OK」は、検索結果ID「2−2」に対応づけて検索結果に含まれる検索結果番号「2」、当該検索結果ID「2−2」、当該検索結果ID「2−2」が付与された検索対象文の文ID「2−3」および当該検索対象文「容器を高速で移動する」に対応づけて検索結果管理リストに追加される。
The partial search
上記したようにステップS58の処理が実行されると、検索結果ID「2−2」に対する処理は終了される。 When the process of step S58 is executed as described above, the process for the search result ID “2-2” is terminated.
検索結果ID「2−2」に対する処理が終了されると、検索結果ID「3−1」に対する処理が実行される。 When the process for the search result ID “2-2” is completed, the process for the search result ID “3-1” is executed.
ここで、図31および図32を用いて、検索結果ID「3−1」に対する処理について説明する。なお、図12に示すように、検索結果ID「3−1」に対応づけられている検索結果番号は検索結果番号「3」であり、当該検索結果ID「3−1」が付与された検索対象文は「容器を高速で移動する」である。 Here, the processing for the search result ID “3-1” will be described with reference to FIGS. 31 and 32. As shown in FIG. 12, the search result number associated with the search result ID “3-1” is the search result number “3”, and the search to which the search result ID “3-1” is assigned. The target sentence is “moving the container at high speed”.
まず、部分検索要求生成部34は、検索要求文情報に含まれる検索結果ID「3−1」に基づいて、検索結果に含まれる検索対象文が1文であるか否かを判定する(ステップS31)。この場合、検索結果IDが「3−1」であるため、検索結果に含まれる検索対象文が1文でないと判定される。
First, the partial search
検索結果に含まれる検索対象文が1文でないと判定された場合(ステップS31のNO)、部分検索要求生成部34は、検索要求文を構成する文節のうち、検索結果ID「3−1」が付与された検索対象文を構成する文節と一致する文節に一致文節IDを設定する(ステップS32)。この場合、検索要求文を構成する文節のうち、文節ID「1」および「4」によって識別される文節に一致文節IDが設定される。
When it is determined that the search target sentence included in the search result is not one sentence (NO in step S31), the partial search
部分検索要求生成部34は、検索要求文を構成する文節のうち、一致文節IDが設定された文節(ここでは、文節ID「1」および「4」によって識別される文節)を保護に設定する(ステップS33)。
The partial search
次に、部分検索要求生成部34は、検索要求文の保護未設定の文節に含まれる単語(ここでは、自立語「入れる」および「インク」)の各々に対して言い換えパタン格納部24に格納されている置換ルールを適用する(ステップS34、S35)。これにより、部分検索要求生成部34は、検索要求文の言い換え処理を行う。検索要求文の言い換え処理が実行されると、当該検索要求文の部分検索要求文が生成される。
Next, the partial search
ここで、図31は、検索結果ID「3−1」に対する処理における検索要求文の言い換え処理結果を示す。ここでは、図31に示すように検索要求文に対して言い換えパタン(置換ルール)が2回適用されることによって検索要求文「容器に入れたインクを移動する」から部分検索要求文「容器を移動する」が生成される。 Here, FIG. 31 shows the paraphrase process result of the search request sentence in the process for the search result ID “3-1”. Here, as shown in FIG. 31, by applying the paraphrase pattern (replacement rule) twice to the search request sentence, the search request sentence “move the ink contained in the container” to the partial search request sentence “container. "Move" is generated.
上記した言い換え処理が実行されると、図15に示す複数用言処理が実行される(ステップS36)。この複数用言処理においては、上記した部分検索要求文「容器を移動する」を入力文として処理が実行される。 When the above paraphrasing process is executed, the plural prescriptive process shown in FIG. 15 is executed (step S36). In this multiple predicate process, the above-described partial search request sentence “move container” is executed as an input sentence.
部分検索要求生成部34は、部分検索要求文(入力文)に含まれる自立語の中から、動詞の数Nをカウントする(ステップS41)。図31に示す部分検索要求文の構文解析結果によれば、当該部分検索要求文の動詞の数Nは1である。
The partial search
この場合、カウントされた部分検索要求文の動詞の数Nは1以下であるため(ステップS42のYES)、部分検索要求生成部34は、部分検索要求文(および当該部分検索要求文の構文解析結果)を複数用言リストに追加する(ステップS52)。
In this case, since the counted number N of verbs in the partial search request sentence is 1 or less (YES in step S42), the partial
次に、言い換え検索部35は、複数用言リストに追加された部分検索要求文を用いて、検索結果ID「3−1」が付与された検索対象文に対して言い換え検索処理を実行する(ステップS53)。この場合、言い換え検索部35は、一次検索結果格納部25に格納されている検索結果ID「3−1」が付与された検索対象文「容器を高速で移動する」の構文解析結果に基づいて、当該検索対象文に含まれる自立語のうち部分検索要求文に含まれる自立語を保護に設定する。ここでは、検索対象文に含まれる自立語「容器」および「移動」に保護が設定される。
Next, the paraphrase
言い換え検索部35は、検索結果ID「3−1」が付与された検索対象文に含まれる自立語であって保護に設定されていない自立語に対して言い換え処理を実行する。
The paraphrase
ここで、図32は、検索結果ID「3−1」が付与された検索対象文の言い換え処理結果を示す。図32に示すように検索対象文には、言い換えパタン格納部24に格納されている置換ルールが適用されないため、当該検索対象文に対しては言い換え処理が実行されず、当該検索対象文のまま以降の処理が実行される。
Here, FIG. 32 shows the paraphrase processing result of the search target sentence to which the search result ID “3-1” is assigned. As shown in FIG. 32, since the replacement rule stored in the paraphrase
言い換え検索部35は、複数用言リストに追加された部分検索要求文「容器を移動する」および検索対象文「容器を高速で移動する」の構文解析結果を比較することにより当該部分検索要求文および検索対象文の言い換え文が類似するか否かを判定する。
The paraphrase
この場合、上記した図30に示すように、部分検索要求文「容器を移動する」および検索対象文「容器を高速で移動する」は類似すると判定される。 In this case, as shown in FIG. 30 described above, the partial search request sentence “move the container” and the search target sentence “move the container at high speed” are determined to be similar.
言い換え検索部35は、言い換え検索処理における言い換え検索結果(ここでは、OK)を複数検索要求リストに追加する(ステップS54)。言い換え検索結果は、例えば検索結果ID「3−1」等に対応づけて複数検索要求リストに追加される。
The paraphrase
次に、部分検索要求生成部34は、複数検索要求リストに保持されている言い換え検索結果の全てがOKであるか否かを判定する(ステップS55)。
Next, the partial search
この場合、上記したように複数検索要求リストにおいては、検索結果ID「3−1」に対応づけられている言い換え検索結果は1つであり、当該言い換え検索結果はOKである。 In this case, as described above, in the multiple search request list, there is one paraphrase search result associated with the search result ID “3-1”, and the paraphrase search result is OK.
したがって、部分検索要求生成部34は、複数検索要求リストに保持されている言い換え検索結果の全てがOKであると判定する(ステップS55のYES)。
Therefore, the partial search
この場合、部分検索要求生成部34は、検索結果ID「3−1」(が付与された検索対象文)に対するマッチ結果をOKとする(ステップS56)。
In this case, the partial search
部分検索要求生成部34は、マッチ結果「OK」を検索結果管理リストに追加する(ステップS58)。このマッチ結果「OK」は、検索結果ID「3−1」に対応づけて検索家かに含まれる検索結果番号「3」、当該検索結果ID「3−1」、当該検索結果ID「3−1」が付与された検索対象文の文ID「3−1」および当該検索対象文「容器を高速で移動する」に対応づけて検索結果管理リストに追加される。
The partial search
上記したようにステップS58の処理が実行されると、検索結果ID「3−1」に対する処理は終了される。 When the process of step S58 is executed as described above, the process for the search result ID “3-1” is terminated.
検索結果ID「3−1」に対する処理が終了されると、検索結果ID「3−2」に対する処理が実行される。 When the process for the search result ID “3-1” is completed, the process for the search result ID “3-2” is executed.
ここで、図33〜図35を用いて、検索結果ID「3−2」に対する処理について説明する。なお、図12に示すように、検索結果ID「3−2」に対応づけられている検索結果番号は検索結果番号「3」であり、当該検索結果ID「3−2」が付与された検索対象文は「インクにペン先を入れる」である。 Here, the processing for the search result ID “3-2” will be described with reference to FIGS. 33 to 35. As shown in FIG. 12, the search result number associated with the search result ID “3-2” is the search result number “3”, and the search to which the search result ID “3-2” is assigned. The target sentence is “Put pen into ink”.
まず、部分検索要求生成部34は、検索要求文情報に含まれる検索結果ID「3−2」に基づいて、検索結果に含まれる検索対象文が1文であるか否かを判定する(ステップS31)。この場合、検索結果IDが「3−2」であるため、検索結果に含まれる検索対象文が1文でないと判定される。
First, the partial search
検索結果に含まれる検索対象文が1文でないと判定された場合(ステップS31のNO)、部分検索要求生成部34は、検索要求文を構成する文節のうち、検索結果ID「3−2」が付与された検索対象文を構成する文節と一致する文節に一致文節IDを設定する(ステップS32)。この場合、検索要求文を構成する文節のうち、文節ID「2」および「3」によって識別される文節に一致文節IDが設定される。
When it is determined that the search target sentence included in the search result is not one sentence (NO in step S31), the partial search
部分検索要求生成部34は、検索要求文を構成する文節のうち、一致文節IDが設定された文節(ここでは、文節ID「2」および「3」によって識別される文節)を保護に設定する(ステップS33)。
The partial search
次に、部分検索要求生成部34は、検索要求文の保護未設定の文節に含まれる単語(ここでは、自立語「容器」および「移動」)の各々に対して言い換えパタン格納部24に格納されている置換ルールを適用する(ステップS34、S35)。これにより、部分検索要求生成部34は、検索要求文の言い換え処理を行う。検索要求文の言い換え処理が実行されると、当該検索要求文の部分検索要求文が生成される。
Next, the partial search
ここで、図33は、検索結果ID「3−2」に対する処理における検索要求文の言い換え処理結果を示す。ここでは、図33に示すように検索要求文に対して言い換えパタン(置換ルール)が2回適用されることによって検索要求文「容器に入れたインクを移動する」から部分検索要求文「入れたインク」が生成される。 Here, FIG. 33 shows the paraphrase process result of the search request sentence in the process for the search result ID “3-2”. Here, as shown in FIG. 33, the partial search request sentence “inserted from the search request sentence“ move the ink in the container ”by applying the paraphrase pattern (replacement rule) twice to the search request sentence. Ink "is generated.
上記した言い換え処理が実行されると、図15に示す複数用言処理が実行される(ステップS36)。この複数用言処理においては、上記した部分検索要求文「入れたインク」を入力文として処理が実行される。 When the above paraphrasing process is executed, the plural prescriptive process shown in FIG. 15 is executed (step S36). In this plural prescriptive process, the process is executed with the partial search request sentence “inked ink” as an input sentence.
部分検索要求生成部34は、部分検索要求文(入力文)に含まれる自立語の中から、動詞の数Nをカウントする(ステップS41)。図33に示す部分検索要求文の構文解析結果によれば、当該部分検索要求文の動詞の数Nは1である。
The partial search
この場合、カウントされた部分検索要求文の動詞の数Nは1以下であるため(ステップS42のYES)、部分検索要求生成部34は、部分検索要求文(および当該部分検索要求文の構文解析結果)を複数用言リストに追加する(ステップS52)。
In this case, since the counted number N of verbs in the partial search request sentence is 1 or less (YES in step S42), the partial
次に、言い換え検索部35は、複数用言リストに追加された部分検索要求文を用いて、検索結果ID「3−1」が付与された検索対象文に対して言い換え検索処理を実行する(ステップS53)。この場合、言い換え検索部35は、一次検索結果格納部25に格納されている検索結果ID「3−2」が付与された検索対象文「インクにペン先を入れる」の構文解析結果に基づいて、当該検索対象文に含まれる自立語のうち部分検索要求文に含まれる自立語を保護に設定する。ここでは、検索対象文に含まれる自立語「インク」および「入れる」に保護が設定される。
Next, the paraphrase
言い換え検索部35は、検索結果ID「3−2」が付与された検索対象文に含まれる自立語であって保護に設定されていない自立語に対して言い換え処理を実行する。
The paraphrase
ここで、図34は、検索結果ID「3−2」が付与された検索対象文の言い換え処理結果を示す。図34に示すように検索対象文には、言い換えパタン格納部24に格納されている置換ルールが適用されないため、当該検索対象文に対しては言い換え処理が実行されず、当該検索対象文のまま以降の処理が実行される。
Here, FIG. 34 shows the paraphrase processing result of the search target sentence to which the search result ID “3-2” is assigned. As shown in FIG. 34, since the replacement rule stored in the paraphrase
言い換え検索部35は、複数用言リストに追加された部分検索要求文「入れたインク」および検索対象文「インクにペン先を入れる」の構文解析結果を比較することにより、当該部分検索要求文および検索対象文の言い換え文が類似するか否かを判定する。
The paraphrase
ここで、図35は、部分検索要求文「入れたインク」および検索対象文「インクにペン先を入れる」が類似するか否かの判定結果を示す。図30においては、部分検索要求文および検索対象文に含まれる自立語は「インク」および「入れる」で同一であるが、これらの自立語の関係が異なるため、当該部分検索要求文「入れたインク」および「検索対象文「インクにペン先を入れる」は類似しないとの判定結果(言い換え検索結果)が示されている。 Here, FIG. 35 shows a determination result of whether or not the partial search request sentence “inked ink” and the search target sentence “add pen tip to ink” are similar. In FIG. 30, the independent words included in the partial search request sentence and the search target sentence are the same for “ink” and “put”, but the relationship between these independent words is different. A determination result (in other words, a search result) that “ink” and “search target sentence“ insert a pen tip into ink ”” are not similar is shown.
言い換え検索部35は、言い換え検索処理における言い換え検索結果(ここでは、NG)を複数検索要求リストに追加する(ステップS54)。言い換え検索結果は、例えば検索結果ID「3−2」等に対応づけて複数検索要求リストに追加される。
The paraphrase
次に、部分検索要求生成部34は、複数検索要求リストに保持されている言い換え検索結果の全てがOKであるか否かを判定する(ステップS55)。
Next, the partial search
この場合、上記したように複数検索要求リストにおいては、検索結果ID「3−2」に対応づけられている言い換え検索結果は1つであり、当該言い換え検索結果はNGである。 In this case, as described above, in the multiple search request list, there is one paraphrase search result associated with the search result ID “3-2”, and the paraphrase search result is NG.
したがって、部分検索要求生成部34は、複数検索要求リストに保持されている言い換え検索結果の全てがOKでないと判定する(ステップS55のNO)。
Therefore, the partial search
この場合、部分検索要求生成部34は、検索結果ID「3−2」(が付与された検索対象文)に対するマッチ結果をNGとする(ステップS57)。
In this case, the partial search
部分検索要求生成部34は、マッチ結果「NG」を検索結果管理リストに追加する(ステップS58)。このマッチ結果「NG」は、検索結果ID「3−2」に対応づけて検索結果に含まれる検索結果番号「2」、当該検索結果ID「3−2」、当該検索結果ID「3−2」が付与された検索対象文の文ID「3−2」および当該検索対象文「インクにペン先を入れる」に対応づけて検索結果管理リストに追加される。
The partial search
上記したようにステップS58の処理が実行されると、検索結果ID「3−2」に対する処理は終了される。 When the process of step S58 is executed as described above, the process for the search result ID “3-2” is terminated.
このように、図13に示す検索要求文情報に含まれる検索結果ID「1」、「2−1」、「2−2」、「3−1」および「3−2」の全てについて図14に示すステップS31〜ステップS36の処理が実行されると(ステップS37のYES)、検索結果決定部36は、検索結果管理リストを参照してユーザに提示される検索結果を決定する(ステップS38)。
As described above, all the search result IDs “1”, “2-1”, “2-2”, “3-1”, and “3-2” included in the search request sentence information illustrated in FIG. Are executed (YES in step S37), the search
ここで、図36は、上記した検索結果ID「1」、「2−1」、「2−2」、「3−1」および「3−2」の全てについて処理が実行された後の検索結果管理リストのデータ構造の一例を示す。 Here, FIG. 36 shows the search after the processing is executed for all the search result IDs “1”, “2-1”, “2-2”, “3-1”, and “3-2”. An example of the data structure of a result management list is shown.
図36に示すように、検索結果管理リストには、検索結果番号、検索結果ID、文ID、検索対象文およびマッチ結果が保持される。 As shown in FIG. 36, the search result management list holds a search result number, a search result ID, a sentence ID, a search target sentence, and a match result.
図36に示す例では、検索結果管理リストには、検索結果番号「1」、検索結果ID「1」、文ID「1」、検索対象文「インクを入れた容器を高速で移動する」およびマッチ結果「OK」が保持されている。 In the example shown in FIG. 36, the search result management list includes a search result number “1”, a search result ID “1”, a sentence ID “1”, a search target sentence “move an ink container at high speed” and The match result “OK” is held.
検索結果管理リストには、検索結果番号「2」、検索結果ID「2−1」、文ID「2−2」、検索対象文「インクを容器に入れる」およびマッチ結果「OK」が保持されている。 The search result management list holds a search result number “2”, a search result ID “2-1”, a sentence ID “2-2”, a search target sentence “put ink into a container”, and a match result “OK”. ing.
検索結果管理リストには、検索結果番号「2」、検索結果ID「2−2」、文ID「2−3」、検索対象文「容器を高速で移動する」およびマッチ結果「OK」が保持されている。 The search result management list holds a search result number “2”, a search result ID “2-2”, a sentence ID “2-3”, a search target sentence “move container at high speed”, and a match result “OK”. Has been.
検索結果管理リストには、検索結果番号「3」、検索結果ID「3−1」、文ID「3−1」、検索対象文「容器を高速で移動する」およびマッチ結果「OK」が保持されている。 The search result management list holds a search result number “3”, a search result ID “3-1”, a sentence ID “3-1”, a search target sentence “move container at high speed”, and a match result “OK”. Has been.
また、検索結果管理リストには、検索結果番号「3」、検索結果ID「3−2」、文ID「3−2」、検索対象文「インクにペン先を入れる」およびマッチ結果「NG」が保持されている。 Further, the search result management list includes a search result number “3”, a search result ID “3-2”, a sentence ID “3-2”, a search target sentence “add pen tip to ink”, and a match result “NG”. Is held.
この場合、検索結果決定部36は、検索結果管理リストを参照して、各検索結果番号に対しマッチ結果がOKとなっているか否かを判定する。つまり、検索結果決定部36は、検索結果番号毎において、マッチ結果が全てOKである場合には検索結果をOKと決定し、マッチ結果のいずれかがNGである場合には検索結果をNGと決定する。
In this case, the search
ここで、図37は、検索結果決定部36による検索結果の決定処理の結果を示す。具体的には、図36に示す検索結果管理リストにおいて検索結果番号「1」のマッチ結果はOKであるため、図37に示すように検索結果番号「1」はOKと決定される。つまり、検索結果番号「1」によって識別される検索結果に含まれる検索対象文は、ユーザに対して提示される検索結果として決定される。
Here, FIG. 37 shows the result of the search result determination process by the search
また、図36に示す検索結果管理リストにおいて検索結果番号「2」のマッチ結果は検索結果ID「2−1」および「2−2」のいずれもOKであるため、図37に示すように検索結果番号「2」はOKと決定される。つまり、検索結果番号「2」によって識別される検索結果に含まれる2つの検索対象文(検索結果ID「2−1」および「2−2」によって識別される検索対象文)は、検索結果として決定される。 Also, in the search result management list shown in FIG. 36, the search result number “2” matches the search result IDs “2-1” and “2-2”, so the search is performed as shown in FIG. Result number “2” is determined to be OK. That is, two search target sentences included in the search result identified by the search result number “2” (search target sentences identified by the search result IDs “2-1” and “2-2”) are used as search results. It is determined.
一方、図36に示す検索結果管理リストにおいて検索結果番号「3」のマッチ結果は検索結果ID「3−1」のマッチ結果はOKであるが、検索結果ID「3−2」のマッチ結果はNGであるため、図37に示すように検索結果番号「3」はNGと決定される。つまり、検索結果番号「3」によって識別される検索結果に含まれる検索対象文(検索結果ID「3−1」および「3−2」によって識別される検索対象文)は、検索結果として決定されない。 On the other hand, in the search result management list shown in FIG. 36, the match result of the search result number “3” is the match result of the search result ID “3-1”, but the match result of the search result ID “3-2” is Since it is NG, the search result number “3” is determined to be NG as shown in FIG. That is, the search target sentence (search target sentences identified by the search result IDs “3-1” and “3-2”) included in the search result identified by the search result number “3” is not determined as the search result. .
つまり、検索結果に2つの検索対象文(第1および第2の検索対象文)が含まれる場合には、検索結果決定部36は、当該第1の検索対象文の部分検索要求文(第1の部分検索要求文)および当該第1の部分検索要求文を用いて生成された当該第1の検索対象文の言い換え文が類似し、かつ、当該第2の検索対象文の部分検索要求文(第2の部分検索要求文)および当該第2の部分検索要求文を用いて生成された当該第2の検索対象文の言い換え文が類似する場合に、当該第1および第2の検索対象文を検索結果として決定する。
That is, when two search target sentences (first and second search target sentences) are included in the search result, the search
これにより、検索要求文「インクを入れた容器を移動する」に対する検索結果として、検索結果番号「1」に対応づけて検索結果管理リストに保持されている検索対象文「インクを入れた容器を高速で移動する」がユーザに対して提示される。また、検索要求文「インクを入れた容器を移動する」に対する検索結果として、検索結果番号「2」に対応づけて検索結果管理リストに保持されている検索対象文「インクを容器に入れる」および検索対象文「容器を高速で移動する」がユーザに対して提示される。なお、これらの検索結果は、出力処理部37を介してユーザに対して提示される。
As a result, as a search result for the search request sentence “move the container containing ink”, the search target sentence “ink container containing ink” held in the search result management list in association with the search result number “1” is stored. “Move at high speed” is presented to the user. Further, as a search result for the search request sentence “move the container containing ink”, a search target sentence “put ink into the container” held in the search result management list in association with the search result number “2” and The search target sentence “moving the container at high speed” is presented to the user. Note that these search results are presented to the user via the
一方、検索結果決定部36によってNGと決定された検索結果番号「3」に対応づけて検索結果管理リストに保持されている検索対象文「容器を高速で移動する」および検索対象文「インクにペン先を入れる」は、ユーザに対して提示されない。
On the other hand, the search target sentence “moving the container at high speed” and the search target sentence “ink to ink” held in the search result management list in association with the search result number “3” determined as NG by the search
なお、上記したように検索結果番号「1」および「2」が検索結果としてユーザに対して提示されるが、この場合、検索対象文が1文である検索結果が優先的にユーザに提示される構成であっても構わない。この場合には、検索結果番号「1」によって識別される検索結果が検索結果番号「2」によって識別される検索結果より上位に提示される。 As described above, the search result numbers “1” and “2” are presented to the user as the search results. In this case, the search result whose search target sentence is one sentence is preferentially presented to the user. It may be a configuration. In this case, the search result identified by the search result number “1” is presented higher than the search result identified by the search result number “2”.
上記したように本実施形態においては、ユーザによって指定された検索要求文に含まれる自立語を含む検索対象文が検索され、当該検索要求文に対して言い換え処理を実行することによって生成された部分検索要求文および当該検索された検索対象文に対して言い換え処理を実行することによって生成された当該検索対象文の言い換え文の構文解析結果が比較される。これにより、本実施形態においては、部分検索要求文および検索対象文の言い換え文が類似するか否かが判定され、当該部分検索要求文および当該検索対象文の言い換え文が類似すると判定された場合に当該検索対象文を検索結果として決定し、当該決定された検索対象文を検索要求文に対する検索結果としてユーザに提示する。 As described above, in the present embodiment, a search target sentence including an independent word included in a search request sentence specified by a user is searched, and a part generated by executing paraphrase processing on the search request sentence The parsing result of the paraphrase text of the search target sentence generated by executing the paraphrase process on the search request sentence and the searched search target sentence is compared. Thereby, in this embodiment, it is determined whether the partial search request sentence and the paraphrase text of the search target sentence are similar, and when it is determined that the partial search request sentence and the paraphrase text of the search target sentence are similar The search target sentence is determined as a search result, and the determined search target sentence is presented to the user as a search result for the search request sentence.
つまり、本実施形態においては、検索要求文に含まれる自立語に基づいて検索された検索対象文のうち、検索要求文と同様の意味内容を有する検索対象文のみが検索結果として決定される。これにより、本実施形態においては、例えば「インクを入れた容器を移動する」という検索要求文から「インクを入れた容器を高速で移動する」という表現を検索することが可能となり、かつ、検索要求文に含まれる自立語を含むが意味内容が異なる検索対象文を検索結果から排除することができる。よって、本実施形態においては、ユーザ(利用者)からの検索要求文に基づいて適切な検索結果を得ることが可能となる。 That is, in the present embodiment, only search target sentences having the same semantic content as the search request sentence are determined as search results among the search target sentences searched based on the independent words included in the search request sentence. As a result, in the present embodiment, for example, it is possible to search for an expression “moving a container with ink at high speed” from a search request sentence “moving a container with ink”, and the search Search target sentences including independent words included in the request sentence but having different semantic contents can be excluded from the search results. Therefore, in the present embodiment, it is possible to obtain an appropriate search result based on the search request text from the user (user).
また、本実施形態においては、ユーザによって指定された検索要求文に含まれる自立語を含む1の文書において連続する例えば2つの検索対象文が検索され、当該検索された検索対象文(の言い換え文)毎に対応する部分検索要求文と類似するか否かが判定される。本実施形態においては、検索された2つの検索対象文の各々が対応する部分検索要求文と類似すると判定された場合、当該2つの検索対象文が検索結果として決定される。これにより、本実施形態においては、例えば「インクを入れた容器を移動する」という検索要求文から「インクを容器に入れる。容器を高速で移動する。」のような表現を検索することが可能となり、かつ、「容器を高速で移動する。インクにペン先を入れる。」のような検索要求文とは意味内容が異なる誤った検索結果を排除することができる。このため、本実施形態においては、検索結果が2つの検索対象文に分かれるような表現であっても、当該検索結果の適合率の低下を抑止することができる。 Further, in the present embodiment, for example, two consecutive search target sentences in one document including independent words included in the search request sentence specified by the user are searched, and the searched search target sentences (in other words, the paraphrase text) ), It is determined whether or not it is similar to the corresponding partial search request sentence. In this embodiment, when it is determined that each of the two searched search target sentences is similar to the corresponding partial search request sentence, the two search target sentences are determined as search results. Thereby, in this embodiment, for example, it is possible to search for an expression such as “put ink into the container. Move the container at high speed” from a search request sentence “move the container containing ink”. In addition, an erroneous search result having a different meaning from the search request sentence such as “moving the container at high speed. For this reason, in this embodiment, even if the search result is an expression in which the search result is divided into two search target sentences, it is possible to suppress a decrease in the matching rate of the search result.
更に、本実施形態においては、ユーザによって指定された検索要求文に複数の動詞(用言)が含まれている場合、当該動詞毎に部分検索要求文が生成され、当該生成された部分検索要求文毎に検索対象文の言い換え文が生成され、当該部分検索要求文および検索対象文の言い換え文が類似するか否かが判定される。本実施形態においては、部分検索要求文および検索対象文の言い換え文の全てが類似すると判定された場合、当該検索対象文が検索結果として決定される。これにより、本実施形態においては、検索要求文が単純でなく複数の用言が含まれるような表現である場合であっても、適切な検索結果を得ることが可能となる。 Further, in the present embodiment, when a search request sentence specified by the user includes a plurality of verbs (precautions), a partial search request sentence is generated for each verb, and the generated partial search request A paraphrase text of the search target sentence is generated for each sentence, and it is determined whether or not the partial search request text and the paraphrase text of the search target text are similar. In this embodiment, when it is determined that the partial search request sentence and the paraphrase sentence of the search target sentence are all similar, the search target sentence is determined as a search result. As a result, in the present embodiment, it is possible to obtain an appropriate search result even when the search request sentence is not simple but is an expression including a plurality of predicates.
なお、本実施形態においては、一次検索部33によって検索された検索結果のうち、検索結果決定部36によって決定された検索結果のみがユーザに対して提示されているが、例えば当該検索結果決定部36によって決定された検索結果を上位とするような検索結果の順位付けを行い、全ての検索結果が出力される構成であっても構わない。
In the present embodiment, among the search results searched by the
また、本実施形態においては、1の文書において連続する2つの検索対象文が検索される場合について説明したが、3つ以上の検索対象文が検索される構成であっても構わない。この場合、検索された3つ以上の検索対象文のマッチ結果の全てがOKであれば検索結果として決定される。 In the present embodiment, the case where two consecutive search target sentences are searched in one document has been described. However, three or more search target sentences may be searched. In this case, if all the match results of the three or more search target sentences searched are OK, the search result is determined.
また、本願発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。 Further, the present invention is not limited to the above-described embodiments as they are, and can be embodied by modifying the constituent elements without departing from the scope of the invention in the implementation stage. Moreover, various inventions can be formed by appropriately combining a plurality of constituent elements disclosed in the embodiment. For example, some components may be deleted from all the components shown in the embodiment.
10…コンピュータ、20…外部記憶装置、22…検索要求文解析結果格納部、23…検索対象文格納部、24…言い換えパタン格納部、25…一次検索結果格納部、26…部分検索要求格納部、27…言い換え検索結果格納部、30…情報検索装置、31…入力処理部(入力手段)、32…構文解析部、33…一次検索部、34…部分検索要求生成部、35…言い換え検索部、36…検索結果決定部、37…出力処理部。
DESCRIPTION OF
Claims (5)
複数の自立語間の係り受け構造を示す第1の部分構文木パタンおよび当該第1の部分構文木パタンの言い換えとなる自立語間の係り受け構造を示すとともに当該第1の部分構文木パタンより自立語の数が少ない第2の部分構文木パタンを対応づけて格納する言い換えパタン格納手段と、
ユーザによって指定された自立語を含む検索要求文を入力する入力手段と、
前記入力された検索要求文を構文解析することにより、当該検索要求文に含まれる自立語間の係り受け構造を示す第2の構文解析結果を取得する構文解析手段と、
前記取得された第2の構文解析結果を格納する検索要求文解析結果格納手段と、
前記入力された検索要求文に含まれる自立語を含む検索対象文を前記検索対象文格納手段から検索する検索手段と、
前記検索要求文解析結果格納手段に格納された第2の構文解析結果によって示される自立語間の係り受け構造において、前記言い換えパタン格納手段に格納されている前記第1の部分構文木パタンによって示される複数の自立語間の係り受け構造と一致する部分を当該第1の部分構文木パタンに対応づけて前記言い換えパタン格納手段に格納されている第2の部分構文木パタンによって示される自立語間の係り受け構造に置換することにより、前記入力された検索要求文の部分検索要求文を生成する第1の生成手段と、
前記第1の生成手段によって生成された部分検索要求文に含まれる自立語に基づいて、前記検索された検索対象文に対応づけて前記検索対象文格納手段に格納されている第1の構文解析結果によって示される自立語間の係り受け構造において、前記言い換えパタン格納手段に格納されている前記第1の部分構文木パタンによって示される複数の自立語間の係り受け構造と一致する部分を当該第1の部分構文木パタンに対応づけて前記言い換えパタン格納手段に格納されている第2の部分構文木パタンによって示される自立語間の係り受け構造に置換することにより、前記検索された検索対象文の言い換え文を生成する第2の生成手段と、
前記第1の生成手段によって生成された部分検索要求文に含まれる自立語間の係り受け構造および前記第2の生成手段によって生成された検索対象文の言い換え文に含まれる自立語間の係り受け構造を比較することにより、当該部分検索要求文および当該検索対象文の言い換え文が類似するかを判定する判定手段と、
前記部分検索要求文および前記検索対象文の言い換え文が類似すると判定された場合、前記検索された検索対象文を前記入力された検索要求文に対する検索結果として決定する決定手段と
を具備することを特徴とする情報検索装置。 Search target sentence storage means for storing a search target sentence including an independent word and a first parsing result indicating a dependency structure between the independent words included in the search target sentence in association with each other;
A first partial syntax tree pattern indicating a dependency structure between a plurality of independent words, and a dependency structure between independent words as a paraphrase of the first partial syntax tree pattern, and from the first partial syntax tree pattern Paraphrase pattern storage means for associating and storing second partial syntax tree patterns with a small number of independent words;
An input means for inputting a search request sentence including an independent word specified by the user;
Parsing means for acquiring a second parsing result indicating a dependency structure between independent words included in the search request sentence by parsing the input search request sentence;
Search request sentence analysis result storage means for storing the acquired second syntax analysis result;
A search unit that searches the search target sentence storage unit for a search target sentence including an independent word included in the input search request sentence;
In the dependency structure between independent words indicated by the second syntax analysis result stored in the search request sentence analysis result storage means, it is indicated by the first partial syntax tree pattern stored in the paraphrase pattern storage means. Between the independent words indicated by the second partial syntax tree pattern stored in the paraphrase pattern storage means in correspondence with the first partial syntax tree pattern corresponding to the dependency structure between the plurality of independent words. First generation means for generating a partial search request sentence of the input search request sentence by replacing with a dependency structure of
The first syntactic analysis stored in the search target sentence storage unit in association with the searched search target sentence based on the independent word included in the partial search request sentence generated by the first generation unit In the dependency structure between independent words indicated by the result, a portion that matches the dependency structure between the plurality of independent words indicated by the first partial syntax tree pattern stored in the paraphrase pattern storage means The retrieved search target sentence is replaced with a dependency structure between independent words indicated by the second partial syntax tree pattern stored in the paraphrase pattern storage means in association with one partial syntax tree pattern. Second generating means for generating the paraphrase text of
Dependency structure between independent words included in the partial search request sentence generated by the first generation means and dependency between independent words included in the paraphrase sentence of the search target sentence generated by the second generation means A determination unit that determines whether the partial search request sentence and the paraphrase sentence of the search target sentence are similar by comparing the structures;
Determining means for determining the searched search target sentence as a search result for the input search request sentence when it is determined that the partial search request sentence and the paraphrase sentence of the search target sentence are similar to each other. A featured information retrieval device.
前記第1の生成手段は、前記検索要求文に含まれる動詞毎に、前記検索要求文解析結果格納手段に格納されている第2の構文解析結果によって示される自立語間の係り受け構造において当該動詞と係り受け関係にある自立語に基づいて前記部分検索要求文を生成し、
前記第2の生成手段は、前記検索要求文に含まれる動詞毎に前記第1の生成手段によって生成された部分検索要求文毎に、当該部分検索要求文に含まれる自立語に基づいて当該部分検索要求文に対応する前記検索された検索対象文の言い換え文を生成し、
前記判定手段は、前記検索要求文に含まれる動詞毎に前記第1の生成手段によって生成された部分検索要求文および前記第2の生成手段によって生成された当該部分検索要求文に対応する前記検索対象文の言い換え文毎に、当該部分検索要求文および当該検索対象文の言い換え文が類似するかを判定し、
前記決定手段は、前記検索要求文に含まれる動詞毎に前記第1の生成手段によって生成された部分検索要求文および前記第2の生成手段によって生成された当該部分検索要求文に対応する前記検索対象文の言い換え文の全てが類似すると判定された場合、前記検索された検索対象文を検索結果として決定する
ことを特徴とする請求項1記載の情報検索装置。 The self-supporting word included in the input search request sentence includes a verb,
In the dependency structure between independent words indicated by the second syntax analysis result stored in the search request sentence analysis result storage means for each verb included in the search request sentence, the first generation means Generating the partial search request sentence based on an independent word having a dependency relation with a verb;
The second generation means, for each partial search request sentence generated by the first generation means for each verb included in the search request sentence, based on an independent word included in the partial search request sentence Generating a paraphrase sentence of the searched search target sentence corresponding to the search request sentence;
The determination means includes the partial search request sentence generated by the first generation means for each verb included in the search request sentence and the search corresponding to the partial search request sentence generated by the second generation means. For each paraphrase sentence of the target sentence, determine whether the partial search request sentence and the paraphrase sentence of the search target sentence are similar,
The determination means includes the partial search request sentence generated by the first generation means for each verb included in the search request sentence and the search corresponding to the partial search request sentence generated by the second generation means. The information search device according to claim 1, wherein when it is determined that all of the paraphrase sentences of the target sentence are similar, the searched search target sentence is determined as a search result.
前記検索手段は、前記入力された検索要求文に含まれる自立語を含む1の文書において連続する第1および第2の検索対象文のペアを検索し、
前記第1の生成手段は、
前記入力された検索要求文に含まれる自立語のうち前記検索された第1の検索対象文に含まれる自立語に基づいて、当該検索要求文の第1の部分検索要求文を生成し、
前記入力された検索要求文に含まれる自立語のうち前記検索された第2の検索対象文に含まれる自立語に基づいて、当該検索要求文の第2の部分検索要求文を生成し、
前記第2の生成手段は、
前記第1の生成手段によって生成された第1の部分検索要求文に含まれる自立語に基づいて、前記検索された第1の検索対象文の言い換え文を生成し、
前記第1の生成手段によって生成された第2の部分検索要求文に含まれる自立語に基づいて、前記検索された第2の検索対象文の言い換え文を生成し、
前記判定手段は、
前記第1の生成手段によって生成された第1の部分検索要求文に含まれる自立語間の係り受け構造および前記第2の生成手段によって生成された第1の検索対象文の言い換え文に含まれる自立語間の係り受け構造を比較することにより、当該第1の部分検索要求文および当該第1の検索対象文の言い換え文が類似するかを判定し、
前記第1の生成手段によって生成された第2の部分検索要求文に含まれる自立語間の係り受け構造および前記第2の生成手段によって生成された第2の検索対象文の言い換え文に含まれる自立語間の係り受け構造を比較することにより、当該第2の部分検索要求および当該第2の検索対象文の言い換え文が類似するかを判定し、
前記決定手段は、前記第1の部分検索要求文および前記第1の検索対象文の言い換え文が類似すると判定され、かつ、前記第2の部分検索要求文および前記第2の検索対象文の言い換え文が類似すると判定された場合、前記検索された第1および第2の検索対象文のペアを前記入力された検索要求文に対する検索結果として決定する
ことを特徴とする請求項1記載の情報検索装置。 The search target sentence stored in the search target sentence storage means constitutes a document,
The search means searches for a pair of consecutive first and second search target sentences in one document including an independent word included in the input search request sentence,
The first generation means includes:
Based on the independent words included in the searched first search target sentence among the independent words included in the input search request sentence, a first partial search request sentence of the search request sentence is generated,
Generating a second partial search request sentence of the search request sentence based on the independent words included in the searched second search target sentence among the independent words included in the input search request sentence;
The second generation means includes
Based on an independent word included in the first partial search request sentence generated by the first generation unit, a paraphrase sentence of the searched first search target sentence is generated,
Based on the independent words included in the second partial search request sentence generated by the first generation unit, generate a paraphrase sentence of the searched second search target sentence,
The determination means includes
Included in the dependency structure between independent words included in the first partial search request sentence generated by the first generation means and the paraphrase sentence of the first search target sentence generated by the second generation means By comparing the dependency structure between independent words, it is determined whether the paraphrase sentence of the first partial search request sentence and the first search target sentence are similar,
Dependent structure between independent words included in the second partial search request sentence generated by the first generation means and included in the paraphrase sentence of the second search target sentence generated by the second generation means By comparing the dependency structure between independent words, it is determined whether the second partial search request and the paraphrase text of the second search target sentence are similar,
The determining means determines that the first partial search request sentence and the paraphrase sentence of the first search target sentence are similar, and the paraphrase of the second partial search request sentence and the second search target sentence The information search according to claim 1, wherein when it is determined that the sentences are similar, the pair of the searched first and second search target sentences is determined as a search result with respect to the input search request sentence. apparatus.
前記コンピュータに、
ユーザによって指定された自立語を含む検索要求文を入力するステップと、
前記入力された検索要求文を構文解析することにより、当該検索要求文に含まれる自立語間の係り受け構造を示す第2の構文解析結果を取得する構文解析手段と、
前記取得された第2の構文解析結果を前記検索要求文解析結果格納手段に格納するステップと、
前記入力された検索要求文に含まれる自立語を含む検索対象文を前記検索対象文格納手段から検索するステップと、
前記検索要求文解析結果格納手段に格納された第2の構文解析結果によって示される自立語間の係り受け構造において、前記言い換えパタン格納手段に格納されている前記第1の部分構文木パタンによって示される複数の自立語間の係り受け構造と一致する部分を当該第1の部分構文木パタンに対応づけて前記言い換えパタン格納手段に格納されている第2の部分構文木パタンによって示される自立語間の係り受け構造に置換することにより、前記入力された検索要求文の部分検索要求文を生成するステップと、
前記生成された部分検索要求文に含まれる自立語に基づいて、前記検索された検索対象文に対応づけて前記検索対象文格納手段に格納されている第1の構文解析結果によって示される自立語間の係り受け構造において、前記言い換えパタン格納手段に格納されている前記第1の部分構文木パタンによって示される複数の自立語間の係り受け構造と一致する部分を当該第1の部分構文木パタンに対応づけて前記言い換えパタン格納手段に格納されている第2の部分構文木パタンによって示される自立語間の係り受け構造に置換することにより、前記検索された検索対象文の言い換え文を生成するステップと、
前記生成された部分検索要求文に含まれる自立語間の係り受け構造および前記生成された検索対象文の言い換え文に含まれる自立語間の係り受け構造を比較することにより、当該部分検索要求文および当該検索対象文の言い換え文が類似するかを判定するステップと、
前記部分検索要求文および前記検索対象文の言い換え文が類似すると判定された場合、前記検索された検索対象文を前記入力された検索要求文に対する検索結果として決定するステップと
を実行させるためのプログラム。 Search target sentence storage means for associating and storing a first sentence analysis result indicating a dependency target sentence and a dependency structure between the independent words included in the search target sentence, and a relation between a plurality of independent words A first partial syntax tree pattern indicating a receiving structure and a dependency structure between independent words serving as paraphrases of the first partial syntax tree pattern are shown, and the number of independent words is smaller than that of the first partial syntax tree pattern. In an information retrieval apparatus comprising an external storage device having a paraphrase pattern storage means for storing two partial syntax tree patterns in association with each other, a search request sentence analysis result storage means, and a computer using the external storage device, A program executed by the computer,
In the computer,
Inputting a search request sentence including an independent word specified by the user;
Parsing means for acquiring a second parsing result indicating a dependency structure between independent words included in the search request sentence by parsing the input search request sentence;
Storing the acquired second syntax analysis result in the search request sentence analysis result storage means;
Searching the search target sentence storage means for a search target sentence including an independent word included in the input search request sentence;
In the dependency structure between independent words indicated by the second syntax analysis result stored in the search request sentence analysis result storage means, it is indicated by the first partial syntax tree pattern stored in the paraphrase pattern storage means. Between the independent words indicated by the second partial syntax tree pattern stored in the paraphrase pattern storage means in correspondence with the first partial syntax tree pattern corresponding to the dependency structure between the plurality of independent words. Generating a partial search request sentence of the input search request sentence by replacing with the dependency structure of
Based on the independent words included in the generated partial search request sentence, the independent words indicated by the first syntax analysis result stored in the search target sentence storage unit in association with the searched search target sentence In the dependency structure between them, a portion that matches the dependency structure between a plurality of independent words indicated by the first partial syntax tree pattern stored in the paraphrase pattern storage means is the first partial syntax tree pattern. By substituting the dependency structure between independent words indicated by the second partial syntax tree pattern stored in the paraphrase pattern storage means in association with Steps,
By comparing the dependency structure between independent words included in the generated partial search request sentence and the dependency structure between independent words included in the paraphrase sentence of the generated search target sentence, the partial search request sentence And determining whether the paraphrase text of the search target sentence is similar;
A program for executing the step of determining, when it is determined that the partial search request sentence and the paraphrase sentence of the search target sentence are similar, the searched search target sentence as a search result for the input search request sentence .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009103067A JP4745417B2 (en) | 2009-04-21 | 2009-04-21 | Information retrieval apparatus and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009103067A JP4745417B2 (en) | 2009-04-21 | 2009-04-21 | Information retrieval apparatus and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010256977A true JP2010256977A (en) | 2010-11-11 |
JP4745417B2 JP4745417B2 (en) | 2011-08-10 |
Family
ID=43317855
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009103067A Expired - Fee Related JP4745417B2 (en) | 2009-04-21 | 2009-04-21 | Information retrieval apparatus and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4745417B2 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011164772A (en) * | 2010-02-05 | 2011-08-25 | Toshiba Corp | Document processing program and document processing apparatus |
KR20200046446A (en) * | 2018-10-24 | 2020-05-07 | 한국전자통신연구원 | Similar patent search method and apparatus using alignment of elements |
CN112015771A (en) * | 2020-10-15 | 2020-12-01 | 北京新唐思创教育科技有限公司 | Data retrieval method and device, electronic equipment and computer storage medium |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003108583A (en) * | 2001-09-27 | 2003-04-11 | Seiko Epson Corp | Search device, search system, search method, program, and recording medium using language sentence |
JP2008250388A (en) * | 2007-03-29 | 2008-10-16 | Toshiba Corp | Information retrieval device, information retrieval method and information retrieval program |
-
2009
- 2009-04-21 JP JP2009103067A patent/JP4745417B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003108583A (en) * | 2001-09-27 | 2003-04-11 | Seiko Epson Corp | Search device, search system, search method, program, and recording medium using language sentence |
JP2008250388A (en) * | 2007-03-29 | 2008-10-16 | Toshiba Corp | Information retrieval device, information retrieval method and information retrieval program |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011164772A (en) * | 2010-02-05 | 2011-08-25 | Toshiba Corp | Document processing program and document processing apparatus |
KR20200046446A (en) * | 2018-10-24 | 2020-05-07 | 한국전자통신연구원 | Similar patent search method and apparatus using alignment of elements |
KR102490554B1 (en) * | 2018-10-24 | 2023-01-20 | 한국전자통신연구원 | Similar patent search method and apparatus using alignment of elements |
CN112015771A (en) * | 2020-10-15 | 2020-12-01 | 北京新唐思创教育科技有限公司 | Data retrieval method and device, electronic equipment and computer storage medium |
Also Published As
Publication number | Publication date |
---|---|
JP4745417B2 (en) | 2011-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9147007B2 (en) | Query expression conversion apparatus, query expression conversion method, and computer program product | |
CN1815477B (en) | Method and system for providing semantic subjects based on mark language | |
US8583415B2 (en) | Phonetic search using normalized string | |
JP2012027788A (en) | Document retrieval system, document retrieval method, and program | |
JP4745417B2 (en) | Information retrieval apparatus and program | |
JP5291351B2 (en) | Evaluation expression extraction method, evaluation expression extraction device, and evaluation expression extraction program | |
JPWO2010109594A1 (en) | Document search device, document search system, document search program, and document search method | |
JP2009277099A (en) | Similar document retrieval device, method and program, and computer readable recording medium | |
JP5447368B2 (en) | NEW CASE GENERATION DEVICE, NEW CASE GENERATION METHOD, AND NEW CASE GENERATION PROGRAM | |
JP2005173847A (en) | Information search apparatus, information search method, program, and recording medium recording the program | |
JP3531222B2 (en) | Similar character string search device | |
JP5160120B2 (en) | Information search apparatus, information search method, and information search program | |
JP5506482B2 (en) | Named entity extraction apparatus, string-named expression class pair database creation apparatus, numbered entity extraction method, string-named expression class pair database creation method, program | |
JP4478042B2 (en) | Word set generation method with frequency information, program and program storage medium, word set generation device with frequency information, text index word creation device, full-text search device, and text classification device | |
JP2005025555A (en) | Thesaurus construction system, thesaurus construction method, program for executing the method, and storage medium with the program stored thereon | |
JP2004334602A (en) | Document retrieving device, document retrieval processing program, and recording medium | |
JP2008140204A (en) | Data retrieval system and program | |
JP6753190B2 (en) | Document retrieval device and program | |
JP4588417B2 (en) | Translation device | |
JP5038881B2 (en) | Information retrieval device | |
JP7302267B2 (en) | Search program, search method and search device | |
JP5691558B2 (en) | Example sentence search device, processing method, and program | |
JP2005338970A (en) | Sentence processor | |
JPH03229367A (en) | Text base retrieving system | |
JP2006163723A (en) | Document search method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110407 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110419 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110511 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140520 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4745417 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |