JPH08305695A - Document processing device - Google Patents
Document processing deviceInfo
- Publication number
- JPH08305695A JPH08305695A JP7105273A JP10527395A JPH08305695A JP H08305695 A JPH08305695 A JP H08305695A JP 7105273 A JP7105273 A JP 7105273A JP 10527395 A JP10527395 A JP 10527395A JP H08305695 A JPH08305695 A JP H08305695A
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- search
- word
- priority
- priority table
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
【0001】[0001]
【産業上の利用分野】本発明は、基本辞書の他に複数の
専門用語辞書を備え、広範囲の分野に関する文書を処理
する文書処理装置に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a document processing apparatus having a plurality of technical term dictionaries in addition to a basic dictionary and processing documents relating to a wide range of fields.
【0002】[0002]
【従来の技術】ワードプロセサ、機械翻訳、索引生成
等、文書を処理する装置において、辞書を検索して単語
の情報を得る場合に、まず基本辞書を検索してそこに無
いときは専門用語辞書を検索する。図4に辞書検索の例
を示す。(1)は文を単語に分割した例である。(2)
は辞書の内容の例である。基本辞書は一般的な文章を構
成する単語(助詞、副詞、動詞、活用語尾等)を保有す
る。専門分野毎に特有の単語や専門分野によって意味が
異なることが多い単語(名詞、特殊な動詞等)は複数の
専門用語辞書(一般的な国語辞書の内容も専門用語辞書
の1つとして扱うことでもよい)に収容されている。文
を分割して単語候補を得て、それぞれの単語候補につい
て辞書を検索し、得られた属性や意味等を翻訳等の処理
の元情報として構文/意味解析部等に渡す。2. Description of the Related Art In a device for processing a document such as a word processor, machine translation, index generation, etc., when a dictionary is searched to obtain word information, a basic dictionary is searched first, and if it is not there, a technical term dictionary is found. To search. FIG. 4 shows an example of dictionary search. (1) is an example in which a sentence is divided into words. (2)
Is an example of the contents of the dictionary. The basic dictionary holds words (particles, adverbs, verbs, inflectional endings, etc.) that make up a general sentence. Multiple specialized term dictionaries (words such as nouns, special verbs, etc.) that have meanings that differ from one specialized field to another or are often different depending on the specialized field (general language dictionary contents should be treated as one of the specialized term dictionaries). It may be). The sentence is divided to obtain word candidates, a dictionary is searched for each word candidate, and the obtained attributes, meanings, etc. are passed to the syntax / semantic analysis unit etc. as original information for processing such as translation.
【0003】従来は、専門用語辞書については、単語が
見つかるまで順に検索していくか、あるいは使用者があ
らかじめ処理対象の文書の専門分野を指定することによ
り、使用する専門用語辞書を決定していた。Conventionally, the technical term dictionary to be used is determined by searching the technical term dictionary in order until a word is found, or by specifying the technical field of the document to be processed in advance by the user. It was
【0004】[0004]
【発明が解決しようとする課題】従って、使用者によっ
て分野が特定されなかった場合には、文書に対して適切
な辞書を選択することができないので、対象文書とは関
係のない専門用語辞書まで検索することになる。また、
異なる分野に跨がる内容を有する文書を処理する場合
や、異なる分野に属する複数の文書を連続して処理する
場合、余分な辞書まで検索対象に指定することになり、
検索の効率が低かった。Therefore, if the user does not specify the field, it is not possible to select an appropriate dictionary for the document. Therefore, even a technical term dictionary unrelated to the target document can be selected. You will be searching. Also,
When processing documents that have content that spans different fields, or when processing multiple documents that belong to different fields in succession, you need to specify an extra dictionary as the search target.
The search efficiency was low.
【0005】本発明は、文書内の専門用語に適した専門
用語辞書を自動的に優先的に選択して検索することによ
り検索の効率を高くすることを目的とする。It is an object of the present invention to improve the efficiency of search by automatically and preferentially selecting and searching a technical term dictionary suitable for a technical term in a document.
【0006】[0006]
請求項1:基本的な単語に関する基本辞書と、専門分野
の単語に関する専門用語辞書群とを備えた文書処理装置
において、処理対象文書の文を単語候補に分割し分離す
る単語判定部と、各辞書の検索の優先度を記した優先度
表と、分離された単語候補について、優先度表に示され
た優先度の順に従って各辞書を順次検索する辞書検索部
と、優先度表の各辞書の検索の優先度を、辞書からの検
出状況によって更新する表更新部とを備える。Claim 1: In a document processing apparatus comprising a basic dictionary for basic words and a technical term dictionary group for words in a specialized field, a word determination unit for dividing a sentence of a document to be processed into word candidates and separating the words. A priority table that lists the search priority of the dictionary, a dictionary search unit that sequentially searches each dictionary according to the priority order shown in the priority table for the separated word candidates, and each dictionary of the priority table And a table updating unit that updates the priority of the search according to the detection status from the dictionary.
【0007】請求項2:請求項1に記載の文書処理装置
において、優先度表は、各辞書対応に単語検出回数を記
録する項目を有し、表更新部は、検索できた辞書の単語
検出回数に基づいて優先度表を更新すると共に、その回
数の多い順に優先度が高くなるように更新する。According to a second aspect of the present invention, in the document processing apparatus according to the first aspect, the priority table has an item for recording the number of word detections for each dictionary, and the table updating unit detects the words in the dictionary that can be searched. The priority table is updated based on the number of times, and the priority is updated in descending order of the number of times.
【0008】請求項3:請求項1または請求項2に記載
の文書処理装置において、各辞書の間の関連の程度を記
録した関連辞書表を有し、表更新部は優先度表を更新す
るときに関連辞書表を参照して関連する辞書についても
優先度を更新する。A third aspect of the present invention is the document processing apparatus according to the first or second aspect, which has a related dictionary table in which the degree of association between the dictionaries is recorded, and the table updating unit updates the priority table. Sometimes, referring to the related dictionary table, the priority of the related dictionary is updated.
【0009】請求項4:請求項1ないし請求項3のいず
れかに記載の文書処理装置において、検索対象となった
単語名と検索の結果それが検出された辞書を示す情報
と、その時点の各辞書の優先度を示す情報とを保持する
検索記録を有し、表更新部は優先度表を更新するときに
検索記録も更新し、辞書検索部は、構文/意味解析部等
から再検索を指示されたとき、検索記録を参照し、検索
対象の単語候補の名前が検索記録に存在する場合は、前
回その単語候補を検出した辞書の優先度より下位にある
辞書から検索する。A fourth aspect of the present invention is the document processing apparatus according to any one of the first to third aspects, in which information indicating a word name as a search target and a dictionary in which the word name is detected as a result of the search and information at that time point are displayed. It has a search record holding information indicating the priority of each dictionary, the table update unit updates the search record when updating the priority table, and the dictionary search unit re-searches from the syntax / semantic analysis unit etc. When the instruction is given, the search record is referred to, and if the name of the word candidate to be searched exists in the search record, the dictionary lower than the priority of the dictionary in which the word candidate was detected last time is searched.
【0010】[0010]
【作用】単語判定部は、入力文書から単語候補を切出
し、辞書検索部に送る。辞書検索部は、単語判定部によ
って得られた単語候補について、まず基本辞書を検索
し、見つかった場合には、その辞書内容(検索結果)を
単語判定部に返す。The word determining unit cuts out word candidates from the input document and sends them to the dictionary searching unit. The dictionary search unit first searches the basic dictionary for the word candidate obtained by the word determination unit, and if found, returns the dictionary contents (search result) to the word determination unit.
【0011】基本辞書中になかった場合は、専門用語辞
書を検索する。このとき優先度表を参照し、優先度が最
も高い専門用語辞書から順に検索していく。単語が検出
できたら、その辞書名を表更新部に送る。If it is not in the basic dictionary, the technical term dictionary is searched. At this time, referring to the priority table, the technical term dictionary with the highest priority is searched in order. When the word is detected, the dictionary name is sent to the table updating unit.
【0012】表更新部は、所定のアルゴリズムによっ
て、検索できた辞書の優先度が高くなるように、優先度
表を更新する。このように構成することにより、次の単
語候補を検索するときには、それが含まれている文書の
属する分野に適した辞書を優先して検索することにな
り、検索の効率を高くすることができる。The table updating unit updates the priority table by a predetermined algorithm so that the searched dictionary has a higher priority. With this configuration, when searching for the next word candidate, the dictionary suitable for the field to which the document that contains it is prioritized to be searched, and the efficiency of the search can be improved. .
【0013】請求項2:優先度表が、各辞書対応に単語
検出回数を記録する項目を有する場合、表更新部は、検
索できた辞書の単語検出回数を優先度表に更新すると共
に、その回数の多い順に優先度が高くなるように更新す
ることにより、よく使われる辞書の優先順位が高くな
る。従って検索の効率が高くなる。Claim 2: When the priority table has an item for recording the number of times of word detection for each dictionary, the table updating unit updates the number of times of word detection of the retrieved dictionary in the priority table and By updating so that the priority increases in descending order of the number of times, the priority of the frequently used dictionary becomes higher. Therefore, the search efficiency is increased.
【0014】請求項3:ある辞書の優先度を更新すると
き、関連する辞書の順位も同時に処理することにより、
次に検索するときの検索効率が高くなる。 請求項4:再検索の場合、検索記録を参照することによ
り、その前の検索が不適当であった辞書をはずして検索
するので、検索効率が高くなる。Claim 3: When updating the priority of a dictionary, the ranks of related dictionaries are processed at the same time.
The search efficiency at the time of the next search is improved. Claim 4: In the case of re-searching, by referring to the search record, the dictionary that was unsuitable for the previous search is removed and the search is performed, so the search efficiency is increased.
【0015】[0015]
【実施例】以下、図面を参照して本発明の実施例を説明
する。図1は本発明の実施例の構成図であり、請求項1
〜4の発明を適用した機械翻訳装置を想定したものであ
る。Embodiments of the present invention will be described below with reference to the drawings. 1 is a block diagram of an embodiment of the present invention.
It is assumed that a machine translation device to which the inventions 4 to 4 are applied.
【0016】文書または指示入力1は入力処理部2によ
って入力される。単語判定部3は入力された文書を文単
位に所定の基準に従って単語に分割して、辞書検索部6
に渡す。辞書検索部6は、単語判定部3から渡された単
語候補を辞書群すなわち基本辞書8a、専門用語辞書1〜
専門用語辞書N(8b〜8n)を検索し属性データ等を得
る。検索すべき辞書の順序は、優先度表5a、関連辞書表
5bおよび検索記録5cを参照して決める。The document or instruction input 1 is input by the input processing unit 2. The word determination unit 3 divides the input document into words on a sentence-by-sentence basis according to a predetermined criterion, and the dictionary search unit 6
Pass to. The dictionary search unit 6 uses the word candidates passed from the word determination unit 3 as a dictionary group, that is, the basic dictionary 8a and the technical term dictionaries 1 to 1.
The technical term dictionary N (8b to 8n) is searched to obtain attribute data and the like. The order of dictionaries to be searched is the priority table 5a, related dictionary table
Determined by referring to 5b and search record 5c.
【0017】検索の結果、検出できた単語の属性等の検
索結果データは、構文/意味解析部4により処理され、
妥当であるかどうか判断される。妥当であればその後の
翻訳処理等を行う処理部(図示してない)に渡される。
不適当と判断すれば、辞書検索部6に対して再検索を行
うよう指示する。As a result of the search, the search result data such as the attributes of the detected words are processed by the syntax / semantic analysis unit 4,
It is judged whether it is appropriate. If appropriate, it is passed to a processing unit (not shown) that performs subsequent translation processing and the like.
If it is determined to be inappropriate, the dictionary search unit 6 is instructed to search again.
【0018】辞書検索部6の動作を以下に説明する。 例1:請求項1の発明のみ適用の場合=優先度表5aのみ
を備え、かつ優先度表5aは各辞書の優先度順位のみを保
持する場合:単語候補を専門用語辞書8b〜8nから検索す
るには、優先度表5aを参照し、その1位にランクされて
いる辞書から検索する。1位の辞書から見つからなかっ
た場合には2位の辞書を検索する。以下、単語が見つか
るまで優先度表の順位に従って辞書を検索していく。The operation of the dictionary search unit 6 will be described below. Example 1: When only the invention of claim 1 is applied = only the priority table 5a is provided, and the priority table 5a holds only the priority order of each dictionary: word candidates are searched from the technical term dictionaries 8b to 8n In order to do so, the priority table 5a is referred to and the dictionary ranked first is searched. If the first-ranked dictionary is not found, the second-ranked dictionary is searched. Hereinafter, the dictionary is searched in the order of the priority table until the word is found.
【0019】1位の辞書から検出できた場合には優先度
表5aの優先度の更新は行わない。2位以下から検索され
た場合には、検出できた辞書を1位にし、検出できた辞
書の順位より上位に位置する辞書の順位をひとつずつ下
げる。When it is possible to detect it from the first-ranked dictionary, the priority of the priority table 5a is not updated. When the search is performed from the second rank or lower, the detected dictionary is set to the first rank, and the rank of the dictionary positioned higher than the rank of the detected dictionary is lowered one by one.
【0020】図2(1)に優先度表の更新例を示す。5
つの専門用語辞書a,b,c,d,eがあり、優先度が
a,b,c,d,eの順になっているとする。検索は、
優先度1位の辞書aから優先度順に実行する。辞書cで
単語が検出できたとすると辞書cを1位にランクし、辞
書a以下のランクはそれぞれ下げる。次の単語候補の検
索時には辞書cから実行する。辞書cで見つからず、辞
書bで検出できたとすると、今度は辞書bを1位にラン
クし、辞書c以下のランクを下げる。FIG. 2A shows an example of updating the priority table. 5
It is assumed that there are two technical term dictionaries a, b, c, d, and e, and the priorities are a, b, c, d, and e in this order. Search is
The processing is executed in order of priority from the dictionary a having the first priority. If a word can be detected in the dictionary c, the dictionary c is ranked first and the ranks below the dictionary a are lowered. When searching for the next word candidate, it is executed from the dictionary c. If it is not found in the dictionary c and can be detected in the dictionary b, then the dictionary b is ranked first and the ranks below the dictionary c are lowered.
【0021】例2:請求項2の発明適用=優先度表5aは
順位と単語を検出した回数(辞書使用回数)とを保持す
る場合:例1と同様に、優先度表5aの優先度にそって辞
書を順に検索する。優先度表5aは辞書名とその辞書から
検索して単語が見つかった回数を記録している。Example 2: Application of the invention of claim 2 = Priority table 5a holds the rank and the number of times a word is detected (the number of times the dictionary is used): As in Example 1, the priority table 5a has the same priority. Then, search the dictionary in order. The priority table 5a records the dictionary name and the number of times the word is found by searching the dictionary.
【0022】図2(2)に優先度表5aの更新の例を示
す。初期状態では、回数はすべて0である。辞書aから
検出できたとすると、辞書aの回数を1にする。次の単
語の検索において辞書cから検出できたとすると、辞書
cの回数は1になり、回数0である辞書bの上位に、か
つ回数1である辞書aの下の2位にランクする。さらに
次の単語候補の検索において、再び辞書cから検出する
と、辞書cの回数は2になり、辞書aの回数を超えるの
で1位に繰り上げる。すなわち見つかった回数がより少
ないものの上位に、かつ、同じ回数のものの下位に置
く。FIG. 2B shows an example of updating the priority table 5a. In the initial state, the number of times is all 0. If it can be detected from the dictionary a, the number of times of the dictionary a is set to 1. If it can be detected from the dictionary c in the search of the next word, the number of times of the dictionary c becomes 1, and it ranks in the upper rank of the dictionary b of 0 times and the second rank of the dictionary a of 1 times. Further, in the next word candidate search, when it is detected again from the dictionary c, the number of times of the dictionary c becomes 2, and since it exceeds the number of times of the dictionary a, it is moved to the first place. That is, it is placed higher in the number of times found less and lower in the number of times found the same.
【0023】例3:請求項3の発明適用=関連辞書表5b
を備える場合:関連辞書表5bは関連のある2つの辞書名
を組にして保持する。その内容は固定的に決めておいて
もよいが、例えば、所定の時期(例:一文書の処理後、
所定数の単語の検索後)に、表更新部7は、優先度表5a
を調べて上位2つの辞書の検索回数が全単語検索回数に
占める割合が所定のレベル(例:30パーセント)に達
していれば、その2つの辞書はある分野に関連して使用
されると判断して、関連辞書表5bにその2つの辞書名を
組にして登録するというような処理を行えば、よりよい
関連が設定される。Example 3: Application of the invention of claim 3 = Related dictionary table 5b
When: The related dictionary table 5b holds two related dictionary names as a set. Although the content may be fixedly decided, for example, at a predetermined time (eg, after processing one document,
After retrieving a predetermined number of words), the table updating unit 7 determines that the priority table 5a
If the ratio of the number of searches of the top two dictionaries to the total number of word searches reaches a predetermined level (eg, 30%), it is determined that the two dictionaries are used in connection with a certain field. Then, by performing a process of registering the two dictionary names as a pair in the related dictionary table 5b, a better relationship is set.
【0024】例2と同様に、単語候補を検索して検出で
きた辞書の回数に1を加え、上位の優先度の辞書の回数
をみて、順位を入れ替える。このとき、関連辞書表5bを
参照し、その辞書名を含む組が登録されているかを調べ
る。もしあれば、その組のもう一方の辞書名が優先度表
5aのどの順位にあるかを調べる。先に順位を入れ替えた
辞書よりも上位にあればそのままにする。下位にあれ
ば、例2と同様に、回数をみて順位を変更する。As in Example 2, 1 is added to the number of dictionaries that can be detected by searching for word candidates, the number of dictionaries with a higher priority is checked, and the order is changed. At this time, referring to the related dictionary table 5b, it is checked whether a set including the dictionary name is registered. If so, the other dictionary name in the set is the priority table.
Find out which rank of 5a. If it is higher than the dictionary whose order has been changed, leave it as it is. If it is in the lower rank, the rank is changed according to the number of times as in Example 2.
【0025】図2(3)に優先度表5aと関連辞書表5bの
例を示す。関連辞書表5bには、辞書の組(a,b)
(a,c)(c,d)が記録されているものとする。こ
こで、ある単語が辞書cから検出されると、辞書cの回
数は1になり、1位にランクされる。関連辞書表5bによ
り、辞書dは辞書cと関連することがわかるので、辞書
dを2位に繰り上げ、辞書a,bはそれぞれ繰り下げ
る。FIG. 2C shows an example of the priority table 5a and the related dictionary table 5b. The related dictionary table 5b includes a set of dictionaries (a, b).
It is assumed that (a, c) and (c, d) are recorded. Here, when a certain word is detected from the dictionary c, the number of times of the dictionary c becomes 1, and it is ranked first. Since it can be seen from the related dictionary table 5b that the dictionary d is related to the dictionary c, the dictionary d is moved up to the second position, and the dictionaries a and b are moved down respectively.
【0026】次に、別の単語候補が辞書aから検出され
ると、辞書aは2位に繰り上げられる。関連辞書表5bか
ら、辞書bと辞書cが関連することがわかるが、辞書c
は辞書aより上位にあるため、辞書bについてだけ繰上
げ処理を行う。Next, when another word candidate is detected from the dictionary a, the dictionary a is moved up to the second position. It can be seen from the related dictionary table 5b that the dictionary b and the dictionary c are related, but the dictionary c
Is higher than the dictionary a, the carry-up process is performed only for the dictionary b.
【0027】次に、さらに辞書aから検出されると、辞
書aは回数2になるので1位に上げる。辞書bと辞書c
が関連するがすでに3位と2位になっているので結果は
そのままとなる。Next, when it is further detected from the dictionary a, the dictionary a becomes the number of times 2, so it is moved up to the first place. Dictionary b and dictionary c
Is related, but since it is already in 3rd and 2nd place, the result remains the same.
【0028】例4:請求項4の発明に対応:検索記録5c
を備える場合 ある一定の処理単位(1文章や、一定の単語数)毎に、
検索の記録を保存しておく。記録内容は、検索した単語
名と検出できた辞書の順位、検索したときの優先度表5a
(更新前)の順位の写しである。Example 4: Corresponding to the invention of claim 4: Search record 5c
For each certain processing unit (one sentence or a certain number of words),
Keep a record of your searches. The recorded contents are the word name searched, the rank of the dictionary that could be detected, and the priority table when searching 5a
It is a copy of the ranking (before updating).
【0029】通常の検索では、例1〜例3と同様に、優
先度表5aに従って検索を行い、検出毎に更新前の優先度
表5aの順位の写しを単語名と検索できた辞書の順位と共
に検索記録5cに保存する。In a normal search, similar to Examples 1 to 3, the search is performed according to the priority table 5a, and a copy of the rank of the priority table 5a before updating is detected for each detection and the rank of the dictionary that can be searched. It is also saved in the search record 5c.
【0030】例えば機械翻訳の場合、検索結果を構文/
意味解析部に渡すと、構文/意味解析部その他の処理部
は処理を行い、最終結果として翻訳文を出力する。構文
/意味解析部の判断または最終結果の表示を見たオペレ
ータの判断によって不適当な結果とされると、再検索が
必要になる。再検索の指示がきた場合は検索記録5cをみ
て、同じ単語候補を検索した結果が残っているか探す。
単語候補の名前が検索記録5cに存在しない場合(単語の
切出し方が異なる場合等)は、現在の優先度表に基づい
て通常の検索と同じ処理を行う。単語候補の名前が検索
記録5cに存在する場合は、記録に残っている前回の辞書
の優先順位を参照し、前回検索した順位より下位にある
辞書を検索していく。For example, in the case of machine translation, the search result is syntax /
When passed to the semantic analysis unit, the syntax / semantic analysis unit and other processing units perform processing and output a translated sentence as a final result. If the syntax / semantic analysis unit judges or the operator who saw the display of the final result gives an inappropriate result, a re-search is required. When the re-search is instructed, the search record 5c is checked to see if the result of searching the same word candidate remains.
When the name of the word candidate does not exist in the search record 5c (when the word is cut out differently, etc.), the same processing as the normal search is performed based on the current priority table. If the name of the word candidate exists in the search record 5c, the priority of the previous dictionary remaining in the record is referred to, and the dictionary lower than the previously searched order is searched.
【0031】検出できたら、記録されている辞書の順位
を再検索できた辞書のランクに書き換える。また、優先
度表5aに対しては、前回検索した辞書の回数を減らし、
再検索した辞書の回数を増やし、必要ならば順位を入れ
換える。When it is detected, the rank of the recorded dictionary is rewritten to the rank of the dictionary that can be searched again. Also, for the priority table 5a, the number of times the dictionary searched last time is reduced,
Increase the number of re-searched dictionaries and change the ranking if necessary.
【0032】所定単位の処理が終了したら、記録を破棄
し、次の処理単位についての記録を開始する。図3は優
先度表5aと検索記録5cの更新例である。(A)は、ある
時点に単語W1が、2位にランクされていた辞書(この
場合c)の検索の結果、検出できた後の優先度表5aと検
索記録5cとを示す。検索記録5cは検索対象の単語名とそ
れが検出された辞書のランク、および更新前の優先度表
5aの辞書の順位の写しを保持する。(B)は、次に単語
W2が優先度表の3位の辞書(この場合b)から検出さ
れ、検索記録5cに追加されたことを示している。同時に
優先度表5aの辞書bの回数が1に更新されている。
(C)では、単語W3が2位の辞書(c)から検出され
たことが検索記録5cに追加されている。辞書cは3回使
われたので優先度表5aのランクは1位に更新されてい
る。When the processing of the predetermined unit is completed, the recording is discarded and the recording of the next processing unit is started. FIG. 3 is an example of updating the priority table 5a and the search record 5c. (A) shows the priority table 5a and the search record 5c after the word W1 was detected as a result of the search of the dictionary (c in this case) ranked second in the word W1 at a certain time. Search record 5c is the word name of the search target, the rank of the dictionary in which it was detected, and the priority table before update
Keep a copy of the ranks of the dictionary in 5a. (B) shows that the word W2 is detected next from the third dictionary (b in this case) in the priority table and added to the search record 5c. At the same time, the number of times the dictionary b in the priority table 5a is updated to 1.
In (C), it is added to the search record 5c that the word W3 has been detected from the second dictionary (c). Since the dictionary c has been used three times, the rank of the priority table 5a is updated to the first rank.
【0033】ここで、再検索の指示がくると、優先度表
ではなく、検索記録5cに記録されている優先順位に従っ
て検索を行う。単語W1に対して再検索の指示があった
とすると、前回は2位の辞書cから検出した(しかし不
適当であった)ので、3位以下の辞書b,d,eを順に
検索しにいく。辞書dから検出できたとすると、検索記
録5cに残されているランク2を辞書dのランク4に書き
換える。また、優先度表5aは辞書cの回数を1減らし、
辞書dの回数を1増やし、必要なら順位も変更する。
(D)は以上の再検索の結果、優先度表5aと検索記録5c
を更新した状態を示す。When a re-search instruction is given, the search is performed according to the priority order recorded in the search record 5c instead of the priority table. If the word W1 is instructed to be re-searched, it was detected from the second-ranked dictionary c (but was inappropriate) last time, so the dictionaries b, d, and e that are third-ranked or lower are searched in order. . If it can be detected from the dictionary d, the rank 2 left in the search record 5c is rewritten to the rank 4 of the dictionary d. Also, the priority table 5a reduces the number of times of the dictionary c by 1,
The number of times of the dictionary d is increased by 1, and the rank is changed if necessary.
As a result of the above re-search, (D) shows the priority table 5a and the search record 5c.
Shows the updated state.
【0034】なお、図1では、入力文書から単語判定部
が単語を切り出す構成になっているが、再検索などの場
合、オペレータ(使用者)が直接に各単語を指定して、
辞書検索部6に渡すようにしてもよい。In FIG. 1, the word determination unit cuts out words from the input document, but in the case of re-search, the operator (user) directly specifies each word,
It may be passed to the dictionary search unit 6.
【0035】[0035]
【発明の効果】以上説明したように、本発明によれば、
使用者が使用する専門用語辞書を特に指定しなくても、
文書が属する分野に適した専門用語辞書が優先的に検索
されることになり、辞書検索の効率をあげることができ
る。なお、初めて検索対象となった単語でも、それまで
検索された単語と同一の分野に属する可能性が高いの
で、適切な分野の辞書(その時点で優先順位の高い辞
書)から検索することになり、検索効率が高い。As described above, according to the present invention,
Even if you do not specify the technical term dictionary used by the user,
The technical term dictionary suitable for the field to which the document belongs is preferentially searched, and the efficiency of the dictionary search can be improved. It should be noted that even the word that was searched for for the first time is likely to belong to the same field as the previously searched word, so it will be searched from the dictionary of the appropriate field (dictionary with high priority at that time). , High search efficiency.
【0036】また、関連辞書表により、専門辞書間の関
連性を推定して、辞書の優先度を更新するときに、関連
すると思われる辞書の優先度も同時に高くすることで、
複数の分野に跨がる文書を処理する場合や、分野の異な
る文書を続けて処理する場合にも、検索効率を上げるこ
とができる。Further, by estimating the relevance between the specialized dictionaries from the related dictionary table and updating the priority of the dictionaries, the priority of the dictionaries which are considered to be related is also increased at the same time.
It is possible to improve the search efficiency even when processing a document that spans a plurality of fields, or when processing documents in different fields in succession.
【0037】検索結果が不適当なため再検索する場合
に、検索記録を使用することにより、自動的に別の辞書
から検索することができ、検索の効率を上げることがで
きる。When a search is performed again because the search result is unsuitable, by using the search record, it is possible to automatically search from another dictionary and improve the search efficiency.
【図1】 実施例の構成図FIG. 1 is a configuration diagram of an embodiment.
【図2】 優先度表の更新例[Fig. 2] Example of updating the priority table
【図3】 優先度表と検索記録の更新例[Fig. 3] Example of updating the priority table and search record
【図4】 辞書検索の例[Figure 4] Example of dictionary search
1 入力文書/指示入力 2 入力処理部 3 単語判定部 4 構文/意味解析部 5a 優先度表、 5b 関連辞書表、 5c 検索記録 6 辞書検索部 7 表更新部 8 基本辞書 8a,8b〜8n 専門用語辞書 1 input document / instruction input 2 input processing unit 3 word determination unit 4 syntax / semantic analysis unit 5a priority table, 5b related dictionary table, 5c search record 6 dictionary search unit 7 table update unit 8 basic dictionary 8a, 8b-8n specialty Term dictionary
Claims (4)
分野の単語に関する専門用語辞書群とを備えた文書処理
装置であって、 処理対象文書の文を単語候補に分割し分離する単語判定
部と、 各辞書の検索の優先度を記した優先度表と、 分離された単語候補について、優先度表に示された優先
度の順に従って各辞書を順次検索する辞書検索部と、 優先度表の各辞書の検索の優先度を、辞書からの検出状
況によって更新する表更新部とを備えたことを特徴とす
る文書処理装置。1. A document processing apparatus comprising a basic dictionary for basic words and a technical term dictionary group for words in a specialized field, wherein a word determination unit divides a sentence of a document to be processed into word candidates and separates them. , A priority table that describes the search priority of each dictionary, a dictionary search unit that sequentially searches each dictionary according to the priority order shown in the priority table for the separated word candidates, and a priority table And a table updating unit that updates the search priority of each dictionary according to the detection status from the dictionary.
て、 優先度表は、各辞書対応に単語検出回数を記録する項目
を有し、 表更新部は、検索できた辞書の単語検出回数に基づいて
優先度表を更新すると共に、その回数の多い順に優先度
が高くなるように更新することを特徴とする文書処理装
置。2. The document processing device according to claim 1, wherein the priority table has an item for recording the number of times of word detection for each dictionary, and the table updating unit sets the number of times of word detection of the dictionaries that can be searched. A document processing apparatus, characterized in that the priority table is updated based on the above, and the priority is updated in descending order of the number of times.
理装置において、 各辞書の間の関連の程度を記録した関連辞書表を有し、 表更新部は優先度表を更新するときに関連辞書表を参照
して関連する辞書についても優先度を更新することを特
徴とする文書処理装置。3. The document processing apparatus according to claim 1 or 2, further comprising a related dictionary table that records a degree of association between the dictionaries, and the table updating unit updates the priority table when updating the priority table. A document processing apparatus characterized by updating a priority of a related dictionary by referring to a related dictionary table.
載の文書処理装置において、 検索対象となった単語名と検索の結果それが検出された
辞書を示す情報と、その時点の各辞書の優先度を示す情
報とを保持する検索記録を有し、 表更新部は優先度表を更新するときに検索記録も更新
し、 辞書検索部は、構文/意味解析部等から再検索を指示さ
れたとき、検索記録を参照し、検索対象の単語候補の名
前が検索記録に存在する場合は、前回その単語候補を検
出した辞書の優先度より下位にある辞書から検索するこ
とを特徴とする文書処理装置。4. The document processing apparatus according to any one of claims 1 to 3, wherein a word name as a search target, information indicating a dictionary in which the word name is detected as a result of the search, and each dictionary at that time are included. The table update unit updates the search record when updating the priority table, and the dictionary search unit instructs the syntax / semantic analysis unit to perform a re-search. When the name of the word candidate to be searched is present in the search record, the search is performed from a dictionary lower than the priority of the dictionary that detected the word candidate last time. Document processing device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7105273A JPH08305695A (en) | 1995-04-28 | 1995-04-28 | Document processing device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7105273A JPH08305695A (en) | 1995-04-28 | 1995-04-28 | Document processing device |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH08305695A true JPH08305695A (en) | 1996-11-22 |
Family
ID=14403066
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP7105273A Withdrawn JPH08305695A (en) | 1995-04-28 | 1995-04-28 | Document processing device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH08305695A (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1998041930A1 (en) * | 1997-03-18 | 1998-09-24 | Siemens Aktiengesellschaft | Method for automatically generating a summarized text by a computer |
JP2000137731A (en) * | 1998-11-02 | 2000-05-16 | Matsushita Giken Kk | Information filter device and information filtering method |
JP2006106889A (en) * | 2004-09-30 | 2006-04-20 | Casio Comput Co Ltd | Information display control device and program |
US10198426B2 (en) | 2014-07-28 | 2019-02-05 | International Business Machines Corporation | Method, system, and computer program product for dividing a term with appropriate granularity |
-
1995
- 1995-04-28 JP JP7105273A patent/JPH08305695A/en not_active Withdrawn
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1998041930A1 (en) * | 1997-03-18 | 1998-09-24 | Siemens Aktiengesellschaft | Method for automatically generating a summarized text by a computer |
US6401086B1 (en) | 1997-03-18 | 2002-06-04 | Siemens Aktiengesellschaft | Method for automatically generating a summarized text by a computer |
JP2000137731A (en) * | 1998-11-02 | 2000-05-16 | Matsushita Giken Kk | Information filter device and information filtering method |
JP2006106889A (en) * | 2004-09-30 | 2006-04-20 | Casio Comput Co Ltd | Information display control device and program |
US10198426B2 (en) | 2014-07-28 | 2019-02-05 | International Business Machines Corporation | Method, system, and computer program product for dividing a term with appropriate granularity |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5523945A (en) | Related information presentation method in document processing system | |
JPH11102374A (en) | Method and device for displaying document of data base | |
JP2002041546A (en) | System and method for hierarchical statistical analysis | |
JP2004326216A (en) | Document search system, method and program, and recording medium | |
US20180246896A1 (en) | Corpus Specific Generative Query Completion Assistant | |
JPH08255172A (en) | Document retrieval system | |
JPH11102377A (en) | Method and device for retrieving document from data base | |
CA2577450C (en) | Landmark case identification system and method | |
JP2004178421A (en) | Document retrieval device, method for retrieving document, program, and recording medium | |
JPH05151253A (en) | Document retrieving device | |
JPH0844771A (en) | Information retrieval device | |
JPH08305695A (en) | Document processing device | |
JPH03294963A (en) | Document retrieving device | |
JPH07134720A (en) | Method and device for presenting relative information in sentence preparing system | |
JP2939841B2 (en) | Database search device | |
JP2000200279A (en) | Information retrieving device | |
KR20010107113A (en) | Reduction of Natural Language Queries into Boolen and Vector Queries Using Syntactic Tree in a Natural Language Information Retrieval System | |
JP4146067B2 (en) | Document search system and document search method | |
JP2002117043A (en) | Device and method for document retrieval, and recording medium with recorded program for implementing the same method | |
JPH09305626A (en) | Retrieval document preparing device, retrieval document storage media, device and method for retrieving document | |
JPH03123971A (en) | Indexing support device | |
JP2002032411A (en) | Method and device for related document retrieval | |
JP3161660B2 (en) | Keyword search method | |
JP2003242177A (en) | Information retrieval supporting system, program and recording medium | |
JPH1069490A (en) | Device and method for document narrowing-down retrieval, and document retrieval device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20020702 |