JPH0531788B2 - - Google Patents
Info
- Publication number
- JPH0531788B2 JPH0531788B2 JP59153628A JP15362884A JPH0531788B2 JP H0531788 B2 JPH0531788 B2 JP H0531788B2 JP 59153628 A JP59153628 A JP 59153628A JP 15362884 A JP15362884 A JP 15362884A JP H0531788 B2 JPH0531788 B2 JP H0531788B2
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- word
- heading
- search
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Document Processing Apparatus (AREA)
- Machine Translation (AREA)
Description
(産業上の利用分野)
本発明は、語辞書に於いて形態情報と単語及び
その対応情報との多対多対応や、単語及び文法情
報と意味情報の多対多対応関係にもとずいて、3
種の辞書に各々の情報を分割することにより辞書
内容の重複を回避し、且つ1つの辞書を指定し他
辞書を検索することを可能にする電子辞書に関す
る。
(従来技術とその問題点)
従来の電子辞書は、見出し語として活用形や原
形(ないし語幹)を使用しており、各々の辞書項
目の内容は表記、形態情報、文法情報、品詞情
報、意味情報などであり、それら全ての内容が1
つの見出し語の下にあつた。しかし表記などの形
態情報と文法情報の間には、表1に示すような対
応がある。
(Field of Industrial Application) The present invention is based on the many-to-many correspondence between morphological information and words and their corresponding information, and the many-to-many correspondence between words and grammatical information and semantic information in a word dictionary. ,3
The present invention relates to an electronic dictionary that avoids duplication of dictionary contents by dividing information into different dictionaries, and that allows one dictionary to be specified and other dictionaries to be searched. (Prior art and its problems) Conventional electronic dictionaries use conjugated forms and base forms (or stems) as headwords, and the contents of each dictionary entry include notation, morphological information, grammatical information, part-of-speech information, and meaning. information, etc., and the contents of all of them are 1
It was under one heading. However, there is a correspondence as shown in Table 1 between morphological information such as notation and grammatical information.
【表】
たとえば、単語「bite」を原形と考えると、
biteは表層形態として「bite、bit、bit」という
形態と「bite、bit、bitlen」という形態をもつ。
これは、原形「bite」と表層形の2対多の関係を
示す。逆に「bit」という表層形は、「bit」と
「bite」の両単語に対応する。これは1形態に対
し多単語対応があることを示す。故に表層形態と
単語には多対多の関係がある。また、単語と意味
にも同様な多対多の関係がある。例えば
「Festival」と「Fair」には意味「BAZAR」が
あり、逆に単語「fair」には意味「BAZR」と
「JUST」(公明正大)が対応する。
通常この組合せを記憶するためには表2に示す
ような辞書エントリーの構成が採用される。
表2 通常の辞書構成
形 態 単 語 意 味
bit bit BIT
SMALL
bit bite BITE
bitten bite BITE
festivals festival BAZAR
fairs fair BAZAR
fair fair BAZAR
JUST
Just just JUST
表2において見出しは形態、単語のどちらかで
あり、意味から、その表層単語、形態を検索する
ことができないとか、「festival」と「fair」と
「bazar」という単語が共通な意味「BAZAR」を
もつにもかかわらず何度も異なるエントリー下に
現われるため記述の冗長性があるなどの欠点があ
る。この結果、記述量の増加(すなわち所要記憶
容量の増大)することになるが、それにもかかわ
らず見出しとしては表層形や単語原形しか用いる
ことができず、意味からの検索は困難であつた。
(発明の目的)
本発明の目的は、上述の欠点を解消し、記述量
を増加させないで、意味、形態(表層表記)、単
語原形(表記)のうち1つを指定し他の情報を柔
軟に検索できる電子辞書を提供することにある。
(発明の構成)
本発明によれば、形態見出しに対応して1又は
複数個の形態情報と単語見出しとを有する形態項
目と、単語見出しに対応して構文品詞情報と該単
語に対応する1又は複数個の形態見出し及び意味
見出しとを有する単語項目を意味見出しに対応し
て意味情報と該意味見出しとを有する意味項目と
を保持する辞書格納手段と、項目の種類を示す記
号と見出しが入力され前記見出しに対応する検索
見出しを生成し前記辞書格納手段に供給する辞書
検索手段とから少なくとも構成されること特徴と
する電子辞書が得られる。
(実施例)
次に本発明により1実施例を図面を用いて説明
する。大1図において1は辞書検索・管理手段、
2は辞書格納手段である入力線4から検索辞書エ
ントリー(見出し)を入力すると、辞書検索管理
手段1によりデータ・制御線3を介し辞書格納手
段2より前記検索辞書エントリーに対応する内容
を検索しデータ線4を介し出力する。当辞書検索
手段は通常のB−tree手法により容易に構築でき
る。
なおこのB−tree手法については、宮川、弓場
により電気学会誌1975年8月号11頁から18頁に
「計算機における見出し検索の技術」と題して発
表された論文に評述されているので、ここでは簡
単な説明を行なうにとどめる。つまりB−tree手
法によれば辞書項目の1つを同定するための形態
素、意味表記、単語表記を探索インデクスとする
検索手段が構成できる。
第1図に於いて、前記辞書格納手段2中のレコ
ード内容を第2図を参照して説明する。辞書エン
トリー1つは可変長レコードであり、2つのフイ
ールドに分割される第1フイールドは同図におい
て212,222,232などの見出し語
(Mbit、Gbite、SBITE)と内容を含む。見出し
はB−tree手法等の前記検索手段の検索キーイン
デクスである。第2フイールドは、各前ボインタ
(各辞書項目レコードの第1フイールド中の見出
し語の集合)が格納される。当刻辞書格納手段2
中の内容は3つのタイプに分かれ、第1種21は
見出し語の先頭に全て“M”(morphologicalの
先頭文字)、第2種22は、見出しの先頭に全て
“G”(Grammaticalの先頭文字)を含む。第3
種23は見出しの先頭に“S”(semanticの先頭
文字)を含む。これにより異なる辞書を同一の物
理的辞書に統合し且つ、内容の異なる辞書にまた
がつた検索を可能にする。
第3図A,Bは該辞書検索手段1の動作を説明
するフロー図である。同図Aに於いて検索指定の
読み込みA1を行なう。検索指定は、表記(形
態、単語、意味表記の1つ)XとXが含まれる辞
書の種類(M、G、S、のうち1つ)Z、Xに関
連し検索した辞書の種類の集合Y(YC({M、G、
S、}−{Z}))である。見出し生成A2では、X
とZとよりB−tree検索見出しZXを生成し、そ
れを{INDEXj}(INDEXj=ZX)とおく。検索
関数の呼び出しA3では{INDEXj}の各々の
INDEXjに対してRETRIEVE関数Bを適用する。
RETRIEVE関数Bでは、レコードの検索B1
を次の要領で行なう。INDEXjによりB−treeに
より辞書項目レコードのアドレスを算出し
{Addressk}、{Addressk}を前記辞書格納手段
2に送り答として当該レコード{Rk}を受け取
り{Rk}を出力する。もし{Rk}が空なら当該
RETRIEVE関数は停止B3する。検索見出しの
生成B2では、{Rk}の第2フイールドからYの
要素を先頭文字とする見出し語を探し、それを
{INDEXj}とし、Yから{INDEXj}の先頭文
字を除いた文字集合を改めてYとおく。このと
き、{INDEXj}が空ならば停止B4する。
本実施例に於いて、先頭文字M、G、Sの見出
し語毎に検索手段を用意し三種の辞書を各々独立
なフアイルに割り付けることにより見出し語先頭
によつて辞書内容や検索キーインデツクスを区別
しなくても同様な検索が可能になる。また、前記
辞書検索手段1に於いて、検索された内容の第2
フイールドをもとに当該辞書検索手段によつて他
の辞書を検索することができる。この際第2フイ
ールドを辞書の見出し語ではなく、その見出し語
の検索手段中のキーインデツクスの物理的番地を
使うことにより高速な辞書検索手段を得ることが
できる。
(発明の効果)
本発明によれば語に関する三種の情報(表層形
態情報、文法品詞情報、意味・概念情報)を別々
に格納保持し、互いに対応する異種情報間にポイ
ンターを付けることにより、三種の情報のうち1
つを指定することによつて関連する他の辞書内容
を検索することができ、且つ各種情報に於いて、
同一内容をもつものを1つのレコードに保持する
ことにより、データの重複を回避できる電子辞書
が得られる。[Table] For example, if we consider the word "bite" as its original form,
Bite has two surface forms: ``bite, bit, bit'' and ``bite, bit, bitlen''.
This shows a two-to-many relationship between the original form "bite" and the surface form. Conversely, the superficial form ``bit'' corresponds to both the words ``bit'' and ``bite.'' This indicates that there is multi-word correspondence for one form. Therefore, there is a many-to-many relationship between surface forms and words. There is also a similar many-to-many relationship between words and meanings. For example, "Festival" and "Fair" have the meaning "BAZAR," and conversely, the word "fair" has the meanings "BAZR" and "JUST" (fair and fair). Normally, in order to store this combination, a dictionary entry structure as shown in Table 2 is adopted. Table 2 Usual dictionary structure Word Meaning bit bit BIT SMALL bit bite BITE bitten bite BITE festivals festival BAZAR fairs fair BAZAR fair fair BAZAR JUST Just just JUST In Table 2, the headings are either the form or the word, and the meaning Because the words "festival", "fair" and "bazar" appear under different entries many times even though they have a common meaning "BAZAR". It has drawbacks such as redundant descriptions. As a result, the amount of description increases (that is, the required storage capacity increases), but despite this, only surface forms and word forms can be used as headings, making it difficult to search based on meaning. (Objective of the Invention) The object of the present invention is to eliminate the above-mentioned drawbacks, specify one of the meaning, form (surface notation), and word base form (notation) without increasing the amount of description, and flexibly handle other information. The aim is to provide an electronic dictionary that can be searched. (Structure of the Invention) According to the present invention, a morphological item having one or more morphological information and a word heading corresponding to a morphological heading, syntactic part-of-speech information corresponding to a word heading, and a word heading corresponding to the word or dictionary storage means for storing a word item having a plurality of form headings and a plurality of meaning headings, and a meaning item having semantic information and the meaning heading corresponding to the meaning heading; and a symbol indicating the type of the item and the heading. There is obtained an electronic dictionary characterized in that it comprises at least a dictionary search means for generating a search heading corresponding to the entered heading and supplying it to the dictionary storage means. (Embodiment) Next, one embodiment of the present invention will be described with reference to the drawings. In Figure 1, 1 is a dictionary search and management means;
2, when a search dictionary entry (heading) is input through an input line 4, which is a dictionary storage means, the dictionary search management means 1 searches the dictionary storage means 2 through a data/control line 3 for contents corresponding to the search dictionary entry. Output via data line 4. This dictionary search means can be easily constructed using the usual B-tree method. This B-tree method is reviewed in a paper published by Miyagawa and Yumiba entitled "Technology for index search in computers" in the August 1975 issue of the Journal of the Institute of Electrical Engineers of Japan, pages 11 to 18. I will only give a brief explanation. That is, according to the B-tree method, it is possible to construct a search means that uses a morpheme, meaning notation, and word notation as a search index for identifying one of the dictionary items. In FIG. 1, the record contents in the dictionary storage means 2 will be explained with reference to FIG. 2. One dictionary entry is a variable length record, and the first field divided into two fields includes headwords (Mbit, Gbite, SBITE) such as 212, 222, 232 and contents in the figure. The heading is a search key index of the search means such as the B-tree method. The second field stores each previous pointer (a set of headwords in the first field of each dictionary entry record). Current dictionary storage means 2
The content inside is divided into three types: the first type 21 has an "M" (the first letter of morphological) at the beginning of the headword, and the second type 22 has a "G" (the first letter of grammatical) at the beginning of the headword. )including. Third
Species 23 includes "S" (the first character of semantics) at the beginning of the heading. This allows different dictionaries to be integrated into the same physical dictionary and allows searches across dictionaries with different contents. FIGS. 3A and 3B are flowcharts illustrating the operation of the dictionary search means 1. In A of the same figure, a search designation is read A1. The search specification is notation (one of form, word, meaning notation) Y(YC({M,G,
S, }−{Z})). In heading generation A2,
A B-tree search index ZX is generated from and Z, and it is set as {INDEXj} (INDEXj=ZX). In search function call A3, each of {INDEXj}
Apply RETRIEVE function B to INDEXj. In RETRIEVE function B, record search B1
Perform as follows. INDEXj calculates the address of the dictionary item record by B-tree {Addressk}, sends {Addressk} to the dictionary storage means 2, receives the record {R k } as a reply, and outputs {R k }. If {R k } is empty, then
The RETRIEVE function stops B3. In search heading generation B2, search the second field of {R k } for a headword whose first character is the element of Y, set it as {INDEXj}, and create a character set by removing the first character of {INDEXj} from Y. Let's say Y again. At this time, if {INDEXj} is empty, stop B4. In this embodiment, a search means is prepared for each entry word with the first character M, G, and S, and three types of dictionaries are allocated to independent files, so that the dictionary contents and search key index can be determined by the beginning of the entry word. Similar searches can be performed without distinction. Further, in the dictionary search means 1, the second
Other dictionaries can be searched by the dictionary search means based on the field. In this case, by using the physical address of the key index in the search means for the headword instead of the dictionary headword as the second field, a high-speed dictionary search means can be obtained. (Effects of the Invention) According to the present invention, three types of information regarding words (surface form information, grammatical part of speech information, and meaning/concept information) are stored and retained separately, and pointers are placed between different types of information that correspond to each other. 1 of the information
By specifying one, you can search for other related dictionary contents, and in various information,
By holding items with the same content in one record, an electronic dictionary that can avoid data duplication can be obtained.
第1図は本発明の一実施例を説明するための
図、第2図は辞書格納手段のレコード形式を説明
するための図、第3図A,Bは辞書検索手段の動
作を説明するための図である。
図において、1は辞書検索手段、2は辞書格納
手段である。
FIG. 1 is a diagram for explaining one embodiment of the present invention, FIG. 2 is a diagram for explaining the record format of the dictionary storage means, and FIGS. 3A and B are diagrams for explaining the operation of the dictionary retrieval means. This is a diagram. In the figure, 1 is a dictionary search means, and 2 is a dictionary storage means.
Claims (1)
報と単語見出しとを有する形態項目と、単語見出
しに対応して構文品詞情報と該単語に対応する形
態見出し及び意味見出しとを有する単語項目と意
味見出しに対応して意味情報と該意味に対する単
語見出しとを有する意味項目とを保護する辞書格
納手段と、項目の種類を示す信号と見出しが入力
され前記見出しに対応する検索見出しを生成し前
記辞書格納手段に供給する辞書検索手段とから少
なくとも構成されることを特徴とする電子辞書。1. A morphological item having one or more morphological information and a word heading corresponding to a morphological heading, and a word item having syntactic part-of-speech information corresponding to a word heading, and a morphological heading and a meaning heading corresponding to the word. dictionary storage means for protecting meaning items having semantic information and word headings for the meanings corresponding to the meaning headings; and a dictionary storing means for protecting meaning items having semantic information and word headings for the meanings; 1. An electronic dictionary comprising at least a dictionary search means supplied to a dictionary storage means.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15362884A JPS6132178A (en) | 1984-07-24 | 1984-07-24 | Electronic dictionary |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15362884A JPS6132178A (en) | 1984-07-24 | 1984-07-24 | Electronic dictionary |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS6132178A JPS6132178A (en) | 1986-02-14 |
JPH0531788B2 true JPH0531788B2 (en) | 1993-05-13 |
Family
ID=15566656
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP15362884A Granted JPS6132178A (en) | 1984-07-24 | 1984-07-24 | Electronic dictionary |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6132178A (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03157769A (en) * | 1989-11-16 | 1991-07-05 | Sanyo Electric Co Ltd | Concept retrieving method |
-
1984
- 1984-07-24 JP JP15362884A patent/JPS6132178A/en active Granted
Also Published As
Publication number | Publication date |
---|---|
JPS6132178A (en) | 1986-02-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5893087A (en) | Method and apparatus for improved information storage and retrieval system | |
US4775956A (en) | Method and system for information storing and retrieval using word stems and derivative pattern codes representing familes of affixes | |
US5099426A (en) | Method for use of morphological information to cross reference keywords used for information retrieval | |
Raymond et al. | Hypertext and the Oxford English dictionary | |
US5812995A (en) | Electronic document filing system for registering and retrieving a plurality of documents | |
JPH0531787B2 (en) | ||
Kircz | Rhetorical structure of scientific articles: the case for argumentational analysis in information retrieval | |
JPH0484271A (en) | Intra-information retrieval device | |
US20040243396A1 (en) | User-oriented electronic dictionary, electronic dictionary system and method for creating same | |
JPH0531788B2 (en) | ||
JPS60100223A (en) | Document creating and control device with automatic index generating function | |
JPH0531789B2 (en) | ||
Brunt | The code and the catalogue: a return to compatibility | |
Rather et al. | The MARC sort program | |
JP2907825B2 (en) | Information retrieval system | |
Mhashi et al. | Word frequency based indexing and authoring | |
JP2751681B2 (en) | Document search device | |
Faulhaber | Philobiblion: problems and solutions in a relational database of medieval texts | |
Rahtz | Bibliographic tools | |
JPS584482A (en) | English sentence generating system | |
JPS5727366A (en) | Electronic translator | |
Lancaster | Review 6--No Title | |
LIN | CD-ROM DATABASES FOR SERIALS CATALOGING | |
Weinberg | In-Depth Book Review | |
JPH01292576A (en) | Constitution and maintenance system for electronic dictionary |