JPH03122770A - キーワード連想文書検索方法 - Google Patents
キーワード連想文書検索方法Info
- Publication number
- JPH03122770A JPH03122770A JP1260693A JP26069389A JPH03122770A JP H03122770 A JPH03122770 A JP H03122770A JP 1260693 A JP1260693 A JP 1260693A JP 26069389 A JP26069389 A JP 26069389A JP H03122770 A JPH03122770 A JP H03122770A
- Authority
- JP
- Japan
- Prior art keywords
- document
- keyword
- keywords
- strength
- relationship
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 10
- 238000004364 calculation method Methods 0.000 claims abstract description 12
- 238000012545 processing Methods 0.000 abstract description 6
- 230000008878 coupling Effects 0.000 description 15
- 238000010168 coupling process Methods 0.000 description 15
- 238000005859 coupling reaction Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000000546 chi-square test Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000002945 steepest descent method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/953—Organization of data
- Y10S707/959—Network
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99935—Query augmenting and refining, e.g. inexact access
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は、検索時に検索利用者の要求概念に近い文書群
の選択を可能としたニューラルネットによるキーワード
連想検索方法に関する。
の選択を可能としたニューラルネットによるキーワード
連想検索方法に関する。
従来の技術
近年、新聞、雑誌、単行本、論文誌などの文書情報の増
大によって、JOIS、NEEDS−IR,DIALO
G等の大規模データベースの利用者が急激に増加してい
る。
大によって、JOIS、NEEDS−IR,DIALO
G等の大規模データベースの利用者が急激に増加してい
る。
ここに、例えば[統計的手法による文書自動分類」 (
情報処理学会第36口金国大会論文集・・・昭和63年
前期)によれば、″カイ二乗検定”という統計的手法を
用いて文書を予め設定した分野へ自動的に分類する方式
について記載されている。
情報処理学会第36口金国大会論文集・・・昭和63年
前期)によれば、″カイ二乗検定”という統計的手法を
用いて文書を予め設定した分野へ自動的に分類する方式
について記載されている。
ここに、カイ二乗検定はキーワードの出現頻度の分野に
よる偏りを示す指標としてカイ二乗値を求める。カイ二
乗値は、各キーワードの出現頻度値と各分野毎の総キー
ワード数とが独立事象であると仮定した場合のキーワー
ドの出現頻度値を理論度数とし、実測値との差を求め正
規化したものである。
よる偏りを示す指標としてカイ二乗値を求める。カイ二
乗値は、各キーワードの出現頻度値と各分野毎の総キー
ワード数とが独立事象であると仮定した場合のキーワー
ドの出現頻度値を理論度数とし、実測値との差を求め正
規化したものである。
また、東洋経済新聞社の新聞(1974年)に掲載され
た「数量化の方法(林知己夫)」においても、カイ二乗
値を用いる統計的手法の一つであって、複数の分野間の
相関を見るための方式について記載されている。
た「数量化の方法(林知己夫)」においても、カイ二乗
値を用いる統計的手法の一つであって、複数の分野間の
相関を見るための方式について記載されている。
発明が解決しようとする課題
しかし、前者の方式は、キーワードの出現頻度の偏りを
用いて文書を分類する方式であり、予め大量の標本デー
タを分野別に分類してカイ二乗値を計算し、分類用デー
タを用意しておく必要がある。この標本データの分類に
はやはり人手による作業が必要となる。また、この際に
人的分類によるバラツキや不適切さが介入する可能性も
ある。
用いて文書を分類する方式であり、予め大量の標本デー
タを分野別に分類してカイ二乗値を計算し、分類用デー
タを用意しておく必要がある。この標本データの分類に
はやはり人手による作業が必要となる。また、この際に
人的分類によるバラツキや不適切さが介入する可能性も
ある。
一方、後者にあっては、分類用の軸を決定するのが難し
い上に、前者の場合と同様な問題点がある。
い上に、前者の場合と同様な問題点がある。
課題を解決するための手段
標準となる文書と各々の文書におけるキーワードとの共
出現頻度値を用いて各キーワード間の関係の強さを予め
算出しておくとともに、各文書におけるキーワードの重
要度をその文書中のキーワード出現頻度を用いて予め算
出しておき、検索利用者が入力する入力条件に対して、
前記キーワード間の関係の強さと文書中のキーワードの
重要度と所定の計算式とを用いて各文書の確度を算出し
、この確度に応じた連想検索を行うようにした。
出現頻度値を用いて各キーワード間の関係の強さを予め
算出しておくとともに、各文書におけるキーワードの重
要度をその文書中のキーワード出現頻度を用いて予め算
出しておき、検索利用者が入力する入力条件に対して、
前記キーワード間の関係の強さと文書中のキーワードの
重要度と所定の計算式とを用いて各文書の確度を算出し
、この確度に応じた連想検索を行うようにした。
さらに、請求項2記載の発明では、検索利用者が指定し
たキーワード間の関係の強さと文書中のキーワードの重
要度と所定の計算式を用いて算出された結果を表示出力
させ、検索利用者による指定キーワードと各文書との関
連の強さについての判断に基づきその関連の強さに対す
る期待値を入力することにより、キーワード間の関係の
強さ及び文書中のキーワードの重要度を変化させるよう
にした。
たキーワード間の関係の強さと文書中のキーワードの重
要度と所定の計算式を用いて算出された結果を表示出力
させ、検索利用者による指定キーワードと各文書との関
連の強さについての判断に基づきその関連の強さに対す
る期待値を入力することにより、キーワード間の関係の
強さ及び文書中のキーワードの重要度を変化させるよう
にした。
作用
検索利用者が入力する入力条件に対して、予め算出され
たキーワード間の関係の強さと文書中のキーワードの重
要度とともに所定の計算式とを用いて各文書の確度が算
出され、この確度に応じた連想検索が行なわれるので、
検索利用者の要求概念に対して適量かつ適量の検索結果
を与える連想検索が可能となる。
たキーワード間の関係の強さと文書中のキーワードの重
要度とともに所定の計算式とを用いて各文書の確度が算
出され、この確度に応じた連想検索が行なわれるので、
検索利用者の要求概念に対して適量かつ適量の検索結果
を与える連想検索が可能となる。
また、検索利用者が指定したキーワード間の関係の強さ
と文書中のキーワードの重要度と所定の計算式を用いて
算出された結果を表示出力させて検索利用者にそのキー
ワードと各文書との関連の強さについて判断させ、利用
者がその関連の強さに対する期待値を入力することによ
り、キーワード間の関係の強さ及び文書中のキーワード
の重要度が変化されるので、連想能力についての知識ベ
ースのユーザ適応化更新が可能となる。
と文書中のキーワードの重要度と所定の計算式を用いて
算出された結果を表示出力させて検索利用者にそのキー
ワードと各文書との関連の強さについて判断させ、利用
者がその関連の強さに対する期待値を入力することによ
り、キーワード間の関係の強さ及び文書中のキーワード
の重要度が変化されるので、連想能力についての知識ベ
ースのユーザ適応化更新が可能となる。
実施例
本発明の一実施例を図面に基づいて説明する。
まず、第1図は本実施例を実行するキーワード連想検索
装置のシステム構成を示す。このシステムは、利用者が
入力した検索条件を解析し下記の連想検索部にキーワー
ド重み値Qkを転送する入力解析部lと、前記キーワー
ド重み値Qkとキーワード間の関係の強さ(結合係数)
Wkjと文書中のキーワードの重要度(結合係数)Sj
iと所定の計算式を用いて文書毎の文書確度Diを計算
しこの文書確度Diを下記の出力制御部へ転送する連想
検索部2と、全ての文書を文書確度順にソートし文書確
度順リストを生成し出力する出力制御部3とを有する。
装置のシステム構成を示す。このシステムは、利用者が
入力した検索条件を解析し下記の連想検索部にキーワー
ド重み値Qkを転送する入力解析部lと、前記キーワー
ド重み値Qkとキーワード間の関係の強さ(結合係数)
Wkjと文書中のキーワードの重要度(結合係数)Sj
iと所定の計算式を用いて文書毎の文書確度Diを計算
しこの文書確度Diを下記の出力制御部へ転送する連想
検索部2と、全ての文書を文書確度順にソートし文書確
度順リストを生成し出力する出力制御部3とを有する。
また、出力制御部3から得られた結果である文書確度D
jはソートされ降順に利用者に表示出力される。この際
、利用者は入力した検索条件に対して出力結果を判断し
、入力解析部1への入力として望ましい値(=期待値)
Tjを入力すると、学習制御部4は所定の計算式を用い
て連想検索部2中の結合手段の結合係数Wkj及びSj
iを変更する。
jはソートされ降順に利用者に表示出力される。この際
、利用者は入力した検索条件に対して出力結果を判断し
、入力解析部1への入力として望ましい値(=期待値)
Tjを入力すると、学習制御部4は所定の計算式を用い
て連想検索部2中の結合手段の結合係数Wkj及びSj
iを変更する。
ここに、第2図は全キーワード数を01全文書数をmと
した時の前記連想検索部2の内部構成を示す。基本的に
は、キーワード数分の入力層5と中間層6と文書数分の
出力層7とよりなり、入力手段8に接続された入力層5
と中間層6との間はキーワード相互コネクション9によ
り結合され、中間層6と出力手段10が接続された出力
層7との間はキーワード/文書コネクション11により
結合されている。
した時の前記連想検索部2の内部構成を示す。基本的に
は、キーワード数分の入力層5と中間層6と文書数分の
出力層7とよりなり、入力手段8に接続された入力層5
と中間層6との間はキーワード相互コネクション9によ
り結合され、中間層6と出力手段10が接続された出力
層7との間はキーワード/文書コネクション11により
結合されている。
入力手段8はn個からなり、選択されたキーワードkに
より重み値Qk (k=I Nn)をキーワード相互
コネクション9に分配させるものである。
より重み値Qk (k=I Nn)をキーワード相互
コネクション9に分配させるものである。
また、キーワード相互コネクション9は入力手段8から
渡された重み値Qkに結合係数(関係の強さ)Wkjを
乗じた積Qk*Wkj を中間層6に分配させるもので
ある。この結合係数Wkjは標準となる文書と各々の文
書におけるキーワードとの共出現頻度値を用いて各キー
ワード間の関係の強さとして予め算出されている。キー
ワード/文書コネクション11はこのような積の和を計
算した後、所定の閾値処理を行い、その結果であるKj
に結合係数(重要度)Sjiを乗じた積Kj*Sjiを
文書確度Dj(j=1〜m)として出力層7へ転送させ
るものである。この結合係数Sjiも各文書中のキーワ
ード出現頻度を用いて予め算出されたものである。
渡された重み値Qkに結合係数(関係の強さ)Wkjを
乗じた積Qk*Wkj を中間層6に分配させるもので
ある。この結合係数Wkjは標準となる文書と各々の文
書におけるキーワードとの共出現頻度値を用いて各キー
ワード間の関係の強さとして予め算出されている。キー
ワード/文書コネクション11はこのような積の和を計
算した後、所定の閾値処理を行い、その結果であるKj
に結合係数(重要度)Sjiを乗じた積Kj*Sjiを
文書確度Dj(j=1〜m)として出力層7へ転送させ
るものである。この結合係数Sjiも各文書中のキーワ
ード出現頻度を用いて予め算出されたものである。
このような構成において、その動作例を説明する。まず
、利用者がn個のキーワードの内、少なくとも一つの検
索用キーワードと各々の重み値とを検索条件として入力
すると入力解析部lは連想検索部2の各キーワード番号
kに相当する重み値Qkを入力手段8に入力させる。連
想検索部2の入力層5は、キーワード重み値Qkをキー
ワード相互コネクション9へ転送する。キーワード相互
コネクション9では予め設定された結合係数(関係の強
さ)Wkjを重み値Qkに乗じて中間層6へ転送する。
、利用者がn個のキーワードの内、少なくとも一つの検
索用キーワードと各々の重み値とを検索条件として入力
すると入力解析部lは連想検索部2の各キーワード番号
kに相当する重み値Qkを入力手段8に入力させる。連
想検索部2の入力層5は、キーワード重み値Qkをキー
ワード相互コネクション9へ転送する。キーワード相互
コネクション9では予め設定された結合係数(関係の強
さ)Wkjを重み値Qkに乗じて中間層6へ転送する。
中間層6ではこの積の総和を計算し、その総和に対して
閾値処理を行った結果のKjをキーワード/文書コネク
ション10へ出力する。
閾値処理を行った結果のKjをキーワード/文書コネク
ション10へ出力する。
このキーワード/文書コネクションlOでは閾値処理結
果Kjに結合係数Sjiを乗じ、出力層7へ送る。出力
層7ではこの積の総和を計算し、その総和に対して閾値
処理fを行った結果であるDiを文書確度として出力す
る。
果Kjに結合係数Sjiを乗じ、出力層7へ送る。出力
層7ではこの積の総和を計算し、その総和に対して閾値
処理fを行った結果であるDiを文書確度として出力す
る。
出力制御部3ではこのような連想検索部2がらの出力で
ある文書確度値を降順にソートし、全ての文書番号と文
書確度との対を文書確度順リストとして生成し出力する
。以上の処理によって、文書確度順リストが得られる。
ある文書確度値を降順にソートし、全ての文書番号と文
書確度との対を文書確度順リストとして生成し出力する
。以上の処理によって、文書確度順リストが得られる。
ところで、閾値処理関数fとして、区分線形関数やシグ
モイド(sigmoid) 関数が使用できる。
モイド(sigmoid) 関数が使用できる。
本実施例の後述する学習の説明においては、この間数f
としてシグモイド関数が用いられている。
としてシグモイド関数が用いられている。
まず、文書確度計算について説明する。入力検索条件か
ら生成された各キーワードの重み値をQk 、キーワー
ド相互コネクション10を構成する結合係数をWkj、
キーワード/文書コネクション11を構成する結合係数
をSji、中間層6の出力をKJ、出力層7の出力、即
ち、文書確度を特徴とする特許 netj= Σ Wkj*Qk ・・・・
・・・・・・・・・・・・・・(1)Kj= f (n
et j ) ・・・・・・・・・・・・・・
・・・・・・・・・・・・・(2)neti=Σ Wj
i*Kj ・・・・・・・・・・・・・・・・
・・(3)」+1 Di== f (net i ) ・・・・・
・・・・・・・・・・・・・・・・・・・・・・(4)
ただし、f (x)は f(x)=1/ (1+e−” ) により与えられる。
ら生成された各キーワードの重み値をQk 、キーワー
ド相互コネクション10を構成する結合係数をWkj、
キーワード/文書コネクション11を構成する結合係数
をSji、中間層6の出力をKJ、出力層7の出力、即
ち、文書確度を特徴とする特許 netj= Σ Wkj*Qk ・・・・
・・・・・・・・・・・・・・(1)Kj= f (n
et j ) ・・・・・・・・・・・・・・
・・・・・・・・・・・・・(2)neti=Σ Wj
i*Kj ・・・・・・・・・・・・・・・・
・・(3)」+1 Di== f (net i ) ・・・・・
・・・・・・・・・・・・・・・・・・・・・・(4)
ただし、f (x)は f(x)=1/ (1+e−” ) により与えられる。
一方、学習機能を具体的なアルゴリズムにより説明する
。学習はある検索条件に対する結果を利用者が判断し、
文書確度の期待値Ti を入力することにより実行され
る。期待値Tiが入力されると評価関数Eが下記の(5
)式を用いて計算される。
。学習はある検索条件に対する結果を利用者が判断し、
文書確度の期待値Ti を入力することにより実行され
る。期待値Tiが入力されると評価関数Eが下記の(5
)式を用いて計算される。
ここに、学習とは、直接的にはこの評価関数をOに近付
けるように結合係数(キーワード間の関係の強さ及び文
書中のキーワードの重要度) Wkj。
けるように結合係数(キーワード間の関係の強さ及び文
書中のキーワードの重要度) Wkj。
Sjiを変更することを意味する。このような方法は、
一般に、ニューラルネットの学習に使用される最急降下
法である。ここに、ニューラルネットは一般に時間がか
がるが、本実施例の場合、結合係数Wkj、 Sjiの
初期値を上記の如く学習によらず設定できるため、初期
学習が不要でもある。
一般に、ニューラルネットの学習に使用される最急降下
法である。ここに、ニューラルネットは一般に時間がか
がるが、本実施例の場合、結合係数Wkj、 Sjiの
初期値を上記の如く学習によらず設定できるため、初期
学習が不要でもある。
ただし、Ei=(Ti−Di)”/2である。
ここに、結合係数Wkj、 Sjiの変化分をΔWkj
。
。
ΔSjiとすると、
Wkj=α(Wkj+ΔWkj) ・・・・・・・・
団・・・・・・・(6)Sji=α (Sji+Δ5j
i) ・・・・・・・・・・・自・■・・(7)た
だし、αは学習係数(定数) であるので、これらの変化分△Wkj、Δsjiは各々
(8)(9)式で与えられる。
団・・・・・・・(6)Sji=α (Sji+Δ5j
i) ・・・・・・・・・・・自・■・・(7)た
だし、αは学習係数(定数) であるので、これらの変化分△Wkj、Δsjiは各々
(8)(9)式で与えられる。
;)Dla net i aSji=η(Ti−
Di)・Di(1−Di)・Kj・・・・・・・・・(
8)=ξ・Σ(Ti−Di)・Di・(1−Di)=ξ
・Σ(Ti−Di)・Di・(1−Di)xSji−K
j・(1−Kj)・Qk ・・・・・・・・・川(9
)発明の効果 本発明は、上述したように構成したので、検索利用者が
入力する入力条件に対して、予め算出されたキーワード
間の関係の強さと文書中のキーワードの重要度とともに
所定の計算式とを用いて各文書の確度が算出され、この
確度に応じた連想検索が行なわれるため、検索利用者の
要求概念に対して適量かっ適量の検索結果を与える連想
検索が可能となり、また、検索利用者が指定したキーワ
ード間の関係の強さと文書中のキーワードの重要度と所
定の計算式を用いて算出された結果を表示出力させて検
索利用者にそのキーワードと各文書との関連の強さにつ
いて判断させ、利用者がその関連の強さに対する期待値
を入力することにより、キーワード間の関係の強さ及び
文書中のキーワードの重要度が変化されるので、連想能
力についての知識ベースのユーザ適応化更新が可能とな
るものである。
Di)・Di(1−Di)・Kj・・・・・・・・・(
8)=ξ・Σ(Ti−Di)・Di・(1−Di)=ξ
・Σ(Ti−Di)・Di・(1−Di)xSji−K
j・(1−Kj)・Qk ・・・・・・・・・川(9
)発明の効果 本発明は、上述したように構成したので、検索利用者が
入力する入力条件に対して、予め算出されたキーワード
間の関係の強さと文書中のキーワードの重要度とともに
所定の計算式とを用いて各文書の確度が算出され、この
確度に応じた連想検索が行なわれるため、検索利用者の
要求概念に対して適量かっ適量の検索結果を与える連想
検索が可能となり、また、検索利用者が指定したキーワ
ード間の関係の強さと文書中のキーワードの重要度と所
定の計算式を用いて算出された結果を表示出力させて検
索利用者にそのキーワードと各文書との関連の強さにつ
いて判断させ、利用者がその関連の強さに対する期待値
を入力することにより、キーワード間の関係の強さ及び
文書中のキーワードの重要度が変化されるので、連想能
力についての知識ベースのユーザ適応化更新が可能とな
るものである。
図面は本発明の一実施例を示し、第1図はシステム構成
を示すブロック図、第2図は連想検索部の内部構成を示
すブロック図である。
を示すブロック図、第2図は連想検索部の内部構成を示
すブロック図である。
Claims (1)
- 【特許請求の範囲】 1、標準となる文書と各々の文書におけるキーワードと
の共出現頻度値を用いて各キーワード間の関係の強さを
予め算出しておくとともに、各文書におけるキーワード
の重要度をその文書中のキーワード出現頻度を用いて予
め算出しておき、検索利用者が入力する入力条件に対し
て、前記キーワード間の関係の強さと文書中のキーワー
ドの重要度と所定の計算式とを用いて各文書の確度を算
出し、この確度に応じた連想検索を行うようにしたこと
を特徴とするキーワード連想文書検索方法。 2、検索利用者が指定したキーワード間の関係の強さと
文書中のキーワードの重要度と所定の計算式を用いて算
出された結果を表示出力させ、検索利用者による指定キ
ーワードと各文書との関連の強さについての判断に基づ
きその関連の強さに対する期待値を入力することにより
、キーワード間の関係の強さ及び文書中のキーワードの
重要度を変化させるようにしたことを特徴とする請求項
1記載のキーワード連想文書検索方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1260693A JPH03122770A (ja) | 1989-10-05 | 1989-10-05 | キーワード連想文書検索方法 |
US07/593,817 US5297042A (en) | 1989-10-05 | 1990-10-05 | Keyword associative document retrieval system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1260693A JPH03122770A (ja) | 1989-10-05 | 1989-10-05 | キーワード連想文書検索方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH03122770A true JPH03122770A (ja) | 1991-05-24 |
Family
ID=17351464
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1260693A Pending JPH03122770A (ja) | 1989-10-05 | 1989-10-05 | キーワード連想文書検索方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US5297042A (ja) |
JP (1) | JPH03122770A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05257991A (ja) * | 1992-03-16 | 1993-10-08 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索処理方式 |
JPH05314187A (ja) * | 1992-05-07 | 1993-11-26 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索方式 |
JPH07129593A (ja) * | 1993-09-08 | 1995-05-19 | Toshiba Corp | テキスト選定装置 |
JP2011504061A (ja) * | 2007-11-14 | 2011-01-27 | クゥアルコム・インコーポレイテッド | 移動環境においてターゲットコンテンツメッセージのユーザ相互関連付けを学習および予測するためにキーワードベクトルおよび関連するメトリックを使用する方法およびシステム |
US10621509B2 (en) | 2015-08-31 | 2020-04-14 | International Business Machines Corporation | Method, system and computer program product for learning classification model |
Families Citing this family (85)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05101107A (ja) * | 1991-10-07 | 1993-04-23 | Hitachi Ltd | 適合率を用いた絞り込みデータ検索装置及び方法 |
US5488725A (en) * | 1991-10-08 | 1996-01-30 | West Publishing Company | System of document representation retrieval by successive iterated probability sampling |
US5265065A (en) * | 1991-10-08 | 1993-11-23 | West Publishing Company | Method and apparatus for information retrieval from a database by replacing domain specific stemmed phases in a natural language to create a search query |
US5598557A (en) * | 1992-09-22 | 1997-01-28 | Caere Corporation | Apparatus and method for retrieving and grouping images representing text files based on the relevance of key words extracted from a selected file to the text files |
US5819259A (en) * | 1992-12-17 | 1998-10-06 | Hartford Fire Insurance Company | Searching media and text information and categorizing the same employing expert system apparatus and methods |
US5523945A (en) * | 1993-09-17 | 1996-06-04 | Nec Corporation | Related information presentation method in document processing system |
US5517405A (en) * | 1993-10-14 | 1996-05-14 | Aetna Life And Casualty Company | Expert system for providing interactive assistance in solving problems such as health care management |
JPH07319918A (ja) * | 1994-05-24 | 1995-12-08 | Fuji Xerox Co Ltd | 文書検索対象指示装置 |
US5745745A (en) * | 1994-06-29 | 1998-04-28 | Hitachi, Ltd. | Text search method and apparatus for structured documents |
JP2687882B2 (ja) * | 1994-07-05 | 1997-12-08 | 日本電気株式会社 | 検索条件統合装置 |
JP3030533B2 (ja) * | 1994-07-26 | 2000-04-10 | 篤 今野 | 情報分類装置 |
JPH08115334A (ja) * | 1994-10-18 | 1996-05-07 | Canon Inc | 検索装置 |
US5694594A (en) * | 1994-11-14 | 1997-12-02 | Chang; Daniel | System for linking hypermedia data objects in accordance with associations of source and destination data objects and similarity threshold without using keywords or link-difining terms |
US5642502A (en) * | 1994-12-06 | 1997-06-24 | University Of Central Florida | Method and system for searching for relevant documents from a text database collection, using statistical ranking, relevancy feedback and small pieces of text |
JP3282937B2 (ja) * | 1995-01-12 | 2002-05-20 | 日本アイ・ビー・エム株式会社 | 情報検索方法及びシステム |
CA2210581C (en) * | 1995-01-23 | 2002-03-26 | British Telecommunications Public Limited Company | Methods and/or systems for accessing information |
US6076082A (en) * | 1995-09-04 | 2000-06-13 | Matsushita Electric Industrial Co., Ltd. | Information filtering method and apparatus for preferentially taking out information having a high necessity |
US6901392B1 (en) | 1995-09-04 | 2005-05-31 | Matsushita Electric Industrial Co., Ltd. | Information filtering method and apparatus for preferentially taking out information having a high necessity |
US5713016A (en) * | 1995-09-05 | 1998-01-27 | Electronic Data Systems Corporation | Process and system for determining relevance |
US5745893A (en) * | 1995-11-30 | 1998-04-28 | Electronic Data Systems Corporation | Process and system for arrangement of documents |
US5787424A (en) * | 1995-11-30 | 1998-07-28 | Electronic Data Systems Corporation | Process and system for recursive document retrieval |
US5826260A (en) * | 1995-12-11 | 1998-10-20 | International Business Machines Corporation | Information retrieval system and method for displaying and ordering information based on query element contribution |
US5819260A (en) * | 1996-01-22 | 1998-10-06 | Lexis-Nexis | Phrase recognition method and apparatus |
US6295543B1 (en) * | 1996-04-03 | 2001-09-25 | Siemens Aktiengesellshaft | Method of automatically classifying a text appearing in a document when said text has been converted into digital data |
TW421764B (en) * | 1996-05-21 | 2001-02-11 | Hitachi Ltd | Input character string estimation and identification apparatus |
US5941944A (en) * | 1997-03-03 | 1999-08-24 | Microsoft Corporation | Method for providing a substitute for a requested inaccessible object by identifying substantially similar objects using weights corresponding to object features |
US6470307B1 (en) * | 1997-06-23 | 2002-10-22 | National Research Council Of Canada | Method and apparatus for automatically identifying keywords within a document |
US6128613A (en) * | 1997-06-26 | 2000-10-03 | The Chinese University Of Hong Kong | Method and apparatus for establishing topic word classes based on an entropy cost function to retrieve documents represented by the topic words |
JP2965010B2 (ja) * | 1997-08-30 | 1999-10-18 | 日本電気株式会社 | 関連情報検索方法及び装置並びにプログラムを記録した機械読み取り可能な記録媒体 |
US7124093B1 (en) * | 1997-12-22 | 2006-10-17 | Ricoh Company, Ltd. | Method, system and computer code for content based web advertising |
US20080028292A1 (en) * | 1997-12-22 | 2008-01-31 | Ricoh Company, Ltd. | Techniques to facilitate reading of a document |
US7257589B1 (en) * | 1997-12-22 | 2007-08-14 | Ricoh Company, Ltd. | Techniques for targeting information to users |
JP4183311B2 (ja) * | 1997-12-22 | 2008-11-19 | 株式会社リコー | 文書の注釈方法、注釈装置および記録媒体 |
US6144958A (en) * | 1998-07-15 | 2000-11-07 | Amazon.Com, Inc. | System and method for correcting spelling errors in search queries |
US6582475B2 (en) * | 1998-09-09 | 2003-06-24 | Ricoh Company Limited | Automatic adaptive document printing help system |
CA2326813A1 (en) * | 1999-01-29 | 2000-08-03 | Lg Electronics Inc. | Method of searching or browsing multimedia data and data structure |
US7016916B1 (en) * | 1999-02-01 | 2006-03-21 | Lg Electronics Inc. | Method of searching multimedia data |
JP3747133B2 (ja) | 1999-04-14 | 2006-02-22 | キヤノン株式会社 | 携帯端末及びその制御方法及びその記憶媒体 |
JP3368237B2 (ja) * | 1999-04-14 | 2003-01-20 | キヤノン株式会社 | コード処理方法、端末装置及び記憶媒体 |
JP3327877B2 (ja) | 1999-04-14 | 2002-09-24 | キヤノン株式会社 | 情報提供方法、情報提供システム、端末装置および情報提供プログラムを格納した記憶媒体 |
JP3327864B2 (ja) | 1999-04-14 | 2002-09-24 | キヤノン株式会社 | 情報登録方法、情報管理方法、情報登録装置、情報管理装置および記憶媒体 |
JP3376311B2 (ja) | 1999-04-14 | 2003-02-10 | キヤノン株式会社 | 情報提供方法および情報提供システム |
JP2000298677A (ja) * | 1999-04-14 | 2000-10-24 | Canon Inc | 情報検索方法、情報検索装置および記憶媒体 |
US7228492B1 (en) | 1999-07-06 | 2007-06-05 | Ricoh Company, Ltd. | 2D graph displaying document locations of user-specified concept of interest |
KR100346262B1 (ko) * | 1999-08-27 | 2002-07-26 | 엘지전자주식회사 | 멀티미디어 데이타의 키워드 자가 생성방법 |
US6876991B1 (en) | 1999-11-08 | 2005-04-05 | Collaborative Decision Platforms, Llc. | System, method and computer program product for a collaborative decision platform |
US6389467B1 (en) | 2000-01-24 | 2002-05-14 | Friskit, Inc. | Streaming media search and continuous playback system of media resources located by multiple network addresses |
US7228305B1 (en) | 2000-01-24 | 2007-06-05 | Friskit, Inc. | Rating system for streaming media playback system |
US6721741B1 (en) | 2000-01-24 | 2004-04-13 | Friskit, Inc. | Streaming media search system |
US6519648B1 (en) | 2000-01-24 | 2003-02-11 | Friskit, Inc. | Streaming media search and continuous playback of multiple media resources located on a network |
US7281034B1 (en) | 2000-01-24 | 2007-10-09 | Friskit, Inc. | System and method for media playback over a network using links that contain control signals and commands |
US7010537B2 (en) * | 2000-04-27 | 2006-03-07 | Friskit, Inc. | Method and system for visual network searching |
US7319975B2 (en) * | 2000-07-24 | 2008-01-15 | Emergency 24, Inc. | Internet-based advertising and referral system |
US6804662B1 (en) * | 2000-10-27 | 2004-10-12 | Plumtree Software, Inc. | Method and apparatus for query and analysis |
US7099860B1 (en) * | 2000-10-30 | 2006-08-29 | Microsoft Corporation | Image retrieval systems and methods with semantic and feature based relevance feedback |
GB2368670A (en) * | 2000-11-03 | 2002-05-08 | Envisional Software Solutions | Data acquisition system |
US20030120560A1 (en) * | 2001-12-20 | 2003-06-26 | John Almeida | Method for creating and maintaning worldwide e-commerce |
US20030157470A1 (en) * | 2002-02-11 | 2003-08-21 | Michael Altenhofen | E-learning station and interface |
US7152059B2 (en) * | 2002-08-30 | 2006-12-19 | Emergency24, Inc. | System and method for predicting additional search results of a computerized database search user based on an initial search query |
US7076497B2 (en) * | 2002-10-11 | 2006-07-11 | Emergency24, Inc. | Method for providing and exchanging search terms between internet site promoters |
US20030088553A1 (en) * | 2002-11-23 | 2003-05-08 | Emergency 24, Inc. | Method for providing relevant search results based on an initial online search query |
US7111000B2 (en) * | 2003-01-06 | 2006-09-19 | Microsoft Corporation | Retrieval of structured documents |
US20040133560A1 (en) * | 2003-01-07 | 2004-07-08 | Simske Steven J. | Methods and systems for organizing electronic documents |
US7194466B2 (en) * | 2003-05-01 | 2007-03-20 | Microsoft Corporation | Object clustering using inter-layer links |
US20030167212A1 (en) * | 2003-05-15 | 2003-09-04 | Emergency 24, Inc. | Method and system for providing relevant advertisement internet hyperlinks |
US8271495B1 (en) | 2003-12-17 | 2012-09-18 | Topix Llc | System and method for automating categorization and aggregation of content from network sites |
US7814089B1 (en) | 2003-12-17 | 2010-10-12 | Topix Llc | System and method for presenting categorized content on a site using programmatic and manual selection of content items |
US7289985B2 (en) * | 2004-04-15 | 2007-10-30 | Microsoft Corporation | Enhanced document retrieval |
US7689585B2 (en) * | 2004-04-15 | 2010-03-30 | Microsoft Corporation | Reinforced clustering of multi-type data objects for search term suggestion |
US7428529B2 (en) * | 2004-04-15 | 2008-09-23 | Microsoft Corporation | Term suggestion for multi-sense query |
US7305389B2 (en) * | 2004-04-15 | 2007-12-04 | Microsoft Corporation | Content propagation for enhanced document retrieval |
US7260568B2 (en) * | 2004-04-15 | 2007-08-21 | Microsoft Corporation | Verifying relevance between keywords and web site contents |
US20050234973A1 (en) * | 2004-04-15 | 2005-10-20 | Microsoft Corporation | Mining service requests for product support |
US7366705B2 (en) * | 2004-04-15 | 2008-04-29 | Microsoft Corporation | Clustering based text classification |
JP2005309727A (ja) * | 2004-04-21 | 2005-11-04 | Hitachi Ltd | ファイルシステム |
US20060212142A1 (en) * | 2005-03-16 | 2006-09-21 | Omid Madani | System and method for providing interactive feature selection for training a document classification system |
US7747495B2 (en) * | 2005-10-24 | 2010-06-29 | Capsilon Corporation | Business method using the automated processing of paper and unstructured electronic documents |
US8176004B2 (en) * | 2005-10-24 | 2012-05-08 | Capsilon Corporation | Systems and methods for intelligent paperless document management |
US7930647B2 (en) * | 2005-12-11 | 2011-04-19 | Topix Llc | System and method for selecting pictures for presentation with text content |
US9405732B1 (en) | 2006-12-06 | 2016-08-02 | Topix Llc | System and method for displaying quotations |
US20080294619A1 (en) * | 2007-05-23 | 2008-11-27 | Hamilton Ii Rick Allen | System and method for automatic generation of search suggestions based on recent operator behavior |
US8290946B2 (en) * | 2008-06-24 | 2012-10-16 | Microsoft Corporation | Consistent phrase relevance measures |
LT5673B (lt) | 2008-11-11 | 2010-08-25 | Vilniaus Gedimino technikos universitetas | Elektroninės informacijos paieškos būdas ir sistema |
IN2014MU00119A (ja) | 2014-01-14 | 2015-08-28 | Tata Consultancy Services Ltd | |
CN110941743B (zh) * | 2019-10-14 | 2023-09-15 | 广西壮族自治区科学技术情报研究所 | 一种基于深度学习算法自动实现字段权重分配的科技项目查重方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS589982B2 (ja) * | 1980-05-30 | 1983-02-23 | 工業技術院長 | 情報検索装置 |
US4554631A (en) * | 1983-07-13 | 1985-11-19 | At&T Bell Laboratories | Keyword search automatic limiting method |
JPS60136892A (ja) * | 1983-12-26 | 1985-07-20 | Hitachi Ltd | オンライン手書き図形認識装置 |
US4823306A (en) * | 1987-08-14 | 1989-04-18 | International Business Machines Corporation | Text search system |
US4849898A (en) * | 1988-05-18 | 1989-07-18 | Management Information Technologies, Inc. | Method and apparatus to identify the relation of meaning between words in text expressions |
-
1989
- 1989-10-05 JP JP1260693A patent/JPH03122770A/ja active Pending
-
1990
- 1990-10-05 US US07/593,817 patent/US5297042A/en not_active Expired - Fee Related
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05257991A (ja) * | 1992-03-16 | 1993-10-08 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索処理方式 |
JPH05314187A (ja) * | 1992-05-07 | 1993-11-26 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索方式 |
JPH07129593A (ja) * | 1993-09-08 | 1995-05-19 | Toshiba Corp | テキスト選定装置 |
JP2011504061A (ja) * | 2007-11-14 | 2011-01-27 | クゥアルコム・インコーポレイテッド | 移動環境においてターゲットコンテンツメッセージのユーザ相互関連付けを学習および予測するためにキーワードベクトルおよび関連するメトリックを使用する方法およびシステム |
US9705998B2 (en) | 2007-11-14 | 2017-07-11 | Qualcomm Incorporated | Method and system using keyword vectors and associated metrics for learning and prediction of user correlation of targeted content messages in a mobile environment |
US10621509B2 (en) | 2015-08-31 | 2020-04-14 | International Business Machines Corporation | Method, system and computer program product for learning classification model |
Also Published As
Publication number | Publication date |
---|---|
US5297042A (en) | 1994-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH03122770A (ja) | キーワード連想文書検索方法 | |
Nabil et al. | Prediction of students’ academic performance based on courses’ grades using deep neural networks | |
Kang | An investigation of the use of feedforward neural networks for forecasting | |
US6996366B2 (en) | Automated individualized learning program creation system and associated methods | |
JP2003345810A (ja) | 文書検索方法、文書検索システム及び文書検索結果示方システム | |
CN111367790A (zh) | 一种基于混合模型的元启发式测试用例排序方法 | |
CN110111885A (zh) | 属性预测方法、装置、计算机设备及计算机可读存储介质 | |
US20060155687A1 (en) | Portable database search agent processing system | |
CN115050484A (zh) | 基于防疫布控场景建模的分析预判方法及系统 | |
Zhang et al. | Neural network-molecular descriptors approach to the prediction of properties of alkenes | |
CN114066227A (zh) | 一种综合pis与权重的改进型fmea风险评估方法 | |
JP2829745B2 (ja) | 文書検索装置 | |
Soujanya et al. | A CNN based approach for handwritten character identification of Telugu guninthalu using various optimizers | |
Andreoua et al. | Financial versus human resources in the Greek‐Turkish arms race: A forecasting investigation using artificial neural networks | |
Inder et al. | K-DIME: a software framework for Kansei filtering of internet material | |
Ning et al. | Soft techniques for rule discovery in data | |
Zhong et al. | Multi-attention deep recurrent neural network for nursing action evaluation using wearable sensor | |
Chang et al. | A fuzzy rule-based approach for dynamic control of kanbans in a generic kanban system | |
CN115018623A (zh) | 还款计划生成方法、装置、设备及存储介质 | |
JP2954949B2 (ja) | 文書検索装置 | |
Gondek | What you see may not be what you think you get: Discriminant analysis in statistical packages | |
CN112417288A (zh) | 一种用于众包软件测试的任务跨域推荐方法 | |
JP3088805B2 (ja) | 文書管理装置 | |
Farkas | Improving the classification accuracy of automatic text processing systems using context vectors and back-propagation algorithms | |
JPH04127272A (ja) | 文書検索装置におけるキーワードコネクション処理方法 |