JP4944406B2 - フレーズに基づく文書説明の生成方法 - Google Patents
フレーズに基づく文書説明の生成方法 Download PDFInfo
- Publication number
- JP4944406B2 JP4944406B2 JP2005216530A JP2005216530A JP4944406B2 JP 4944406 B2 JP4944406 B2 JP 4944406B2 JP 2005216530 A JP2005216530 A JP 2005216530A JP 2005216530 A JP2005216530 A JP 2005216530A JP 4944406 B2 JP4944406 B2 JP 4944406B2
- Authority
- JP
- Japan
- Prior art keywords
- phrase
- query
- document
- phrases
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 239000013598 vector Substances 0.000 claims description 83
- 238000000034 method Methods 0.000 claims description 62
- 230000008569 process Effects 0.000 claims description 27
- 238000012545 processing Methods 0.000 claims description 25
- 230000004044 response Effects 0.000 claims description 20
- 238000005259 measurement Methods 0.000 claims 1
- 239000011159 matrix material Substances 0.000 description 19
- 241000282472 Canis lupus familiaris Species 0.000 description 11
- 238000013459 approach Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 11
- 238000005192 partition Methods 0.000 description 10
- 230000009471 action Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 5
- 230000015654 memory Effects 0.000 description 5
- 230000009193 crawling Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 206010000060 Abdominal distension Diseases 0.000 description 1
- 241000212749 Zesius chrysomallus Species 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 208000024330 bloating Diseases 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 235000014510 cooky Nutrition 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
- G06F16/345—Summarisation for human users
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99935—Query augmenting and refining, e.g. inexact access
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Document Processing Apparatus (AREA)
Description
この出願は、下記の係属中の出願に関連している。
出願日2004年7月26日、出願番号第10/xxx、xxx号、名称「情報検索システムにおけるフレーズ同定化」、
出願日2004年7月26日、出願番号第10/xxx、xxx号、名称「情報検索システムにおけるフレーズに基づくインデックス化」、
出願日2004年7月26日、出願番号第10/xxx、xxx号、名称「情報検索システムにおけるフレーズに基づく検索」、
出願日2004年7月26日、出願番号第10/xxx、xxx号、名称「情報検索システムにおけるフレーズに基づく検索の個人化」、
出願日2004年7月26日、出願番号第10/xxx、xxx号、名称「フレーズを用いる検索結果の自動ソート生成」および、
出願日2004年7月26日、出願番号第10/xxx、xxx号、名称「情報検索システムにおけるフレーズに基づく複製文書の検出」、
これらは全て共に所有されており、本明細書中に引用して組み込む。
図1について説明する。本発明の一実施の形態による検索システム100の実施の形態のソフトウエアアーキテクチャを示す。本実施の形態では、システムには、インデックス化システム110、検索システム120、提示システム130、およびフロントエンドサーバ140が含まれる。
II.インデックス化システム
1.フレーズ識別
2.関連フレーズ、および関連フレーズのクラスタの識別
3.フレーズおよび関連フレーズによる文書インデックス化
a)文書の主題を判定
b)改良型ランク付けのための文書注釈
III.検索システム
1.クエリーおよびクエリー拡張のフレーズ識別
2.ランク付け
a)含まれるフレーズに基づく文書ランク付け
b)アンカーフレーズに基づく文書のランク付け
3.フレーズに基づく検索個人化
IV. 結果提示
1.提示のための動的ソート生成
2.主題に基づく文書説明
a)一般的な主題文書説明
b)個人化した主題に基づく文書説明
3.複製文書の検出および削除
170 クライアント
180 インターネット
190 ウェブサイト
Claims (16)
- 文書の説明を自動的に生成する方法であって、
コンピュータシステム内のプロセッサの処理によって、クエリーに応じて文書を検索するステップと、ここで、前記クエリーは少なくとも1つのクエリーフレーズを含み、該クエリーフレーズとは前記クエリー内に含まれるフレーズであり、前記文書は複数の文を含み、
前記検索に応じて、コンピュータシステム内のプロセッサの処理によって、前記クエリーフレーズが前記文書の文中に出現する回数を各文について測定した第1カウントを決定するステップと、
前記検索に応じて、コンピュータシステム内のプロセッサの処理によって、前記クエリーフレーズに関連する関連フレーズが前記文書の文中に出現する回数を各文について測定した第2カウントを決定するステップと、ここで、前記関連フレーズとは、前記クエリーフレーズに関連するものとして予め定義されたフレーズであり、或る第1フレーズ(g j )に関する或る第2フレーズ(g k )の情報ゲインが所定の閾値を超えるとき該第2フレーズ(g k )を該第1フレーズ(g j )の前記関連フレーズとして識別することにより定義されたものであり、前記情報ゲインとは、前記第1及び第2フレーズ(g j ,g k )の共出現率の期待値及び該両フレーズ(g j ,g k )の実際の共出現率の関数であり、
前記検索に応じて、コンピュータシステム内のプロセッサの処理によって、前記クエリーフレーズのフレーズ拡張が前記文書の文中に出現する回数を各文について測定した第3カウントを決定するステップと、ここで、前記クエリーフレーズの前記フレーズ拡張は、前記クエリーフレーズに一致するフレーズを含み且つ該クエリーフレーズよりも長いフレーズシーケンスからなり、
コンピュータシステム内のプロセッサの処理によって、前記第1乃至第3カウントに基づいて前記文書内の1又は複数の文を選択するステップと、
コンピュータシステム内のプロセッサの処理によって、前記選択した文を利用して前記文書の説明を形成するステップと、
を備える方法。 - 前記第1乃至第3カウントに基づいて前記文書内の1又は複数の文を選択する前記ステップは、
個々のカウントの降順で前記文書内の文をソートするステップと、
最大カウントを有する前記文書内の幾つかの文を選択するステップと、
を含む請求項1の方法。 - 前記選択した文を利用して前記文書の説明を形成する前記ステップは、前記選択した複数の文を連結することを含む、請求項1又は2の方法。
- 前記クエリーフレーズの関連フレーズを識別するステップを備え、該関連フレーズを識別するステップは、前記クエリーフレーズに対応するフレーズのポスティングリストから該クエリーフレーズに対応するフレーズの関連フレーズビットベクトルを読み出すステップを含み、前記関連フレーズビットベクトルは、該クエリーフレーズに対応するフレーズが存在する文書内に関連フレーズが存在しているかどうかを示すビットを具備している、請求項1乃至3のいずれかの方法。
- 前記個々のカウントの降順で前記文書内の文をソートする前記ステップは、前記クエリーフレーズの前記第1のカウントを第1ソートキー、前記関連フレーズの前記第2カウントを第2ソートキー、前記フレーズ拡張の前記第3カウントを第3ソートキー、として用いてソートする、請求項2の方法。
- 個別ユーザー向けに個人化された文書の説明を自動的に生成する方法であって、
コンピュータシステム内のプロセッサの処理によって、或るユーザーがアクセスした文書に含まれる複数のフレーズを内容とし、当該ユーザーに対応付けられた、ユーザーモデルを格納するステップと、
コンピュータシステム内のプロセッサの処理によって、前記ユーザーからクエリーを受け取るステップと、ここで、前記クエリーは少なくとも1つのクエリーフレーズを含み、該クエリーフレーズとは前記クエリー内に含まれるフレーズであり、
コンピュータシステム内のプロセッサの処理によって、前記クエリーに応じて文書を選択するステップと、
コンピュータシステム内のプロセッサの処理によって、前記クエリーフレーズに関連する関連フレーズであって、前記ユーザーモデル内にあるフレーズを識別するステップと、ここで、前記関連フレーズとは、前記クエリーフレーズに関連するものとして予め定義されたフレーズであり、或る第1フレーズ(g j )に関する或る第2フレーズ(g k )の情報ゲインが所定の閾値を超えるとき該第2フレーズ(g k )を該第1フレーズ(g j )の前記関連フレーズとして識別することにより定義されたものであり、前記情報ゲインとは、前記第1及び第2フレーズ(g j ,g k )の共出現率の期待値及び該両フレーズ(g j ,g k )の実際の共出現率の関数であり、
コンピュータシステム内のプロセッサの処理によって、前記選択された前記文書から前記クエリーフレーズ及び前記識別されたフレーズに従って文を選択し、該選択した文を各文内の前記クエリーフレーズ及び前記識別されたフレーズの数の関数として順序付けし、こうして選択され順序付けられた文で構成される前記ユーザー向けに個人化された文書の説明を生成するステップと、
を備える方法。 - 個別ユーザー向けに個人化された文書の説明を自動的に生成する方法であって、
コンピュータシステム内のプロセッサの処理によって、或るユーザーがアクセスした文書に含まれる複数のフレーズを内容とし、当該ユーザーに対応付けられた、ユーザーモデルを格納するステップと、
コンピュータシステム内のプロセッサの処理によって、前記ユーザーからクエリーを受け取るステップと、ここで、前記クエリーは少なくとも1つのクエリーフレーズを含み、該クエリーフレーズとは前記クエリー内に含まれるフレーズであり、
コンピュータシステム内のプロセッサの処理によって、前記クエリーに応じて文書を選択するステップと、
コンピュータシステム内のプロセッサの処理によって、前記クエリーフレーズに関連する関連フレーズであって、前記ユーザーモデル内にあるフレーズを識別するステップと、ここで、前記関連フレーズとは、前記クエリーフレーズに関連するものとして予め定義されたフレーズであり、或る第1フレーズ(g j )に関する或る第2フレーズ(g k )の情報ゲインが所定の閾値を超えるとき該第2フレーズ(g k )を該第1フレーズ(g j )の前記関連フレーズとして識別することにより定義されたものであり、前記情報ゲインとは、前記第1及び第2フレーズ(g j ,g k )の共出現率の期待値及び該両フレーズ(g j ,g k )の実際の共出現率の関数であり、
コンピュータシステム内のプロセッサの処理によって、前記選択された文書内の各文について、該文において出現する前記識別されたフレーズの各々についての出現数を測定したカウントを判定するステップと、
コンピュータシステム内のプロセッサの処理によって、個々の前記カウントに基づいて1以上の文を選択するステップと、
コンピュータシステム内のプロセッサの処理によって、前記選択した文を利用して前記文書の説明を形成し、これにより前記ユーザー向けに個人化された文書の説明を生成するステップと、
を備える方法。 - 前記クエリーフレーズの関連フレーズを識別するステップを備え、該関連フレーズを識別するステップは、前記クエリーフレーズに対応するフレーズのポスティングリストから該クエリーフレーズに対応するフレーズの関連フレーズビットベクトルを読み出すステップを含み、前記関連フレーズビットベクトルは、該クエリーフレーズに対応するフレーズが存在する文書内に関連フレーズが存在しているかどうかを示すビットを具備している、請求項7の方法。
- 前記選択した文を利用して前記文書の説明を形成する前記ステップは、前記選択した複数の文を連結することを含む、請求項7又は8の方法。
- 文書の説明を自動的に生成するための、コンピュータシステム内のプロセッサによって実行されるプログラムであって、該プロセッサに、
クエリーに応じて文書を検索する手順と、ここで、前記クエリーは少なくとも1つのクエリーフレーズを含み、該クエリーフレーズとは前記クエリー内に含まれるフレーズであり、前記文書は複数の文を含み、
前記検索に応じて、前記クエリーフレーズが前記文書の文中に出現する回数を各文について測定した第1カウントを計算する手順と、
前記検索に応じて、前記クエリーフレーズに関連する関連フレーズが前記文書の文中に出現する回数を各文について測定した第2カウントを計算する手順と、ここで、前記関連フレーズとは、前記クエリーフレーズに関連するものとして予め定義されたフレーズであり、或る第1フレーズ(g j )に関する或る第2フレーズ(g k )の情報ゲインが所定の閾値を超えるとき該第2フレーズ(g k )を該第1フレーズ(g j )の前記関連フレーズとして識別することにより定義されたものであり、前記情報ゲインとは、前記第1及び第2フレーズ(g j ,g k )の共出現率の期待値及び該両フレーズ(g j ,g k )の実際の共出現率の関数であり、
前記検索に応じて、前記クエリーフレーズのフレーズ拡張が前記文書の文中に出現する回数を各文について測定した第3カウントを計算する手順と、ここで、前記クエリーフレーズの前記フレーズ拡張は、前記クエリーフレーズに一致するフレーズを含み且つ該クエリーフレーズよりも長いフレーズシーケンスからなり、
前記第1乃至第3カウントに基づいて前記文書内の1又は複数の文を選択する手順と、
前記選択した文を利用して前記文書の説明を形成する手順と、
を実行させるためのプログラム。 - 個別ユーザー向けに個人化された文書の説明を自動的に生成するための、コンピュータシステム内のプロセッサによって実行されるプログラムであって、該プロセッサに、
或るユーザーがアクセスした文書に含まれる複数のフレーズを内容とし、当該ユーザーに対応付けられた、ユーザーモデルを格納する手順と、
前記ユーザーからクエリーを受信する手順と、ここで、前記クエリーは少なくとも1つのクエリーフレーズを含み、該クエリーフレーズとは前記クエリー内に含まれるフレーズであり、
前記クエリーに応じて文書を選択する手順と、
前記クエリーフレーズに関連する関連フレーズであって、前記ユーザーモデル内にあるフレーズを識別する手順と、ここで、前記関連フレーズとは、前記クエリーフレーズに関連するものとして予め定義されたフレーズであり、或る第1フレーズ(g j )に関する或る第2フレーズ(g k )の情報ゲインが所定の閾値を超えるとき該第2フレーズ(g k )を該第1フレーズ(g j )の前記関連フレーズとして識別することにより定義されたものであり、前記情報ゲインとは、前記第1及び第2フレーズ(g j ,g k )の共出現率の期待値及び該両フレーズ(g j ,g k )の実際の共出現率の関数であり、
前記選択された前記文書から前記クエリーフレーズ及び前記識別されたフレーズに従って文を選択し、該選択した文を各文内の前記クエリーフレーズ及び前記識別されたフレーズの数の関数として順序付けし、こうして選択され順序付けられた文で構成される前記ユーザー向けに個人化された文書の説明を生成する手順と、
を実行させるためのプログラム。 - 文書の説明を自動的に生成するための、コンピュータを装備したシステムであって、
クエリーに応じて文書を検索することをコンピュータによって実行するように構成された文書検索システムと、ここで、前記クエリーは少なくとも1つのクエリーフレーズを含み、該クエリーフレーズとは前記クエリー内に含まれるフレーズであり、前記文書は複数の文を含み、
コンピュータによって実行されるように構成された文書説明生成システムであって、
前記検索に応じて、前記クエリーフレーズが前記文書の文中に出現する回数を各文について測定した第1カウントを計算し、
前記検索に応じて、前記クエリーフレーズに関連する関連フレーズが前記文書の文中に出現する回数を各文について測定した第2カウントを計算し、ここで、前記関連フレーズとは、前記クエリーフレーズに関連するものとして予め定義されたフレーズであり、或る第1フレーズ(g j )に関する或る第2フレーズ(g k )の情報ゲインが所定の閾値を超えるとき該第2フレーズ(g k )を該第1フレーズ(g j )の前記関連フレーズとして識別することにより定義されたものであり、前記情報ゲインとは、前記第1及び第2フレーズ(g j ,g k )の共出現率の期待値及び該両フレーズ(g j ,g k )の実際の共出現率の関数であり、
前記検索に応じて、前記クエリーフレーズのフレーズ拡張が前記文書の文中に出現する回数を各文について測定した第3カウントを計算し、ここで、前記クエリーフレーズの前記フレーズ拡張は、前記クエリーフレーズに一致するフレーズを含み且つ該クエリーフレーズよりも長いフレーズシーケンスからなり、
前記第1乃至第3カウントに基づいて前記文書内の1又は複数の文を選択し、
前記選択した文を利用して前記文書の説明を形成する、
ように構成された前記文書説明生成システムと
を備えるシステム。 - 前記文書説明生成システムが、前記第1乃至第3カウントに基づいて前記文書内の1又は複数の文を選択することは、
個々のカウントの降順で前記文書内の文をソートし、
最大カウントを有する前記文書内の幾つかの文を選択することを含む、請求項12のシステム。 - 前記個々のカウントの降順で前記文書内の文をソートすることは、前記クエリーフレーズの前記第1のカウントを第1ソートキー、前記関連フレーズの前記第2カウントを第2ソートキー、前記フレーズ拡張の前記第3カウントを第3ソートキー、として用いてソートすることからなる、請求項13のシステム。
- 前記文書説明生成システムが、前記選択した文を利用して前記文書の説明を形成することは、前記選択した複数の文を連結することを含む、請求項13又は14のシステム。
- 個別ユーザー向けに個人化された文書の説明を自動的に生成するための、コンピュータを装備したシステムであって、
記憶媒体内に格納され、或るユーザーがアクセスした文書に含まれる複数のフレーズを内容とし、当該ユーザーに対応付けられた、ユーザーモデルと、
コンピュータによって実行されるように構成されたクエリー処理システムであって、
前記ユーザーからクエリーを受信し、ここで、前記クエリーは少なくとも1つのクエリーフレーズを含み、該クエリーフレーズとは前記クエリー内に含まれるフレーズであり、
前記クエリーに応じて文書を選択し、
前記クエリーフレーズに関連する関連フレーズであって、前記ユーザーモデル内にあるフレーズを識別し、ここで、前記関連フレーズとは、前記クエリーフレーズに関連するものとして予め定義されたフレーズであり、或る第1フレーズ(g j )に関する或る第2フレーズ(g k )の情報ゲインが所定の閾値を超えるとき該第2フレーズ(g k )を該第1フレーズ(g j )の前記関連フレーズとして識別することにより定義されたものであり、前記情報ゲインとは、前記第1及び第2フレーズ(g j ,g k )の共出現率の期待値及び該両フレーズ(g j ,g k )の実際の共出現率の関数であり、
前記選択された前記文書から前記クエリーフレーズ及び前記識別されたフレーズに従って文を選択し、該選択した文を各文内の前記クエリーフレーズ及び前記識別されたフレーズの数の関数として順序付けし、こうして選択され順序付けられた文で構成される前記ユーザー向けに個人化された文書の説明を生成する、
ように構成された前記クエリー処理システムと
を備えるシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/900,075 US7584175B2 (en) | 2004-07-26 | 2004-07-26 | Phrase-based generation of document descriptions |
US10/900,075 | 2004-07-26 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2006048686A JP2006048686A (ja) | 2006-02-16 |
JP2006048686A5 JP2006048686A5 (ja) | 2011-07-21 |
JP4944406B2 true JP4944406B2 (ja) | 2012-05-30 |
Family
ID=34982376
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005216530A Expired - Fee Related JP4944406B2 (ja) | 2004-07-26 | 2005-07-26 | フレーズに基づく文書説明の生成方法 |
Country Status (10)
Country | Link |
---|---|
US (1) | US7584175B2 (ja) |
EP (1) | EP1622052B1 (ja) |
JP (1) | JP4944406B2 (ja) |
KR (1) | KR101176079B1 (ja) |
CN (1) | CN1728143B (ja) |
AT (1) | ATE529811T1 (ja) |
AU (1) | AU2005203237B2 (ja) |
BR (1) | BRPI0503780A (ja) |
CA (1) | CA2513851C (ja) |
NO (1) | NO335144B1 (ja) |
Families Citing this family (67)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7266553B1 (en) * | 2002-07-01 | 2007-09-04 | Microsoft Corporation | Content data indexing |
US7580921B2 (en) | 2004-07-26 | 2009-08-25 | Google Inc. | Phrase identification in an information retrieval system |
US7711679B2 (en) | 2004-07-26 | 2010-05-04 | Google Inc. | Phrase-based detection of duplicate documents in an information retrieval system |
US7580929B2 (en) * | 2004-07-26 | 2009-08-25 | Google Inc. | Phrase-based personalization of searches in an information retrieval system |
US7599914B2 (en) * | 2004-07-26 | 2009-10-06 | Google Inc. | Phrase-based searching in an information retrieval system |
US7702618B1 (en) | 2004-07-26 | 2010-04-20 | Google Inc. | Information retrieval system for archiving multiple document versions |
US7567959B2 (en) | 2004-07-26 | 2009-07-28 | Google Inc. | Multiple index based information retrieval system |
US7536408B2 (en) | 2004-07-26 | 2009-05-19 | Google Inc. | Phrase-based indexing in an information retrieval system |
US7199571B2 (en) * | 2004-07-27 | 2007-04-03 | Optisense Network, Inc. | Probe apparatus for use in a separable connector, and systems including same |
US7467155B2 (en) * | 2005-07-12 | 2008-12-16 | Sand Technology Systems International, Inc. | Method and apparatus for representation of unstructured data |
US7475072B1 (en) | 2005-09-26 | 2009-01-06 | Quintura, Inc. | Context-based search visualization and context management using neural networks |
US7620607B1 (en) * | 2005-09-26 | 2009-11-17 | Quintura Inc. | System and method for using a bidirectional neural network to identify sentences for use as document annotations |
US20070078889A1 (en) * | 2005-10-04 | 2007-04-05 | Hoskinson Ronald A | Method and system for automated knowledge extraction and organization |
US7971137B2 (en) * | 2005-12-14 | 2011-06-28 | Google Inc. | Detecting and rejecting annoying documents |
US8126874B2 (en) * | 2006-05-09 | 2012-02-28 | Google Inc. | Systems and methods for generating statistics from search engine query logs |
US9892111B2 (en) | 2006-10-10 | 2018-02-13 | Abbyy Production Llc | Method and device to estimate similarity between documents having multiple segments |
US9189482B2 (en) | 2012-10-10 | 2015-11-17 | Abbyy Infopoisk Llc | Similar document search |
US9098489B2 (en) | 2006-10-10 | 2015-08-04 | Abbyy Infopoisk Llc | Method and system for semantic searching |
US9075864B2 (en) | 2006-10-10 | 2015-07-07 | Abbyy Infopoisk Llc | Method and system for semantic searching using syntactic and semantic analysis |
US9495358B2 (en) | 2006-10-10 | 2016-11-15 | Abbyy Infopoisk Llc | Cross-language text clustering |
US9069750B2 (en) | 2006-10-10 | 2015-06-30 | Abbyy Infopoisk Llc | Method and system for semantic searching of natural language texts |
US7966321B2 (en) | 2007-01-17 | 2011-06-21 | Google Inc. | Presentation of local results |
US8326858B2 (en) * | 2007-01-17 | 2012-12-04 | Google Inc. | Synchronization of fixed and mobile data |
US8005822B2 (en) * | 2007-01-17 | 2011-08-23 | Google Inc. | Location in search queries |
US8966407B2 (en) | 2007-01-17 | 2015-02-24 | Google Inc. | Expandable homepage modules |
US7966309B2 (en) | 2007-01-17 | 2011-06-21 | Google Inc. | Providing relevance-ordered categories of information |
US7437370B1 (en) * | 2007-02-19 | 2008-10-14 | Quintura, Inc. | Search engine graphical interface using maps and images |
US8166021B1 (en) | 2007-03-30 | 2012-04-24 | Google Inc. | Query phrasification |
US7925655B1 (en) | 2007-03-30 | 2011-04-12 | Google Inc. | Query scheduling using hierarchical tiers of index servers |
US8086594B1 (en) | 2007-03-30 | 2011-12-27 | Google Inc. | Bifurcated document relevance scoring |
US7702614B1 (en) | 2007-03-30 | 2010-04-20 | Google Inc. | Index updating using segment swapping |
US7693813B1 (en) | 2007-03-30 | 2010-04-06 | Google Inc. | Index server architecture using tiered and sharded phrase posting lists |
US8166045B1 (en) | 2007-03-30 | 2012-04-24 | Google Inc. | Phrase extraction using subphrase scoring |
US9535810B1 (en) | 2007-04-24 | 2017-01-03 | Wal-Mart Stores, Inc. | Layout optimization |
JP5241828B2 (ja) * | 2007-06-14 | 2013-07-17 | グーグル・インコーポレーテッド | 辞書の単語及び熟語の判定 |
US8117223B2 (en) * | 2007-09-07 | 2012-02-14 | Google Inc. | Integrating external related phrase information into a phrase-based indexing information retrieval system |
US20090119572A1 (en) * | 2007-11-02 | 2009-05-07 | Marja-Riitta Koivunen | Systems and methods for finding information resources |
US7949657B2 (en) * | 2007-12-11 | 2011-05-24 | Microsoft Corporation | Detecting zero-result search queries |
WO2009111631A1 (en) * | 2008-03-05 | 2009-09-11 | Chacha Search, Inc. | Method and system for triggering a search request |
US8180754B1 (en) | 2008-04-01 | 2012-05-15 | Dranias Development Llc | Semantic neural network for aggregating query searches |
US8788476B2 (en) * | 2008-08-15 | 2014-07-22 | Chacha Search, Inc. | Method and system of triggering a search request |
GB2472250A (en) * | 2009-07-31 | 2011-02-02 | Stephen Timothy Morris | Method for determining document relevance |
US8533579B2 (en) * | 2009-10-21 | 2013-09-10 | Symantec Corporation | Data loss detection method for handling fuzziness in sensitive keywords |
US8543381B2 (en) * | 2010-01-25 | 2013-09-24 | Holovisions LLC | Morphing text by splicing end-compatible segments |
US8392175B2 (en) * | 2010-02-01 | 2013-03-05 | Stratify, Inc. | Phrase-based document clustering with automatic phrase extraction |
US8650195B2 (en) * | 2010-03-26 | 2014-02-11 | Palle M Pedersen | Region based information retrieval system |
US8161073B2 (en) | 2010-05-05 | 2012-04-17 | Holovisions, LLC | Context-driven search |
US20110313756A1 (en) * | 2010-06-21 | 2011-12-22 | Connor Robert A | Text sizer (TM) |
US8655648B2 (en) * | 2010-09-01 | 2014-02-18 | Microsoft Corporation | Identifying topically-related phrases in a browsing sequence |
US9342582B2 (en) | 2010-11-22 | 2016-05-17 | Microsoft Technology Licensing, Llc | Selection of atoms for search engine retrieval |
US9529908B2 (en) | 2010-11-22 | 2016-12-27 | Microsoft Technology Licensing, Llc | Tiering of posting lists in search engine index |
US9195745B2 (en) | 2010-11-22 | 2015-11-24 | Microsoft Technology Licensing, Llc | Dynamic query master agent for query execution |
US8713024B2 (en) | 2010-11-22 | 2014-04-29 | Microsoft Corporation | Efficient forward ranking in a search engine |
US8620907B2 (en) | 2010-11-22 | 2013-12-31 | Microsoft Corporation | Matching funnel for large document index |
US9424351B2 (en) | 2010-11-22 | 2016-08-23 | Microsoft Technology Licensing, Llc | Hybrid-distribution model for search engine indexes |
US8478704B2 (en) | 2010-11-22 | 2013-07-02 | Microsoft Corporation | Decomposable ranking for efficient precomputing that selects preliminary ranking features comprising static ranking features and dynamic atom-isolated components |
CN102033911A (zh) * | 2010-11-25 | 2011-04-27 | 北京搜狗科技发展有限公司 | 一种搜索预处理方法和搜索预处理器 |
JP5669638B2 (ja) * | 2011-03-17 | 2015-02-12 | キヤノン株式会社 | 文書管理装置、文書管理方法、プログラム。 |
US20140114733A1 (en) * | 2012-10-23 | 2014-04-24 | Thomas A Mello | Business Review Internet Posting System Using Customer Survey Response |
US9104710B2 (en) | 2013-03-15 | 2015-08-11 | Src, Inc. | Method for cross-domain feature correlation |
US9501506B1 (en) | 2013-03-15 | 2016-11-22 | Google Inc. | Indexing system |
CN104182383B (zh) * | 2013-05-27 | 2019-01-01 | 腾讯科技(深圳)有限公司 | 一种文字统计方法及设备 |
US9483568B1 (en) | 2013-06-05 | 2016-11-01 | Google Inc. | Indexing system |
US9852648B2 (en) * | 2015-07-10 | 2017-12-26 | Fujitsu Limited | Extraction of knowledge points and relations from learning materials |
JP6435467B1 (ja) * | 2018-03-05 | 2018-12-12 | 株式会社テンクー | 検索システム及び検索システムの動作方法 |
US10902066B2 (en) * | 2018-07-23 | 2021-01-26 | Open Text Holdings, Inc. | Electronic discovery using predictive filtering |
JP7520500B2 (ja) * | 2019-12-09 | 2024-07-23 | 株式会社東芝 | データ生成装置およびデータ生成方法 |
Family Cites Families (110)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5321833A (en) | 1990-08-29 | 1994-06-14 | Gte Laboratories Incorporated | Adaptive ranking system for information retrieval |
US5523946A (en) * | 1992-02-11 | 1996-06-04 | Xerox Corporation | Compact encoding of multi-lingual translation dictionaries |
JPH0756933A (ja) | 1993-06-24 | 1995-03-03 | Xerox Corp | 文書検索方法 |
US5692176A (en) | 1993-11-22 | 1997-11-25 | Reed Elsevier Inc. | Associative text search and retrieval system |
US6460036B1 (en) | 1994-11-29 | 2002-10-01 | Pinpoint Incorporated | System and method for providing customized electronic newspapers and target advertisements |
US5758257A (en) | 1994-11-29 | 1998-05-26 | Herz; Frederick | System and method for scheduling broadcast of and access to video programs and other data using customer profiles |
US5724571A (en) * | 1995-07-07 | 1998-03-03 | Sun Microsystems, Inc. | Method and apparatus for generating query responses in a computer-based document retrieval system |
US6366933B1 (en) | 1995-10-27 | 2002-04-02 | At&T Corp. | Method and apparatus for tracking and viewing changes on the web |
US6098034A (en) | 1996-03-18 | 2000-08-01 | Expert Ease Development, Ltd. | Method for standardizing phrasing in a document |
US5924108A (en) | 1996-03-29 | 1999-07-13 | Microsoft Corporation | Document summarizer for word processors |
US7051024B2 (en) | 1999-04-08 | 2006-05-23 | Microsoft Corporation | Document summarizer for word processors |
US5826261A (en) | 1996-05-10 | 1998-10-20 | Spencer; Graham | System and method for querying multiple, distributed databases by selective sharing of local relative significance information for terms related to the query |
US5915249A (en) | 1996-06-14 | 1999-06-22 | Excite, Inc. | System and method for accelerated query evaluation of very large full-text databases |
EP0822502A1 (en) | 1996-07-31 | 1998-02-04 | BRITISH TELECOMMUNICATIONS public limited company | Data access system |
US5920854A (en) | 1996-08-14 | 1999-07-06 | Infoseek Corporation | Real-time document collection search engine with phrase indexing |
US6085186A (en) | 1996-09-20 | 2000-07-04 | Netbot, Inc. | Method and system using information written in a wrapper description language to execute query on a network |
US20030093790A1 (en) | 2000-03-28 | 2003-05-15 | Logan James D. | Audio and video program recording, editing and playback systems using metadata |
US5960383A (en) | 1997-02-25 | 1999-09-28 | Digital Equipment Corporation | Extraction of key sections from texts using automatic indexing techniques |
US6055540A (en) | 1997-06-13 | 2000-04-25 | Sun Microsystems, Inc. | Method and apparatus for creating a category hierarchy for classification of documents |
US6470307B1 (en) * | 1997-06-23 | 2002-10-22 | National Research Council Of Canada | Method and apparatus for automatically identifying keywords within a document |
JP4021525B2 (ja) * | 1997-07-28 | 2007-12-12 | 株式会社ジャストシステム | 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法 |
US5983216A (en) * | 1997-09-12 | 1999-11-09 | Infoseek Corporation | Performing automated document collection and selection by providing a meta-index with meta-index values indentifying corresponding document collections |
US5956722A (en) | 1997-09-23 | 1999-09-21 | At&T Corp. | Method for effective indexing of partially dynamic documents |
US6542888B2 (en) | 1997-11-26 | 2003-04-01 | International Business Machines Corporation | Content filtering for electronic documents generated in multiple foreign languages |
JP4183311B2 (ja) | 1997-12-22 | 2008-11-19 | 株式会社リコー | 文書の注釈方法、注釈装置および記録媒体 |
US6185558B1 (en) | 1998-03-03 | 2001-02-06 | Amazon.Com, Inc. | Identifying the items most relevant to a current query based on items selected in connection with similar queries |
JP3664874B2 (ja) | 1998-03-28 | 2005-06-29 | 松下電器産業株式会社 | 文書検索装置 |
US6363377B1 (en) | 1998-07-30 | 2002-03-26 | Sarnoff Corporation | Search data processor |
US6377949B1 (en) | 1998-09-18 | 2002-04-23 | Tacit Knowledge Systems, Inc. | Method and apparatus for assigning a confidence level to a term within a user knowledge profile |
US6415283B1 (en) | 1998-10-13 | 2002-07-02 | Orack Corporation | Methods and apparatus for determining focal points of clusters in a tree structure |
US7058589B1 (en) | 1998-12-17 | 2006-06-06 | Iex Corporation | Method and system for employee work scheduling |
US6862710B1 (en) | 1999-03-23 | 2005-03-01 | Insightful Corporation | Internet navigation using soft hyperlinks |
JP4021583B2 (ja) | 1999-04-08 | 2007-12-12 | 富士通株式会社 | 情報検索装置、情報検索方法、及びその方法を実現するプログラムを記録した記録媒体 |
US6430539B1 (en) | 1999-05-06 | 2002-08-06 | Hnc Software | Predictive modeling of consumer financial behavior |
US7089236B1 (en) * | 1999-06-24 | 2006-08-08 | Search 123.Com, Inc. | Search engine interface |
US6601026B2 (en) * | 1999-09-17 | 2003-07-29 | Discern Communications, Inc. | Information retrieval by natural language querying |
US6996775B1 (en) | 1999-10-29 | 2006-02-07 | Verizon Laboratories Inc. | Hypervideo: information retrieval using time-related multimedia: |
US6684183B1 (en) | 1999-12-06 | 2004-01-27 | Comverse Ltd. | Generic natural language service creation environment |
US6963867B2 (en) | 1999-12-08 | 2005-11-08 | A9.Com, Inc. | Search query processing to provide category-ranked presentation of search results |
US6772150B1 (en) | 1999-12-10 | 2004-08-03 | Amazon.Com, Inc. | Search query refinement using related search phrases |
CA2293064C (en) | 1999-12-22 | 2004-05-04 | Ibm Canada Limited-Ibm Canada Limitee | Method and apparatus for analyzing data retrieval using index scanning |
US6981040B1 (en) | 1999-12-28 | 2005-12-27 | Utopy, Inc. | Automatic, personalized online information and product services |
US6820237B1 (en) * | 2000-01-21 | 2004-11-16 | Amikanow! Corporation | Apparatus and method for context-based highlighting of an electronic document |
US6883135B1 (en) | 2000-01-28 | 2005-04-19 | Microsoft Corporation | Proxy server using a statistical model |
US6571240B1 (en) | 2000-02-02 | 2003-05-27 | Chi Fai Ho | Information processing for searching categorizing information in a document based on a categorization hierarchy and extracted phrases |
US20060143714A1 (en) | 2000-03-09 | 2006-06-29 | Pkware, Inc. | System and method for manipulating and managing computer archive files |
US6859800B1 (en) * | 2000-04-26 | 2005-02-22 | Global Information Research And Technologies Llc | System for fulfilling an information need |
AU2001261505A1 (en) * | 2000-05-11 | 2001-11-20 | University Of Southern California | Machine translation techniques |
US6691106B1 (en) | 2000-05-23 | 2004-02-10 | Intel Corporation | Profile driven instant web portal |
WO2001098942A2 (en) | 2000-06-19 | 2001-12-27 | Lernout & Hauspie Speech Products N.V. | Package driven parsing using structure function grammar |
US20020078090A1 (en) | 2000-06-30 | 2002-06-20 | Hwang Chung Hee | Ontological concept-based, user-centric text summarization |
EP1182577A1 (en) | 2000-08-18 | 2002-02-27 | SER Systeme AG Produkte und Anwendungen der Datenverarbeitung | Associative memory |
KR100426382B1 (ko) | 2000-08-23 | 2004-04-08 | 학교법인 김포대학 | 엔트로피 정보와 베이지안 에스오엠을 이용한 문서군집기반의 순위조정 방법 |
US7017114B2 (en) | 2000-09-20 | 2006-03-21 | International Business Machines Corporation | Automatic correlation method for generating summaries for text documents |
US20020143524A1 (en) | 2000-09-29 | 2002-10-03 | Lingomotors, Inc. | Method and resulting system for integrating a query reformation module onto an information retrieval system |
US20020065857A1 (en) | 2000-10-04 | 2002-05-30 | Zbigniew Michalewicz | System and method for analysis and clustering of documents for search engine |
CA2322599A1 (en) | 2000-10-06 | 2002-04-06 | Ibm Canada Limited-Ibm Canada Limitee | System and method for workflow control of contractual activities |
JP2002169834A (ja) * | 2000-11-20 | 2002-06-14 | Hewlett Packard Co <Hp> | 文書のベクトル解析を行うコンピュータおよび方法 |
US20020091671A1 (en) * | 2000-11-23 | 2002-07-11 | Andreas Prokoph | Method and system for data retrieval in large collections of data |
JP2002207760A (ja) | 2001-01-10 | 2002-07-26 | Hitachi Ltd | 文書検索方法及びその実施装置並びにその処理プログラムを記録した記録媒体 |
US6778980B1 (en) | 2001-02-22 | 2004-08-17 | Drugstore.Com | Techniques for improved searching of electronically stored information |
US6741984B2 (en) * | 2001-02-23 | 2004-05-25 | General Electric Company | Method, system and storage medium for arranging a database |
US6741981B2 (en) | 2001-03-02 | 2004-05-25 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration (Nasa) | System, method and apparatus for conducting a phrase search |
US6823333B2 (en) * | 2001-03-02 | 2004-11-23 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | System, method and apparatus for conducting a keyterm search |
US6721728B2 (en) | 2001-03-02 | 2004-04-13 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | System, method and apparatus for discovering phrases in a database |
US7194483B1 (en) | 2001-05-07 | 2007-03-20 | Intelligenxia, Inc. | Method, system, and computer program product for concept-based multi-dimensional analysis of unstructured information |
US7171619B1 (en) | 2001-07-05 | 2007-01-30 | Sun Microsystems, Inc. | Methods and apparatus for accessing document content |
US6778979B2 (en) | 2001-08-13 | 2004-08-17 | Xerox Corporation | System for automatically generating queries |
US6978274B1 (en) | 2001-08-31 | 2005-12-20 | Attenex Corporation | System and method for dynamically evaluating latent concepts in unstructured documents |
US6741982B2 (en) | 2001-12-19 | 2004-05-25 | Cognos Incorporated | System and method for retrieving data from a database system |
US7356527B2 (en) | 2001-12-19 | 2008-04-08 | International Business Machines Corporation | Lossy index compression |
US7243092B2 (en) | 2001-12-28 | 2007-07-10 | Sap Ag | Taxonomy generation for electronic documents |
US7139756B2 (en) | 2002-01-22 | 2006-11-21 | International Business Machines Corporation | System and method for detecting duplicate and similar documents |
US7028045B2 (en) | 2002-01-25 | 2006-04-11 | International Business Machines Corporation | Compressing index files in information retrieval |
JP4092933B2 (ja) | 2002-03-20 | 2008-05-28 | 富士ゼロックス株式会社 | 文書情報検索装置及び文書情報検索プログラム |
NZ518744A (en) * | 2002-05-03 | 2004-08-27 | Hyperbolex Ltd | Electronic document indexing using word use nodes, node objects and link objects |
US7085771B2 (en) | 2002-05-17 | 2006-08-01 | Verity, Inc | System and method for automatically discovering a hierarchy of concepts from a corpus of documents |
US7028026B1 (en) | 2002-05-28 | 2006-04-11 | Ask Jeeves, Inc. | Relevancy-based database retrieval and display techniques |
JP4452012B2 (ja) | 2002-07-04 | 2010-04-21 | ヒューレット・パッカード・カンパニー | 文書の特有性評価方法 |
US20040034633A1 (en) | 2002-08-05 | 2004-02-19 | Rickard John Terrell | Data search system and method using mutual subsethood measures |
US7151864B2 (en) | 2002-09-18 | 2006-12-19 | Hewlett-Packard Development Company, L.P. | Information research initiated from a scanned image media |
US7158983B2 (en) | 2002-09-23 | 2007-01-02 | Battelle Memorial Institute | Text analysis technique |
US6886010B2 (en) | 2002-09-30 | 2005-04-26 | The United States Of America As Represented By The Secretary Of The Navy | Method for data and text mining and literature-based discovery |
JP2004139150A (ja) | 2002-10-15 | 2004-05-13 | Ricoh Co Ltd | 文書検索装置、プログラム及び記憶媒体 |
US20040133560A1 (en) * | 2003-01-07 | 2004-07-08 | Simske Steven J. | Methods and systems for organizing electronic documents |
GB2399427A (en) * | 2003-03-12 | 2004-09-15 | Canon Kk | Apparatus for and method of summarising text |
US7945567B2 (en) | 2003-03-17 | 2011-05-17 | Hewlett-Packard Development Company, L.P. | Storing and/or retrieving a document within a knowledge base or document repository |
US6947930B2 (en) | 2003-03-21 | 2005-09-20 | Overture Services, Inc. | Systems and methods for interactive search query refinement |
US7051023B2 (en) | 2003-04-04 | 2006-05-23 | Yahoo! Inc. | Systems and methods for generating concept units from search queries |
US7149748B1 (en) | 2003-05-06 | 2006-12-12 | Sap Ag | Expanded inverted index |
US7051014B2 (en) | 2003-06-18 | 2006-05-23 | Microsoft Corporation | Utilizing information redundancy to improve text searches |
US7254580B1 (en) | 2003-07-31 | 2007-08-07 | Google Inc. | System and method for selectively searching partitions of a database |
US20050043940A1 (en) | 2003-08-20 | 2005-02-24 | Marvin Elder | Preparing a data source for a natural language query |
US20050071328A1 (en) | 2003-09-30 | 2005-03-31 | Lawrence Stephen R. | Personalization of web search |
US7240064B2 (en) | 2003-11-10 | 2007-07-03 | Overture Services, Inc. | Search engine with hierarchically stored indices |
US20050154723A1 (en) | 2003-12-29 | 2005-07-14 | Ping Liang | Advanced search, file system, and intelligent assistant agent |
US7206389B1 (en) | 2004-01-07 | 2007-04-17 | Nuance Communications, Inc. | Method and apparatus for generating a speech-recognition-based call-routing system |
US20050216564A1 (en) | 2004-03-11 | 2005-09-29 | Myers Gregory K | Method and apparatus for analysis of electronic communications containing imagery |
US20050256848A1 (en) | 2004-05-13 | 2005-11-17 | International Business Machines Corporation | System and method for user rank search |
EP1767010B1 (en) | 2004-06-15 | 2015-11-11 | Tekelec Global, Inc. | Method, system, and computer program products for content-based screening of MMS messages |
JP2006026844A (ja) | 2004-07-20 | 2006-02-02 | Fujitsu Ltd | ポリッシングパッド、それを備えた研磨装置及び貼り付け装置 |
US7567959B2 (en) | 2004-07-26 | 2009-07-28 | Google Inc. | Multiple index based information retrieval system |
US7536408B2 (en) | 2004-07-26 | 2009-05-19 | Google Inc. | Phrase-based indexing in an information retrieval system |
US7426507B1 (en) | 2004-07-26 | 2008-09-16 | Google, Inc. | Automatic taxonomy generation in search results using phrases |
US7580921B2 (en) | 2004-07-26 | 2009-08-25 | Google Inc. | Phrase identification in an information retrieval system |
US7599914B2 (en) | 2004-07-26 | 2009-10-06 | Google Inc. | Phrase-based searching in an information retrieval system |
US7711679B2 (en) | 2004-07-26 | 2010-05-04 | Google Inc. | Phrase-based detection of duplicate documents in an information retrieval system |
US8407239B2 (en) | 2004-08-13 | 2013-03-26 | Google Inc. | Multi-stage query processing system and method for use with tokenspace repository |
US20060200464A1 (en) * | 2005-03-03 | 2006-09-07 | Microsoft Corporation | Method and system for generating a document summary |
US20080005064A1 (en) | 2005-06-28 | 2008-01-03 | Yahoo! Inc. | Apparatus and method for content annotation and conditional annotation retrieval in a search context |
-
2004
- 2004-07-26 US US10/900,075 patent/US7584175B2/en active Active
-
2005
- 2005-07-22 BR BRPI0503780-8A patent/BRPI0503780A/pt not_active IP Right Cessation
- 2005-07-25 AU AU2005203237A patent/AU2005203237B2/en not_active Ceased
- 2005-07-26 AT AT05254644T patent/ATE529811T1/de not_active IP Right Cessation
- 2005-07-26 CA CA2513851A patent/CA2513851C/en not_active Expired - Fee Related
- 2005-07-26 CN CN2005100853734A patent/CN1728143B/zh not_active Expired - Fee Related
- 2005-07-26 NO NO20053639A patent/NO335144B1/no not_active IP Right Cessation
- 2005-07-26 JP JP2005216530A patent/JP4944406B2/ja not_active Expired - Fee Related
- 2005-07-26 KR KR1020050068056A patent/KR101176079B1/ko active IP Right Grant
- 2005-07-26 EP EP05254644A patent/EP1622052B1/en not_active Not-in-force
Also Published As
Publication number | Publication date |
---|---|
EP1622052A1 (en) | 2006-02-01 |
AU2005203237A1 (en) | 2006-02-09 |
NO20053639D0 (no) | 2005-07-26 |
NO335144B1 (no) | 2014-09-29 |
US20060020571A1 (en) | 2006-01-26 |
EP1622052B1 (en) | 2011-10-19 |
BRPI0503780A (pt) | 2006-03-14 |
KR101176079B1 (ko) | 2012-08-23 |
US7584175B2 (en) | 2009-09-01 |
AU2005203237B2 (en) | 2009-04-30 |
CA2513851A1 (en) | 2006-01-26 |
ATE529811T1 (de) | 2011-11-15 |
KR20060048777A (ko) | 2006-05-18 |
CN1728143B (zh) | 2010-06-09 |
JP2006048686A (ja) | 2006-02-16 |
CN1728143A (zh) | 2006-02-01 |
NO20053639L (no) | 2006-01-27 |
CA2513851C (en) | 2013-12-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4944406B2 (ja) | フレーズに基づく文書説明の生成方法 | |
JP5175005B2 (ja) | 情報検索システムにおけるフレーズに基づく検索方法 | |
JP4944405B2 (ja) | 情報検索システムにおけるフレーズに基づくインデックス化方法 | |
JP4976666B2 (ja) | 情報検索システムにおけるフレーズ識別方法 | |
US9990421B2 (en) | Phrase-based searching in an information retrieval system | |
US9817825B2 (en) | Multiple index based information retrieval system | |
US7426507B1 (en) | Automatic taxonomy generation in search results using phrases | |
US7580929B2 (en) | Phrase-based personalization of searches in an information retrieval system | |
US8612427B2 (en) | Information retrieval system for archiving multiple document versions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080723 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101115 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101130 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110228 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110303 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110325 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110401 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110420 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110425 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110530 |
|
A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A524 Effective date: 20110530 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120131 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120302 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4944406 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150309 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |