JP2008135023A - 情報アクセスおよび検索におけるレレバンス重み付けナビゲーション - Google Patents
情報アクセスおよび検索におけるレレバンス重み付けナビゲーション Download PDFInfo
- Publication number
- JP2008135023A JP2008135023A JP2007288256A JP2007288256A JP2008135023A JP 2008135023 A JP2008135023 A JP 2008135023A JP 2007288256 A JP2007288256 A JP 2007288256A JP 2007288256 A JP2007288256 A JP 2007288256A JP 2008135023 A JP2008135023 A JP 2008135023A
- Authority
- JP
- Japan
- Prior art keywords
- query
- document
- scope
- value
- values
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】文書セットにクエリーが適用され、一致する文書のリザルトセットおよびクエリー依存サブセットが識別される。リザルトセットを横切る文書スコープ、値および関連する重みの要約情報を計算し、値の確率の測度を与える要約値メトリクスで値を重み付けする。検索エンジン(100)は1つ以上のコア検索エンジン(101)の形のサブシステム、コンテンツ・アプリケーション・プログラミング・インターフェイス(102)、コンテンツ解析段階(103)およびクエリー解析およびリザルト解析段階(105,107)を介してコア検索エンジン(101)に接続されるクライアント・アプリケーション・プログラミング・インターフェイスを含む。
【選択図】図9
Description
N(Q,a,ν)=|{d in D:Q matches d,ν in d(a)}|
R(a,ν)=Σp(d)if ν in d(a)[sum over all d in D]
R(a,ν)=Σf(p(d),p(d,a,ν))if ν in d(a)[sum over all d in D]
...in 1953,the house was taken over by John Smith.
Born in 1965,Julia Smith...
第1の文節は人スコープで終り、後続文節はトークン「誕生」で始り、人スコープおよびトークン「誕生」はトークン近接に関して隣接しているが、視覚的には意味的にさらに離れている。このケースにおいてSVMに簡約を与えるために、文節スコープに暗黙的トークン分離を関連付けることができる。より進んだ方法は、たとえば、HTMLを解釈することにより文書フォーマット内の視覚レイアウトからトークン分離を引き出すことである。もう1つの方法はクエリーが評価されるとコンテンツ内の一致間の視覚距離を計算できるように視覚位置をトークン位置に平行に関連付けることである。文X02内の会社名X07はより良いトークン近接得点および正確な言語学的一致により文X01内の会社名X03より高い重みを得る。言語学的変形は意味的あいまいさが導入されるケースではより低い重みを有することがある。一方、クエリー内に指定されているように、会社名X03は“Inc”を含むための追加ブーストを得る。さらに、クエリーは形容詞「良い(good)」X04が会社名X03にブーストを与えるように中間形容詞上の感情にわたってアグリゲーションを指定することができる。
本発明の第1の実施例はインターネット検索アプリケーション内の、たとえば、垂直検索、局所検索、およびグローバルインターネット検索である。このようなアプリケーションの圧倒的なコンテンツボリュームおよび、サービスが一般大衆により使用されるために生じる、ユーザの検索専門技術の典型的な欠如により関連情報を戻すための補助手段をシステムに設ける必要がある。新考案によりウェブページ解析は、たとえば、良く見えるフォント内の情報に焦点を合わせて視覚表現により概念およびメタデータを評価し、逆文書頻度(inverse document frequency)に基づくターム(terms)のレレバンス計算と同様な多くのページ上で見つかったメニュー内のテキストからの寄与を低減する。文脈のハイパーリンク構造の解析は、たとえば、アンカーテキスト・ナビゲータ内のページの参照しているアンカーテキストを評価することができる。クエリーの結果としてのページビューを使用してクエリーを見られたページと関連付けることができる。このクエリートラフィックの解析は、たとえば、時間経過に伴う人気、現在のトレンド、ユーザを評価できる他のユーザのグループ内の人気に基づいて重み付けされた関連を提供することができる。一般的なページビューに対するユーザトラフィックの解析は全メタデータに適用する演繹的文書レレバンスを提供することができる。概念ナビゲータは前例を含むいくつかのソースから重み付けされた入力を取り出すことができる。
本考案の第2の実施例はe−行列(tailing)およびインターネット・ショッピングを含むe−コマース・アプリケーションの検索分野内にある。たとえば、クエリー“mp3”は多くのバッテリではなく多くのプレーヤを有するメーカへ向かってバイアスされるメーカ・ナビゲータを与えるように、mp3プレーヤはそのmp3プレーヤに対するバッテリよりも強くメーカと関連付けられる。重みは単純に価格とすることができるが、検索からのだけではなく全体的な販売数を含むように改良することができる。製品ナビゲータ内の値に対する重みもレビューから引き出してビシセネスルール−たとえば、製品満了日付、製品収益性、およびキャンペーンにより設定することができる。製品およびクエリー内のテキストから引き出された概念間の重み付けされた関連を、前記したインターネット検索アプリケーションと同様に、これらのデータから確立することができる。示唆された製品カテゴリ、メーカ、モデル、および色およびサイズ等の特徴の重みはユーザトラフィックから推論することができる。異なる製品タイプは異なる特性を有するため、検索に関して異なるコンテンツスキーマを有する。これらのスキーマはエンドユーザに対して一般的な検索スキーマを提供するように正規化されるため、特定製品分野を検索スキーマ分野へマッピングすることはファジーとなることがある。このファジーさは検索スキーマ分野上のナビゲーションへ持続することができる。意味的に良好なマッピングに対する値は明確ではない意味的相関があるマッピングに対するよりも高く重み付けされる。
本発明の第3の実施例は知識発見およびテキストマイニング、たとえば、特許検索のエリア内にある。ユーザは典型的に対象エリアのエキスパートであり検索結果に極端な精度が要求される。挑戦はより精密な情報を提供するクエリー改良を提供するだけでなく、クエリーをナビゲータと関連付けてクエリーおよびリザルトセットの定性的測度を与えることである。文書をメタデータと関連付ける技術、およびクエリーをそのリザルトセット内の文書のメタデータ上のナビゲータと関連付ける技術は既にある。本出願人が譲り受けた国際特許出願PCT/NO06/000165はクエリー時間選出サブ文書エンティティと関連付けられたメタデータ上のナビゲータを計算し、ナビゲータ内により高い精度を与えるように示されている。両方のケースにおいて、ナビゲータはメタデータの頻度に基づいている。本発明はクエリーおよびメタデータ間の関連を2進関係からクエリー時間で重みを評価できる重み付け関係に変える。特許検索に応用された本実施例では、独立項、特に請求項1の概念は、たとえば、発明の背景の概念よりも高く重み付けされるように重みを、たとえば、請求項構造に基づくものとして特許の中の発明的ステップの識別により良い精度を与えることができる。たとえば、述語の形の知識の抽出は本来確率的であり、本考案によりこの不確かさは要約化へ流すことができる。これらの確率を閾値でフィルタリングすると要約の品質が低減する。
本発明の第4の実施例はファイルおよび音楽、ビデオ、音声、および写真を含むストリーミングブロードキャストを含むマルチメディアオブジェクトへの応用である。たとえば、社会的ネットワーク内の人気測度は過去の活動および現在のトレンドの概要がこれらの重みを含むようにジャンル、アーチスト、およびソングに重みを与えることができる。オブジェクトにグローバルおよび特定文脈メタデータ(たとえば、ビデオストリーム内のスクリーン当たり)を付加するために、特徴抽出がしばしばマルチメディアに適用される。抽出された特徴は本発明が要約化において考慮する確率と関連付けられる。たとえば、音声からテキストへの変換はメディアストリーム内で検出された音素および語へ確率を割り当て、顔検出システムが検出された各顔へ確率を割り当てる。
202 リザルトセット
203,204,205 文書・レベル・メタデータ
X01 文書(図3)
X02 文節(図3)
X03 文レベル(図3)
X01 コンテンツ・パーティション(図5)
X02 局所アグリゲーション(図5)
X03 ネットワーク(図5)
X04 グローバルアグリゲーション(図5)
X05 プロセス(図5)
X01 Contacts(図6)
X02 Customers(図6)
X03 SearchSchema(図6)
X01 文(図7)
X02 文(図7)
X03 会社名(図7)
X04 形容詞(図7)
X05 食料雑貨店(図7)
X01 オントロジー(図8)
X01,X02,X03,X04,X05 ノード(図8)
X06 文書(図8)
100 検索エンジン
101 コア検索エンジン
101a インデクシングサブシステム
101b 検索サブシステム
102,107 アプリケーション・プログラミング・インターフェイス
103 コンテンツ解析段階
104 アラートエンジン
105 クエリー解析段階
106 リザルト解析段階
108,109,110,111 モジュール
Claims (24)
- スコープと値間またはスコープと値重み対間の複数の関連(associations)を含む階層型指定スコープを含む文書上の要約情報を計算する方法であって、前記方法は、
文書セットにクエリーを適用し、一致する文書のリザルトセットおよび一致するセットのクエリー依存サブセットを識別するステップを含み、前記方法は、
文書スコープ上の要約情報、それらの値、および関連する重みをリザルトセットを横切って計算し、
値を要約値メトリクス(SVM)により重み付けし、前記要約値メトリクスは属性値の重み付けされた統計的および動的性質の結合であり、属性値の確率の測度を提供する付加ステップにより特徴づけられる方法。 - 請求項1に記載の方法であって、前記文書はそれが指定された要素および属性のセット、すなわち1レベル構造(one−level structure)、を有効に有するように暗黙的で無名のルート要素(implicit and anonymous root element)を有することにより特徴づけられる方法。
- 請求項1に記載の方法であって、前記文書セットのインデクシング時間解析を行って文書の意味構造を発見して符号化し、符号化された構造に重みを割当てることにより特徴づけられる方法。
- 請求項1に記載の方法であって、オントロジー構造との重み付けられた関連を含むスコープ値により特徴づけられる方法。
- 請求項4に記載の方法であって、前記オントロジー構造は分類法であり、各値重み対はスコープ値を表す分類法ノードに属する確率を与える方法。
- 請求項4に記載の方法であって、オントロジー構造サブジェクトの関係(relations)を介してスコープ値をオントロジー構造内の前記関係に関連付けられる重み変更にマッピングすることにより特徴づけられる方法。
- 請求項1に記載の方法であって、選出された文書スコープの監視または非監視クラスタリング(unsupervised clustering)により要約情報を計算し、スコープ値に関連付けられた重みを考慮し、前記要約情報はクラスタメンバシップの確率に応答することにより特徴づけられる方法。
- 請求項1に記載の方法であって、特にSVMおよびそのアグリゲーションに向けられるフラグメントを含むクエリーにより特徴づけられる方法。
- 請求項1に記載の方法であって、
クエリー文脈(クエリーフラグメント)内のレレバンススコア、特に、リザルトセット内の文書の最終レレバンススコア、
指定された文書の存否、または、指定された文書スコープの値および、もしあれば、これらの値の関連付けられた重み、
の少なくとも1つに応答するSVMにより特徴づけられる方法。 - 請求項9に記載の方法であって、SVMはクエリー文脈のレレバンススコアに応答し、さらに、
クエリー内の述語間の文書内の1つ以上のトークン/語位置的近接、
クエリー内の述語間の文書内の文字位置的近接、
クエリー内の述語間の、サブクエリーにより選出される、文書内の一致の数(a number of matches)、
クエリー内の述語間の、サブクエリーにより選出される、文書内の一致上のアグリゲーション、
オントロジー内のトークン/語の意味的距離、
クエリー内に指定された数値およびサブクエリーにより選出されるスコープの数値であって、前記数値は整数、実数、時間、および地理的位置を含む数値、および、
クエリー内に指定されたまたはクエリーにより示唆された文書ベクトルと一致する文書から選出されるベクトル値間の距離測度、
の1つ以上に応答することにより特徴づけられる方法。 - 請求項1に記載の方法であって、
クエリー改良を要約情報と関連付けることにより文脈ナビゲーションを生成するステップを含み、前記クエリー改良はリザルトセットフィルタリングおよびレレバンスブースティングを含むことにより特徴づけられる方法。 - 請求項1に記載の方法であって、
頻度情報で重み付けされる要約情報により特徴づけられる方法。 - 請求項12に記載の方法であって、
Java(登録商標)ソースコードまたはバイトコード、XPatchまたはXQuery(XQuery全文を含む)、またはオントロジー言語の1つにより少なくとも部分的にクエリー述語、レレバンス計算、アグリゲーション、またはクエリー改良を定義することにより特徴づけられる方法。 - 請求項1に記載の方法であって、
どの文書スコープがクエリーに関連しているかを識別し、かつ、前記識別されたスコープに対する支配的値(dominant values)を識別して、適切な事実および知識が高められることにより特徴づけられる方法。 - 請求項14に記載の方法であって、
識別されたスコープおよび支配的値を提示することにより特徴づけられる方法。 - 請求項1に記載の方法であって、
最もレレバントなスコープをリスティング(listing)し、値関連(value associations)が、指定されたスコープ集合を横切って重み付けされた頻度を低減することによりランク付けされるスコープ値および重み付けされた頻度の三つ組みを提示するオブジェクト内にリスティングされる(value associations are listed in an object presenting triples of scope value and weighted frequency ranked by decreasing weighted frequency across a set of named scopes)ことにより特徴づけられる方法。 - 請求項1に記載の方法であって、
要約情報の計算でエラー制約を行い、プロセスがその早期段階におけるある値を無視できるようにすることにより特徴づけられる方法。 - 請求項1に記載の方法であって、
リザルトセット内の最高ランク文書の要約情報を計算し、リザルトセット内の他の文書を無視することによる要約情報内のエラーであって要約オブジェクトのエラー成分内にもどされたエラーを随意推定することにより特徴づけられる方法。 - 請求項17または請求項18に記載の方法であって、
要約情報の計算を多数の処理装置にわたって分散させることにより特徴づけられる方法。 - 請求項1に記載の方法であって、
要約情報の計算に共起統計(co−occurrence statistics)が含まれることにより特徴づけられる方法。 - 請求項20に記載の方法であって、
2つのスコープ間の共起統計を最もレレバントな共起関連(most relevant co−occurrence associations)をハイライトする2次元ヒートマップ(heat map)として提示し、かつ/または前記共起統計をナビゲータとして最もレレバントな共起関連上に提示することにより特徴づけられる方法。 - 請求項1に記載の方法であって、
SVMへの人気得点(popularity score)により決定されることにより特徴づけられ、前記人気得点はハイパーリンクおよび引用等のコンテンツ参照、およびビューおよび購入等の文書アクションの解析結果として決定されることにより特徴づけられる方法。 - 請求項1に記載の方法であって、
リザルトセット内の文書の提示、
リザルトセット内の文書のユーザビュー、
リザルトセット内の文書により提示されるオブジェクトの購入、
リザルトセット内の文書により提示されるオブジェクトの推薦、
リザルトセット内の文書により提示されるオブジェクトの再検討、
リザルトセット内のナビゲータエントリの提示、および、
ナビゲータエントリのユーザ選出およびクエリー改良、
の1つ以上を含むクエリーのリザルトセットに応答して文書アクションを解析することにより前記値およびSVMを決定することにより特徴づけられる方法。 - 情報アクセスまたは検索システムにおける前記いずれかの請求項に記載の方法をサポートし実現することができる検索エンジン(100)であって、検索エンジン(100)は、エクストラネットおよびイントラネットを含むデータ通信網を介して利用可能なコンテンツレポジットリ(content repositories)からの情報アクセス、検索、および解析、およびエンドユーザに対する検索および解析結果の提示に適用され、検索エンジンは少なくともコア検索エンジン(101)、コンテンツ解析段階(103)を介して少なくとも1つのコア検索エンジン(101)に接続されたコンテンツアプリケーション・プログラミングインターフェイス(102)(コンテンツAPI)、および各クエリー解析およびリザルト解析段階(105;106)を介して前記少なくとも1つのコア検索エンジン(101)に接続されたクエリーアプリケーション・プログラミングインターフェイス(107)を含み、検索エンジン(100)は、
階層型スコープへの要約値メトリクス(SVM)を指定する第1のモジュール(108)を含み、前記第1のモジュール(108)はコンテンツAPI(102)またはコンテンツ解析段階(103)内に含まれ、コンテンツ内の明白なフォーマット構造を認識することからスコープを生成する第2のモジュール(109)と、コンテンツの解析からスコープを生成する第3のモジュール(110)とを含み、前記第2および第3のモジュール(109;110)はコンテンツ解析段階(103)内に含まれて前記生成されたスコープに要約値メトリクス(SVM)を割当てるようにされており、さらに、スコープ、値およびSVMを索引する第4のモジュール(111)を含み、前記第4のモジュールはコア検索エンジン(103)のインデクシングサブシステム(103a)内に含まれることを特徴とする検索エンジン。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
NO20065133A NO325864B1 (no) | 2006-11-07 | 2006-11-07 | Fremgangsmåte ved beregning av sammendragsinformasjon og en søkemotor for å støtte og implementere fremgangsmåten |
NO20065133 | 2006-11-07 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008135023A true JP2008135023A (ja) | 2008-06-12 |
JP4861961B2 JP4861961B2 (ja) | 2012-01-25 |
Family
ID=39301121
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007288256A Expired - Fee Related JP4861961B2 (ja) | 2006-11-07 | 2007-11-06 | 情報アクセスおよび検索におけるレレバンス重み付けナビゲーション |
Country Status (4)
Country | Link |
---|---|
US (1) | US7966305B2 (ja) |
EP (1) | EP1930816A1 (ja) |
JP (1) | JP4861961B2 (ja) |
NO (1) | NO325864B1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017513138A (ja) * | 2014-03-31 | 2017-05-25 | コファックス, インコーポレイテッド | スケーラブルなビジネスプロセスインテリジェンスおよび分散アーキテクチャのための予測的分析 |
EP3276507A1 (en) | 2016-07-25 | 2018-01-31 | Fujitsu Limited | Encoding device, encoding method and search method |
Families Citing this family (111)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7505964B2 (en) | 2003-09-12 | 2009-03-17 | Google Inc. | Methods and systems for improving a search ranking using related queries |
US7610255B2 (en) | 2006-03-31 | 2009-10-27 | Imagini Holdings Limited | Method and system for computerized searching and matching multimedia objects using emotional preference |
US8856105B2 (en) * | 2006-04-28 | 2014-10-07 | Hewlett-Packard Development Company, L.P. | Dynamic data navigation |
US9110975B1 (en) | 2006-11-02 | 2015-08-18 | Google Inc. | Search result inputs using variant generalized queries |
US8661029B1 (en) | 2006-11-02 | 2014-02-25 | Google Inc. | Modifying search result ranking based on implicit user feedback |
US8938463B1 (en) | 2007-03-12 | 2015-01-20 | Google Inc. | Modifying search result ranking based on implicit user feedback and a model of presentation bias |
US8694374B1 (en) | 2007-03-14 | 2014-04-08 | Google Inc. | Detecting click spam |
US9092510B1 (en) | 2007-04-30 | 2015-07-28 | Google Inc. | Modifying search result ranking based on a temporal element of user feedback |
US8694511B1 (en) | 2007-08-20 | 2014-04-08 | Google Inc. | Modifying search result ranking based on populations |
US8909655B1 (en) | 2007-10-11 | 2014-12-09 | Google Inc. | Time based ranking |
US8126877B2 (en) * | 2008-01-23 | 2012-02-28 | Globalspec, Inc. | Arranging search engine results |
US8290975B2 (en) * | 2008-03-12 | 2012-10-16 | Microsoft Corporation | Graph-based keyword expansion |
US20100100562A1 (en) * | 2008-10-01 | 2010-04-22 | Jerry Millsap | Fully Parameterized Structured Query Language |
US8756219B2 (en) * | 2008-11-04 | 2014-06-17 | Microsoft Corporation | Relevant navigation with deep links into query |
US8396865B1 (en) | 2008-12-10 | 2013-03-12 | Google Inc. | Sharing search engine relevance data between corpora |
US8639682B2 (en) * | 2008-12-29 | 2014-01-28 | Accenture Global Services Limited | Entity assessment and ranking |
US8386502B2 (en) * | 2009-03-12 | 2013-02-26 | Bank Of America Corporation | Market identification system |
US8930350B1 (en) | 2009-03-23 | 2015-01-06 | Google Inc. | Autocompletion using previously submitted query data |
US9009146B1 (en) | 2009-04-08 | 2015-04-14 | Google Inc. | Ranking search results based on similar queries |
US20120130819A1 (en) * | 2009-04-15 | 2012-05-24 | Imagini Holdings Limited | method and system for providing customized content using emotional preference |
US8244749B1 (en) * | 2009-06-05 | 2012-08-14 | Google Inc. | Generating sibling query refinements |
US8756229B2 (en) | 2009-06-26 | 2014-06-17 | Quantifind, Inc. | System and methods for units-based numeric information retrieval |
US8447760B1 (en) | 2009-07-20 | 2013-05-21 | Google Inc. | Generating a related set of documents for an initial set of documents |
US8583675B1 (en) | 2009-08-28 | 2013-11-12 | Google Inc. | Providing result-based query suggestions |
US8498974B1 (en) | 2009-08-31 | 2013-07-30 | Google Inc. | Refining search results |
US8694505B2 (en) | 2009-09-04 | 2014-04-08 | Microsoft Corporation | Table of contents for search query refinement |
US8364679B2 (en) | 2009-09-17 | 2013-01-29 | Cpa Global Patent Research Limited | Method, system, and apparatus for delivering query results from an electronic document collection |
US20110078188A1 (en) * | 2009-09-28 | 2011-03-31 | Microsoft Corporation | Mining and Conveying Social Relationships |
US8972391B1 (en) | 2009-10-02 | 2015-03-03 | Google Inc. | Recent interest based relevance scoring |
US8706717B2 (en) * | 2009-11-13 | 2014-04-22 | Oracle International Corporation | Method and system for enterprise search navigation |
US8874555B1 (en) | 2009-11-20 | 2014-10-28 | Google Inc. | Modifying scoring data based on historical changes |
US8271479B2 (en) | 2009-11-23 | 2012-09-18 | International Business Machines Corporation | Analyzing XML data |
US8886650B2 (en) * | 2009-11-25 | 2014-11-11 | Yahoo! Inc. | Algorithmically choosing when to use branded content versus aggregated content |
US8793208B2 (en) | 2009-12-17 | 2014-07-29 | International Business Machines Corporation | Identifying common data objects representing solutions to a problem in different disciplines |
US8645377B2 (en) * | 2010-01-15 | 2014-02-04 | Microsoft Corporation | Aggregating data from a work queue |
US8615514B1 (en) | 2010-02-03 | 2013-12-24 | Google Inc. | Evaluating website properties by partitioning user feedback |
US8903794B2 (en) | 2010-02-05 | 2014-12-02 | Microsoft Corporation | Generating and presenting lateral concepts |
US8983989B2 (en) | 2010-02-05 | 2015-03-17 | Microsoft Technology Licensing, Llc | Contextual queries |
US8650172B2 (en) * | 2010-03-01 | 2014-02-11 | Microsoft Corporation | Searchable web site discovery and recommendation |
US20110219030A1 (en) * | 2010-03-03 | 2011-09-08 | Daniel-Alexander Billsus | Document presentation using retrieval path data |
US8924379B1 (en) | 2010-03-05 | 2014-12-30 | Google Inc. | Temporal-based score adjustments |
US8972397B2 (en) * | 2010-03-11 | 2015-03-03 | Microsoft Corporation | Auto-detection of historical search context |
US8959093B1 (en) | 2010-03-15 | 2015-02-17 | Google Inc. | Ranking search results based on anchors |
US8782046B2 (en) | 2010-03-24 | 2014-07-15 | Taykey Ltd. | System and methods for predicting future trends of term taxonomies usage |
US10600073B2 (en) | 2010-03-24 | 2020-03-24 | Innovid Inc. | System and method for tracking the performance of advertisements and predicting future behavior of the advertisement |
US9946775B2 (en) | 2010-03-24 | 2018-04-17 | Taykey Ltd. | System and methods thereof for detection of user demographic information |
US9613139B2 (en) | 2010-03-24 | 2017-04-04 | Taykey Ltd. | System and methods thereof for real-time monitoring of a sentiment trend with respect of a desired phrase |
US9183292B2 (en) * | 2010-03-24 | 2015-11-10 | Taykey Ltd. | System and methods thereof for real-time detection of an hidden connection between phrases |
US9460232B2 (en) * | 2010-04-07 | 2016-10-04 | Oracle International Corporation | Searching document object model elements by attribute order priority |
US9298818B1 (en) * | 2010-05-28 | 2016-03-29 | Sri International | Method and apparatus for performing semantic-based data analysis |
US20110302149A1 (en) * | 2010-06-07 | 2011-12-08 | Microsoft Corporation | Identifying dominant concepts across multiple sources |
US9623119B1 (en) | 2010-06-29 | 2017-04-18 | Google Inc. | Accentuating search results |
US8832083B1 (en) | 2010-07-23 | 2014-09-09 | Google Inc. | Combining user feedback |
US8548989B2 (en) * | 2010-07-30 | 2013-10-01 | International Business Machines Corporation | Querying documents using search terms |
EP2606421A4 (en) * | 2010-08-20 | 2014-03-05 | Carl Mandel | SORTING AND PRESENTATION OF FORUM DATA |
US8595240B1 (en) | 2010-09-24 | 2013-11-26 | Google Inc. | Labeling objects by propagating scores in a graph |
US20120095862A1 (en) | 2010-10-15 | 2012-04-19 | Ness Computing, Inc. (a Delaware Corportaion) | Computer system and method for analyzing data sets and generating personalized recommendations |
US9396492B2 (en) | 2010-10-15 | 2016-07-19 | Opentable, Inc. | Computer system and method for analyzing data sets and providing personalized recommendations |
US9002867B1 (en) | 2010-12-30 | 2015-04-07 | Google Inc. | Modifying ranking data based on document changes |
US20120239681A1 (en) * | 2011-03-14 | 2012-09-20 | Splunk Inc. | Scalable interactive display of distributed data |
US8688696B2 (en) | 2011-06-27 | 2014-04-01 | Microsoft Corporation | Multi-part search result ranking |
WO2013013093A1 (en) | 2011-07-20 | 2013-01-24 | Ness Computing, Inc. | Method and apparatus for quickly evaluating entities |
WO2013013090A1 (en) * | 2011-07-20 | 2013-01-24 | Ness Computing, Inc. | Method and apparatus for allowing users to augment searches |
US20130024449A1 (en) | 2011-07-20 | 2013-01-24 | Ness Computing, Inc. | Method and apparatus for allowing users to augment searches |
US8930340B1 (en) * | 2011-09-20 | 2015-01-06 | Google Inc. | Blending content in an output |
CN103136262B (zh) * | 2011-11-30 | 2016-08-24 | 阿里巴巴集团控股有限公司 | 信息检索方法及装置 |
US9183511B2 (en) * | 2012-02-24 | 2015-11-10 | Ming Li | System and method for universal translating from natural language questions to structured queries |
US8747115B2 (en) * | 2012-03-28 | 2014-06-10 | International Business Machines Corporation | Building an ontology by transforming complex triples |
US9754585B2 (en) * | 2012-04-03 | 2017-09-05 | Microsoft Technology Licensing, Llc | Crowdsourced, grounded language for intent modeling in conversational interfaces |
EP2836920A4 (en) | 2012-04-09 | 2015-12-02 | Vivek Ventures Llc | PROCESSING CLASSIFIED INFORMATION AND SEARCH USING A BRIDGE BETWEEN STRUCTURED AND UNSTRUCTURED DATABASES |
US9262469B1 (en) * | 2012-04-23 | 2016-02-16 | Monsanto Technology Llc | Intelligent data integration system |
US9372903B1 (en) | 2012-06-05 | 2016-06-21 | Monsanto Technology Llc | Data lineage in an intelligent data integration system |
CN102750375B (zh) * | 2012-06-21 | 2014-04-02 | 武汉大学 | 一种基于随机游走的服务和标签推荐方法 |
US8539001B1 (en) | 2012-08-20 | 2013-09-17 | International Business Machines Corporation | Determining the value of an association between ontologies |
US9396179B2 (en) * | 2012-08-30 | 2016-07-19 | Xerox Corporation | Methods and systems for acquiring user related information using natural language processing techniques |
WO2014036441A2 (en) * | 2012-08-31 | 2014-03-06 | The Dun & Bradstreet Corporation | System and process for discovering relationships between entities based on common areas of interest |
US10031968B2 (en) * | 2012-10-11 | 2018-07-24 | Veveo, Inc. | Method for adaptive conversation state management with filtering operators applied dynamically as part of a conversational interface |
US9569434B2 (en) | 2012-10-22 | 2017-02-14 | Ab Initio Technology Llc | Profiling data with source tracking |
US8874569B2 (en) * | 2012-11-29 | 2014-10-28 | Lexisnexis, A Division Of Reed Elsevier Inc. | Systems and methods for identifying and visualizing elements of query results |
US10733182B2 (en) * | 2012-12-10 | 2020-08-04 | Healthagen International Limited | Method and system for aggregate banding |
US9753986B2 (en) * | 2012-12-17 | 2017-09-05 | International Business Machines Corporation | Multi-dimensional feature merging for supporting evidence in a question and answering system |
US9297918B2 (en) * | 2012-12-28 | 2016-03-29 | General Electric Company | Seismic data analysis |
US9892026B2 (en) | 2013-02-01 | 2018-02-13 | Ab Initio Technology Llc | Data records selection |
US9449106B2 (en) | 2013-03-08 | 2016-09-20 | Opentable, Inc. | Context-based queryless presentation of recommendations |
US10671629B1 (en) | 2013-03-14 | 2020-06-02 | Monsanto Technology Llc | Intelligent data integration system with data lineage and visual rendering |
US9183499B1 (en) | 2013-04-19 | 2015-11-10 | Google Inc. | Evaluating quality based on neighbor features |
US9514133B1 (en) | 2013-06-25 | 2016-12-06 | Jpmorgan Chase Bank, N.A. | System and method for customized sentiment signal generation through machine learning based streaming text analytics |
US9268770B1 (en) | 2013-06-25 | 2016-02-23 | Jpmorgan Chase Bank, N.A. | System and method for research report guided proactive news analytics for streaming news and social media |
US9298785B2 (en) * | 2013-07-19 | 2016-03-29 | Paypal, Inc. | Methods, systems, and apparatus for generating search results |
US11487732B2 (en) | 2014-01-16 | 2022-11-01 | Ab Initio Technology Llc | Database key identification |
JP6427592B2 (ja) * | 2014-03-07 | 2018-11-21 | アビニシオ テクノロジー エルエルシー | データ型に関連するデータプロファイリング操作の管理 |
US10102274B2 (en) * | 2014-03-17 | 2018-10-16 | NLPCore LLC | Corpus search systems and methods |
US10372739B2 (en) * | 2014-03-17 | 2019-08-06 | NLPCore LLC | Corpus search systems and methods |
US10839441B2 (en) * | 2014-06-09 | 2020-11-17 | Ebay Inc. | Systems and methods to seed a search |
US20160063095A1 (en) * | 2014-08-27 | 2016-03-03 | International Business Machines Corporation | Unstructured data guided query modification |
US10019523B2 (en) * | 2014-11-21 | 2018-07-10 | Ebay Inc. | Diversifying search results |
US9971760B2 (en) | 2014-12-22 | 2018-05-15 | International Business Machines Corporation | Parallelizing semantically split documents for processing |
US10019442B2 (en) * | 2015-05-31 | 2018-07-10 | Thomson Reuters Global Resources Unlimited Company | Method and system for peer detection |
US11023553B2 (en) * | 2017-04-04 | 2021-06-01 | Microsoft Technology Licensing, Llc | Identifying and managing trusted sources in online and networked content for professional knowledge exchange |
CN107480199B (zh) * | 2017-07-17 | 2020-06-12 | 深圳先进技术研究院 | 数据库的查询重构方法、装置、设备及存储介质 |
US11068540B2 (en) | 2018-01-25 | 2021-07-20 | Ab Initio Technology Llc | Techniques for integrating validation results in data profiling and related systems and methods |
US11010179B2 (en) | 2018-04-20 | 2021-05-18 | Facebook, Inc. | Aggregating semantic information for improved understanding of users |
US11676220B2 (en) | 2018-04-20 | 2023-06-13 | Meta Platforms, Inc. | Processing multimodal user input for assistant systems |
US11715042B1 (en) | 2018-04-20 | 2023-08-01 | Meta Platforms Technologies, Llc | Interpretability of deep reinforcement learning models in assistant systems |
US11307880B2 (en) | 2018-04-20 | 2022-04-19 | Meta Platforms, Inc. | Assisting users with personalized and contextual communication content |
US11886473B2 (en) | 2018-04-20 | 2024-01-30 | Meta Platforms, Inc. | Intent identification for agent matching by assistant systems |
EP3959623A4 (en) | 2019-04-23 | 2022-12-21 | RELX Inc. | SYSTEMS AND METHODS FOR CLASSIFYING ELECTRONIC DOCUMENTS BASED ON QUERY TOKEN DENSITIES |
US20200409982A1 (en) * | 2019-06-25 | 2020-12-31 | i2k Connect, LLC. | Method And System For Hierarchical Classification Of Documents Using Class Scoring |
CN114584574B (zh) * | 2022-04-28 | 2022-08-02 | 武汉四通信息服务有限公司 | 数据同步方法、装置、计算机设备及存储介质 |
US12050879B2 (en) * | 2022-05-24 | 2024-07-30 | Verizon Patent And Licensing Inc. | Systems and methods for reducing input to and increasing processing speeds of natural language processing models |
US20240274251A1 (en) * | 2023-02-13 | 2024-08-15 | Nec Laboratories America, Inc. | Summarizing prevalent opinions for medical decision-making |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005025525A (ja) * | 2003-07-02 | 2005-01-27 | Oki Electric Ind Co Ltd | 情報検索システム、情報検索方法及び情報検索プログラム |
JP2005141296A (ja) * | 2003-11-04 | 2005-06-02 | Just Syst Corp | 文書検索装置、文書検索方法、および文書検索プログラム |
JP2006072844A (ja) * | 2004-09-03 | 2006-03-16 | Oki Electric Ind Co Ltd | キーワード特定装置、キーワード特定方法及びキーワード特定プログラム |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6073130A (en) * | 1997-09-23 | 2000-06-06 | At&T Corp. | Method for improving the results of a search in a structured database |
AU2936600A (en) | 1999-02-25 | 2000-09-14 | Focusengine Software Ltd. | Method and apparatus for dynamically displaying a set of documents organized by a hierarchy of indexing concepts |
JP2001249943A (ja) | 2000-03-03 | 2001-09-14 | Ricoh Co Ltd | 文書検索システム、文書検索方法およびその方法を実施するためのプログラムを記憶した記憶媒体 |
US7035864B1 (en) | 2000-05-18 | 2006-04-25 | Endeca Technologies, Inc. | Hierarchical data-driven navigation system and method for information retrieval |
US7062483B2 (en) * | 2000-05-18 | 2006-06-13 | Endeca Technologies, Inc. | Hierarchical data-driven search and navigation system and method for information retrieval |
JP2002024144A (ja) | 2000-07-05 | 2002-01-25 | Nippon Telegr & Teleph Corp <Ntt> | 電子メール転送方法及び装置及び電子メール転送プログラムを格納した記憶媒体 |
US6633868B1 (en) * | 2000-07-28 | 2003-10-14 | Shermann Loyall Min | System and method for context-based document retrieval |
GB0026353D0 (en) | 2000-10-27 | 2000-12-13 | Canon Kk | Apparatus and a method for facilitating searching |
US7526425B2 (en) * | 2001-08-14 | 2009-04-28 | Evri Inc. | Method and system for extending keyword searching to syntactically and semantically annotated data |
US6886010B2 (en) * | 2002-09-30 | 2005-04-26 | The United States Of America As Represented By The Secretary Of The Navy | Method for data and text mining and literature-based discovery |
US7035884B2 (en) * | 2002-11-05 | 2006-04-25 | Sun Microsystems, Inc. | Placement of allocation trains in the train algorithm |
US7685136B2 (en) * | 2005-01-12 | 2010-03-23 | International Business Machines Corporation | Method, system and program product for managing document summary information |
US20060200464A1 (en) * | 2005-03-03 | 2006-09-07 | Microsoft Corporation | Method and system for generating a document summary |
NO20052215L (no) * | 2005-05-06 | 2006-11-07 | Fast Search & Transfer Asa | Fremgangsmate til bestemmelse av kontekstuell sammendragsinformasjon over dokumenter |
-
2006
- 2006-11-07 NO NO20065133A patent/NO325864B1/no not_active IP Right Cessation
-
2007
- 2007-11-06 US US11/979,607 patent/US7966305B2/en not_active Expired - Fee Related
- 2007-11-06 JP JP2007288256A patent/JP4861961B2/ja not_active Expired - Fee Related
- 2007-11-06 EP EP07021555A patent/EP1930816A1/en not_active Ceased
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005025525A (ja) * | 2003-07-02 | 2005-01-27 | Oki Electric Ind Co Ltd | 情報検索システム、情報検索方法及び情報検索プログラム |
JP2005141296A (ja) * | 2003-11-04 | 2005-06-02 | Just Syst Corp | 文書検索装置、文書検索方法、および文書検索プログラム |
JP2006072844A (ja) * | 2004-09-03 | 2006-03-16 | Oki Electric Ind Co Ltd | キーワード特定装置、キーワード特定方法及びキーワード特定プログラム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017513138A (ja) * | 2014-03-31 | 2017-05-25 | コファックス, インコーポレイテッド | スケーラブルなビジネスプロセスインテリジェンスおよび分散アーキテクチャのための予測的分析 |
EP3276507A1 (en) | 2016-07-25 | 2018-01-31 | Fujitsu Limited | Encoding device, encoding method and search method |
US9906238B2 (en) | 2016-07-25 | 2018-02-27 | Fujitsu Limited | Encoding device, encoding method and search method |
Also Published As
Publication number | Publication date |
---|---|
NO325864B1 (no) | 2008-08-04 |
US20080189269A1 (en) | 2008-08-07 |
EP1930816A1 (en) | 2008-06-11 |
JP4861961B2 (ja) | 2012-01-25 |
NO20065133L (no) | 2008-05-08 |
US7966305B2 (en) | 2011-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4861961B2 (ja) | 情報アクセスおよび検索におけるレレバンス重み付けナビゲーション | |
US10223439B1 (en) | Systems and methods for providing search query refinements | |
US8051084B2 (en) | System and method for measuring the quality of document sets | |
JP5377829B2 (ja) | 関連性のある情報源を決定し、クエリし、複数のコンテンツ情報源からの結果をマージするための方法とシステム | |
US7634466B2 (en) | Realtime indexing and search in large, rapidly changing document collections | |
US20070214133A1 (en) | Methods for filtering data and filling in missing data using nonlinear inference | |
US20060155751A1 (en) | System and method for document analysis, processing and information extraction | |
US20070192300A1 (en) | Method and system for determining relevant sources, querying and merging results from multiple content sources | |
JP2007234008A5 (ja) | ||
Setia et al. | HPM: A Hybrid Model for User’s Behavior Prediction Based on N‐Gram Parsing and Access Logs | |
Ko et al. | Semantically-based recommendation by using semantic clusters of users' viewing history | |
Veningston et al. | Semantic association ranking schemes for information retrieval applications using term association graph representation | |
Selvan et al. | ASE: Automatic search engine for dynamic information retrieval | |
WO2006034222A2 (en) | System and method for document analysis, processing and information extraction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100709 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20100922 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20101008 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20100922 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20101015 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20101109 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20101112 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20101207 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20101210 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110106 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20110207 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20110207 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110311 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110711 |
|
RD13 | Notification of appointment of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7433 Effective date: 20110712 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20110712 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20110908 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111028 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111107 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4861961 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141111 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |