JP5116593B2 - 公開された検索エンジンを用いた検索装置、検索方法及び検索プログラム - Google Patents
公開された検索エンジンを用いた検索装置、検索方法及び検索プログラム Download PDFInfo
- Publication number
- JP5116593B2 JP5116593B2 JP2008192799A JP2008192799A JP5116593B2 JP 5116593 B2 JP5116593 B2 JP 5116593B2 JP 2008192799 A JP2008192799 A JP 2008192799A JP 2008192799 A JP2008192799 A JP 2008192799A JP 5116593 B2 JP5116593 B2 JP 5116593B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- input
- combinations
- sub
- combination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2453—Query optimisation
- G06F16/24534—Query rewriting; Transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2453—Query optimisation
- G06F16/24534—Query rewriting; Transformation
- G06F16/24535—Query rewriting; Transformation of sub-queries or views
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24564—Applying rules; Deductive queries
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
サーバがNビットのデータを所有し、クライアントがNビットの内の1ビットをサーバに知らせることなく取得する問題があるが、この問題の単純な解決方法はサーバが全Nビットをクライアントに送ることである。しかし、複数のサーバの存在や計算複雑性の仮定の下で全ビットを送ることなく解決できるという研究結果は90年代からすでにある。これらは数学的な基礎理論であり、実用にはいたっていない(http://www.cs.umd.edu/~gasarch/papers/pirsurvey.pdf(非特許文献1)参照)。
PIRの場合、クライアントは自分が欲しがる情報以外の情報を得られるかもしれないが、OTの設定ではPIRを満たすほかに、クライアントは自分の欲しがるデータ以外の情報が得られないようなプロトコルを設計する。また、OTの場合、通信量の制限がない。OTは非特許文献1に登場するSymmetric PIRと同じである。これらも理論であり、実装例はほとんどない。
この手法では、ユーザの公開鍵でクエリをサーバ側で暗号化し、同時にインデックスも暗号化することで、サーバ側に情報を公開せずに、検索結果を得ることができる。しかし、この手法では、サーバ側の実装が必要になるため、通常利用されている検索サーバを活用することができない(http://acsc.csl.sri.com/privss/(非特許文献2))参照)。
(2)同一ヒットページを含む個別検索結果の数が多い方の順位を優先する。
(3)ヒットページの数が多い方の個別検索結果の順位を優先する。
得点=所定値(たとえば200)−当該ヒットページの順位 …(1)
15 入力装置
16 ディスプレイ
20 インターネット
21〜23 検索エンジン
41〜43 個別検索結果
Claims (12)
- 公開された検索エンジンを用いて検索を行う検索装置であって、
複数のキーワードを含むメインクエリの入力を受け付けるメインクエリ入力手段と、
前記入力手段で入力されたメインクエリに含まれるキーワードを組み合わせ、各々が1又は2以上のキーワードを含む複数のサブクエリを生成するサブクエリ生成手段と、
前記サブクエリ生成手段で生成された複数のサブクエリを別々に前記検索エンジンに送信する検索要求手段と、
前記検索要求手段からの複数のサブクエリに応答して前記検索エンジンから返信されて来た複数の検索結果を前記入力手段で入力されたメインクエリで再検索する再検索手段と、
前記再検索手段による検索結果を表示する検索結果表示手段とを備える、ことを特徴とする検索装置。 - 請求項1に記載の検索装置であって、
前記サブクエリ生成手段は、
各々が1又は2以上のキーワードを含む複数の組合せを生成するキーワード組合せ手段と、
前記キーワード組合せ手段で生成された複数の組合せのうち秘密情報が推測され易い組合せを前記サブクエリから除外するサブクエリ除外手段とを含む、ことを特徴とする検索装置。 - 請求項2に記載の検索装置であって、
前記サブクエリ除外手段は、
禁止すべきキーワードの組合せの入力を受け付ける手段と、
前記入力された組合せを除外する手段とを含む、ことを特徴とする検索装置。 - 請求項2に記載の検索装置であって、
前記サブクエリ除外手段は、
あらかじめ指定された組合せを除外する手段を含む、ことを特徴とする検索装置。 - 請求項2に記載の検索装置であって、
前記サブクエリ除外手段は、
未知のキーワードを含む組合せを除外する手段を含む、ことを特徴とする検索装置。 - 請求項2に記載の検索装置であって、
前記サブクエリ除外手段は、
前記キーワード組合せ手段で生成された各組合せに含まれるキーワードの共起確率を取得する手段と、
前記取得された共起確率が所定の値よりも低い組合せを除外する手段とを含む、ことを特徴とする検索装置。 - 請求項6に記載の検索装置であって、
前記検索エンジンは複数あり、
前記サブクエリ生成手段はさらに、
前記サブクエリ除外手段で残された組合せのうち前記取得された共起確率が低い方から順に前記検索エンジンと同数の組合せをサブクエリとして選択する手段を含む、ことを特徴とする検索装置。 - 請求項1に記載の検索装置であって、
前記検索エンジンは複数あり、前記サブクエリの数は前記検索エンジンの数と同じであり、
前記検索要求手段は、前記複数のサブクエリの各々を対応する検索エンジンに送信する、ことを特徴とする検索装置。 - 請求項8に記載の検索装置であって、
前記再検索手段は、
前記複数の検索エンジンから返信されて来た複数の検索結果の各々から無関係なヒットデータを除外するフィルタリング手段と、
前記フィルタリング手段により無関係なヒットデータが除外された複数の検索結果を統合する統合手段とを含む、ことを特徴とする検索装置。 - 公開された検索エンジンを用いて検索を行う検索方法であって、
複数のキーワードを含むメインクエリの入力を受け付けるステップと、
前記入力されたメインクエリに含まれるキーワードを組み合わせ、各々が1又は2以上のキーワードを含む複数のサブクエリを生成するステップと、
前記生成された複数のサブクエリを別々に前記検索エンジンに送信するステップと、
前記複数のサブクエリに応答して前記検索エンジンから返信されて来た複数の検索結果を前記入力されたメインクエリで再検索するステップと、
前記再検索による検索結果を表示するステップとを含む、ことを特徴とする検索方法。 - 請求項10に記載の各ステップをコンピュータに実行させるための検索プログラム。
- 公開された検索エンジンを用いて検索を行う検索装置であって、
複数のキーワードを含むメインクエリの入力を受け付けるメインクエリ入力手段と、
前記入力手段で入力されたメインクエリに含まれるキーワードを組み合わせ、各々が1又は2以上のキーワードを含む複数のサブクエリを生成するサブクエリ生成手段と、
前記サブクエリ生成手段で生成された複数のサブクエリを別々に前記検索エンジンに送信する検索要求手段と、
前記検索要求手段からの複数のサブクエリに応答して前記検索エンジンから返信されて来た複数の検索結果を前記入力手段で入力されたメインクエリで再検索する再検索手段と、
前記再検索手段による検索結果を表示する検索結果表示手段とを備え、
前記サブクエリ生成手段は、
各々が1又は2以上のキーワードを含む複数の組合せを生成するキーワード組合せ手段と、
前記キーワード組合せ手段で生成された複数の組合せのうち秘密情報が推測され易い組合せを前記サブクエリから除外するサブクエリ除外手段とを含み、
前記サブクエリ除外手段は、
禁止すべきキーワードの組合せの入力を受け付ける手段と、
前記入力された組合せを除外する手段と、
あらかじめ指定された組合せを除外する手段と、
未知のキーワードを含む組合せを除外する手段と、
前記キーワード組合せ手段で生成された各組合せに含まれるキーワードの共起確率を取得する手段と、
前記取得された共起確率が所定の値よりも低い組合せを除外する手段とを含み、
前記検索エンジンは複数あり、前記サブクエリの数は前記検索エンジンの数と同じであり、
前記サブクエリ生成手段はさらに、
前記サブクエリ除外手段で残された組合せのうち前記取得された共起確率が低い方から順に前記検索エンジンと同数の組合せをサブクエリとして選択する手段を含み、
前記検索要求手段は、前記複数のサブクエリの各々を対応する検索エンジンに送信し、
前記再検索手段は、
前記複数の検索エンジンから返信されて来た複数の検索結果の各々から無関係なヒットデータを除外するフィルタリング手段と、
前記フィルタリング手段により無関係なヒットデータが除外された複数の検索結果を統合する統合手段とを含む、ことを特徴とする検索装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008192799A JP5116593B2 (ja) | 2008-07-25 | 2008-07-25 | 公開された検索エンジンを用いた検索装置、検索方法及び検索プログラム |
US12/506,109 US9195744B2 (en) | 2008-07-25 | 2009-07-20 | Protecting information in search queries |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008192799A JP5116593B2 (ja) | 2008-07-25 | 2008-07-25 | 公開された検索エンジンを用いた検索装置、検索方法及び検索プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010033197A JP2010033197A (ja) | 2010-02-12 |
JP5116593B2 true JP5116593B2 (ja) | 2013-01-09 |
Family
ID=41569545
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008192799A Active JP5116593B2 (ja) | 2008-07-25 | 2008-07-25 | 公開された検索エンジンを用いた検索装置、検索方法及び検索プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9195744B2 (ja) |
JP (1) | JP5116593B2 (ja) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5306356B2 (ja) * | 2008-08-26 | 2013-10-02 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 公開された検索エンジンを用いた検索装置、検索方法及び検索プログラム |
EP2558988A4 (en) * | 2010-04-14 | 2016-12-21 | The Dun And Bradstreet Corp | ASSIGNMENT OF ACTIONABLE ATTRIBUTES TO DATA DESCRIBING A PERSONAL IDENTITY |
US8849776B2 (en) * | 2011-10-17 | 2014-09-30 | Yahoo! Inc. | Method and system for resolving data inconsistency |
JP5393816B2 (ja) * | 2012-02-08 | 2014-01-22 | 株式会社Nttドコモ | 情報検索装置および情報検索方法 |
JP5953851B2 (ja) * | 2012-03-19 | 2016-07-20 | 富士ゼロックス株式会社 | 文書管理装置及びプログラム |
CN103324644B (zh) * | 2012-03-23 | 2016-05-11 | 日电(中国)有限公司 | 一种查询结果多样化方法及装置 |
US9576077B2 (en) * | 2012-12-28 | 2017-02-21 | Intel Corporation | Generating and displaying media content search results on a computing device |
US9721020B2 (en) * | 2013-07-31 | 2017-08-01 | International Business Machines Corporation | Search query obfuscation via broadened subqueries and recombining |
US9118631B1 (en) * | 2013-08-16 | 2015-08-25 | Google Inc. | Mixing secure and insecure data and operations at server database |
CN104572713A (zh) * | 2013-10-18 | 2015-04-29 | 英业达科技有限公司 | 文件搜寻保护系统及其方法 |
US9444797B2 (en) * | 2014-07-10 | 2016-09-13 | Empire Technology Development Llc | Protection of private data |
US9965649B2 (en) * | 2015-05-19 | 2018-05-08 | Rujing Tang | System and method for protecting internet user data privacy |
WO2016207996A1 (ja) * | 2015-06-24 | 2016-12-29 | 三菱電機株式会社 | 表示制御装置および表示制御方法 |
RU2626663C2 (ru) | 2015-06-30 | 2017-07-31 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и сервер для создания предложений по завершению поисковых запросов |
US10362060B2 (en) | 2015-12-30 | 2019-07-23 | International Business Machines Corporation | Curtailing search engines from obtaining and controlling information |
US11227113B2 (en) * | 2016-01-20 | 2022-01-18 | International Business Machines Corporation | Precision batch interaction with a question answering system |
US10601784B2 (en) * | 2017-11-15 | 2020-03-24 | International Business Machines Corporation | Obscuring internet searches from external web service providers |
CN108345702A (zh) * | 2018-04-10 | 2018-07-31 | 北京百度网讯科技有限公司 | 实体推荐方法和装置 |
JP7069098B2 (ja) * | 2019-10-25 | 2022-05-17 | ヤフー株式会社 | 提供装置、提供方法、および提供プログラム |
US11544597B2 (en) * | 2020-04-30 | 2023-01-03 | International Business Machines Corporation | Problem manipulators for language-independent computerized reasoning |
US20220138343A1 (en) * | 2020-10-30 | 2022-05-05 | EMC IP Holding Company LLC | Method of determining data set membership and delivery |
GB202107332D0 (en) * | 2021-05-21 | 2021-07-07 | Cyan Forensics Ltd | Improvements in or relating to data transmission |
US12147425B2 (en) * | 2021-09-23 | 2024-11-19 | Ancestry.Com Operations Inc. | Search-result explanation systems and methods |
WO2023106608A1 (ko) * | 2021-12-06 | 2023-06-15 | 삼성전자 주식회사 | 개인정보 침해를 방지하기 위한 빅데이터 분석 장치, 동작 방법 및 비-일시적 컴퓨터 판독가능 저장 매체 |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07146878A (ja) * | 1993-11-25 | 1995-06-06 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索装置 |
US5590319A (en) * | 1993-12-15 | 1996-12-31 | Information Builders, Inc. | Query processor for parallel processing in homogenous and heterogenous databases |
JP3766126B2 (ja) * | 1995-10-24 | 2006-04-12 | 富士通株式会社 | 情報検索方法および情報検索装置 |
GB2325537B8 (en) * | 1997-03-31 | 2000-01-31 | Microsoft Corp | Query-based electronic program guide |
JP4065346B2 (ja) * | 1997-07-28 | 2008-03-26 | 株式会社ジャストシステム | 単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP3581009B2 (ja) * | 1998-03-12 | 2004-10-27 | 株式会社日立製作所 | データ検索システム及びデータ検索方法 |
JP2001125923A (ja) * | 1999-10-29 | 2001-05-11 | Canon Inc | 情報処理装置及びその方法、コンピュータ可読メモリ |
US6928428B1 (en) * | 2000-11-27 | 2005-08-09 | Microsoft Corporation | Distributed confidential contextual querying |
JP4006214B2 (ja) * | 2001-01-26 | 2007-11-14 | 株式会社日立製作所 | データ検索システム、データ中継サーバ、データベースサーバおよびデータベースのアクセス方法 |
CA2442869A1 (en) * | 2001-03-30 | 2002-10-10 | Goldman, Sachs & Co. | Method and system for processing queries requiring coordinated access to distributed databases |
JP3871301B2 (ja) * | 2001-05-15 | 2007-01-24 | インターナショナル・ビジネス・マシーンズ・コーポレーション | データベース検索装置、及びプログラム |
US20030014405A1 (en) * | 2001-07-09 | 2003-01-16 | Jacob Shapiro | Search engine designed for handling long queries |
AUPR796701A0 (en) * | 2001-09-27 | 2001-10-25 | Plugged In Communications Pty Ltd | Database query system and method |
US7437349B2 (en) * | 2002-05-10 | 2008-10-14 | International Business Machines Corporation | Adaptive probabilistic query expansion |
US7103593B2 (en) * | 2002-06-14 | 2006-09-05 | Christopher James Dean | System and method for retrieving information from disparate information sources in a decentralized manner and integrating the information in accordance with a distributed domain model/ontology |
US20060047649A1 (en) * | 2003-12-29 | 2006-03-02 | Ping Liang | Internet and computer information retrieval and mining with intelligent conceptual filtering, visualization and automation |
US7984039B2 (en) * | 2005-07-14 | 2011-07-19 | International Business Machines Corporation | Merging of results in distributed information retrieval |
JP4733458B2 (ja) * | 2005-07-29 | 2011-07-27 | 株式会社野村総合研究所 | 検索システム及び検索方法 |
JP5067556B2 (ja) * | 2005-09-30 | 2012-11-07 | 日本電気株式会社 | トレンド評価装置と、その方法及びプログラム |
US7536383B2 (en) * | 2006-08-04 | 2009-05-19 | Apple Inc. | Method and apparatus for searching metadata |
US8738606B2 (en) * | 2007-03-30 | 2014-05-27 | Microsoft Corporation | Query generation using environment configuration |
US7984043B1 (en) * | 2007-07-24 | 2011-07-19 | Amazon Technologies, Inc. | System and method for distributed query processing using configuration-independent query plans |
WO2010027517A2 (en) * | 2008-09-08 | 2010-03-11 | Chuan David Ai | Private information requests and information management |
-
2008
- 2008-07-25 JP JP2008192799A patent/JP5116593B2/ja active Active
-
2009
- 2009-07-20 US US12/506,109 patent/US9195744B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2010033197A (ja) | 2010-02-12 |
US9195744B2 (en) | 2015-11-24 |
US20100023509A1 (en) | 2010-01-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5116593B2 (ja) | 公開された検索エンジンを用いた検索装置、検索方法及び検索プログラム | |
JP5306356B2 (ja) | 公開された検索エンジンを用いた検索装置、検索方法及び検索プログラム | |
US8745039B2 (en) | Method and system for user guided search navigation | |
US10289700B2 (en) | Method for dynamically matching images with content items based on keywords in response to search queries | |
JP4638439B2 (ja) | ウェブ検索の個人化 | |
JP4991289B2 (ja) | 予め定義されたサーチ問合せからサーチ結果へのアクセスを与えるurlで補足されるサーチエンジン | |
US8352396B2 (en) | Systems and methods for improving web site user experience | |
US10216851B1 (en) | Selecting content using entity properties | |
CN100487703C (zh) | 用于生成搜索引擎搜索结果的方法和系统 | |
US10296535B2 (en) | Method and system to randomize image matching to find best images to be matched with content items | |
CN103339597A (zh) | 转换搜索引擎查询 | |
CN109952571B (zh) | 基于上下文的图像搜索结果 | |
US10275472B2 (en) | Method for categorizing images to be associated with content items based on keywords of search queries | |
US20170351706A1 (en) | Method and system for matching images with content using whitelists and blacklists in response to a search query | |
US20170255647A1 (en) | Method for selecting images for matching with content based on metadata of images and content in real-time in response to search queries | |
WO2015198112A1 (en) | Processing search queries and generating a search result page including search object related information | |
US20160335365A1 (en) | Processing search queries and generating a search result page including search object information | |
Patel et al. | SEO and content management system | |
Patel et al. | A review of PageRank and HITS algorithms | |
WO2015198115A1 (en) | Method of and a system for determining linked objects | |
JP2006164045A (ja) | 共起グラフ作成方法及び装置及びプログラム及びプログラムを格納した記憶媒体 | |
Waqas et al. | Knowledge Extraction Using Web Usage Mining. | |
Vijaya et al. | in Knowledge Computing | |
Mogal | Citation Network and Author based Search Pattern for Article Recommendation | |
Thomas et al. | A Survey on Web Search Results Personalization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110704 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120830 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120925 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121016 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5116593 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151026 Year of fee payment: 3 |