JP6034674B2 - 検索情報難読化装置、検索情報難読化方法、およびプログラム - Google Patents
検索情報難読化装置、検索情報難読化方法、およびプログラム Download PDFInfo
- Publication number
- JP6034674B2 JP6034674B2 JP2012258906A JP2012258906A JP6034674B2 JP 6034674 B2 JP6034674 B2 JP 6034674B2 JP 2012258906 A JP2012258906 A JP 2012258906A JP 2012258906 A JP2012258906 A JP 2012258906A JP 6034674 B2 JP6034674 B2 JP 6034674B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- phrase
- search information
- obfuscation
- obfuscated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 37
- 238000012545 processing Methods 0.000 claims description 4
- 230000006870 function Effects 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 239000000470 constituent Substances 0.000 description 3
- 238000011160 research Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
<検索情報難読化装置>
図1は、本発明の第1の実施形態における検索情報難読化装置100の機能構成を示す図である。検索情報難読化装置100は、検索情報が第三者に漏えいすることを防ぐために、検索エンジンに送信する検索クエリに含める検索情報の言語傾向を難読化する装置である。ここで、検索情報とは、1以上の検索キーワード、および検索を行ったユーザ(以下、検索ユーザ)の情報から構成されている情報である。図1に示すように、検索情報難読化装置100は、難読化語句取得部110、辞書記憶部120、難読検索情報生成部130、検索部140から構成される。
図3を用いて、本発明の第2の実施形態について説明する。なお、本実施形態における検索情報難読化装置は、検索情報の言語傾向を統計的に難読化することができる。なお、第1の実施形態と同一の符号を付す構成要素については、同一の機能を有することから、その詳細な説明は省略する。
図3は、本発明の第2の実施形態における検索情報難読化装置101の機能構成を示す図である。検索情報難読化装置101は、検索情報が第三者に漏えいすることを防ぐために、検索エンジンに送信する検索クエリに含める検索情報の言語傾向を難読化する装置である。ここで、検索情報とは、1以上の検索キーワード、および検索を行ったユーザ(以下、検索ユーザ)の情報から構成されている情報である。図1に示すように、検索情報難読化装置101は、難読化語句取得部110、辞書記憶部120、難読検索情報生成部130、検索部140、検索コンテンツ記憶部150、および難読化語句数決定部160から構成される。
図4を用いて、本発明の第3の実施形態について説明する。なお、本実施形態における検索情報難読化装置は、Web上でよく用いられる語句を用いて検索情報を難読化する。なお、第1の実施形態と同一の符号を付す構成要素については、同一の機能を有することから、その詳細な説明は省略する。
110 難読化語句取得部
111 関連語句取得部
112 低関連検索語句取得部
113 検索主体関連語句取得部
114 低関連検索主体語句取得部
120 辞書記憶部
130 難読検索情報生成部
140 検索部
Claims (8)
- インターネット検索に関する検索情報における言語傾向を、第三者から難読化する検索情報難読化装置であって、
語句間の関連を示す辞書データを記憶する辞書記憶手段と、
前記検索情報に含まれる検索語句に関連する関連検索語句を前記辞書記憶手段から難読化語句として取得する関連語句取得手段と、
前記辞書記憶手段から取得した語句と関連する語句を当該辞書記憶手段から取得する処理を1回以上繰り返し、当該取得した語句群それぞれについて関連が低い低関連検索語句を前記辞書記憶手段から前記難読化語句として取得する低関連検索語句取得手段と、
前記関連語句取得手段および前記低関連検索語句取得手段で取得した難読化語句と前記検索情報とに基づいて、難読検索情報を生成する難読検索情報生成手段と、
を備えることを特徴とする検索情報難読化装置。 - 前記低関連検索語句取得手段が、前記検索情報に含まれる検索語句と関連が低い低関連検索語句を、前記辞書記憶手段から取得し、当該取得した語句と関連する語句を当該辞書記憶手段から取得する処理を1回以上繰り返し、当該取得した語句群を前記難読化語句として取得することを特徴とする請求項1に記載の検索情報難読化装置。
- 前記難読化語句取得手段が、前記検索情報に含まれる前記インターネット検索の主体を特定する検索主体情報と関連がある検索主体関連語句を、前記辞書記憶手段から前記難読化語句として取得する検索主体関連語句取得手段を備え、
前記難読検索情報生成手段が、前記検索主体関連語句取得手段で取得した前記難読化語句を、前記検索情報に組み合わせて難読検索情報を生成することを特徴とする請求項1または請求項2に記載の検索情報難読化装置。 - 前記検索情報に含まれる前記検索主体情報と関連が低い低関連検索主体語句を、前記辞書記憶手段から前記難読化語句として取得する低関連検索主体語句取得手段を備え、
前記難読検索情報生成手段が、前記低関連検索主体語句取得手段で取得した前記難読化語句を、前記検索情報に組み合わせて難読検索情報を生成することを特徴とする請求項3に記載の検索情報難読化装置。 - 前記低関連検索主体語句取得手段が、前記辞書記憶手段から取得した語句と関連する語句を当該辞書記憶手段から取得する処理を1回以上繰り返し、当該取得した語句群それぞれと関連する低関連検索主体語句を前記辞書記憶手段から前記難読化語句として取得することを特徴とする請求項4に記載の検索情報難読化装置。
- 前記難読検索情報による前記インターネット検索により取得されたコンテンツを、当該難読検索情報に対応する当該検索情報と対応付けて記憶する検索コンテンツ記憶手段と、
前記検索コンテンツ記憶手段に記憶されているコンテンツと当該コンテンツに対応付けられている前記検索情報とに基づいて、当該検索情報に含まれる検索語句の出現頻度に基づいて、前記難読検索情報に含める難読化語句数を決定する難読化語句数決定手段と、
を備え、
前記難読検索情報生成手段が、前記難読化語句数決定手段で決定された難読化語句数に基づいて、前記難読化語句から前記難読検索情報に含める前記難読化語句を選択することを特徴とする請求項1から請求項5のいずれかに記載の検索情報難読化装置。 - インターネット検索に関する検索情報の言語傾向を、第三者から難読化する検索情報難読化装置における検索情報難読化方法であって、
前記検索情報難読化装置が、語句間の関連を示す辞書データを記憶する辞書記憶手段、関連語句取得手段、低関連検索語句取得手段、および難読検索情報生成手段を備え、
前記関連語句取得手段が、前記検索情報に含まれる検索語句に関連する関連検索語句を前記辞書記憶手段から難読化語句として取得する第1のステップと、
前記低関連検索語句取得手段が、前記辞書記憶手段から取得した語句と関連する語句を当該辞書記憶手段から取得する処理を1回以上繰り返し、当該取得した語句群それぞれについて関連が低い低関連検索語句を前記辞書記憶手段から前記難読化語句として取得する第2のステップと、
前記難読検索情報生成手段が、前記第1のステップおよび前記第2のステップで取得した難読化語句と前記検索情報とに基づいて、難読検索情報を生成する第3のステップと、
を含むことを特徴とする検索情報難読化方法。 - インターネット検索に関する検索情報の言語傾向を、第三者から難読化する検索情報難読化装置における検索情報難読化方法をコンピュータに実行させるためのプログラムであって、
前記検索情報難読化装置が、語句間の関連を示す辞書データを記憶する辞書記憶手段、関連語句取得手段、低関連検索語句取得手段、および難読検索情報生成手段を備え、
前記関連語句取得手段が、前記検索情報に含まれる検索語句に関連する関連検索語句を前記辞書記憶手段から難読化語句として取得する第1のステップと、
前記低関連検索語句取得手段が、前記辞書記憶手段から取得した語句と関連する語句を当該辞書記憶手段から取得する処理を1回以上繰り返し、当該取得した語句群それぞれについて関連が低い低関連検索語句を前記辞書記憶手段から前記難読化語句として取得する第2のステップと、
前記難読検索情報生成手段が、前記第1のステップおよび前記第2のステップで取得した難読化語句と前記検索情報とに基づいて、難読検索情報を生成する第3のステップと、
をコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012258906A JP6034674B2 (ja) | 2012-11-27 | 2012-11-27 | 検索情報難読化装置、検索情報難読化方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012258906A JP6034674B2 (ja) | 2012-11-27 | 2012-11-27 | 検索情報難読化装置、検索情報難読化方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014106723A JP2014106723A (ja) | 2014-06-09 |
JP6034674B2 true JP6034674B2 (ja) | 2016-11-30 |
Family
ID=51028156
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012258906A Active JP6034674B2 (ja) | 2012-11-27 | 2012-11-27 | 検索情報難読化装置、検索情報難読化方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6034674B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7169628B2 (ja) * | 2018-06-15 | 2022-11-11 | 大学共同利用機関法人情報・システム研究機構 | 情報検索システム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3581009B2 (ja) * | 1998-03-12 | 2004-10-27 | 株式会社日立製作所 | データ検索システム及びデータ検索方法 |
JP3827936B2 (ja) * | 2000-10-18 | 2006-09-27 | シャープ株式会社 | 情報提供制御装置、情報提供方法、情報提供プログラムを記録した記録媒体および情報提供システム |
JP2004118262A (ja) * | 2002-09-24 | 2004-04-15 | Toshiba Corp | 文書検索装置、文書検索方法及び文書検索プログラム |
JP5306356B2 (ja) * | 2008-08-26 | 2013-10-02 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 公開された検索エンジンを用いた検索装置、検索方法及び検索プログラム |
JP5321258B2 (ja) * | 2009-06-09 | 2013-10-23 | 日本電気株式会社 | 情報収集システムおよび情報収集方法ならびにそのプログラム |
US8725762B2 (en) * | 2009-07-28 | 2014-05-13 | International Business Machines Corporation | Preventing leakage of information over a network |
EP2680251B1 (en) * | 2011-02-22 | 2016-05-25 | Mitsubishi Electric Corporation | Search system, search method for search system, information processing device, search program, corresponding keyword management device and corresponding keyword management system |
-
2012
- 2012-11-27 JP JP2012258906A patent/JP6034674B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014106723A (ja) | 2014-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Fu et al. | Enabling central keyword-based semantic extension search over encrypted outsourced data | |
US10013574B2 (en) | Method and apparatus for secure storage and retrieval of encrypted files in public cloud-computing platforms | |
US9576005B2 (en) | Search system | |
US11550833B2 (en) | Architecture for semantic search over encrypted data in the cloud | |
EP2336908B1 (en) | Search device, search method and search program using open search engine | |
Arampatzis et al. | A query scrambler for search privacy on the internet | |
Henzinger et al. | Private web search with Tiptoe | |
CN107704768A (zh) | 一种密文的多关键字分级安全检索方法 | |
Viejo et al. | Profiling social networks to provide useful and privacy‐preserving web search | |
Chatterjee et al. | Why does this entity matter? support passage retrieval for entity retrieval | |
Sasikumar et al. | A survey of natural language question answering system | |
Wang et al. | ReSLLM: Large language models are strong resource selectors for federated search | |
KR20200089893A (ko) | 빅데이터 텍스트 마이닝과 블록체인 기술을 이용한 건강정보 저장 및 서칭 시스템 | |
JP6034674B2 (ja) | 検索情報難読化装置、検索情報難読化方法、およびプログラム | |
Faggioli et al. | Query Obfuscation for Information Retrieval Through Differential Privacy | |
KR20130032660A (ko) | 개인정보 유출 검색 시스템 및 방법 | |
EP2775420A1 (en) | Semantic search over encrypted data | |
JP2023518111A (ja) | ボリューム漏洩が低減された、暗号化されたデータに対する暗号化されたサーチ | |
Grzebala et al. | Private record linkage: Comparison of selected techniques for name matching | |
Nobili | Review OSINT tool for social engineering | |
Chaudhari et al. | An In-Depth Analysis on Efficiency and Vulnerabilities on a Cloud-Based Searchable Symmetric Encryption Solution | |
Sousa et al. | Privacy in open search: A review of challenges and solutions | |
Fang et al. | A novel storage and search scheme in cloud computing | |
Zhang | Privacy-preserving Statistical Tools: Differential Privacy and Beyond | |
Yamamoto et al. | A study on the information content leaked from queries to search engines and its reduction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150828 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160630 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160802 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160926 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161025 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161028 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6034674 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |