JP5179564B2 - クエリセグメント位置決定装置 - Google Patents
クエリセグメント位置決定装置 Download PDFInfo
- Publication number
- JP5179564B2 JP5179564B2 JP2010292481A JP2010292481A JP5179564B2 JP 5179564 B2 JP5179564 B2 JP 5179564B2 JP 2010292481 A JP2010292481 A JP 2010292481A JP 2010292481 A JP2010292481 A JP 2010292481A JP 5179564 B2 JP5179564 B2 JP 5179564B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- query
- segment position
- separator
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1は本発明の第1の実施形態にかかるシステムの構成例を示す図である。
Assistants)等のユーザ端末2が複数接続されている。ユーザ端末2は、一般的なブラウザ(Webブラウザ)21を備えている。ブラウザ21は、インターネットの標準プロトコルであるHTTP(Hyper Text Transfer Protocol)等に従い、HTML(Hyper
Text Markup Language)等の言語で記述されたページデータの要求・取得・表示およびフォームデータの送信等を行う機能を有している。
Memory)、RAM(Random Access Memory)等のハードウェア資源上で実行されるコンピュータプログラムによって実現されるものである。これらの機能部は、単一のコンピュータ上に配置される必要はなく、必要に応じて分散される形態であってもよい。
=(word1とword2の連接状態でのヒット数)/min(word1のヒット数,word2のヒット数)
相互情報量によるスコア
=log(P(word1,word2))/(P(word1)P(word2))
ここで、minは括弧内の数値のうち小さい方を表わす。また、P(word1,word2)はword1とword2の同時分布関数、P(word1)はword1の周辺確率分布関数、P(word2)はword2の周辺確率分布関数である。
図9は本発明の第2の実施形態にかかるシステムの構成例を示す図である。前述した第1の実施形態ではバッチ処理によりクエリセグメント位置の学習を行い、学習結果に基づいて受け付けた検索クエリを修正する場合について説明したが、この第2の実施形態では、受け付けた検索クエリを逐次に修正するようにしている。
以上説明したように、本実施形態によれば、ユーザにより入力された検索クエリのクエリセグメント位置を適正な位置に修正することで、検索精度を高めることができる。
2 ユーザ端末
21 ブラウザ
3 検索装置
301 クエリセグメント位置学習部
302 検索ログ取得部
303 セパレータ削除部
304 クエリ分割部
305 検索部
306 検索結果解析部
307 クエリセグメント位置決定部
308 学習データ生成・学習要求部
309 パターン認識部
310 検索クエリ受付部
311 検索クエリ修正部
312 検索部
313 検索結果応答部
314 検索ログ
315 検索DB
Claims (10)
- 検索ログを取得する検索ログ取得手段と、
取得した検索ログの検索クエリからセパレータを削除するセパレータ削除手段と、
セパレータが削除された検索クエリを複数の文字列に分割するクエリ分割手段と、
分割された文字列に基づいて検索データベースを検索する第1検索手段と、
検索結果に基づいて、分割された一の文字列が隣接する文字列と連接共起する頻度をスコアとして算出する解析手段と、
算出されたスコアに基づいてクエリセグメント位置を決定するクエリセグメント位置決定手段と
を備えたことを特徴とするクエリセグメント位置決定装置。 - 請求項1に記載のクエリセグメント位置決定装置において、
前記クエリ分割手段は、形態素解析により検索クエリを複数の文字列に分割する
ことを特徴とするクエリセグメント位置決定装置。 - 請求項1に記載のクエリセグメント位置決定装置において、
前記クエリ分割手段は、検索ログから最も分割数の多いパターンを選択することで検索クエリを複数の文字列に分割する
ことを特徴とするクエリセグメント位置決定装置。 - 請求項1に記載のクエリセグメント位置決定装置において、
前記クエリ分割手段は、検索ログから文字列の結合モデルを複数生成することで検索クエリを複数の文字列に分割する
ことを特徴とするクエリセグメント位置決定装置。 - 検索ログを取得する検索ログ取得手段と、
取得した検索ログの検索クエリからセパレータを削除するセパレータ削除手段と、
セパレータが削除された検索クエリを複数の文字列に分割するクエリ分割手段と、
分割された文字列に基づいて検索データベースを検索する第1検索手段と、
検索結果に基づいて、分割された一の文字列が隣接する文字列と連接共起する頻度をスコアとして算出する解析手段と、
算出されたスコアに基づいてクエリセグメント位置を決定するクエリセグメント位置決定手段と、
決定されたクエリセグメント位置に基づいてパターン認識部の学習を行う学習手段と、
ユーザから入力された検索クエリを前記パターン認識部によりクエリセグメント位置の適否を判断し、適正なクエリセグメント位置に修正を行うクエリ修正手段と、
修正された検索クエリに基づいて前記検索データベースを検索する第2検索手段と
を備えたことを特徴とする検索装置。 - ユーザから検索クエリを受け付ける受付手段と、
受け付けた検索クエリからセパレータを削除するセパレータ削除手段と、
セパレータが削除された検索クエリを複数の文字列に分割するクエリ分割手段と、
分割された文字列に基づいて検索データベースを検索する第1検索手段と、
検索結果に基づいて、分割された一の文字列が隣接する文字列と連接共起する頻度をスコアとして算出する解析手段と、
算出されたスコアに基づいてクエリセグメント位置を決定するクエリセグメント位置決定手段と、
決定されたクエリセグメント位置決定手段に基づいて検索クエリを修正するクエリ修正手段と、
修正された検索クエリに基づいて前記検索データベースを検索する第2検索手段と
を備えたことを特徴とする検索装置。 - 検索装置の制御部が、検索ログを取得する検索ログ取得工程と、
前記制御部が、取得した検索ログの検索クエリからセパレータを削除するセパレータ削除工程と、
前記制御部が、セパレータが削除された検索クエリを複数の文字列に分割するクエリ分割工程と、
前記制御部が、分割された文字列に基づいて検索データベースを検索する第1検索工程と、
前記制御部が、検索結果に基づいて、分割された一の文字列が隣接する文字列と連接共起する頻度をスコアとして算出する解析工程と、
前記制御部が、算出されたスコアに基づいてクエリセグメント位置を決定するクエリセグメント位置決定工程と、
前記制御部が、決定されたクエリセグメント位置に基づいてパターン認識部の学習を行う学習工程と、
前記制御部が、ユーザから入力された検索クエリを前記パターン認識部によりクエリセグメント位置の適否を判断し、適正なクエリセグメント位置に修正を行うクエリ修正工程と、
前記制御部が、修正された検索クエリに基づいて前記検索データベースを検索する第2検索工程と
を備えたことを特徴とする検索制御方法。 - 検索装置の制御部が、ユーザから検索クエリを受け付ける受付工程と、
前記制御部が、受け付けた検索クエリからセパレータを削除するセパレータ削除工程と、
前記制御部が、セパレータが削除された検索クエリを複数の文字列に分割するクエリ分割工程と、
前記制御部が、分割された文字列に基づいて検索データベースを検索する第1検索工程と、
前記制御部が、検索結果に基づいて、分割された一の文字列が隣接する文字列と連接共起する頻度をスコアとして算出する解析工程と、
前記制御部が、算出されたスコアに基づいてクエリセグメント位置を決定するクエリセグメント位置決定工程と、
前記制御部が、決定されたクエリセグメント位置決定手段に基づいて検索クエリを修正するクエリ修正工程と、
前記制御部が、修正された検索クエリに基づいて前記検索データベースを検索する第2検索工程と
を備えたことを特徴とする検索制御方法。 - 検索装置を構成するコンピュータを、
検索ログを取得する検索ログ取得手段、
取得した検索ログの検索クエリからセパレータを削除するセパレータ削除手段、
セパレータが削除された検索クエリを複数の文字列に分割するクエリ分割手段、
分割された文字列に基づいて検索データベースを検索する第1検索手段、
検索結果に基づいて、分割された一の文字列が隣接する文字列と連接共起する頻度をスコアとして算出する解析手段、
算出されたスコアに基づいてクエリセグメント位置を決定するクエリセグメント位置決定手段、
決定されたクエリセグメント位置に基づいてパターン認識部の学習を行う学習手段、
ユーザから入力された検索クエリを前記パターン認識部によりクエリセグメント位置の適否を判断し、適正なクエリセグメント位置に修正を行うクエリ修正手段、
修正された検索クエリに基づいて前記検索データベースを検索する第2検索手段
として機能させる検索制御プログラム。 - 検索装置を構成するコンピュータを、
ユーザから検索クエリを受け付ける受付手段、
受け付けた検索クエリからセパレータを削除するセパレータ削除手段、
セパレータが削除された検索クエリを複数の文字列に分割するクエリ分割手段、
分割された文字列に基づいて検索データベースを検索する第1検索手段、
検索結果に基づいて、分割された一の文字列が隣接する文字列と連接共起する頻度をスコアとして算出する解析手段、
算出されたスコアに基づいてクエリセグメント位置を決定するクエリセグメント位置決定手段、
決定されたクエリセグメント位置決定手段に基づいて検索クエリを修正するクエリ修正手段、
修正された検索クエリに基づいて前記検索データベースを検索する第2検索手段
として機能させる検索制御プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010292481A JP5179564B2 (ja) | 2010-12-28 | 2010-12-28 | クエリセグメント位置決定装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010292481A JP5179564B2 (ja) | 2010-12-28 | 2010-12-28 | クエリセグメント位置決定装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012141681A JP2012141681A (ja) | 2012-07-26 |
JP5179564B2 true JP5179564B2 (ja) | 2013-04-10 |
Family
ID=46677941
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010292481A Active JP5179564B2 (ja) | 2010-12-28 | 2010-12-28 | クエリセグメント位置決定装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5179564B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6571053B2 (ja) * | 2016-08-15 | 2019-09-04 | 株式会社トヨタマップマスター | 施設検索装置、施設検索方法、コンピュータプログラム及びコンピュータプログラムを記録した記録媒体 |
JP6577925B2 (ja) * | 2016-09-20 | 2019-09-18 | 株式会社トヨタマップマスター | 施設検索装置、施設検索方法、コンピュータプログラム及びコンピュータプログラムを記録した記録媒体 |
JP6813776B2 (ja) * | 2016-10-27 | 2021-01-13 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、その制御方法及びプログラム |
JP7258988B2 (ja) * | 2019-02-08 | 2023-04-17 | ヤフー株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003005776A (ja) * | 2001-06-21 | 2003-01-08 | Nec Corp | 音声合成装置 |
JP2006079454A (ja) * | 2004-09-10 | 2006-03-23 | Fujitsu Ltd | 検索キーワード分析方法、検索キーワード分析プログラムおよび検索キーワード分析装置 |
JP5041802B2 (ja) * | 2006-12-26 | 2012-10-03 | ヤフー株式会社 | クエリ分析サーバ、評価観点語データベース及び語句データベース生成方法 |
JP5314493B2 (ja) * | 2009-05-15 | 2013-10-16 | 日本電信電話株式会社 | 情報検索方法、情報検索装置、情報検索プログラム |
-
2010
- 2010-12-28 JP JP2010292481A patent/JP5179564B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012141681A (ja) | 2012-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2798540B1 (en) | Extracting search-focused key n-grams and/or phrases for relevance rankings in searches | |
US7769771B2 (en) | Searching a document using relevance feedback | |
JP4961043B2 (ja) | 関連性に基づくユーザー・ブラウザー履歴のソーティング | |
US8713024B2 (en) | Efficient forward ranking in a search engine | |
CA2638558C (en) | Topic word generation method and system | |
US8332208B2 (en) | Information processing apparatus, information processing method, and program | |
KR20100047221A (ko) | 사전 단어 및 어구 판정 | |
JP2009525520A (ja) | 検索結果リストにおける電子文書を関連性に基づきランク付けおよびソートする評価方法、およびデータベース検索エンジン | |
KR20070092755A (ko) | 로컬 항목 추출 | |
JP5179564B2 (ja) | クエリセグメント位置決定装置 | |
CN105550217B (zh) | 场景音乐搜索方法及场景音乐搜索装置 | |
JP2000200281A (ja) | 情報検索装置および情報検索方法ならびに情報検索プログラムを記録した記録媒体 | |
JP2001265774A (ja) | 情報検索方法、装置、および情報検索プログラムを記録した記録媒体、ハイパーテキスト情報検索システム | |
JP2010123036A (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
JP2008077252A (ja) | 文書ランキング方法、文書検索方法、文書ランキング装置、文書検索装置、及び記録媒体 | |
JP5364529B2 (ja) | 辞書登録装置、文書ラベル判定システムおよび辞書登録プログラム | |
JP2012104051A (ja) | 文書インデックス作成装置 | |
JP5127553B2 (ja) | 情報処理装置、情報処理方法、プログラム及び記録媒体 | |
JP5332128B2 (ja) | 情報検索装置、情報検索方法およびそのプログラム | |
JP6173958B2 (ja) | 複数のハッシュテーブルを用いて検索するプログラム、装置及び方法 | |
JP4959032B1 (ja) | ウェブページ解析装置およびウェブページ解析用プログラム | |
JP4426893B2 (ja) | 文書検索方法、文書検索プログラムおよびこれを実行する文書検索装置 | |
JP2010282403A (ja) | 文書検索方法 | |
US8005845B2 (en) | System and method for automatically ranking lines of text | |
JP5199168B2 (ja) | 検索装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121213 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121218 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130109 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5179564 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |