JP7626924B2 - 情報処理システム、情報処理方法、プログラム - Google Patents
情報処理システム、情報処理方法、プログラム Download PDFInfo
- Publication number
- JP7626924B2 JP7626924B2 JP2020218462A JP2020218462A JP7626924B2 JP 7626924 B2 JP7626924 B2 JP 7626924B2 JP 2020218462 A JP2020218462 A JP 2020218462A JP 2020218462 A JP2020218462 A JP 2020218462A JP 7626924 B2 JP7626924 B2 JP 7626924B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- search
- search query
- processing unit
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 17
- 238000003672 processing method Methods 0.000 title claims description 7
- 230000000295 complement effect Effects 0.000 claims description 13
- 238000012545 processing Methods 0.000 description 94
- 238000000034 method Methods 0.000 description 64
- 230000008569 process Effects 0.000 description 62
- 239000013598 vector Substances 0.000 description 42
- 238000010586 diagram Methods 0.000 description 19
- 230000006870 function Effects 0.000 description 16
- 238000013500 data storage Methods 0.000 description 8
- 238000013077 scoring method Methods 0.000 description 7
- 238000012546 transfer Methods 0.000 description 6
- 238000013515 script Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013404 process transfer Methods 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
次に図4のフローチャートを用いて、本発明の実施形態における全文検索装置が実行する学習処理について説明する。
また各フィールドは、検索語や登録文書の単語の識別方法(形態素解析、n-gramなど)やスコアリングの方法(tf・idfやBM25など)に応じた複数のインデックスを持つことを可能とする。
ステップS405では、学習処理部301は、ステップS404の学習結果である学習モデルを学習データ保存領域302における学習モデル保存テーブル502に保存する。
次に図7のフローチャートを用いて、前述したステップS402の検索クエリフィールド追加処理について説明する。
(学習データ生成処理)
次に図8のフローチャートを用いて、前述したステップS403の学習データ生成処理について説明する。
次に図9のフローチャートを用いて、前述したステップS803における検索処理部304の検索クエリに対する特徴ベクトル生成処理について説明する。
次に、学習処理の具体例として、図10に示す閲覧履歴保存テーブル501および図11に示す文書保存テーブル601に対して、図4に示す学習処理が実施された場合について説明する。
ステップS701では、学習処理部301は、文書保存テーブル601に検索クエリフィールド1101を追加する。
ステップS706では、学習処理部301は、文書保存テーブル601の登録文書1102に対して、ステップS708までの繰り返し処理を開始する。
次に図18のフローチャートを用いて、ステップS404で獲得した学習モデルを用いた検索処理について説明する。
次に、検索処理の具体例として、閲覧履歴に含まれない文書d2を対象とした検索クエリ「スクリプトの編集について」に対して、図16に示した学習モデルを用い、図18に示す検索処理が実施した場合について説明する。
本発明は、例えば、システム、装置、方法、プログラムもしくは記録媒体等としての実施態様をとることが可能である。具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
110 クライアント端末
120 LAN
Claims (6)
- 文書に、当該文書が検索された際の検索クエリを補完情報として対応付けて記憶し、前記検索クエリが存在しない文書については、当該文書の内容に基づく情報を補完情報として対応付けて記憶する記憶手段と、
ユーザから受け付けた検索クエリを用いて、前記記憶手段に記憶された文書の内容と、当該文書に対応付けて記憶された補完情報とを検索対象として検索を行う検索手段と、
を備えることを特徴とする情報処理システム。 - 前記記憶手段は、前記検索クエリが存在しない文書について、当該文書における複数の項目に係る内容を結合した情報を補完情報として、当該文書に対応付けて記憶することを特徴とする請求項1に記載の情報処理システム。
- 前記記憶手段は、前記検索クエリが存在しない文書について、当該文書から抽出した特徴語を補完情報として、当該文書に対応付けて記憶することを特徴とする請求項1または2に記載の情報処理システム。
- 前記記憶手段は、前記文書が検索され閲覧された場合に、当該文書が検索された際の検索クエリを補完情報として対応付けて記憶することを特徴とする請求項1乃至3のいずれか1項に記載の情報処理システム。
- 情報処理システムの記憶手段が、文書に、当該文書が検索された際の検索クエリを補完情報として対応付けて記憶し、前記検索クエリが存在しない文書については、当該文書の内容に基づく情報を補完情報として対応付けて記憶する記憶工程と、
前記情報処理システムの検索手段が、ユーザから受け付けた検索クエリを用いて、前記記憶手段に記憶された文書の内容と、当該文書に対応付けて記憶された補完情報とを検索対象として検索を行う検索工程と、
を備えることを特徴とする情報処理方法。 - コンピュータを、請求項1乃至4のいずれか1項に記載の各手段として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020218462A JP7626924B2 (ja) | 2020-12-28 | 2020-12-28 | 情報処理システム、情報処理方法、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020218462A JP7626924B2 (ja) | 2020-12-28 | 2020-12-28 | 情報処理システム、情報処理方法、プログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2022103684A JP2022103684A (ja) | 2022-07-08 |
JP2022103684A5 JP2022103684A5 (ja) | 2024-01-22 |
JP7626924B2 true JP7626924B2 (ja) | 2025-02-05 |
Family
ID=82279540
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020218462A Active JP7626924B2 (ja) | 2020-12-28 | 2020-12-28 | 情報処理システム、情報処理方法、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7626924B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004145706A (ja) | 2002-10-25 | 2004-05-20 | Canon Inc | マルチメディアデータ検索システム |
JP2013033488A (ja) | 2012-09-21 | 2013-02-14 | Panasonic Healthcare Co Ltd | 検索システム |
-
2020
- 2020-12-28 JP JP2020218462A patent/JP7626924B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004145706A (ja) | 2002-10-25 | 2004-05-20 | Canon Inc | マルチメディアデータ検索システム |
JP2013033488A (ja) | 2012-09-21 | 2013-02-14 | Panasonic Healthcare Co Ltd | 検索システム |
Also Published As
Publication number | Publication date |
---|---|
JP2022103684A (ja) | 2022-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11693864B2 (en) | Methods of and systems for searching by incorporating user-entered information | |
CN107402954B (zh) | 建立排序模型的方法、基于该模型的应用方法和装置 | |
RU2628200C2 (ru) | Обеспечение руководства тематическим поиском | |
US7861149B2 (en) | Key phrase navigation map for document navigation | |
US9846744B2 (en) | Media discovery and playlist generation | |
JP5497022B2 (ja) | 入力文字列からのリソースロケータの提案 | |
CN102625936B (zh) | 来自文档的查询建议 | |
US7958128B2 (en) | Query-independent entity importance in books | |
KR101554293B1 (ko) | 교차 언어 정보 검색 | |
US7769771B2 (en) | Searching a document using relevance feedback | |
US9613003B1 (en) | Identifying topics in a digital work | |
US20090055394A1 (en) | Identifying key terms related to similar passages | |
EP2727026A2 (en) | Exposing search history by category | |
CN109952571B (zh) | 基于上下文的图像搜索结果 | |
JP2022069790A (ja) | 情報処理装置、情報処理方法、プログラム | |
JP7626924B2 (ja) | 情報処理システム、情報処理方法、プログラム | |
US20130036354A1 (en) | Music interface | |
JP7614705B2 (ja) | 情報処理システム、情報処理方法、プログラム | |
JP7545061B2 (ja) | 情報処理システム、情報処理方法、プログラム | |
JP7174268B2 (ja) | 情報処理システム、情報処理装置、情報処理方法、プログラム | |
JP7587171B2 (ja) | 情報処理装置、制御方法、プログラム | |
JP2006163645A (ja) | 情報検索方法、情報検索装置、情報検索プログラム及びコンピュータで読み取り可能な記録媒体並びに記録した機器 | |
JP2023078847A (ja) | 文書管理装置、文書管理方法及び文書管理プログラム | |
JP2024062159A (ja) | 情報処理装置、制御方法、プログラム | |
Reddy et al. | Cross lingual information retrieval using search engine and data mining |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231227 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240112 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20241108 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20241224 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250106 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7626924 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |