KR20040039691A - 정보 검색 시스템의 인덱싱 방법 - Google Patents
정보 검색 시스템의 인덱싱 방법 Download PDFInfo
- Publication number
- KR20040039691A KR20040039691A KR1020020067836A KR20020067836A KR20040039691A KR 20040039691 A KR20040039691 A KR 20040039691A KR 1020020067836 A KR1020020067836 A KR 1020020067836A KR 20020067836 A KR20020067836 A KR 20020067836A KR 20040039691 A KR20040039691 A KR 20040039691A
- Authority
- KR
- South Korea
- Prior art keywords
- document
- information
- index
- posting list
- keyword
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
- G06F16/319—Inverted lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (5)
- 정보 검색 시스템에서, 클라이언트로부터 요청되는 문서에 대한 검색 정보를 제공하기 위하여, 문서에 대한 인덱싱을 수행함에 있어,해당 키워드를 갖는 문서를 검색할 수 있도록, 해당 키워드를 갖는 문서의 위치 정보를 제공하는 포스팅 리스트를 구비하는 역 인덱스 구조의 키워드 인덱스를 생성하고,문서 식별자로부터 해당 포스팅 리스트의 위치를 검색할 수 있도록, 상기 포스팅 리스트의 위치 정보를 제공하는 문서 인덱스를 생성하는 것을 특징으로 하는 정보 검색 시스템의 인덱싱 방법.
- 정보 검색 시스템에서, 클라이언트로부터 요청되는 문서에 대한 검색 정보를 제공하기 위하여, 추가되는 문서에 대한 인덱싱을 수행함에 있어,추가되는 문서에 대한 키워드를 추출하고, 추출된 키워드를 포함하는 문서 정보를 삽입할 포스팅 리스트를 검색하고, 검색된 포스팅 리스트의 존재 여부를 판단하는 단계와,상기 판단 결과, 상기 검색된 포스팅 리스트가 존재하지 않으면, 키워드 인덱스에 새로운 포스팅 리스트를 생성하고, 포스팅 리스트의 위치 리스트에 생성된 포스팅 리스트의 위치 정보를 추가하고, 문서 인덱스에 해당 키워드를 포함하는 문서의 식별자 정보를 추가하는 단계를 포함하는 것을 특징으로 하는 정보 검색 시스템의 인덱싱 방법.
- 제 2항에 있어서,상기 검색된 포스팅 리스트의 존재 여부를 판단한 결과, 검색된 포스팅 리스트가 존재하는 경우에는, 문서 인덱스에 해당 키워드를 포함하는 문서의 식별자 정보를 추가하는 것을 특징으로 하는 정보 검색 시스템의 인덱싱 방법.
- 정보 검색 시스템에서, 클라이언트로부터 요청되는 문서에 대한 검색 정보를 제공하기 위하여, 삭제되는 문서에 대한 인덱싱을 수행함에 있어,문서 인덱스를 통해 삭제될 문서에 포함된 키워드들의 포스팅 리스트를 검색하고, 각 포스팅 리스트 내에 있는 해당 문서 정보를 삭제하고, 각 포스팅 리스트 내에 다른 문서 정보가 존재하는 지의 여부를 판단하는 단계와;상기 판단 결과, 상기 각 포스팅 리스트 내에 다른 문서 정보가 더 이상 존재하지 않는 경우에는 키워드 인덱스에서 포스팅 리스트를 삭제하고, 포스팅 리스트의 위치 리스트에서 해당 항목을 삭제하며, 문서 인덱스에서 삭제된 문서의 식별자 정보를 삭제하는 단계; 를 포함하는 것을 특징으로 하는 정보 검색 시스템의 인덱싱 방법.
- 제 4항에 있어서,상기 포스팅 리스트 내에 다른 문서의 존재 여부를 판단한 결과, 다른 문서가 존재하는 경우에는, 문서 인덱스에서 삭제할 문서의 식별자 정보를 삭제하는 것을 특징으로 하는 정보 검색 시스템의 인덱싱 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020020067836A KR20040039691A (ko) | 2002-11-04 | 2002-11-04 | 정보 검색 시스템의 인덱싱 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020020067836A KR20040039691A (ko) | 2002-11-04 | 2002-11-04 | 정보 검색 시스템의 인덱싱 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20040039691A true KR20040039691A (ko) | 2004-05-12 |
Family
ID=37337233
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020020067836A KR20040039691A (ko) | 2002-11-04 | 2002-11-04 | 정보 검색 시스템의 인덱싱 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20040039691A (ko) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100811838B1 (ko) * | 2006-07-31 | 2008-03-10 | (주)닷넷소프트 | 정보 검색 장치 및 그 제어 방법 |
CN100423005C (zh) * | 2005-09-30 | 2008-10-01 | 国际商业机器公司 | 索引实体的方法和系统 |
KR100920745B1 (ko) * | 2008-03-04 | 2009-10-07 | 재단법인대구경북과학기술원 | 질의 처리 방법, 역 리스트 관리 방법, 역 리스트 관리를위한 압축 방법, 및 구문 역 리스트 관리 방법 |
KR100990047B1 (ko) * | 2008-12-19 | 2010-10-26 | 재단법인대구경북과학기술원 | 플래시 메모리에 저장된 텍스트 데이터의 인덱싱 장치 및 방법 |
KR20150127729A (ko) * | 2012-12-21 | 2015-11-17 | 페이스북, 인크. | 추출 연산자 |
US9792315B2 (en) | 2014-08-21 | 2017-10-17 | Dropbox, Inc. | Multi-user search system with methodology for bypassing instant indexing |
US9959357B2 (en) | 2015-01-30 | 2018-05-01 | Dropbox, Inc. | Personal content item searching system and method |
US10394910B2 (en) | 2015-01-30 | 2019-08-27 | Dropbox, Inc. | Personal content item searching system and method |
KR20210071096A (ko) * | 2019-10-16 | 2021-06-15 | 쿠팡 주식회사 | 제품 추천을 제공하기 위한 컴퓨터화된 시스템 및 방법 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0944521A (ja) * | 1995-07-25 | 1997-02-14 | Fuji Xerox Co Ltd | インデックス作成装置および文書検索装置 |
KR19990070838A (ko) * | 1998-02-25 | 1999-09-15 | 윤덕용 | 데이터 베이스 관리 시스템과 정보 검색의 밀결합을 위하여 서브 인덱스와 대용량 객체를 이용한 역 인덱스 저장 구조 |
KR20010002567A (ko) * | 1999-06-16 | 2001-01-15 | 맹성현 | 정보검색 시스템의 하부저장구조 관리장치 및 그 정보 저장/검색 방법 |
-
2002
- 2002-11-04 KR KR1020020067836A patent/KR20040039691A/ko not_active Application Discontinuation
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0944521A (ja) * | 1995-07-25 | 1997-02-14 | Fuji Xerox Co Ltd | インデックス作成装置および文書検索装置 |
KR19990070838A (ko) * | 1998-02-25 | 1999-09-15 | 윤덕용 | 데이터 베이스 관리 시스템과 정보 검색의 밀결합을 위하여 서브 인덱스와 대용량 객체를 이용한 역 인덱스 저장 구조 |
KR20010002567A (ko) * | 1999-06-16 | 2001-01-15 | 맹성현 | 정보검색 시스템의 하부저장구조 관리장치 및 그 정보 저장/검색 방법 |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100423005C (zh) * | 2005-09-30 | 2008-10-01 | 国际商业机器公司 | 索引实体的方法和系统 |
KR100811838B1 (ko) * | 2006-07-31 | 2008-03-10 | (주)닷넷소프트 | 정보 검색 장치 및 그 제어 방법 |
KR100920745B1 (ko) * | 2008-03-04 | 2009-10-07 | 재단법인대구경북과학기술원 | 질의 처리 방법, 역 리스트 관리 방법, 역 리스트 관리를위한 압축 방법, 및 구문 역 리스트 관리 방법 |
KR100990047B1 (ko) * | 2008-12-19 | 2010-10-26 | 재단법인대구경북과학기술원 | 플래시 메모리에 저장된 텍스트 데이터의 인덱싱 장치 및 방법 |
KR20150127729A (ko) * | 2012-12-21 | 2015-11-17 | 페이스북, 인크. | 추출 연산자 |
US10061846B2 (en) | 2012-12-21 | 2018-08-28 | Facebook, Inc. | Extract operator |
US9984110B2 (en) | 2014-08-21 | 2018-05-29 | Dropbox, Inc. | Multi-user search system with methodology for personalized search query autocomplete |
US9977810B2 (en) | 2014-08-21 | 2018-05-22 | Dropbox, Inc. | Multi-user search system with methodology for personal searching |
US9792315B2 (en) | 2014-08-21 | 2017-10-17 | Dropbox, Inc. | Multi-user search system with methodology for bypassing instant indexing |
US10102238B2 (en) | 2014-08-21 | 2018-10-16 | Dropbox, Inc. | Multi-user search system using tokens |
US10579609B2 (en) | 2014-08-21 | 2020-03-03 | Dropbox, Inc. | Multi-user search system with methodology for bypassing instant indexing |
US10817499B2 (en) | 2014-08-21 | 2020-10-27 | Dropbox, Inc. | Multi-user search system with methodology for personal searching |
US10853348B2 (en) | 2014-08-21 | 2020-12-01 | Dropbox, Inc. | Multi-user search system with methodology for personalized search query autocomplete |
US9959357B2 (en) | 2015-01-30 | 2018-05-01 | Dropbox, Inc. | Personal content item searching system and method |
US10394910B2 (en) | 2015-01-30 | 2019-08-27 | Dropbox, Inc. | Personal content item searching system and method |
US10977324B2 (en) | 2015-01-30 | 2021-04-13 | Dropbox, Inc. | Personal content item searching system and method |
US11120089B2 (en) | 2015-01-30 | 2021-09-14 | Dropbox, Inc. | Personal content item searching system and method |
KR20210071096A (ko) * | 2019-10-16 | 2021-06-15 | 쿠팡 주식회사 | 제품 추천을 제공하기 위한 컴퓨터화된 시스템 및 방법 |
US11354721B2 (en) | 2019-10-16 | 2022-06-07 | Coupang Corp. | Computerized systems and methods for providing product recommendations |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6898592B2 (en) | Scoping queries in a search engine | |
US7849063B2 (en) | Systems and methods for indexing content for fast and scalable retrieval | |
US20100145918A1 (en) | Systems and methods for indexing content for fast and scalable retrieval | |
US9020951B2 (en) | Methods for indexing and searching based on language locale | |
US9405784B2 (en) | Ordered index | |
JP2007102786A (ja) | 大規模フルテキスト・インデックスでタキソノミーにインデックスを付け、探索することをサポートする方法、装置およびシステム | |
EP2172853A1 (en) | Database index and database for indexing text documents | |
CN111400323A (zh) | 数据检索方法、系统、设备及存储介质 | |
US20110113052A1 (en) | Query result iteration for multiple queries | |
JP4237813B2 (ja) | 構造化文書管理システム | |
KR20040039691A (ko) | 정보 검색 시스템의 인덱싱 방법 | |
KR100269114B1 (ko) | 캐쉬 운영방법 | |
US20100205175A1 (en) | Cap-sensitive text search for documents | |
KR20000071937A (ko) | 사이트 정보 데이터베이스 구축을 통한 인터넷 상에서의정보 검색 방법 | |
US8818990B2 (en) | Method, apparatus and computer program for retrieving data | |
US9020995B2 (en) | Hybrid relational, directory, and content query facility | |
JP4091586B2 (ja) | 構造化文書管理システム、索引構築方法及びプログラム | |
KR100353112B1 (ko) | 정보검색 시스템의 하부저장구조 관리장치 및 그 정보 저장/검색 방법 | |
US20130091166A1 (en) | Method and apparatus for indexing information using an extended lexicon | |
KR100434718B1 (ko) | 문서 색인 시스템 및 그 방법 | |
JP4160627B2 (ja) | 構造化文書管理システム及びプログラム | |
JP4304226B2 (ja) | 構造化文書管理システム、構造化文書管理方法及びプログラム | |
JP4550876B2 (ja) | 構造化文書検索システム及びプログラム | |
KR100440906B1 (ko) | 문서 색인 시스템 및 그 방법 | |
EP1677208A1 (en) | Method and system for searching for data objects |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20021104 |
|
PG1501 | Laying open of application | ||
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20071105 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20021104 Comment text: Patent Application |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20090317 Patent event code: PE09021S01D |
|
E601 | Decision to refuse application | ||
PE0601 | Decision on rejection of patent |
Patent event date: 20090529 Comment text: Decision to Refuse Application Patent event code: PE06012S01D Patent event date: 20090317 Comment text: Notification of reason for refusal Patent event code: PE06011S01I |