KR100414236B1 - 데이터의 검색을 위한 서치 시스템 및 방법 - Google Patents
데이터의 검색을 위한 서치 시스템 및 방법 Download PDFInfo
- Publication number
- KR100414236B1 KR100414236B1 KR10-2001-7000436A KR20017000436A KR100414236B1 KR 100414236 B1 KR100414236 B1 KR 100414236B1 KR 20017000436 A KR20017000436 A KR 20017000436A KR 100414236 B1 KR100414236 B1 KR 100414236B1
- Authority
- KR
- South Korea
- Prior art keywords
- word
- sequence
- text
- query
- search
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3346—Query execution using probabilistic model
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99935—Query augmenting and refining, e.g. inexact access
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99936—Pattern matching access
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99937—Sorting
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Radar Systems Or Details Thereof (AREA)
- Automobile Manufacture Line, Endless Track Vehicle, Trailer (AREA)
- Liquid Crystal Substances (AREA)
Abstract
Description
Claims (14)
- 텍스트(T)의 형태로 저장된 정보를 포함하는 정보 검색(retrieve)을 위한 서치(search) 시스템으로서,상기 텍스트(T)는 워드 및/또는 심볼(s) 및 그들의 시퀀스(S)를 포함하고,상기 정보 검색은 워드 및/또는 심볼(q) 및 그들의 시퀀스들(P)을 포함하는 쿼리(Q;query)와 상기 텍스트(T)로부터의 워드 및/또는 심볼 및 그들의 시퀀스들을 포함하는 검색된 정보(R) 사이의 고정되어 있거나 혹은 변화하는 매칭도에 따라 발생하고,상기 서치 시스템은 상기 텍스트(T)의 적어도 일부분을 저장하기 위한 데이터 구조 및 쿼리(Q)와 검색된 정보(R) 사이의 매칭도를 측정하는 메트릭(metric;M)을 포함하고, 상기 서치 시스템은 서치, 특히 키워드(kw)를 기초로 전문 서치를 수행하기 위한 서치 알고리즘을 구현하는 서치 시스템으로서,상기 데이터 구조는 상기 텍스트(T) 내의 워드 및/또는 심볼들(s) 및 그들의 시퀀스들(S)의 접미어들을 저장하기 위한 비균일한(non-evenly) 간격의 희소(sparse) 접미어 트리 ST(T) 형태의 트리 구조를 포함하고,상기 메트릭(M)은 텍스트(T)내의 각각의 워드 및/또는 심볼들(s;q)과 쿼리(Q) 사이의 근사 매칭도에 대한 편집 거리 메트릭 D(s,q) 및 상기 텍스트(T) 내의 워드 및/또는 심볼들(q)의 시퀀스들(S)과 상기 쿼리(Q) 내의 워드 및/또는 심볼들의 쿼리 시퀀스(P) 사이의 근사 매칭도에 대한 편집 거리 메트릭 DWS(S,P)의 조합을 포함하고, 후자인 상기 편집 거리 메트릭은 텍스트(T) 내의 워드 및/또는 심볼들(s)의 시퀀스(S)를 쿼리(Q)내의 워드 및/또는 심볼들(q)의 시퀀스(P)로 변환하는 편집 연산을 위한 가중 코스트 함수(weighting cost function)를 포함하고, 상기 가중치 부여는 변환에서의 시퀀스 길이(S)의 변화에 비례하거나 매칭될 시퀀스(S;P) 내의 워드 및/또는 심볼(s;q)의 크기에 종속인 값과 함께 발생하고,상기 구현된 서치 알고리즘은 텍스트(T) 및 쿼리(Q) 각각의 접미어 트리 표현내의 워드 및/또는 심볼(s;q) 사이의 매칭도를 결정하기 위한 제1 알고리즘과 텍스트(T) 및 쿼리(Q) 각각의 접미어 트리 표현내의 워드 및/또는 심볼(s;q)의 시퀀스들(S;P) 사이의 매칭도를 결정하기 위한 제2 알고리즘을 포함하고, 상기 제1 및/또는 제2 알고리즘은 워드, 심볼, 워드의 시퀀스 또는 심볼의 시퀀스 또는 그들의 조합 중 한 형태의 쿼리(Q)에 의해 데이터 구조를 서치하여, 정보(R)가 전자 및 후자 사이에서 특정 매칭도를 갖는 쿼리(Q)를 기초로 검색토록 하며,상기 서치 알고리즘은 또한 선택적으로 각각 텍스트(T) 및 쿼리(Q)의 접미어 트리 표현내의 워드 및/또는 심볼들(s;q) 사이의 완전 매칭을 결정하기 위한 제3 알고리즘 및/또는 각각 텍스트(T) 및 쿼리(Q)의 접미어 트리 표현내의 워드 및/또는 심볼(s;q)의 시퀀스들(S;P) 사이의 완전 매칭을 결정하기 위한 제4 알고리즘을 포함하고, 상기 제3 및/또는 제4 알고리즘은 워드, 심볼, 워드의 시퀀스 또는 심볼의 시퀀스 또는 그들의 조합 중 하나의 형태인 쿼리(Q)에 의해 데이터 구조를 서치하여, 정보(R)가 상기 쿼리(Q) 및 상기 정보(R) 사이에서 완전 매칭을 갖는 쿼리(Q)를 기초로 검색되는 것을 특징으로 하는 서치 시스템.
- 제1항에 있어서, 상기 비균일한 간격의 희소 접미어 트리 ST(T)는 텍스트(T)내에 오직 접미어 부분 집합만을 포함하는 워드-간격의 희소 접미어 트리 SSTWS(T)인 것을 특징으로 하는 서치 시스템.
- 제2항에 있어서, 상기 워드-간격의 희소 접미어 트리 SSTWS(T)는 키워드-간격의 희소 접미어 트리 SSTKWS(T)인 것을 특징으로 하는 서치 시스템.
- 제3항에 있어서, 상기 키워드-간격의 희소 접미어 트리 SSTKWS(T)에서의 키워드 매칭도를 검출하기 위한 제1 알고리즘은 다음과 같은 의사-코드(pseudo-code)로 구현되는 것을 특징으로 하는 서치 시스템.
- 제3항에 있어서, 상기 키워드-간격의 희소 접미어 트리 SSTKWS(T)에서의 키워드 시퀀스 매칭도를 결정하기 위한 제2 알고리즘은 다음과 같은 의사-코드로 구현되는 것을 특징으로 하는 서치 시스템.
- 제5항에 있어서, 상기 제2 알고리즘의 상기 ApproxMatchRest 서브 루틴은 다음과 같은 의사 코드로 구현되는 것을 특징으로 하는 서치 시스템.
- 제3항에 있어서, 상기 키워드-간격의 희소 접미어 트리 SSTKWS(T)에서 완전 키워드 매칭을 결정하기 위한 제3 알고리즘은 다음과 같은 의사-코드로 구현되는 것을 특징으로 하는 서치 시스템.
- 제3항에 있어서, 상기 키워드-간격의 희소 접미어 트리 SSTKWS(T)에서의 완전 키워드 시퀀스 매칭을 결정하기 위한 제4 알고리즘은 다음과 같은 의사-코드로 구현되는 것을 특징으로 하는 서치 시스템.
- 텍스트(T)의 형태로 저장된 정보를 포함하는 정보를 검색하기 위한 서치(search) 시스템에서 정보를 검색하기 위한 방법으로서,상기 텍스트(T)는 워드, 심볼(s) 및 그들의 시퀀스(S)를 포함하고,상기 정보 검색은 워드 및/또는 심볼(q) 및 그들의 시퀀스들(P)을 포함하는 쿼리(Q)와 텍스트(T)로부터의 워드 및/또는 심볼 및 그들의 시퀀스들을 포함하는 검색된 정보(R) 사이의 고정되어 있거나 혹은 변화하는 매칭도에 따라 발생하고,상기 서치 시스템은 상기 텍스트(T)의 적어도 일부분을 저장하기 위한 데이터 구조 및 쿼리(Q)와 검색된 정보(R) 사이의 매칭도를 측정하는 메트릭(M)을 포함하고,상기 서치 시스템은 서치, 특히 키워드(kw)를 기초로한 전문 검색을 수행하기 위한 서치 알고리즘을 구현하고,상기 텍스트(T)에서의 정보는 워드(s) 및 워드 시퀀스(S)들로 분할되고, 상기 워드는 워드 경계 텀(word boundary term)에 의해 분리된 전체 텍스트의 하위 스트링이며 또한 심볼의 시퀀스를 형성하고,각 워드는 심볼의 시퀀스로서 구조화 되는 방법으로서,상기 데이터 구조를 텍스트(T)의 워드 분리 심볼(word separator symbol)에서 시작하는 모든 접미어를 표현하기 위한 텍스트(T)의 워드-간격의 희소 접미어 트리 SSTWS(T)로서 발생시키는 단계;상기 텍스트(T)내 워드(s)의 시퀀스 정보를 상기 워드-간격의 희소 접미어 트리 SSTWS(T)에 저장하는 단계;상기 텍스트(T)의 워드(s)와 상기 쿼리(Q)의 쿼리 워드(q)에 대한 편집 거리 메트릭 D(s,q) 및 상기 텍스트(T)내의 워드(s)의 시퀀스(S)와 상기 쿼리(Q)내의 워드(q)의 시퀀스(P)에 대한 워드 크기-종속 편집 거리 메트릭 DWS(S,P)을 포함하는 결합된 편집 거리 메트릭(M)을 발생시키고,상기 편집 거리 메트릭 DWS(S,P)은 상기 시퀀스(S)를 시퀀스(P)로 변환하는 편집 연산에 대한 코스트의 최소합이며,코스트의 최소합은 시퀀스(S)의 총 길이 변화에 비례하는 파라미터 또는 현재 워드 길이와 시퀀스(S;P)의 평균 길이와의 비율에 의해, 가중된 각각의 편집 연산에 대한 코스트 함수의 최소합인 단계; 및검색된 정보(R)의 워드(s)와 쿼리(Q)의 워드(q) 사이의 편집 거리 D(s,q)를 계산하므로써 워드(s,q) 사이의 매칭도를 결정하거나,상기 워드(s,q)가 서로 k개 이상의 에러를 갖는 경우에는 모든 매칭에 대한 편집 거리 DWS(SR,PQ)를 계산하므로써 검색된 정보(R) 및 쿼리(Q) 각각의 워드 시퀀스들(SR,PQ) 사이의 매칭도를 결정하는 단계를 포함하는 것을 특징으로 하는 정보 검색 방법.
- 제9항에 있어서, 워드(s;q) 사이의 근접성(proximity)에 대한 파라미터로 워드(s)를 워드(q)로 변경시키는 편집 연산에 가중치를 주므로써, 당해 편집 연산의 코스트을 결정할때 워드(s;q)의 유사성을 고려하는 것을 특징으로 하는 정보 검색 방법.
- 제9항에 있어서, 쿼리 워드 시퀀스(PQ)내의 제한된 워드수에 대한 편집 거리 DWS(SR,PQ)를 계산하므로써 매칭수를 제한하는 것을 특징으로 하는 정보 검색 방법.
- 제9항에 있어서, 워드들(s)과 워드(q) 사이의 상기 편집 거리 D(s,q)를 순환적으로(recursively) 정의하고, 동적 프로그래밍 과정에 의해 상기 편집 거리 D(s,q)를 계산하는 것을 특징으로 하는 정보 검색 방법.
- 제9항에 있어서, 시퀀스(S) 및 시퀀스(P) 사이의 편집거리 DWS(S,P)를 순환적으로 정의하고 동적 프로그래밍 과정에 의해 상기 편집 거리 DWS(S,P)를 계산하는 것을 특징으로 하는 정보 검색 방법.
- 제1항에 있어서, 상기 서치 시스템은 근사(approximate) 서치 엔진에서 사용되는 것을 특징으로 하는 서치 시스템.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
NO19983175 | 1998-07-10 | ||
NO983175A NO983175L (no) | 1998-07-10 | 1998-07-10 | Soekesystem for gjenfinning av data |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20010071841A KR20010071841A (ko) | 2001-07-31 |
KR100414236B1 true KR100414236B1 (ko) | 2004-01-07 |
Family
ID=19902243
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR10-2001-7000436A KR100414236B1 (ko) | 1998-07-10 | 1999-07-09 | 데이터의 검색을 위한 서치 시스템 및 방법 |
Country Status (20)
Country | Link |
---|---|
US (1) | US6377945B1 (ko) |
EP (1) | EP1095326B1 (ko) |
JP (1) | JP3581652B2 (ko) |
KR (1) | KR100414236B1 (ko) |
CN (1) | CN1317114A (ko) |
AT (1) | ATE212736T1 (ko) |
AU (2) | AU772525B2 (ko) |
BR (1) | BR9912015B1 (ko) |
CA (1) | CA2337079C (ko) |
DE (1) | DE69900854T2 (ko) |
DK (1) | DK1095326T3 (ko) |
ES (1) | ES2173752T3 (ko) |
HK (1) | HK1040784A1 (ko) |
HU (1) | HUP0201630A2 (ko) |
IL (1) | IL140606A0 (ko) |
IS (1) | IS5796A (ko) |
NO (1) | NO983175L (ko) |
PL (1) | PL345714A1 (ko) |
PT (1) | PT1095326E (ko) |
WO (1) | WO2000003315A2 (ko) |
Families Citing this family (124)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6564206B1 (en) * | 1998-10-05 | 2003-05-13 | Canon Kabushiki Kaisha | Information search apparatus and method, and storage medium |
US6584465B1 (en) * | 2000-02-25 | 2003-06-24 | Eastman Kodak Company | Method and system for search and retrieval of similar patterns |
US7127450B1 (en) * | 2000-05-02 | 2006-10-24 | International Business Machines Corporation | Intelligent discard in information access system |
US6745181B1 (en) * | 2000-05-02 | 2004-06-01 | Iphrase.Com, Inc. | Information access method |
US6704728B1 (en) | 2000-05-02 | 2004-03-09 | Iphase.Com, Inc. | Accessing information from a collection of data |
US6711561B1 (en) * | 2000-05-02 | 2004-03-23 | Iphrase.Com, Inc. | Prose feedback in information access system |
US8478732B1 (en) | 2000-05-02 | 2013-07-02 | International Business Machines Corporation | Database aliasing in information access system |
US6718325B1 (en) * | 2000-06-14 | 2004-04-06 | Sun Microsystems, Inc. | Approximate string matcher for delimited strings |
US6408277B1 (en) | 2000-06-21 | 2002-06-18 | Banter Limited | System and method for automatic task prioritization |
US8290768B1 (en) | 2000-06-21 | 2012-10-16 | International Business Machines Corporation | System and method for determining a set of attributes based on content of communications |
US9699129B1 (en) | 2000-06-21 | 2017-07-04 | International Business Machines Corporation | System and method for increasing email productivity |
US7080073B1 (en) | 2000-08-18 | 2006-07-18 | Firstrain, Inc. | Method and apparatus for focused crawling |
US7103838B1 (en) * | 2000-08-18 | 2006-09-05 | Firstrain, Inc. | Method and apparatus for extracting relevant data |
US6915294B1 (en) | 2000-08-18 | 2005-07-05 | Firstrain, Inc. | Method and apparatus for searching network resources |
US20020152202A1 (en) * | 2000-08-30 | 2002-10-17 | Perro David J. | Method and system for retrieving information using natural language queries |
GB2368414B (en) * | 2000-10-27 | 2002-09-11 | One Stop To Ltd | Searching procedures |
US7644057B2 (en) * | 2001-01-03 | 2010-01-05 | International Business Machines Corporation | System and method for electronic communication management |
US6681219B2 (en) * | 2001-03-29 | 2004-01-20 | Matsushita Electric Industrial Co., Ltd. | Method for keyword proximity searching in a document database |
US6976016B2 (en) * | 2001-04-02 | 2005-12-13 | Vima Technologies, Inc. | Maximizing expected generalization for learning complex query concepts |
US7136846B2 (en) | 2001-04-06 | 2006-11-14 | 2005 Keel Company, Inc. | Wireless information retrieval |
US7054855B2 (en) * | 2001-07-03 | 2006-05-30 | International Business Machines Corporation | Method and system for performing a pattern match search for text strings |
US7209913B2 (en) * | 2001-12-28 | 2007-04-24 | International Business Machines Corporation | Method and system for searching and retrieving documents |
US7343372B2 (en) * | 2002-02-22 | 2008-03-11 | International Business Machines Corporation | Direct navigation for information retrieval |
US7287026B2 (en) * | 2002-04-05 | 2007-10-23 | Oommen John B | Method of comparing the closeness of a target tree to other trees using noisy sub-sequence tree processing |
US6928445B2 (en) * | 2002-06-25 | 2005-08-09 | International Business Machines Corporation | Cost conversant classification of objects |
FI121583B (fi) * | 2002-07-05 | 2011-01-14 | Syslore Oy | Symbolijonon etsintä |
US6983280B2 (en) * | 2002-09-13 | 2006-01-03 | Overture Services Inc. | Automated processing of appropriateness determination of content for search listings in wide area network searches |
US7970621B2 (en) * | 2002-10-18 | 2011-06-28 | Cerner Innovation, Inc. | Automated order entry system and method |
US20050187913A1 (en) | 2003-05-06 | 2005-08-25 | Yoram Nelken | Web-based customer service interface |
US8495002B2 (en) * | 2003-05-06 | 2013-07-23 | International Business Machines Corporation | Software tool for training and testing a knowledge base |
CA2429909A1 (en) * | 2003-05-27 | 2004-11-27 | Cognos Incorporated | Transformation of tabular and cross-tabulated queries based upon e/r schema into multi-dimensional expression queries |
CN1567303A (zh) * | 2003-07-03 | 2005-01-19 | 富士通株式会社 | 结构文档信息块的自动分割方法和装置 |
US7165119B2 (en) * | 2003-10-14 | 2007-01-16 | America Online, Inc. | Search enhancement system and method having rankings, explicitly specified by the user, based upon applicability and validity of search parameters in regard to a subject matter |
US7640232B2 (en) | 2003-10-14 | 2009-12-29 | Aol Llc | Search enhancement system with information from a selected source |
US7657423B1 (en) * | 2003-10-31 | 2010-02-02 | Google Inc. | Automatic completion of fragments of text |
US7418455B2 (en) * | 2003-11-26 | 2008-08-26 | International Business Machines Corporation | System and method for indexing weighted-sequences in large databases |
US7343378B2 (en) * | 2004-03-29 | 2008-03-11 | Microsoft Corporation | Generation of meaningful names in flattened hierarchical structures |
IL161874A (en) * | 2004-05-07 | 2012-09-24 | Yves Villaret | System and method for searching strings of records |
US20060212441A1 (en) * | 2004-10-25 | 2006-09-21 | Yuanhua Tang | Full text query and search systems and methods of use |
US20080077570A1 (en) * | 2004-10-25 | 2008-03-27 | Infovell, Inc. | Full Text Query and Search Systems and Method of Use |
US20070266406A1 (en) * | 2004-11-09 | 2007-11-15 | Murali Aravamudan | Method and system for performing actions using a non-intrusive television with reduced text input |
US7895218B2 (en) | 2004-11-09 | 2011-02-22 | Veveo, Inc. | Method and system for performing searches for television content using reduced text input |
US20060101504A1 (en) * | 2004-11-09 | 2006-05-11 | Veveo.Tv, Inc. | Method and system for performing searches for television content and channels using a non-intrusive television interface and with reduced text input |
CN1614607B (zh) * | 2004-11-25 | 2011-08-31 | 中国科学院计算技术研究所 | 垃圾邮件过滤的方法和系统 |
CA2509496A1 (en) * | 2005-06-06 | 2006-12-06 | 3618633 Canada Inc. | Search-enhanced trie-based syntactic pattern recognition of sequences |
US9041744B2 (en) | 2005-07-14 | 2015-05-26 | Telecommunication Systems, Inc. | Tiled map display on a wireless device |
US7788266B2 (en) | 2005-08-26 | 2010-08-31 | Veveo, Inc. | Method and system for processing ambiguous, multi-term search queries |
US7779011B2 (en) | 2005-08-26 | 2010-08-17 | Veveo, Inc. | Method and system for dynamically processing ambiguous, reduced text search queries and highlighting results thereof |
US7644054B2 (en) * | 2005-11-23 | 2010-01-05 | Veveo, Inc. | System and method for finding desired results by incremental search using an ambiguous keypad with the input containing orthographic and typographic errors |
US7882119B2 (en) * | 2005-12-22 | 2011-02-01 | Xerox Corporation | Document alignment systems for legacy document conversions |
US7664343B2 (en) * | 2006-01-23 | 2010-02-16 | Lockheed Martin Corporation | Modified Levenshtein distance algorithm for coding |
US7529741B2 (en) | 2006-03-06 | 2009-05-05 | Veveo, Inc. | Methods and systems for segmenting relative user preferences into fine-grain and coarse-grain collections |
US8073860B2 (en) | 2006-03-30 | 2011-12-06 | Veveo, Inc. | Method and system for incrementally selecting and providing relevant search engines in response to a user query |
EP2911071A1 (en) | 2006-04-20 | 2015-08-26 | Veveo, Inc. | User interface methods and systems for selecting and presenting content based on user navigation and selection actions associated with the content |
CN100401300C (zh) * | 2006-04-29 | 2008-07-09 | 上海世纪互联信息系统有限公司 | 具有自动分类功能的搜索引擎 |
US20070260595A1 (en) * | 2006-05-02 | 2007-11-08 | Microsoft Corporation | Fuzzy string matching using tree data structure |
US7849078B2 (en) * | 2006-06-07 | 2010-12-07 | Sap Ag | Generating searchable keywords |
US8577328B2 (en) | 2006-08-21 | 2013-11-05 | Telecommunication Systems, Inc. | Associating metro street address guide (MSAG) validated addresses with geographic map data |
CA2989780C (en) * | 2006-09-14 | 2022-08-09 | Veveo, Inc. | Methods and systems for dynamically rearranging search results into hierarchically organized concept clusters |
JP4274221B2 (ja) * | 2006-10-02 | 2009-06-03 | ソニー株式会社 | 情報処理装置および方法、プログラム、並びに記録媒体 |
WO2008045690A2 (en) | 2006-10-06 | 2008-04-17 | Veveo, Inc. | Linear character selection display interface for ambiguous text input |
US8078884B2 (en) | 2006-11-13 | 2011-12-13 | Veveo, Inc. | Method of and system for selecting and presenting content based on user identification |
US8131722B2 (en) * | 2006-11-20 | 2012-03-06 | Ebay Inc. | Search clustering |
US20080172380A1 (en) * | 2007-01-17 | 2008-07-17 | Wojciech Czyz | Information retrieval based on information location in the information space. |
US8082240B2 (en) * | 2007-02-28 | 2011-12-20 | Classe Qsl, S.L. | System for retrieving information units |
WO2008148012A1 (en) | 2007-05-25 | 2008-12-04 | Veveo, Inc. | System and method for text disambiguation and context designation in incremental search |
US20090055436A1 (en) * | 2007-08-20 | 2009-02-26 | Olakunle Olaniyi Ayeni | System and Method for Integrating on Demand/Pull and Push Flow of Goods-and-Services Meta-Data, Including Coupon and Advertising, with Mobile and Wireless Applications |
US20090055242A1 (en) * | 2007-08-24 | 2009-02-26 | Gaurav Rewari | Content identification and classification apparatus, systems, and methods |
EP2201545A4 (en) * | 2007-09-11 | 2011-01-19 | Telecomm Systems Inc | LOCAL INSTRUCTIONS FOR WIRELESS DEVICES FOR BATTERY NOTIFICATION EVENTS |
US7716228B2 (en) * | 2007-09-25 | 2010-05-11 | Firstrain, Inc. | Content quality apparatus, systems, and methods |
US7904433B2 (en) * | 2007-10-09 | 2011-03-08 | O2Micro International Limited | Apparatus and methods for performing a rule matching |
WO2009061501A1 (en) * | 2007-11-09 | 2009-05-14 | Telecommunication Systems, Inc. | Points-of-interest panning on a displayed map with a persistent search on a wireless phone |
US8943539B2 (en) | 2007-11-21 | 2015-01-27 | Rovi Guides, Inc. | Enabling a friend to remotely modify user data |
CN101246501B (zh) * | 2008-03-27 | 2010-06-23 | 腾讯科技(深圳)有限公司 | 一种聚合相同主题网络文档的方法及系统 |
US20090265340A1 (en) * | 2008-04-07 | 2009-10-22 | Bob Barcklay | Proximity search for point-of-interest names combining inexact string match with an expanding radius search |
US8027990B1 (en) * | 2008-07-09 | 2011-09-27 | Google Inc. | Dynamic query suggestion |
US8027973B2 (en) * | 2008-08-04 | 2011-09-27 | Microsoft Corporation | Searching questions based on topic and focus |
US7882143B2 (en) * | 2008-08-15 | 2011-02-01 | Athena Ann Smyros | Systems and methods for indexing information for a search engine |
US9424339B2 (en) * | 2008-08-15 | 2016-08-23 | Athena A. Smyros | Systems and methods utilizing a search engine |
US9092517B2 (en) * | 2008-09-23 | 2015-07-28 | Microsoft Technology Licensing, Llc | Generating synonyms based on query log data |
US8396658B2 (en) * | 2008-10-06 | 2013-03-12 | Telecommunication Systems, Inc. | Probabilistic reverse geocoding |
US8594627B2 (en) | 2008-10-06 | 2013-11-26 | Telecommunications Systems, Inc. | Remotely provisioned wirelessly proxy |
DE102008062830B3 (de) * | 2008-12-23 | 2010-07-22 | Cerebrix Gmbh | Vorrichtung und Verfahren zum Speichern, Suchen und Darstellen von Informationen |
US20100287177A1 (en) * | 2009-05-06 | 2010-11-11 | Foundationip, Llc | Method, System, and Apparatus for Searching an Electronic Document Collection |
US20100287148A1 (en) * | 2009-05-08 | 2010-11-11 | Cpa Global Patent Research Limited | Method, System, and Apparatus for Targeted Searching of Multi-Sectional Documents within an Electronic Document Collection |
US20100293179A1 (en) * | 2009-05-14 | 2010-11-18 | Microsoft Corporation | Identifying synonyms of entities using web search |
US8533203B2 (en) * | 2009-06-04 | 2013-09-10 | Microsoft Corporation | Identifying synonyms of entities using a document collection |
US9166714B2 (en) | 2009-09-11 | 2015-10-20 | Veveo, Inc. | Method of and system for presenting enriched video viewing analytics |
US8364679B2 (en) * | 2009-09-17 | 2013-01-29 | Cpa Global Patent Research Limited | Method, system, and apparatus for delivering query results from an electronic document collection |
US20110082839A1 (en) * | 2009-10-02 | 2011-04-07 | Foundationip, Llc | Generating intellectual property intelligence using a patent search engine |
WO2011056086A2 (en) * | 2009-11-05 | 2011-05-12 | Google Inc. | Statistical stemming |
US20110119250A1 (en) * | 2009-11-16 | 2011-05-19 | Cpa Global Patent Research Limited | Forward Progress Search Platform |
US8244754B2 (en) * | 2010-02-01 | 2012-08-14 | International Business Machines Corporation | System and method for object searching in virtual worlds |
US20110191330A1 (en) | 2010-02-04 | 2011-08-04 | Veveo, Inc. | Method of and System for Enhanced Content Discovery Based on Network and Device Access Behavior |
US8339094B2 (en) * | 2010-03-11 | 2012-12-25 | GM Global Technology Operations LLC | Methods, systems and apparatus for overmodulation of a five-phase machine |
US9760634B1 (en) | 2010-03-23 | 2017-09-12 | Firstrain, Inc. | Models for classifying documents |
US10643227B1 (en) | 2010-03-23 | 2020-05-05 | Aurea Software, Inc. | Business lines |
US10546311B1 (en) | 2010-03-23 | 2020-01-28 | Aurea Software, Inc. | Identifying competitors of companies |
US11367295B1 (en) | 2010-03-23 | 2022-06-21 | Aurea Software, Inc. | Graphical user interface for presentation of events |
US9600566B2 (en) | 2010-05-14 | 2017-03-21 | Microsoft Technology Licensing, Llc | Identifying entity synonyms |
EP2423830A1 (de) | 2010-08-25 | 2012-02-29 | Omikron Data Quality GmbH | Verfahren zum Suchen in einer Vielzahl von Datensätzen und Suchmaschine |
US8745061B2 (en) * | 2010-11-09 | 2014-06-03 | Tibco Software Inc. | Suffix array candidate selection and index data structure |
US20130262485A1 (en) * | 2010-12-14 | 2013-10-03 | The Regents Of The University Of California | High Efficiency Prefix Search Algorithm Supporting Interactive, Fuzzy Search on Geographical Structured Data |
US9846688B1 (en) | 2010-12-28 | 2017-12-19 | Amazon Technologies, Inc. | Book version mapping |
US8798366B1 (en) | 2010-12-28 | 2014-08-05 | Amazon Technologies, Inc. | Electronic book pagination |
US9069767B1 (en) | 2010-12-28 | 2015-06-30 | Amazon Technologies, Inc. | Aligning content items to identify differences |
US9881009B1 (en) | 2011-03-15 | 2018-01-30 | Amazon Technologies, Inc. | Identifying book title sets |
US8782042B1 (en) | 2011-10-14 | 2014-07-15 | Firstrain, Inc. | Method and system for identifying entities |
US8745019B2 (en) | 2012-03-05 | 2014-06-03 | Microsoft Corporation | Robust discovery of entity synonyms using query logs |
US8977613B1 (en) | 2012-06-12 | 2015-03-10 | Firstrain, Inc. | Generation of recurring searches |
US10032131B2 (en) | 2012-06-20 | 2018-07-24 | Microsoft Technology Licensing, Llc | Data services for enterprises leveraging search system data assets |
US9594831B2 (en) | 2012-06-22 | 2017-03-14 | Microsoft Technology Licensing, Llc | Targeted disambiguation of named entities |
US9229924B2 (en) | 2012-08-24 | 2016-01-05 | Microsoft Technology Licensing, Llc | Word detection and domain dictionary recommendation |
KR101355254B1 (ko) * | 2012-10-22 | 2014-01-28 | 인하대학교 산학협력단 | 접미사 트리의 병렬 생성을 위한 트라이 자료구조 기반 접미사 병렬 분할 방법 |
US9256593B2 (en) | 2012-11-28 | 2016-02-09 | Wal-Mart Stores, Inc. | Identifying product references in user-generated content |
US10592480B1 (en) | 2012-12-30 | 2020-03-17 | Aurea Software, Inc. | Affinity scoring |
US9244952B2 (en) | 2013-03-17 | 2016-01-26 | Alation, Inc. | Editable and searchable markup pages automatically populated through user query monitoring |
US9589074B2 (en) | 2014-08-20 | 2017-03-07 | Oracle International Corporation | Multidimensional spatial searching for identifying duplicate crash dumps |
CN105446957B (zh) | 2015-12-03 | 2018-07-20 | 小米科技有限责任公司 | 相似性确定方法、装置及终端 |
CN108595584B (zh) * | 2018-04-18 | 2022-06-07 | 卓望数码技术(深圳)有限公司 | 一种基于数字标记的汉字输出方法和系统 |
US10761965B2 (en) * | 2018-09-28 | 2020-09-01 | Atlassian Pty Ltd. | Detecting method calls based on stack trace data |
CN110517050A (zh) * | 2019-08-12 | 2019-11-29 | 太平洋医疗健康管理有限公司 | 一种医保反欺诈串换编码挖掘系统及方法 |
CN111415708B (zh) * | 2020-03-24 | 2023-05-05 | 山东大学 | 双缓冲模型实现大规模数据库聚类方法及系统 |
CN111860443A (zh) * | 2020-07-31 | 2020-10-30 | 上海掌学教育科技有限公司 | 语文作业题目文字识别方法、搜索方法、服务器及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0408188A2 (en) * | 1989-07-12 | 1991-01-16 | Digital Equipment Corporation | Compressed prefix matching database searching |
JPH07210569A (ja) * | 1994-01-19 | 1995-08-11 | Oki Electric Ind Co Ltd | 情報検索方法および情報検索装置 |
JPH08272827A (ja) * | 1994-09-14 | 1996-10-18 | Toshiba Corp | データ処理装置、データ検索装置、データ処理方法及びデータ検索方法 |
KR980004154A (ko) * | 1996-06-29 | 1998-03-30 | 김광호 | 접두어를 이용한 전자 사전 및 그에 접합한 압축 및 검색 방법 |
KR19990040752A (ko) * | 1997-11-19 | 1999-06-05 | 정선종 | 지도 용어 사전을 위한 트라이 사전과 그 등록 및 검색 방법 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU1640992A (en) * | 1991-03-08 | 1992-10-06 | Red Brick System | Compaction of a querying in relational databases |
US5511159A (en) | 1992-03-18 | 1996-04-23 | At&T Corp. | Method of identifying parameterized matches in a string |
US5953006A (en) * | 1992-03-18 | 1999-09-14 | Lucent Technologies Inc. | Methods and apparatus for detecting and displaying similarities in large data sets |
US5412807A (en) * | 1992-08-20 | 1995-05-02 | Microsoft Corporation | System and method for text searching using an n-ary search tree |
WO1996000945A1 (en) * | 1994-06-30 | 1996-01-11 | International Business Machines Corp. | Variable length data sequence matching method and apparatus |
US5724571A (en) * | 1995-07-07 | 1998-03-03 | Sun Microsystems, Inc. | Method and apparatus for generating query responses in a computer-based document retrieval system |
-
1998
- 1998-07-10 NO NO983175A patent/NO983175L/no not_active Application Discontinuation
-
1999
- 1999-07-09 HU HU0201630A patent/HUP0201630A2/hu unknown
- 1999-07-09 BR BRPI9912015-1A patent/BR9912015B1/pt not_active IP Right Cessation
- 1999-07-09 PT PT99933296T patent/PT1095326E/pt unknown
- 1999-07-09 CN CN99810507A patent/CN1317114A/zh active Pending
- 1999-07-09 WO PCT/NO1999/000233 patent/WO2000003315A2/en not_active Application Discontinuation
- 1999-07-09 DK DK99933296T patent/DK1095326T3/da active
- 1999-07-09 PL PL99345714A patent/PL345714A1/xx unknown
- 1999-07-09 AT AT99933296T patent/ATE212736T1/de not_active IP Right Cessation
- 1999-07-09 JP JP2000559494A patent/JP3581652B2/ja not_active Expired - Lifetime
- 1999-07-09 CA CA002337079A patent/CA2337079C/en not_active Expired - Lifetime
- 1999-07-09 DE DE69900854T patent/DE69900854T2/de not_active Expired - Lifetime
- 1999-07-09 IL IL14060699A patent/IL140606A0/xx unknown
- 1999-07-09 EP EP99933296A patent/EP1095326B1/en not_active Expired - Lifetime
- 1999-07-09 KR KR10-2001-7000436A patent/KR100414236B1/ko not_active IP Right Cessation
- 1999-07-09 AU AU49370/99A patent/AU772525B2/en not_active Expired
- 1999-07-09 US US09/486,726 patent/US6377945B1/en not_active Expired - Lifetime
- 1999-07-09 ES ES99933296T patent/ES2173752T3/es not_active Expired - Lifetime
-
2000
- 2000-12-29 IS IS5796A patent/IS5796A/is unknown
-
2002
- 2002-03-19 HK HK02102107.4A patent/HK1040784A1/zh unknown
-
2004
- 2004-07-29 AU AU2004203480A patent/AU2004203480A1/en not_active Abandoned
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0408188A2 (en) * | 1989-07-12 | 1991-01-16 | Digital Equipment Corporation | Compressed prefix matching database searching |
JPH07210569A (ja) * | 1994-01-19 | 1995-08-11 | Oki Electric Ind Co Ltd | 情報検索方法および情報検索装置 |
JPH08272827A (ja) * | 1994-09-14 | 1996-10-18 | Toshiba Corp | データ処理装置、データ検索装置、データ処理方法及びデータ検索方法 |
KR980004154A (ko) * | 1996-06-29 | 1998-03-30 | 김광호 | 접두어를 이용한 전자 사전 및 그에 접합한 압축 및 검색 방법 |
KR19990040752A (ko) * | 1997-11-19 | 1999-06-05 | 정선종 | 지도 용어 사전을 위한 트라이 사전과 그 등록 및 검색 방법 |
Also Published As
Publication number | Publication date |
---|---|
PT1095326E (pt) | 2002-07-31 |
PL345714A1 (en) | 2002-01-02 |
DE69900854T2 (de) | 2002-08-22 |
DE69900854D1 (de) | 2002-03-14 |
US6377945B1 (en) | 2002-04-23 |
NO983175L (no) | 2000-01-11 |
CN1317114A (zh) | 2001-10-10 |
CA2337079C (en) | 2006-07-04 |
AU4937099A (en) | 2000-02-01 |
DK1095326T3 (da) | 2002-05-13 |
KR20010071841A (ko) | 2001-07-31 |
JP2002520712A (ja) | 2002-07-09 |
EP1095326A1 (en) | 2001-05-02 |
WO2000003315A3 (en) | 2000-02-24 |
WO2000003315A2 (en) | 2000-01-20 |
HK1040784A1 (zh) | 2002-06-21 |
CA2337079A1 (en) | 2000-01-20 |
BR9912015B1 (pt) | 2011-12-13 |
IS5796A (is) | 2000-12-29 |
ATE212736T1 (de) | 2002-02-15 |
IL140606A0 (en) | 2002-02-10 |
HUP0201630A2 (en) | 2002-08-28 |
ES2173752T3 (es) | 2002-10-16 |
AU2004203480A1 (en) | 2004-08-26 |
AU772525B2 (en) | 2004-04-29 |
BR9912015A (pt) | 2001-04-10 |
JP3581652B2 (ja) | 2004-10-27 |
EP1095326B1 (en) | 2002-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100414236B1 (ko) | 데이터의 검색을 위한 서치 시스템 및 방법 | |
Blumer et al. | Complete inverted files for efficient text retrieval and analysis | |
Chang et al. | IEPAD: Information extraction based on pattern discovery | |
Stonebraker et al. | Document processing in a relational database system | |
CN102142038B (zh) | 用于记号空间资料库的多级查询处理系统与方法 | |
US6240409B1 (en) | Method and apparatus for detecting and summarizing document similarity within large document sets | |
US6598051B1 (en) | Web page connectivity server | |
US6701317B1 (en) | Web page connectivity server construction | |
CN107153647B (zh) | 进行数据压缩的方法、装置、系统和计算机程序产品 | |
US7444326B1 (en) | Method of performing approximate substring indexing | |
US7103536B1 (en) | Symbol dictionary compiling method and symbol dictionary retrieving method | |
US6754650B2 (en) | System and method for regular expression matching using index | |
Krishnan et al. | Estimating alphanumeric selectivity in the presence of wildcards | |
US20080288442A1 (en) | Ontology Based Text Indexing | |
US8266150B1 (en) | Scalable document signature search engine | |
Sadakane et al. | Indexing huge genome sequences for solving various problems | |
Rao et al. | Sequencing XML data and query twigs for fast pattern matching | |
Gog et al. | Improved single-term top-k document retrieval | |
Amir et al. | Searching for a modified pattern in a changing text | |
Aoe | A fast digital search algorithm using a double‐array structure | |
Kanlayanawat et al. | Automatic indexing for Thai text with unknown words using trie structure | |
KR100434718B1 (ko) | 문서 색인 시스템 및 그 방법 | |
Ferragina et al. | An experimental study of SB-trees | |
CA2524207A1 (en) | A search system and method for retrieval of data, and the use thereof in a search engine | |
KR100440906B1 (ko) | 문서 색인 시스템 및 그 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0105 | International application |
Patent event date: 20010110 Patent event code: PA01051R01D Comment text: International Patent Application |
|
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20010621 Comment text: Request for Examination of Application |
|
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20030930 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20031223 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20031224 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20061220 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20071207 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20081202 Start annual number: 6 End annual number: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20091210 Start annual number: 7 End annual number: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20101208 Start annual number: 8 End annual number: 8 |
|
PR1001 | Payment of annual fee |
Payment date: 20111202 Start annual number: 9 End annual number: 9 |
|
FPAY | Annual fee payment |
Payment date: 20121203 Year of fee payment: 10 |
|
PR1001 | Payment of annual fee |
Payment date: 20121203 Start annual number: 10 End annual number: 10 |
|
FPAY | Annual fee payment |
Payment date: 20131202 Year of fee payment: 11 |
|
PR1001 | Payment of annual fee |
Payment date: 20131202 Start annual number: 11 End annual number: 11 |
|
FPAY | Annual fee payment |
Payment date: 20141203 Year of fee payment: 12 |
|
PR1001 | Payment of annual fee |
Payment date: 20141203 Start annual number: 12 End annual number: 12 |
|
FPAY | Annual fee payment |
Payment date: 20151118 Year of fee payment: 13 |
|
PR1001 | Payment of annual fee |
Payment date: 20151118 Start annual number: 13 End annual number: 13 |
|
FPAY | Annual fee payment |
Payment date: 20161122 Year of fee payment: 14 |
|
PR1001 | Payment of annual fee |
Payment date: 20161122 Start annual number: 14 End annual number: 14 |
|
FPAY | Annual fee payment |
Payment date: 20171117 Year of fee payment: 15 |
|
PR1001 | Payment of annual fee |
Payment date: 20171117 Start annual number: 15 End annual number: 15 |
|
FPAY | Annual fee payment |
Payment date: 20181129 Year of fee payment: 16 |
|
PR1001 | Payment of annual fee |
Payment date: 20181129 Start annual number: 16 End annual number: 16 |
|
EXPY | Expiration of term | ||
PC1801 | Expiration of term |
Termination date: 20200109 Termination category: Expiration of duration |