KR19990013736A - 키워드 추출 시스템 및 그를 사용한 문서 검색 시스템 - Google Patents
키워드 추출 시스템 및 그를 사용한 문서 검색 시스템 Download PDFInfo
- Publication number
- KR19990013736A KR19990013736A KR1019980027734A KR19980027734A KR19990013736A KR 19990013736 A KR19990013736 A KR 19990013736A KR 1019980027734 A KR1019980027734 A KR 1019980027734A KR 19980027734 A KR19980027734 A KR 19980027734A KR 19990013736 A KR19990013736 A KR 19990013736A
- Authority
- KR
- South Korea
- Prior art keywords
- text
- words
- word
- texts
- list
- Prior art date
Links
- 238000000605 extraction Methods 0.000 title description 9
- 238000000034 method Methods 0.000 claims description 50
- 230000004044 response Effects 0.000 claims description 18
- 238000012360 testing method Methods 0.000 claims description 11
- 150000001875 compounds Chemical class 0.000 claims description 6
- 230000007175 bidirectional communication Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 239000000470 constituent Substances 0.000 description 6
- 230000007717 exclusion Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/912—Applications of a database
- Y10S707/917—Text
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99932—Access augmentation or optimizing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99935—Query augmenting and refining, e.g. inexact access
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (78)
- 질문 요청을 수신하고 검색된 텍스트의 텍스트 ID의 목록을 만드는 기능을 갖는 텍스트 검색 시스템에서 이용자가 텍스트 베이스를 탐색하는 것을 돕는 방법으로서,상기 텍스트 베이스를 구성하는 각 텍스트에 대해서, 상기 텍스트 각각에 사용된 단어 및 복합어구(이하, 총괄적으로 단어라 한다)상의 로컬 통계 정보를 관리하는 단계와,상기 텍스트 베이스를 구성하는 상기 텍스트 중 어느 하나에 사용된 단어상의 전체 통계 정보를 관리하는 단계와,선택된 텍스트의 텍스트 ID의 선택된 텍스트 목록을 제공하기 위해 상기 이용자가 상기 텍스트 베이스로부터 적어도 1개의 텍스트를 선택하는 단계와,상기 선택된 텍스트(들)에 포함된 각 단어에 대해서, 상기 선택된 텍스트에 대한 상기 로컬 통계 정보와 상기 전체 통계 정보를 사용하여 중요도를 계산하는 단계와,상기 선택된 텍스트에 포함된 상기 단어를 상기 중요도 순으로 소트(sorting)하는 단계와,소정수의 상기 소트된 단어를 관련 키워드로서 디스플레이 하는 단계와,상기 관련 키워드를 사용하여 상기 이용자가 질문 요청을 입력하는 것을 돕는 단계를 포함하는 방법.
- 제 1 항에 있어서, 상기 로컬 통계 정보를 관리하는 단계는, 상기 로컬 통계 정보내에, 상기 텍스트 각각에 사용된 각 단어의 단어 ID와 상기 단어 ID와 결합된 단어 발생 카운트를 포함하는 단계를 포함하고, 상기 단어 발생 카운트는 상기 텍스트 각각에서, 상기 텍스트 각각에 사용된 상기 단어 각각의 발생수를 가리키며,상기 전체 통계 정보를 관리하는 단계는, 상기 전체 통계 정보내에, 상기 텍스트 베이스를 구성하는 상기 텍스트 중 어느 하나에 사용된 상기 단어 각각의 단어 ID와, 총 단어 발생 카운트와, 임의의 상기 텍스트에 사용된 상기 단어 각각의 상기 단어 ID와 결합되는 포함 텍스트 카운트를 포함하는 단계를 포함하고, 상기 총 단어 발생 카운트는 상기 텍스트 베이스를 구성하는 상기 텍스트 전체의 총 발생수를 가리키며, 상기 포함 텍스트 카운트는 임의의 상기 텍스트에 사용된 상기 단어 각각을 포함하는 텍스트의 수를 가리키며,상기 방법은, 상기 선택된 텍스트에 대해 주어진 상기 단어 발생 카운트와, 상기 선택된 텍스트의 수와, 상기 선택된 텍스트에 포함된 상기 단어 각각에 대해 규정된 수량과의 합에 상기 중요도가 비례하도록, 상기 중요도를 규정하는 단계를 더 포함하며, 상기 단어 각각이 상기 텍스트 베이스를 구성하는 상기 텍스트에 보다 많이 나타나면 상기 수량이 더 작아지도록 한 방법.
- 제 2 항에 있어서, 상기 중요도를 규정하는 상기 단계는 다음과 같이 상기 중요도, 즉 I(Wj)를 표시하는 단계를 포함하는 방법으로서,이고, 여기서, Wj는 상기 검색된 텍스트에 포함된 상기 단어 각각의 단어 ID이고, C는 상수이고, WOr(Wj)는 상기 검색된 텍스트(RTr) 각각내의 상기 단어(Wj) 각각의 상기 단어 발생 카운트이고, RCT(Wj)는 상기 단어(Wj) 각각을 포함하는 상기 검색된 텍스트의 수이고, IDF(Wj)는 RTr이 상기 검색된 텍스트 각각의 텍스트 ID이고 r=1,2,...,R(R=검색된 텍스트의 수)인 경우의 상기 수량인 방법.
- 제 1 항에 있어서, 상기 이용자가 적어도 1개의 텍스트를 선택하는 상기 단계는,상기 이용자가 그의 또는 그녀가 깊이 생각한 검색 조건을 사용하여 질문 요청을 발행하여 검색된 텍스트의 목록을 얻는 단계와,상기 이용자가 상기 검색된 텍스트로부터 상기 적어도 1개의 텍스트를 선택하는 단계를 포함하는 방법.
- 제 1 항에 있어서, 상기 이용자가 상기 목록의 부분 집합인 더 작은 목록을 얻기 위해 질문 요청을 더 발행하는 단계와,상기 목록에 기입된 상기 검색된 텍스트에 사용된 단어상의 통계 정보와, 상기 더 작은 목록에 기입된 텍스트에 포함된 단어상의 통계 정보를 사용하여 상기 검색된 텍스트에 포함된 상기 단어 각각에 대해, 분포 지수를 계산하는 단계와,상기 중요도를 상기 분포 지수로 가중치 부여하는 단계를 더 포함하며, 상기 분포 지수는, 상기 선택된 텍스트에 포함된 상기 단어 각각이 상기 더 작은 목록에 기입된 텍스트에 더 많이 분포되고 상기 선택된 텍스트에 더 적게 분포되면, 더 커지도록 규정되는 방법.
- 제 5 항에 있어서, 상기 분포 지수는 {(MA/CTA(Wj)*(CTB(Wj)/MB)}로 VYTLELH고, 여기서 MA, MB는 상기 목록과 상기 더 작은 목록에 각각 기입된 텍스트의 수이고, CTA(Wj), CTA(Wj)는 상기 목록과 상기 더 작은 목록에 각각 기입되며 상기 선택된 텍스트에 포함된 상기 단어(Wj) 각각을 포함하는 텍스트의 수인 방법.
- 제 2 항에 있어서, 상기 목록은 상기 선택된 텍스트의 적합도의 순으로 소트되고, 상기 방법은 상기 소트된 목록을 수신하고 상기 소트된 목록의 상기 선택된 목록의 각각에 소정의 가중치를 할당하고, 상기 중요도를 표시하는 단계는 상기 단어 발생 카운트(WOr(Wj))에 상기 소정의 가중치를 가중치 부여하는 단계를 포함하는 방법.
- 제 2 항에 있어서, 상기 선택된 텍스트의 각각에 가중치를 할당하는 단계를 더 포함하며, 상기 중요도를 계산하는 상기 단계는 상기 선택된 텍스트 각각에 대해 상기 단어 발생 카운트에, 상기 선택된 텍스트 각각에 대해 할당된 상기 가중치로 가중치 부여하는 단계를 포함하는 방법.
- 제 1 항에 있어서, 상기 선택된 텍스트에 포함된 상기 단어 각각에 대해, 단어를 포함하는 텍스트의 수가 소정의 범위 이내인지 여부를 알아보기 위해 테스트를 하는 단계와,상기 단어가 상기 테스트를 통과하지 않으면, 상기 선택된 키워드의 후보자에서 상기 단어를 제외하는 단계를 더 포함하는 방법.
- 제 9 항에 있어서, 상기 단어의 수량 특성과 결합된 값을 상기 소정의 범위로서 사용하는 단계를 더 포함하는 방법.
- 제 10 항에 있어서, 상기 수량은 상기 단어의 길이인 방법.
- 제 9 항에 있어서, 상기 단어의 수량 특성의 제2 소정 범위 각각을 상기 단어를 포함하는 상기 텍스트의 수의 상이한 소정 범위와 결합하는 단계를 더 포함하며, 상기 테스트하는 단계는 상기 단어 호출의 상기 수량 특성상의 제2 소정 범위와 결합된 상기 상이한 소정 범위 중 하나를 상기 소정 범위로서 사용하는 단계를 포함하는 방법.
- 제 2 항에 있어서, 상기 텍스트 베이스를 구성하는 텍스트 각각에 대해, 상기 텍스트 베이스를 구성하는 상기 텍스트 각각의 상기 워드 각각의 발생 각각과, 상기 각각의 텍스트의 일부와, 상기 발생 각각의 일부를 관리하는 단계와,상기 텍스트 각각의 가능한 일부 각각에 소정의 가중치 인자를 할당하는 단계와,상기 텍스트 각각에 대해, 상기 단어 각각에 대해 텍스트 단위로 가중치를 산출하기 위해 상기 단어 각각의 상기 발생 각각의 상기 일부와 결합된 상기 소정의 가중치 인자를 축적하는 단계를 더 포함하고, 상기 중요도를 규정하는 상기 단계는 상기 단어 각각에 텍스트 단위로 상기 가중치를 부여하는 단계를 포함하는 방법.
- 제 1 항에 있어서, 상기 텍스트 베이스를 구성하는 텍스트 각각에 대해, 상기 텍스트를 구성하는 상기 텍스트 각각의 상기 단어 각각의 발생 각각과, 상기 발생 각각의 상기 텍스트 각각내의 위치를 관리하는 단계와,상기 텍스트 각각의 상기 단어 각각의 상기 발생 각각에 대해, 상기 위치와 상기 질문 요청에 사용된 키워드 각각의 위치와의 간격을 계산하는 단계와,소정의 간격 범위 각각에 소정의 가중치 인자를 할당하는 단계와,상기 텍스트 베이스를 구성하는 텍스트 각각에 대해, 상기 단어 각각에 대해 텍스트 단위로 가중치를 산출하도록, 상기 단어 각각의 상기 발생 각각에 상기 키워드 각각의 상기 간격과 결합된 상기 소정의 가중치 인자를 축적하는 단계를 더 포함하고, 상기 중요도를 규정하는 상기 단계는 상기 단어 발생 카운트의 각각에 텍스트 단위로 상기 가중치를 부여하는 단계를 포함하는 방법.
- 제 1 항에 있어서, 상기 중요도에, 상기 선택된 텍스트의 상기 단어 각각의 속성과 결합된 가중치를 부여하는 단계를 더 포함하는 방법.
- 제 1 항에 있어서, 임의의 2개의 상기 소트된 단어내에나, 임의의 상기 소트된 단어와 상기 질문 요청에 사용된 임의의 키워드 사이 중에 어떤 포함 관계가 발견되면, 소정의 기준에 기초하여 상기 2개의 소트된 단어 중 하나를 선택하는 단계를 더 포함하는 방법.
- 제 16 항에 있어서, 상기 포함 관계에 포함된 상기 2개의 단어 사이의 길이를 비교하기 위해 상기 소정의 기준을 설정하는 단계를 더 포함하는 방법.
- 제 16 항에 있어서, 상기 포함 관계에 포함된 상기 2개의 단어 사이의 중요도를 비교하기 위해 상기 소정의 기준을 설정하는 단계를 더 포함하는 방법.
- 제 16 항에 있어서, 상기 2개의 단어 중 하나를 선택하는 단계는 상기 2개의 단어 사이의 더 짧은 단어 및/또는 차이를 선택하는 단계를 포함하는 방법.
- 제 3 항에 있어서, 상기 질문 요청에 사용된 키워드와 상기 기능으로부터의 상기 목록에 기초하여, 상기 선택된 텍스트의 적합도 순으로 상기 목록을 소트하는 단계와,상기 소트된 목록의 상기 선택된 텍스트의 각각에 소저의 가중치를 할당하는 단계를 더 포함하고, 상기 중요도를 표시하는 상기 단계는 상기 단어 발생 카운트(WOr(Wj))에 상기 선택된 텍스트(RTr) 각각과 결합된 상기 소정의 가중치 중 하나를 가중치 부여하는 단계를 포함하는 방법.
- 제 1 항에 있어서, 상기 소트된 단어를 디스플레이를 위해 상기 소트된 단어의 속성 단위로 유사한 키워드의 그룹으로 분류하는 단계를 더 포함하는 방법.
- 제 1 항에 있어서, 상기 소트된 단어를 디스플레이를 위해 상기 소트된 단어의 통계 데이터 단위로 유사한 키워드의 그룹으로 분류하는 단계를 더 포함하는 방법.
- 제 1 항에 있어서, 상기 소트된 단어를 디스플레이를 위해 상기 소트된 단어의 시소러스 단위로 유사한 키워드의 그룹으로 분류하는 단계를 더 포함하는 방법.
- 제 21 항에 있어서, 상기 그룹 대신에 대표 키워드를 디스플레이 하는 단계를 더 포함하는 방법.
- 제 22 항에 있어서, 상기 그룹 대신에 대표 키워드를 디스플레이 하는 단계를 더 포함하는 방법.
- 제 23 항에 있어서, 상기 그룹 대신에 대표 키워드를 디스플레이 하는 단계를 더 포함하는 방법.
- 제 1 항에 있어서, 상기 이용자를 돕는 상기 단계는, 상기 이용자로부터의 소정의 입력에 응답하여, 상기 관련 단어의 상기 소정의 수의 적어도 일부를 사용하여 상기 질문 요청을 자동적으로 발생하는 단계를 포함하는 방법.
- 제 1 항에 있어서, 상기 관련 단어의 상기 소정의 수를 저장하는 단계와,상기 이용자로부터의 소정의 입력에 응답하여, 상기 관련 키워드의 상기 저장된 소정의 수를 디스플레이 하는 단계를 더 포함하는 방법.
- 질문 요청을 수신하고 검색된 텍스트의 텍스트 ID의 목록을 만드는 기능을 갖는 텍스트 검색 시스템에서 이용자가 텍스트 베이스를 탐색하는 것을 돕는 시스템으로서,상기 텍스트 베이스를 구성하는 각 텍스트에 대해서 실시되며, 상기 텍스트 각각에 사용된 단어 및 복합어구(이하, 총괄적으로 단어라 한다)상의 로컬 통계 정보를 관리하는 수단과,상기 텍스트 베이스를 구성하는 상기 텍스트 중 어느 하나에 사용된 단어상의 전체 통계 정보를 관리하는 수단과,선택된 텍스트의 텍스트 ID의 선택된 텍스트 목록을 제공하기 위해 상기 이용자가 상기 텍스트 베이스로부터 적어도 1개의 텍스트를 선택하는 것을 가능케 하는 수단과,상기 선택된 텍스트 목록에 기입된 상기 선택된 텍스트에 포함된 각 단어에 대해 실시되며, 상기 선택된 텍스트에 대한 상기 로컬 통계 정보와 상기 전체 통계 정보를 사용하여 중요도를 계산하는 수단과,상기 선택된 텍스트에 포함된 상기 단어를 상기 중요도 순으로 소트하는 수단과,가장 높은 중요도를 갖는 소정수의 상기 소트된 단어를 관련 키워드로서 디스플레이 하는 수단과,상기 관련 키워드를 사용하여 상기 이용자가 질문 요청을 입력하는 것을 돕는 수단을 포함하는 시스템.
- 제 29 항에 있어서, 상기 로컬 통계 정보를 관리하는 수단은, 상기 로컬 통계 정보내에, 상기 텍스트 각각에 사용된 각 단어의 단어 ID와 상기 단어 ID와 결합된 단어 발생 카운트를 포함하는 수단을 포함하고, 상기 단어 발생 카운트는 상기 텍스트 각각에서, 상기 텍스트 각각에 사용된 상기 단어 각각의 발생수를 가리키며,상기 전체 통계 정보를 관리하는 수단은, 상기 전체 통계 정보내에, 상기 텍스트 베이스를 구성하는 상기 텍스트 중 어느 하나에 사용된 상기 단어 각각의 단어 ID와, 총 단어 발생 카운트와, 임의의 상기 텍스트에 사용된 상기 단어 각각의 상기 단어 ID와 결합되는 포함 텍스트 카운트를 포함하는 수단을 포함하고, 상기 총 단어 발생 카운트는 상기 텍스트 베이스를 구성하는 상기 텍스트 전체의 총 발생수를 가리키며, 상기 포함 텍스트 카운트는 임의의 상기 텍스트에 사용된 상기 단어 각각을 포함하는 텍스트의 수를 가리키며,상기 시스템은, 상기 선택된 텍스트에 대해 주어진 상기 단어 발생 카운트와, 상기 선택된 텍스트의 수와, 상기 선택된 텍스트에 포함된 상기 단어 각각에 대해 규정된 수량과의 합에 상기 중요도가 비례하도록, 상기 중요도를 규정하는 수단을 더 포함하며, 상기 단어 각각이 상기 텍스트 베이스를 구성하는 상기 텍스트에 보다 많이 나타나면 상기 수량이 더 작아지도록 한 시스템.
- 제 30 항에 있어서, 상기 중요도를 규정하는 상기 수단은 다음과 같이 상기 중요도, 즉 I(Wj)를 표시하는 수단을 포함하는 시스템으로서,이고, 여기서, Wj는 상기 검색된 텍스트에 포함된 상기 단어 각각의 단어 ID이고, C는 상수이고, WOr(Wj)는 상기 검색된 텍스트(RTr) 각각내의 상기 단어(Wj) 각각의 상기 단어 발생 카운트이고, RCT(Wj)는 상기 단어(Wj) 각각을 포함하는 상기 검색된 텍스트의 수이고, IDF(Wj)는 RTr이 상기 검색된 텍스트 각각의 텍스트 ID이고 r=1,2,...,R(R=검색된 텍스트의 수)인 경우의 상기 수량인 시스템.
- 제 29 항에 있어서, 상기 이용자가 적어도 1개의 텍스트를 선택하는 것을 허용하는 상기 수단은,상기 이용자가 그의 또는 그녀가 깊이 생각한 검색 조건을 사용하여 질문 요청을 발행하여 검색된 텍스트의 목록을 얻는 것을 허용하는 수단과,상기 이용자가 상기 검색된 텍스트로부터 상기 적어도 1개의 텍스트를 선택하는 것을 허용하는 수단을 포함하는 시스템.
- 제 29 항에 있어서,상기 이용자로부터의 더한 질문 요청에 의해 상기 기능이 상기 목록의 부분 집합인 더 작은 목록을 만들기 위해 복귀하는 판정에 응답하여, 상기 선택된 텍스트에 사용된 단어상의 통계 정보와, 상기 더 작은 목록에 기입된 텍스트에 포함된 단어상의 통계 정보를 사용하여 상기 선택된 텍스트에 포함된 상기 단어 각각에 대해, 분포 지수를 계산하는 수단과,상기 중요도에 상기 분포 지수로 가중치 부여하는 수단을 더 포함하며, 상기 분포 지수는, 상기 선택된 텍스트에 포함된 상기 단어 각각이 상기 더 작은 목록에 기입된 텍스트에 더 많이 분포되고 상기 선택된 텍스트에 더 적게 분포되면, 더 커지도록 규정되는 시스템.
- 제 33 항에 있어서, 상기 분포 지수는 {(MA/CTA(Wj)*(CTB(Wj)/MB)}로 VYTLELH고, 여기서 MA, MB는 상기 목록과 상기 더 작은 목록에 각각 기입된 텍스트의 수이고, CTA(Wj), CTA(Wj)는 상기 목록과 상기 더 작은 목록에 각각 기입되며 상기 선택된 텍스트에 포함된 상기 단어(Wj) 각각을 포함하는 텍스트의 수인 시스템.
- 제 30 항에 있어서, 상기 목록은 상기 선택된 텍스트의 적합도의 순으로 소트되고, 상기 시스템은 상기 소트된 목록을 수신하고 상기 소트된 목록의 상기 선택된 목록의 각각에 소정의 가중치를 할당하고, 상기 중요도를 표시하는 수단은 상기 단어 발생 카운트에 상기 소정의 가중치를 가중치 부여하는 수단을 포함하는 시스템.
- 제 30 항에 있어서, 상기 이용자가 상기 선택된 텍스트의 각각에 가중치를 할당하는 것을 허용하는 수단을 더 포함하며, 상기 중요도를 계산하는 상기 수단은 상기 선택된 텍스트 각각에 대해 상기 단어 발생 카운트에, 상기 선택된 텍스트 각각에 대해 할당된 상기 가중치로 가중치 부여하는 수단을 포함하는 시스템.
- 제 29 항에 있어서,상기 선택된 텍스트에 포함된 상기 단어 각각에 대해 실시되며, 단어를 포함하는 텍스트의 수가 소정의 범위 이내인지 여부를 알아보기 위해 테스트를 하는 수단과,상기 단어가 상기 테스트를 통과하지 않았음의 판정에 응답하여, 상기 선택된 키워드의 후보자에서 상기 단어를 제외하는 수단을 더 포함하는 시스템.
- 제 37 항에 있어서, 상기 단어의 수량 특성과 결합된 값을 상기 소정의 범위로서 사용하는 수단을 더 포함하는 시스템.
- 제 38 항에 있어서, 상기 수량은 상기 단어의 길이인 시스템.
- 제 37 항에 있어서, 상기 단어의 수량 특성의 제2 소정 범위 각각을 상기 단어를 포함하는 상기 텍스트의 수의 상이한 소정 범위와 결합하는 수단을 더 포함하며, 상기 테스트하는 수단은 상기 단어 호출의 상기 수량 특성상의 제2 소정 범위와 결합된 상기 상이한 소정 범위 중 하나를 상기 소정 범위로서 사용하는 수단을 포함하는 시스템.
- 제 30 항에 있어서, 상기 텍스트 베이스를 구성하는 텍스트 각각에 대해 실시되며, 상기 텍스트 베이스를 구성하는 상기 텍스트 각각의 상기 워드 각각의 발생 각각과, 상기 각각의 텍스트의 일부와, 상기 발생 각각의 일부를 관리하는 수단과,상기 텍스트 각각의 가능한 일부 각각에 소정의 가중치 인자를 할당하는 수단과,상기 텍스트 각각에 대해 실시되며, 상기 단어 각각에 대해 텍스트 단위로 가중치를 산출하기 위해 상기 단어 각각의 상기 발생 각각의 상기 일부와 결합된 상기 소정의 가중치 인자를 축적하는 수단을 더 포함하고, 상기 중요도를 규정하는 상기 수단은 상기 단어 각각에 텍스트 단위로 상기 가중치를 부여하는 수단을 포함하는 시스템.
- 제 29 항에 있어서,상기 텍스트 베이스를 구성하는 텍스트 각각에 대해 실시되며, 상기 텍스트를 구성하는 상기 텍스트 각각의 상기 단어 각각의 발생 각각과, 상기 발생 각각의 상기 텍스트 각각내의 위치를 관리하는 수단과,상기 텍스트 각각의 상기 단어 각각의 상기 발생 각각에 대해, 상기 위치와 상기 질문 요청에 사용된 키워드 각각의 위치와의 간격을 계산하는 수단과,소정의 간격 범위 각각에 소정의 가중치 인자를 할당하는 수단과,상기 텍스트 베이스를 구성하는 텍스트 각각에 대해, 상기 단어 각각에 대해 텍스트 단위로 가중치를 산출하도록, 상기 단어 각각의 상기 발생 각각에 상기 키워드 각각의 상기 간격과 결합된 상기 소정의 가중치 인자를 축적하는 수단을 더 포함하고, 상기 중요도를 규정하는 상기 수단은 상기 단어 발생 카운트의 각각에 텍스트 단위로 상기 가중치를 부여하는 수단을 포함하는 시스템.
- 제 29 항에 있어서, 상기 중요도에, 상기 선택된 텍스트의 상기 단어 각각의 속성과 결합된 가중치를 부여하는 수단을 더 포함하는 시스템.
- 제 29 항에 있어서, 임의의 2개의 상기 소트된 단어내에나, 임의의 상기 소트된 단어와 상기 질문 요청에 사용된 임의의 키워드 사이 중에 어떤 포함 관계가 발견됨의 판정에 응답하여, 소정의 기준에 기초하여 상기 포함 관계에 포함된 2개의 단어 중 하나를 선택하는 수단을 더 포함하는 시스템.
- 제 44 항에 있어서, 상기 포함 관계에 포함된 상기 2개의 단어 사이의 길이를 비교하기 위해 상기 소정의 기준을 설정하는 수단을 더 포함하는 시스템.
- 제 44 항에 있어서, 상기 포함 관계에 포함된 상기 2개의 단어 사이의 중요도를 비교하기 위해 상기 소정의 기준을 설정하는 수단을 더 포함하는 시스템.
- 제 44 항에 있어서, 상기 2개의 단어 중 하나를 선택하는 수단은 상기 2개의 단어 사이의 더 짧은 단어 및/또는 차이를 선택하는 수단을 포함하는 시스템.
- 제 31 항에 있어서, 상기 질문 요청에 사용된 키워드와 상기 기능으로부터의 상기 목록에 기초하여 실시되며, 상기 선택된 텍스트의 적합도 순으로 상기 목록을 소트하는 수단과,상기 소트된 목록의 상기 선택된 텍스트의 각각에 소저의 가중치를 할당하는 수단을 더 포함하고, 상기 중요도를 표시하는 상기 수단은 상기 단어 발생 카운트(WOr(Wj))에 상기 선택된 텍스트(RTr) 각각과 결합된 상기 소정의 가중치 중 하나를 가중치 부여하는 수단을 포함하는 시스템.
- 제 29 항에 있어서, 상기 소트된 단어를 디스플레이를 위해 상기 소트된 단어의 속성 단위로 유사한 키워드의 그룹으로 분류하는 수단을 더 포함하는 시스템.
- 제 29 항에 있어서, 상기 소트된 단어를 디스플레이를 위해 상기 소트된 단어의 통계 데이터 단위로 유사한 키워드의 그룹으로 분류하는 수단을 더 포함하는 시스템.
- 제 29 항에 있어서, 상기 소트된 단어를 디스플레이를 위해 상기 소트된 단어의 시소러스 단위로 유사한 키워드의 그룹으로 분류하는 수단을 더 포함하는 시스템.
- 제 49 항에 있어서, 상기 그룹 대신에 대표 키워드를 디스플레이 하는 수단을 더 포함하는 시스템.
- 제 50 항에 있어서, 상기 그룹 대신에 대표 키워드를 디스플레이 하는 수단을 더 포함하는 시스템.
- 제 51 항에 있어서, 상기 그룹 대신에 대표 키워드를 디스플레이 하는 수단을 더 포함하는 시스템.
- 제 29 항에 있어서, 상기 이용자를 돕는 상기 수단은, 상기 이용자로부터의 소정의 입력에 응답하여, 상기 관련 단어의 상기 소정의 수의 적어도 일부를 사용하여 상기 질문 요청을 자동적으로 발생하는 수단을 포함하는 시스템.
- 제 29 항에 있어서, 상기 관련 단어의 상기 소정의 수를 저장하는 수단과,상기 이용자로부터의 소정의 입력에 응답하며, 상기 관련 키워드의 상기 저장된 소정의 수를 디스플레이 하는 수단을 더 포함하는 시스템.
- 적어도 1개의 전술한 탐색에 기초하여 키워드를 제공하여 이용자가 텍스트를 탐색하는 것을 도울 수 있는 텍스트 검색 시스템으로서,상기 텍스트 베이스를 구성하는 텍스트의 다양성과,상기 텍스트 베이스를 구성하는 상기 텍스트상의 속성 정보를 관리하는 수단과,상기 텍스트 베이스를 구성하는 각 텍스트에 대해서 실시되며, 상기 텍스트 각각에 사용된 단어 및 복합어구(이하, 총괄적으로 단어라 한다)상의 로컬 통계 정보를 관리하는 수단과,상기 텍스트 베이스를 구성하는 상기 텍스트 중 어느 하나에 사용된 단어상의 전체 통계 정보를 관리하는 수단과,상기 이용자가 질문 요청을 발행하는 것을 허용하는 수단과,선택된 텍스트의 텍스트 ID 목록을 제공하는 상기 질문 요청에 응답하는 수단과,상기 선택된 텍스트 목록에 기입된 상기 선택된 텍스트에 포함된 각 단어에 대해 실시되며, 상기 선택된 텍스트에 대한 상기 로컬 통계 정보와 상기 전체 통계 정보를 사용하여 중요도를 계산하는 수단과,상기 선택된 텍스트에 포함된 상기 단어를 상기 중요도 순으로 소트하는 수단과,가장 높은 중요도를 갖는 소정수의 상기 소트된 단어를 관련 키워드로서 디스플레이 하는 수단과,상기 관련 키워드를 사용하여 상기 이용자가 질문 요청을 입력하는 것을 돕는 수단을 포함하는 시스템.
- 제 57 항에 있어서, 상기 로컬 통계 정보를 관리하는 수단은, 상기 텍스트 베이스를 구성하는 상기 텍스트 중 하나와 각각 결합된 복수의 로컬 통계 정보와, 상기 텍스트 각각에 사용된 각 단어의 단어 ID와 상기 단어 ID와 결합된 단어 발생 카운트를 포함하는 상기 텍스트 각각과 결합된 로컬표를 포함하고, 상기 단어 발생 카운트는 상기 텍스트 각각에서, 상기 텍스트 각각에 사용된 상기 단어 각각의 발생수를 가리키며,상기 전체 통계 정보를 관리하는 수단은, 상기 텍스트 베이스를 구성하는 상기 텍스트 중 어느 하나에 사용된 상기 단어 각각의 단어 ID와, 총 단어 발생 카운트와, 임의의 상기 텍스트에 사용된 상기 단어 각각의 상기 단어 ID와 결합되는 포함 텍스트 카운트를 저장하는 전체 통계표를 포함하고, 상기 총 단어 발생 카운트는 상기 텍스트 베이스를 구성하는 상기 텍스트 전체의 총 발생수를 가리키며, 상기 포함 텍스트 카운트는 임의의 상기 텍스트에 사용된 상기 단어 각각을 포함하는 텍스트의 수를 가리키며,상기 중요도는 상기 선택된 텍스트에 대해 주어진 상기 단어 발생 카운트와, 상기 선택된 텍스트의 수와, 상기 선택된 텍스트에 포함된 상기 단어 각각에 대해 규정된 수량과의 합에 비례하여, 상기 단어 각각이 상기 텍스트 베이스를 구성하는 상기 텍스트에 보다 많이 나타나면 상기 수량이 더 작아지도록 한 시스템.
- 제 58 항에 있어서, 상기 중요도, 즉 I(Wj)는,로 규정되고, 여기서, Wj는 상기 선택된 텍스트에 포함된 상기 단어 각각의 단어 ID이고, C는 상수이고, WOr(Wj)는 상기 검색된 텍스트(RTr) 각각내의 상기 단어(Wj) 각각의 상기 단어 발생 카운트이고, RCT(Wj)는 상기 단어(Wj) 각각을 포함하는 상기 선택된 텍스트의 수이고, IDF(Wj)는 RTr이 상기 검색된 텍스트 각각의 텍스트 ID이고 r=1,2,...,R(R=검색된 텍스트의 수)인 경우의 상기 수량인 시스템.
- 제 59 항에 있어서, 상기 이용자가 적어도 1개의 텍스트를 선택하는 것을 허용하는 상기 수단은,상기 이용자가 그의 또는 그녀가 깊이 생각한 검색 조건을 사용하여 질문 요청을 발행하여 검색된 텍스트의 목록을 얻는 것을 허용하는 수단과,상기 이용자가 상기 검색된 텍스트로부터 상기 적어도 1개의 텍스트를 선택하는 것을 허용하는 수단을 포함하는 시스템.
- 제 57 항에 있어서, 제1 질문 응답과 상기 제1 질문 응답 후에 발행된 제2 질문 응답이 제1 선택된 텍스트의 제1 텍스트 ID의 제1 목록과 제2 선택된 텍스트의 제2 텍스트 ID의 제2 목록에 귀착되어 상기 제2 목록이 상기 제1 목록의 부분 집합이 되는 판정에 응답하며, 상기 제1 선택된 텍스트에 사용된 단어상의 통계 정보와 상기 제2 선택된 텍스트에 사용된 단어상의 통계 정보를 사용하여, 상기 제1 선택된 텍스트에 포함된 상기 단어 각각에 대해 분포 지수를 계산하는 수단과,상기 중요도에 상기 분포 지수로 가중치 부여하는 수단을 더 포함하며,상기 분포 지수는, 각 단어가 상기 제2 선택된 목록에 기입된 텍스트에 더 많이 분포되고 상기 제1 선택된 텍스트에 더 적게 분포되면, 단어의 상기 지수가 더 커지도록 규정되는 시스템.
- 제 61 항에 있어서, 상기 분포 지수는 {(MA/CTA(Wj)*(CTB(Wj)/MB)}로 VYTLELH고, 여기서 MA, MB는 상기 목록과 상기 더 작은 목록에 각각 기입된 텍스트의 수이고, CTA(Wj), CTA(Wj)는 상기 목록과 상기 더 작은 목록에 각각 기입되며 상기 선택된 텍스트에 포함된 상기 단어(Wj) 각각을 포함하는 텍스트의 수인 시스템.
- 제 58 항에 있어서, 상기 목록은 상기 선택된 텍스트의 적합도의 순으로 소트되고, 상기 시스템은 상기 소트된 목록을 수신하고 상기 소트된 목록의 상기 선택된 목록의 각각에 소정의 가중치를 할당하고, 상기 중요도를 표시하는 수단은 상기 단어 발생 카운트에 상기 소정의 가중치를 가중치 부여하는 수단을 포함하는 시스템.
- 제 57 항에 있어서, 상기 선택된 텍스트에 포함된 상기 단어 각각에 대해 실시되며, 단어를 포함하는 텍스트의 수가 소정의 범위 이내인지 여부를 알아보기 위해 테스트를 하는 수단과,상기 단어가 상기 테스트를 통과하지 않았음의 판정에 응답하여, 상기 선택된 키워드의 후보자에서 상기 단어를 제외하는 수단을 더 포함하는 시스템.
- 제 58 항에 있어서, 상기 텍스트 베이스를 구성하는 텍스트 각각에 대해 실시되며, 상기 텍스트 베이스를 구성하는 상기 텍스트 각각의 상기 워드 각각의 발생 각각과, 상기 각각의 텍스트의 일부와, 상기 발생 각각의 일부를 관리하는 수단과,상기 텍스트 각각의 가능한 일부 각각에 소정의 가중치 인자를 할당하는 수단과,상기 텍스트 각각에 대해 실시되며, 상기 단어 각각에 대해 텍스트 단위로 가중치를 산출하기 위해 상기 단어 각각의 상기 발생 각각의 상기 일부와 결합된 상기 소정의 가중치 인자를 축적하는 수단을 더 포함하고, 상기 중요도를 규정하는 상기 수단은 상기 단어 각각에 텍스트 단위로 상기 가중치를 부여하는 수단을 포함하는 시스템.
- 제 57 항에 있어서, 상기 텍스트 베이스를 구성하는 텍스트 각각에 대해 실시되며, 상기 텍스트를 구성하는 상기 텍스트 각각의 상기 단어 각각의 발생 각각과, 상기 발생 각각의 상기 텍스트 각각내의 위치를 관리하는 수단과,상기 텍스트 각각의 상기 단어 각각의 상기 발생 각각에 대해, 상기 위치와 상기 질문 요청에 사용된 키워드 각각의 위치와의 간격을 계산하는 수단과,소정의 간격 범위 각각에 소정의 가중치 인자를 할당하는 수단과,상기 텍스트 베이스를 구성하는 텍스트 각각에 대해, 상기 단어 각각에 대해 텍스트 단위로 가중치를 산출하도록, 상기 단어 각각의 상기 발생 각각에 상기 키워드 각각의 상기 간격과 결합된 상기 소정의 가중치 인자를 축적하는 수단을 더 포함하고, 상기 중요도를 규정하는 상기 수단은 상기 단어 발생 카운트의 각각에 텍스트 단위로 상기 가중치를 부여하는 수단을 포함하는 시스템.
- 제 57 항에 있어서, 상기 중요도에, 상기 선택된 텍스트의 상기 단어 각각의 속성과 결합된 가중치를 부여하는 수단을 더 포함하는 시스템.
- 제 57 항에 있어서, 임의의 2개의 상기 소트된 단어내에나, 임의의 상기 소트된 단어와 상기 질문 요청에 사용된 임의의 키워드 사이 중에 어떤 포함 관계가 발견됨의 판정에 응답하여, 소정의 기준에 기초하여 상기 포함 관계에 포함된 2개의 단어 중 하나를 선택하는 수단을 더 포함하는 시스템.
- 제 67 항에 있어서, 상기 포함 관계에 포함된 상기 2개의 단어 사이의 길이를 비교하기 위해 상기 소정의 기준을 설정하는 수단을 더 포함하는 시스템.
- 제 67 항에 있어서, 상기 포함 관계에 포함된 상기 2개의 단어 사이의 중요도를 비교하기 위해 상기 소정의 기준을 설정하는 수단을 더 포함하는 시스템.
- 제 67 항에 있어서, 상기 2개의 단어 중 하나를 선택하는 수단은 상기 2개의 단어 사이의 더 짧은 단어 및/또는 차이를 선택하는 수단을 포함하는 시스템.
- 제 59 항에 있어서, 상기 질문 요청에 사용된 키워드와 상기 기능으로부터의 상기 목록에 기초하여 실시되며, 상기 선택된 텍스트의 적합도 순으로 상기 목록을 소트하는 수단과,상기 소트된 목록의 상기 선택된 텍스트의 각각에 소저의 가중치를 할당하는 수단을 더 포함하고, 상기 중요도를 표시하는 상기 수단은 상기 단어 발생 카운트(WOr(Wj))에 상기 선택된 텍스트(RTr) 각각과 결합된 상기 소정의 가중치 중 하나를 가중치 부여하는 수단을 포함하는 시스템.
- 제 57 항에 있어서, 상기 소트된 단어를 디스플레이를 위해 상기 소트된 단어의 속성 단위로 유사한 키워드의 그룹으로 분류하는 수단을 더 포함하는 시스템.
- 제 73 항에 있어서, 상기 그룹 대신에 대표 키워드를 디스플레이 하는 수단을 더 포함하는 시스템.
- 제 57 항에 있어서, 상기 이용자를 돕는 상기 수단은, 상기 이용자로부터의 소정의 입력에 응답하여, 상기 관련 단어의 상기 소정의 수의 적어도 일부를 사용하여 상기 질문 요청을 자동적으로 발생하는 수단을 포함하는 시스템.
- 제 57 항에 있어서, 상기 관련 단어의 상기 소정의 수를 저장하는 수단과,상기 이용자로부터의 소정의 입력에 응답하며, 상기 관련 키워드의 상기 저장된 소정의 수를 디스플레이 하는 수단을 더 포함하는 시스템.
- 제 57 항에 있어서, 분리 가능한 대량 기억 매체용으로 개조된 기억 매체 드라이브를 더 포함하고, 상기 텍스트 베이스를 구성하는 텍스트의 상기 다양성은 상기 분리 가능한 기억 매체 중 하나에 저장되는 시스템.
- 제 57 항에 있어서, 양방향 통신 수단을 더 포함하고, 서버 및 클라이언트 시스템에 배치되는 시스템.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP17682297A JP3607462B2 (ja) | 1997-07-02 | 1997-07-02 | 関連キーワード自動抽出装置及びこれを用いた文書検索システム |
JP97-176822 | 1997-07-02 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR19990013736A true KR19990013736A (ko) | 1999-02-25 |
KR100304335B1 KR100304335B1 (ko) | 2001-11-22 |
Family
ID=16020456
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019980027734A KR100304335B1 (ko) | 1997-07-02 | 1998-07-02 | 키워드 추출 시스템 및 그를 사용한 문서 검색 시스템 |
Country Status (6)
Country | Link |
---|---|
US (1) | US6212517B1 (ko) |
EP (1) | EP0889419B1 (ko) |
JP (1) | JP3607462B2 (ko) |
KR (1) | KR100304335B1 (ko) |
CN (1) | CN1198225C (ko) |
DE (1) | DE69833238T2 (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005083593A1 (en) * | 2004-02-26 | 2005-09-09 | Nhn Corporation | A method for providing search results list based on importance information and system thereof |
KR100906928B1 (ko) * | 2007-03-26 | 2009-07-10 | 엔에이치엔비즈니스플랫폼 주식회사 | 비즈니스 키워드에 대한 연관 요소를 반영하는 검색어 추천 서비스 방법, 컴퓨터 판독 가능 기록 매체 및 그 시스템 |
US7657555B2 (en) | 2000-05-22 | 2010-02-02 | Yahoo! Inc | Method and apparatus for identifying related searches in a database search system |
Families Citing this family (157)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3664874B2 (ja) * | 1998-03-28 | 2005-06-29 | 松下電器産業株式会社 | 文書検索装置 |
IL126373A (en) | 1998-09-27 | 2003-06-24 | Haim Zvi Melman | Apparatus and method for search and retrieval of documents |
JP2000132560A (ja) * | 1998-10-23 | 2000-05-12 | Matsushita Electric Ind Co Ltd | 中国語テレテキスト処理方法及び装置 |
JP3760057B2 (ja) * | 1998-11-19 | 2006-03-29 | 株式会社日立製作所 | 複数文書データベースを対象とした文書検索方法および文書検索サービス |
JP3603721B2 (ja) * | 1999-02-25 | 2004-12-22 | 日本電信電話株式会社 | データ検索支援方法及び装置及びデータ検索支援プログラムを格納した記憶媒体 |
US8572069B2 (en) | 1999-03-31 | 2013-10-29 | Apple Inc. | Semi-automatic index term augmentation in document retrieval |
US6408294B1 (en) * | 1999-03-31 | 2002-06-18 | Verizon Laboratories Inc. | Common term optimization |
US8275661B1 (en) | 1999-03-31 | 2012-09-25 | Verizon Corporate Services Group Inc. | Targeted banner advertisements |
WO2000058863A1 (en) | 1999-03-31 | 2000-10-05 | Verizon Laboratories Inc. | Techniques for performing a data query in a computer system |
JP3327877B2 (ja) | 1999-04-14 | 2002-09-24 | キヤノン株式会社 | 情報提供方法、情報提供システム、端末装置および情報提供プログラムを格納した記憶媒体 |
JP3376311B2 (ja) | 1999-04-14 | 2003-02-10 | キヤノン株式会社 | 情報提供方法および情報提供システム |
JP2000298677A (ja) * | 1999-04-14 | 2000-10-24 | Canon Inc | 情報検索方法、情報検索装置および記憶媒体 |
JP3368237B2 (ja) * | 1999-04-14 | 2003-01-20 | キヤノン株式会社 | コード処理方法、端末装置及び記憶媒体 |
JP3747133B2 (ja) | 1999-04-14 | 2006-02-22 | キヤノン株式会社 | 携帯端末及びその制御方法及びその記憶媒体 |
JP3558267B2 (ja) * | 1999-05-06 | 2004-08-25 | 株式会社エヌ・ティ・ティ・データ | 文書検索装置 |
US6385611B1 (en) * | 1999-05-07 | 2002-05-07 | Carlos Cardona | System and method for database retrieval, indexing and statistical analysis |
US7844594B1 (en) | 1999-06-18 | 2010-11-30 | Surfwax, Inc. | Information search, retrieval and distillation into knowledge objects |
US6718363B1 (en) * | 1999-07-30 | 2004-04-06 | Verizon Laboratories, Inc. | Page aggregation for web sites |
JP3725373B2 (ja) * | 1999-08-04 | 2005-12-07 | 富士通株式会社 | 単語重要度計算装置、文書検索装置、単語重要度計算プログラムを記録したコンピュータ読み取り可能な記録媒体および文書検索プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP3855551B2 (ja) * | 1999-08-25 | 2006-12-13 | 株式会社日立製作所 | 検索方法及び検索システム |
US6701310B1 (en) * | 1999-11-22 | 2004-03-02 | Nec Corporation | Information search device and information search method using topic-centric query routing |
US6751612B1 (en) * | 1999-11-29 | 2004-06-15 | Xerox Corporation | User query generate search results that rank set of servers where ranking is based on comparing content on each server with user query, frequency at which content on each server is altered using web crawler in a search engine |
US20020059223A1 (en) * | 1999-11-30 | 2002-05-16 | Nash Paul R. | Locator based assisted information browsing |
NL1013793C1 (nl) * | 1999-12-08 | 2001-06-11 | Eidetica B V | Documentenzoeksysteem met automatische veldselectie en veldgestuurde documentsortering. |
US6845369B1 (en) * | 2000-01-14 | 2005-01-18 | Relevant Software Inc. | System, apparatus and method for using and managing digital information |
JP4608740B2 (ja) * | 2000-02-21 | 2011-01-12 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム格納媒体 |
US7428500B1 (en) | 2000-03-30 | 2008-09-23 | Amazon. Com, Inc. | Automatically identifying similar purchasing opportunities |
US7007232B1 (en) * | 2000-04-07 | 2006-02-28 | Neoplasia Press, Inc. | System and method for facilitating the pre-publication peer review process |
US7555557B2 (en) * | 2000-04-07 | 2009-06-30 | Avid Technology, Inc. | Review and approval system |
US6912525B1 (en) | 2000-05-08 | 2005-06-28 | Verizon Laboratories, Inc. | Techniques for web site integration |
US7617184B2 (en) * | 2000-05-18 | 2009-11-10 | Endeca Technologies, Inc. | Scalable hierarchical data-driven navigation system and method for information retrieval |
US7062483B2 (en) * | 2000-05-18 | 2006-06-13 | Endeca Technologies, Inc. | Hierarchical data-driven search and navigation system and method for information retrieval |
US7035864B1 (en) | 2000-05-18 | 2006-04-25 | Endeca Technologies, Inc. | Hierarchical data-driven navigation system and method for information retrieval |
US6883001B2 (en) * | 2000-05-26 | 2005-04-19 | Fujitsu Limited | Document information search apparatus and method and recording medium storing document information search program therein |
JP3870666B2 (ja) * | 2000-06-02 | 2007-01-24 | 株式会社日立製作所 | 文書検索方法および装置並びにその処理プログラムを記録した記録媒体 |
KR100408965B1 (ko) * | 2000-06-26 | 2003-12-06 | 주식회사쓰리소프트 | 검색조건을 추천하는 검색결과 제공방법 및 검색서버 |
KR20000063310A (ko) * | 2000-06-26 | 2000-11-06 | 민재기 | 통신망을 통한 명사의 순위 검색 시스템과 그 방법 |
JP3573688B2 (ja) * | 2000-06-28 | 2004-10-06 | 松下電器産業株式会社 | 類似文書検索装置及び関連キーワード抽出装置 |
US6598040B1 (en) * | 2000-08-14 | 2003-07-22 | International Business Machines Corporation | Method and system for processing electronic search expressions |
EP1816553B1 (en) | 2000-12-21 | 2011-08-31 | Xerox Corporation | Systems and computer program products for the display and operation of virtual three-dimensional books |
JP2002189754A (ja) * | 2000-12-21 | 2002-07-05 | Ricoh Co Ltd | 文書検索装置及び文書検索方法 |
US7203673B2 (en) * | 2000-12-27 | 2007-04-10 | Fujitsu Limited | Document collection apparatus and method for specific use, and storage medium storing program used to direct computer to collect documents |
WO2002069203A2 (en) * | 2001-02-28 | 2002-09-06 | The Johns Hopkins University | Method for identifying term importance to a sample text using reference text |
JP4671212B2 (ja) * | 2001-03-26 | 2011-04-13 | 株式会社リコー | 文書検索装置、文書検索方法、プログラムおよび記録媒体 |
US6681219B2 (en) * | 2001-03-29 | 2004-01-20 | Matsushita Electric Industrial Co., Ltd. | Method for keyword proximity searching in a document database |
CA2373568C (en) | 2001-04-26 | 2008-06-17 | Hitachi, Ltd. | Method of searching similar document, system for performing the same and program for processing the same |
US6795820B2 (en) * | 2001-06-20 | 2004-09-21 | Nextpage, Inc. | Metasearch technique that ranks documents obtained from multiple collections |
EP1276061A1 (en) * | 2001-07-09 | 2003-01-15 | Accenture | Computer based system and method of determining a satisfaction index of a text |
US6732092B2 (en) * | 2001-09-28 | 2004-05-04 | Client Dynamics, Inc. | Method and system for database queries and information delivery |
CN1327334C (zh) * | 2001-11-08 | 2007-07-18 | 住友电气工业株式会社 | 文件分组装置 |
JP2003316807A (ja) * | 2002-04-23 | 2003-11-07 | Communication Research Laboratory | 情報検索装置及び情報検索ソフトウェアを格納した記憶媒体 |
US7131117B2 (en) * | 2002-09-04 | 2006-10-31 | Sbc Properties, L.P. | Method and system for automating the analysis of word frequencies |
US7440941B1 (en) * | 2002-09-17 | 2008-10-21 | Yahoo! Inc. | Suggesting an alternative to the spelling of a search query |
US6947930B2 (en) * | 2003-03-21 | 2005-09-20 | Overture Services, Inc. | Systems and methods for interactive search query refinement |
US7346493B2 (en) | 2003-03-25 | 2008-03-18 | Microsoft Corporation | Linguistically informed statistical models of constituent structure for ordering in sentence realization for a natural language generation system |
US7194460B2 (en) * | 2003-03-31 | 2007-03-20 | Kabushiki Kaisha Toshiba | Search device, search system, and search method |
JP4049317B2 (ja) | 2003-05-14 | 2008-02-20 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 検索支援装置およびプログラム |
US7359905B2 (en) * | 2003-06-24 | 2008-04-15 | Microsoft Corporation | Resource classification and prioritization system |
GB2403558A (en) * | 2003-07-02 | 2005-01-05 | Sony Uk Ltd | Document searching and method for presenting the results |
JP4552401B2 (ja) * | 2003-08-19 | 2010-09-29 | 富士ゼロックス株式会社 | 文書処理装置および方法 |
US20050060290A1 (en) * | 2003-09-15 | 2005-03-17 | International Business Machines Corporation | Automatic query routing and rank configuration for search queries in an information retrieval system |
US20050091194A1 (en) * | 2003-10-10 | 2005-04-28 | Jupp Peter A. | List acquisition method and system |
US7370034B2 (en) * | 2003-10-15 | 2008-05-06 | Xerox Corporation | System and method for performing electronic information retrieval using keywords |
CN100437561C (zh) * | 2003-12-17 | 2008-11-26 | 国际商业机器公司 | 电子文档的处理方法和装置及其系统 |
US7672927B1 (en) | 2004-02-27 | 2010-03-02 | Yahoo! Inc. | Suggesting an alternative to the spelling of a search query |
US7716216B1 (en) * | 2004-03-31 | 2010-05-11 | Google Inc. | Document ranking based on semantic distance between terms in a document |
JP4569178B2 (ja) * | 2004-06-03 | 2010-10-27 | 富士ゼロックス株式会社 | 分類符号処理装置 |
JP4569179B2 (ja) * | 2004-06-03 | 2010-10-27 | 富士ゼロックス株式会社 | ドキュメント検索装置 |
US7594277B2 (en) * | 2004-06-30 | 2009-09-22 | Microsoft Corporation | Method and system for detecting when an outgoing communication contains certain content |
JP4525224B2 (ja) * | 2004-07-26 | 2010-08-18 | 富士ゼロックス株式会社 | ドキュメント管理プログラム、ドキュメント管理方法、及びドキュメント管理装置 |
US7110949B2 (en) * | 2004-09-13 | 2006-09-19 | At&T Knowledge Ventures, L.P. | System and method for analysis and adjustment of speech-enabled systems |
US7043435B2 (en) * | 2004-09-16 | 2006-05-09 | Sbc Knowledgfe Ventures, L.P. | System and method for optimizing prompts for speech-enabled applications |
WO2006047790A2 (en) * | 2004-10-27 | 2006-05-04 | Client Dynamics, Inc. | Enhanced client relationship management systems and methods with a recommendation engine |
JP2006155275A (ja) * | 2004-11-30 | 2006-06-15 | Denso It Laboratory Inc | 情報抽出方法及び情報抽出装置 |
US7493273B1 (en) * | 2005-01-19 | 2009-02-17 | Earthtrax, Inc. | Method, medium, and apparatus for identifying similar auctions |
JP2006215916A (ja) * | 2005-02-04 | 2006-08-17 | Denso It Laboratory Inc | 映像閲覧装置及び映像閲覧方法 |
JP2006285460A (ja) * | 2005-03-31 | 2006-10-19 | Konica Minolta Holdings Inc | 情報検索システム |
JP2006331245A (ja) * | 2005-05-30 | 2006-12-07 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索装置、情報検索方法およびプログラム |
KR100657318B1 (ko) * | 2005-06-29 | 2006-12-14 | 삼성전자주식회사 | 이미지 선택방법 및 장치 |
JP4504878B2 (ja) * | 2005-06-30 | 2010-07-14 | 株式会社野村総合研究所 | 文書処理装置 |
WO2007011140A1 (en) * | 2005-07-15 | 2007-01-25 | Chutnoon Inc. | Method of extracting topics and issues and method and apparatus for providing search results based on topics and issues |
JP4314221B2 (ja) | 2005-07-28 | 2009-08-12 | 株式会社東芝 | 構造化文書記憶装置、構造化文書検索装置、構造化文書システム、方法およびプログラム |
US20070078833A1 (en) * | 2005-10-03 | 2007-04-05 | Powerreviews, Inc. | System for obtaining reviews using selections created by user base |
US7730081B2 (en) * | 2005-10-18 | 2010-06-01 | Microsoft Corporation | Searching based on messages |
US8019752B2 (en) * | 2005-11-10 | 2011-09-13 | Endeca Technologies, Inc. | System and method for information retrieval from object collections with complex interrelationships |
US7620651B2 (en) * | 2005-11-15 | 2009-11-17 | Powerreviews, Inc. | System for dynamic product summary based on consumer-contributed keywords |
JP4719921B2 (ja) * | 2005-11-15 | 2011-07-06 | 独立行政法人情報通信研究機構 | データ表示装置およびデータ表示プログラム |
JP4172801B2 (ja) * | 2005-12-02 | 2008-10-29 | インターナショナル・ビジネス・マシーンズ・コーポレーション | テキストからキーワードを検索する効率的なシステム、および、その方法 |
US7627559B2 (en) * | 2005-12-15 | 2009-12-01 | Microsoft Corporation | Context-based key phrase discovery and similarity measurement utilizing search engine query logs |
US7962466B2 (en) * | 2006-01-23 | 2011-06-14 | Chacha Search, Inc | Automated tool for human assisted mining and capturing of precise results |
US20070174258A1 (en) * | 2006-01-23 | 2007-07-26 | Jones Scott A | Targeted mobile device advertisements |
US8117196B2 (en) * | 2006-01-23 | 2012-02-14 | Chacha Search, Inc. | Search tool providing optional use of human search guides |
US8065286B2 (en) | 2006-01-23 | 2011-11-22 | Chacha Search, Inc. | Scalable search system using human searchers |
US8266130B2 (en) * | 2006-01-23 | 2012-09-11 | Chacha Search, Inc. | Search tool providing optional use of human search guides |
JP4699909B2 (ja) * | 2006-01-25 | 2011-06-15 | 株式会社野村総合研究所 | キーワード対応関係分析装置及び分析方法 |
JP2007265068A (ja) * | 2006-03-29 | 2007-10-11 | National Institute Of Information & Communication Technology | 文書差分検出装置及びプログラム |
US7716229B1 (en) | 2006-03-31 | 2010-05-11 | Microsoft Corporation | Generating misspells from query log context usage |
JP2007323238A (ja) * | 2006-05-31 | 2007-12-13 | National Institute Of Information & Communication Technology | 強調表示装置及びプログラム |
JP4948071B2 (ja) * | 2006-07-28 | 2012-06-06 | 三菱スペース・ソフトウエア株式会社 | コンテンツ検索装置及びコンテンツ検索プログラム |
WO2008059515A2 (en) * | 2006-08-01 | 2008-05-22 | Divyank Turakhia | A system and method of generating related words and word concepts |
CN100444591C (zh) * | 2006-08-18 | 2008-12-17 | 北京金山软件有限公司 | 获取网页关键字的方法及其应用系统 |
US20100031142A1 (en) * | 2006-10-23 | 2010-02-04 | Nec Corporation | Content summarizing system, method, and program |
US20080113801A1 (en) * | 2006-11-13 | 2008-05-15 | Roland Moreno | Game based on combinations of words and implemented by computer means |
US8676802B2 (en) * | 2006-11-30 | 2014-03-18 | Oracle Otc Subsidiary Llc | Method and system for information retrieval with clustering |
US7630978B2 (en) * | 2006-12-14 | 2009-12-08 | Yahoo! Inc. | Query rewriting with spell correction suggestions using a generated set of query features |
JP5332128B2 (ja) * | 2007-03-30 | 2013-11-06 | 富士通株式会社 | 情報検索装置、情報検索方法およびそのプログラム |
US20080300971A1 (en) * | 2007-05-30 | 2008-12-04 | Microsoft Corporation | Advertisement approval based on training data |
US20080313202A1 (en) * | 2007-06-12 | 2008-12-18 | Yakov Kamen | Method and apparatus for semantic keyword clusters generation |
US8195687B2 (en) | 2007-08-08 | 2012-06-05 | Panasonic Corporation | Program retrieval support device for accumulating and searching pieces of program information and corresponding programs and a method for performing the same |
JP4771485B2 (ja) * | 2007-08-20 | 2011-09-14 | 日本電信電話株式会社 | 文書間距離演算装置、プログラムおよび記録媒体 |
US8108405B2 (en) * | 2007-10-05 | 2012-01-31 | Fujitsu Limited | Refining a search space in response to user input |
US8694483B2 (en) * | 2007-10-19 | 2014-04-08 | Xerox Corporation | Real-time query suggestion in a troubleshooting context |
JP5315664B2 (ja) * | 2007-10-29 | 2013-10-16 | 沖電気工業株式会社 | 位置表現検出装置、プログラム、及び、記憶媒体 |
US7856434B2 (en) * | 2007-11-12 | 2010-12-21 | Endeca Technologies, Inc. | System and method for filtering rules for manipulating search results in a hierarchical search and navigation system |
JP5104329B2 (ja) * | 2008-01-16 | 2012-12-19 | 大日本印刷株式会社 | ドキュメント検索システム |
US20090241165A1 (en) * | 2008-03-19 | 2009-09-24 | Verizon Business Network Service, Inc. | Compliance policy management systems and methods |
JP2009245179A (ja) * | 2008-03-31 | 2009-10-22 | Nomura Research Institute Ltd | 文書検索支援装置 |
JP4587236B2 (ja) * | 2008-08-26 | 2010-11-24 | Necビッグローブ株式会社 | 情報検索装置、情報検索方法、およびプログラム |
JP5380989B2 (ja) * | 2008-09-30 | 2014-01-08 | カシオ計算機株式会社 | 辞書機能を備えた電子装置およびプログラム |
US8468158B2 (en) * | 2008-11-06 | 2013-06-18 | Yahoo! Inc. | Adaptive weighted crawling of user activity feeds |
WO2010061537A1 (ja) | 2008-11-26 | 2010-06-03 | 日本電気株式会社 | 検索装置、検索方法、及びプログラムが格納された記録媒体 |
US8112393B2 (en) * | 2008-12-05 | 2012-02-07 | Yahoo! Inc. | Determining related keywords based on lifestream feeds |
US8451734B2 (en) * | 2008-12-22 | 2013-05-28 | Telecom Italia S.P.A. | Measurement of data loss in a communication network |
KR101065091B1 (ko) | 2009-02-17 | 2011-09-16 | 엔에이치엔(주) | 기여 점수에 기초한 문서 순위 결정 시스템 및 방법 |
JP5321258B2 (ja) * | 2009-06-09 | 2013-10-23 | 日本電気株式会社 | 情報収集システムおよび情報収集方法ならびにそのプログラム |
JP5261326B2 (ja) * | 2009-08-28 | 2013-08-14 | 日本電信電話株式会社 | 情報検索装置、情報検索プログラム |
CN102053977A (zh) * | 2009-11-04 | 2011-05-11 | 阿里巴巴集团控股有限公司 | 一种搜索结果生成方法及信息搜索系统 |
WO2011074698A1 (ja) * | 2009-12-17 | 2011-06-23 | 日本電気株式会社 | テキストマイニングシステム、テキストマイニング方法および記録媒体 |
US8788342B2 (en) | 2010-03-04 | 2014-07-22 | Yahoo! Inc. | Intelligent feature expansion of online text ads |
JP5362651B2 (ja) * | 2010-06-07 | 2013-12-11 | 日本電信電話株式会社 | 重要語句抽出装置及び方法及びプログラム |
CN102289436B (zh) * | 2010-06-18 | 2013-12-25 | 阿里巴巴集团控股有限公司 | 确定搜索词权重值方法及装置、搜索结果生成方法及装置 |
CN102014199A (zh) * | 2010-09-16 | 2011-04-13 | 宇龙计算机通信科技(深圳)有限公司 | 一种信息显示方法及终端 |
KR101086566B1 (ko) | 2010-09-27 | 2011-11-23 | 엔에이치엔(주) | 문서 순위 점수의 동적 갱신을 위한 방법 및 장치 |
EP2680251B1 (en) * | 2011-02-22 | 2016-05-25 | Mitsubishi Electric Corporation | Search system, search method for search system, information processing device, search program, corresponding keyword management device and corresponding keyword management system |
JP5044707B1 (ja) * | 2011-03-31 | 2012-10-10 | 株式会社東芝 | 情報処理システム、情報処理装置およびプログラム |
JP5248655B2 (ja) * | 2011-05-18 | 2013-07-31 | 株式会社東芝 | 情報処理装置およびプログラム |
US20130024459A1 (en) * | 2011-07-20 | 2013-01-24 | Microsoft Corporation | Combining Full-Text Search and Queryable Fields in the Same Data Structure |
US8572096B1 (en) * | 2011-08-05 | 2013-10-29 | Google Inc. | Selecting keywords using co-visitation information |
JP5639549B2 (ja) * | 2011-08-22 | 2014-12-10 | 日本電信電話株式会社 | 情報検索装置及び方法及びプログラム |
US20130110839A1 (en) * | 2011-10-31 | 2013-05-02 | Evan R. Kirshenbaum | Constructing an analysis of a document |
JP5595426B2 (ja) * | 2012-01-05 | 2014-09-24 | 日本電信電話株式会社 | 単語抽出方法及び装置及びプログラム |
JP5597653B2 (ja) * | 2012-01-05 | 2014-10-01 | 日本電信電話株式会社 | 単語抽出装置及び方法及びプログラム |
JP2012216239A (ja) * | 2012-07-12 | 2012-11-08 | Toshiba Corp | 情報処理装置、プログラムおよび情報検索方法 |
CN103678365B (zh) | 2012-09-13 | 2017-07-18 | 阿里巴巴集团控股有限公司 | 数据的动态获取方法、装置及系统 |
TW201411379A (zh) * | 2012-09-14 | 2014-03-16 | Hon Hai Prec Ind Co Ltd | 搜索系統及方法 |
US9678993B2 (en) | 2013-03-14 | 2017-06-13 | Shutterstock, Inc. | Context based systems and methods for presenting media file annotation recommendations |
JP2014178965A (ja) * | 2013-03-15 | 2014-09-25 | Ntt Docomo Inc | 意味属性推定装置、意味属性推定方法及び意味属性推定プログラム |
US9244952B2 (en) | 2013-03-17 | 2016-01-26 | Alation, Inc. | Editable and searchable markup pages automatically populated through user query monitoring |
CN104281603B (zh) * | 2013-07-05 | 2018-01-19 | 北大方正集团有限公司 | 字频分级统计方法及系统 |
JP6107513B2 (ja) * | 2013-07-29 | 2017-04-05 | 富士通株式会社 | 情報処理システム、情報処理方法、および情報処理プログラム |
KR101541306B1 (ko) * | 2013-11-11 | 2015-08-04 | 주식회사 엘지씨엔에스 | 컴퓨터 실행 가능한 중요 키워드 추출 방법, 이를 수행하는 중요 키워드 추출 서버 및 이를 저장하는 기록매체 |
US9875246B2 (en) * | 2014-10-02 | 2018-01-23 | Liquid Presentation LLC | System and method for generating and displaying a cocktail recipe presentation |
JP5818391B2 (ja) * | 2014-10-29 | 2015-11-18 | シャープ株式会社 | 情報処理システムおよび電子機器 |
US10977284B2 (en) * | 2016-01-29 | 2021-04-13 | Micro Focus Llc | Text search of database with one-pass indexing including filtering |
WO2020213776A1 (ko) * | 2019-04-19 | 2020-10-22 | 한국과학기술원 | 토론 상황 시 객관적이고 구체적이고 정보가 풍부한 근거 문장 검색에 특화된 자질 추출기 |
JP6764973B1 (ja) * | 2019-04-25 | 2020-10-07 | みずほ情報総研株式会社 | 関連語辞書作成システム、関連語辞書作成方法及び関連語辞書作成プログラム |
CN112084771B (zh) * | 2020-07-22 | 2024-06-18 | 浙江工业大学 | 一种基于地址的单字权重统计方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0520362A (ja) * | 1991-07-10 | 1993-01-29 | Tokyo Electric Power Co Inc:The | 文書テキスト間の連鎖自動作成システム |
US5278980A (en) | 1991-08-16 | 1994-01-11 | Xerox Corporation | Iterative technique for phrase query formation and an information retrieval system employing same |
JP2542464B2 (ja) * | 1991-09-20 | 1996-10-09 | 日本電信電話株式会社 | 文書検索装置 |
JPH05135107A (ja) * | 1991-11-14 | 1993-06-01 | Ricoh Co Ltd | 文書検索装置 |
JP2583386B2 (ja) | 1993-03-29 | 1997-02-19 | 日本電気株式会社 | キーワード自動抽出装置 |
JP3361563B2 (ja) * | 1993-04-13 | 2003-01-07 | 松下電器産業株式会社 | 形態素解析装置及びキーワード抽出装置 |
JP3220885B2 (ja) | 1993-06-18 | 2001-10-22 | 株式会社日立製作所 | キーワード付与システム |
JPH07192010A (ja) * | 1993-12-27 | 1995-07-28 | Canon Inc | 文書処理装置 |
JPH08221448A (ja) * | 1995-02-10 | 1996-08-30 | Canon Inc | キーワード抽出装置 |
JPH08272822A (ja) * | 1995-03-29 | 1996-10-18 | Fuji Xerox Co Ltd | 文書登録装置及び文書検索装置 |
WO1997012334A1 (en) | 1995-09-25 | 1997-04-03 | International Compu Research, Inc. | Matching and ranking legal citations |
US5826261A (en) * | 1996-05-10 | 1998-10-20 | Spencer; Graham | System and method for querying multiple, distributed databases by selective sharing of local relative significance information for terms related to the query |
-
1997
- 1997-07-02 JP JP17682297A patent/JP3607462B2/ja not_active Expired - Lifetime
-
1998
- 1998-06-30 US US09/106,748 patent/US6212517B1/en not_active Expired - Lifetime
- 1998-07-01 DE DE69833238T patent/DE69833238T2/de not_active Expired - Lifetime
- 1998-07-01 EP EP98112174A patent/EP0889419B1/en not_active Expired - Lifetime
- 1998-07-02 CN CNB981159095A patent/CN1198225C/zh not_active Expired - Lifetime
- 1998-07-02 KR KR1019980027734A patent/KR100304335B1/ko not_active IP Right Cessation
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7657555B2 (en) | 2000-05-22 | 2010-02-02 | Yahoo! Inc | Method and apparatus for identifying related searches in a database search system |
WO2005083593A1 (en) * | 2004-02-26 | 2005-09-09 | Nhn Corporation | A method for providing search results list based on importance information and system thereof |
US7756868B2 (en) | 2004-02-26 | 2010-07-13 | Nhn Corporation | Method for providing search results list based on importance information and system thereof |
KR100906928B1 (ko) * | 2007-03-26 | 2009-07-10 | 엔에이치엔비즈니스플랫폼 주식회사 | 비즈니스 키워드에 대한 연관 요소를 반영하는 검색어 추천 서비스 방법, 컴퓨터 판독 가능 기록 매체 및 그 시스템 |
Also Published As
Publication number | Publication date |
---|---|
EP0889419B1 (en) | 2006-01-18 |
CN1198225C (zh) | 2005-04-20 |
JP3607462B2 (ja) | 2005-01-05 |
DE69833238D1 (de) | 2006-04-06 |
EP0889419A2 (en) | 1999-01-07 |
KR100304335B1 (ko) | 2001-11-22 |
CN1206158A (zh) | 1999-01-27 |
US6212517B1 (en) | 2001-04-03 |
EP0889419A3 (en) | 2000-03-22 |
DE69833238T2 (de) | 2006-09-28 |
JPH1125108A (ja) | 1999-01-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100304335B1 (ko) | 키워드 추출 시스템 및 그를 사용한 문서 검색 시스템 | |
EP1012750B1 (en) | Information retrieval | |
US6480835B1 (en) | Method and system for searching on integrated metadata | |
US6389412B1 (en) | Method and system for constructing integrated metadata | |
KR101301380B1 (ko) | 네트워크 상에서의 문서의 바이어스된 클릭 거리를사용하는 순위 함수 | |
Nottelmann et al. | Evaluating different methods of estimating retrieval quality for resource selection | |
US7792833B2 (en) | Ranking search results using language types | |
KR101120760B1 (ko) | 구조화 문서 검색 | |
US7085761B2 (en) | Program for changing search results rank, recording medium for recording such a program, and content search processing method | |
US8566340B2 (en) | Provision of query suggestions independent of query logs | |
US7305406B2 (en) | Computer aided authoring, electronic document browsing, retrieving, and subscribing and publishing | |
WO2005083597A1 (en) | Intelligent search and retrieval system and method | |
JP2001084255A (ja) | 文書検索装置および方法 | |
JP3431836B2 (ja) | ドキュメントデータベースの検索支援方法とそのプログラムを記憶した記憶媒体 | |
JP3612562B2 (ja) | ディジタルデータ検索情報提示システム | |
EP2017752A1 (en) | Information processing apparatus, information processing method and program | |
JP2003173352A (ja) | 検索ログ解析方法および装置、文書情報検索方法および装置、検索ログ解析プログラム、文書情報検索プログラム、および記録媒体 | |
KR20020089677A (ko) | 문서 자동 분류 방법 및 이를 수행하기 위한 시스템 | |
JP2010055164A (ja) | 文章検索装置、文章検索方法、文章検索プログラムおよびその記録媒体 | |
KR20050074879A (ko) | 카테고리 별 키워드의 입력 순위를 제공하기 위한 검색서비스 시스템 및 그 방법 | |
JP2005010848A (ja) | 情報検索装置、情報検索方法、情報検索プログラム、及び記録媒体 | |
KR20040098889A (ko) | 웹사이트 검색 서비스 제공 방법 및 그 시스템 | |
US20090049035A1 (en) | System and method for indexing type-annotated web documents | |
JP3275813B2 (ja) | 文書検索装置、方法及び記録媒体 | |
KR100942902B1 (ko) | 웹페이지 검색 방법 및 상기 방법을 컴퓨터에서 구현하는 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 19980702 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20010430 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20010720 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20010721 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20040709 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20050711 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20060711 Start annual number: 6 End annual number: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20070710 Start annual number: 7 End annual number: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20080701 Start annual number: 8 End annual number: 8 |
|
PR1001 | Payment of annual fee |
Payment date: 20090708 Start annual number: 9 End annual number: 9 |
|
PR1001 | Payment of annual fee |
Payment date: 20100719 Start annual number: 10 End annual number: 10 |
|
PR1001 | Payment of annual fee |
Payment date: 20110617 Start annual number: 11 End annual number: 11 |
|
PR1001 | Payment of annual fee |
Payment date: 20120629 Start annual number: 12 End annual number: 12 |
|
FPAY | Annual fee payment |
Payment date: 20130701 Year of fee payment: 13 |
|
PR1001 | Payment of annual fee |
Payment date: 20130701 Start annual number: 13 End annual number: 13 |
|
FPAY | Annual fee payment |
Payment date: 20140707 Year of fee payment: 14 |
|
PR1001 | Payment of annual fee |
Payment date: 20140707 Start annual number: 14 End annual number: 14 |
|
FPAY | Annual fee payment |
Payment date: 20150619 Year of fee payment: 15 |
|
PR1001 | Payment of annual fee |
Payment date: 20150619 Start annual number: 15 End annual number: 15 |
|
FPAY | Annual fee payment |
Payment date: 20160617 Year of fee payment: 16 |
|
PR1001 | Payment of annual fee |
Payment date: 20160617 Start annual number: 16 End annual number: 16 |
|
FPAY | Annual fee payment |
Payment date: 20170619 Year of fee payment: 17 |
|
PR1001 | Payment of annual fee |
Payment date: 20170619 Start annual number: 17 End annual number: 17 |
|
EXPY | Expiration of term | ||
PC1801 | Expiration of term |
Termination date: 20190102 Termination category: Expiration of duration |