KR100396826B1 - 정보검색에서 질의어 처리를 위한 단어 클러스터 관리장치 및 그 방법 - Google Patents
정보검색에서 질의어 처리를 위한 단어 클러스터 관리장치 및 그 방법 Download PDFInfo
- Publication number
- KR100396826B1 KR100396826B1 KR10-2000-0029788A KR20000029788A KR100396826B1 KR 100396826 B1 KR100396826 B1 KR 100396826B1 KR 20000029788 A KR20000029788 A KR 20000029788A KR 100396826 B1 KR100396826 B1 KR 100396826B1
- Authority
- KR
- South Korea
- Prior art keywords
- word
- cluster
- coefficient
- words
- noun
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 87
- 238000000605 extraction Methods 0.000 claims abstract description 26
- 230000008569 process Effects 0.000 claims description 53
- 238000007726 management method Methods 0.000 claims description 32
- 238000004458 analytical method Methods 0.000 claims description 15
- 230000006870 function Effects 0.000 claims description 11
- 239000000284 extract Substances 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000008859 change Effects 0.000 claims description 3
- 230000003071 parasitic effect Effects 0.000 claims 2
- 238000010586 diagram Methods 0.000 description 16
- 150000001875 compounds Chemical class 0.000 description 9
- 238000011835 investigation Methods 0.000 description 4
- 230000000877 morphologic effect Effects 0.000 description 3
- 230000001149 cognitive effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000019771 cognition Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Algebra (AREA)
- Computational Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Artificial Intelligence (AREA)
- Pure & Applied Mathematics (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (16)
- 정보검색에서 질의어 처리를 위한 단어 클러스터 관리 장치에 있어서,정보검색에서 이용되는 단어에 대해 연계되는 관련단어를 제공할 수 있도록 단어 클러스터로 묶어 저장하기 위한 클러스터 저장수단;정보검색에 이용할 수 있도록 관련단어를 추출하는 클러스트링을 행할 문서를 받아, 문장분석을 통해 의미있는 명사 단어를 추출하기 위한 추출수단; 및추출된 단어를 참조하여 상기 문서에서 연계단어를 추출한 후, 코사인계수 및 구문정보계수를 바탕으로 클러스터계수를 산출하여 클러스터를 생성하고, 기존의 클러스터와 비교하여 상기 클러스터 저장수단을 갱신하기 위한 클러스터 관리수단을 포함하는 단어 클러스터 관리 장치.
- 제 1 항에 있어서,사용자로부터 검색 질의어를 입력받아 상기 클러스터 저장수단을 참조하여 획득된 관련단어를 제공하기 위한 질의 처리수단을 더 포함하는 단어 클러스터 관리 장치.
- 제 2 항에 있어서,상기 질의 처리수단은,상기 클러스터 저장수단을 참조하여 획득된 관련단어를 상기 사용자로부터의 질의에 따른 검색 결과와 함께 제공하는 것을 특징으로 하는 단어 클러스터 관리 장치.
- 제 3 항에 있어서,상기 질의 처리수단은,상기 사용자로부터 질의어를 입력받아 검색엔진에서 사용하는 연산자를 추가하여 조건 검색이 될 수 있도록 변경하기 위한 질의생성수단;생성된 질의어를 기존에 개발되어 사용되고 있는 상기 검색엔진에 의뢰하여 검색결과를 추출하기 위한 검색의뢰수단;질의어와 관련이 있는 단어를 상기 클러스터 저장수단을 참조하여 확장하기 위한 관련 클러스터 확장수단; 및추출된 단어 클러스터 및 검색결과를 상기 사용자에게 제공하기 위한 출력수단을 포함하는 단어 클러스터 관리 장치.
- 제 4 항에 있어서,상기 질의처리 수단은,상기 사용자로부터 질의어를 받아 개인의 정보검색 이력을 관리하기 위한 이력관리수단; 및상기 이력관리수단의 제어에 따라 개인의 정보검색 이력을 저장하기 위한 이력 저장수단을 더 포함하는 단어 클러스터 관리 장치.
- 제 1 항에 있어서,상기 추출수단은,의미있는 명사단어를 판별할 수 있도록 시소러스 정보, 명사 정보, 불용어 정보, 부사 정보, 동사 정보 및 형용사 정보를 포함하는 사전정보를 저장하기 위한 사전정보 저장수단;정보검색에 이용할 수 있도록 관련단어를 추출하는 클러스트링을 행할 문서를 받아 단어 클러스트링에 불필요한 태그(Tag) 정보를 분리시키기 위한 태그 필터;상기 태그 필터에 의해 추출된 택스트(Text) 문자열을 토큰 단위로 분리하기 위한 토큰추출수단;상기 토큰추출수단에 의해 분리된 토큰을 확인하여 명사를 추출하여 명사노드 리스트에 저장하기 위한 명사추출수단;추출된 토큰이 상기 사전정보 저장수단에 등록되지 않은 경우에 미등록어로서 토큰과 출현횟수를 저장하기 위한 미등록어 저장수단; 및상기 미등록어 저장수단에 저장된 토큰의 출현횟수를 확인하여 상기 사전정보 저장수단을 갱신하기 위한 사전관리수단을 포함하는 단어 클러스터 관리 장치.
- 제 6 항에 있어서,상기 사전정보 저장수단, 상기 명사추출수단 및 상기 미등록어 저장수단은,정보검색에 사용되는 언어에 따라 언어별로 관리 및 처리하는 것을 특징으로 하는 단어 클러스터 관리 장치.
- 제 1 항 내지 제 7 항 중 어느 한 항에 있어서,상기 클러스터 관리수단은,상기 추출수단으로부터 생성된 명사노드 리스트를 입력받아 해당 문서의 관련단어를 추출하고 문서별 단어 클러스터를 생성하여 저장하는 연계단어 추출수단; 및상기 연계단어 추출수단에서 생성된 문서별 단어 클러스터와 상기 클러스터 저장수단에 저장된 단어 클러스터와의 관계를 파악하여 상기 클러스터 저장수단의 단어 클러스터를 갱신하기 위한 클러스터 갱신 처리수단을 포함하는 단어 클러스터 관리 장치.
- 정보검색에서 질의어 처리를 위한 단어 클러스터 관리 장치에 적용되는 단어 클러스터 관리 방법에 있어서,정보검색에 이용할 문서를 받아 문장분석을 통해 의미있는 명사 단어를 추출하는 제 1 단계;추출된 단어를 참조하여 상기 문서에서 연계단어를 추출한 후, 코사인계수 및 구문정보계수를 바탕으로 클러스터계수를 산출하여 단어 클러스터를 생성하는 제 2 단계; 및정보검색에서 이용되는 단어와 연계되는 관련단어를 제공할 수 있도록, 생성된 상기 단어 클러스터를 이용하여 기존의 클러스터와 비교해서 클러스터 저장수단을 갱신하는 제 3 단계를 포함하는 단어 클러스터 관리 방법.
- 제 9 항에 있어서,사용자로부터 검색 질의어를 입력받아 상기 클러스터 저장수단을 참조하여 획득한 관련단어를 상기 사용자에게 제공하는 제 4 단계를 더 포함하는 단어 클러스터 관리 방법.
- 제 10 항에 있어서,상기 제 4 단계에서, 사용자로부터 검색 질의어를 입력받아 상기 클러스터 저장수단을 참조하여 확장한 관련단어를 상기 사용자로부터의 질의에 따른 검색 결과와 함께 상기 사용자에게 제공하는 것을 특징으로 하는 단어 클러스터 관리 방법.
- 제 9 항 내지 제 11 항 중 어느 한 항에 있어서,상기 제 1 단계는,수집된 문서 파일에서 태그(Tag) 정보를 분리시켜 택스트(Text) 파일을 생성하는 제 5 단계;택스트 파일을 문장 단위로 입력받아 어절단위로 토큰을 추출하는 제 6 단계; 및추출된 토큰이 어떠한 언어에 해당하는지에 따라 해당 언어의 명사추출수단이 토큰을 받아 사전정보 저장수단을 참조하여 명사를 추출하여 명사노드 리스트로 저장하는 제 7 단계를 포함하는 단어 클러스터 관리 방법.
- 프로세서를 구비한 정보검색 시스템에,정보검색에 이용할 문서를 받아 문장분석을 통해 의미있는 명사 단어를 추출하는 제 1 기능;추출된 단어를 참조하여 상기 문서에서 연계단어를 추출한 후 코사인계수 및 구문정보계수를 바탕으로 클러스터계수를 산출하여 단어 클러스터를 생성하는 제 2 기능; 및정보검색에서 이용되는 단어와 연계되는 관련단어를 제공할 수 있도록, 생성된 상기 단어 클러스터를 이용하여 기존의 클러스터와 비교해서 클러스터 저장수단을 갱신하는 제 3 기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
- 제 8 항에 있어서,상기 연계단어 추출수단은,상기 명사추출 수단을 통하여 만들어진 명사노드에서 첫번째 단어로 이동하여 첫번째 단어를 중심어로 하고, 중심어를 제외한 단어중 첫번째 단어로 이동하는 제 1 과정;클러스터 대상 단어(Ti)와 리스트내 단어(Tj), 클러스터 대상 단어(Ti)의 빈도수(WTi), 리스트내 단어(Tj)의 빈도수(WTj)를 참조하여 아래 [수학식 1]을 이용하여 해당단어의 코사인(Cosine) 계수를 계산함으로써, 단어간의 유사도를 구하는 제 2 과정;[수학식 1]단어간의 구문정보계수를 계산하는 아래 [수학식 2]에 따라, 리스트내 단어(Tj)가 클러스터 대상 단어(Ti)와 같은 구문에 등장하는 빈도수를 계산함으로써, 문서에서의 집중도를 구하는 제 3 과정;[수학식 2](단,는 단어 Tj가 단어 Ti와 같은 구문에서 나타나는 빈도수임)상기 [수학식 1]과 [수학식 2]에 따라 계산된 코사인 계수와 구문정보 계수의 계산 결과를 참조하고, 아래의 [수학식 3]에 따라 클러스터 계수를 계산함으로써 상기 유사도와 집중도를 바탕으로 연관관계를 구하여, 해당 단어에 대한 클러스터를 생성하는 제 4 과정; 및;[수학식 3]다음 비교단어에 대하여 클러스터 계수를 계산한 후 순차적으로 이동하면서, 마지막 단어까지 상기 처리 과정들을 반복하는 제 5 과정을 수행하여,링크드 리스트(Linked List) 형태로 저장된 명사노드에서 순차적으로 단어를 인식하여 단어간 연관계수를 계산하고, 해당문서에 대한 문서별 단어 클러스터를 생성하는 것을 특징으로 하는 단어 클러스터 관리 장치.
- 제 8 항에 있어서,상기 클러스터 갱신 처리수단은,해당문서에서 생성된 문서별 단어 클러스터의 중심어가 기존의 단어 클러스터 사전에 존재하는지 여부를 판단하여, 존재할 경우에는 제 2 과정으로 분기하고, 신규인 경우에는 제 6 과정으로 분기하는 제 1 과정;신규생성 클러스터 중심어(Ti), 기생성된 클러스터 중심어(Tj), 상기 Ti와 상기 Tj의 클러스터 내 공동 단어수(N(GTi ∩GTj)), 상기 Ti와 상기 Tj의 클러스터 내 연계단어 합(N(GTi ∪ GTj))을 참조하여 아래의 [수학식 4]에 따라 자카드(Jaccard) 계수를 계산하는 제 2 과정;[수학식 4](단,는 단어 Ti를 중심으로 하는 클러스터,는 단어 Tj를 중심어로 하는 클러스터임)상기 제 2 과정에서 계산된 자카드(Jaccard) 계수값이 임계값(JT)보다 크면 동의어로 처리하고, 작은 경우에는 동음이의어로 처리하는 제 3 과정;재계산 클러스터 계수(P(Ti))를 기존 클러스터계수(PTi), 신규 생성된 클러스터 계수(P'Ti), 클러스터 계산에 이용된 문서수(n)를 이용하여 다음의 [수학식 5]에 따라 생성하는 제 4 과정;[수학식 5]얻어진 재계산 클러스터 계수(P(Ti))를 이용하여 기존의 클러스터 인덱스 값을 새로 변경하는 제 5 과정; 및해당문서에서 클러스터가 있는지를 판단하여 없으면 다음 문서 처리를 계속하고, 있는 경우에는 단어 클러스터 사전의 생성과 변경 작업을 지속하는 제 6 과정을 통하여, 클러스터 갱신을 수행하는 것을 특징으로 하는 단어 클러스터 관리 장치.
- 제 9 항에 있어서,상기 제 2 단계는,상기 명사추출 수단을 통하여 만들어진 명사노드에서 첫번째 단어로 이동하여 첫번째 단어를 중심어로 하고, 중심어를 제외한 단어중 첫번째 단어로 이동하는 제 1 과정;클러스터 대상 단어(Ti)와 리스트내 단어(Tj), 클러스터 대상 단어(Ti)의 빈도수(WTi), 리스트내 단어(Tj)의 빈도수(WTj)를 참조하여 아래 [수학식 1]을 이용하여 해당단어의 코사인(Cosine) 계수를 계산함으로써, 단어간의 유사도를 구하는 제 2 과정;[수학식 1]단어간의 구문정보계수를 계산하는 아래 [수학식 2]에 따라, 리스트내 단어(Tj)가 클러스터 대상 단어(Ti)와 같은 구문에 등장하는 빈도수를 계산함으로써, 문서에서의 집중도를 구하는 제 3 과정;[수학식 2](단,는 단어 Tj가 단어 Ti와 같은 구문에서 나타나는 빈도수임)상기 [수학식 1]과 [수학식 2]에 따라 계산된 코사인 계수와 구문정보 계수의 계산 결과를 참조하고, 아래의 [수학식 3]에 따라 클러스터 계수를 계산함으로써 상기 유사도와 집중도를 바탕으로 연관관계를 구하여, 해당 단어에 대한 클러스터를 생성하는 제 4 과정;[수학식 3]다음 비교단어에 대하여 클러스터 계수를 계산한 후 순차적으로 이동하면서, 마지막 단어까지 상기 처리 과정들을 반복하여, 해당문서에 대한 문서별 단어 클러스터를 생성하는 제 5 과정;해당문서에서 생성된 문서별 단어 클러스터의 중심어가 기존의 단어 클러스터 사전에 존재하는지 여부를 판단하여, 존재할 경우에는 제 7 과정으로 분기하고, 신규인 경우에는 제 11 과정으로 분기하는 제 6 과정;신규생성 클러스터 중심어(Ti), 기생성된 클러스터 중심어(Tj), 상기 Ti와 상기 Tj의 클러스터 내 공동 단어수(N(GTi ∩GTj)), 상기 Ti와 상기 Tj의 클러스터 내 연계단어 합(N(GTi ∪ GTj))을 참조하여 아래의 [수학식 4]에 따라 자카드(Jaccard) 계수를 계산하는 제 7 과정;[수학식 4](단,는 단어 Ti를 중심으로 하는 클러스터,는 단어 Tj를 중심어로 하는 클러스터임)상기 제 7 과정에서 계산된 자카드(Jaccard) 계수값이 임계값(JT)보다 크면 동의어로 처리하고, 작은 경우에는 동음이의어로 처리하는 제 8 과정;재계산 클러스터 계수(P(Ti))를 기존 클러스터계수(PTi), 신규 생성된 클러스터 계수(P'Ti), 클러스터 계산에 이용된 문서수(n)를 이용하여 다음의 [수학식 5]에 따라 생성하는 제 9 과정;[수학식 5]얻어진 재계산 클러스터 계수(P(Ti))를 이용하여 기존의 클러스터 인덱스 값을 새로 변경하는 제 10 과정; 및해당문서에서 클러스터가 있는지를 판단하여 없으면 다음 문서 처리를 계속하고, 있는 경우에는 단어 클러스터 사전의 생성과 변경 작업을 지속하는 제 11 과정을 포함하는 단어 클러스터 관리 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2000-0029788A KR100396826B1 (ko) | 2000-05-31 | 2000-05-31 | 정보검색에서 질의어 처리를 위한 단어 클러스터 관리장치 및 그 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2000-0029788A KR100396826B1 (ko) | 2000-05-31 | 2000-05-31 | 정보검색에서 질의어 처리를 위한 단어 클러스터 관리장치 및 그 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20010108845A KR20010108845A (ko) | 2001-12-08 |
KR100396826B1 true KR100396826B1 (ko) | 2003-09-02 |
Family
ID=41110845
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR10-2000-0029788A KR100396826B1 (ko) | 2000-05-31 | 2000-05-31 | 정보검색에서 질의어 처리를 위한 단어 클러스터 관리장치 및 그 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100396826B1 (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101223987B1 (ko) | 2010-08-31 | 2013-01-24 | 대한민국 | 동적 온톨로지를 이용한 관련어 제공 방법 및 시스템 |
KR101238381B1 (ko) | 2011-06-07 | 2013-02-28 | 엔에이치엔(주) | 다중범위 스캔에서의 n 정렬 질의를 최적으로 처리하기 위한 방법 및 장치 |
KR20200065926A (ko) * | 2018-11-30 | 2020-06-09 | 한국생산기술연구원 | 기술 정보의 구조화를 통한 유사 기술 제공 방법 및 장치 |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20000063310A (ko) * | 2000-06-26 | 2000-11-06 | 민재기 | 통신망을 통한 명사의 순위 검색 시스템과 그 방법 |
KR20020049164A (ko) * | 2000-12-19 | 2002-06-26 | 오길록 | 유전자 알고리즘을 이용한 카테고리 학습과 단어클러스터에 의한 문서 자동 분류 시스템 및 그 방법 |
KR20030069639A (ko) * | 2002-02-22 | 2003-08-27 | 이의범 | 계층적 및 개념적 클러스터링에 의한 증권정보 검색시스템및 그 방법 |
KR100773066B1 (ko) * | 2004-02-07 | 2007-11-02 | 주식회사 다음커뮤니케이션 | 인터넷 정보검색방법 |
KR100819846B1 (ko) * | 2005-04-08 | 2008-04-07 | 김동암 | 인터넷 검색결과 정보를 언어고리로 구성하여 제공하는방법 |
KR100847376B1 (ko) * | 2006-11-29 | 2008-07-21 | 김준홍 | 질의어 자동 추출을 이용한 검색 방법 및 장치 |
KR100892842B1 (ko) | 2007-08-08 | 2009-04-10 | 엔에이치엔(주) | 사용자 중심 정보탐색 방법 및 시스템 |
KR100903506B1 (ko) * | 2007-10-24 | 2009-06-17 | 엔에이치엔(주) | 정보 맵 관리 시스템 및 방법 |
KR100955186B1 (ko) * | 2008-07-31 | 2010-04-29 | 엔에이치엔(주) | 동의어 필터링을 이용한 검색 서비스 제공 방법 및 시스템 |
KR101048540B1 (ko) * | 2009-03-24 | 2011-07-11 | 엔에이치엔(주) | 연관 키워드에 따른 클러스터를 이용하여 검색 키워드를 분류하는 장치 및 방법 |
KR101122329B1 (ko) * | 2010-05-03 | 2012-03-23 | 엔에이치엔(주) | 문서 간의 유사도 계산 시스템 및 방법 |
CN103823814B (zh) * | 2012-11-19 | 2017-12-01 | 腾讯科技(深圳)有限公司 | 一种信息处理方法及装置 |
KR101446154B1 (ko) * | 2013-01-11 | 2014-10-01 | 한남대학교 산학협력단 | 사용자 질의 확장 기법을 이용한 시맨틱 콘텐츠 검색 시스템 및 방법 |
TWI639927B (zh) * | 2016-05-27 | 2018-11-01 | 雲拓科技有限公司 | 將一申請專利範圍中的申請專利範圍元件名詞所屬元件名詞對應標號予以對應之對應方法 |
KR20200084260A (ko) | 2019-01-02 | 2020-07-10 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
CN112148838B (zh) * | 2020-09-23 | 2024-04-19 | 北京中电普华信息技术有限公司 | 一种业务源对象提取方法与装置 |
CN112256880B (zh) * | 2020-11-11 | 2024-12-10 | 腾讯科技(深圳)有限公司 | 文本识别方法和装置、存储介质及电子设备 |
-
2000
- 2000-05-31 KR KR10-2000-0029788A patent/KR100396826B1/ko not_active IP Right Cessation
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101223987B1 (ko) | 2010-08-31 | 2013-01-24 | 대한민국 | 동적 온톨로지를 이용한 관련어 제공 방법 및 시스템 |
KR101238381B1 (ko) | 2011-06-07 | 2013-02-28 | 엔에이치엔(주) | 다중범위 스캔에서의 n 정렬 질의를 최적으로 처리하기 위한 방법 및 장치 |
KR20200065926A (ko) * | 2018-11-30 | 2020-06-09 | 한국생산기술연구원 | 기술 정보의 구조화를 통한 유사 기술 제공 방법 및 장치 |
KR102124454B1 (ko) | 2018-11-30 | 2020-06-19 | 한국생산기술연구원 | 기술 정보의 구조화를 통한 유사 기술 제공 방법 및 장치 |
Also Published As
Publication number | Publication date |
---|---|
KR20010108845A (ko) | 2001-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100396826B1 (ko) | 정보검색에서 질의어 처리를 위한 단어 클러스터 관리장치 및 그 방법 | |
JP4241934B2 (ja) | テキスト処理及び検索システム及び方法 | |
JP3928722B2 (ja) | 1組のドキュメントの階層的記述の推測 | |
KR100666064B1 (ko) | 인터랙티브 검색 쿼리 개선 시스템 및 방법 | |
Capstick et al. | A system for supporting cross-lingual information retrieval | |
US20110295857A1 (en) | System and method for aligning and indexing multilingual documents | |
JPH0424869A (ja) | 文書処理システム | |
JPH11110416A (ja) | データベースからドキュメントを検索するための方法および装置 | |
CN102214189B (zh) | 基于数据挖掘获取词用法知识的系统及方法 | |
CN115186050B (zh) | 基于自然语言处理的选题推荐方法、系统及相关设备 | |
JPH03172966A (ja) | 類似文書検索装置 | |
CN105005556A (zh) | 一种基于地质大数据的标引关键词提取方法和系统 | |
JP2011118689A (ja) | 検索方法及びシステム | |
JP3596210B2 (ja) | 関連語辞書作成装置 | |
JP4065346B2 (ja) | 単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2001184358A (ja) | カテゴリ因子による情報検索装置,情報検索方法およびそのプログラム記録媒体 | |
KR20020072092A (ko) | 단락 단위의 실시간 응답 색인을 이용한 자연어 질의-응답검색시스템 | |
JP5073349B2 (ja) | 専門用語抽出装置、方法及びプログラム | |
Bessou et al. | An accuracy-enhanced stemming algorithm for Arabic information retrieval | |
Torres-Parejo et al. | MTCIR: A multi-term tag cloud information retrieval system | |
JPH11143902A (ja) | n−gramを用いた類似文書検索方法 | |
JP2006227823A (ja) | 情報処理装置及びその制御方法 | |
JP5094096B2 (ja) | 有名人の別表現の自動抽出装置、方法 | |
Thanadechteemapat et al. | Thai word segmentation for visualization of thai web sites | |
JPH0232469A (ja) | 情報検索方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20000531 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20020830 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20030612 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20030821 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20030822 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |