KR20020023543A - 자연어 검색 시스템을 위한 한글 스태머와 그 스태밍 방법 - Google Patents
자연어 검색 시스템을 위한 한글 스태머와 그 스태밍 방법 Download PDFInfo
- Publication number
- KR20020023543A KR20020023543A KR1020000055858A KR20000055858A KR20020023543A KR 20020023543 A KR20020023543 A KR 20020023543A KR 1020000055858 A KR1020000055858 A KR 1020000055858A KR 20000055858 A KR20000055858 A KR 20000055858A KR 20020023543 A KR20020023543 A KR 20020023543A
- Authority
- KR
- South Korea
- Prior art keywords
- rule
- processing
- word
- syllable
- natural language
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3335—Syntactic pre-processing, e.g. stopword elimination, stemming
Landscapes
- Engineering & Computer Science (AREA)
- Machine Translation (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
Abstract
Description
Claims (6)
- 자연어 한글 단어에 대한 스태밍을 하기 위해서 소정 종류의 문맥의존 규칙테이블을 설계하는 단계와,상기 테이블을 시스템에서 순환적으로 호출하여 프로시쥬어에서 적용하는 단계를 구비하여 이루어진 것을 특징으로 하는 한글 스태밍 방법.
- 제1항에 있어서, 다양한 불규칙 활용에 대한 처리를 위해서 어간사전 및 어미파일을 준비하는 단계를 더 구비하고,조건에 따라 하나 이상의 매칭 방법을 적용하는 것을 특징으로 하는 한글 스태밍 방법.
- 제2항에 있어서, 상기 매칭 방법이 완전 매칭과 부분 매칭을 포함하는 것을 특징으로 하는 한글 스태밍 방법.
- 한글의 색인어 처리대상을 최소어간 길이 규칙을 적용하여 처리하는 처리수단과,상기 처리수단에 의해 처리된 색인어 처리대상을 현재 처리되어야 할 자연어 음절조건에 따라 소정의 규칙을 적용하여 처리하는 스태밍 수단을 구비하여 구성된 것을 특징으로 하는 한글 스태머.
- 제4항에 있어서, 한글의 색인어 처리대상이 체언과 용언을 포함하는 것을 특징으로 하는 한글 스태머.
- 제4항 또는 제5항에 있어서, 상기 처리수단에서 적용하는 최소어간 길이 규칙이 고정어간 길이 규칙이고, 상기 스태밍 수단에서 적용하는 규칙이 문맥의존 어간길이 규칙인 것을 특징으로 하는 한글 스태머.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2000-0055858A KR100401466B1 (ko) | 2000-09-22 | 2000-09-22 | 자연어 검색 시스템을 위한 한글 스태머와 그 스태밍 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2000-0055858A KR100401466B1 (ko) | 2000-09-22 | 2000-09-22 | 자연어 검색 시스템을 위한 한글 스태머와 그 스태밍 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20020023543A true KR20020023543A (ko) | 2002-03-29 |
KR100401466B1 KR100401466B1 (ko) | 2003-10-11 |
Family
ID=19690028
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR10-2000-0055858A KR100401466B1 (ko) | 2000-09-22 | 2000-09-22 | 자연어 검색 시스템을 위한 한글 스태머와 그 스태밍 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100401466B1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101139469B1 (ko) | 2010-03-25 | 2012-04-30 | 성중모 | 한국어사전 |
KR20240140206A (ko) | 2023-03-16 | 2024-09-24 | 배재대학교 산학협력단 | 언어학적 특징을 고려한 자연어 처리 기반 한국어 요약 시스템 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08235187A (ja) * | 1995-02-24 | 1996-09-13 | Fujitsu Ltd | 辞書検索システム |
KR100286650B1 (ko) * | 1996-06-27 | 2001-04-16 | 이구택 | 테이블 구동방식에 의한 술부 양상류 생성방법 |
JPH11143861A (ja) * | 1997-11-05 | 1999-05-28 | Omron Corp | 文字入力装置および文字入力方法、並びに記録媒体 |
KR19990042430A (ko) * | 1997-11-26 | 1999-06-15 | 정선종 | 문장의 구조정보를 이용한 명사구 추출장치 및 그 방법 |
KR100474823B1 (ko) * | 1998-02-23 | 2005-03-16 | 삼성전자주식회사 | 자연어의품사태깅장치및그방법 |
KR100283100B1 (ko) * | 1998-12-03 | 2001-03-02 | 정선종 | 대용량 말뭉치를 위한 통계학적 용례 추출 수단 및 그 방법 |
KR100288144B1 (ko) * | 1998-12-10 | 2001-05-02 | 이계철 | 한글로 표기된 외래어 코드화 방법 및 그를 이용한 검색 방법 |
-
2000
- 2000-09-22 KR KR10-2000-0055858A patent/KR100401466B1/ko not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
KR100401466B1 (ko) | 2003-10-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhou et al. | Approaches to text mining for clinical medical records | |
US8041697B2 (en) | Semi-automatic example-based induction of semantic translation rules to support natural language search | |
US8280721B2 (en) | Efficiently representing word sense probabilities | |
EP1508861A1 (en) | Method for synthesising a self-learning system for knowledge acquisition for text-retrieval systems | |
EP0971294A2 (en) | Method and apparatus for automated search and retrieval processing | |
Spasić et al. | FlexiTerm: a flexible term recognition method | |
US20030130837A1 (en) | Computer based summarization of natural language documents | |
JPS63231674A (ja) | コンピュータによる形態論的テキスト解析方法 | |
WO1997004405A9 (en) | Method and apparatus for automated search and retrieval processing | |
JPH083815B2 (ja) | 自然言語の共起関係辞書保守方法 | |
Ekmekcioglu et al. | Stemming and n-gram matching for term conflation in Turkish texts | |
Schinke et al. | A stemming algorithm for Latin text databases | |
Galvez et al. | Term conflation methods in information retrieval: Non‐linguistic and linguistic approaches | |
Srinivas et al. | An approach to robust partial parsing and evaluation metrics | |
Lazarinis et al. | Current research issues and trends in non-English Web searching | |
JP2004133564A (ja) | 文書検索装置 | |
Tambouratzis | Automatic corpora-based stemming in Greek | |
Daille et al. | Applications of computational morphology | |
Hamon et al. | A robust linguistic platform for efficient and domain specific web content analysis | |
Yeshambel et al. | Evaluation of corpora, resources and tools for Amharic information retrieval | |
Vilares et al. | Extraction of complex index terms in non-English IR: A shallow parsing based approach | |
KR100401466B1 (ko) | 자연어 검색 시스템을 위한 한글 스태머와 그 스태밍 방법 | |
Litkowski | Question Answering Using XML-Tagged Documents. | |
Meyer | On Sanskrit and information retrieval | |
Abdullah et al. | Feature-based POS tagging and sentence relevance for news multi-document summarization in Bahasa Indonesia |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20000922 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20030327 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20030830 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20030930 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20031001 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20061002 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20070802 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20080717 Start annual number: 6 End annual number: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20090914 Start annual number: 7 End annual number: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20100927 Start annual number: 8 End annual number: 8 |
|
FPAY | Annual fee payment |
Payment date: 20110927 Year of fee payment: 9 |
|
PR1001 | Payment of annual fee |
Payment date: 20110927 Start annual number: 9 End annual number: 9 |
|
FPAY | Annual fee payment |
Payment date: 20120907 Year of fee payment: 10 |
|
PR1001 | Payment of annual fee |
Payment date: 20120907 Start annual number: 10 End annual number: 10 |
|
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |