KR20010107113A - 자연어 정보 검색 시스템에서 구문 트리를 이용한 자연어질의의 불린 질의 및 벡터 질의 변환 방법 - Google Patents
자연어 정보 검색 시스템에서 구문 트리를 이용한 자연어질의의 불린 질의 및 벡터 질의 변환 방법 Download PDFInfo
- Publication number
- KR20010107113A KR20010107113A KR1020000028347A KR20000028347A KR20010107113A KR 20010107113 A KR20010107113 A KR 20010107113A KR 1020000028347 A KR1020000028347 A KR 1020000028347A KR 20000028347 A KR20000028347 A KR 20000028347A KR 20010107113 A KR20010107113 A KR 20010107113A
- Authority
- KR
- South Korea
- Prior art keywords
- query
- natural language
- compound
- noun
- syntax
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
Description
Claims (2)
- 사용자 질의에 대해 구문을 분석하여 구문 트리로 분류하는 단계; 상기 분류된 구문 트리의 단말 노드에 위치하는 각 형태소의 어휘와 품사 정보를 키워드 또는 연산자로 결정하는 단계; 상기 결정된 키워드를 복합명사 분할 및 복합 명사 합성을 사용하여 질의 확장시키는 단계; 상기 각 형태소의 어휘와 품사 정보에 의해 결정된 각 연산자들의 적용 순서를 결정하는 단계; 상기 각 연산자들의 적용 순서가 결정된 구문 트리를 포스트 픽스(Post-fix)형태의 불린식으로 변환하는 단계; 상기 불린식에서 불린 연산자를 제거하여 벡터 질의로 변환하는 단계를 포함하는 자연어 정보 검색 시스템에서 구문 트리를 이용한 자연어 질의의 불린 질의 및 벡터 질의 변환 방법.
- 제 1항에 있어서, 사용자 질의에 대한 구문을 N개의 구문 트리로 분류하고, 상기 N 개의 구문 트리 각각을 불린식으로 변환하여,구문 트리 자체의 확률 값이 높은 것;합성된 복합 명사의 상호 정보없이 복합 명사가 존재할 가능성이 큰 것;합성된 복합 명사가 색인된 문서에 많이 나타나는 것;단일 키워드 수가 많은 것을 우선적으로 선택하는 것을 특징으로 하는 자연어 정보 검색 시스템에서 구문 트리를 이용한 자연어 질의의 불린 질의 및 벡터 질의 변환 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020000028347A KR20010107113A (ko) | 2000-05-25 | 2000-05-25 | 자연어 정보 검색 시스템에서 구문 트리를 이용한 자연어질의의 불린 질의 및 벡터 질의 변환 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020000028347A KR20010107113A (ko) | 2000-05-25 | 2000-05-25 | 자연어 정보 검색 시스템에서 구문 트리를 이용한 자연어질의의 불린 질의 및 벡터 질의 변환 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20010107113A true KR20010107113A (ko) | 2001-12-07 |
Family
ID=19670245
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020000028347A KR20010107113A (ko) | 2000-05-25 | 2000-05-25 | 자연어 정보 검색 시스템에서 구문 트리를 이용한 자연어질의의 불린 질의 및 벡터 질의 변환 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20010107113A (ko) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100378642B1 (ko) * | 2000-07-06 | 2003-03-31 | 김시환 | 정보 검색 시스템과 그 방법 |
KR100406671B1 (ko) * | 2000-07-24 | 2003-11-21 | 주식회사 유니마이다스 | 문장 표절 및 도용 검색 방법 |
KR20150121578A (ko) * | 2014-04-21 | 2015-10-29 | (주) 정랩 | 전자입찰정보 스마트 공유장치 및 방법 |
CN108108379A (zh) * | 2016-11-25 | 2018-06-01 | 北京国双科技有限公司 | 关键词拓词的方法及装置 |
CN108363743A (zh) * | 2018-01-24 | 2018-08-03 | 清华大学深圳研究生院 | 一种智能问题生成方法、装置和计算机可读存储介质 |
CN117785884A (zh) * | 2023-12-28 | 2024-03-29 | 支付宝(杭州)信息技术有限公司 | 图查询语句的图逻辑执行计划生成方法、数据处理方法及装置 |
-
2000
- 2000-05-25 KR KR1020000028347A patent/KR20010107113A/ko not_active Application Discontinuation
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100378642B1 (ko) * | 2000-07-06 | 2003-03-31 | 김시환 | 정보 검색 시스템과 그 방법 |
KR100406671B1 (ko) * | 2000-07-24 | 2003-11-21 | 주식회사 유니마이다스 | 문장 표절 및 도용 검색 방법 |
KR20150121578A (ko) * | 2014-04-21 | 2015-10-29 | (주) 정랩 | 전자입찰정보 스마트 공유장치 및 방법 |
CN108108379A (zh) * | 2016-11-25 | 2018-06-01 | 北京国双科技有限公司 | 关键词拓词的方法及装置 |
CN108363743A (zh) * | 2018-01-24 | 2018-08-03 | 清华大学深圳研究生院 | 一种智能问题生成方法、装置和计算机可读存储介质 |
CN108363743B (zh) * | 2018-01-24 | 2020-06-02 | 清华大学深圳研究生院 | 一种智能问题生成方法、装置和计算机可读存储介质 |
CN117785884A (zh) * | 2023-12-28 | 2024-03-29 | 支付宝(杭州)信息技术有限公司 | 图查询语句的图逻辑执行计划生成方法、数据处理方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109800284B (zh) | 一种面向任务的非结构化信息智能问答系统构建方法 | |
US6101492A (en) | Methods and apparatus for information indexing and retrieval as well as query expansion using morpho-syntactic analysis | |
US5794177A (en) | Method and apparatus for morphological analysis and generation of natural language text | |
US7389224B1 (en) | Natural language search method and apparatus, including linguistically-matching context data | |
US7567902B2 (en) | Generating speech recognition grammars from a large corpus of data | |
US7272558B1 (en) | Speech recognition training method for audio and video file indexing on a search engine | |
EP0597630A1 (en) | Method for resolution of natural-language queries against full-text databases | |
JP2004110808A (ja) | ネットワークを介してデータを検索及び提示する方法及びマシン可読記憶装置 | |
WO1997004405A9 (en) | Method and apparatus for automated search and retrieval processing | |
JPH1049549A (ja) | 文書検索装置 | |
US11573989B2 (en) | Corpus specific generative query completion assistant | |
JP2001043236A (ja) | 類似語抽出方法、文書検索方法及びこれらに用いる装置 | |
JP2005251115A (ja) | 連想検索システムおよび連想検索方法 | |
KR100396826B1 (ko) | 정보검색에서 질의어 처리를 위한 단어 클러스터 관리장치 및 그 방법 | |
JP2011118689A (ja) | 検索方法及びシステム | |
EP1099171B1 (en) | Accessing a semi-structured database | |
US20070112839A1 (en) | Method and system for expansion of structured keyword vocabulary | |
JP4065346B2 (ja) | 単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
KR20020072092A (ko) | 단락 단위의 실시간 응답 색인을 이용한 자연어 질의-응답검색시스템 | |
JPH0844771A (ja) | 情報検索装置 | |
KR20010107113A (ko) | 자연어 정보 검색 시스템에서 구문 트리를 이용한 자연어질의의 불린 질의 및 벡터 질의 변환 방법 | |
JP4439496B2 (ja) | 検索処理装置及びプログラム | |
JP2008077252A (ja) | 文書ランキング方法、文書検索方法、文書ランキング装置、文書検索装置、及び記録媒体 | |
JP5260123B2 (ja) | 検索システム、索引作成装置、検索エンジン、索引作成方法、検索方法およびプログラム | |
KR20020054254A (ko) | 사전구조를 이용한 한국어 형태소 분석방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20000525 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20020628 Patent event code: PE09021S01D |
|
E601 | Decision to refuse application | ||
PE0601 | Decision on rejection of patent |
Patent event date: 20020927 Comment text: Decision to Refuse Application Patent event code: PE06012S01D Patent event date: 20020628 Comment text: Notification of reason for refusal Patent event code: PE06011S01I |