[go: up one dir, main page]

KR100568977B1 - 생물학적 관계 추출 시스템 및 생물 정보 처리 방법 - Google Patents

생물학적 관계 추출 시스템 및 생물 정보 처리 방법 Download PDF

Info

Publication number
KR100568977B1
KR100568977B1 KR1020040109046A KR20040109046A KR100568977B1 KR 100568977 B1 KR100568977 B1 KR 100568977B1 KR 1020040109046 A KR1020040109046 A KR 1020040109046A KR 20040109046 A KR20040109046 A KR 20040109046A KR 100568977 B1 KR100568977 B1 KR 100568977B1
Authority
KR
South Korea
Prior art keywords
biological
biological entity
name
entity name
relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
KR1020040109046A
Other languages
English (en)
Inventor
장현철
이현숙
임재수
박수준
박선희
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020040109046A priority Critical patent/KR100568977B1/ko
Priority to US11/304,030 priority patent/US20060136147A1/en
Application granted granted Critical
Publication of KR100568977B1 publication Critical patent/KR100568977B1/ko
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/10Ontologies; Annotations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioethics (AREA)
  • Biophysics (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 생물학적 관계 추출 시스템에 관한 것이다.
본 발명의 생물학적 관계 추출 시스템은 생물학적 문서로부터, 생물학적 개체명을 소정의 치환명으로 치환하는 생물학적 개체명 치환부; 상기 생물학적 개체명이 치환된 생물학적 문서를 파싱하는 구조 분석부; 상기 구조 분석부에서 파싱된 생물학적 문서로부터 생물학적 개체명들의 관계를 분석하여, 생물학적 개체명 관계 후보를 선발하는 관계 분석부; 상기 관계 분석부에서 수신 받은 관계 후보가 생물학적으로 의미 있는지 판단하여 생물학적 개체명들의 관계를 결정하는 관계 결정부; 및 상기 생물학적 개체명 및 생물학적 개체명에 대응하는 치환명을 저장하고, 치환명 또는 생물학적 개체명을 제공하는 생물학적 개체명 할당 저장부를 포함한다.
생물학적 관계 추출

Description

생물학적 관계 추출 시스템 및 생물 정보 처리 방법{BIOLOGICAL RELATION EVENT EXTRACTION SYSTEM AND METHOD FOR PROCESSING BIOLOGICAL INFORMATION}
도 1 은 본 발명의 제 1 실시예에 따른 생물학적 관계 추출 시스템의 구성도이다.
도 2 는 본 발명의 제 1 실시예의 생물학적 관계 추출 시스템의 생물학적 문서 태깅부에 의해 태깅된 문장의 구조이다.
도 3 는 본 발명의 제 1 실시예의 생물학적 관계 추출 시스템의 생물학적 개체명 치환부의 구성도이다.
도 4 는 본 발명의 제 1 실시예에 따른 생물학적 관계 추출 시스템의 생물학적 개체명 치환부에 의해 치환된 문장 구조이다.
도 5 은 본 발명의 제 1 실시예에 따른 생물학적 관계 추출 시스템의 구조 분석부의 구성도이다.
도 6 는 본 발명의 제 1 실시예에 따른 생물학적 관계 추출 시스템의 관계 검색부의 구성도이다.
도 7 는 본 발명의 제 1 실시예에 따른 생물학적 관계 추출 시스템의 관계 결정부의 구성도이다.
도 8 은 본 발명의 제 2 실시예에 따른 생물 정보 처리 방법의 순서도이다.
본 발명은 생물학적 관계 추출 시스템 및 생물 정보 처리 방법에 관한 것이다. 특히, 생물 정보 문헌으로부터 추출된 생물학적 개체명들 간의 관계를 조사하는 생물학적 관계 추출 시스템 및 생물 정보 처리 방법에 관한 것이다.
최근, 활발한 생물학 연구로 인해 생물 정보 문헌이 급증하면서 생물 정보 문헌으로부터 신뢰성 있는 유용한 정보를 자동으로 추출하여 처리하는 방법이 요구되고 있다.
일반적으로, 문헌으로부터의 정보추출은 문헌 내의 정보 주체와 이들 간의 관계 또는 각 주체가 이끄는 정보의 흐름을 파악하는데 목적이 있다.
생물 정보 문헌의 경우, 생물 정보 문헌 내의 정보주체가 되는 생물학적 개체명을 인식하고 생물학적 개체명간의 관계 정보를 인식하는 방법이 요구된다.
미국 특허 제 6539376 호는 "System and method for the automatic mining of new relationships"에 관한 것으로서, 대용량의 구조화 되지 않은 문서들로부터 통계 기법을 사용하여 관계를 자동으로 추출하고 분류하는 시스템이 개시되어 있으나, 생물학적 개체명간의 관계 정보를 제시하는데 적합하지 않다.
일반적인 생물 정보 관계 인식은 단백질간의 특정 기능(예를 들어, 상호작용, 활성화, 결합 반응 등)만을 추출하는 방식이 알려져 있다. 상기 방법은 한정된 단백질 도메인을 대상으로 하여 특정 단백질과 다른 단백질들의 일부 기능들에 초점을 맞추어 수행되고 있으나, 이러한 방법은 미리 정의된 규칙에 일치하는 한정적인 정보만을 추출하게 되는 단점이 있다.
Toshihide Ono 등은 "Automated extraction of information on protein-protein interactions from the biological literature(Bioinformatics, VOL.17 NO.22001, 2001 년 2월)"을 통해 생물 정보 문헌에서 단백질을 추출하고 단백질 간의 미리 정의된 네 종류의 관계를 인식하는 방법을 기술하고 있으나, 모든 생물학적 개체간의 관계 검색을 달성하지는 못하고 있다.
또한, Gondy Leroy 와 Hsinchun Chen는 "Filling Preposition-based Templates to Capture Information from Medical Abstracts(PSB, Proceedings 2002, 350-361, 2002년 1월)" 에서, 생물 정보 문헌에서 관계를 포함할 만한 문장을 선택하고 전치사를 중심으로 주요 동사와 주체, 객체가 되는 유전자나 단백질 개체명을 추출하여 관계로 인식한 후, 이를 위해 세가지로 구성된 템플릿을 사용하는 방법이 개시되어 있으나, 모든 생물학적 개체명간의 관계 검색을 달성하지는 못하고 있다.
이와 같이, 생물 정보 문헌은 표기된 생물학적 개체명들의 복잡성 및 그로 인한 다양한 관계 추출의 어려움이 있다.
한편, 문법이나 통계 기법을 이용하는 기술 개발이 진행되고 있으나, 일반 문헌에 비해 복잡한 생물 정보 문헌의 특성으로 인하여 문법 적용의 어려움과 통계를 이용하기 위한 코퍼스 구축에 어려움이 있었다.
본 발명은 대량의 생물 정보 문헌으로부터 생물학적 개체명들을 추출하여 생물 정보를 처리할 수 있는 생물학적 관계 추출 시스템을 제공하고자 한다.
또한, 본 발명은 대량의 생물 정보 문헌으로부터 생물학적 개체명들을 추출하고, 생물학적 개체명들간의 관계를 조사할 수 있은 생물학적 관계 추출 시스템을 제공하고자 한다.
또한, 본 발명은 대량의 생물 정보 문헌으로부터 생물학적 개체명들을 추출하여 생물 정보를 처리할 수 있는 생물 정보 처리 방법을 제공하고자 한다.
또한, 본 발명은 대량의 생물 정보 문헌으로부터 생물학적 개체명들을 추출하고, 생물학적 개체명들간의 관계를 조사할 수 있는 생물 정보 처리 방법을 제공하고자 한다.
상기와 같은 기술적 과제를 달성하기 위한 본 발명의 한 특징에 따른 생물학적 관계 추출 시스템은 생물학적 문서로부터, 생물학적 개체명을 소정의 치환명으로 치환하는 생물학적 개체명 치환부; 상기 생물학적 개체명이 치환된 생물학적 문서를 파싱하는 구조 분석부; 상기 구조 분석부에서 파싱된 생물학적 문서로부터 생물학적 개체명들의 관계를 분석하여, 생물학적 개체명 관계 후보를 선발하는 관계 분석부; 상기 관계 분석부에서 수신 받은 관계 후보가 생물학적으로 의미 있는지 판단하여 생물학적 개체명들의 관계를 결정하는 관계 결정부; 및 상기 생물학적 개체명 및 생물학적 개체명에 대응하는 치환명을 저장하고, 치환명 또는 생물학적 개체명을 제공하는 생물학적 개체명 할당 저장부를 포함한다.
본 발명의 또 다른 특징에 따른 생물 정보 처리 방법은 생물학적 개체명을 소정의 치환 명으로 치환하는 단계; 상기 생물학적 개체명이 치환된 생물학적 문서를 파싱하는 단계; 생물학적 개체명 및 그에 연결되는 관계동사를 이용하여 생물학적 개체명들간의 관계 후보를 선발하는 단계; 및 생물학적 개체명들간 관계 후보로부터 생물학적으로 의미가 있는 관계 후보를 선택하여 생물학적 개체명들간의 관계로 결정하는 단계를 포함한다.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다.
이하, 도 1을 참조하여, 본 발명의 제 1 실시예에 따른 생물학적 관계 추출 시스템에 대하여 설명한다.
도 1 은 본 발명의 제 1 실시예에 따른 생물학적 관계 추출 시스템에 관한 것이다.
본 발명의 제 1 실시예에 따른 생물학적 관계 추출 시스템은 생물학적 문서 태깅부(100), 생물학적 개체명 치환부(200), 구조 분석부(300), 관계 검색부(400), 관계 결정부(500) 및 생물학적 개체명 할당 저장부(600)을 포함한다.
생물학적 문서 태깅부(100)는 생물 문헌으로부터 생물 정보를 포함하는 문장을 추출하고, 생물 정보 문장을 분석하여, 생물 정보 문장에 포함되는 단어들에 대하여 태그를 부여한다.
상기 태그 부여 방법에 대하여, "Alzheimer's disease-associated amyloid beta interacts with the human serine protease HtrA2/Omi"라는 문장을 예를 들어 구체적으로 설명한다.
상기 문장은 1 차적으로 아래와 같이 각 품사에 대하여 태그 부여된다.
Alzheimer//NN 's//POS disease-associated//JJ amyloid//NN beta//NN interacts//VBZ with//IN the//DT human//NN serine//NN protease// HtrA2\/Omi//NN
여기서, NN은 명사, POS 는 소유격, JJ 는 형용사, VBZ 는 동사, IN 은 전치사, DT 는 정관사를 의미하는 태그이다.
다음으로, 2 차적으로 생물학적 개체명을 <NE> 생물학적 개체명</NE>와 같은 형식으로 하는 생물 정보 태그를 부여한다.
<NE> Alzheimer//NN 's//POS disease </NE> -associated//JJ <NE> amyloid//NN beta//NN </NE> interacts//VBZ with//IN the//DT human//NN serine//NN protease// <NE> HtrA2\/Omi//NN </NE>
이와 같은 생물 정보 문장의 태그 방법을 도 2 를 참조하여 구체적으로 설명한다.
도 2 는 본 발명의 제 1 실시예의 생물학적 관계 추출 시스템의 생물학적 문서 태깅부에 의해 태깅된 문장의 구조를 보여준다.
도 2 에서와 같이, NN(명사), POS(소유격), JJ(형용사), 및 VBZ(동사)와 같은 품사로 1 차 태그 부여되고, 그 후, 생물학적 개체명인 Alzheimer's disease에 대하여 2 차 생물 정보 태그가 부여된다.
여기서, 상기 문장들을 구성하는 각 단어가 품사별로 태그 부여되고, 생물학적 개체명에 해당하는 Alzheimer's disease에 대하여는 태그명 A로 추가 태그 부여된 것을 알 수 있다.
이하, 도 3 을 참조하여, 본 발명의 제 1 실시예에 따른 생물학적 관계 추출 시스템의 생물학적 개체명 치환부(200)의 구성에 대하여 설명한다.
도 3 은 본 발명의 제 1 실시예에 따른 생물학적 관계 추출 시스템의 생물학적 개체명 치환부(200)의 구성도 이다.
생물학적 개체명 치환부(200)는 생물학적 문서 태깅부(100)에서 태깅된 생물학적 문서를 입력 받고, 생물 정보 태그로부터 생물학적 개체명을 인식한 후, 생물학적 개체명을 소정의 치환명으로 치환한다.
도 3 에서 볼 수 있는 바와 같이, 생물학적 개체명 치환부(200)는 생물학적 개체명 탐색 모듈(210), 관계 동사 탐색 모듈(220), 생물학적 개체명 치환 모듈(230) 및 품사 태깅 수정 모듈(240)을 포함한다.
생물학적 개체명 탐색 모듈(210)은 생물학적 개체명이 태깅된 생물학적 문서를 입력 받아, 생물학적 문서로부터 생물학적 개체명을 탐색하여, 생물학적 개체명을 추출한다.
관계 동사 탐색 모듈(220)은 생물학적 문서로부터 생물학적 개체명에 연결되는 관계 동사를 탐색하여, 탐색된 관계 동사들로부터 추출된 생물학적 개체명과 적합한 관계 의미를 포함하는 관계 동사가 있는지 확인한다.
생물학적 개체명 치환 모듈(230)은 생물학적 문서를 문장 단위로 분리하고, 분리된 문장에 포함된 생물학적 개체명을 소정의 치환명으로 치환한다. 이때, 치환할 생물학적 개체명에 대하여, 생물학적 개체명 할당 저장부(600)에 적절한 치환 명이 존재하는 지 검색하고, 적절한 치환명이 존재하는 경우 그 치환명을 수신 받아, 생물학적 개체명을 치환한다. 생물학적 개체명 할당 저장부(600)에, 적절한 치환 명이 존재하지 않는 경우, 생물학적 개체명 할당 저장부(600) 상기 생물학적 개체명에 대하여 적절한 치환명을 생성하여 부여한다. 이 경우, 생물학적 개체명 및 이에 대응하는 치환명을 생물학적 개체명 할당 저장부(600)에 저장한다.
품사 태깅 수정 모듈(240)은 생물학적 개체명이 소정의 치환명으로 치환된 문장의 적합성을 판단하여, 품사 태깅 정보를 수정한다.
도 4 는 본 발명의 제 1 실시예에 따른 생물학적 관계 추출 시스템의 생물학적 개체명 치환부에 의해 치환된 문장 구조를 보여준다.
도 4 에서 알 수 있는 바와 같이, 예시 문장으로서, 앞에서와 같이, "Alzheimer's disease-associated amyloid beta interacts with the human serine protease HtrA2/Omi"라는 문장을 사용하였다.
도 4 에서 볼 수 있는 바와 같이, 생물학적 개체명 "Alzheimer's disease"는 그 품사가 명사(NN) 이고, 치환명(A)로 치환되었고, 생물학적 개체명 "amyloid beta" 는 그 품사가 명사(NN) 이고, 치환명(B)로 치환되었다.
도 4 에는 개시되어 있지 않으나, 생물학적 개체명 "human serine protease "가 치환명 (C)로 치환되고, 생물학적 개체명 "HtrA2/Omi"가 치환명 (D)로 치환되 었다고 한다면, 생물학적 개체명 치환 모듈(230)에 의해 생물 정보 문장은 "NEA-associated NEB interacts with the NEC NED"로 생물학적 개체명이 포함되지 않는 간단한 문장이 된다.
여기서, NE 는 생물학적 개체명임을 표시한다.
또한, 상기 문장은 품사 태깅 수정 모듈(240)에 의해, "JJ NN VBZ IN DT NN NN"으로 품사 태깅된다.
이하, 도 5 를 참조하여, 본 발명의 제 1 실시예에 따른 생물학적 관계 추출 시스템의 구조 분석부(300)의 구성에 대하여 설명한다.
도 5 은 본 발명의 제 1 실시예에 따른 생물학적 관계 추출 시스템의 구조 분석부(300)의 구성도 이다.
도 5 에서 볼 수 있는 바 와 같이, 구조 분석부(300)은 파서(310)을 포함한다.
구조 분석부(300)은 파서(310)을 이용하여, 생물학적 개체명 치환부(200)으로부터 전달된 생물학적 개체명이 치환된 생물 정보 문장을 파싱한 후, 문장 구조를 분석하고, 문장을 트리로 구성한다. 여기서, 사용될 수 있는 파서(310)은 일반적으로 사용되는 파서(310)을 이용할 수 있다.
본 발명의 제 1 실시예의 경우, 복잡한 생물학적 개체명이 상기 생물학적 개체명 치환부(200)에서 간단한 치환명으로 치환되어, 문장이 단순해져서, 파서(310)의 기능이 극대화될 수 있다.
이하, 도 6 를 참조하여, 본 발명의 제 1 실시예에 따른 생물학적 관계 추출 시스템의 관계 검색부(400)의 구성에 대하여 설명한다.
관계 분석부(400)은 구조 분석부(300)에서 파싱된 문장을 분석하여, 생물학적 개체명 할당 저장부(600)에 저장된 치환명과 생물학적 개체명을 이용하여, 생물학적 개체명의 관계들을 분석하여, 생물학적 개체명 관계 후보를 도출한다. 구체적으로, 파싱된 문장을 분석하여, 생물학적 개체명을 탐색하고, 탐색된 생물학적 개체명과 연결되는 관계동사을 탐색하고, 탐색된 관계동사에 연결된 다른 생물학적 개체명을 탐색한다. 이렇게, 생물학적 개체명, 관계 동사, 관계 동사에 연결된 다른 생물학적 개체명등 세가지가 모두 탐색되면, 두 생물학적 개체명과 관계동사를 이용하여 관계정보를 구성한다.
도 6 은 본 발명의 제 1 실시예에 따른 생물학적 관계 추출 시스템의 관계 분석부(400)의 한 구현예의 구성도 이다.
도 6 에서 볼 수 있는 바와 같이, 관계 분석부(400)는 생물학적 개체명(주체) 탐색 모듈(410), 관계 동사 탐색 모듈(420), 관계 명사 탐색 모듈(430), 관계절 탐색 모듈(440), 생물학적 개체명(객체) 탐색 모듈(450) 및 관계 후보 선발 모듈(460)을 포함한다.
생물학적 개체명(주체) 탐색 모듈(410)은 구조 분석부(300)에서 파싱된 문장을 수신 받아, 파싱된 문장에서 주체에 해당하는 치환명에 해당하는 생물학적 개체명을 생물학적 개체명 할당 저장부(600)으로부터 탐색하여 추출한다. 주체에 해당하는 치환명은 일반적으로 주어에 해당하는 치환명을 포함한다. 관계절에서의 주어에 해당하는 치환명을 포함한다.
관계 동사 탐색 모듈(420)은 생물학적 개체명(주체) 탐색 모듈(410)에서 추출된 생물학적 개체명과 연결된 관계 동사를 탐색한다(420). 여기서, 관계 동사는 수동태, 능동태, 과거형, 현재형등 모든 종류의 동사를 포함하며, 직접적으로 생물학적 개체명에 연결되는 것뿐만 아니라, 간접적으로 연결되는 단어도 포함한다.
생물학적 개체명(객체) 탐색 모듈(450)은 파싱된 문장에서 상기 관계 동사의 객체에 해당하는 치환명에 해당하는 생물학적 개체명을 생물학적 개체명 할당 저장부(600)으로부터 탐색하여 추출한다. 객체에 해당하는 치환명은 일반적으로 목적어에 해당하는 치환명을 포함한다.
관계 명사 탐색 모듈(430)은 탐색된 생물학적 개체명이 탐색된 관계 동사의 명사형에 연결될 경우, 명사형 표현에 같이 연결된 다른 생물학적 개체명이 있는지 탐색한다. 여기서, 관계 동사의 명사형은 관계 동사의 분사 또는 명사형을 포함한다. 구체적으로 관계동사가 interact 인 경우, 분사 interacting 및 명사형 interaction 등을 포함한다. 이때, 관계 동사의 명사형과 연결되는 2 이상의 생물학적 개체명이 탐색되면, 추출된 2 이상의 생물학적 개체명은 관계 정보가 추출될 수 있는 후보가 된다.
관계절 탐색 모듈(440)은 탐색된 생물학적 개체명에 직접 연결되어 수식하는 관계 동사 대신에 관계절의 형태로 수식하는 절이 탐색되는 경우, 탐색된 관계 절에 사용된 관계동사와 생물학적 개체명을 탐색한다. 관계 절의 여부는 관계 대명사의 존재 여부로 판단될 수 있다.
관계 후보 선발 모듈(460)은 하나의 관계 동사에 2 이상의 생물학적 개체명 들이 연결되는 경우, 상기 생물학적 개체명들이 관계가 있는 것으로 하여, 관계 후보로 선발한다. 특히, 생물학적 개체명(주체) 탐색 모듈(410)로부터 탐색된 생물학적 개체명, 상기 생물학적 개체명에 연결되며 관계 동사 탐색 모듈(420)로부터 탐색된 관계동사, 및 상기 관계 동사의 객체로서 연결되며 생물학적 개체명(객체) 탐색 모듈(450)로부터 탐색된 생물학적 개체명이 존재할 경우, 상기 두 생물학적 개체명들에 대하여 관계후보로 선발한다.
도 6 에서 개시되어 있는 구현예 외에도, 먼저, 생물 정보 문장에 대하여 주체에 해당하는 치환명에 연결되는 관계동사를 탐색하고, 상기 탐색된 관계동사에 객체로 연결되는 치환명을 탐색하여, 상기 관계 동사에 객체로 연결되는 치환명이 존재할 경우, 상기 주체에 해당하는 치환명 및 상기 객체에 해당하는 치환명에 대응하는 각각의 생물학적 개체명들을 관계 후보로 선발하는 또 다른 구현예를 고려할 수 있다.
이하, 도 7 를 참조하여, 본 발명의 제 1 실시예에 따른 생물학적 관계 추출 시스템의 관계 결정부(500)의 구성에 대하여 설명한다.
도 7 은 본 발명의 제 1 실시예에 따른 생물학적 관계 추출 시스템의 관계 결정부(500)의 구성도 이다.
관계 결정부(500)은 관계 검색 부(400)에서 선택된 생물학적 개체명간의 관계 후보를 수신 받아, 생물학적으로 의미 있는 관계 후보를 선택하여 생물학적 개체명들간의 관계를 결정한다.
도 7 에서 볼 수 있는 바와 같이, 관계 결정부(500)은 생물학적 개체명 복원 모듈(510), 생물학적 개체명 속성 검색 모듈(520), 관계 속성 판단 모듈(530), 및 관계 결정 모듈(550)을 포함한다.
생물학적 개체명 복원 모듈(510)은 생물학적 개체명 할당 저장부(600)로부터 치환명에 해당하는 생물학적 개체명을 추출하여, 생물학적 개체명을 복원한다.
생물학적 개체명 속성 검색 모듈(520)은 복원된 생물학적 개체명의 속성을 확인하여 생물학적 개체명에 속성을 부여한다. 생물학적 개체명의 속성은 생물학적 개체명의 대상인 생물 객체의 종류에 따라 다양하게 분리될 수 있다. 여기서, 생물 객체의 종류는 미생물, DNA, RNA, 단백질, 아미노산, 효소, 조효소, 비타민, 포도당 등 모든 종류의 생물 객체를 포함한다. 이러한 생물학적 개체명의 속성은 생물학적 개체명의 표기 형식으로부터 파악될 수 있다. 구체적으로 '…ase'인 경우 효소로 판단하는 경우가 이에 속한다.
한편, 생물학적 개체명 속성 검색 모듈(520)은 생물 정보 데이터 베이스를 포함하여, 생물 정보 데이터 베이스를 이용하여 생물학적 개체명에 대한 속성을 검색할 수 있다.
관계 속성 판단 모듈(540)은 생물학적 개체명 속성 검색 모듈(520)을 통해 부여된 생물 속성을 이용하여, 생물학적 개체명의 대상 생물 객체 및 관계 동사의 속성들을 비교하여, 생물학적 개체명들간의 관계 후보가 생물학적으로 의미가 있는 정보인지 판단한다.
구체적으로, 관계 후보로서, 생물학적 개체명의 객체가 각각 DNA 중합 효소(polymerase) 및 특정의 DNA이고, 관계 동사가 전사(transcript)인 경우, DNA 중합 효소와 특정의 DNA 는 생물학적으로 의미가 있으나, 전사(transcript)는 RNA 와 관련된 관계 동사이므로, 본 관계 후보는 생물학적으로 의미가 없게 된다. 이때, 관계 동사가 중합(polymerize)인 경우, DNA 중합 효소가 특정의 DNA를 중합하는 것은 생물학적으로 의미가 있는 것이므로, 본 관계 후보는 생물학적으로 의미가 있다고 판단한다.
관계 속성 판단 모듈(540)은 생물학적 지식 판단 규칙을 저장하는 생물학적 지식 판단 규칙 데이터 베이스를 포함하여, 생물학적 지식 판단 규칙을 통하여 생물학적 개체명들간의 생물 속성이 서로 생물학적 의미가 있는지 판단할 수 있다. 구체적으로, 생물학적 지식 판단 규칙으로는 앞에서 예시한 바와 같은 <DNA, 중합효소(polymerase)>, 및 <RNA, 전사 효소(transcriptase)> 등을 포함할 수 있다.
관계 결정 모듈(550)은 관계 속성 판단 모듈(540)에서 생물학적으로 의미가 있는 것으로 판단된 관계 후보를 생물학적 개체명의 관계로 결정한다.
생물학적 개체명 할당 저장부(600)는 생물학적 개체명 및 생물학적 개체명에 대응하는 적절한 치환명을 저장하며, 생물학적 개체명 치환부(200), 관계 검색부(400) 및 관계 결정부(500)의 요청에 따라, 생물학적 개체명에 대하여 적절한 치환명을, 치환명에 대해서는 대응하는 생물학적 개체명을 할당한다. 생물학적 개체명 할당 저장부(600)에 생물학적 개체명에 대한 적절한 치환명이 존재하지 않는 경우에는 생물학적 개체명에 대하여 치환명을 생성하여 할당한다. 이를 위해, 생물학적 개체명 할당 저장부(600)는 생물학적 개체명에 대한 치환명을 생성하여 할당하는 치환명 생성 모듈을 포함할 수 있다.
이하, 도 8을 참조하여, 본 발명의 제 2 실시예에 따른 생물 정보 검색 방법에 대하여 설명한다.
먼저, 생물 정보를 포함하는 생물학적 문서를 태깅한다(s100). 생물학적 문서 태깅은 생물 정보 문장을 분석하여, 생물 정보 문장에 포함되는 각 단어에 대하여 태그를 부여하고, 및 생물학적 개체명에 해당하는 단어에 대해서는 생물 정보 태그를 부여하는 단계들을 포함할 수 있다.
다음으로, 태깅된 생물학적 문서를 받아, 생물학적 개체명을 소정의 치환 명으로 치환한다(s200).
구체적으로는, 생물학적 개체명을 소정의 치환명으로 치환하기 위해, 태깅된 생물학적 문서를 입력 받아, 생물학적 개체명을 탐색한다.
그 후, 탐색된 생물학적 개체명에 연결된 관계 동사를 탐색하고, 생물학적 개체명을 적절한 치환명으로 치환한다. 그 후, 치환된 생물학적 문서를 이용하여, 품사 태깅 정보를 수정하여, 생물학적 개체명이 소정의 치환 명으로 치환된 생물학적 문서를 작성한다. 다음으로, 치환된 문장의 적합성을 판단하여, 품사 태깅 정보를 수정한다.
품사 태깅 정보 수정은 앞에서와 같은 태깅된 생물학적 문서로서 설명하면, <NE> Alzheimer//NN 's//POS disease </NE>와 같이 여러 품사 태그로 구성되는 생물학적 개체명 부분을 하나의 품사 태깅을 가질 수 있도록, 도 4 에서 개시되는 바와 같이 하나의 명사 태깅(NN)으로 수정한다.
그 후 -associated//JJ와 같이 생물학적 개체명에 연결된 단어( associated) 를 분리하여, 적절한 품사 태깅(JJ)을 부여한다. 다음으로, 하나 이상의 단어로 구성되었던 본래의 생물학적 개체명이 하나의 치환명으로 치환되었을 때, 생물 정보 문장에서 필요가 없어진 품사 태깅(상기 예에서는 소유격을 태그하는 'POS')을 제거한다.
다음으로, 생물학적 개체명이 소정의 치환 명으로 치환된 생물학적 문서를 수신 받아, 파싱한다(s300).
다음으로, 파싱된 생물학적 문서를 수신 받아, 생물학적 개체명 및 그에 연결되는 관계 동사를 이용하여 생물학적 개체명들간의 관계를 분석하여, 생물학적 개체명들간의 관계 후보를 선발한다(s400).
구체적으로는 생물학적 문서의 주체가 되는 치환명에 대한 생물학적 개체명을 호출하고, 주체가 되는 생물학적 개체명과 연결되는 관계 동사를 검색한다.
그 후, 상기 관계 동사의 객체가 되는 치환명의 생물학적 개체명을 호출하여, 주체가 되는 생물학적 개체명, 관계 동사 및 객체가 되는 생물학적 개체명으로 이루어지는 두 생물학적 개체명의 관계 후보를 선발한다.
다른 방법으로는, 파싱된 문장에서 주체가 되는 치환명에 해당하는 생물학적 개체명을 호출 한다. 다음으로, 주체가 되는 생물학적 개체명과 연결되는 관계 동사를 탐색한다.
그후, 관계 동사의 객체가 되는 치환명에 연결되는 생물학적 개체명을 호출하여, 주체가 되는 생물학적 개체명 및 객체가 되는 생물학적 개체명을 관계 후보로 선발한다.
이때, 생물학적 개체명과 연결되는 명사가, 관계 동사의 명사형인지 확인하고, 관계 동사의 명사형인 경우, 상기 명사에 연결되는 또 다른 생물학적 개체명을 검색한다.
또한, 상기 생물학적 개체명에 관계 절이 연결되어 있는지 검색하고, 상기 생물학적 개체명에 관계절이 연결되어 있는 경우, 상기 관계 절에 포함되는 관계동사에 연결되는 생물학적 개체명을 검색하고, 상기 관계절에 연결되는 생물학적 개체명과 검색된 생물학적 개체명을 관계 후보로 선발한다.
다음으로, 도출된 생물학적 개체명들간 관계 후보를 수신 받아, 생물 학적으로 의미 있는 관계 후보를 선택하여 생물학적 개체명들 간의 관계로 결정한다(s500).
구체적으로는, 치환명에 해당하는 생물학적 개체명을 호출하여, 치환명에 대한 생물학적 개체명을 복원하고, 생물학적 개체명의 생물 속성을 확인하여, 주체가 되는 생물학적 개체명, 객체가 되는 생물학적 개체명 및 관계동사들간의 생물학적 의미가 있는 지 판단한다.
생물학적 의미가 없는 것으로 판단되면, 생물학적 개체명 관계 후보를 폐기하고, 생물학적 의미가 있는 것으로 판단되면, 생물학적 개체명 관계 후보를 생물학적 개체명 관계로 결정한다.
이상에서 본 발명의 실시예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 않으며, 첨부된 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속한다.
본 발명은 대량의 생물학적 문헌으로부터 생물 정보들간의 관계를 자동으로 추출하여 분석할 수 있는 수단을 제공할 수 있다.
본 발명은 생물학적 개체명을 간단한 치환명으로 치환하여, 복잡한 생물 정보 문장을 간단한 문장으로 변환 시킨 후, 파서를 이용하여 구조 분석을 수행할 때, 파서의 기능을 극대화 할 수 있어, 대량의 생물 문헌을 효율적으로 처리할 수 있다.
또한, 본 발명은 생물학적 개체명 관계의 생물학적 의미를 판단함으로써, 생물 정보 처리 결과에 대하여 신뢰성을 향상시킬 수 있다.

Claims (17)

  1. 생물학적 관계 추출 시스템에 있어서,
    생물학적 문서로부터, 생물학적 개체명을 소정의 치환명으로 치환하는 생물학적 개체명 치환부;
    상기 생물학적 개체명이 치환된 생물학적 문서를 파싱하는 구조 분석부;
    상기 구조 분석부에서 파싱된 생물학적 문서로부터 생물학적 개체명들의 관계를 분석하여, 생물학적 개체명 관계 후보를 선발하는 관계 분석부;
    상기 관계 분석부에서 수신 받은 관계 후보가 생물학적으로 의미 있는지 판단하여 생물학적 개체명들의 관계를 결정하는 관계 결정부; 및
    상기 생물학적 개체명 및 생물학적 개체명에 대응하는 치환명을 저장하고, 치환명 또는 생물학적 개체명을 제공하는 생물학적 개체명 할당 저장부를 포함하는 생물학적 관계 추출 시스템.
  2. 제 1 항에 있어서,
    생물 정보 문장을 분석하여, 생물 정보 문장에 포함되는 각 단어에 대하여 태그를 부여하고, 생물학적 개체명에 해당하는 단어에 대해서는 생물 정보 태그를 부여하는 생물학적 문서 태깅부를 추가 포함하고,
    상기 생물학적 문서 태깅부에 의해 태그 부여된 생물학적 문서를 상기 생물학적 개체명 치환부에 입력하는 생물학적 관계 추출 시스템.
  3. 제 1 항에 있어서,
    상기 생물학적 개체명 치환부가
    상기 생물학적 문서로부터 생물학적 개체명을 탐색하는 생물학적 개체명 탐색 모듈; 및
    상기 생물학적 개체명 할당 저장부에 생물학적 개체명에 대응되는 치환명을 요청 받고, 상기 생물학적 개체명 할당 저장부로부터 수신 받은 치환명으로 상기 생물학적 개체명을 치환하는 생물학적 개체명 치환 모듈을 포함하는 생물학적 관계 추출 시스템.
  4. 제 3 항에 있어서,
    상기 생물학적 개체명 치환부가
    치환된 문장의 품사 태깅 정보를 수정하는 품사 태깅 수정 모듈을 추가 포함하는 생물학적 관계 추출 시스템.
  5. 제 1 항에 있어서,
    상기 관계 분석부가
    상기 구조 분석부에서 파싱된 문장을 수신 받아, 생물학적 개체명에 대응하는 치환명에 연결되는 관계동사를 탐색하는 관계 동사 탐색 모듈; 및
    하나의 관계 동사에 2 이상의 생물학적 개체명들이 연결되는 경우, 상기 생 물학적 개체명들을 관계 후보로 선발하는 관계 후보 선발 모듈을 포함하는 생물학적 관계 추출 시스템.
  6. 제 1 항에 있어서,
    상기 관계 분석부가
    파싱된 문장에서 주체에 해당하는 치환명에 대응하는 생물학적 개체명을 상기 생물학적 개체명 할당 저장부에 요청하는 제 1 생물학적 개체명 탐색 모듈;
    파싱된 문장에서 주체에 해당하는 치환명에 연결되는 관계동사를 탐색하는 관계 동사 탐색 모듈;
    상기 관계 동사 탐색 모듈에서 탐색된 관계동사에 객체로 연결되는 치환명에 대응하는 생물학적 개체명을 상기 생물학적 개체명 할당 저장부에 요청하는 제 2 생물학적 개체명 탐색 모듈; 및
    상기 제 1 생물학적 개체명 탐색 모듈에서 탐색된 생물학적 개체명, 제 2 생물학적 개체명 탐색 모듈에서 탐색된 생물학적 개체명 및 관계 동사 탐색 모듈에서 탐색된 관계동사를 생물학적 개체명 관계 후보로 선발하는 관계 후보 선발 모듈을 포함하는 생물학적 관계 추출 시스템.
  7. 제 5 항 또는 제 6 항 에 있어서,
    상기 생물학적 개체명에 연결되는 관계 동사가 관계동사의 명사형인 경우, 상기 관계 동사의 명사형에 같이 연결되는 다른 생물학적 개체명을 탐색하는 관계 명사 탐색 모듈을 추가 포함하는 생물학적 관계 추출 시스템.
  8. 제 5 항 또는 제 6 항 에 있어서,
    상기 생물학적 개체명에 관계 절이 연결되는 경우, 상기 관계절을 구성하는 생물학적 개체명 및 관계 동사를 탐색하는 관계절 탐색 모듈을 추가 포함하는 생물학적 관계 추출 시스템.
  9. 제 1 항에 있어서,
    상기 관계 결정부가
    상기 생물학적 개체명들간의 관계 후보에 포함되는 생물학적 개체명의 속성을 확인하여 생물학적 개체명에 속성을 부여하는 생물학적 개체명 속성 검색 모듈; 및
    상기 생물학적 개체명 속성 검색 모듈로부터 부여된 생물 속성들을 비교하여, 상기 생물학적 개체명들의 관계 후보가 생물학적으로 의미가 있는지 판단하는 관계 속성 판단 모듈을 포함하는 생물학적 관계 추출 시스템.
  10. 제 9 항에 있어서,
    상기 생물학적 개체명 속성 검색 모듈이
    생물학적 개체명에 대한 속성을 저장하는 생물 정보 데이터 베이스를 포함하는 생물학적 관계 추출 시스템.
  11. 제 9 항에 있어서,
    상기 관계 속성 판단 모듈이
    생물학적 지식 판단 규칙을 포함하고, 상기 생물학적 개체명에 대응하는 생물학적 지식 판단 규칙을 제공하는 생물학적 지식 판단 데이터 베이스를 포함하는 생물학적 관계 추출 시스템.
  12. 제 1 항에 있어서,
    상기 생물학적 개체명 할당 저장부가
    저장되어 있지 않는 생물학적 개체명에 대하여, 상기 생물학적 개체명에 대응하는 치환명을 생성하는 치환명 생성 모듈을 포함하는 생물학적 관계 추출 시스템.
  13. 생물 정보 처리 방법에 있어서,
    a) 생물학적 개체명을 소정의 치환 명으로 치환하는 단계;
    b) 상기 생물학적 개체명이 치환된 생물학적 문서를 파싱하는 단계;
    c) 생물학적 개체명 및 그에 연결되는 관계동사를 이용하여 생물학적 개체명들간의 관계 후보를 선발하는 단계; 및
    d) 생물학적 개체명들간 관계 후보로부터 생물학적으로 의미가 있는 관계 후보를 선택하여 생물학적 개체명들간의 관계로 결정하는 단계를 포함하는 생물 정보 처리 방법.
  14. 제 13 항에 있어서,
    생물 정보 문장을 분석하여, 생물 정보 문장에 포함되는 각 단어에 대하여 태그를 부여하는 단계; 및
    상기 생물학적 개체명에 해당하는 단어에 대해서는 생물 정보 태그를 부여하는 단계를 포함하는 전처리 단계를 추가 포함하는 생물 정보 처리 방법.
  15. 제 13 항에 있어서,
    c) 단계가
    파싱된 문장을 분석하여, 파싱된 문장의 주체에 해당하는 치환명을 검색하는 단계;
    상기 검색된 주체에 해당하는 치환명에 연결되는 관계동사를 탐색하는 단계;
    상기 탐색된 관계동사에 객체로 연결되는 치환명을 탐색하는 단계; 및
    상기 관계 동사에 객체로 연결되는 치환명이 존재할 경우, 상기 주체에 해당하는 치환명 및 상기 객체에 해당하는 치환명에 대응하는 각각의 생물학적 개체명들을 관계 후보로 선발하는 단계를 포함하는 생물 정보 처리 방법.
  16. 제 13 항 내지 제 15 항 중 어느 한 항에 있어서,
    c) 단계가,
    상기 생물학적 개체명과 연결되는 명사가, 관계 동사의 명사형인지 확인하는 단계; 및
    상기 명사가 관계 동사의 명사형인 경우, 상기 명사에 연결되는 또 다른 생물학적 개체명을 검색하는 단계를 추가 포함하는 생물 정보 처리 방법.
  17. 제 13 항 내지 제 15 항 중 어느 한 항에 있어서,
    c) 단계가,
    상기 생물학적 개체명에 관계 절이 연결되어 있는지 검색하는 단계; 및
    상기 생물학적 개체명에 관계절이 연결되어 있는 경우, 상기 관계 절에 포함되는 관계동사에 연결되는 생물학적 개체명을 검색하고, 상기 관계절에 연결되는 생물학적 개체명과 검색된 생물학적 개체명을 관계 후보로 선발하는 단계를 추가 포함하는 생물 정보 처리 방법.
KR1020040109046A 2004-12-20 2004-12-20 생물학적 관계 추출 시스템 및 생물 정보 처리 방법 Expired - Fee Related KR100568977B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020040109046A KR100568977B1 (ko) 2004-12-20 2004-12-20 생물학적 관계 추출 시스템 및 생물 정보 처리 방법
US11/304,030 US20060136147A1 (en) 2004-12-20 2005-12-15 Biological relationship event extraction system and method for processing biological information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040109046A KR100568977B1 (ko) 2004-12-20 2004-12-20 생물학적 관계 추출 시스템 및 생물 정보 처리 방법

Publications (1)

Publication Number Publication Date
KR100568977B1 true KR100568977B1 (ko) 2006-04-07

Family

ID=36597190

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040109046A Expired - Fee Related KR100568977B1 (ko) 2004-12-20 2004-12-20 생물학적 관계 추출 시스템 및 생물 정보 처리 방법

Country Status (2)

Country Link
US (1) US20060136147A1 (ko)
KR (1) KR100568977B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010055967A1 (en) * 2008-11-14 2010-05-20 Korea Institute Of Science & Technology Information System for extracting ralation between technical terms in large collection using a verb-based pattern
KR20180082030A (ko) * 2017-01-09 2018-07-18 김선중 생물학적 체계 정보 검색 시스템 및 방법
WO2021006573A1 (ko) * 2019-07-05 2021-01-14 (주)호모미미쿠스 생물 종 동정을 활용한 생물학적 정보 추론 장치 및 방법

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8112402B2 (en) * 2007-02-26 2012-02-07 Microsoft Corporation Automatic disambiguation based on a reference resource
GB201919111D0 (en) * 2019-12-20 2020-02-05 Benevolentai Tech Limited SVO entity information retrieval system

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010057781A (ko) * 1999-12-23 2001-07-05 오길록 다중어 형태소 분석장치 및 그 방법
KR20010110496A (ko) * 2000-06-05 2001-12-13 문유진 용언을 중심으로 한 의미분석 지식 베이스의 구축방법
KR20020036059A (ko) * 2000-11-07 2002-05-16 옥철영 사전 뜻풀이말에서 추출된 의미정보를 기반으로하는 의미중의성 해결 방법
KR20040029858A (ko) * 2002-10-02 2004-04-08 학교법인대우학원 생물정보학에서의 데이터베이스 처리 방법

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5369704A (en) * 1993-03-24 1994-11-29 Engate Incorporated Down-line transcription system for manipulating real-time testimony
US6038561A (en) * 1996-10-15 2000-03-14 Manning & Napier Information Services Management and analysis of document information text
US5963965A (en) * 1997-02-18 1999-10-05 Semio Corporation Text processing and retrieval system and method
US6078924A (en) * 1998-01-30 2000-06-20 Aeneid Corporation Method and apparatus for performing data collection, interpretation and analysis, in an information platform
US6539348B1 (en) * 1998-08-24 2003-03-25 Virtual Research Associates, Inc. Systems and methods for parsing a natural language sentence
US6470277B1 (en) * 1999-07-30 2002-10-22 Agy Therapeutics, Inc. Techniques for facilitating identification of candidate genes
US7233891B2 (en) * 1999-08-24 2007-06-19 Virtural Research Associates, Inc. Natural language sentence parser
US6539376B1 (en) * 1999-11-15 2003-03-25 International Business Machines Corporation System and method for the automatic mining of new relationships

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010057781A (ko) * 1999-12-23 2001-07-05 오길록 다중어 형태소 분석장치 및 그 방법
KR20010110496A (ko) * 2000-06-05 2001-12-13 문유진 용언을 중심으로 한 의미분석 지식 베이스의 구축방법
KR20020036059A (ko) * 2000-11-07 2002-05-16 옥철영 사전 뜻풀이말에서 추출된 의미정보를 기반으로하는 의미중의성 해결 방법
KR20040029858A (ko) * 2002-10-02 2004-04-08 학교법인대우학원 생물정보학에서의 데이터베이스 처리 방법

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010055967A1 (en) * 2008-11-14 2010-05-20 Korea Institute Of Science & Technology Information System for extracting ralation between technical terms in large collection using a verb-based pattern
KR101061391B1 (ko) 2008-11-14 2011-09-01 한국과학기술정보연구원 동사기반패턴을 이용한 대용량 문헌정보 내에서의 기술용어간 관계추출 시스템
KR20180082030A (ko) * 2017-01-09 2018-07-18 김선중 생물학적 체계 정보 검색 시스템 및 방법
KR101880275B1 (ko) 2017-01-09 2018-08-16 김선중 생물학적 체계 정보 검색 시스템 및 방법
WO2021006573A1 (ko) * 2019-07-05 2021-01-14 (주)호모미미쿠스 생물 종 동정을 활용한 생물학적 정보 추론 장치 및 방법

Also Published As

Publication number Publication date
US20060136147A1 (en) 2006-06-22

Similar Documents

Publication Publication Date Title
CN118627628B (zh) 一种融合多模态知识图谱的大语言模型知识问答方法及系统
US8832064B2 (en) Answer determination for natural language questioning
US7343371B2 (en) Queries-and-responses processing method, queries-and-responses processing program, queries-and-responses processing program recording medium, and queries-and-responses processing apparatus
US6473729B1 (en) Word phrase translation using a phrase index
Huang et al. Discovering patterns to extract protein–protein interactions from full texts
KR102256240B1 (ko) 논팩토이드형 질의 응답 시스템 및 방법
Clarke et al. Models for sentence compression: A comparison across domains, training requirements and evaluation measures
JP5825676B2 (ja) ノン・ファクトイド型質問応答システム及びコンピュータプログラム
JP3429184B2 (ja) テキスト構造解析装置および抄録装置、並びにプログラム記録媒体
JP5065420B2 (ja) ウェブ・サービス定義の品質を事前評価および精密化するための方法、システム、およびコンピュータ読み取り可能媒体
KR20100054587A (ko) 동사기반패턴을 이용한 대용량 문헌정보 내에서의 기술용어간 관계추출 시스템
CN109766556B (zh) 一种语料修复的方法和装置
KR101709055B1 (ko) 오픈 웹 질의응답을 위한 질문분석 장치 및 방법
CN113032371A (zh) 数据库语法分析方法、装置和计算机设备
CN112380848A (zh) 文本生成方法、装置、设备及存储介质
US20050033569A1 (en) Methods and systems for automatically identifying gene/protein terms in medline abstracts
US20060047732A1 (en) Document processing apparatus for searching documents, control method therefor, program for implementing the method, and storage medium storing the program
KR102338949B1 (ko) 기술문서 번역 지원 시스템
KR20220132679A (ko) 자연어 구조 정보를 이용한 임상정보 검색 시스템 및 방법
JP4162223B2 (ja) 自然文検索装置、その方法及びプログラム
KR100568977B1 (ko) 생물학적 관계 추출 시스템 및 생물 정보 처리 방법
CN109800430B (zh) 一种语义理解方法及系统
Alias et al. A Malay text corpus analysis for sentence compression using pattern-growth method
CN1545665A (zh) 用于多分析器架构的预测串联算法
KR101104113B1 (ko) 기술용어 간 관계 추출용 테스트 컬렉션 반자동 구축을 위한 시스템

Legal Events

Date Code Title Description
A201 Request for examination
PA0109 Patent application

St.27 status event code: A-0-1-A10-A12-nap-PA0109

PA0201 Request for examination

St.27 status event code: A-1-2-D10-D11-exm-PA0201

D13-X000 Search requested

St.27 status event code: A-1-2-D10-D13-srh-X000

D14-X000 Search report completed

St.27 status event code: A-1-2-D10-D14-srh-X000

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

St.27 status event code: A-1-2-D10-D22-exm-PE0701

GRNT Written decision to grant
PR0701 Registration of establishment

St.27 status event code: A-2-4-F10-F11-exm-PR0701

PR1002 Payment of registration fee

St.27 status event code: A-2-2-U10-U11-oth-PR1002

Fee payment year number: 1

PG1601 Publication of registration

St.27 status event code: A-4-4-Q10-Q13-nap-PG1601

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 4

PN2301 Change of applicant

St.27 status event code: A-5-5-R10-R13-asn-PN2301

St.27 status event code: A-5-5-R10-R11-asn-PN2301

FPAY Annual fee payment

Payment date: 20100401

Year of fee payment: 5

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 5

LAPS Lapse due to unpaid annual fee
PC1903 Unpaid annual fee

St.27 status event code: A-4-4-U10-U13-oth-PC1903

Not in force date: 20110404

Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE

PC1903 Unpaid annual fee

St.27 status event code: N-4-6-H10-H13-oth-PC1903

Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE

Not in force date: 20110404

PN2301 Change of applicant

St.27 status event code: A-5-5-R10-R13-asn-PN2301

St.27 status event code: A-5-5-R10-R11-asn-PN2301

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000