KR20030094966A - 통제학습 기반의 문서 자동분류시스템 및 그 방법 - Google Patents
통제학습 기반의 문서 자동분류시스템 및 그 방법 Download PDFInfo
- Publication number
- KR20030094966A KR20030094966A KR1020020032451A KR20020032451A KR20030094966A KR 20030094966 A KR20030094966 A KR 20030094966A KR 1020020032451 A KR1020020032451 A KR 1020020032451A KR 20020032451 A KR20020032451 A KR 20020032451A KR 20030094966 A KR20030094966 A KR 20030094966A
- Authority
- KR
- South Korea
- Prior art keywords
- documents
- document
- data
- classification
- learning
- Prior art date
Links
- 239000000284 extract Substances 0.000 claims abstract description 8
- 238000004891 communication Methods 0.000 claims abstract description 5
- 238000000034 method Methods 0.000 claims description 14
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 230000000877 morphologic effect Effects 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 claims description 2
- 239000000463 material Substances 0.000 claims description 2
- 238000011160 research Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60N—SEATS SPECIALLY ADAPTED FOR VEHICLES; VEHICLE PASSENGER ACCOMMODATION NOT OTHERWISE PROVIDED FOR
- B60N2/00—Seats specially adapted for vehicles; Arrangement or mounting of seats in vehicles
- B60N2/24—Seats specially adapted for vehicles; Arrangement or mounting of seats in vehicles for particular purposes or particular vehicles
- B60N2/42—Seats specially adapted for vehicles; Arrangement or mounting of seats in vehicles for particular purposes or particular vehicles the seat constructed to protect the occupant from the effect of abnormal g-forces, e.g. crash or safety seats
- B60N2/427—Seats or parts thereof displaced during a crash
- B60N2/42727—Seats or parts thereof displaced during a crash involving substantially rigid displacement
- B60N2/42745—Seats or parts thereof displaced during a crash involving substantially rigid displacement of the back-rest
Landscapes
- Engineering & Computer Science (AREA)
- Aviation & Aerospace Engineering (AREA)
- Transportation (AREA)
- Mechanical Engineering (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (4)
- 데이터 통신이 가능한 사용자 단말기(500)와;인터넷 및 인트라넷 기반에서 제공되는 문헌이나 문서(100,110)들의 문장이나 문맥에서 형태소를 분석하여 추출된 단어들의 가중치 및 유사도를 산출하고, 상기 자동 분석된 데이터에서 인덱스를 추출하여 저장하며 상기 사용자 단말기(500)에서 입력되는 키워드에 해당되는 데이터들을 전송하는 문서분류서버(200)와;상기 문서분류서버(200)의 인덱스 데이터들을 주제별로 분류하며 상기 데이터를 유지 관리하는 관리자서버(300)로 이루어진 것을 특징으로 하는 학습통제 기반의 자동 문서분류시스템.
- 제 1항에 있어서, 상기 문서분류서버(200)는 문헌이나 문서들을 데이터로 변환하는 파일변환수단(210)과;상기 파일변환수단(210)에 의해 변환된 데이터의 문장이나 문맥에서 사전적 의미를 갖는 단어를 추출하는 형태소 분석기(220)와;상기 형태소 분석기(220)에 의해 추출된 단어들의 출현 빈도 및 역문헌 빈도를 각각 산출하여 부가된 가중치 값이 1과 0사이에서 최대 값으로 하고, 상기 가중치에 의해 부여된 단어간의 의미관계를 사전에 학습된 학습문서와 사용자가 신규로 등록하는 문서들에 의해 주제별 데이터를 생성하는 자동분류 프로그램(230)과;상기 자동분류 프로그램(230)에 의해 생성된 데이터에서 인덱스만을 추출하여 저장하는 데이터서버(240)를 더 포함한 것을 특징으로 하는 통제학습 기반의 자동 문서분류시스템.
- 인터넷/인트라넷 기반에서 신문기사 및 각종 학술논문 초록들의 문헌이나 문서들을 사전 정의된 정보로 분류하고, 상기 분류된 문서들을 데이터로 변환하는 제 1단계;상기 변환된 데이터들은 각 문장이나 문맥 용어들의 형태소 분석하여 각 용어들의 사전적인 의미를 갖는 단어들을 추출하는 제 2단계;상기 문헌이나 문서들의 내용에서 단어들의 가중치 및 유사도를 산출하는 제 3단계;상기 단어들의 가중치 및 유사도가 산출되면 각 문헌이나 문서에 분류 정보를 추가하여 데이터를 생성하고, 생성된 데이터에서 인덱스를 추출하여 저장하는 제 4단계;상기 인덱스 자료들을 학습문서로 분류하기 위해 관리자로부터 입력되는 키워드 및 분류별 질의를 통해 분류대상 문서와 코사인 유사계수를 이용하여 가장 유사한 복수개의 학습문서를 검색하는 제 5단계;상기 검색된 학습문서가 분류된 각 범주에 대해 입력문서의 적합성을 산출하여 그 적합성 값이 사전 설정된 기준치 1과 0사이에 값인 경우 해당되는 각 범주로 분류하거나 또는 가장 큰 하나의 범주로 분류하는 제 6단계 및;개인사용자 단말기로부터 입력되는 키워드에 적합한 해당 분류데이터를 전송하는 제 7단계로 이루어진 것을 특징으로 하는 통제학습 기반의 자동 문서분류방법.
- 제 3항에 있어서, 상기 제 3단계에서 단어의 가중치 및 유사도를 검출하는 방법은 사전 정의되어 분류된 정치·경제·산업·사회·사건·문화·과학 및 스포츠 등으로 분류하고, 각 문헌이나 문서에서 각 단어의 빈도와 역문헌 빈도를 각각 산출하여 각 도출된 값의 최대 값으로 가중치를 계산하고, 상기 문헌이나 문서에 부여된 가중치를 통하여 단어간의 의미관계를 생성하기 위한 단어간의 유사도를 산출하는 것을 특징으로 하는 통제학습 기반의 자동 문서분류방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020020032451A KR20030094966A (ko) | 2002-06-11 | 2002-06-11 | 통제학습 기반의 문서 자동분류시스템 및 그 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020020032451A KR20030094966A (ko) | 2002-06-11 | 2002-06-11 | 통제학습 기반의 문서 자동분류시스템 및 그 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20030094966A true KR20030094966A (ko) | 2003-12-18 |
Family
ID=32386543
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020020032451A KR20030094966A (ko) | 2002-06-11 | 2002-06-11 | 통제학습 기반의 문서 자동분류시스템 및 그 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20030094966A (ko) |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100503950B1 (ko) * | 2002-11-09 | 2005-07-26 | 삼성에스디에스 주식회사 | 인터넷 검색엔진을 이용한 커스터마이징 분류 사전 구성시스템 및 방법 |
KR100505848B1 (ko) * | 2002-10-02 | 2005-08-04 | 씨씨알 주식회사 | 검색 시스템 |
KR100659370B1 (ko) * | 2006-02-15 | 2006-12-19 | 한국과학기술정보연구원 | 시소러스 매칭에 의한 문서 db 형성 방법 및 정보검색방법 |
KR100691400B1 (ko) * | 2006-03-31 | 2007-03-12 | 엔에이치엔(주) | 부가 정보를 이용하여 형태소를 분석하는 방법 및 상기방법을 수행하는 형태소 분석기 |
KR20070035786A (ko) * | 2005-09-28 | 2007-04-02 | 강기만 | 단어 교차 관계 기반 질의어 확장에 의한 문서 검색 장치및 그 방법 |
KR100756921B1 (ko) * | 2006-02-28 | 2007-09-07 | 한국과학기술원 | 문서 분류방법 및 그 문서 분류방법을 컴퓨터에서 실행시키기 위한 프로그램을 포함하는 컴퓨터로 읽을 수있는 기록매체. |
KR100809751B1 (ko) * | 2006-04-13 | 2008-03-04 | 엘지전자 주식회사 | 문서분석 시스템 및 그 방법 |
KR100816923B1 (ko) * | 2006-04-13 | 2008-03-26 | 엘지전자 주식회사 | 문서 분류 시스템 및 그 방법 |
KR100816912B1 (ko) * | 2006-04-13 | 2008-03-26 | 엘지전자 주식회사 | 문서검색 시스템 및 그 방법 |
WO2008070866A3 (en) * | 2006-12-07 | 2008-07-24 | Google Inc | Interleaving search results |
KR100885527B1 (ko) * | 2007-10-24 | 2009-02-26 | 주식회사 코난테크놀로지 | 문맥 기반 색인데이터 생성장치와 문맥기반 검색장치 및 그방법 |
KR101064256B1 (ko) * | 2009-12-03 | 2011-09-14 | 한국과학기술정보연구원 | 최대 개념강도 인지기법을 이용한 최적의 데이터베이스 선택장치 및 그 방법 |
WO2014178859A1 (en) * | 2013-05-01 | 2014-11-06 | Hewlett-Packard Development Company, L.P. | Content classification |
US10419269B2 (en) | 2017-02-21 | 2019-09-17 | Entit Software Llc | Anomaly detection |
US10803074B2 (en) | 2015-08-10 | 2020-10-13 | Hewlett Packard Entperprise Development LP | Evaluating system behaviour |
US10884891B2 (en) | 2014-12-11 | 2021-01-05 | Micro Focus Llc | Interactive detection of system anomalies |
KR20210059954A (ko) * | 2019-11-18 | 2021-05-26 | 주식회사 메드올스 | 의료 전문 자료의 과목 분류 시스템 및 방법 |
KR102294364B1 (ko) * | 2021-05-24 | 2021-08-27 | 김희대 | 인공지능 기반 문서 자동 변환 시스템 및 그 방법 |
CN114205148A (zh) * | 2021-12-10 | 2022-03-18 | 深圳市亚讯威视数字技术有限公司 | 一种大数据应用安全管控系统 |
KR20220087119A (ko) * | 2020-12-17 | 2022-06-24 | 한국산업기술평가관리원 | 특허, 논문, 국가연구보고서 통합 정보 산출 및 표시방법 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20010004404A (ko) * | 1999-06-28 | 2001-01-15 | 정선종 | 키팩트기반 텍스트 검색시스템과, 이를 이용한 키팩트기반 텍스트 색인방법 및 검색방법 |
KR20010098714A (ko) * | 2000-04-18 | 2001-11-08 | 이계철 | 중심용어사전을 이용한 표제어의 중심용어 추출 방법 및그를 이용한 정보 검색 시스템 및 그 방법 |
KR20010097802A (ko) * | 2000-04-26 | 2001-11-08 | 신재균 | 다국어 검색과 검색정보 자동번역/분류 시스템과 그를이용한 다국어 검색방법 |
KR20020014026A (ko) * | 2000-08-14 | 2002-02-25 | (주) 인포마스터 | 웹 개인화에 바탕한 뉴스 추적 및 분석 서비스 |
KR20020016056A (ko) * | 2000-08-24 | 2002-03-04 | 모리시타 요이찌 | 문서 검색 및 분류 방법 및 장치 |
KR20020032060A (ko) * | 2000-10-25 | 2002-05-03 | 전종훈 | 근접 검색식을 이용한 정보 검색 시스템 및 방법 |
-
2002
- 2002-06-11 KR KR1020020032451A patent/KR20030094966A/ko not_active Application Discontinuation
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20010004404A (ko) * | 1999-06-28 | 2001-01-15 | 정선종 | 키팩트기반 텍스트 검색시스템과, 이를 이용한 키팩트기반 텍스트 색인방법 및 검색방법 |
KR20010098714A (ko) * | 2000-04-18 | 2001-11-08 | 이계철 | 중심용어사전을 이용한 표제어의 중심용어 추출 방법 및그를 이용한 정보 검색 시스템 및 그 방법 |
KR20010097802A (ko) * | 2000-04-26 | 2001-11-08 | 신재균 | 다국어 검색과 검색정보 자동번역/분류 시스템과 그를이용한 다국어 검색방법 |
KR20020014026A (ko) * | 2000-08-14 | 2002-02-25 | (주) 인포마스터 | 웹 개인화에 바탕한 뉴스 추적 및 분석 서비스 |
KR20020016056A (ko) * | 2000-08-24 | 2002-03-04 | 모리시타 요이찌 | 문서 검색 및 분류 방법 및 장치 |
KR20020032060A (ko) * | 2000-10-25 | 2002-05-03 | 전종훈 | 근접 검색식을 이용한 정보 검색 시스템 및 방법 |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100505848B1 (ko) * | 2002-10-02 | 2005-08-04 | 씨씨알 주식회사 | 검색 시스템 |
KR100503950B1 (ko) * | 2002-11-09 | 2005-07-26 | 삼성에스디에스 주식회사 | 인터넷 검색엔진을 이용한 커스터마이징 분류 사전 구성시스템 및 방법 |
KR20070035786A (ko) * | 2005-09-28 | 2007-04-02 | 강기만 | 단어 교차 관계 기반 질의어 확장에 의한 문서 검색 장치및 그 방법 |
KR100659370B1 (ko) * | 2006-02-15 | 2006-12-19 | 한국과학기술정보연구원 | 시소러스 매칭에 의한 문서 db 형성 방법 및 정보검색방법 |
KR100756921B1 (ko) * | 2006-02-28 | 2007-09-07 | 한국과학기술원 | 문서 분류방법 및 그 문서 분류방법을 컴퓨터에서 실행시키기 위한 프로그램을 포함하는 컴퓨터로 읽을 수있는 기록매체. |
KR100691400B1 (ko) * | 2006-03-31 | 2007-03-12 | 엔에이치엔(주) | 부가 정보를 이용하여 형태소를 분석하는 방법 및 상기방법을 수행하는 형태소 분석기 |
KR100809751B1 (ko) * | 2006-04-13 | 2008-03-04 | 엘지전자 주식회사 | 문서분석 시스템 및 그 방법 |
KR100816923B1 (ko) * | 2006-04-13 | 2008-03-26 | 엘지전자 주식회사 | 문서 분류 시스템 및 그 방법 |
KR100816912B1 (ko) * | 2006-04-13 | 2008-03-26 | 엘지전자 주식회사 | 문서검색 시스템 및 그 방법 |
US8086600B2 (en) | 2006-12-07 | 2011-12-27 | Google Inc. | Interleaving search results |
WO2008070866A3 (en) * | 2006-12-07 | 2008-07-24 | Google Inc | Interleaving search results |
US8738597B2 (en) | 2006-12-07 | 2014-05-27 | Google Inc. | Interleaving search results |
KR100885527B1 (ko) * | 2007-10-24 | 2009-02-26 | 주식회사 코난테크놀로지 | 문맥 기반 색인데이터 생성장치와 문맥기반 검색장치 및 그방법 |
KR101064256B1 (ko) * | 2009-12-03 | 2011-09-14 | 한국과학기술정보연구원 | 최대 개념강도 인지기법을 이용한 최적의 데이터베이스 선택장치 및 그 방법 |
WO2014178859A1 (en) * | 2013-05-01 | 2014-11-06 | Hewlett-Packard Development Company, L.P. | Content classification |
US10884891B2 (en) | 2014-12-11 | 2021-01-05 | Micro Focus Llc | Interactive detection of system anomalies |
US10803074B2 (en) | 2015-08-10 | 2020-10-13 | Hewlett Packard Entperprise Development LP | Evaluating system behaviour |
US10419269B2 (en) | 2017-02-21 | 2019-09-17 | Entit Software Llc | Anomaly detection |
KR20210059954A (ko) * | 2019-11-18 | 2021-05-26 | 주식회사 메드올스 | 의료 전문 자료의 과목 분류 시스템 및 방법 |
KR20220087119A (ko) * | 2020-12-17 | 2022-06-24 | 한국산업기술평가관리원 | 특허, 논문, 국가연구보고서 통합 정보 산출 및 표시방법 |
KR102294364B1 (ko) * | 2021-05-24 | 2021-08-27 | 김희대 | 인공지능 기반 문서 자동 변환 시스템 및 그 방법 |
CN114205148A (zh) * | 2021-12-10 | 2022-03-18 | 深圳市亚讯威视数字技术有限公司 | 一种大数据应用安全管控系统 |
CN114205148B (zh) * | 2021-12-10 | 2024-05-28 | 深圳市亚讯威视数字技术有限公司 | 一种大数据应用安全管控系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20030094966A (ko) | 통제학습 기반의 문서 자동분류시스템 및 그 방법 | |
Bollacker et al. | CiteSeer: An autonomous web agent for automatic retrieval and identification of interesting publications | |
Niwattanakul et al. | Using of Jaccard coefficient for keywords similarity | |
US8108204B2 (en) | Text categorization using external knowledge | |
US7257530B2 (en) | Method and system of knowledge based search engine using text mining | |
US20180341686A1 (en) | System and method for data search based on top-to-bottom similarity analysis | |
Al-Obaydy et al. | Document classification using term frequency-inverse document frequency and K-means clustering | |
EP0822503A1 (en) | Document retrieval system | |
Salman | Text summarizing and clustering using data mining technique | |
Ramya et al. | DRDLC: discovering relevant documents using latent dirichlet allocation and cosine similarity | |
Bassil | A survey on information retrieval, text categorization, and web crawling | |
Özyirmidokuz | Mining unstructured Turkish economy news articles | |
KR100407081B1 (ko) | 문서 검색 및 분류 방법 및 장치 | |
Wang et al. | An automatic online news topic keyphrase extraction system | |
Chung et al. | Developing a specialized directory system by automatically classifying Web documents | |
Mallek et al. | An unsupervised approach for precise context identification from unstructured text documents | |
CN113590738A (zh) | 一种基于内容与情感的网络敏感信息的检测方法 | |
Narang | Hiearchical clustering of documents: A brief study and implementation in Matlab | |
Cheng et al. | Learning to rank relevant documents for information retrieval in bioengineering text corpora | |
Raheemaa Khan et al. | A Novel Technique Using Multiple K-Shingling Based Weighted Dissimilarity Score for Web Content Outlier Mining. | |
AU2021100441A4 (en) | A method of text mining in ranking of web pages using machine learning | |
Golub | Using controlled vocabularies in automated subject classification of textual web pages, in the context of browsing | |
Li et al. | Clustering web search results using conceptual grouping | |
Kozłowski | PKE: a novel Polish keywords extraction method | |
Theobald et al. | Classification and focused crawling for semistructured data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20020611 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20040908 Patent event code: PE09021S01D |
|
E601 | Decision to refuse application | ||
PE0601 | Decision on rejection of patent |
Patent event date: 20050429 Comment text: Decision to Refuse Application Patent event code: PE06012S01D Patent event date: 20040908 Comment text: Notification of reason for refusal Patent event code: PE06011S01I |