KR100816923B1 - 문서 분류 시스템 및 그 방법 - Google Patents
문서 분류 시스템 및 그 방법 Download PDFInfo
- Publication number
- KR100816923B1 KR100816923B1 KR1020060033660A KR20060033660A KR100816923B1 KR 100816923 B1 KR100816923 B1 KR 100816923B1 KR 1020060033660 A KR1020060033660 A KR 1020060033660A KR 20060033660 A KR20060033660 A KR 20060033660A KR 100816923 B1 KR100816923 B1 KR 100816923B1
- Authority
- KR
- South Korea
- Prior art keywords
- document
- documents
- classification
- database
- stored
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/40—Data acquisition and logging
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (6)
- 문서가 저장된 데이터베이스; 및상기 데이터베이스에 저장된 문서들을 자동 분류하기 위한 문서 분류부;가 포함되고,상기 문서 분류부에는 상기 문서로부터 도출되는 키워드 또는 색인어에 가중치를 부여하여 이를 특성값으로 작성하고 이를 벡터화하는 특성 추출부와, 상기 특성 추출부에 의해 형성된 벡터들을 이용하여 문서간의 유사도를 판단하는 유사도 판단부와, 기 설정된 특성값들을 갖는 코드들을 이용하여 상기 데이터베이스에 저장된 문서들을 기술분야별 분류코드에 따라 분류시키는 분류 체계부가 구비되고,상기 문서 분류부는 상기 데이터베이스로 제공되는 신규의 문서를 사용자에 의해 설정된 주기마다 상기 분류체계에 따른 문서분류를 수행하는 것을 특징으로 하는 문서 분류 시스템.
- 삭제
- 삭제
- (a) 데이터베이스에 저장된 문서들로부터 도출되는 키워드 또는 색인어에 가중치를 부여하여 이를 특성값으로 작성하고, 추출된 특성값을 이용하여 문서들간의 유사도가 판단되는 단계;(b) 상기 문서들간의 유사도와 기 설정된 특성값들을 갖는 코드들을 이용하여, 상기 데이터베이스에 저장된 문서들을 기술분야별 분류코드에 따라 분류하는 단계; 및(c) 상기 데이터베이스로 신규의 문서가 제공되는지 여부를 감시하고, 신규의 문서가 제공되는 경우에 상기 신규의 문서에 대하여 사용자가 설정된 주기마다 상기의 (a) 및 (b)단계가 재수행되는 단계;가 포함되는 문서 분류 방법.
- 삭제
- 삭제
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020060033660A KR100816923B1 (ko) | 2006-04-13 | 2006-04-13 | 문서 분류 시스템 및 그 방법 |
US11/621,870 US8090743B2 (en) | 2006-04-13 | 2007-01-10 | Document management system and method |
CN2007100080684A CN101055581B (zh) | 2006-04-13 | 2007-02-09 | 文档管理系统和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020060033660A KR100816923B1 (ko) | 2006-04-13 | 2006-04-13 | 문서 분류 시스템 및 그 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20070102035A KR20070102035A (ko) | 2007-10-18 |
KR100816923B1 true KR100816923B1 (ko) | 2008-03-26 |
Family
ID=38795418
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020060033660A Expired - Fee Related KR100816923B1 (ko) | 2006-04-13 | 2006-04-13 | 문서 분류 시스템 및 그 방법 |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR100816923B1 (ko) |
CN (1) | CN101055581B (ko) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101035038B1 (ko) | 2010-10-12 | 2011-05-19 | 한국과학기술정보연구원 | 분류기의 동적 결합에 의한 대용량 분류기 자동 생성 시스템 및 방법 |
KR101064256B1 (ko) | 2009-12-03 | 2011-09-14 | 한국과학기술정보연구원 | 최대 개념강도 인지기법을 이용한 최적의 데이터베이스 선택장치 및 그 방법 |
KR101136037B1 (ko) | 2009-11-06 | 2012-04-18 | 동국대학교 산학협력단 | 문서의 색인화 및 검색을 위한 방법 및 장치 |
KR101339103B1 (ko) * | 2011-10-05 | 2013-12-09 | (주)워드워즈 | 의미적 자질을 이용한 문서 분류 시스템 및 그 방법 |
KR101458588B1 (ko) * | 2012-09-12 | 2014-11-21 | (주)케이테크 | 분야별 전문가 큐레이션 추천 시스템 및 이를 이용한 분야별 전문가 추천 방법 |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102008013608A1 (de) * | 2008-03-11 | 2009-10-29 | Vodafone Holding Gmbh | Verfahren und Einrichtung zum Analysieren digitaler Bilder |
KR101252397B1 (ko) | 2011-06-02 | 2013-04-08 | 포항공과대학교 산학협력단 | 웹을 이용한 정보 검색 방법 및 이를 사용하는 음성 대화 방법 |
JP5389130B2 (ja) * | 2011-09-15 | 2014-01-15 | 株式会社東芝 | 文書分類装置、方法およびプログラム |
KR101404644B1 (ko) * | 2012-01-18 | 2014-07-01 | 고려대학교 산학협력단 | 지식 베이스 확장 장치 및 방법 |
KR101492016B1 (ko) * | 2013-03-15 | 2015-02-23 | 한국과학기술원 | 문서 분석 방법 |
CN104281603B (zh) * | 2013-07-05 | 2018-01-19 | 北大方正集团有限公司 | 字频分级统计方法及系统 |
KR101656604B1 (ko) * | 2015-02-11 | 2016-09-23 | 중앙대학교 산학협력단 | 다중 레이블을 분류하기 위해 이용되는 특징 셋의 선택 방법 및 장치 |
JP6623547B2 (ja) * | 2015-05-12 | 2019-12-25 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
CN107480879A (zh) * | 2017-08-09 | 2017-12-15 | 郑州星睿水利科技有限公司 | 水文职工业务知识考评方法及系统 |
CN107609169A (zh) * | 2017-09-27 | 2018-01-19 | 合肥博力生产力促进中心有限公司 | 一种基于数据库的专利名称后台管理分析系统 |
CN109729126A (zh) * | 2017-10-31 | 2019-05-07 | 北京国双科技有限公司 | 文本资源的推送方法、装置、存储介质及处理器 |
CN111460786A (zh) * | 2020-04-09 | 2020-07-28 | 南京东大智能化系统有限公司 | 一种传统文档结构分析的技术方法 |
CN112507062B (zh) * | 2020-12-15 | 2023-07-25 | 国能大渡河流域水电开发有限公司 | 一种文档分类保存管理方法、系统及存储设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09282331A (ja) * | 1996-04-09 | 1997-10-31 | Canon Inc | 文書類似判定装置および文書類似判定方法 |
KR20020089677A (ko) * | 2001-05-24 | 2002-11-30 | 주식회사 네오프레스 | 문서 자동 분류 방법 및 이를 수행하기 위한 시스템 |
KR20030094966A (ko) * | 2002-06-11 | 2003-12-18 | 주식회사 코스모정보통신 | 통제학습 기반의 문서 자동분류시스템 및 그 방법 |
JP2004206468A (ja) | 2002-12-25 | 2004-07-22 | Ricoh Co Ltd | 文書管理システム及び文書管理プログラム |
KR20060016933A (ko) * | 2004-08-19 | 2006-02-23 | 함정우 | 문서분류장치 및 문서분류방법 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6055540A (en) * | 1997-06-13 | 2000-04-25 | Sun Microsystems, Inc. | Method and apparatus for creating a category hierarchy for classification of documents |
JP3701197B2 (ja) * | 2000-12-28 | 2005-09-28 | 松下電器産業株式会社 | 分類への帰属度計算基準作成方法及び装置 |
CN1536483A (zh) * | 2003-04-04 | 2004-10-13 | 陈文中 | 网络信息抽取及处理的方法及系统 |
-
2006
- 2006-04-13 KR KR1020060033660A patent/KR100816923B1/ko not_active Expired - Fee Related
-
2007
- 2007-02-09 CN CN2007100080684A patent/CN101055581B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09282331A (ja) * | 1996-04-09 | 1997-10-31 | Canon Inc | 文書類似判定装置および文書類似判定方法 |
KR20020089677A (ko) * | 2001-05-24 | 2002-11-30 | 주식회사 네오프레스 | 문서 자동 분류 방법 및 이를 수행하기 위한 시스템 |
KR20030094966A (ko) * | 2002-06-11 | 2003-12-18 | 주식회사 코스모정보통신 | 통제학습 기반의 문서 자동분류시스템 및 그 방법 |
JP2004206468A (ja) | 2002-12-25 | 2004-07-22 | Ricoh Co Ltd | 文書管理システム及び文書管理プログラム |
KR20060016933A (ko) * | 2004-08-19 | 2006-02-23 | 함정우 | 문서분류장치 및 문서분류방법 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101136037B1 (ko) | 2009-11-06 | 2012-04-18 | 동국대학교 산학협력단 | 문서의 색인화 및 검색을 위한 방법 및 장치 |
KR101064256B1 (ko) | 2009-12-03 | 2011-09-14 | 한국과학기술정보연구원 | 최대 개념강도 인지기법을 이용한 최적의 데이터베이스 선택장치 및 그 방법 |
KR101035038B1 (ko) | 2010-10-12 | 2011-05-19 | 한국과학기술정보연구원 | 분류기의 동적 결합에 의한 대용량 분류기 자동 생성 시스템 및 방법 |
WO2012050252A1 (ko) * | 2010-10-12 | 2012-04-19 | 한국과학기술정보연구원 | 분류기의 동적 결합에 의한 대용량 분류기 자동 생성 시스템 및 방법 |
KR101339103B1 (ko) * | 2011-10-05 | 2013-12-09 | (주)워드워즈 | 의미적 자질을 이용한 문서 분류 시스템 및 그 방법 |
KR101458588B1 (ko) * | 2012-09-12 | 2014-11-21 | (주)케이테크 | 분야별 전문가 큐레이션 추천 시스템 및 이를 이용한 분야별 전문가 추천 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR20070102035A (ko) | 2007-10-18 |
CN101055581A (zh) | 2007-10-17 |
CN101055581B (zh) | 2012-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100816923B1 (ko) | 문서 분류 시스템 및 그 방법 | |
US8090743B2 (en) | Document management system and method | |
US7424421B2 (en) | Word collection method and system for use in word-breaking | |
JP4233836B2 (ja) | 文書自動分類システム、不要語判定方法、文書自動分類方法、およびプログラム | |
Usman et al. | Urdu text classification using majority voting | |
EP1170674A2 (en) | Method and apparatus for ordering electronic data | |
Sabuna et al. | Summarizing Indonesian text automatically by using sentence scoring and decision tree | |
CN108132927A (zh) | 一种融合图结构与节点关联的关键词提取方法 | |
KR20220119745A (ko) | 콘텐츠를 검색하는 방법, 장치, 기기 및 컴퓨터 판독 가능 저장 매체 | |
KR102334236B1 (ko) | 음성 변환 Text Data에서 의미있는 키워드 추출 방법과 활용 | |
KR101976081B1 (ko) | 토픽 모델링 기반 시맨틱 이미지 검색 방법, 시스템 및 컴퓨터 프로그램 | |
CN106844482B (zh) | 一种基于搜索引擎的检索信息匹配方法及装置 | |
JP4873739B2 (ja) | テキストの多重トピック抽出装置、テキストの多重トピック抽出方法、プログラム及び記録媒体 | |
CN103294741B (zh) | 类似文件检索辅助装置以及类似文件检索辅助方法 | |
Zehtab-Salmasi et al. | FRAKE: fusional real-time automatic keyword extraction | |
CN115130601A (zh) | 基于多维特征融合的二阶段学术数据网页分类方法及系统 | |
JP2013101679A (ja) | テキストセグメンテーション装置及び方法及びプログラム及びコンピュータ読取可能な記録媒体 | |
JP2009015795A (ja) | テキストセグメンテーション装置、テキストセグメンテーション方法、プログラム及び記録媒体 | |
KR101458857B1 (ko) | 특허 분석 시스템 및 방법과 이를 실행하기 위한 프로그램이 기록된 기록매체 | |
Behera et al. | An approach of categorization and summarization of news using topic modeling | |
JP2004287670A (ja) | 画像データベース作成装置、画像データベース作成方法、プログラム、及び記録媒体 | |
Lingwal | Noise reduction and content retrieval from web pages | |
KR102371224B1 (ko) | 공항 및 항공 기술의 트렌드 분석 장치 및 방법 | |
JP2006227823A (ja) | 情報処理装置及びその制御方法 | |
KR100964207B1 (ko) | 해시 기반 문서의 색인화 및 검색 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20060413 |
|
PA0201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20070522 Patent event code: PE09021S01D |
|
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20071224 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20080319 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee | ||
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee | ||
FPAY | Annual fee payment |
Payment date: 20111221 Year of fee payment: 5 |
|
PR1001 | Payment of annual fee | ||
FPAY | Annual fee payment |
Payment date: 20130226 Year of fee payment: 6 |
|
PR1001 | Payment of annual fee | ||
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |