KR101057075B1 - 정보 검색 방법 및 이를 수행할 수 있는 프로그램이 수록된컴퓨터로 읽을 수 있는 기록 매체 - Google Patents
정보 검색 방법 및 이를 수행할 수 있는 프로그램이 수록된컴퓨터로 읽을 수 있는 기록 매체 Download PDFInfo
- Publication number
- KR101057075B1 KR101057075B1 KR20080138728A KR20080138728A KR101057075B1 KR 101057075 B1 KR101057075 B1 KR 101057075B1 KR 20080138728 A KR20080138728 A KR 20080138728A KR 20080138728 A KR20080138728 A KR 20080138728A KR 101057075 B1 KR101057075 B1 KR 101057075B1
- Authority
- KR
- South Korea
- Prior art keywords
- query
- subject
- keyword
- document
- rank
- Prior art date
Links
Images
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Computational Linguistics (AREA)
- Library & Information Science (AREA)
Abstract
Description
Claims (8)
- 문서를 수집하고 수집된 상기 문서의 키워드를 추출하는 데이터 수집 단계;검색자에 의해 질의어가 입력되는 질의입력단계;상기 질의어와 상기 키워드 또는 상기 키워드 사이의 주제 랭크(topic rank)를 계산하여 상기 키워드 중 상기 질의어와 연관되는 연관 주제를 선정하는 연관 주제 생성 단계;선정된 상기 연관 주제의 상기 질의어로부터의 연관도를 가중치로 부여하여 가중치 벡터를 형성하는 연관 질의어 생성 단계; 및상기 가중치 벡터를 이용하여 상기 질의어와 연관된 문서들을 제공하는 문서 검색 단계;를 포함하되,상기 질의어와 상기 키워드 사이의 주제 랭크 TR(K,w)와 상기 키워드 사이의 주제 랭크 TR(wi, wj)는 하기 식에 의해 계산되는 것을 특징으로 하는 정보 검색 방법.여기서,K는 질의어, w, wi, wj는 키워드, DF(K,w)는 K와 w가 함께 들어있는 문서 빈도, DF(wi, wj)는 wi와 wj가 함께 들어있는 문서 빈도, DF(w) 또는 DF(wj)는 w 또는 wj가 들어있는 문서 빈도, p(w) 또는 p(wj)는 w 또는 wj가 문서에 들어 있는 확률, α, β는 가중치로 양의 실수, i, j는 추출된 상기 키워드의 수 이하의 서로 다른 값을 가지는 양의 정수.
- 삭제
- 제1 항에 있어서,상기 연관 주제 선정 단계는, 상기 질의어와 상기 키워드 사이의 주제 랭크 TR(K, w) 또는 상기 키워드 사이의 주제 랭크 TR(wi, wj)가 소정의 값 이상인 경우에 연결 관계를 형성하고, 상기 연결 관계가 상기 질의어로부터 M개 이하인 키워드를 상기 연관 주제로 선정하는 것을 특징으로 하는 정보 검색 방법(M은 1보다 큰 양의 정수).
- 제3 항에 있어서,상기 가중치 벡터 WM은,상기 연관 주제와 상기 연관 주제의 상기 질의어 방향으로 형성된 연결 관계의 주제 랭크를 상기 질의어와 상기 연관 주제 사이의 연결 관계의 개수인 깊이를 반영하여 결합하도록, 하기의 식에 의해 형성되는 것을 특징으로 하는 정보 검색 방법.여기서, wk는 k번째 연관 주제, TRk는 k번째 연관 주제의 상기 질의어 방향으로 형성된 연결 관계의 주제 랭크, depthk는 상기 질의어와 k번째 연관 주제 사이의 연결 관계의 개수인 깊이, dTRk는 k번째 연관 주제의 깊이 가중 주제 랭크, N는 선정된 연관 주제의 수, k는 1과 N 사이의 정수.
- 제1 항에 있어서,상기 데이터 수집 단계는, 수집된 상기 문서의 키워드를 이용하여 각각 해당 문서를 나타내는 단어 벡터인 특성키워드벡터를 형성하고,상기 문서 검색 단계는, 상기 특성키워드벡터와 상기 가중치 벡터를 비교하여 상기 질의어와 관련된 문서들을 선정하여 제공하는 것을 특징으로 하는 정보 검색 방법.
- 제6 항에 있어서,상기 문서 검색 단계에서 제공된 문서 중 상기 검색자에 의하여 선택되는 문서의 키워드를 분석하여, 선택율이 소정의 임계값 이하인 문서에 포함된 키워드를 상기 연관 주제에서 제거하는 사용자 피드백 단계;를 더 포함하는 것을 특징으로 하는 정보 검색 방법.
- 제1 항 및 제3 항 내지 제7 항 중의 어느 한 항의 항법을 수행할 수 있는 프로그램이 수록된 컴퓨터로 읽을 수 있는 기록 매체.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20080138728A KR101057075B1 (ko) | 2008-12-31 | 2008-12-31 | 정보 검색 방법 및 이를 수행할 수 있는 프로그램이 수록된컴퓨터로 읽을 수 있는 기록 매체 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20080138728A KR101057075B1 (ko) | 2008-12-31 | 2008-12-31 | 정보 검색 방법 및 이를 수행할 수 있는 프로그램이 수록된컴퓨터로 읽을 수 있는 기록 매체 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20100080100A KR20100080100A (ko) | 2010-07-08 |
KR101057075B1 true KR101057075B1 (ko) | 2011-08-16 |
Family
ID=42641094
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR20080138728A KR101057075B1 (ko) | 2008-12-31 | 2008-12-31 | 정보 검색 방법 및 이를 수행할 수 있는 프로그램이 수록된컴퓨터로 읽을 수 있는 기록 매체 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101057075B1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101137491B1 (ko) * | 2010-05-18 | 2012-04-20 | 서울시립대학교 산학협력단 | 웹 페이지 검색에서 개인화된 태그 추천 모델 활용 시스템 및 방법 |
CN112733527B (zh) * | 2020-12-15 | 2024-05-10 | 上海建工四建集团有限公司 | 建筑工程文档知识网络的构建方法及系统 |
-
2008
- 2008-12-31 KR KR20080138728A patent/KR101057075B1/ko active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
KR20100080100A (ko) | 2010-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Jeon et al. | A framework to predict the quality of answers with non-textual features | |
KR101059557B1 (ko) | 정보 검색 방법 및 이를 수행할 수 있는 프로그램이 수록된컴퓨터로 읽을 수 있는 기록 매체 | |
US8027977B2 (en) | Recommending content using discriminatively trained document similarity | |
US8051080B2 (en) | Contextual ranking of keywords using click data | |
JP7252914B2 (ja) | 検索提案を提供する方法、装置、機器及び媒体 | |
KR100974064B1 (ko) | 사용자 맞춤형 정보 제공 시스템 및 그 방법 | |
US20130110839A1 (en) | Constructing an analysis of a document | |
US20110047161A1 (en) | Query/Document Topic Category Transition Analysis System and Method and Query Expansion-Based Information Retrieval System and Method | |
EP2307951A1 (en) | Method and apparatus for relating datasets by using semantic vectors and keyword analyses | |
CN101609450A (zh) | 基于训练集的网页分类方法 | |
GB2397147A (en) | Organising, linking and summarising documents using weighted keywords | |
US8812504B2 (en) | Keyword presentation apparatus and method | |
CN103678422A (zh) | 网页分类方法和装置、网页分类器的训练方法和装置 | |
Schedl | # nowplaying Madonna: a large-scale evaluation on estimating similarities between music artists and between movies from microblogs | |
JP2024091709A (ja) | 文作成装置、文作成方法および文作成プログラム | |
KR100973969B1 (ko) | 매체 편향의 효과를 완화하는 뉴스 서비스 시스템 및 방법 | |
JP4569380B2 (ja) | ベクトル生成方法及び装置及びカテゴリ分類方法及び装置及びプログラム及びプログラムを格納したコンピュータ読み取り可能な記録媒体 | |
KR101057075B1 (ko) | 정보 검색 방법 및 이를 수행할 수 있는 프로그램이 수록된컴퓨터로 읽을 수 있는 기록 매체 | |
EP2137648A1 (en) | Organising and storing documents | |
JP4606349B2 (ja) | 話題画像抽出方法及び装置及びプログラム | |
KR100407081B1 (ko) | 문서 검색 및 분류 방법 및 장치 | |
US20140012854A1 (en) | Method or system for semantic categorization | |
Balaji et al. | Finding related research papers using semantic and co-citation proximity analysis | |
Iacobelli et al. | Finding New Information Via Robust Entity Detection. | |
WO2011033457A1 (en) | System and method for content classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20081231 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20101019 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20110623 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20110809 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20110810 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
FPAY | Annual fee payment |
Payment date: 20150804 Year of fee payment: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20150804 Start annual number: 5 End annual number: 5 |
|
FPAY | Annual fee payment |
Payment date: 20160729 Year of fee payment: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20160729 Start annual number: 6 End annual number: 6 |
|
FPAY | Annual fee payment |
Payment date: 20170804 Year of fee payment: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20170804 Start annual number: 7 End annual number: 7 |
|
FPAY | Annual fee payment |
Payment date: 20190805 Year of fee payment: 9 |
|
PR1001 | Payment of annual fee |
Payment date: 20190805 Start annual number: 9 End annual number: 9 |
|
PR1001 | Payment of annual fee |
Payment date: 20201109 Start annual number: 10 End annual number: 10 |
|
PR1001 | Payment of annual fee |
Payment date: 20210802 Start annual number: 11 End annual number: 11 |
|
PR1001 | Payment of annual fee |
Payment date: 20230703 Start annual number: 13 End annual number: 13 |
|
PR1001 | Payment of annual fee |
Payment date: 20240701 Start annual number: 14 End annual number: 14 |