KR20010082966A - 관련 웹 사이트 제공 방법 및 시스템 - Google Patents
관련 웹 사이트 제공 방법 및 시스템 Download PDFInfo
- Publication number
- KR20010082966A KR20010082966A KR1020000008551A KR20000008551A KR20010082966A KR 20010082966 A KR20010082966 A KR 20010082966A KR 1020000008551 A KR1020000008551 A KR 1020000008551A KR 20000008551 A KR20000008551 A KR 20000008551A KR 20010082966 A KR20010082966 A KR 20010082966A
- Authority
- KR
- South Korea
- Prior art keywords
- url
- urls
- extracting
- domain
- internet
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/50—Business processes related to the communications industry
Landscapes
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Information Transfer Between Computers (AREA)
Abstract
Description
Claims (10)
- (a) 인터넷 북마크 DB로부터 각 웹 사이트의 URL을 정규화하여 하나 이상의 표준 URL을 생성하는 단계;(b) 상기 표준 URL로부터 각 웹 사이트간의 관련성을 추출하여 하나 이상의 관련 URL을 생성하는 단계;(c) 서버 에이전트를 통하여 각 URL을 방문하여 하나 이상의 관련 URL 표제어를 생성하는 단계; 및(d) 사용자가 현재 방문하고 있는 인터넷 웹 사이트와 관련성이 높은 사이트들을 상기 단계(b)에서 생성한 하나 이상의 관련 URL과 상기 단계(c)에서 생성한 하나 이상의 관련 URL 표제어로부터 검색하여 상기 사용자에게 실시간으로 제공하는 단계를 포함하는 관련 웹 사이트 제공 방법.
- 제1항에 있어서, 상기 단계(a)는,(a-1) URL 서비스가 HTTP/HTTPS인지의 여부를 체크하여 상기 HTTP/HTTPS가 아닌 경우에는 표준화 대상에서 제외하는 단계;(a-2) 상기 단계(a-1)에서 URL 서비스가 HTTP/HTTPS인 경우에는 서비스 명을 제거하여 중복 도메인 DB에 대표 도메인의 존재 여부를 체크하는 단계;(a-3) 상기 단계(a-2)에서 대표 도메인이 존재하는 경우에는 URL내의 도메인네임을 대표 도메인으로 대체하는 단계;(a-4) 상기 단계(a-2)에서 대표 도메인이 존재하지 않은 경우 및 상기 단계(a-3)후에 URL의 최종 파일명이 기본 웹 파일인지의 여부를 체크하는 단계;(a-5) 상기 단계(a-4)에서 상기 URL의 최종 파일명이 기본 웹 파일인 경우에는 URL 내의 최종 파일명을 제거하는 단계; 및(a-6) 상기 단계(a-4)에서 상기 URL의 최종 파일명이 기본 웹 파일이 아닌 경우 및 최종 파일명을 제거한 이후에 디렉토리 표시를 제거하여 표준 URL을 생성하는 단계를 포함하는 것을 특징으로 하는 관련 웹 사이트 제공 방법.
- 제1항에 있어서, 상기 단계(b)는,(b-1) 표준 URL인 제1 URL이 속한 모든 폴더들을 추출하는 단계;(b-2) 상기 단계(b-1)에서 구한 모든 폴더들에 속한 제2 URL을 추출하는 단계;(b-3) 상기 단계(b-2)에서 구한 제2 URL로부터 상이한 제3 URL을 추출하는 단계;(b-4) 상기 제3 URL에 속하는 모든 URL에 대해 제2 URL에 나타나는 빈도수를 추출하는 단계; 및(b-5) 상기 단계(b-4)에서 구한 모든 URL에 대해서 빈도수로 정렬하여 상위 N개의 URL 및 그 빈도수를 저장하는 단계를 포함하는 것을 특징으로 하는 관련 웹 사이트 제공 방법.
- 제1항에 있어서, 상기 단계(c)는,(c-1) 상기 하나 이상의 관련 URL로부터 제1 URL을 읽어 데이터의 끝인지의 여부를 체크하여 데이터의 끝인 경우에는 종료하는 단계;(c-2) 상기 단계(c-1)에서 데이터의 끝이 아닌 경우에는 상기 제1 URL의 신규 여부를 체크하여 비신규인 경우에는 상기 단계(c-1)로 피드백하는 단계;(c-3) 상기 단계(c-2)에서 상기 제1 URL이 신규한 경우에는 인터넷 웹 사이트로부터 HTML을 읽는 단계;(c-4) 상기 단계(c-3)에서 읽은 HTML로부터 표제어를 추출하는 단계; 및(c-5) 상기 추출된 표제어를 업 데이트하는 단계를 포함하는 것을 특징으로 하는 관련 웹 사이트 제공 방법.
- 하나 이상의 웹 사이트의 URL를 저장하는 인터넷 북 마크 DB;상기 인터넷 북마크 DB에 저장된 URL을 정규화하여 표준 URL DB를 구축하는 URL 표준화부;상기 표준 URL DB로부터 각 웹 사이트간의 관련성을 추출하여 관련 URL DB를 구축하는 관련 URL 추출부;서버 에이전트를 통하여 각 URL을 방문하여 관련 URL의 표제어를 추출하며, 관련 URL 표제어 DB를 구축하는 URL 표제어 구축부; 및상기 관련 URL DB와 상기 URL 표제어 DB에 저장된 정보를 근거로 사용자가현재 방문하고 있는 인터넷 웹 사이트와 관련성이 높은 하나 이상의 사이트를 상기 사용자에게 제공하는 서비스 제공부를 포함하는 관련 웹 사이트 제공 시스템.
- 제5항에 있어서, 상기 서비스 제공부는,상기 하나 이상의 사이트를 실시간으로 제공하는 것을 특징으로 하는 관련 웹 사이트 제공 시스템.
- 제5항에 있어서, 상기 URL 표준화부는,판별 대상 DB;서로 다른 도메인 네임이지만 실제로 동일한 웹 사이트를 지정하는 경우 이들 도메인들에 대해 대표 도메인 네임을 저장하는 중복 도메인 DB;상기 북마크 DB내의 각 URL에 들어있는 도메인 네임에서 동일 대상인지 판별해야 할 필요가 있는 도메인 네임을 추출하고, 이를 상기 판별대상 DB에 저장한 후 상기 판별 대상 DB로부터 판별 대상 도메인을 읽어내어 동일한 사이트를 나타내는 지의 여부를 인터넷을 통해 검색하여 상기 중복 도메인 DB에 저장된 정보를 업 데이트하는 동일 URL 판별부;상기 북마크 DB와 상기 중복 도메인 DB를 참조하여 표준 포맷의 URL을 추출하는 URL 표준화부; 및상기 URL 표준화부에 의해 표준 포맷으로 전환된 URL 및 URL의 폴더 고유 번호를 저장하는 표준 URL DB를 포함하는 것을 특징으로 하는 관련 웹 사이트 제공 시스템.
- 제5항에 있어서, 상기 관련 URL 추출부는,상기 URL 표준화부에서 생성된 URL 및 폴더 정보를 읽어 각 URL에 대해 관련성 순위로 배열하고, 배열된 상위 N개에 대해 <URL, 관련 정도> 정보를 출력하는 URL 관련 추출부; 및상기 URL 관련 추출부로부터 출력되는 정보를 저장하는 관련 URL DB를 포함하는 것을 특징으로 하는 관련 웹 사이트 제공 시스템.
- 제5항에 있어서, 상기 URL 표제어 구축부는,상기 관련 URL 추출부에 의해 구축된 관련 URL DB에 제1 URL 표제어가 작성되지 않거나 제1 URL 표제 작성 시점이 일정 기간이 경과되어 재확인해야 하는 경우 인터넷상에세 URL을 읽어 제2 URL 표제어를 추출하는 URL 표제어 추출부; 및상기 제2 URL 표제어를 저장하는 URL 표제어 DB를 포함하는 것을 특징으로 하는 관련 웹 사이트 제공 시스템.
- 제5항에 있어서, 상기 서비스 제공부는,사용자로부터 현재 URL를 제공받아 이와 관련된 URL 정보를 상기 사용자측에 제공하는 웹 서버인 것을 특징으로 하는 관련 웹 사이트 제공 시스템.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2000-0008551A KR100371805B1 (ko) | 2000-02-22 | 2000-02-22 | 관련 웹 사이트 제공 방법 및 시스템 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2000-0008551A KR100371805B1 (ko) | 2000-02-22 | 2000-02-22 | 관련 웹 사이트 제공 방법 및 시스템 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20010082966A true KR20010082966A (ko) | 2001-08-31 |
KR100371805B1 KR100371805B1 (ko) | 2003-02-11 |
Family
ID=19648841
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR10-2000-0008551A Expired - Fee Related KR100371805B1 (ko) | 2000-02-22 | 2000-02-22 | 관련 웹 사이트 제공 방법 및 시스템 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100371805B1 (ko) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100391391B1 (ko) * | 2000-06-14 | 2003-07-12 | (주) 제이.에스.씨.앤.아이 | 저작권 침해 방지를 위한 정보추출 에이전트 시스템 및그의 정보제공 방법 |
KR100792109B1 (ko) * | 2006-03-27 | 2008-01-04 | 하상호 | 모바일 웹서버에서의 사용자인터페이스 기반의 범용 웹정보 추출을 위한 래퍼 생성장치 및 그 방법 |
KR100902757B1 (ko) * | 2007-12-24 | 2009-06-15 | 엔에이치엔(주) | Url기반의 검색결과 제공방법 및 시스템 |
KR101454466B1 (ko) * | 2013-08-02 | 2014-10-23 | 주식회사 알에스엔 | Html파일로부터 비정형 메타 데이터를 추출하는 장치 |
-
2000
- 2000-02-22 KR KR10-2000-0008551A patent/KR100371805B1/ko not_active Expired - Fee Related
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100391391B1 (ko) * | 2000-06-14 | 2003-07-12 | (주) 제이.에스.씨.앤.아이 | 저작권 침해 방지를 위한 정보추출 에이전트 시스템 및그의 정보제공 방법 |
KR100792109B1 (ko) * | 2006-03-27 | 2008-01-04 | 하상호 | 모바일 웹서버에서의 사용자인터페이스 기반의 범용 웹정보 추출을 위한 래퍼 생성장치 및 그 방법 |
KR100902757B1 (ko) * | 2007-12-24 | 2009-06-15 | 엔에이치엔(주) | Url기반의 검색결과 제공방법 및 시스템 |
KR101454466B1 (ko) * | 2013-08-02 | 2014-10-23 | 주식회사 알에스엔 | Html파일로부터 비정형 메타 데이터를 추출하는 장치 |
Also Published As
Publication number | Publication date |
---|---|
KR100371805B1 (ko) | 2003-02-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8166013B2 (en) | Method and system for crawling, mapping and extracting information associated with a business using heuristic and semantic analysis | |
CN100390786C (zh) | 信息解析方法以及装置 | |
US20180004850A1 (en) | Method for inputting and processing feature word of file content | |
US20050149538A1 (en) | Systems and methods for creating and publishing relational data bases | |
US20050198559A1 (en) | Document information management system, document information management program, and document information management method | |
JP2008507041A (ja) | 検索結果内におけるプレーストコンテンツの順序付けのパーソナライズ | |
JP5552582B2 (ja) | コンテンツ検索装置 | |
KR100434902B1 (ko) | 지식 기반 맞춤 정보 제공 시스템 및 그 서비스 방법 | |
JP2009271799A (ja) | 企業相関情報抽出システム | |
JP3803961B2 (ja) | データベース生成装置、データベース生成処理方法及びデータベース生成プログラム | |
JP4875911B2 (ja) | コンテンツ特定方法及び装置 | |
JP4769822B2 (ja) | ページグループを用いた情報検索サービス提供サーバー、方法及びシステム | |
JP2001290843A (ja) | 文書検索装置及びその方法並びに文書検索プログラム及びそのプログラムを記録した記録媒体 | |
JP5221664B2 (ja) | 情報マップ管理システムおよび情報マップ管理方法 | |
KR20000063422A (ko) | 인터넷 정보 검색 시 개인의 북마크 파일 데이터를기반으로 필터링하여 개인 맞춤 검색 결과를 도출하는 방법 | |
KR20000054312A (ko) | 맞춤 웹정보 구축 제공 방법 | |
KR100455439B1 (ko) | 인터넷 자원의 도메인화와 확장 사이트맵을 이용한정보검색 및 브라우징방법 | |
JP4469432B2 (ja) | インターネット情報処理装置、インターネット情報処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
KR100557874B1 (ko) | 과학기술 정보분석 방법 및 그 방법에 대한 컴퓨터프로그램을 저장한 기록매체 | |
KR100616152B1 (ko) | 인터넷상에서 기사를 자동분류하여 타 웹사이트에 자동송출하는 제어방법 | |
KR20020089677A (ko) | 문서 자동 분류 방법 및 이를 수행하기 위한 시스템 | |
JP4430598B2 (ja) | 情報共有システムおよび情報共有方法 | |
KR100371805B1 (ko) | 관련 웹 사이트 제공 방법 및 시스템 | |
JP2008077353A (ja) | キーワード分類方法、サーバコンピュータ、及びプログラム | |
CN1922606B (zh) | 用于面向用户的互联网导航的动态关键字处理系统和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
St.27 status event code: A-0-1-A10-A12-nap-PA0109 |
|
PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
R17-X000 | Change to representative recorded |
St.27 status event code: A-3-3-R10-R17-oth-X000 |
|
PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
T11-X000 | Administrative time limit extension requested |
St.27 status event code: U-3-3-T10-T11-oth-X000 |
|
P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
N231 | Notification of change of applicant | ||
PN2301 | Change of applicant |
St.27 status event code: A-3-3-R10-R13-asn-PN2301 St.27 status event code: A-3-3-R10-R11-asn-PN2301 |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
St.27 status event code: A-1-2-D10-D22-exm-PE0701 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
St.27 status event code: A-2-4-F10-F11-exm-PR0701 |
|
PR1002 | Payment of registration fee |
St.27 status event code: A-2-2-U10-U11-oth-PR1002 Fee payment year number: 1 |
|
PG1601 | Publication of registration |
St.27 status event code: A-4-4-Q10-Q13-nap-PG1601 |
|
R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 4 |
|
R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 5 |
|
P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |
|
PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 7 |
|
R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 9 |
|
R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
FPAY | Annual fee payment |
Payment date: 20130111 Year of fee payment: 11 |
|
PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 11 |
|
PN2301 | Change of applicant |
St.27 status event code: A-5-5-R10-R13-asn-PN2301 St.27 status event code: A-5-5-R10-R11-asn-PN2301 |
|
FPAY | Annual fee payment |
Payment date: 20131231 Year of fee payment: 12 |
|
PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 12 |
|
R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
FPAY | Annual fee payment |
Payment date: 20141230 Year of fee payment: 13 |
|
PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 13 |
|
FPAY | Annual fee payment |
Payment date: 20151223 Year of fee payment: 14 |
|
PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 14 |
|
FPAY | Annual fee payment |
Payment date: 20170117 Year of fee payment: 15 |
|
PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 15 |
|
P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |
|
FPAY | Annual fee payment |
Payment date: 20180102 Year of fee payment: 16 |
|
PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 16 |
|
PN2301 | Change of applicant |
St.27 status event code: A-5-5-R10-R13-asn-PN2301 St.27 status event code: A-5-5-R10-R11-asn-PN2301 |
|
PN2301 | Change of applicant |
St.27 status event code: A-5-5-R10-R13-asn-PN2301 St.27 status event code: A-5-5-R10-R11-asn-PN2301 |
|
FPAY | Annual fee payment |
Payment date: 20190102 Year of fee payment: 17 |
|
PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 17 |
|
PC1903 | Unpaid annual fee |
St.27 status event code: A-4-4-U10-U13-oth-PC1903 Not in force date: 20200129 Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE |
|
PC1903 | Unpaid annual fee |
St.27 status event code: N-4-6-H10-H13-oth-PC1903 Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE Not in force date: 20200129 |
|
R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |