KR100433584B1 - 온토로지와 규칙정보를 이용한, 인터넷 쇼핑몰 상품에관한 상세 정보 추출 방법 - Google Patents
온토로지와 규칙정보를 이용한, 인터넷 쇼핑몰 상품에관한 상세 정보 추출 방법 Download PDFInfo
- Publication number
- KR100433584B1 KR100433584B1 KR10-2000-0075438A KR20000075438A KR100433584B1 KR 100433584 B1 KR100433584 B1 KR 100433584B1 KR 20000075438 A KR20000075438 A KR 20000075438A KR 100433584 B1 KR100433584 B1 KR 100433584B1
- Authority
- KR
- South Korea
- Prior art keywords
- shopping mall
- detailed information
- ontology
- database
- product
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0623—Item investigation
- G06Q30/0625—Directed, with specific intent or strategy
- G06Q30/0627—Directed, with specific intent or strategy using item specifications
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (6)
- 지식데이터베이스(a)와 데이터베이스(b)를 구비한 상세 정보 추출 시스템을 이용하는 인터넷 쇼핑몰 상품에 관한 상세 정보 추출 방법에 있어서,상기 쇼핑몰 상품의 해당 URL(Uniform Resource Locator) 정보를 이용하여 상기 인터넷 쇼핑몰 상품에 관련된 HTML(HyperText Markup Language) 페이지를 검색하는 제 1 단계;상기 검색된 HTML 페이지를 특정 태그 및 순수한 문자열들로 구성된 문서로 전처리하는 제 2 단계;상기 지식데이터베이스(a)에 저장된 분류명들 및 동의어들로부터, 상기 전처리된 문서의 입력 라인에서 해당 분류명의 동의어와 문자열을 비교하여 이에 근접한 동의어를 검색하는 제 3 단계;상기 제 3 단계에서 검색된 동의어가 읽어들인 라인에 존재하면, 상기 지식데이터베이스(a)에 저장된 온토로지(Ontology) 값들과 해당 문자열을 비교하여 해당 온토로지 값이 존재하는지를 판단하는 제 4 단계;상기 제 4 단계에서의 판단 결과, 해당 온토로지 값이 존재하면, 상기 분류명과 온토로지 값을 상기 데이터베이스(b)에 저장 및 갱신하는 제 5 단계; 및상기 저장 및 갱신된 데이터베이스(b)를 이용하여 인터넷 쇼핑몰 상품 상세 정보를 추출하는 제 6 단계;를 포함하는 것을 특징으로 하는 인터넷 쇼핑몰 상품에 관한 상세 정보 추출 방법.
- 제 1 항에 있어서,상기 제 2 단계는,상기 HTML 페이지를 라인별로 분리한 후, 분리된 라인별로 특정 태그를 제외한 HTML 태그를 제거하는 서브 단계; 및상기 특정 태그만이 포함된 라인과, 상기 HTML 태그가 포함되지 않은 라인을 상기 데이터베이스(b에 저장 및 갱신하는 서브 단계;를 포함하는 것을 특징으로 하는 인터넷 쇼핑몰 상품에 관한 상세 정보 추출 방법.
- 삭제
- 제 1 항에 있어서,상기 제 2 단계에서 전처리된 문서를 읽어들여서 각 라인별로 "(" 문자와 ")" 문자를 검색하는 제 2-1 단계;상기 검색된 "(" 문자와 ")" 문자 사이의 문자열을 추출한 후, 추출된 문자열에서 "-" 문자를 검색하는 제 2-2 단계; 및상기 검색된 "-" 문자를 기준으로 상기 문자열들을 분리한 후, 분리된 문자열들이 영문과 숫자의 조합으로 구성되어 있으면, 이 문자열을 모델명으로 인식한 후, 상기 데이터베이스(b)에 저장 및 갱신하는 제 2-3 단계;를 포함하는 것을 특징으로 하는 인터넷 쇼핑몰 상품에 관한 상세 정보 추출 방법.
- 제 1 항에 있어서,상기 특정 태그는 <TR, <P, <BR 태그를 포함하는 것을 특징으로 하는 인터넷 쇼핑몰 상품에 관한 상세 정보 추출 방법.
- 지식데이터베이스(a)와 데이터베이스(b)를 구비한 상세 정보 추출 시스템을 이용하는 인터넷 쇼핑몰 상품에 관한 상세 정보 추출 방법을 컴퓨터로 실행할 수 있는 프로그램을 기록한 기록 매체에 있어서,상기 쇼핑몰 상품의 해당 URL(Uniform Resource Locator) 정보를 이용하여 상기 인터넷 쇼핑몰 상품에 관련된 HTML(HyperText Markup Language) 페이지를 검색하는 제 1 단계;상기 검색된 HTML 페이지를 특정 태그 및 순수한 문자열들로 구성된 문서로 전처리하는 제 2 단계;상기 지식데이터베이스(a)에 저장된 분류명들 및 동의어들로부터, 상기 전처리된 문서의 입력 라인에서 해당 분류명의 동의어와 문자열을 비교하여 이에 근접한 동의어를 검색하는 제 3 단계;상기 제 3 단계에서 검색된 동의어가 읽어들인 라인에 존재하면, 상기 지식데이터베이스(a)에 저장된 온토로지(Ontology) 값들과 해당 문자열을 비교하여 해당 온토로지 값이 존재하는지를 판단하는 제 4 단계;상기 제 4 단계에서의 판단 결과, 해당 온토로지 값이 존재하면, 상기 분류명과 온토로지 값을 상기 데이터베이스(b)에 저장 및 갱신하는 제 5 단계; 및상기 저장 및 갱신된 데이터베이스(b)를 이용하여 인터넷 쇼핑몰 상품 상세 정보를 추출하는 제 6 단계;를 포함하는 것을 특징으로 하는 프로그램을 기록한 컴퓨터로 판독할 수 있는 기록매체.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2000-0075438A KR100433584B1 (ko) | 2000-12-12 | 2000-12-12 | 온토로지와 규칙정보를 이용한, 인터넷 쇼핑몰 상품에관한 상세 정보 추출 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2000-0075438A KR100433584B1 (ko) | 2000-12-12 | 2000-12-12 | 온토로지와 규칙정보를 이용한, 인터넷 쇼핑몰 상품에관한 상세 정보 추출 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20020045971A KR20020045971A (ko) | 2002-06-20 |
KR100433584B1 true KR100433584B1 (ko) | 2004-06-04 |
Family
ID=27681068
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR10-2000-0075438A KR100433584B1 (ko) | 2000-12-12 | 2000-12-12 | 온토로지와 규칙정보를 이용한, 인터넷 쇼핑몰 상품에관한 상세 정보 추출 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100433584B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018155817A1 (ko) * | 2017-02-24 | 2018-08-30 | (주)위세아이텍 | 이상탐지시스템 내의 데이터에 대한 이상을 탐지하는 장치 및 그 방법 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20020064249A (ko) * | 2002-07-04 | 2002-08-07 | 이은석 | 컨텐츠 자동확장기능을 이용한 전자상거래시스템 및 이의운용방법 |
KR100709984B1 (ko) * | 2005-05-20 | 2007-04-23 | 엔에이치엔(주) | 질의어를 다양한 로직에 따라 처리하여 매칭되는 결과를출력하는 질의어 매칭 방법 및 시스템 |
WO2006123918A1 (en) * | 2005-05-20 | 2006-11-23 | Nhn Corporation | Query matching system and method, and computer readable recording medium recording program for implementing the method |
KR100623628B1 (ko) * | 2005-05-20 | 2006-09-19 | 엔에이치엔(주) | 질의어 매칭 시스템, 방법 및 상기 방법을 실행하기 위한프로그램이 기록된 컴퓨터에서 판독 가능한 기록 매체 |
KR100729103B1 (ko) * | 2006-05-29 | 2007-06-14 | 주식회사 케이티 | 비구조 웹문서로부터 온톨로지 인스턴스를 자동으로추출하기 위한 시스템 및 그 방법 |
KR100800460B1 (ko) * | 2006-07-18 | 2008-02-04 | 제주대학교 산학협력단 | 웹 온톨로지 검색/분류 시스템 및 방법 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10198706A (ja) * | 1996-11-15 | 1998-07-31 | Digital Vision Lab:Kk | 情報検索装置及びその方法 |
KR19990031784A (ko) * | 1997-10-14 | 1999-05-06 | 정선종 | 전자상거래 상품정보 검색용 자연언어 질의어 처리방법 |
KR20000049333A (ko) * | 1999-10-28 | 2000-08-05 | 한상천 | 지능형 인터넷 쇼핑몰 상품비교검색엔진 |
-
2000
- 2000-12-12 KR KR10-2000-0075438A patent/KR100433584B1/ko not_active IP Right Cessation
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10198706A (ja) * | 1996-11-15 | 1998-07-31 | Digital Vision Lab:Kk | 情報検索装置及びその方法 |
KR19990031784A (ko) * | 1997-10-14 | 1999-05-06 | 정선종 | 전자상거래 상품정보 검색용 자연언어 질의어 처리방법 |
KR20000049333A (ko) * | 1999-10-28 | 2000-08-05 | 한상천 | 지능형 인터넷 쇼핑몰 상품비교검색엔진 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018155817A1 (ko) * | 2017-02-24 | 2018-08-30 | (주)위세아이텍 | 이상탐지시스템 내의 데이터에 대한 이상을 탐지하는 장치 및 그 방법 |
KR20180097895A (ko) * | 2017-02-24 | 2018-09-03 | (주)위세아이텍 | 이상탐지시스템 내의 데이터에 대한 이상을 탐지하는 장치 및 그 방법 |
KR101965598B1 (ko) | 2017-02-24 | 2019-08-13 | (주)위세아이텍 | 이상탐지시스템 내의 데이터에 대한 이상을 탐지하는 장치 및 그 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR20020045971A (ko) | 2002-06-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10764353B2 (en) | Automatic genre classification determination of web content to which the web content belongs together with a corresponding genre probability | |
CN102254014B (zh) | 一种网页特征自适应的信息抽取方法 | |
CN103177075B (zh) | 基于知识的实体检测和消歧 | |
US8140579B2 (en) | Method and system for subject relevant web page filtering based on navigation paths information | |
US7953592B2 (en) | Semantic analysis apparatus, semantic analysis method and semantic analysis program | |
JP6543283B2 (ja) | パッセージ型質問応答装置、方法、及びプログラム | |
KR101607468B1 (ko) | 콘텐츠에 대한 키워드 태깅 방법 및 시스템 | |
Sivakumar | Effectual web content mining using noise removal from web pages | |
CN107577788A (zh) | 一种自动结构化数据的电商网站主题爬虫方法 | |
US20160034484A1 (en) | Document tagging and retrieval using entity specifiers | |
CN118468881A (zh) | 一种自动提取关键词的语义检索方法及系统 | |
TWI682286B (zh) | 利用文字解析結果與自然語言輸入的文件搜尋系統 | |
CN109165373B (zh) | 一种数据处理方法及装置 | |
CN118095265A (zh) | 一种直播数据的llm智能分析方法、装置、设备和介质 | |
CN108153728B (zh) | 一种关键词确定方法及装置 | |
KR100433584B1 (ko) | 온토로지와 규칙정보를 이용한, 인터넷 쇼핑몰 상품에관한 상세 정보 추출 방법 | |
WO2012091541A1 (en) | A semantic web constructor system and a method thereof | |
JP5179564B2 (ja) | クエリセグメント位置決定装置 | |
CN112989163A (zh) | 一种垂直搜索方法和系统 | |
WO2010119794A1 (en) | Information processing apparatus and information processing method | |
US20080033953A1 (en) | Method to search transactional web pages | |
JP2009205499A (ja) | ウェブページ特定装置、ウェブページ特定方法およびウェブページ特定用プログラム | |
KR100659370B1 (ko) | 시소러스 매칭에 의한 문서 db 형성 방법 및 정보검색방법 | |
JP4143085B2 (ja) | 同義語獲得方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 | |
KR20000063488A (ko) | 전자화된 문서의 의미적 지식 데이터베이스 자동구축장치와 방법 및 그 기록매체 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20001212 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20030630 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20040221 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20040519 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20040520 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20070502 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20080428 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20090504 Start annual number: 6 End annual number: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20100430 Start annual number: 7 End annual number: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20110511 Start annual number: 8 End annual number: 8 |
|
PR1001 | Payment of annual fee |
Payment date: 20120509 Start annual number: 9 End annual number: 9 |
|
FPAY | Annual fee payment |
Payment date: 20130424 Year of fee payment: 10 |
|
PR1001 | Payment of annual fee |
Payment date: 20130424 Start annual number: 10 End annual number: 10 |
|
FPAY | Annual fee payment |
Payment date: 20140430 Year of fee payment: 11 |
|
PR1001 | Payment of annual fee |
Payment date: 20140430 Start annual number: 11 End annual number: 11 |
|
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |
Termination category: Default of registration fee Termination date: 20160409 |