KR20020075359A - System and method for capturing and managing information from digital source - Google Patents
System and method for capturing and managing information from digital source Download PDFInfo
- Publication number
- KR20020075359A KR20020075359A KR1020027000027A KR20027000027A KR20020075359A KR 20020075359 A KR20020075359 A KR 20020075359A KR 1020027000027 A KR1020027000027 A KR 1020027000027A KR 20027000027 A KR20027000027 A KR 20027000027A KR 20020075359 A KR20020075359 A KR 20020075359A
- Authority
- KR
- South Korea
- Prior art keywords
- item
- context
- user
- file
- keywords
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
- G06F16/9562—Bookmark management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Accounting & Taxation (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Finance (AREA)
- Artificial Intelligence (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Primary Health Care (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
사용자가 다른 항목들 외에도, 도큐먼트로부터 정보의 보조성분들을 의미하거나 사용자에게 관심이 있는 파일을 포함하는 개별 정보의 항목들을 포착하게 하는 시스템 및 방법이 제공된다. 또한, 콘텍스트 데이터베이스는 포착된 항목들, 항목들과 관련된 파일들, 및 항목과 관련된 키워드들을 포함하는 메타 데이터를 포함하는 사용자를 위해 포착된다. 콘텍스트 데이터베이스는 사용자에 의한 선택들 또는 사용자에 의해 엔터된 워드들에 응답하여 콘텍스트 써머리의 생성을 위해 문의된다. 콘텍스트 써머리는 검색을 향상시키고 사용자의 현 활동 정보에 기초하여 사용자에게 표시를 위한 대상 광고들을 선택하기 위해 사용된다.Systems and methods are provided that allow a user to capture, in addition to other items, items of individual information, including files that are of interest to the user or that represent auxiliary components of the information from the document. In addition, the context database is captured for a user that includes metadata including captured items, files associated with the items, and keywords associated with the item. The context database is queried for the creation of the context summary in response to selections by the user or words entered by the user. The context summary is used to enhance the search and select target advertisements for display to the user based on the user's current activity information.
Description
(배경기술의 설명)(Explanation of Background Art)
정보의 중요한 소스로서의 월드 와이드 웹(World Wide Web)의 탁월함은 최종-사용자들(end-users) 및 제품 개발자들(developers)로 하여금 워드 처리 어플리케이션들 내에 전자우편(e-mail), 웹 페이지, 및 도큐먼트들 등의 디지털 소스들로부터 유용한 정보를 효과적으로 포착하는 방법에 대한 탐구를 추진하게 한다.The excellence of the World Wide Web as an important source of information has enabled end-users and product developers to e-mail, web pages, And exploring how to effectively capture useful information from digital sources, such as documents.
포착 기술들의 한가지 기본적인 분류는 독립형 포착 기술들(Standalone capture techniques) 이다. 예를 들면, 사용자가 웹 페이지 상의 문단을 세이브하기 원한다면, 사용자는 웹 페이지의 내용들을 인쇄하고, HTML 또는 텍스트 파일들로서 웹 페이지 오브젝트(object)를 세이브할 수 있고, 마이크로소프트 워드 또는 파워포인트 등의 제품을 사용하여 "캐리어(carrier)" 도큐먼트에 웹 페이지 내용들을 복사하고 덧붙일 수 있고, 또는 페이퍼 상에 흥미 있는 웹 페이지 내용을 간단히 기재할 수 있다. 또 다른 포착 기술은 방문한 흥미있는 사이트들에 대해 링크들을 포착하고 관리하는 대부분의 브라우저들 및 차후의 브라우징을 위한 국부 디스크(local disk) 상의 파일들 내의 웹 페이지들이나 사이트들의 전체 내용을 포착하고 관리하는 오프라인 브라우저들(offline browsers)(또한 "페이지 그래버들(page grabbers)"로서 알려짐)에서 이용가능한 즐겨찾기(Favorites)나 북마크(Bookmark) 도구들을 포함하는 브라우저 기반 페이지 포착 도구들(Browser-based page capture tools)을 사용한다.One basic classification of capture techniques is standalone capture techniques. For example, if the user wants to save a paragraph on a web page, the user can print the contents of the web page, save the web page object as HTML or text files, and then use Microsoft Word or PowerPoint, The product can be used to copy and append web page content to a "carrier" document, or simply write the web page content of interest on the paper. Another capture technique captures and manages the entire contents of web pages or sites in most browsers that capture and manage links to interesting sites that have been visited, and files on local disk for subsequent browsing. Browser-based page capture, including Favorites and Bookmarks tools available in offline browsers (also known as "page grabbers") tools).
독립형 포착 기술들 모두는 심각한 제한들을 갖는다. 하드 복사들이(hard copies) 집합 또는 프리젠테이션에 대한 매우 제한된 옵션들만을 가지며 쉽게 손상 또는 파손된다. 파일들 내의 웹 오브젝트를 포착하는 것은 지루하고 시간이 걸린다. 많은 오브젝트들이 논리적으로 함께 속한다 할지라도 일반적으로 단일의 오브젝트만이 파일당 저장된다. 오브젝트는 통상 표준 파일 시스템(예컨대, 윈도우 익스플로러)의 제한된 유용성을 가지며 관리되어야 하고, 파일들 내의 오브젝트들을 집합시키는 것은 캐리어 도큐먼트들로 수동적 덧붙임(pasting)을 요구한다.All standalone capture techniques have serious limitations. Hard copies have very limited options for aggregation or presentation and are easily damaged or broken. Capturing web objects in files is tedious and time consuming. Although many objects logically belong together, typically only a single object is stored per file. Objects typically have to be managed with limited utility of standard file systems (eg, Windows Explorer), and aggregating objects in files requires manual pasting into carrier documents.
웹 오브젝트들에 캐리어 도큐먼트들의 사용은 극히 힘들고, 자원 집약 시스템(system resource-intentive)은 종종 포착된 오브젝트의 외관에 있어 미묘한 또는 심지어는 빠른 변경을 야기하고, 도큐먼트 관리 시스템 하에서 도큐먼트당 오브젝트 하나를 저장하는 등의 독특한 수단이 이용되지 않으면, 캐리어 도큐먼트들의 사용은 제한된 조잡한 낱알모양의 관리(coarse-grained management) 및 검색 성능만을 제공한다.The use of carrier documents in web objects is extremely difficult, and system resource-intentive often causes subtle or even rapid changes in the appearance of captured objects and stores one object per document under the document management system. If no unique means is used, the use of carrier documents provides only limited coarse-grained management and retrieval performance.
브라우저 기반 페이지 포착 도구들은 또한 심각한 제한들을 갖는다. 웹 사이트들과 웹 페이지들에 링크를 포착하거나 이들 사이트 및 페이지들의 전체 내용을 포착하는 것은 정의에 의해, 조잡한 낱알형의 행동이고, 따라서 이질적인 정보가 액세스되고, 사용자는 포착된 내용이 조직화되는 방식으로 제어하지 못한다. 페이지 포착 도구들(링크 또는 내용 기반)은 통상 명칭열(name string), URL, 및 분류와 관리를 위한 구조 정보만을 이용한다. 키워드들 및 알림들(notes) 등의 부가적인 분류 도구들은 통상 의미 있는 용어로 상세하게 설명될 수 없는 많은 항목들을 포함하는 조잡한 낱알형의 정적으로 집합된 페이지들 일반적으로 이용 불가능하거나 효과적으로 이용할 수 없다.Browser based page capture tools also have serious limitations. Capturing links to web sites and web pages or capturing the entire contents of these sites and pages is by definition a crude grainy behavior, and thus heterogeneous information is accessed, and the user organizes the captured content. Can not control. Page capture tools (link or content based) typically use only name strings, URLs, and structure information for classification and management. Additional sorting tools, such as keywords and notes, are usually crude or statically aggregated pages containing many items that cannot be described in detail in meaningful terms. .
페이지 또는 사이트 기반 관리의 조잡한 낱알형 특성 및 복잡한 분류 도구들의 결핍은 광범위한 즐겨찾기 리스트 또는 오프라인 페이지 저장 영역 내에 정보를 위치시키기는 과정을 귀찮게 만드는데, 즉 이러한 유용성이 증가할 수 있는 크기를효과적으로 제한한다.The crude grainy nature of page or site-based management and the lack of complex classification tools bother the process of placing information within an extensive favorites list or offline page storage area, ie effectively limiting the size at which this usefulness can increase. .
순수한 링크 기반 사이트 또는 페이지 포착은 어드레스된 페이지들의 내용이 공지(notice)없이 변경되므로 안전하거나 보장된 정확한 결과를 제공하지 않으며, 링크들은 진부하게(stale) 되고, 다이내믹한 페이지들은 그들이 어드레스된 후에 사라진다.Pure link-based site or page capture does not provide secure or guaranteed accurate results because the content of addressed pages is changed without notice, links become stale and dynamic pages disappear after they are addressed. .
지금까지, 전자 상업(e-commerce)에 약정된 사업(business)들은 일반적으로 고객들에 관한 정보를 대상으로 하는 프로모터들을 모으고 광고를 실질적으로 전달하기 위한 검색 포털들(portals) 등의 하이 트래픽(high-traffic) 웹 사이트들에 의존하여 왔다. 이들 하이 트래픽 사이트들은 통상 고객의 관심사 및 두 개의 기본적인 기술을 통한 구입 패턴들을 얻는다. 우선, 사이트들은 사용자가 어떠한 사이트를 방문하고, 사용자가 무엇을 링크하는 지를 결정하기 위해 트래킹(tracking) "클릭 트래일(click trails)"를 통해 암시적으로 정보를 수집한다. 다음으로는, 사이트들은 고개들이 부가 서비스들, 보다 큰 온라인 편의, 또는 사상을 위한 찬스에 대한 교환에 있어 자발적으로 자신들에 관한 더 많은 정보를 제공하는 프로모션들, 콘테스트들(contests), 및 사이트 개인화 특성을 통해 정보 공개적으로 수집한다.To date, businesses committed to e-commerce generally have high traffic, such as search portals for collecting promoters that target information about customers and for actually delivering advertising. -traffic) have been dependent on web sites. These high traffic sites typically get customer interests and purchase patterns through two basic techniques. First, sites implicitly collect information through tracking "click trails" to determine which sites a user visits and what the user links to. Next, sites offer promotions, contests, and site personalizations where heads up voluntarily provide more information about themselves in exchange for additional services, greater online convenience, or opportunities for thought. Collect information publicly through its characteristics.
주요한 제한은 소비자들에 관한 특정 행동가능 정보를 제공하기 위해 현재 인터넷 정보 수집 기술의 무능(inability)이었다. 포털 사이트조차도 "개인화(presonalization)"는 사용자가 "opt in"와 제한된 양의 사용자 데이터를 산출하는 개인화된 페이지들을 설정해야 하기 때문에 제한들을 갖는다.The main limitation was the inability of current Internet information gathering technologies to provide specific actionable information about consumers. Even a portal site has "presonalization" because it requires the user to set up personalized pages that yield "opt in" and a limited amount of user data.
일부 아래에 놓이는, 주변의, 또는 배경 정보인, 콘텍스트를 제공하기 위한능력은 원하는 정보를 찾는데 있어 검색 엔지들을 돕는데 상당히 바람직하다. 예를 들면, 사용자는 아프리카에서 코끼리들을 다루는 것에 관한 정보를 찾을 수 있지만, 문의(query)는 서커스들에서 코끼리들을 다루는 것에 관한 수많은 결과들을 포함할 수 있다.The ability to provide context, some underlying, or background information, is highly desirable to assist search engines in finding the desired information. For example, a user may find information about handling elephants in Africa, but a query may include numerous results about handling elephants in circus.
사용자의 필요 또는 요구에 적합한 검색 및 광고를 위한 콘텍스트를 제공하기 위해 또한 사용될 수 있는 개별 정보의 미세 낱알형 액세스 및 저장을 제공하기 위해 상당히 바람직하다.It is highly desirable to provide fine grained access and storage of individual information that can also be used to provide context for search and advertising that suits the needs or needs of the user.
(관련 출원)(Related application)
본 출원은 본 명세서에 참조문헌으로 포함되며, 1999년 7월 2일에 출원된 "임시 출원(Provisisional Application)"으로서, 발명자 David S. Wadhwani, Dennis S. Buchheim, Richard S. Buchheim, Scott A. Raposa와 Ethan F. Malasky에 의한, "System and Method for Capturing and Managing Information form Digital Sources"란 제목의 U.S. 임시 특허 출원 제60/142,237호로 35U.S.C. δ119(e) 하의 우선권을 주장한다.This application is incorporated herein by reference, and as a "Provisisional Application" filed on July 2, 1999, the inventors David S. Wadhwani, Dennis S. Buchheim, Richard S. Buchheim, Scott A. US, entitled "System and Method for Capturing and Managing Information form Digital Sources," by Raposa and Ethan F. Malasky. Provisional Patent Application No. 60 / 142,237 to 35 U.S.C. Claim priority under δ119 (e).
(발명의 배경)(Background of invention)
본 발명은 디지털 소스로부터의 정보를 포착하고 관리하기 위한 시스템 및 방법을 제공한다.The present invention provides a system and method for capturing and managing information from digital sources.
도 1은 본 발명에 따른 디지털 소스로부터의 개별 정보를 포착하고 관리하기 위한 시스템의 일실시예를 도시하는 도면.1 illustrates one embodiment of a system for capturing and managing individual information from a digital source in accordance with the present invention.
도 2a는 본 발명에 따른 개별 정보를 포착하기 위한 시스템에 사용된 사용자 인터페이스의 실시예를 도시하는 도면.2A illustrates an embodiment of a user interface used in a system for capturing individual information in accordance with the present invention.
도 2b는 브라우저(browser) 디스플레이로 표시된 콜렉션(collection)의 모여진 개별 항목들의 실시예를 도시하는 도면.FIG. 2B illustrates an embodiment of a collection of individual items of a collection represented by a browser display. FIG.
도 2c는 선택된 항목이 그 항목에 대한 "웹 콘텐트"를 선택함으로써 항목의 개별 형태로 저장할지, 또는 "웹 링크"를 선택함으로써 항목이 나타나는 웹페이지에 링크를 저장할지를 사용자가 나타낼 수 있는 팝-업 윈도우(pop-up window)의 실시예를 도시하는 도면.FIG. 2C illustrates a pop-up that allows a user to indicate whether the selected item is to be saved as an individual form of the item by selecting "web content" for that item, or to store the link on the web page where the item appears by selecting "web link". Figure showing an embodiment of a pop-up window.
도 2d는 메타 데이터가 사용자에게 표시되고 그 사용자로부터의 메타 데이터에 대한 부가 또는 변경들을 받아들이는, 사용자 인터페이스, 팝-업 윈도우의 실시예를 도시하는 도면.FIG. 2D illustrates an embodiment of a user interface, pop-up window in which metadata is displayed to a user and accepts additions or changes to metadata from that user. FIG.
도 2e는 항목의 주석(annotation)을 허용하도록 사용자에게 표시되는 팝-업 윈도우로서 사용자 인터페이스의 실시예를 도시하는 도면.FIG. 2E illustrates an embodiment of a user interface as a pop-up window displayed to a user to allow annotation of an item. FIG.
도 2f는 항목의 외관을 바꾸기 위해 사용자에게 표시되는 팝-업 윈도우로서사용자 인터페이스의 실시예를 도시하는 도면.FIG. 2F illustrates an embodiment of a user interface as a pop-up window displayed to a user to change the appearance of an item. FIG.
도 3a는 브라우저의 환경 내에서 실시된 것으로서 디지털 소스들로부터 조잡한 낟알모양의 정보와 개별 정보의 항목들을 포착하고 관리하기 위한 컴퓨터 구현 시스템의 실시예를 도시하는 도면.FIG. 3A illustrates an embodiment of a computer implemented system for capturing and managing crude grainy information and individual items of information from digital sources as implemented in a browser environment.
도 3b는 테이블 정의(definition)들에 따라, 포착된 각 항목에 대한 파일을 포함하고 콜렉션들의 계층으로 저장된 파일들 및 SQL 데이터베이스 엔트리들로서 저장된 메타 데이터를 포함하는 웹베이스(WebBase)로서 콘텍스트 데이터베이스의 실시예를 도시하는 도면.FIG. 3B illustrates the implementation of a context database as a WebBase containing files for each item captured and containing metadata stored as SQL database entries and files stored in a hierarchy of collections, according to table definitions. A diagram showing an example.
도 3c는 사용자가 사용자 콘텍스트 데이터베이스(Context Database)의 필터를 만들게 하기 위해, 사용자 인터페이스, 팝-업 윈도우의 실시예를 도시하는 도면.FIG. 3C illustrates an embodiment of a user interface, pop-up window, to allow a user to create a filter of a user context database. FIG.
도 3d는 콜렉션에 이용하는 필터들이 표시되는 사용자 인터페이스, 팝-업 윈도우의 실시예를 도시하는 도면.3D illustrates an embodiment of a user interface, pop-up window, in which filters to use in a collection are displayed.
도 4는 균일한 파일 포맷으로 항목을 형성하는 전체 방법의 실시예의 흐름도.4 is a flowchart of an embodiment of an overall method of forming an item in a uniform file format.
도 5a 및 5b는 항목을 위한 메타 데이터를 생성하는 과정의 일실시예의 전체 흐름도를 도시하는 도면.5A and 5B show an overall flow diagram of one embodiment of a process of generating metadata for an item.
도 6a는 항목과 오브젝트들에 대한 파일 시스템 계층으로서 항목 액세스 시스템의 실시예를 도시하는 도면.6A illustrates an embodiment of an item access system as a file system hierarchy for items and objects.
도 6b는 외부 파일들에 대한 참조문헌을 갖는 3 항목들이 어떻게 도 6a의 파일 시스템 실시예에 저장되는 지의 예를 도시하는 도면.FIG. 6B illustrates an example of how three items with references to external files are stored in the file system embodiment of FIG. 6A.
도 7a는 사용자가 항목 또는 콜렉션을 선택할 때, 콘텍스트 데이터베이스의 실시예에 기초한 콘텍스트 써머리(Context Summary)를 만들기 위한 방법의 실시예의 흐름도.7A is a flow diagram of an embodiment of a method for creating a context summary based on an embodiment of a context database when a user selects an item or collection.
도 7b는 도 7a의 방법을 이용하는 예를 도시하는 도면.7B illustrates an example of using the method of FIG. 7A.
도 8a는 본 발명에 따른 콘텍스트 써머리를 이용하는 대상 광고를 선택하는 방법의 실시예의 흐름도.8A is a flowchart of an embodiment of a method of selecting a target advertisement using a context summary in accordance with the present invention.
도 8b는 향상된 검색 방법의 실시예의 흐름도.8B is a flow diagram of an embodiment of an improved search method.
도 9a는 사용자 인터페이스의 실시예의 사용자의 선택을 도시하는 도면.9A illustrates a user's selection of an embodiment of a user interface.
도 9b는 도 8b의 방법으로부터 생성된 향상된 검색 문의(search query) 및 제안된 키워드들의 예를 도시하는 도면.FIG. 9B illustrates an example of an improved search query and suggested keywords generated from the method of FIG. 8B.
도 9c는 도 8a의 방법으로부터 선택된 대상 광고를 포함하는 웹 페이지의 실시예를 도시하는 도면.FIG. 9C illustrates an embodiment of a web page that includes a targeted advertisement selected from the method of FIG. 8A.
(발명의 개요)(Summary of invention)
본 발명은 디지털 소스로부터의 정보를 포착하고 관리하기 위한 시스템 및 방법을 제공한다.The present invention provides a system and method for capturing and managing information from digital sources.
한 양상에서, 본 발명은 사용자가 웹 사이트, 전자우편 또는 전자 도큐먼트 등의 디지털 소스로부터 개별 정보를 포착하고 관리하게 한다. 일반적으로, 웹 사이트 또는 다른 디지털 소스로부터 개별 정보 예컨대 문단(paragraph)을 포착하기 위해, 사용자는 웹 사이트 상의 원하는 정보를 하이라이트(highlight)하고 하이라이트된 정보가 포착되어야 함을 나타내는 브라우저 등의 사용자 인터페이스 상에 포착 제어를 활성시킨다. 본 발명의 또 다른 양상에서, 이하에서 항목으로 언급된 포착된 정보는 이롭게는 포착된 정보의 검색 및 포착된 정보에 미세 낱알형 액세스를 허용하는 강화된 HTML/XML 등의 균일 파일 포맷(uniform file format)에 저장된다. 각 항목은 항목 액세스 시스템에 저장된다. 항목 액세스 시스템의 일실시예는 항목들이 파일들에 저장되는 파일 시스템이다. 항목은 또한 포착된 정보에 메타 데이터를 할당함으로써 분석되고 조직화된다. 이러한 메타 데이터의 예들은 포착된 정보의 명칭, 카테고리, 키워드들, 소스, 소스 설명, 포착 날자 및 시간을 포함한다. 사용자는 본 발명 또는 대안에 의해 제안된 포착된 항목에 대한 메타 데이터를 선택할 수 있고, 사용자는 사용자 자신의 메타 데이터를 엔터할 수 있다.In one aspect, the present invention allows a user to capture and manage individual information from a digital source, such as a web site, email or electronic document. In general, in order to capture individual information, such as paragraphs, from a web site or other digital source, the user may highlight the desired information on the web site and display it on a user interface such as a browser indicating that the highlighted information should be captured. Enable capture control. In another aspect of the invention, the captured information referred to below as an item is advantageously a uniform file format, such as enhanced HTML / XML, that allows for retrieval of captured information and fine grained access to the captured information. format). Each item is stored in an item access system. One embodiment of an item access system is a file system in which items are stored in files. Items are also analyzed and organized by assigning metadata to captured information. Examples of such metadata include the name, category, keywords, source, source description, capture date and time of the captured information. The user can select metadata for the captured item proposed by the present invention or alternative, and the user can enter the user's own metadata.
본 발명은 또한 항목들, 임의의 관련된 파일들, 및 항목과 관련된 메타 데이터를 포함하는 콘텍스트 데이터베이스를 사용하는 개별 정보의 항목들을 관리한다. 일단 정보의 항목이 포착되고 파일에 저장되면, 이것의 메타 데이터는 포착된 정보의 분류, 주석, 구조 및 관리를 돕기 위해 SQL 데이터베이스 등의 데이터베이스 내에 통합된다. 콘텍스트 데이터베이스는 사용자가 포착된 정보를 다이내믹하게 집합하게 한다. 달리 말해서, 사용자는 상이한 포착된 정보 항목들을 조합하거나 인식할 수 있다. 콘텍스트 데이터베이스의 일실시예는 항목들이 인터넷을 통해 쉽게 관리되도록 HTML/XML 등의 마크업(mrakup) 언어로 항목들이 저장되는 웹베이스(WebBase)이다. 본 발명의 웹베이스 실시예는 데이터베이스의 파워나 웹 페이지들의 편재(ubiquity)를 함께 야기한다. 웹 페이지들과 SQL 데이터베이스의 이 혼합(melding)은 많은 작은 부가적인 일(work)로 공유 및 수입/수출과 같은 주변 특성들을 인에이블 한다The present invention also manages items of individual information using a context database that includes items, any related files, and metadata associated with the item. Once an item of information is captured and stored in a file, its metadata is integrated into a database, such as a SQL database, to assist in the classification, annotation, structure, and management of the captured information. The context database allows the user to dynamically gather the captured information. In other words, the user can combine or recognize different captured information items. One embodiment of a context database is WebBase, where items are stored in a markup language such as HTML / XML so that the items are easily managed over the Internet. The web base embodiment of the present invention brings together the power of a database or the ubiquity of web pages. This melding of web pages and SQL database enables peripheral features such as sharing and import / export in many small additional tasks.
또 다른 양상에서, 본 발명은 상품에 대한 대상된 프로모션들, 서비스들, 및 내용을 전달하고 이미 포착된 정보와 유사한 부가적인 정보를 찾는데 사용자를 돕기 위해 콘텍스트 데이터베이스를 사용한다. 일반적으로, 본 발명은 각 포착된 항목과 관련된 메타 데이터와, 항목들 사이의 관계(relationship)들 및 임의의 주언지 순간에서 특정 사용자 관심사의 써머리(Summery)를 만들기 위해 콘텍스트 데이터베이스에 저장된 항목들과 항목들의 메타 데이터 사이의 관계들을 분석한다. 얻어진 써머리는 컴퓨터에 의해 분석될 수 있고 이후에, 사용자가 웹베이스로부터 항목을 검색할 때 특정 상품, 서비스들, 및 내용에 대한 대상지정된 시기적절한 프로모셔널(promotional) 링크들 제공하기 위해 사용될 수 있는 포맷에서 사용자 관심사의 개요를 제공한다.In another aspect, the present invention uses a context database to convey targeted promotions, services, and content for a product and to assist the user in finding additional information similar to information already captured. In general, the present invention relates to metadata stored in relation to each captured item, items stored in a context database to create summaries of particular user interests at any point in time, and relationships between the items. Analyze the relationships between the metadata of items. The resulting summary can be analyzed by a computer and then used to provide targeted timely promotional links to specific products, services, and content when a user retrieves an item from a web base. Provides an overview of user interests in a format.
또 다른 양상에서, 본 발명은 인터넷 등의 디지털 정보 시스템들 상에서 수행된 검색들을 향상시키기 위해 콘텍스트 데이터베이스 내의 포착된 정보과 관련된 메타 데이터를 사용한다. 일반적으로, 사용자가 검색을 시작할 때, 본 발명은 검색에서 어떤 워드들을 사용하고 어떻게 문의에서 워드들을 사용하는지를 결정하기 위해 검색에 적절한 사용자 관심사의 써머리를 분석한다. 따라서, 포착된 정보와 관련된 메타 데이터는 존재하는 검색 포털들을 따라 통과될 수 있는 관심사의 사용자 써머리로부터 정보를 부가하는 강력한 검색 문의를 만들기 위해 사용된다.In another aspect, the present invention uses metadata associated with captured information in a context database to enhance searches performed on digital information systems such as the Internet. In general, when a user starts a search, the present invention analyzes a summary of user interests appropriate for the search to determine which words to use in the search and how to use the words in the query. Thus, the metadata associated with the captured information is used to make a powerful search query that adds information from the user summary of interest that can be passed along existing search portals.
따라서, 본 발명은 이롭게는 사용자가 디지털 소스들로부터의 개별 정보를 포착하고 관리하게 한다.Thus, the present invention advantageously allows a user to capture and manage individual information from digital sources.
첨부된 도면들은 본 발명의 실시예들을 도시한다. 본 발명의 실시예의 설명은 예시 및 설명을 위해 제공된 것이며, 개시된 정확한 형태로 본 발명을 배제하려 거나 제한하려는 의도가 아니다. 많은 변형들 및 변환들이 기술분야에서 가능하며,본 발명의 범위는 이 상세한 설명에 의해 제한되지 않으며 첨부된 청구범위에 한정됨을 의도한다.The accompanying drawings show embodiments of the invention. The description of the embodiments of the invention is provided for the purpose of illustration and description, and is not intended to be exhaustive or to limit the invention to the precise form disclosed. Many modifications and variations are possible in the art, and the scope of the invention is not limited by this detailed description, but is intended to be limited by the appended claims.
도 1은 동작 시스템(164')을 갖는 고객 컴퓨터(118'), 사용자의 콘텍스트 데이터베이스(140')을 위한 저장 영역을 포함하는 메모리 영역, 브라우저 디스플레이와 같은 사용자 인터페이스(160')를 갖는 디스플레이(108'), 입력 장치들(키보드(114)와 마우스(116)), 인터넷과 같은 네트워크(159')를 통해 고객 컴퓨터(118')와 통신(142')하는 서버(128)의 실시예로서, 서버는 고객컴퓨터(118')와 통신하는 웹사이트(130, 및 복수의 콘텍스트 데이터베이스(140')를 위한 대안의 저장 위치를 제공하기 위한 저장 영역(138)을 호스트(host)하고, 웹사이트(144) 및 전자우편 또는 전자 도큐먼트(148)와 같은 디지털 소스들은 또한 고객 컴퓨터(118')와 통신(150,154)하는, 실시예를 포함하는 본 발명에 따른 디지털 소스로부터 개별 정보를 포착하고 관리하기 위한 시스템의 일실시예를 도시한다. 고객 컴퓨터의 또 다른 실시예는 또한 디스플레이(108') 및 사용자 입력 장치로서 침(stylus:126), 및 동작 시스템(164')을 갖는 개인 디지털 어시스턴트(assistant)(118')로서 도 1에 도시된다. 개인 디지털 어시스턴트(PDA)는 또한 서버(128)와 네트워크(159')를 통해 통신(158)한다. 도 3A는 동작 시스템이 클립보드 구조(168)와 드래그와 드롭 하부구조(drag and drop infrastructure: 170)를 가짐을 도시한다.1 shows a customer computer 118 'with an operating system 164', a memory area including a storage area for a user's context database 140 ', and a display with a user interface 160' such as a browser display. 108 '), an embodiment of a server 128 that communicates 142' with a customer computer 118 'via input devices (keyboard 114 and mouse 116), a network 159' such as the Internet. The server hosts a website 130 that communicates with the customer computer 118 ', and a storage area 138 to provide alternative storage locations for the plurality of context databases 140', and the website 144 and digital sources such as e-mail or electronic document 148 also capture and manage individual information from a digital source in accordance with the present invention, including an embodiment 150,154 in communication with a customer computer 118 '. One embodiment of a system is shown. Another embodiment of a guest computer is also shown in FIG. 1 as a personal digital assistant 118 'having a stylus 126 as a display 108' and a user input device, and an operating system 164 '. The Personal Digital Assistant (PDA) also communicates with the server 128 and the network 159 '158. Figure 3A shows that the operating system drags and drops the clipboard structure 168 and the drag and drop infrastructure. infrastructure: 170).
PDA 실시예(118')는 또한 사용자에게 정보를 표시하기 위한 사용자 인터페이스, 예컨대 브라우저 디스플레이(160')를 갖는다. 브라우저 디스플레이(160')는 세 개의 클릭 버튼들(120',122, 124')과 사용자의 콘텍스트 데이터베이스에 항목들을 표시하기 위한 항목 액세스 윈도우(162)를 갖는 툴바(toolbar)로서 실시된 포착 제어(capture control)를 갖는다. 이들 실시예들에서, 가장 밝은 클릭 버튼(120')은 흥미있는 정보를 선택하기 위한 가장 밝은 모습을 활성화한다. 원(one) 클릭 포착 버튼(122')은 정보가 포착되어야 함을 나타내도록 사용자에 의해 활성된다. 제 3 클릭 버튼(124')은 사용자의 개별 항목들이 항목들을 볼 수 없는 것인지를 사용자에게 표시하게 하는 이들 예들에 도시된다.PDA embodiment 118 'also has a user interface, such as a browser display 160', for presenting information to a user. Browser display 160 'is a capture control implemented as a toolbar having three click buttons 120', 122, 124 'and an item access window 162 for displaying items in a user's context database. have capture control. In these embodiments, the brightest click button 120 'activates the brightest look for selecting interesting information. One click capture button 122 'is activated by the user to indicate that information should be captured. Third click button 124 ′ is shown in these examples to allow the user to indicate whether the user's individual items are invisible.
도 1에서, 각 디스플레이는 동작 시스템의 드롭 및 드래인 하부구조에 따라 마우스(116)와 침(126)등의 입력 장치의 사용자 동작에 응답하여 선택되는 정보(112')의 개별 항목의 사용자 선택(110)을 나타낸다. 정보의 원하는 개별 항목을 선택하기 위한 어떤 다른 입력 장치들뿐만 아니라 키보드(114)가 또한 사용될 수 있다. 사용자는 또한 가장 밝은 버튼(124')을 클릭할 수 있고, 입력 장치를 이용하여 선택될 개별 정보 위로 커서를 움직일 수 있다. 이후에 사용자는 선택된 항목을 포착하도록 나타내기 위해 원 클릭 포착 버튼(122')을 클릭한다.In FIG. 1, each display is a user selection of an individual item of information 112 ′ that is selected in response to user actions of an input device, such as mouse 116 and needle 126, depending on the drop and drain infrastructure of the operating system. (110). The keyboard 114 may also be used as well as any other input devices for selecting the desired individual item of information. The user can also click on the brightest button 124 'and use the input device to move the cursor over the individual information to be selected. The user then clicks the one-click capture button 122 'to indicate to capture the selected item.
도 2a는 본 발명의 한 버전에 의해 생성된 브라우저 디스플레이(200)의 실시예를 도시한다. 브라우저 디스플레이(200)는 툴바(202), 브라우저 윈도우(204), 광고 패널(206), 브라우저 플러그-인(plug-in) 윈도우(222)를 가지며, 브라우저 플러그-인(plug-in) 윈도우(222)는 검색 워드 엔트리 바(208)와, 이 실시예에서 웹베이스인 사용자의 콘텍스트 데이터베이스의 구조에서 사용자의 항목들을 표시하기 위한 콜렉션 맵(collection map: 212)을 포함하고, 또한 파일 메뉴 버튼(214), 원 클릭 포착 버튼(216), 센드 버튼(send button: 218), 웹 검색 버튼(220), 콘텍스트 데이터베이스 검색 버튼(227), 및 도구 버튼(tools button: 225), 및 항목 리스트(210)를 포함한다.2A illustrates an embodiment of a browser display 200 generated by one version of the present invention. The browser display 200 has a toolbar 202, a browser window 204, an advertising panel 206, a browser plug-in window 222, and a browser plug-in window ( 222 includes a search word entry bar 208 and a collection map 212 for displaying the user's items in the structure of the user's context database, which in this embodiment is a web base, and also includes a file menu button ( 214, one click capture button 216, send button 218, web search button 220, context database search button 227, and tools button 225, and item list 210 ).
도시된 바와 같이, PTO란 제목의 콜렉션은 개별 정보의 두 개의 항목들을 포함하는 다수의 항목들을 포함하며, 각 정보는 "미국의 지적 재산 심포지엄(Intellectual Property Symposium of the Americas)"(228) 및 "일부 잘 알려진 미국 상표들(Some Well-Known U.S. Trademarks)"(230)의 명칭들로 식별된파일에 저장된다. 브라우저 윈도우(204)는 선택된 항목 "미국 지적 재산 심포지엄"(228)의 내용들(215)을 표시한다. 광고 패널(206)은 또한 다양한 광고 및 프로모션들의 키워드들과 사용자의 콘텍스트 데이터베이스의 키워드들을 매치들에 기초하여, 일실시예에서 선택되는 바와 같이 관련 광고 및 프로모션들을 표시하기 위해, 표시된 웹페이지(200)에 포함된다.As shown, a collection titled PTO includes a number of items, including two items of individual information, each of which is referred to as "Intellectual Property Symposium of the Americas" (228) and " Stored in a file identified by the names of some well-known US Trademarks " The browser window 204 displays the contents 215 of the selected item “US Intellectual Property Symposium” 228. The advertising panel 206 also displays the displayed webpage 200 for displaying related advertisements and promotions as selected in one embodiment, based on matches of keywords of various advertisements and promotions and keywords of the user's context database. Included).
도 2b는 개별 항목들이 사용자를 위해 집합되는 본 발명의 양상을 도시한다. "PTO" 콜렉션(226)이 이 실시예에서 선택되는 경우, 브라우저 윈도우(204)는 하나의 집합된 포맷 디스플레이(217)에서의 콜렉션 내의 개별 항목들을 표시한다. 본 발명의 일실시예에서, 항목들은 다이내믹하게 집합될 수 있다, 예를 들면, 도 2b는 두 개의 항목들, 즉 PTO 콜렉션이 선택되었을 경우 함께 표시되는 "미국의 지적 재산 심포지엄"(228) 및 "일부 잘 알려진 미국 상표들은 100주년을 축하한다"(230)를 보여준다. 포착된 정보의 항목들은 이전에 익명의 도큐먼트들이 지적으로 통합될 수 있도록 처리된다. 이는 다른 것들에 대해 관련된 개별 항목들의 콜렉션들을 브라우징, 공유, 수출, 수입, 검색 및 전송하는 것을 용이하게 한다. 기술분야의 당업자가 이해하는 바와 같이, 웹베이스 항목들의 다이내믹한 집합(aggregation)의 많은 다른 형태들이 가능하다. 다이내믹한 집합을 수행하기 위한 성능이란 정보가 시스템들에 기초하여 전통적인 도큐먼트로 간단히 가능하게 될 수 없는 방식으로 쉽고 용이하게 재조직화되고 다시 고려될 수 있다는 것을 의미한다.2B illustrates an aspect of the invention in which individual items are aggregated for a user. When the "PTO" collection 226 is selected in this embodiment, the browser window 204 displays the individual items in the collection in one aggregated format display 217. In one embodiment of the present invention, the items may be dynamically collected, for example, FIG. 2B shows the "US Intellectual Property Symposium" 228 that is displayed together when two items, PTO collections, are selected. "Some well-known American brands celebrate 100 years" (230). The captured items of information are processed so that previously anonymous documents can be intelligently integrated. This facilitates browsing, sharing, exporting, importing, searching and transmitting collections of individual items related to others. As will be appreciated by those skilled in the art, many other forms of dynamic aggregation of webbase items are possible. The ability to perform a dynamic aggregation means that information can be easily and easily reorganized and reconsidered in a way that simply cannot be made possible with traditional documents based on systems.
디지털 정보의 다중 및 종종 혼합된 유형의 포맷들이 포착 제어에 의해 포착될 수 있다. 혼합된 유형의 포맷들은 워드와 뛰어난 도큐먼트 등의 링크들과 다른파일들뿐만 아니라, 영화, 애플렛들(applets), 플레쉬(flash), 쇼크웨이브(shockwave) 등의 제 3 부분 삽입가능 오브젝트들, 테스트, 영상들, 사운드들에 제한되지 않는다.Multiple and often mixed types of formats of digital information can be captured by acquisition control. Mixed types of formats include links and other files, such as Word and excellent documents, as well as third-part insertable objects such as movies, applets, flash, shockwaves, tests, etc. It is not limited to images, sounds.
포착하는 항목들에서, 사용자들은 조잡한 낱알 정보 또는 미세한 낱알 정보를 포착하는 옵션을 갖는다. 조잡한 낱알 정보의 예는 웹페이지, 도큐먼트 또는 포함 파일(encompassing file)이다. 미세한 낱알 정보의 예는 도큐먼트 또는 포함 파일의 보조-성분(sub-component)이다. 도 2c에 도시된 바와 같이 World Wide Web 포맷의 정보를 포착하는 것에 관해 통상 사용된 일실시예에서, 사용자는 선택된 항목이 그 항목에 대한 "웹 내용(Web content)"(258)를 선택함으로써 엔트리 도큐먼트의 데이터보다 작은 개별적인 형태로 세이브되고, 또는 통상 항목이 "웹 링크(Web Link)"(260)를 선택함으로써 나타나는 웹페이지에 그 링크를 세이브하는지의 여부를 나타낼 수 있다. 이 실시예에서, 명칭(name:262)은 항목에 대해 제공되고, 알림부(notes section:264)와 폴더(folder:226)는 그 항목에 대해 제공되며, 그 모두는 사용자에 의해 변경되거나 부가될 수 있다.In the capturing items, users have the option of capturing crude grain information or fine grain information. Examples of crude grain information are web pages, documents or encompassing files. An example of fine grain information is a sub-component of a document or include file. In one embodiment commonly used with respect to capturing information in the World Wide Web format as shown in FIG. 2C, a user may enter an entry by selecting the "Web content" 258 for that item. It may be saved in a separate form that is smaller than the document's data, or may indicate whether the item is typically saved to a web page that appears by selecting “Web Link” 260. In this embodiment, a name (262) is provided for the item, a notes section (264) and a folder (226) are provided for that item, all of which are changed or added by the user. Can be.
도 2d에 나타내어진 바와 같이, 팝-업(pop-up) 윈도우(299)는 사용자가 스크롤 바들(scroll bars:248)과 부가(Add:291), 관리(293), 및 OK(253) 클릭 버튼들을 조작함으로써 선택할 수 있는 더 많은 키워드들(2486')에 대한 항목(242), 카테고리(244), 및 제안들에 대한 명칭을 제공하기 위해 사용자에게 제공된다. 박스의 윈도우(257)에서 사용자에게 제공된 것은 항목의 소스, 소스의 설명(description) 및 포착의 날짜와 시간이다. 사용자는 OK 버튼(253)을 클릭함으로써 그의 콘텍스트 데이터베이스에 삽입될 항목을 얻는다. 사용자는 또한 알림을 부가하거나 '알림(notes)(292) 버튼 및 외관(Appearance)(294) 버튼들 각각 클릭함으로서 항목의 외관을 변경할 수 있다. 도 2e에 도시된 예, 팝-업 윈도우(252)는 알림들의 엔트리를 사용자가 허용하도록 표시되고, 도 2f에 도시되는 예, 팝-업 윈도우는 항목의 외관을 변경하기 위해 사용될 수 있음을 도시되었다.As shown in FIG. 2D, a pop-up window 299 allows a user to click scroll bars 248 and add (291), manage 293, and OK 253. The user is provided to provide a name for item 242, category 244, and suggestions for more keywords 2486 ′ that can be selected by manipulating the buttons. Provided to the user in the window 257 of the box are the source of the item, a description of the source and the date and time of the capture. The user clicks the OK button 253 to get the item to be inserted into his context database. The user can also change the appearance of the item by adding a notification or clicking on each of the 'notes' 292 and the Appearance 294 buttons. The example pop-up window 252 shown in FIG. 2E is indicated to allow the user to enter an entry of notifications, and the example pop-up window shown in FIG. 2F can be used to change the appearance of an item. It became.
도 3a는 고객 컴퓨터(118') 상에서 동작하는 브라우저(360)로서 삽입된 디지털 소스들로부터 개별 정보를 포착하고 관리하기 위한 컴퓨터 구현 시스템(320)의 실시예를 보여준다. 원 클릭 포착 버튼(120' 또는 216)의 사용자의 선택은 포착 제어(322)와 통신된다. 포착 제어(322)는 동작 시스템(164) 및 어플리케이션 특정 액세스 프로토콜과 상호작용 한다. 예를 들면, 사용자가 도 1에 나타낸 바와 같이 정보(112')의 개별 항목을 선택(110')하고 원 클릭 포착 버튼을 활성화시키는 경우, 항목은 동작 시스템 클립보드로 넘겨진다. 도시된 실시예에서 포착 제어(322)는 가용한 클립보드 포맷들에서 클립보드(168) 상에 포착된 내용을 시험하고, 균일 파일 포맷(Uniform File Format)에 대한 최상의 변역을 제공하는 하나를 선택한다. 선택된 포맷 내의 항목은 이후에 균일 파일 포매터(324)를 따라 통과된다. 또 다른 예에서, 사용자가 브라우저(360)로부터 직접 항목을 포착할 때, 포착 제어(322)는 브라우저의 내부 데이터 구조 또는 도큐먼트 오브젝트 모델을 시험하고 균일 파일 포매터(324)에 설정된 이 데이터로부터 관련 바일 포맷팅 정보를 따라 통과한다.3A shows an embodiment of a computer implemented system 320 for capturing and managing individual information from digital sources inserted as a browser 360 operating on a customer computer 118 ′. The user's selection of the one click capture button 120 'or 216 is communicated with the capture control 322. Acquisition control 322 interacts with operating system 164 and application specific access protocols. For example, when a user selects 110 'an individual item of information 112' and activates a one-click capture button as shown in FIG. 1, the item is passed to the operating system clipboard. In the illustrated embodiment, capture control 322 examines the content captured on clipboard 168 in the available clipboard formats, and selects one that provides the best translation for Uniform File Format. do. The item in the selected format is then passed along the uniform file formatter 324. In another example, when a user captures an item directly from the browser 360, the capture control 322 examines the browser's internal data structure or document object model and associates it with this data set in the uniform file formatter 324. Pass along the formatting information.
균일 파일 포매터(324)는 균일 포맷에 포착된 항목들을 위치시킨다. 본 발명의 일실시예에서, 균일 파일 포매터는 모든 항목들을 그 항목들이 다이내믹하게 집합될 수 있도록 "집합가능(aggretabable)" 포맷으로 변형시킨다. 예들 들면, 도 2b는 브라우저 윈도우(204)에서 하나의 표시된 HTML 도큐먼트(217)에 집합된 선택되는 POL 콜렉션(226) 내에 항목들을 보여준다. 집합가능 포맷으로 저장된 항목은 집합된 디스플레이에서의 위치에 무관하게 프리젠테이션 보전(presentation integrity)을 유지한다.The uniform file formatter 324 places the captured items in a uniform format. In one embodiment of the present invention, the uniform file formatter transforms all items into an "aggretabable" format so that they can be gathered dynamically. For example, FIG. 2B shows items in the selected POL collection 226 aggregated into one displayed HTML document 217 in the browser window 204. Items stored in an aggregateable format maintain presentation integrity regardless of their position in the aggregated display.
메타 데이터 생성기(326)가 개별적인 소자(element)로서 도시되었지만, 그의 기능들 및 균일 파일 포매터(324)의 기능들은 포착된 항목의 단일 패스(pass)에서 함께 수행될 수 있다. 메타 데이터 생성기(326)는 항목과 메타 데이터를 관련시킨다. 메타 데이터의 예들은 명칭, 카테고리, 키워들, 소스, 및 소스 설명 등에 제한됨이 없이 이들을 포함한다. 메타 데이터는 사용자의 콘텍스트 데이터베이스(140')에 콘텍스트를 제공하기 위해 사용된다. 생성된 메타 데이터는 승인(approval) 및/또는 변경 및 부가를 위해 도 2d에 도시된 바와 같이 사용자 인터페이스를 통해 사용자에게 제공된다. 메타 데이터 생성기는 사용자(338)로부터 수신되는 이들의 변경 및/또는 부가를 포함한다. 메타 데이터 생성기는 메타 데이터가 사용자의 콘텍스트 데이터베이스(140')에 저장될 수 있도록 콘텍스트 데이터베이스 관리기(Context Database Manager:330)에 메타 데이터를 전달한다. 더욱이, 균일 파일 포매터(324) 및 메타 데이터 생성기(326)는 생성된 파일 관리기(328)와 통신한다.Although the metadata generator 326 is shown as a separate element, its functions and the functions of the uniform file formatter 324 may be performed together in a single pass of the captured item. Meta data generator 326 associates the item with metadata. Examples of metadata include, without limitation, name, category, keywords, source, source description, and the like. Meta data is used to provide context to the user's context database 140 '. The generated metadata is provided to the user via the user interface as shown in FIG. 2D for approval and / or modification and addition. The metadata generator includes their changes and / or additions received from user 338. The metadata generator delivers the metadata to the context database manager 330 so that the metadata can be stored in the user's context database 140 '. Moreover, uniform file formatter 324 and metadata generator 326 are in communication with generated file manager 328.
생성된 파일 관리기(328)는 파일 시스템(354)에서 집합가능 포맷 내에 항목을 저장할 것이다. 일실시예에서, 항목 또는 콜렉션이 보여질 때, 생성된 파일 관리기는 버퍼에 기록되는 헤더를 다이내믹하게 생성한다. 생성된 파일 관리기는 콜렉션이 선택되면 그 항목 또는 항목들을 "집합가능" 포맷으로 위치시키고, 이 헤더에 항목 또는 항목들을 덧붙인다. 얻어지는 버퍼는 파일에 기록되고 사용자에게 표시된다.The generated file manager 328 will store the items in a collectable format in the file system 354. In one embodiment, when an item or collection is viewed, the generated file manager dynamically generates a header that is written to the buffer. The generated file manager places the item or items in a "gatherable" format when the collection is selected, and appends the item or items to this header. The resulting buffer is written to a file and displayed to the user.
콘텍스트 데이터베이스 관리기(330)는 콘텍스트 데이터베이스(140')로부터 시스템의 다른 성분들을 위한 요청된 데이터를 저장하고, 정정하고, 검색한다. 콘텍스트 데이터베이스는 사용자의 포맷된 파일들(354), 데이터베이스(356) 및 다른 특성들, 예컨대, 사용자의 항목들과 관련되는 집합가능 항목의 메모리 내의 위치에 대한 포인터(pointer), 및 시드 키워드들(Seed Keywords:358)을 포함한다. 시드 키워들의 예들은 임시 출원(Provisional Application)의 부록 C에서 찾을 수 있다. 본 발명의 일실시예에서, 시드 키워드들(358)은 콘텍스트 써머리를 만드는데 있어 임의의 조건들 하에서 콘텍스트 써머라이저(332)에 의해 사용된다.Context database manager 330 stores, corrects, and retrieves requested data for other components of the system from context database 140 '. The context database includes a pointer to a location in memory of a user's formatted files 354, a database 356, and other characteristics, such as a collectible item associated with the user's items, and seed keywords ( Seed Keywords: 358). Examples of seed keywords can be found in Appendix C of the Provisional Application. In one embodiment of the invention, the seed keywords 358 are used by the context summerizer 332 under certain conditions in making the context summary.
콘텍스트 써머라이저(332)는 데이터베이스를 문의함으로써 사용자의 콘텍스트 데이터베이스(140)의 웨이트되고 키워드 기반의 써머리인 콘텍스트 써머리를 만든다. 콘텍스트 써머라이저(332)는 현재 선택된 항목 또는 콜렉션에 기초하여 콘텍스트 써머리 내의 키워들을 우선시키는 콘텍스트 필터(336)를 포함한다. 콘텍스트 써머라이저는 매 시간 콘텍스트 써머리를 만들고, 사용자는 항목 또는 콜렉션을 선택하고 이 실시예에서 서버(128)에 위치된 플로파일 분석기(Profile Analyzer:342)에 그 써머리를 전달한다. 또한, 콘텍스트 써머라이저는 그 써머리를 되돌리는 검색 인핸서(Search Enhancer)에 의해 요청될 때 키워들의 콘텍스트 써머리를 만든다.The context summerizer 332 makes a context summary that is a weighted, keyword-based summary of the user's context database 140 by querying the database. The context summerizer 332 includes a context filter 336 that prioritizes keywords in the context summary based on the currently selected item or collection. The context summerizer creates a context summary every hour, and the user selects an item or collection and passes the summary to a profile analyzer (342) located in the server 128 in this embodiment. The context summerizer also creates a context summary of keywords when requested by a Search Enhancer that returns the summary.
프로파일 분석기(342)는 항목 또는 콜렉션의 각 선택에 따라 콜렉션 써머리를 수신한다. 일실시예에서, 콘텍스트 써머라이저(332)는 항목의 카테고리를 포함한다. 또 다른 실시예에서, 프로파일 분석기(342)는 콘텍스트 데이터베이스 관리기(330)로부터 그것을 요청함으로써 선택된 항목 또는 콜렉션의 카테고리를 얻는다. 프로파일 분석기는 이후에 서버(128) 상에 위치된 프로모터 인터페이스(Promoter Interface:344)에 현 선택에 대한 써머리와 카테고리를 전달한다. 프로모션 인터페이스는 사용자에게 표시될 프로모션을 선택한다. 일실시예에서, 프로모터 인터페이스는 매치들(matches)을 찾기 위해 서버 상에 저장된 프로모션(343)과 관련된 키워들(345)과 현 선택의 키워드들을 비교한다. 키워드들의 매치를 찾으면, 키워드들이 매치하는 이들 프로모터들이 선택된다. 도 3a의 실시예에서, 프로모터 인터페이스는 광고 패널(206)에 표시하기 위해 HTML 도큐먼트를 생성한다.Profile analyzer 342 receives a collection summary according to each selection of an item or collection. In one embodiment, the context summerizer 332 includes a category of items. In another embodiment, profile analyzer 342 obtains the category of the selected item or collection by requesting it from context database manager 330. The profile analyzer then forwards the summary and category for the current selection to a promoter interface 344 located on server 128. The promotion interface selects a promotion to be displayed to the user. In one embodiment, the promoter interface compares the keywords of the current selection with keywords 345 associated with the promotion 343 stored on the server to find matches. If a match is found for the keywords, those promoters that match the keywords are selected. In the embodiment of FIG. 3A, the promoter interface generates an HTML document for display in the advertising panel 206.
검색 인핸서(Search Enhancer:346)는 검색 문의 엔트리 바(enter bar)(208)에 엔터된 사용자의 검색열(search string)을 분석한다. 검색 인핸서는 메타 데이터 내에서의 워드들의 발생을 찾고 그 워드들과 관련된 항목들 또는 콜렉션들을 검색하기 위해 콘텍스트 데이터베이스를 검색하도록 콘텍스트 데이터베이스 관리기(330)에 요청을 전달한다. 임의의 항목들 또는 콜렉션들이 검색열 내의 워들들과 관련되면, 검색 인핸서는 콘텍스트 써머라이저로부터 각 항목 또는 콜렉션에 대한 콘텍스트 써머리를 요청한다.Search Enhancer 346 analyzes a user's search string entered in search query entry bar 208. The search enhancer forwards a request to the context database manager 330 to search the context database to find occurrences of words in the metadata and to search for items or collections related to those words. If any items or collections are associated with the words in the search string, the search enhancer requests a context summary for each item or collection from the context summer.
검색 인핸서는 이 실시예에서의 서버(128) 상의 문의 생성기(348)에 사용자의 선택된 검색 엔진에 따라 전달되는 콘텍스트 써머라이저들로부터 검색 써머리를 만든다. 문의 생성기(339)는 검색 엔진 그래머 프로토콜들(Search Engine Grammar Protocals:339)로부터 적절한 곳에 검색 써머리의 워드들을 위치시킨다.The search enhancer creates a search summary from the context summers that are passed according to the user's selected search engine to the query generator 348 on the server 128 in this embodiment. The query generator 339 places the words of the search summary in place from the Search Engine Grammar Protocals 339.
도 3b는 SQL 데이터베이스(376) 및 사용자의 파일들(378)을 포함하는 웹베이스(370)로서 콘텍스트 데이터베이스의 실시예를 도시한다. 사용자의 파일들은 HTML 프레임 등의 참조된 오브젝트들(374) 또는 영상 또는 영화 등의 삽입된 오브젝트에 대한 파일들을 포함하는 관련된 파일들(374)뿐만 아니라 사용자의 항목들(372)을 포함한다.3B illustrates an embodiment of a context database as a web database 370 that includes an SQL database 376 and users' files 378. The user's files include the user's items 372 as well as associated files 374 including files for referenced objects 374 such as HTML frames or embedded objects such as images or movies.
SQL 데이터베이스의 사용자는 포착된 정보의 분류, 주석(annotation), 구성, 및 관리에 있어 도움을 받는다. SQL 데이터베이스는 웹베이스를 관리하는데 있어 사용자에게 콘텍스트를 제공하기 위해 관계들(relationships)을 정의하는 테이블들을 포함한다. 테이블 정의들의 예들이 본 명세서에 참조문헌으로 통합된 임시 출원의 부록 B에 포함되어 있다. 특히, 테이블들은 오브젝트 테이블(308), 관계 테이블(382), 필터 테이블(392), 필터 관계 테이블(394), 정보 맵 테이블(388), 정보 맵 exp키들(expkeys) 테이블(390), 태그 테이블(386), 및 태그 관계 테이블(384)을 포함한다. 일실시예에서, 항목은 오브젝트 테이블(380)에서 엔트리에 의해 표현될 수 있다. 열들(columns)은 특정 항목, 그 항목의 명칭, 알림들, 소스, 소스 설명, 파일의 위치에 대한 포인터들, 배경색과 같은 외관 특성들, 부모(parent) 콜렉션에 관한 아이(child) 순서로 키잉(keying)을 위한 키에 제한되지 않고 이들을 포함한다. 각 항목은 관계 테이블(382)에 정의된 바와 같이 하나 이상의 콜렉션들에 속한다. 예를 들어, 각 항목은 하나 이상의 부모 콜렉션들의 아이로서 관련될 수 있고, 각 콜렉션은 차례로 하나 이상의 부모 콜렉션들의 아이로서 관련될 수 있다.Users of the SQL database are helped in classifying, annotating, organizing, and managing the captured information. An SQL database contains tables that define relationships in order to provide a context for the user in managing a Web database. Examples of table definitions are included in Appendix B of the interim application, which is incorporated herein by reference. In particular, the tables include object table 308, relationship table 382, filter table 392, filter relationship table 394, information map table 388, information map expkeys table 390, tag table 386, and a tag relationship table 384. In one embodiment, the item may be represented by an entry in the object table 380. Columns are keyed in order of a particular item, its name, notifications, source, source description, pointers to the location of the file, appearance characteristics such as background color, and child relative to the parent collection. Include them without being limited to keys for keying. Each item belongs to one or more collections as defined in relationship table 382. For example, each item may be related as a child of one or more parent collections, and each collection may in turn be related as a child of one or more parent collections.
이 실시예에서, 각 항목에 대한 키워드들, 카테고리들, 및 명칭들이 태그 관계 테이블(384)에 정의된 관계들에 의해 오브젝트 테이블 내의 항목들에 관련되는 태그 테이블(386)에서 엔트리들에 의해 표현될 수 있다.In this embodiment, the keywords, categories, and names for each item are represented by entries in the tag table 386 where the keywords, categories, and names for each item are related to the items in the object table by the relationships defined in the tag relationship table 384. Can be.
이 실시예에서, 정보 테이블(388)은 사용자의 선택 및 사용자가 보고있는 것의 현재 상태를 유지하도록 정의된다. 정보 맵 Exp 키들은 관계 테이블(382)과 상호작용하고 콜렉션들 및 항목들이 개방임을 인식함으로써 현재 개방 트리 경로를 트랙(track)한다. 시스템이 동작중일 때, 이 정보는 랜덤 액세스 메모리(RAM)에 있는 이 정보는 정보 맵 테이블들 상의 데이터베이스 문의들을 수행하기보다는 오히려 RAM으로부터 쉽게 얻어질 수 있다.In this embodiment, the information table 388 is defined to maintain the user's selection and the current state of what the user is viewing. The information map Exp keys track the current open tree path by interacting with relationship table 382 and recognizing that collections and items are open. When the system is running, this information in random access memory (RAM) can be easily obtained from RAM rather than performing database queries on information map tables.
필터(392)와 필터 관계(394) 테이블들은 사용자의 콘텍스트 데이터베이스를 통해 감별하는(sifting) 사용자를 돕는다. 필터 테이블(392)은 원하는 행들, 필터 또는 에이전트 명칭, 주석, 및 관련된 키워드들로 색인하기 위한 키 등의 필드들을 정의하는 여러 가지 행들을 포함한다. 필터 관계 테이블(392)은 선택된 필터에 따르는 오브젝트 테이블 내의 항목들을 필터에 관계시킨다.Filter 392 and filter relationship 394 tables assist the user in sifting through the user's context database. The filter table 392 contains various rows that define fields such as desired rows, a filter or agent name, a comment, and a key for indexing with related keywords. The filter relationship table 392 associates items in the object table according to the selected filter with the filter.
예를 들어, 도 3c는 사용자가 이 실시예에서, 에이전트라고 불리는 필터를 정의하게 하는 "에이전트 재산들(Agent Properties)이란 제목의 사용자 인터페이스로서 팝-업 윈도우(395)를 도시한다. 이 실시예에서, 필터 테이블(392)은 에이전트의 명칭, 항목의 명칭, 항목의 키워드들, 항목들의 알림들, 및 항목의 소스에 관련되는 엔트리 바들(415, 401, 393, 403, 및 405)에서 워드들의 사용자 엔트리에 대응하는 열들을 포함한다. 도 3c의 예에서, 사용자는 키워드들 엔트리 바(393)에서 "특허(patent)"를 엔터하였다. 이는 콘텍스트 데이터베이스가 필터와 그들과 관련된 워드 "특허"를 갖는 항목들 또는 콜렉션들을 관계시키는 이 에이전트 "특허"에 대한 필터 관계 열을 만들도록 한다. 도 3d의 팝-업 윈도우(407)에 도시된 바와 같이, PTO 콜렉션은 이것에 이용되는 특허 에이전트를 갖는다. 버튼(417)을 클릭함으로써, "정부(government)" 에이전트(411)는 또한 PTO 콜렉션에 이용될 수 있다. 필터 명령이 사용자로부터 수신될 때, 필터와 관련된 이들 항목들 또는 콜렉션들이 사용자에게 표시된다.For example, FIG. 3C shows a pop-up window 395 as a user interface entitled "Agent Properties" that allows a user to define a filter called an agent in this embodiment. This embodiment In the filter table 392 is the name of the agent, the name of the item, the keywords of the item, the notifications of the item, and the words of the entries in the entry bars 415, 401, 393, 403, and 405 related to the source of the item. The columns corresponding to the user entry In the example of Fig. 3c, the user has entered a "patent" in the keywords entry bar 393. This means that the context database has a filter and the word "patent" associated with them. Create a filter relationship column for this agent “patent” that associates items or collections that have a PTO collection, as shown in pop-up window 407 of FIG. 3D. By clicking on button 417, "government" agent 411 can also be used for PTO collections.When a filter command is received from a user, these items or collections associated with the filter are received by the user. Is displayed.
정보의 포착된 항목이 사용자의 콘텍스트 데이터베이스에 저장되기 전에, 항목은 균일 파일 포맷에 포맷된다. 도 4는 균일 파일 포맷에 항목을 포맷하는 전체 방법의 실시예의 흐름도이다. 도 5a 및 5b는 메타 데이터의 생성 과정의 실시예를 설명한다. 본 발명의 일실시예에서, 포착된 항목을 통한 단일 패스는 메타 데이터를 포맷하고 생성하는 균일한 파일의 목적들을 위해 효과적으로 이용된다.Before the captured item of information is stored in the user's context database, the item is formatted in a uniform file format. 4 is a flowchart of an embodiment of an overall method of formatting an item in a uniform file format. 5A and 5B illustrate an embodiment of a process of generating metadata. In one embodiment of the present invention, a single pass through the captured item is effectively used for the purposes of a uniform file to format and generate metadata.
많은 다른 포맷을 포함할 수 있는 단일 포맷은 균일 파일 포맷으로서 상당히 바람직하다. 우연히 접하게 될 수 있는 포맷들의 예들은 HTML 및 XML 등의 마크업(markup) 언어들, URL 대 (국부 파일들을 포함하는) ASCⅡ 파일, 리치 텍스트 포맷(Rich Text Format), 삽입된 파일들 및 하이퍼링크들(hyperlinks)에 대한몇몇 워드 프로세서들과 함께 사용되는 것들과 같은 재산 이진 포맷들(proprietary binary formats), 영상들을 저장하는 것과 다른 다중매체 등의 국부 이진 파일들, URL 대 이진 파일, 및 데이터를 해석하고 표시하는 등록된 성분 등의 "자기 관리된(self-managed)" 삽입된 오브젝트들 및 마이크로소프트 엑셀, 마이크로소프트 워드, 아크로뱃 PDF, 플래쉬, 및 ASCⅡ 텍스트 등의 다른 데이터와 함께 혼합된 이들 오브젝트들에 대한 참조문헌들(references)을 포함한다.A single format that can include many other formats is highly desirable as a uniform file format. Examples of formats that may come across include markup languages such as HTML and XML, URL to ASCII files (including local files), rich text format, embedded files and hyperlinks. Property binary formats, such as those used with some word processors for hyperlinks, local binary files such as storing images and other multimedia media, URL to binary files, and data. "Self-managed" embedded objects such as registered components that are interpreted and displayed and mixed with other data such as Microsoft Excel, Microsoft Word, Acrobat PDF, Flash, and ASCII text. And references to these.
HTML은 균일한 포맷으로서 아래의 예들에 사용된다. 모든 변환들이 필요하다면, 참조된 파일들이 적절히 변환되도록 반복해서 일어난다.HTML is used in the examples below as a uniform format. If all the conversions are needed, it is repeated to ensure that the referenced files are properly converted.
도 4는 정보의 항목을 균일 집합가능 HTML 파일 포맷으로 변환하기 위한 방법의 실시예를 도시한다. 우선, 항목의 포맷이 결정된다(402). 도 3a의 예에서, 포착 제어(322)가 포맷을 제공하였다. 다음으로, 현재 항목의 국부 표현이 HTML에서 생성된다(404). 이 실시예에서, 파일 포맷팅 및 메타 데이터 생성은 포착 항목의 단일 패스에서 함께 행해진다. 도 5a 및 5b에 도시된 바와 같이 메타 데이터의 실시예를 위한 준비에서, 명칭 제안 버퍼 및 키워드 제안 버퍼가 준비된다(418).4 illustrates an embodiment of a method for converting an item of information into a uniformly aggregateable HTML file format. First, the format of the item is determined (402). In the example of FIG. 3A, acquisition control 322 provided the format. Next, a local representation of the current item is generated in the HTML (404). In this embodiment, file formatting and metadata generation are done together in a single pass of the captured item. In preparation for the embodiment of the metadata as shown in FIGS. 5A and 5B, a name suggestion buffer and a keyword suggestion buffer are prepared 418.
항목에 의해 사용된 문자 세트(character set)가 단일의 균일 문자 세트가 아닌 경우에(420), 항목의 문자들은 단일의 균일한 문자 세트로 변환된다(422). 일반적인 문자 세트의 예는 유니코드(Unicode) 또는 공통 유니코드 매핑(common unicode mapping:UTF8)이다. 이 변환은 "집합가능" 변형의 예이다. 이는 재산 문자 세트 포맷들에 기초하여 이전에 비호환성이었던 두 개의 항목들의 집합을 허용한다.If the character set used by the item is not a single uniform character set (420), the characters of the item are converted to a single uniform character set (422). Examples of common character sets are Unicode or common unicode mapping (UTF8). This transformation is an example of a "settable" variant. This allows a set of two items that were previously incompatible based on property character set formats.
다음으로, 다른 외부 파일들에 대한 참조문헌들의 존재가 결정(406)된다. 외부 파일들에 대한 참조문헌들이 존재하면, 참조된 파일들이 다운로드 된다(408). 다운로드된 파일들은 혼환가능 HTML로 만들어진다. 예를 들어, IMG 태그들은 영상들 주변에 위치되고, 앤코 태그들(anchor tags)은 링크들 주변에 위치된다. 또한, 외부 파일에 대해 항목 내의 참조문헌들은 파일들의 국부 복사들을 지시하도록 결정된다(412).Next, the existence of references to other external files is determined 406. If references to external files exist, the referenced files are downloaded 408. The downloaded files are made of interchangeable HTML. For example, IMG tags are located around the images, and anchor tags are located around the links. Also, for external files, references in the item are determined to point to local copies of the files (412).
파일은, 예컨대 상대적으로 위치된 오브젝트들에 대해 절대적으로 위치된 오브젝트들을 변환시킴으로써 집합가능 포맷(414)에 위치된다. 이는 항목으로 하여금 항목이 집합된 디스플레이에서 떨어지는 것과 무관하게 이것의 프리젠테이션 보전을 유지하게 한다. 또한, 항목의 헤더 정보는 항목의 HTML(존재한다면)로부터 제거되고 콘텍스트 데이터베이스에 저장될 수 있다. 헤더 정보에서 프리젠테이션 보전으로 세이브될 수 있는 특성의 예는 항목들의 부분들이 표시되는 정면(front) 또는 색들이다. 도 4의 실시예에서, 균일한 집합가능 포맷의 파일에 대한 포인터들은 다이내믹 집합 시에 차후의 헤더 생성을 위한 항목의 특성을 포함하는 메타 데이터로서 저장된다(416).The file is located in aggregable format 414, for example, by transforming objects that are absolutely positioned relative to objects that are located relatively. This allows the item to maintain its presentation integrity regardless of whether the item falls on the aggregated display. In addition, the header information of the item may be removed from the item's HTML (if present) and stored in the context database. An example of a property that may be saved for presentation integrity in header information is the front or colors in which portions of the items are displayed. In the embodiment of FIG. 4, pointers to files in a uniform collectible format are stored 416 as metadata containing the characteristics of the item for subsequent header generation upon dynamic aggregation.
아래의 예들은 균일 포맷에 대한 포맷팅 항목들을 설명하기 위해 제공된다.The examples below are provided to illustrate formatting items for a uniform format.
포착된 항목은 HTML의 버전에 이미 있을 수 있다. HTML의 국부 리프리젠테이션(representation)은 국부적으로 저장된 HTML로서 사용된 버전에서 생성된다. 일반적으로, HTML은 종종 시청가능 도큐먼트에 삽입될 외부 파일들을 참조한다. 참조된 정보는 다운로드되고 국부 복사들(copies)을 가리키기 위해 분석된다. 다시, 이스테이지(stage)는 모든 참조된 파일들 및 그들의 참조된 파일들을 얻기 위해 반복적으로 관리된다. 일실시예에서, 자바 스크립트(Java Script)는 일관되고 독특한 접두사로 모든 참조문헌들을 관리한다. 이하는 어떻게 구조들이 변환될 수 있는지의 예이다. 프레임들은 pre-HTML 4.0 시스템들 상에서 포착되는 조합된 프레임들을 보기 위해서 IFRAME들, 대안으로는 TABLE들에 대해 전화될 수 있다. 다시, 반복적인 접근법은 프레임들 내에서 프레임들이 받아들일 수 있도록 사용된다. 영상들, 사운드 파일들, 영화들은 국부 또는 원격 영상 파일들에 저장될 수 있다. 파일은 필요하다면 다운로드되고, 참조문헌은 국부 복사로 만들어진다.The captured item may already be in the version of HTML. Local representation of HTML is generated in the version used as locally stored HTML. In general, HTML often refers to external files to be inserted into a viewable document. The referenced information is downloaded and analyzed to point to local copies. Again, the stage is managed repeatedly to get all the referenced files and their referenced files. In one embodiment, Java Script manages all references with a consistent and unique prefix. The following is an example of how structures can be converted. Frames can be called for IFRAMEs, alternatively TABLEs, to see the combined frames captured on pre-HTML 4.0 systems. Again, an iterative approach is used to make frames acceptable within frames. Images, sound files, movies can be stored in local or remote image files. The file is downloaded if necessary, and the references are made as local copies.
참조된 자바 애플릿들(applets)을 포착하기 위해서, 그 애플릿들은 다운로드되고 국부 복사를 참조하기 위해 분석된다. 애플릿의 포착은 이것이 남아있는 HTML 파일의 포착을 통해 개시된다.To capture the referenced Java applets, the applets are downloaded and analyzed to reference a local copy. The capture of the applet is initiated by the capture of the remaining HTML file.
몇몇 포착된 항목들 또는 참조된 파일들은 엔터될 수 있는 매개변수를 갖는다. 예를 들면, 주요한 제 3 부분, 예컨대, 플래쉬 또는 딩월드(ThingWorld)의 사전(dictionary)의 경우에, 삽입된 어플리케이션의 데이터 파일은 매개변수 리스트로부터 참조된 파일들뿐만 아니라 다운로드된다. 국부 복사에 대한 참조문헌이 분석되어야만 하고, 매개변수들은 내용이 정보, 포맷팅 또는 기능(function)의 장애 없이 표시될 수 있도록 변경되어야 한다. 플래쉬는 플래쉬 디벨로퍼(devloper)들이 입력 파일과 같은 임의의 매개변수들에 의존하게 한다. 플래쉬 파일은 다운로드되고, 이 입력 파일도 다운로드되어야 한다. 플래쉬 태그들 내부의 매개변수는 새로 다운로드된 버전을 참조하기 위해 변할 필요가 있다.Some captured items or referenced files have parameters that can be entered. For example, in the case of a major third part, such as a dictionary of Flash or ThingWorld, the data file of the embedded application is downloaded as well as the files referenced from the parameter list. References to local copying must be analyzed and parameters changed so that the content can be displayed without disturbing information, formatting, or function. Flash allows flash developers to rely on arbitrary parameters such as input files. The flash file is downloaded, and this input file must also be downloaded. The parameters inside the flash tags need to be changed to refer to the newly downloaded version.
인식되지 않은 삽입된 어플리케이션의 예에서, 어플리케이션은 다운로드되거나 실행될 수 있다. 발견적 교수법이 그 값들을 분석함으로써 매개변수 리스트를 분석하는데 필요하다. 만약 이것이 "/" 와 "."와 부연(extension)을 갖는다면, 우리는 이것이 다운로드되는 파일에 대한 참조문헌이라고 가정한다. 참조문헌이 국부 복사로 결정되고, 매개변수들이 변경되고, 따라서 내용이 정보, 포맷팅 또는 기능의 장애 없이 표시될 수 있다.In the example of an embedded application that is not recognized, the application can be downloaded or executed. Heuristic teaching is needed to analyze the parameter list by analyzing the values. If it has an extension with "/" and ".", We assume that it is a reference to the file being downloaded. The reference is determined to be a local copy, the parameters are changed, and the content can thus be displayed without disturbing information, formatting or functionality.
HTML 또는 XML 등의 마크업 언어로 변환되는 텍스트 파일들에 대해 URL들을 포착하는 것에 관하여, 이하의 예는 다른 옵션들을 제공한다. URL들은 파일들(HTML)에 대한 간단한 참조문헌들이다. 일실시예에서, 사용자는 두 개의 옵션들로 주어진다. 우선, 참조되는 파일을 포착하는데, 그 포착 과정은 URL보다는 파일 유형들과 같은 데이터를 다루기 위해 간단히 재시작된다.With regard to capturing URLs for text files that are translated into markup languages such as HTML or XML, the following example provides other options. URLs are simple references to files (HTML). In one embodiment, the user is given two options. First, the file being referenced is captured, which is simply restarted to handle data such as file types rather than URLs.
다른 옵션은 북마크(bookmark)로서 URL만을 포착하는 것이다. 이후에 URL은 적절한 HTML/XML 참조문헌 태그들, 예컨대 <A HREF> </A>로 감싸(wrapped)진다.Another option is to only capture URLs as bookmarks. The URL is then wrapped in appropriate HTML / XML reference tags, such as <A HREF> </A>.
리치 텍스트 포맷(RTF)에서 HTML/XML로의 파일 변환에서, 한가지 접근법은 RTF를 분석하고 HTML 태그들을 변환시킴으로써 시작된다.In file conversion from Rich Text Format (RTF) to HTML / XML, one approach begins by analyzing the RTF and converting HTML tags.
특허 이진 포맷들(proprietary binary formats)은 우연히 접하게 되고, 균일 파일 포맷은 HTML/XML이며, 이들 포맷들은 통상 HTML 뷰어(viewer)로 삽입될 수 없다. 파일은 HTML 링크로서 다뤄지고, 파일에 대한 참조문헌은 <A HREF> </A> 태그들 내에서 감싸진다.Patent binary formats are encountered by chance, the uniform file format is HTML / XML, and these formats cannot normally be inserted into an HTML viewer. The file is treated as an HTML link, and references to the file are wrapped in <A HREF> </A> tags.
국부 이진 파일이 HTML/XML에서 캡슐화되면, 파일 유형은 파일 헤더 정보,파일 접미사, 및 동작 시스템 등록 접미사를 고려하여 분석된다. 이후에 산업 표준 접미사에 기초하여, 파일은 영상을 위한 "IMG" 태그, 사운드 파일을 위한 "SOUND" 태그, 또는 인식된 HTML/XML 플러그-인을 위한 "EMBED" 또는 "OBJECT" 태그 등에 제한되지 않고 적절한 HTML 태그에서 감싸진다.If a local binary file is encapsulated in HTML / XML, the file type is analyzed taking into account file header information, file suffixes, and operating system registration suffixes. Based on industry standard suffixes later, the file is not limited to "IMG" tags for video, "SOUND" tags for sound files, or "EMBED" or "OBJECT" tags for recognized HTML / XML plug-ins. Wrapped in the appropriate HTML tag.
균일 파일 포매터가 HTML/XML로 변환될 원격 이진 파일에 대한 URL와 우연히 접하게 되면, 원격 파일은 국부 이진 파일의 경우에서와 같이 다운로드되고 관리될 수 있다.If the uniform file formatter encounters a URL to a remote binary file to be converted to HTML / XML, the remote file can be downloaded and managed as in the case of a local binary file.
HTML로 변환될 "자기-관리된" 삽입된 오브젝트들에 대한 참조문헌들은 동작 시스템에 대한 문의에 의해 결정되는 바와 같이 적절한 매개변수들로 "OBJECT" 태그에서 오브젝트를 감싸도록 요청할 수 있다. 만약 동작 시스템으로부터 달성될 수 없다면, 이후에 삽입될 수 있는 오브젝트의 소정의 사전이 고려된다.References to "self-managed" inserted objects to be converted to HTML may request to wrap the object in an "OBJECT" tag with appropriate parameters as determined by a query to the operating system. If it cannot be achieved from the operating system, certain dictionaries of objects that can be inserted later are considered.
ASCⅡ 텍스트를 HTML/XML로 변환하는데 있어, 텍스트는 변환 필터를 따라 통과된다. 포맷팅은 그 텍스트의 보전(integrity)을 유지하도록 행해진다. 예를 들면, 스페이스들은 " "로 변환되고, CRLF들은 "<BR>"로 변환되고, "."는 ">"로 변환되고, "<"는 "<"로 변환된다.In converting ASCII text into HTML / XML, the text is passed through a conversion filter. Formatting is done to maintain the integrity of the text. For example, spaces are converted to "& nbsp", CRLFs are converted to "<BR>", "." Is converted to "& gt", and "<" is converted to "& lt".
HTML은 택스트의 내용이 트리거하거나 위반(violate)할 수 있는 규칙들과 제한들을 갖는다. 텍스트는 HTML로 보여질 때 해석기(interpreter)(웹 브라우저와 같음)가 포착된 내용을 표시하는 HTML를 출력하는 변환 필터를 따라 통과된다.HTML has rules and restrictions that the contents of the text can trigger or violate. When text is viewed as HTML, an interpreter (like a web browser) is passed along a transform filter that outputs HTML that displays the captured content.
도 5a 및 5b는 메타 데이터 생성기에 의해 행해질 수 있는 것으로서 항목에 대한 메타 데이터를 생성하는 과정의 일실시예의 전체 흐름도를 도시한다. 메타 데이터는 사용자가 포착하는 모든 항목과 관련되고, 도 2d에 도시된 바와 같이, 이 메타 데이터는 사용자에 의해 보여지거나 변경될 수 있다. 본 발명의 한 양상에서, 생성된 메타 데이터는 각 항목에 대해 명치, 카테고리, 키워드들, 소스 및 소스 설명을 포함한다.5A and 5B show an overall flow diagram of one embodiment of a process for generating metadata for an item as may be done by the metadata generator. The metadata is associated with all items that the user captures, and as shown in FIG. 2D, this metadata may be viewed or changed by the user. In one aspect of the invention, the generated metadata includes name, category, keywords, source and source description for each item.
명칭 제안 버퍼 및 키워드 제안 버퍼가 준비되어 있다(418). 포착 항목의 내용은 포맷팅 태그들(볼드(bold), 이탤릭, 위치 등)이 제거된 정보를 의미하는 "적절한" 정보를 제공하기 위해 필터링되었다. 적절한 정보는 버터들에 저장되었다. 적절한 정보의 예는 항목의 제안된 명칭에 대해 "적절한" 것으로 여겨지고 이 예에서 보유되는 HTML의 "ALT" 태그 등의 임의 설명 태그들을 포함한다. 이 버퍼는 프로덕트의 포착 수행성능에 부정적인 영향을 미치지 않기 위해 특정 크기, 예컨대 5K로 제한될 수 있다.A name suggestion buffer and a keyword suggestion buffer are prepared (418). The content of the capture item has been filtered to provide "appropriate" information, meaning that the formatting tags (bold, italic, position, etc.) have been removed. Appropriate information was stored in butters. Examples of suitable information include any descriptive tags, such as the "ALT" tag of HTML that is considered "appropriate" for the proposed name of the item and is retained in this example. This buffer may be limited to a certain size, such as 5K, in order not to negatively affect the capture performance of the product.
메타 데이터 생성기는 제 1의 N의 제안된 명칭을 만들고, 예컨대 파일 시스템에 의해 결정될 수 있는 미리 선택된 수는 스페이스들을 포함하는 합산된 길이가 문자들(510)의 소정 수보다 작은, 예컨대 128보다 작은 전체 워드들을 제한한다. 일단 제안된 명칭이 결정되면, 이것은 부적절하게 가까운 구성(construct)에 대해 검사된다(512). 만약 제안된 명칭이 부적절하게 가까운 구성으로 종료하면, 그 명칭의 마지막 워드는 가까운 구성이 더 이상 부적절한 것이 아닐 때까지 반복해서 제거된다(514). 이 경우에, 제안된 명칭은 항목의 명칭으로서 선택된다(516). 아래는 부적절한 구성들의 예들이다.The metadata generator makes the proposed name of the first N, for example the preselected number that can be determined by the file system is such that the combined length including the spaces is less than a predetermined number of characters 510, eg less than 128. Limit the whole words. Once the proposed name is determined, it is checked for an improperly close construct (512). If the proposed name ends with an improperly close configuration, the last word of that name is removed 514 repeatedly until the close configuration is no longer inappropriate. In this case, the proposed name is selected as the name of the item (516). Below are examples of inappropriate configurations.
"the", "this", "and", "an", " that", "for", "to", "or", "nor","though", "although", "if", "who", "which", "whoever", "what", "whose", "these", "those", "whether", "but", "so", "yes", "as", "because", "until", "when", "whenever", "even", "rather", "about", "at", "against", "by", "during", "except", "from", "in", "of", "like", "till", "upon", "with", "while", "since", "&", "...", "|", ":", ";", ",", "/", "\", "-", "--", "=", "+""the", "this", "and", "an", "that", "for", "to", "or", "nor", "though", "although", "if", "who "," which "," whoever "," what "," whose "," these "," those "," whether "," but "," so "," yes "," as "," because ", "until", "when", "whenever", "even", "rather", "about", "at", "against", "by", "during", "except", "from", "in "," of "," like "," till "," upon "," with "," while "," since "," & "," ... "," | ",": ","; ",", "," / "," \ ","-","-"," = "," + "
당업자에게 명백한 바와 같이, 다른 워드들이 이 리스트에서 제거 및 부가를 위해 선택될 수 있다.As will be apparent to those skilled in the art, other words may be selected for removal and addition from this list.
도 2a에 도시된 실시예에서, 항목들이 포착될 때, 카테고리는 "Business" 또는 "Travel"과 같은 것으로 할당된다. 우선, 항목은 카테고리와 함께 콜렉션에 위치되고, 이 콜렉션은 만약 하나가 이미 사용자에 의해 아직까지 선택되지 않으면 항목이 자동적으로 그의 카테고리를 물려받는 "적절한" 콘텍스트 콜렉션이다. 도 5b는 항목의 카테고리가 관련된 제 1의 "적절한" 콘텍스트 콜렉션에 기초하여 할당됨을 도시한다(518).In the embodiment shown in FIG. 2A, when items are captured, a category is assigned to something like "Business" or "Travel". First, an item is placed in a collection along with a category, which is an "appropriate" context collection in which the item automatically inherits its category if one is not already selected by the user yet. 5B shows that a category of items is assigned based on the first " appropriate " context collection associated (518).
도 5a 및 5b의 실시예에서, 항목의 소스는 데이터 전달 중에 소스 어플리케이션으로부터 수신된 정보에 기초한 항목과 관련된다(520).5A and 5B, the source of the item is associated with the item based on information received from the source application during data delivery (520).
일 실시예에서 항목의 메타 데이터 부분은 설명이다. 그 설명은 또한 적절한 정보의 명칭 제안 버퍼로부터 만들어질 수 있다. 예를 들면, 균일 파일 포맷이 분석가능 마크업 언어(522)로 되어 있고, 제목 태그(title tag)(524)가 존재하면, 항목의 설명 또는 소스 설명은 제목 태그(526)에서의 내용으로 설정될 수 있다.항목(522,524)과 관련된 제목 태그가 없으면, 이후에 항목의 설명은 이것의 소스로 설정될 수 있다(528).In one embodiment, the metadata portion of the item is a description. The description may also be made from a name suggestion buffer of appropriate information. For example, if the uniform file format is in a resolvable markup language 522 and a title tag 524 is present, the description of the item or the source description is set to the content in the title tag 526. If there is no title tag associated with items 522 and 524, then the description of the item may be set to its source (528).
다음으로, 키워들은 항목과 관련된다. 도 5a 및 5b의 실시예에서, 적절한 정보는 명칭 제안 버퍼에만 저장되는 것이 아니라, 키워드 제안 버퍼에도 저장된다(506). 이 실시예에서, 보다 큰 키워드 버퍼(50K)가 요구된다.Next, the keywords are associated with the item. 5A and 5B, the appropriate information is not only stored in the name suggestion buffer, but also in the keyword suggestion buffer (506). In this embodiment, a larger keyword buffer 50K is required.
키워드들을 결정하는데 있어, 메타 데이터 생성기는 키워드들의 하나 이상의 아래의 세트들로부터 키워드들 상에 그려진다. 제 1 세트는 콘텍스트 키워드들로서 설명된 콘텍스트 특정 세트라기 보다는 모든 사용자 키워드들의 세트를 참조하는 사용자 키워드들(User Keywords)이다. 도 2d의 예로 도시된 바와 같이, 사용자는 항목과 관련될 키워드들을 엔터하고 항목에 대해 제안된 키워드들을 취할 수 있다. 이들 키워드들은 사용자 키워드들의 세트를 형성한다.In determining the keywords, the metadata generator is drawn on the keywords from one or more below sets of keywords. The first set is User Keywords that refer to the set of all user keywords rather than the context specific set described as context keywords. As shown in the example of FIG. 2D, the user may enter keywords to be associated with the item and take suggested keywords for the item. These keywords form a set of user keywords.
키워드들의 또 다른 세트는 사용자들이 키워드들의 그들 자신의 유용한 데이터베이스를 설치하기 전에 특히 도움이 될 수 있는 시트 키워드들(358)의 데이터베이스를 포함하는 시트 키워드들(Seed Keywords)의 세트이다. 이들 키워드들은 스마트한 키워드 제안을 할 수 있도록 카테고리에 의해 그룹지어 진다.Another set of keywords is a set of Seed Keywords that includes a database of sheet keywords 358 that can be particularly helpful before users set up their own useful database of keywords. These keywords are grouped by category to allow smart keyword suggestions.
또한 콘텍스트 키워드들의 세트가 있다. 콘텍스트 키워드들은 계층적인 콜렉션의 상부로부터 항목으로의 항목의 경로에서 항목들과 콜렉션들과 관련된 이들 키워드들이다. 그 경로는 콜렉션들의 많은 레벨을 가지거나 레벨들을 갖지 않는다. 검색될 레벨들의 수(예컨대 3 레벨들)에 대한 제한들 및 키워드들의 최소 및 최대 수가 요구될 수 있다.There is also a set of context keywords. Context keywords are those keywords associated with items and collections in the path of the item from the top of the hierarchical collection to the item. The path has many levels of collections or no levels. Limits on the number of levels to be searched (eg 3 levels) and minimum and maximum number of keywords may be required.
콘텍스트 키워드들의 세트의 예는,An example of a set of context keywords is
1. 계층적 콜렉션들의 상부로부터의 경로에서 콜렉션, 예컨대 지정 콜렉션 예컨대 도 2a의 "PTO" 콜렉션 대한 예컨대 도 2a의 "모든 콜렉션(All Collections)"에 할당된 모든 키워드들.1. All keywords assigned to a collection in the path from the top of the hierarchical collections, such as "All Collections" in FIG. 2A, for example a designated collection such as the "PTO" collection in FIG.
2. 지정 콜렉션에서 항목들에 관련된 모든 키워드들. 도 2a에서, 이는 "미국 지적 재산 심포지엄(Intellectual Property Symposium of the Americas"" 및 "몇몇 잘 알려진 미국 상표들(Some Well-Known U.S. Trademarks)"과 관련된 키워드들을 포함한다.2. All keywords related to items in the specified collection. In FIG. 2A, this includes keywords related to "Intellectual Property Symposium of the Americas" and "Some Well-Known U.S. Trademarks."
3. 콜렉션 경로에서 콜렉션들 내의 항목들과 관련된 키워드들의 결합이다.3. A combination of keywords related to items in collections in the collection path.
도 5b는 키워드들의 생성을 포함하는 메타 데이터의 생성을 계속한다. 이 특정 예에서, 항목의 포착 지정이 이것에 할당된 카테고리를 갖는지가 우선 결정된다(530). 만약 결정을 하면, 사용자의 콘텍스트 데이터베이스, 예컨대 웨베이스 내의 오브젝트(Object:380), 관계(Relationship:382), 태그(386), 태그 관계(384) 테이블들의 SQU 문의가 앞의 세 개의 세트들의 결합인 세트를 만족시키는 모든 키워드들을 포착하기 위해 만들어진다. 그 문의로부터의 결과는 특정 항목에 대한 콘텍스트 키워들 세트이다.5B continues the generation of metadata including the generation of keywords. In this particular example, it is first determined whether the capture specification of the item has a category assigned to it (530). If a decision is made, the SQU query of the user's context database, e.g., Object (380), Relationship (382), Tag (386), Tag Relationship (384) tables in the database is a combination of the first three sets. It is made to capture all keywords that satisfy the inset. The result from the query is a set of context keywords for a particular item.
더욱이, 설명 콜렉션이 카테고리를 가지며, 카테고리와 관련된 시드 키워들은 또한 매치들을 위해 분석될 수 있다.Moreover, the description collection has a category, and seed keywords associated with the category can also be analyzed for matches.
도시된 실시예에서, 찾아진 키워들의 최소 수 예컨대 3인 키워드 임계값은 항목에 대해 제안될 키워들의 최대 수를 결정하는 매개변수인 최대 키워드 제안들로도 사용된다.In the illustrated embodiment, the minimum number of keywords found, such as a keyword threshold of 3, is also used as the maximum keyword suggestions, which is a parameter that determines the maximum number of keywords to be proposed for the item.
메타 데이터 생성기는 포착된 내용에 대해 각 세트를 매치하는 지정 콜렉션의 카테고리와 관련된 시트 워드들 및 콘텍스트 키워드 세트를 통해 루프(loop)한다(532). 루프는 키워드 임계값 및 최대 키워드 제안들에 의해 경계지어진다(532). 또한, 보다 앞의 세트(들)에 대해 만들어진 매치들은 차후의 세트들로부터 매치들에 의해 결코 교체되지 않는다. 키워드 임계값은 모든 이들 키워들를 통해 이동 한 후 만족되지 않으며(536), 이후에 매칭을 위한 가능한 키워들의 선택은 지정 콜렉션이 카테고리를 갖지 않는 경우에 넓어진다. 반면, 키워드들은 사용자의 콘텍스트 데이터베이스에서 메타 데이터에 의해 트랙되는 것과 같이 항목에 할당된다.The metadata generator loops 532 through the set of sheet words and context keywords associated with the category of the specified collection that matches each set for captured content. The loop is bounded by keyword thresholds and maximum keyword suggestions (532). Also, matches made for the earlier set (s) are never replaced by matches from later sets. The keyword threshold is not satisfied after moving through all these keywords (536), and then the selection of possible keywords for matching is broadened if the specified collection does not have a category. Keywords, on the other hand, are assigned to an item as tracked by metadata in the user's context database.
이 항목의 지정 콜렉션이 이것과 관련된 카테고리를 갖지 않으면, 키워드 세트들은 콘텍스트 키워드들, 모든 사용자 키워드들 및 모든 시트 키워드들을 포함한다. 다시, 메타 데이터 생성기는 포착된 내용을 대한 각 세트를 매치시키는 콘텍스트 키워드 세트, 엔터된 모든 사용자 키워드들, 및 모든 시드 키워드들 통해 루프한다(534). 얻어진 키워들은 이후에 사용자의 웹베이스(538)에 할당된다. 도 3b의 실시예에서, 메타 데이터 생성기는 웹베이스 내의 테이블들에 의해 정의되는 것과 같은 사용자 웹베이스와 함께 이들 키워드들을 통합하는 웹베이스 관리기로 얻어진 키워드들을 전달한다.If the specified collection of this item does not have a category associated with it, the keyword sets include context keywords, all user keywords, and all sheet keywords. Again, the metadata generator loops 534 through a set of context keywords, all entered user keywords, and all seed keywords that match each set to captured content. The keywords obtained are then assigned to the user's web base 538. In the embodiment of FIG. 3B, the metadata generator delivers the keywords obtained with a web site manager incorporating these keywords with a user web base as defined by tables in the web base.
도 6a는 항목 액세스 시스템, 항목을 저장하기 위한 파일 시스템 계층 및 이것이 참조하는 오브젝트들의 예를 도시한다. 이 예에서, 상부 디렉토리는 설치 디렉토리(Installation Directory:602)이다. 다음의 낮은 레벨은 항목 HTML파일들(602), 생성된 표시 파일들(612), 및 항목 HTML 파일과 동일한 레벨인 항목 관련 디렉토리(608)를 포함하는 데이터 디렉토리(604)이다. 항목 관련 디렉토리(608)는 관련된 항목 파일이 참조하는 오브젝트들을 의미하는 디렉토리(610)와 관련된 파일들이다.6A shows an example of an item access system, a file system hierarchy for storing items, and the objects that it references. In this example, the top directory is the Installation Directory (602). The next lower level is a data directory 604 that includes item HTML files 602, generated display files 612, and an item related directory 608 that is at the same level as the item HTML file. The item related directory 608 is files related to the directory 610 that mean the objects referenced by the related item file.
도 6b는 도 6a의 파일 시스템 계층을 이용하는 외부 파일들을 참조하는 HTML에 포맷된 세 개의 항목들의 예를 도시한다.FIG. 6B shows an example of three items formatted in HTML that refer to external files using the file system hierarchy of FIG. 6A.
도 6b에서, 메인 디렉토리(614)는 파일 시스템 계층에서 가장 상부의 디렉토리이다. 제 1 항목(618)은 웹 사이트로부터 포착되었으며 데이터 디렉토리(616)에서 123.htm(618)로서 파일 시스템에 기록되었다. 참조된 파일은 또한 파일 시스템 계층에서 123 htm과 동일한 레벨인 123(624)라고 불리는 디렉토리에 다운로드된다. HTML이 이 포착을 위해 처리되었을 때, 적절한 참조문헌들은 참조문헌들로부터 월드 와이드 웹(World Wide Web)으로 123 디렉토리(624)로 변경된다.In FIG. 6B, main directory 614 is the topmost directory in the file system hierarchy. The first item 618 was captured from the web site and recorded in the file system as 123.htm 618 in the data directory 616. The referenced file is also downloaded to a directory called 123 624, which is at the same level as 123 htm in the file system hierarchy. When HTML is processed for this capture, the appropriate references are changed from the references to the 123 directory 624 from the references to the World Wide Web.
유사하게, 제 2 포착 항목은 또 다른 웹 페이지로부터 포착되고 234.htm(620)으로서 데이터 디렉토리(616) 하에서 저장되며, 234에 대한 참조된 파일들은 다운로드되고 파일 시스템 계층에서 234.htm과 동일한 레벨인 디렉토리234(630)에 세이브된다. 파일 마커(Maker)가 이 항목을 처리한 때, 적절한 참조문헌들은 참조문헌들로부터 월드 와이드 웹으로 234 디렉토리(624)로 변경된다.Similarly, the second capture item is captured from another web page and stored under data directory 616 as 234.htm 620, the referenced files for 234 are downloaded and at the same level as 234.htm in the file system hierarchy. In directory 234 630. When the file marker Maker processes this item, the appropriate references are changed from the references to the 234 directory 624 from the references to the world wide web.
제 3 항목은 파일 시스템으로부터의 복사로서 포착된 텍스트 파일이다. 이 실시예에서, 균일 파일 포맷은 HTML이고 이 텍스트 파일은 HTML로 변환되었다.HTML 파일은 345.htm(622)로서 데이터 디렉토리(616) 하에서 세이브되고, 텍스트 파일(640)은 파일 시스템 계층에서 345.htm(622)과 동일한 레벨인 345(638)이라 불리는 디렉토리에 저장된다.The third item is a text file captured as a copy from the file system. In this embodiment, the uniform file format is HTML and this text file has been converted to HTML. The HTML file is saved under the data directory 616 as 345.htm 622, and the text file 640 in the file system hierarchy. It is stored in a directory called 345 (638) at the same level as .htm (622).
예컨대 123.htm를 보기 위해서, 시스템은 표시_페이지1.htm(642)를 생성한다. 이 페이지는 <HTML> 및 <BODY>를 포함하는 몇몇 표준 HTML 태그들, 및 전체 123.htm에 의해 접미사로 붙여진 외관 선호(appearance preferences) 및 메타 데이터를 표시하는 몇몇 생성된 HTML를 포함한다. 이 심플하고 블라인드한 연결(simple blind concatenation)은 두 가지 이유에 대해 가능하다. 우선, 시스템이 이들 개별 HTML 파일들을 만들 때, 이것은 그 파일들이 어떤 도큐먼트 글로벌 정보를 포함하고 있지 않는 것으로 만들어, 파일들은 끝없이 서로 배열될 수 있다. 시스템은 그것들 모드가 적절한 서브디렉토리들을 참조하도록 그것들을 생성하며, 관련된 파일 참조문헌을 결과적으로 다시 처리할 필요가 없는데, 이는 모든 항목들 및 생성된 파일들이 동일한 디렉토리 레벨에 있기 때문이다.For example, to view 123.htm, the system creates display_page 1.htm 642. This page contains some standard HTML tags, including <HTML> and <BODY>, and some generated HTML that displays appearance preferences and metadata suffixed by the entire 123.htm. This simple blind concatenation is possible for two reasons. First, when the system creates these individual HTML files, this makes them do not contain any document global information, so that the files can be arranged endlessly. The system creates them so that their modes refer to the appropriate subdirectories, and there is no need to reprocess related file references as a result, because all entries and generated files are at the same directory level.
도 7a는 사용자의 콘텍스트 데이터베이스에 기초하여 콘텍스트 써머리를 만들기 위한 방법의 실시예의 흐름도이다. 메타 데이터의 사용은 대상 광고 및 검색을 향상시키토록 정보 콘텍스트를 제공한다. 이 방법은 프로세서 상에서 실행되는 컴퓨터 지시들로서 실시되고, 컴퓨터 이용가능 매체에 저장될 수 있다.7A is a flowchart of an embodiment of a method for creating a context summary based on a user's context database. The use of metadata provides an information context to enhance targeted advertising and search. The method may be embodied as computer instructions executing on a processor and may be stored on a computer usable medium.
본 발명의 한 양상에서, 콘텍스트 써머라이저(332)는 콘텍스트 데이터베이스 밖의 정보의 "유용한(usable)" 조각들을 증류하고(distill) 임의의 주어진 순간에 사용자가 흥미있어 하는 간명한 써머리를 만든다. 이 실시예에 대해, 데이터베이스써머라이저는 콘텍스트 데이터베이스에 정의된 관계들 및 각 항목과 관련된 메타 데이터를 분석하고, 사용자가 흥미있어 하는 웨이트되고 키워드 기반의 써머리를 생성할 수 있다. 이 써머라이제이션(Summarization) 방법은 컴퓨터에 의해 효과적으로 분석될 수 있는 포맷으로 사용자가 흥미있어 하는 다차원 개요(multidimensional synopsis)를 효과적으로 제공한다.In one aspect of the invention, the context summerizer 332 distills "usable" pieces of information out of the context database and creates a concise summary of interest to the user at any given moment. For this embodiment, the database summerizer can analyze the relationships defined in the context database and the metadata associated with each item, and generate a weighted, keyword-based summary of interest to the user. This summarization method effectively provides a multidimensional synopsis of interest to the user in a format that can be effectively analyzed by a computer.
도 7a의 실시예에서, 메타 데이터, 특히 각 항목과 관련된 명치 키워드들이 분석된다. 각 항목은 오브젝트 테이블(380)에서 엔트리에 의해 표현되고, 키워드는 태그 테이블(392)에서 엔트리에 의해 표현된다. 각 항목 엔트리는 태그관계 테이블(392)에 정의된 바와 같이 0 이상의 키워들을 갖는다. 각 항목은 관계 테이블(382)에 정의된 바와 같이 하나 이상의 콜렉션들에 속한다. 각 콜렉션은 관계 테이블(380)에 정의된 바와 같이 하나 이상의 부모 콜렉션들을 갖는다.In the embodiment of FIG. 7A, metadata, in particular nominal keywords associated with each item, are analyzed. Each item is represented by an entry in the object table 380 and a keyword is represented by an entry in the tag table 392. Each item entry has zero or more keywords as defined in tag relationship table 392. Each item belongs to one or more collections as defined in relationship table 382. Each collection has one or more parent collections as defined in relationship table 380.
도시된 실시예에서, 콘텍스트 써머라이저는 정보 또는 시드들의 두 가지 유형들의 입력에 기초하여 콘텍스트 써머리를 만들며, 제 1은 사용자 클릭에 의해 나타내어질 수 있는 것으로서, 항목 또는 콜렉션의 선택이고, 제 2는 사용에 의해 엔터된 하나 이상의 워드들이다. 도시된 예에서, 시드가 제2의 유형이면, 그 방법은 도 7a에 설명된 바와 같이 항목 또는 콜렉션의 선택을 위해 사용된 행동들(actions)을 포함한다.In the illustrated embodiment, the context summerizer creates a context summary based on two types of input of information or seeds, the first being a selection of an item or a collection, which can be represented by a user click, and the second being One or more words entered by use. In the example shown, if the seed is of the second type, the method includes the actions used for the selection of the item or collection as described in FIG. 7A.
도 7a의 실시예에서, 항목 또는 콜렉션의 선택을 나타내는 사용자 입력이 수신될 때, 현재의 가변 레벨은 사용자에 의해 선택된 항목 또는 콜렉션의 레벨에 설정된다. 다음으로, 현재 레벨의 항목 또는 콜렉션과 관련된 키워드들이얻어진다(704). 이 레벨에서 모든 키워드들은 루트(root) 레벨에 가장 가까운 키워드들을 우선시키는 [100/(level - 0.05)]에 따라 웨이트된다(706).In the embodiment of FIG. 7A, when a user input indicating selection of an item or collection is received, the current variable level is set at the level of the item or collection selected by the user. Next, keywords related to the item or collection of the current level are obtained (704). At this level all keywords are weighted according to [100 / (level−0.05)] which prioritizes the keywords closest to the root level (706).
이 실시예에서, 태그 관계(384)를 판독함으로써, 키워드가 현재 개방 트리에서 항목 또는 콜렉션과 관련되는지의 여부에 대해 결정이 행해진다(708). 현재 개방 트리는 상부 레벨 콜렉션, 예컨대 도 2a의 모든 콜렉션들(All Collections)에서 항목 또는 콜렉션의 루트 레벨로의 파일 시스템 계층에서의 경로이다. 예를 들면, 사용자가 항목 "미국의 지적 재산 심포지엄"(228)을 클릭하면, 현재 개방 트리는 "미국의 지적 재산 심포지엄"(228), PTO 콜렉션(226), 특허 콜렉션(224), 및 모든 콜렉션(All Collections) 콜렉션(223)을 포함한다. 키워드가 현재 개방 트리 내의 항목 또는 콜렉션과 관련되면, 콘텍스트 필터는 이 키워드에 부가적인 웨이트를 제공하기 위해 키워드(710)에 이용된다. 콘텍스트 필터는 현재의 활동 경로에서 콜렉션들 및 항목들에 부가적인 웨이팅을 더한다. 이는 본 발명으로 하여금 사용자의 관심사를 아는 것뿐만 아니라 임의의 주어진 순간에 사용자의 특정 관심사를 알 수 있게 한다.In this embodiment, by reading the tag relationship 384, a determination is made whether the keyword is associated with an item or collection in the current open tree (708). The current open tree is a path in the file system hierarchy from the top level collection, such as All Collections in FIG. 2A to the root level of an item or collection. For example, if a user clicks on the item "US Intellectual Property Symposium" 228, the current open tree is "US Intellectual Property Symposium" 228, PTO Collection 226, Patent Collection 224, and All Collections. (All Collections) includes a collection 223. If a keyword is associated with an item or collection in the current open tree, a context filter is used in keyword 710 to provide additional weight to this keyword. The context filter adds additional weighting to collections and items in the current activity path. This allows the present invention not only to know the user's interests, but also to know the specific interests of the user at any given moment.
각 키워드가 현재 레벨(711)에서 웨이트된 후, 항목 또는 콜렉션(712)의 명칭이 그것(712)에 이용된 보다 낮은 웨이트를 갖는다. 예를 들면, 명칭의 웨이트는 [75/(level)2 - 0.05)]에 의해 결정된다. 만약 항목 또는 콜렉션이 현재 개방 트리(714)에 있다고 결정되면, 콘텍스트 필터는 또한 명칭(716)에 이용된다. 만약 파일 계층(718)에서 또 다른 레벨 업이 존재하면, 현재 레벨은 현재 레벨이 다음 레벨 업까지 설정되고(720) 가로지르기(traverse) 위해 하나 이상의 레벨들이 존재할 때까지 과정이 반복된다(722).After each keyword is weighted at the current level 711, the name of the item or collection 712 has the lower weight used for it 712. For example, the weight of the name is determined by [75 / (level) 2-0.05)]. If it is determined that the item or collection is currently in the open tree 714, the context filter is also used for the name 716. If there is another level up in the file hierarchy 718, the current level is set until the current level is set up to the next level up (720) and the process is repeated until there are one or more levels to traverse (722). .
명칭/키워드 웨이팅은 누적(cumulative)적이고, 만약 동일한 키워드가 계층에서 세 개의 항목들을 정의하기 위해 사용되었다면, 그들 각각의 웨이팅은 서로 더해진다(719).Name / keyword weightings are cumulative, and if the same keyword is used to define three items in the hierarchy, their respective weightings are added together (719).
도 7b는 도 7a의 실시예를 이용하여 콘텍스트 써머리를 만들는 예를 도시한다. 트리의 레벨들은 루트 레벨(748)에 대해 1, 부모 레벨(746)에 대해 2, 조부모 레벨(grandparent level:744)에 대해 3, 레벨 5까지(740) 증가하는 순서로 할당된다. 예는 [100/level - 0.05]에 의해 정의된 키워드 웨이팅을 이용한다. 키워드의 웨이트는 루트 레벨(748)에서 가장 높고 트리에서 위로 올라가는 각 레벨에 대해 다소 증가한다. 0.05는 레벨2(746)에서 두 배 높은 키워드가 레벨1(748)에서 키워드의 웨티트보다 조금 낮은 웨이트로 주어지도록 빼진다(subtract).이 인수(factor)가 존재하지 않으면, 이 경우에서 순서(ordering)는 서로 더해진 두 개의 키워드들이 정확히 레벨1: 100/1=100에서 단일의 키워드와 동일하게 되는 (100/2)+(100/2)=100호 웨이트하므로 제멋대로 된다(arbitrary). 0.05의 인수를 사용하면, 이들 웨이트들은 루트 레벨 키워드에 대해 10/0.95=105.3 및 레벨2에서 두 배 높은 키워드에 대해 (100/1.95)+(100/1.95)=102.6으로 변한다.FIG. 7B illustrates an example of creating a context summary using the embodiment of FIG. 7A. The levels of the tree are assigned in increasing order of 1 for the root level 748, 2 for the parent level 746, 3 for the grandparent level 744, and 740 up to level 5. The example uses keyword weighting defined by [100 / level-0.05]. The weight of the keyword is highest at the root level 748 and increases somewhat for each level going up in the tree. 0.05 is subtracted so that a keyword that is twice as high at level 2 746 is given a weight that is slightly lower than the wett of the keyword at level 1 748. If this factor is not present, order in this case (ordering) is arbitrarily because the two keywords added together are weighted at (100/2) + (100/2) = 100, which is exactly the same as a single keyword at level 1: 100/1 = 100. Using a factor of 0.05, these weights change to 10 / 0.95 = 105.3 for the root level keyword and (100 / 1.95) + (100 / 1.95) = 102.6 for the keyword that is twice as high at level 2.
도 7a에 나타내어진 바와 같이, 제목(title)은 보다 적은 웨이트로 주어지고 이 예에서 제목 웨이트는 [75/(level2)-0.05]로서 정의된다. 제목의 웨이트는 루트 레벨(748)에서 가장 높지만, 동일한 레벨에서 발견된 키워드보다는 낮다. 또한, 제목의 웨이트는 트리에서 위로 이동함에 따라 빠르게 감소한다. 0.05 인수가 동일한이유를 위해 상기에서와 같이 존재함을 주지하자.As shown in FIG. 7A, a title is given with less weight and in this example the title weight is defined as [75 / (level 2 ) -0.05]. The weight of the title is highest at the root level 748, but lower than keywords found at the same level. Also, the title's weight decreases rapidly as it moves up in the tree. Note that the 0.05 factor exists as above for the same reason.
이 예에서 콘텍스트 필터는 부가적인 곱셈 인수로서 삽입된다. 만약 산정되는 항목 또는 콜렉션이 별표로 나타내어진 것과 같이 현재 개방 트리에 있다면, 웨이팅은 2.5만큼 곱해질 것이다. 이 인수는 현재 개방 트리에서의 레벨4에서 항목 또는 콜렉션으로부터 키워드/제목이 현재 개방 트리에 있지 않은 레벨2에서 또 다른 항목 또는 콜렉션으로부터 더 웨이트하도록 선택되었다.In this example, the context filter is inserted as an additional multiplication factor. If the item or collection being estimated is in the current open tree as indicated by an asterisk, the weight will be multiplied by 2.5. This argument was chosen so that the keyword / title from an item or collection at level 4 in the current open tree is further weighted from another item or collection at level 2 where the current open tree is not.
현재 개방 트리 내의 워드들(750, 752, 754, 756, 760)이 제 5 레벨까지 비현재(non-current) 경로 상의 워드들보다 크게 웨이트됨을 주지하자. 이는 2.5의 인수가 다른 것을 통해 어떤 키워들을 우선시키는 것이다. "3륜 자전거들(tricycles)"(760)은 현재 개방 트리 경로에 있다 할지라도 "트럭(truck)"(758)보다 낮게 웨이트되어 있음을 주지하자.Note that the words 750, 752, 754, 756, 760 in the current open tree are weighted larger than the words on the non-current path to the fifth level. This means that arguments of 2.5 take precedence over some keywords over others. Note that "tricycles" 760 are weighted lower than "truck" 758 even though they are currently in an open tree path.
워드/구(phrase)의 웨이트들은 위의 예에서 "타이어들(tires)"(752)의 웨이트에 의해 도시된 바와 같이 현재 경로에 이미 존재한다면 더해진다.The weights of the word / phrase are added if they already exist in the current path as shown by the weight of " tires " 752 in the above example.
도 8a는 본 발명에 따른 콘텍스트 써머리를 이용하는 대상 광고를 선택하는 방법의 실시예의 흐름도이다. 콘텍스트 써머리와 카테고리는 사용자에 의해 현재 선택된 항목 또는 콜렉션에 대해 수신된다(802). 콘텍스트 써머라이저(332)의 일실시예에서, 카테고리에는 콘텍스트 써머리 키워들의 우선된 리스트가 포함된다. 키워드가 어떻게 우선순서될 수 있는지의 일 예가 도 7a 및 7b에 설명되는 웨이트된 방법을 이용하는 것이다.8A is a flowchart of an embodiment of a method of selecting a target advertisement using a context summary in accordance with the present invention. The context summary and category are received 802 for the item or collection currently selected by the user. In one embodiment of the context summerizer 332, the category includes a prioritized list of context summary keywords. One example of how keywords can be prioritized is to use the weighted method described in FIGS. 7A and 7B.
이 실시예에서, 가장 높은 우선순위를 갖는 콘텍스트 써머리 키워드는 현재키워드로서 선택된다(804). 현재 키워드는 프로모션들(promotions)과 관련된 키워드들과 비교된다(806). 매치(808)가 일어나면, HTML 도큐먼트는 도 2a 및 2b의 광고 패널(Advertising Panel:206)에서와 같은, 사용자에게 표시하기 위한 매칭 키워드들의 프로모션들의 일부를 삽입하는 것을 생성한다(816).In this embodiment, the context summary keyword with the highest priority is selected as the current keyword (804). The current keyword is compared 806 with keywords related to promotions. If a match 808 occurs, the HTML document generates 816 inserting some of the promotions of matching keywords for display to the user, such as in the Advertising Panel 206 of FIGS. 2A and 2B.
하지만, 매치가 일어나지 않으면, 더 이상의 키워드가 없음으로 판정된다(810). 그렇다면, 다음으로 가장 높은 우선순위를 갖는 콘텍스트 써머리 키워드는 현재 키워드로서 선택되고(808), 비교(810)가 매치가 발견되거나 더 이상의 키워드들이 존재하지 않을 때까지 매치들(808) 상의 검사 및 키워드들(806)의 수의 검사를 따라 반복된다.However, if no match occurs, it is determined that there are no more keywords (810). If so, the next highest priority context summary keyword is selected as the current keyword (808), and the comparison (810) checks and keywords on the matches (808) until a match is found or no more keywords exist. Repeated inspection of the number of fields 806.
만약 매치가 없고, 더 많은 키워드들이 존재하지 않으면, 프로모션들은 선택된 항목 또는 콜렉션과 동일한 카테고리를 갖는 것으로 선택되고(814), HTML 도큐먼트가 생성된다(816).If there is no match and no more keywords exist, the promotions are selected to have the same category as the selected item or collection (814), and an HTML document is generated (816).
이러한 생성된 도큐먼트의 예는 여행 콜렉션(Travel collection:974)에서 아프리카(Africa:972)를 사용자가 클릭함으로써 나타나는 도 9c의 가용한 가장 낮은 요금에 대한 광고(970)이다.An example of such a generated document is the advertisement 970 for the lowest available fare of FIG. 9C that appears when a user clicks on African (972) in the Travel collection (974).
본 발명의 또 다른 양상은 "콘텍스에서의 검색(searching in context)"를 제공한다. 항목 또는 콜렉션이 선택되고, 인터넷의 검색이 선택된 항목의 콘텍스트에서 수행되도록 요청될 때, 콘텍스트 써머리는 강력한 검색 문의를 종합하기 위해 사용된다. 사용자가 통상 사용하는 것보다 일반적으로 훨씬 더 복잡한 이 문의는 존재하는 검색 포털(portal)들에 따라 통과된다. 문의가 가장 수동적으로 엔터된문의들보다 더 많은 정보를 다이내믹하게 갖는 검색 포털들을 제공하기 때문에, 검색 엔진들은 통상 더 적절한 히트(hit)들을 포함하는 결과들을 되돌린다.Another aspect of the invention provides for "searching in context." When an item or collection is selected and a search of the Internet is requested to be performed in the context of the selected item, the context summary is used to synthesize a powerful search query. This query, which is generally much more complex than the user typically uses, is passed according to existing search portals. Since inquiries provide search portals with more information dynamically than the most manually entered inquiries, search engines typically return results containing more appropriate hits.
도 8b는 사용자에게 향상된 검색열을 제공하는 방법의 실시예의 흐름도이다. 일실시예에서, 이 방법은 검색 인핸서(346)에 의해 수행된다. 사용자가 검색을 개시할 수 있는 두 가지 방법이 있다. 사용자는 항목 또는 콜렉션을 클릭하고, 웹 검색 버튼(220)을 클릭함으로써 검색을 요청하거나, 사용자는, 예컨대 검색 문의 바(search query bar:208)에서 검색열을 엔터할 수 있다.8B is a flowchart of an embodiment of a method of providing an enhanced search string to a user. In one embodiment, this method is performed by search enhancer 346. There are two ways a user can initiate a search. The user may click on an item or collection and request a search by clicking on the web search button 220, or the user may enter a search string, for example, in a search query bar 208.
검색 요청을 나타내는 사용자 입력이 수신되고(818), 검색열(820)이 엔터되었는지의 여부를 결정한다. 결정되지 않았으면, 항목 또는 콜렉션이 선택된 것이고, 따라서 콘텍스트 써머리는 선태된 항목 또는 콜렉션을 위해 만들어진다(824). 검색열이 엔터되었다면, 검색열은 사용자의 검색 워드들로 분석된다(822).A user input indicating a search request is received 818, and a search string 820 determines whether the enter has been entered. If not determined, the item or collection is selected, so a context summary is made 824 for the selected item or collection. If the search string has been entered, the search string is resolved to the user's search words (822).
사용자의 콘텍스트 데이터베이스(140) 내의 키워드들은 사용자의 검색 워드들의 발생에 대해 검색된다(826). 발생이 발견되지 않으면, 그 방법은 이 실시예에서 제거된다(827), 그밖에, 항목들 및 콜렉션들은 사용자의 검색 워드들(830)을 갖는다. 각 항목 또는 콜렉션에 대해, 콘텍스트 써머리가 생성된다(832). 콘텍스트 써러리들 모두에서 한번 이상 나타나는 키워드들의 웨이트들이 합산된다(834).Keywords in the user's context database 140 are searched for the occurrence of the user's search words (826). If no occurrence is found, the method is removed 827 in this embodiment, in addition, the items and collections have the user's search words 830. For each item or collection, a context summary is generated 832. The weights of keywords that appear more than once in both context surrogates are summed (834).
사용자가 항목 또는 콜렉션을 클릭하거나, 키워드들을 엔터하고, 검색 써머리는 키워드들로서 가장 높은 웨이트들을 갖는 키워드들의 최대 수(N)까지 선택함으로써(836) 콘텍스트 써머라이징(Context Summarizing)의 결과에 기초하여 생성된다.Created based on the results of context summarizing by the user clicking on an item or collection, entering keywords, and selecting a search summary up to the maximum number N of keywords with the highest weights as keywords (836). do.
다음으로, 임계값을 패스(pass)하는 웨이트들을 갖는 키워드들의 수, 즉 키워드들의 제 2 최대 수(Q)를 초과하지 않는 수는 우선순위 검색 워드들로서 지정된다(838). 검색 써머리 키워드들은 우선순위 검색 워드들로 주워진 그래머 특정 강조(grammar specific emphasis)를 갖는 사용자 선택된 검색 엔지(840)의 검색 문의 그래머 프로토콜에 위치된다. 이러한 프로토콜의 예는 워드가 절대적으로 결과에 포함되어야 함을 나타내기 위해 워드 앞에 "+" 기호를 나타낸다. 이후에 검색 써머리 키워드는 사용자에게 마크된 우선순위 검색 워드들로 사용자에게 표시된다(842). 써머리 키워드들의 리스트(963)의 예가 도 9b에 도시되이 있다. "휴가(vacation)"(960) 및 맵(Map)"(966) 앞의 플러스 "+" 기호는 그것들이 사용자에게 우선순위 검색 워드들로서 제안되었음을 나타낸다. 사용자는 문의에 추가하고자 하는 워드들을 검색 써머리로부터 간단히 선택함으로써 "더 많은 제안들(More Suggestions)" 하에서 리스트된 워드들 중 어떤 것을 선택한다.Next, the number of keywords with weights that pass the threshold, i.e., the number not exceeding the second maximum number Q of keywords, is designated as priority search words (838). Search summary keywords are located in the search query grammar protocol of the user selected search engine 840 with grammar specific emphasis given by priority search words. An example of such a protocol is a "+" sign before the word to indicate that the word should be included in the result absolutely. The search summary keyword is then displayed to the user with priority search words marked for the user (842). An example of a list of summary keywords 963 is shown in FIG. 9B. The plus "+" sign in front of "vacation" 960 and map "966 indicates that they have been suggested to the user as priority search words. Select simply any of the words listed under "More Suggestions" by simply choosing from.
도 9a는 사용자가 "코끼리(Elephants)"를 클릭한 사용자 인터페이스 윈도우를 보여준다. 콘텍스트 써머라이저는 명칭 "코끼리"(926)에 대한 웨이트와, 명칭 "마사이 마라(Masai Mara)"(918)에 대한 보다 낮은 웨이팅과, "케냐(Kenya)"(914)에 대한 보다 낮은 웨이팅과, "트립(Trips"(910)까지의 웨이팅을 부가한다. 웨이팅의 유사한 감소는 우리가 상부로 계층을 가로지름에 따라 접하게되는 각 콜렉션 또는 항목과 관련된 키워드들에 이용한다. 콘텍스트는 본 발명이 계층을 상부로 가로지르기 때문에 유지됨을 주지하자. 탄자니아(Tanzania:920)와 관련된 메타 데이터는 케냐의 마사이 마라(918)의 콘텍스트에서 전혀 웨이트에 영향을 받지 않는다. 결과적으로, 이 클릭에 대한 콘텍스트 써머리는 아래의 것들을 포함할 수 있다.9A shows a user interface window in which the user clicked on "Elephants". The context summerizer has a weight for the name "Elephant" 926, a lower weight for the name "Masai Mara" 918, a lower weight for the "Kenya" 914, Add weighting up to “Trips” 910. A similar reduction in weighting is used for keywords associated with each collection or item that we encounter as we traverse the hierarchy upwards. Note that the metadata associated with Tanzania (920) is not affected by the weight at all in Kenya's Masai Mara (918) context, so the context summary for this click It may include:
여행(Travel)(여행 하의 모든 콜렉션과 관련된 키워드)Travel (keywords related to all collections under travel)
아프리카(Africa)(마사이 마라, 코끼리, 및 콜렉션 명칭과 관련된 키워드)Africa (keywords related to Masai Mara, elephant, and collection name)
마사이 마라(Masai Mara)(코끼리들 및 콜렉션의 명칭에 대한 키워드)Masai Mara (keywords for names of elephants and collections)
케냐(Kenya)(마사이 마라, 코끼리, 및 콜렉션의 명칭에 대한 키워드)Kenya (keywords for the names of Masai Mara, elephants, and collections)
트립(Trips)(아프리카, 마사이 마라, 및 콜렉션 명칭에 대한 키워드)Trips (keywords for Africa, Masai Mara, and collection name)
최종 웨이팅을 결정하는데 있어 콘텍스트의 영향을 강조하기 위해서, "코끼리" 항목이 다중 콜렉션들, 즉 여기에 보여진 마사이 마라 콜렉션 및 "USA" 콜렉션 중의 어디에선가의 서커스(circus) 콜렉션에 남아있는 아래의 예를 고려해보자.To highlight the impact of the context in determining the final weighting, the example below where the "elephant" item remains in multiple collections, the circus collection somewhere in the Masai Mara collection and the "USA" collection shown here Consider.
사용자가 서커스 콜렉션의 코끼리를 클릭하는 경우, 써머라이저는 "케냐" 또는 "마사이 마라"와 같은 것을 제안하지 않는다. 오히려, 이들 워드들은 "서커스" 및 "훈련(Training)" 등으로써 겨체될 된다.If the user clicks on an elephant in the circus collection, the summerizer does not suggest something like "Kenya" or "Masai Mara". Rather, these words are incorporated by "circus", "training", and the like.
본 발명의 실시예들의 앞선 설명은 예시와 설명의 목적을 위해 제시된 것이다. 이는 개시된 정확한 형태로 본 발명을 제한하거나 배제하기 위해 의도된 것이 아니다. 많은 변형들 및 변환이 상기 사상에 비추어 가능하다. 본 발명의 범위는 이 상세한 설명에 의해 제한되지 않으며 첨부된 청구범위에 한정되도록 한다.The foregoing description of the embodiments of the invention has been presented for the purposes of illustration and description. It is not intended to be exhaustive or to limit the invention to the precise form disclosed. Many variations and modifications are possible in light of the above teachings. It is intended that the scope of the invention be limited not by this detailed description, but rather by the claims appended hereto.
Claims (23)
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14223799P | 1999-07-02 | 1999-07-02 | |
US60/142,237 | 1999-07-02 | ||
PCT/US2000/018111 WO2001002984A2 (en) | 1999-07-02 | 2000-06-30 | System and method for capturing and managing information from digital source |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20020075359A true KR20020075359A (en) | 2002-10-04 |
Family
ID=22499112
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020027000027A Withdrawn KR20020075359A (en) | 1999-07-02 | 2000-06-30 | System and method for capturing and managing information from digital source |
Country Status (8)
Country | Link |
---|---|
EP (1) | EP1282864A2 (en) |
JP (1) | JP2003524823A (en) |
KR (1) | KR20020075359A (en) |
AU (1) | AU6062800A (en) |
BR (1) | BR0011779A (en) |
CA (1) | CA2377576A1 (en) |
NZ (1) | NZ516340A (en) |
WO (1) | WO2001002984A2 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100738945B1 (en) * | 2004-07-29 | 2007-07-12 | 캐논 가부시끼가이샤 | Information management apparatus, information presentation method, image processing apparatus, and image processing method |
KR100926123B1 (en) * | 2008-07-21 | 2009-11-11 | 강민수 | Advertising method using text content included in digital content |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE60132821T2 (en) | 2000-05-29 | 2009-03-05 | Saora K.K. | SYSTEM AND METHOD FOR STORING NAVIGATED DATA |
KR100955693B1 (en) * | 2001-11-27 | 2010-05-03 | 강민수 | Advertising method using text content. |
GB2378775A (en) * | 2001-05-03 | 2003-02-19 | Connextra Ltd | Provision of Secondary Information based on Context of Primary Information |
US20050114198A1 (en) * | 2003-11-24 | 2005-05-26 | Ross Koningstein | Using concepts for ad targeting |
US7664733B2 (en) * | 2003-04-11 | 2010-02-16 | Ricoh Company, Ltd. | Techniques for performing operations on a source symbolic document |
US20070022110A1 (en) * | 2003-05-19 | 2007-01-25 | Saora Kabushiki Kaisha | Method for processing information, apparatus therefor and program therefor |
WO2006001565A1 (en) | 2004-06-24 | 2006-01-05 | Electronics And Telecommunications Research Institute | Extended description to support targeting scheme, and tv anytime service and system employing the same |
ES2324362T3 (en) * | 2006-02-03 | 2009-08-05 | Hurra Communications Gmbh | PROCEDURE FOR SELECTION AND PRESENTATION OF AT LEAST ADDITIONAL INFORMATION. |
KR100924001B1 (en) | 2008-03-24 | 2009-10-28 | 강민수 | Method on making commercial tag sets for content match keyword advertisement of digital content |
WO2009120004A2 (en) * | 2008-03-24 | 2009-10-01 | Kang Min Soo | Keyword-advertisement method using meta-information related to digital contents and system thereof |
CN102129632A (en) * | 2010-01-13 | 2011-07-20 | 阿里巴巴集团控股有限公司 | Method, device and system for capturing webpage information |
CN103971244B (en) | 2013-01-30 | 2018-08-17 | 阿里巴巴集团控股有限公司 | A kind of publication of merchandise news and browsing method, apparatus and system |
CN111079377B (en) * | 2019-12-03 | 2022-12-13 | 哈尔滨工程大学 | Method for recognizing named entities of Chinese medical texts |
KR102468630B1 (en) | 2022-08-05 | 2022-11-22 | 주식회사 레이첼블루 | Apparatus and method for providing item replacement matching platform service throuth item valuation |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1995034051A1 (en) * | 1994-06-06 | 1995-12-14 | Spectragraphics Corporation | Method and apparatus for capturing and distributing graphical data |
-
2000
- 2000-06-30 JP JP2001508705A patent/JP2003524823A/en active Pending
- 2000-06-30 AU AU60628/00A patent/AU6062800A/en not_active Abandoned
- 2000-06-30 BR BR0011779-0A patent/BR0011779A/en not_active Application Discontinuation
- 2000-06-30 CA CA002377576A patent/CA2377576A1/en not_active Abandoned
- 2000-06-30 EP EP00946945A patent/EP1282864A2/en not_active Withdrawn
- 2000-06-30 NZ NZ516340A patent/NZ516340A/en unknown
- 2000-06-30 WO PCT/US2000/018111 patent/WO2001002984A2/en not_active Application Discontinuation
- 2000-06-30 KR KR1020027000027A patent/KR20020075359A/en not_active Withdrawn
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100738945B1 (en) * | 2004-07-29 | 2007-07-12 | 캐논 가부시끼가이샤 | Information management apparatus, information presentation method, image processing apparatus, and image processing method |
US7689915B2 (en) | 2004-07-29 | 2010-03-30 | Canon Kabushiki Kaisha | Image processing apparatus and image processing method using image attribute information and thumbnail displays for display control |
KR100926123B1 (en) * | 2008-07-21 | 2009-11-11 | 강민수 | Advertising method using text content included in digital content |
Also Published As
Publication number | Publication date |
---|---|
NZ516340A (en) | 2004-07-30 |
JP2003524823A (en) | 2003-08-19 |
WO2001002984A2 (en) | 2001-01-11 |
WO2001002984A3 (en) | 2002-11-28 |
CA2377576A1 (en) | 2001-01-11 |
EP1282864A2 (en) | 2003-02-12 |
BR0011779A (en) | 2003-07-01 |
AU6062800A (en) | 2001-01-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7370061B2 (en) | Method for querying XML documents using a weighted navigational index | |
US6012053A (en) | Computer system with user-controlled relevance ranking of search results | |
US7890485B2 (en) | Knowledge management tool | |
US8423537B2 (en) | Method and arrangement for handling of information search results | |
US7693825B2 (en) | Systems and methods for ranking implicit search results | |
US20040205514A1 (en) | Hyperlink preview utility and method | |
US20060155728A1 (en) | Browser application and search engine integration | |
US20090144240A1 (en) | Method and systems for using community bookmark data to supplement internet search results | |
US20070185860A1 (en) | System for searching | |
CN100462969C (en) | Methods of using the Internet to provide and query information for the public | |
US20030018607A1 (en) | Method of enabling browse and search access to electronically-accessible multimedia databases | |
US20110119262A1 (en) | Method and System for Grouping Chunks Extracted from A Document, Highlighting the Location of A Document Chunk Within A Document, and Ranking Hyperlinks Within A Document | |
US20030025731A1 (en) | Method and system for automated research using electronic book highlights and notations | |
US20120059822A1 (en) | Knowledge management tool | |
JP2007519111A (en) | Method, system, and program for processing anchor text | |
US20020083045A1 (en) | Information retrieval processing apparatus and method, and recording medium recording information retrieval processing program | |
KR20020075359A (en) | System and method for capturing and managing information from digital source | |
US20080071768A1 (en) | System and Method for Ordering Items | |
KR100403947B1 (en) | Aggregation of content as a personalized document | |
US20100082594A1 (en) | Building a topic based webpage based on algorithmic and community interactions | |
KR101393839B1 (en) | Search system presenting active abstracts including linked terms | |
US8612431B2 (en) | Multi-part record searches | |
Papadakos et al. | On exploiting static and dynamically mined metadata for exploratory web searching | |
US20110252313A1 (en) | Document information selection method and computer program product | |
US20080256058A1 (en) | Highlighting of Search Terms in a Meta Search Engine |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0105 | International application |
Patent event date: 20020102 Patent event code: PA01051R01D Comment text: International Patent Application |
|
N231 | Notification of change of applicant | ||
PN2301 | Change of applicant |
Patent event date: 20020506 Comment text: Notification of Change of Applicant Patent event code: PN23011R01D |
|
PG1501 | Laying open of application | ||
PC1203 | Withdrawal of no request for examination | ||
WITN | Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid |