KR102275135B1 - Data collection and analyzing system and construction method of the same for project - Google Patents
Data collection and analyzing system and construction method of the same for project Download PDFInfo
- Publication number
- KR102275135B1 KR102275135B1 KR1020190144516A KR20190144516A KR102275135B1 KR 102275135 B1 KR102275135 B1 KR 102275135B1 KR 1020190144516 A KR1020190144516 A KR 1020190144516A KR 20190144516 A KR20190144516 A KR 20190144516A KR 102275135 B1 KR102275135 B1 KR 102275135B1
- Authority
- KR
- South Korea
- Prior art keywords
- web
- information
- crawling
- project
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/904—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
본 발명은 프로젝트를 위한 자료 수집 및 분석 시스템의 구축 방법으로서, 특히 네트워크 상에서 사용자가 프로젝트를 위해 웹사이트를 검색하면 기계적 작업을 자동으로 수행하여 자료 수집 및 분석을 수행하는 시스템의 구축 방법에 관한 것이다. 본 발명은, 웹 크롤링에 의한 마인드맵 생성으로 프로젝트를 위한 자료 수집 및 분석 시스템에 있어서, 크롤러 설정에 따라 마인드맵을 생성하는 마인드맵 생성부; 및 사용자의 조작에 따라 웹 사이트 내의 특정 부분이 선택되어 웹 크롤링이 요청되는 경우, 웹 크롤링 설정 인터페이스를 출력하고, 상기 웹 크롤링의 설정 인터페이스를 통해 입력되는 웹 크롤링 설정정보를 저장하며, 상기 웹 크롤링 설정정보에 따라 웹 정보를 크롤링하고, 상기 크롤링 웹 정보를 상기 임의의 노드에 표히하는 웹 크롤링부를 포함하고, 상기 웹 크롤링부는, 상기 웹 크롤링을 이용한 마인드맵 생성 이후, 상기 크롤링된 웹 정보를 설정 정보에 따라 사용자 검색어를 기준으로 요약될 수 있다.
전술한 바와 같은 구성을 갖는 본 발명에 따르면, 프로젝트 수행 과정에서 자료 수집 시, 사용자 중 1인의 메모 과정에 기반하여 타인이 마인드 맵을 도출해 내기 때문에, 데이터 출처의 효율적인 관리에 이점이 있다.The present invention relates to a method of constructing a data collection and analysis system for a project, and more particularly, to a method of constructing a system for performing data collection and analysis by automatically performing a mechanical operation when a user searches a website for a project on a network. . The present invention provides a data collection and analysis system for a project by generating a mind map by crawling the web, comprising: a mind map generator for generating a mind map according to a crawler setting; and when a web crawling is requested by selecting a specific part of the web site according to a user's operation, outputting a web crawling setting interface, storing web crawling setting information input through the web crawling setting interface, and the web crawling and a web crawling unit that crawls web information according to setting information and displays the crawled web information to the arbitrary node, wherein the web crawling unit generates a mind map using the web crawling, and then sets the crawled web information According to the information, it may be summarized based on the user search term.
According to the present invention having the above-described configuration, there is an advantage in efficient management of data sources, since another person derives a mind map based on the memo process of one of the users when collecting data during the project execution process.
Description
본 발명은 프로젝트를 위한 자료 수집 및 분석 시스템의 구축 방법으로서, 특히 네트워크 상에서 사용자가 프로젝트를 위해 웹사이트를 검색하면 기계적 작업을 자동으로 수행하여 자료 수집 및 분석을 수행하는 시스템의 구축 방법에 관한 것이다.The present invention relates to a method of constructing a data collection and analysis system for a project, and more particularly, to a method of constructing a system for performing data collection and analysis by automatically performing a mechanical operation when a user searches a website for a project on a network. .
인터넷 환경의 폭발적 성장과 휴대용 모바일 기기의 웹 접근성이 용이해짐에 따라 개인들은 여러 정보를 수집하고, 해당 정보들의 출처와 기록된 내용들은 리스트 형태로 저장될 수 있다.With the explosive growth of the Internet environment and the ease of web accessibility of portable mobile devices, individuals collect various information, and the sources and recorded contents of the information can be stored in the form of a list.
그런데 이러한 기록들은 리스트 형태로 저장되어 있으므로 자신의 기록을 한 번에 확인하거나, 다수의 사용자가 모여 자료를 공유하려고 하면 자료를 전달하는 데 있어서 매우 비효율적이다. 또한, 기존의 자료 수집 및 시각화 방식은 사용자가 직접 입력을 하는 방식으로만 이루어져 있어 비효율적인 프로젝트를 진행하고 있다.However, since these records are stored in the form of a list, it is very inefficient in delivering data if one's own records are checked at once or a large number of users try to share data. In addition, the existing data collection and visualization method consists only of a method in which the user directly inputs, thus inefficient projects are being carried out.
근래에 들어서는, 개인이 프로젝트를 진행하는 것이 아닌 다수의 사람들이 모여서 자료를 수집하고 계획하는 단계에서 자신의 의견을 공유하여야 하고, 수집된 자료의 출처를 유지하여야 한다.In recent years, rather than an individual project being carried out, a large number of people gather to collect data and share their opinions in the planning stage, and the source of the collected data must be maintained.
이와 관련, 종래의 한국공개특허 제10-2017-0041523호(스크래핑 서비스 제공 방법, 그를 위한 서버 장치 및 시스템)는, 모바일 단말기로부터 사용자 개인 정보가 포함된 스크래핑 요청을 수신하는 단계; 모바일 단말기로부터 수신된 사용자 개인 정보를 이용하여 스크래핑하고자 하는 정보가 구비된 웹 서버에 접속하는 단계; 접속된웹 서버로부터 스크래핑하고자 하는 정보를 수집하는 단계; 및 웹 서버로부터 수집된 정보를 모바일 단말기로 전송하거나 또는 모바일 단말기와 연관된 데이터 베이스에 저장시키는 단계를 개시하고 있다.In this regard, the prior Korean Patent Application Laid-Open No. 10-2017-0041523 (a method for providing a scraping service, a server device and system therefor) includes the steps of: receiving a scraping request including user personal information from a mobile terminal; using the user's personal information received from the mobile terminal to access a web server having information to be scraped; collecting information to be scraped from the accessed web server; and transmitting the information collected from the web server to the mobile terminal or storing the information in a database associated with the mobile terminal.
다만, 종래의 기술은 사용자 1인의 정보 수집 과정만을 개시하고 있으며, 사용자가 프로젝트를 진행하면서 자료의 추적성, 연관성 그리고 방향성 제시를 위한 방법을 제공하지 못하는 문제점이 있다.However, the prior art discloses only the information collection process of one user, and there is a problem in that it cannot provide a method for suggesting traceability, correlation, and direction of data while the user proceeds with a project.
또한, 자료들을 모으고 하나의 결과물을 내려고 할 때, 문서 형태의 수집된 자료 보고서의 경우에는 한 눈에 보기 어려우며, 서로 접근하여 계속적으로 분석하기 어렵다는 문제점이 있다.In addition, when collecting data and trying to produce a single result, there are problems in that it is difficult to see at a glance the collected data report in the form of a document, and it is difficult to continuously analyze each other by approaching each other.
본 발명은 자료를 분류 및 재정리를 수월하게 하고, 시간적 비용적 손실을 최소화하여 프로젝트를 효율적으로 수행할 수 있는 자료 수집 및 분석 시스템의 구축 방법을 제공하는 것을 목적으로 한다.An object of the present invention is to provide a method of constructing a data collection and analysis system that can easily categorize and rearrange data, minimize time and cost loss, and efficiently perform a project.
상기 목적을 달성하기 위하여 본 발명은, 웹 크롤링을 이용하여 프로젝트를 위한 자료 수집 및 분석 시스템의 구축 방법에 있어서, (a) 사용자의 웹 접속에 기반하여 자료 수집 및 분석을 수행하는 시스템 내의 마인드맵 상에 임의의 노드가 생성되어 상기 웹 크롤링이 요청되는 단계; (b) 상기 요청에 대응되어 입력된 정보에 따라 상기 웹 크롤링의 접속 정보 또는 사용 정보를 포함하는 설정 정보가 저장되는 단계; 및 (c) 상기 설정 정보에 따라 웹 정보를 상기 웹에서 크롤링하고, 크롤링된 웹 정보를 상기 임의의 노드에 표시하는 단계를 포함하고, 상기 마인드맵의 생성 이후, 상기 크롤링된 웹 정보를 상기 설정 정보에 따라 상기 사용자의 설정 정보를 저장하는 것을 특징으로 하는 프로젝트를 위한 자료 수집 및 분석 시스템의 구축 방법을 제공하는 것을 일 목적으로 한다.In order to achieve the above object, the present invention provides a method of constructing a data collection and analysis system for a project using web crawling, (a) a mind map in a system for collecting and analyzing data based on a user's web access a step of requesting the web crawling by generating a random node on the; (b) storing setting information including access information or usage information of the web crawling according to information input in response to the request; and (c) crawling web information on the web according to the setting information, and displaying the crawled web information on the arbitrary node, after generating the mind map, setting the crawled web information An object of the present invention is to provide a method of constructing a data collection and analysis system for a project, characterized in that the user's setting information is stored according to the information.
실시 예에 따라, 상기 (b)단계는, (b1) 웹 브라우저를 호출하는 단계; (b2) 입력된 키워드에 기반하여 특정 웹 페이지를 상기 웹 브라우저를 통해 출력하는 단계; (b3) 상기 설정 정보에 따라 상기 웹 페이지 중 소정의 영역을 선택 영역으로 설정하는 단계; 및 (b4) 상기 웹 페이지의 주소 정보, 상기 선택 영역에서 추출된 데이터 및 상기 사용자의 메모를 포함한 웹 크롤링 설정 정보를 생성 또는 저장하는 단계를 포함할 수 있다.According to an embodiment, the step (b) includes: (b1) calling a web browser; (b2) outputting a specific web page through the web browser based on the input keyword; (b3) setting a predetermined area of the web page as a selection area according to the setting information; and (b4) generating or storing web crawling setting information including address information of the web page, data extracted from the selection area, and the user's memo.
실시 예에 따라, 상기 마인드맵의 생성 이후, (d1) 상기 마인드맵에 대한 “열기(open)” 요청이 있는지 검색 또는 판단하는 단계; 및 (d2) 상기 “열기(open)” 요청이 입력된 웹 정보 및 상기 사용자의 메모를 상기 임의의 노드에 표시하는 단계를 포함할 수 있다.According to an embodiment, after generating the mind map, (d1) searching for or determining whether there is a request for “open” for the mind map; and (d2) displaying the web information to which the “open” request is input and the user's memo on the arbitrary node.
실시 예에 따라, 상기 마인드맵의 생성은, (e1) 상기 크롤링된 웹 정보를 포함하는 마인드맵에서 상기 크롤링된 웹 정보가 들어있는 특정 부분이 클릭되는지 여부를 판단하는 단계; 및 (e2) 상기 클릭이 판단되는 경우, 상기 클릭에 관련된 클릭 정보를 상기 웹 크롤링의 설정 정보에 따라 변환되어 별도의 페이지로 마우스 이벤트 정보를 전송하는 단계를 포함할 수 있다.According to an embodiment, the generation of the mind map may include: (e1) determining whether a specific part containing the crawled web information is clicked in the mind map including the crawled web information; and (e2) when the click is determined, the click information related to the click is converted according to the setting information of the web crawling, and the mouse event information is transmitted to a separate page.
실시 예에 따라, 상기 (e2)단계는, 상기 웹 정보가 표시되는 노드에 상기 웹 정보를 이미지 또는 텍스트로 표시할 수 있다.According to an embodiment, in the step (e2), the web information may be displayed as an image or text on a node where the web information is displayed.
실시 예에 따라, 상기 (e2)단계는, 상기 웹 정보를 별도의 웹 브라우저로 표시할 수 있다.According to an embodiment, in step (e2), the web information may be displayed in a separate web browser.
실시 예에 따라, 상기 (a) 내지 (e) 단계의 방법을 실행하도록 프로그램을 기록한 컴퓨터 판독가능 기록매체로 구현될 수 있다.According to an embodiment, it may be implemented as a computer-readable recording medium in which a program is recorded to execute the method of steps (a) to (e).
또한 본 발명은, 웹 크롤링에 의한 마인드맵 생성으로 프로젝트를 위한 자료 수집 및 분석 시스템에 있어서, 크롤러 설정에 따라 마인드맵을 생성하는 마인드맵 생성부; 및 사용자의 조작에 따라 웹 사이트 내의 특정 부분이 선택되어 웹 크롤링이 요청되는 경우, 웹 크롤링 설정 인터페이스를 출력하고, 상기 웹 크롤링의 설정 인터페이스를 통해 입력되는 웹 크롤링 설정정보를 저장하며, 상기 웹 크롤링 설정정보에 따라 웹 정보를 크롤링하고, 상기 크롤링 웹 정보를 상기 임의의 노드에 표히하는 웹 크롤링부를 포함하고, 상기 웹 크롤링부는, 상기 웹 크롤링을 이용한 마인드맵 생성 이후, 상기 크롤링된 웹 정보를 설정 정보에 따라 사용자 검색어를 기준으로 요약되는 것을 특징으로 하는 프로젝트를 위한 자료 수집 및 분석 시스템을 제공하는 것을 다른 목적으로 한다.In addition, the present invention provides a data collection and analysis system for a project by generating a mind map by crawling the web, comprising: a mind map generator for generating a mind map according to a crawler setting; and when a web crawling is requested by selecting a specific part of the web site according to a user's operation, outputting a web crawling setting interface, storing web crawling setting information input through the web crawling setting interface, and the web crawling and a web crawling unit for crawling web information according to setting information and displaying the crawled web information to the arbitrary node, wherein the web crawling unit generates a mind map using the web crawling, and then sets the crawled web information Another object of the present invention is to provide a data collection and analysis system for a project, characterized in that the information is summarized based on user search terms.
실시 예에 따라, 상기 웹 크롤링부는, 상기 사용자의 요청에 의한 웹 주소의 웹 페이지를 표시하는 웹 브라우저를 호출하여 출력하는 웹 브라우저 처리모듈; 상기 웹 페이지의 중요도, 사용자 메모 및 이미지 캡쳐를 포함하는 설정 인터페이스를 사용자에게 제공하고, 상기 설정 인터페이스를 통해 설정되는 설정 정보를 저장하는 사용자정보 처리모듈; 상기 웹 페이지의 주소 정보 및 상기 설정 정보를 포함하는 웹 크롤링 설정정보를 생성 또는 저장하는 웹 크롤링 설정모듈; 및 상기 설정 정보에 따라 웹 정보를 크롤링하고, 크롤링된 웹 정보를 선택된 특정 노드에 표시하는 웹 크롤링 처리모듈을 포함할 수 있다.According to an embodiment, the web crawling unit may include: a web browser processing module for calling and outputting a web browser displaying a web page of a web address according to the user's request; a user information processing module for providing a user with a setting interface including the importance of the web page, user memo, and image capture, and for storing setting information set through the setting interface; a web crawling setting module for generating or storing web crawling setting information including the address information of the web page and the setting information; and a web crawling processing module that crawls web information according to the setting information and displays the crawled web information on a selected specific node.
실시 예에 따라, 상기 웹 브라우저 처리모듈은, 상기 마인드맵 상의 특정 부분이 클릭되는 경우, 상기 클릭에 관련된 클릭 정보를 상기 설정 정보에 따라 변환하여 웹 서버로 마우스 이벤트 정보를 전송하고, 상기 마우스 이벤트 정보에 따라 상기 웹 서버로부터 전송되는 웹 정보를 수신하여 출력할 수 있다.According to an embodiment, when a specific part on the mind map is clicked, the web browser processing module converts click information related to the click according to the setting information and transmits the mouse event information to the web server, and the mouse event According to the information, it is possible to receive and output web information transmitted from the web server.
실시 예에 따라, 상기 웹 브라우저 처리모듈은, 상기 웹 정보를 상기 크롤링된 웹 정보가 표시되는 노드에 이미지 또는 텍스트로 표시할 수 있다.According to an embodiment, the web browser processing module may display the web information as an image or text on a node where the crawled web information is displayed.
실시 예에 따라, 상기 웹 브라우저 처리모듈은, 상기 웹 정보를 상기 웹 브라우저를 호출하여 표시할 수 있다.According to an embodiment, the web browser processing module may display the web information by calling the web browser.
전술한 바와 같은 구성을 갖는 본 발명에 따르면, 프로젝트 수행 과정에서 자료 수집 시, 사용자 중 1인의 메모 과정에 기반하여 타인이 마인드 맵을 도출해 내기 때문에, 데이터 출처의 효율적인 관리에 이점이 있다.According to the present invention having the above-described configuration, there is an advantage in efficient management of data sources because, when data is collected in the project execution process, another person derives a mind map based on the memo process of one of the users.
또한 본 발명은, 프로젝트 당사자 간의 의견 조율 및 합의를 도출하며 프로젝트의 비젼을 제시하며 데이터의 흐름도를 마인드 맵으로 전달하는 서비스를 제공할 수 있는 이점이 있다.In addition, the present invention has the advantage of being able to provide a service of coordinating opinions and drawing consensus among project parties, presenting a project vision, and delivering a data flow chart as a mind map.
도 1은 본 발명의 프로젝트를 위한 자료 수집 및 분석 시스템 구축 방법에 대한 순서도를 나타낸다.
도 2는 본 발명의 자료 수집 및 분석 시스템의 블록도를 나타낸다.
도 3은 본 발명의 실시 예에 따라 도 1에 기재된 DB서버 내부의 사용자 DB에 대한 통합 과정의 모습을 나타낸다.
도 4는 본 발명의 실시 예에 따른 사용자DB의 포맷을 나타낸다.
도 5는 본 발명의 실시 예에 따른 자료 수집 및 분석 시스템에서의 시각화 모듈의 결과물을 나타낸다.
도 6은 본 발명의 실시 예에 따른 다중 방문 표시줄 및 최소 방문 표시줄을 나타내고, 각 사용자의 생각에 대한 가이드라인을 나타낸다.
도 7은 본 발명의 실시 예에 따라 프로젝트에 대해 각 사용자가 수집한 자료를 기반으로 편집된 노드가 제공되는 모습을 나타낸다.
도 8은 본 발명의 실시 예에 따라 핵심단어 모듈의 선택시 배열되는 연관 검색어 모듈의 모습을 나타낸다.1 shows a flow chart for a method of constructing a data collection and analysis system for the project of the present invention.
2 shows a block diagram of the data collection and analysis system of the present invention.
3 shows a state of an integration process for a user DB inside the DB server shown in FIG. 1 according to an embodiment of the present invention.
4 shows a format of a user DB according to an embodiment of the present invention.
5 shows a result of a visualization module in a data collection and analysis system according to an embodiment of the present invention.
6 shows a multi-visit bar and a minimum-visit bar according to an embodiment of the present invention, and shows guidelines for the thoughts of each user.
7 shows a state in which an edited node is provided based on data collected by each user for a project according to an embodiment of the present invention.
8 shows a state of a related search word module arranged when a key word module is selected according to an embodiment of the present invention.
본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 본 발명에 대해 구체적으로 설명하기로 한다.Terms used in this specification will be briefly described, and the present invention will be described in detail.
본 발명에서 사용되는 용어는 본 발명에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 발명에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 발명의 전반에 걸친 내용을 토대로 정의되어야 한다. The terms used in the present invention have been selected as currently widely used general terms as possible while considering the functions in the present invention, but these may vary depending on the intention or precedent of a person skilled in the art, the emergence of new technology, and the like. In addition, in a specific case, there is a term arbitrarily selected by the applicant, and in this case, the meaning will be described in detail in the description of the corresponding invention. Therefore, the term used in the present invention should be defined based on the meaning of the term and the overall content of the present invention, rather than the name of a simple term.
명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다. 또한, 명세서에 기재된 "...부", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다. 또한, 명세서 전체에서 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, "그 중간에 다른 구성을 사이에 두고" 연결되어 있는 경우도 포함한다.When a part "includes" a certain element throughout the specification, this means that other elements may be further included, rather than excluding other elements, unless otherwise stated. In addition, terms such as "...unit" and "module" described in the specification mean a unit that processes at least one function or operation, which may be implemented as hardware or software, or a combination of hardware and software. . Also, throughout the specification, when a part is "connected" with another part, this includes not only the case of being "directly connected" but also the case of being connected "with another configuration in between".
아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시 예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings so that those of ordinary skill in the art can easily carry out the present invention. However, the present invention may be embodied in various different forms and is not limited to the embodiments described herein. And in order to clearly explain the present invention in the drawings, parts irrelevant to the description are omitted, and similar reference numerals are attached to similar parts throughout the specification.
본 발명의 실시 예에서, "마인드 맵"이라는 용어는, 노드와 가지를 이용하여 정보를 시각적으로 구조화한 정보를 총칭하는 것으로서, 그 표시 형식에 무관하게 마인드맵의 특성을 가지고 있는 모든 정보를 포함하는 개념이다.In an embodiment of the present invention, the term "mind map" refers to information that is visually structured using nodes and branches, and includes all information having the characteristics of a mind map regardless of the display format. is a concept that
또한, "웹 정보'란 용어는, 웹 페이지에 포함되어 사용자 단말기에 출력되는 모든 형식의 정보를 의미하는 것으로서, 일 실시 예로서 웹 사이트에서 제공되는 웹 페이지에 포함된 특정 텍스트 정보, 이미지 정보 또는 동영상 정보일 수 있다.In addition, the term "web information" refers to all types of information included in a web page and output to a user terminal, and as an embodiment, specific text information, image information, or It may be video information.
도 1은 본 발명의 프로젝트를 위한 자료 수집 및 분석 시스템 구축 방법에 대한 순서도를 나타낸다.1 shows a flow chart for a method of constructing a data collection and analysis system for the project of the present invention.
도 1을 참조하면, 본 발명은 (a) 사용자의 웹 접속에 기반하여 자료 수집 및 분석을 수행하는 시스템 내의 마인드맵 상에 임의의 노드가 생성되어 상기 웹 크롤링이 요청되는 단계; (b) 상기 요청에 대응되어 입력된 정보에 따라 상기 웹 크롤링의 접속 정보 또는 사용 정보를 포함하는 설정 정보가 저장되는 단계; 및 (c) 상기 설정 정보에 따라 웹 정보를 상기 웹에서 크롤링하고, 크롤링된 웹 정보를 상기 임의의 노드에 표시하는 단계를 포함하고, 상기 마인드맵의 생성 이후, 상기 크롤링된 웹 정보를 상기 설정 정보에 따라 상기 사용자의 설정 정보를 저장하는 것을 특징으로 하는 프로젝트를 위한 자료 수집 및 분석 시스템의 구축 방법을 제공한다.Referring to Figure 1, the present invention comprises the steps of (a) generating a random node on a mind map in a system that performs data collection and analysis based on a user's web access and requesting the web crawling; (b) storing setting information including access information or usage information of the web crawling according to information input in response to the request; and (c) crawling web information on the web according to the setting information, and displaying the crawled web information on the arbitrary node, after generating the mind map, setting the crawled web information It provides a method of constructing a data collection and analysis system for a project, characterized in that the user's setting information is stored according to the information.
본 발명에서는 4가지의 핵심적인 기능적 요소가 존재하게 된다. 웹 크롤링, 분류화, 연결화, 시각화 부분으로 총 4가지로 나누어져 있다. In the present invention, there are four key functional elements. It is divided into four parts: web crawling, classification, connection, and visualization.
특히, 상기 (b)단계는, (b1) 웹 브라우저를 호출하는 단계; (b2) 입력된 키워드에 기반하여 특정 웹 페이지를 상기 웹 브라우저를 통해 출력하는 단계; (b3) 상기 설정 정보에 따라 상기 웹 페이지 중 소정의 영역을 선택 영역으로 설정하는 단계; 및 (b4) 상기 웹 페이지의 주소 정보, 상기 선택 영역에서 추출된 데이터 및 상기 사용자의 메모를 포함한 웹 크롤링 설정 정보를 생성 또는 저장하는 단계를 포함할 수 있다.In particular, the step (b) includes: (b1) calling a web browser; (b2) outputting a specific web page through the web browser based on the input keyword; (b3) setting a predetermined area of the web page as a selection area according to the setting information; and (b4) generating or storing web crawling setting information including address information of the web page, data extracted from the selection area, and the user's memo.
웹 크롤링의 경우 실시 예에 따르면, 사용자가 웹 페이지를 연 상태에서 검색 엔진을 통해서 자료를 찾게되면 별도의 프로그램이 작동을 하여 사용자가 방문한 웹 페이지의 정보를 수집하며, 별도의 데이터베이스에 저장을 실시하게 된다. 여기서 개인으로 할 경우에는 별도의 통합 데이터베이스가 필요하지 않지만, 프로젝트를 진행하면서 다수가 정보를 찾게 된다면, 다수가 찾은 정보들을 통합하는 통합용 데이터베이스를 설정한다.In the case of web crawling, according to the embodiment, when a user finds data through a search engine while a web page is open, a separate program operates to collect information on the web page visited by the user, and stores it in a separate database will do In the case of an individual, a separate integrated database is not required. However, if a large number of people find information while proceeding with a project, an integrated database is set up that integrates the information found by many people.
분류화에서는 데이터 베이스에 각 사용자들이 저장한 정보를 가지고 와서 별도의 분류 알고리즘을 이용하여 통합을 실시한다. 통합을 진행하려고 할 때, 각 사용자의 별도의 고유번호를 부여한 이후에, 각 사용자가 만든 별도의 테이블을 통합하게 된다. 여기서 통합을 진행하게 될 때, 각 사용자가 방문한 웹 페이지의 노드의 레벨에 따라서 다시 분류를 진행하여서 사용자의 시인성이 높은 결과물을 만들기 쉽도록 만든다. 또한 연결화 부분을 더 쉽게 이루기 위해서 기초적인 이러한 기초적인 작업을 동행한다.In classification, the information stored by each user is brought to the database and integrated using a separate classification algorithm. When integration is attempted, a separate table created by each user is combined after a separate unique number is assigned to each user. Here, when the integration is carried out, the classification is performed again according to the level of the node of the web page visited by each user, thereby making it easy to create a result with high user visibility. It also accompanies these basic tasks to make the linking part easier.
연결화에서는 웹 크롤링에서 수집한 각 사용자의 정보와 해당 분류화를 통해서 분류가 완료된 상태의 자료를 가지고 와서 각 노드의 레벨에 따라서 분류가 완료된 해당 통합 데이터베이스를 노드에 따라 연결을 진행하며 하나의 트리 형태로 만든다. In connectionization, each user's information collected from web crawling and the data in the state in which classification is completed through the classification are brought, and the corresponding integrated database that has been classified according to the level of each node is connected according to the node. make in the form
해당 연결화 부분에서는 기초적인 통합 데이터베이스를 이용하여 하나의 맵으로 먼저 만든 이후, 별도의 프로그램을 통하여 시각화 부분으로 넘기게 된다. 또한 이후에 별도의 알고리즘을 적용하여 자료들의 연관성을 다시 살펴보고 별도의 맵을 제공할 수 있다.In the connection part, a map is first created using a basic integrated database, and then transferred to the visualization part through a separate program. In addition, a separate algorithm can be applied later to re-examine the correlation between data and provide a separate map.
또한, 상기 마인드맵의 생성 이후, (d1) 상기 마인드맵에 대한 “열기(open)” 요청이 있는지 검색 또는 판단하는 단계; 및 (d2) 상기 “열기(open)” 요청이 입력된 웹 정보 및 상기 사용자의 메모를 상기 임의의 노드에 표시하는 단계를 포함할 수 있다.In addition, after generating the mind map, (d1) searching or determining whether there is an “open” request for the mind map; and (d2) displaying the web information to which the “open” request is input and the user's memo on the arbitrary node.
상기 마인드맵의 생성은, (e1) 상기 크롤링된 웹 정보를 포함하는 마인드맵에서 상기 크롤링된 웹 정보가 들어있는 특정 부분이 클릭되는지 여부를 판단하는 단계; 및 (e2) 상기 클릭이 판단되는 경우, 상기 클릭에 관련된 클릭 정보를 상기 웹 크롤링의 설정 정보에 따라 변환되어 별도의 페이지로 마우스 이벤트 정보를 전송하는 단계를 포함할 수 있다.The generation of the mind map may include: (e1) determining whether a specific part containing the crawled web information is clicked in the mind map including the crawled web information; and (e2) when the click is determined, the click information related to the click is converted according to the setting information of the web crawling, and the mouse event information is transmitted to a separate page.
시각화 부분에서는 기초적으로 3가지인 사용자들이 방문하여 기록한 웹 페이지들을 크롤링 한 이후, 해당 크롤링된 자료들을 각자 데이터베이스를 재분류를 통한 통합 데이터베이스를 만들고, 이후에 통합 데이터베이스의 연결화를 진행하여 하나의 맵 형태로 보여주게 된다.In the visualization part, after crawling the web pages visited and recorded by basically three users, the crawled data are reclassified to create an integrated database, and then the integrated database is connected to create a single map. will be shown in the form.
여기서 시각화 부분은 정적으로 데이터가 수집되어 하나의 맵으로 보여주는 것이 아니라, 사용자의 별도의 설정에 따라서 맵의 형태가 달라질 수가 있다. 프로젝트의 성질과 방향에 따라 최종 데이터를 바라보는 사용자가 원하는 최종적인 데이터 구조도는 다르기 때문에 이것을 반영하여 각각 별도의 알고리즘을 적용한다.In the visualization part, data is not statically collected and displayed as a single map, but the shape of the map may vary according to a user's separate setting. Depending on the nature and direction of the project, the final data structure desired by the user looking at the final data is different, so a separate algorithm is applied to reflect this.
특히, 상기 (e2)단계는, 상기 웹 정보가 표시되는 노드에 상기 웹 정보를 이미지 또는 텍스트로 표시할 수 있다. 상기 (e2)단계는, 상기 웹 정보를 별도의 웹 브라우저로 표시할 수 있다.In particular, in step (e2), the web information may be displayed as an image or text on a node where the web information is displayed. In step (e2), the web information may be displayed with a separate web browser.
또한, 본 발명은 실시 예에 따라, 상기 (a) 내지 (e) 단계의 방법을 실행하도록 프로그램을 기록한 컴퓨터 판독가능 기록매체로 구현될 수 있다.In addition, according to an embodiment, the present invention may be implemented as a computer-readable recording medium in which a program is recorded to execute the method of steps (a) to (e).
이하, 상술한 방법을 구현하는 자료 수집 및 분석 시스템에 대해 설명한다.Hereinafter, a data collection and analysis system implementing the above-described method will be described.
도 2는 본 발명의 자료 수집 및 분석 시스템의 블록도를 나타낸다.2 shows a block diagram of the data collection and analysis system of the present invention.
도 2를 참조하면, 전체 시스템은 프로젝트를 위한 자료 수집 및 분석 시스템 구축방법을 위한 단말 장치(이하 '자료구축 생성장치'라 함)(100), 네트워크(110), DB 서버(120), 시각화 모듈(130)를 포함할 수 있다.Referring to FIG. 2 , the entire system includes a terminal device (hereinafter referred to as a 'data construction generating device') 100, a
본 발명에 따른 단말 장치(100)는 사용자의 조작에 따라 입력되는 정보를 이용하여 사용자의 자료에 따라 노드를 생성하고, 생성된 노드들의 모임을 오픈(실행)하는 기능을 수행하는 장치이다.The
단말 장치(100)는, 데스크톱 컴퓨터뿐만 아니라 노트북 컴퓨터, 워크스테이션, 개인 휴대 정보단말기, 웹 패드, 스마트 폰을 포함하는 이동통신 단말기 등과 같이 메모리 수단을 구비하고 마이크로 프로세서를 탑재한 연산 능력 및 네트워크를 통한 데이터 통신 능력을 갖춘 디지털 기기라면 본 발명에 따른 웹 서버(120) 안에 포함되어 인터넷 (110A)에 접속을 하여서 사용자가 방문한 웹 페이지의 정보를 수집하여 DB 서버(120)에 저장을 실시한다. The
단말 장치(100)는 시각화 모듈(130) 안에 있는 트리 노드 및 분석 알고리즘이 논리적으로 탑재되어, 본 발명에 따른 단말 장치(100)에 표현되며 별도의 작업을 수행할 수 있다. The
단말장치(100)에서 웹 서버(110)을 통하여 인터넷(110A)에 접속하여 사용자가 정보를 수집하여 노드를 생성하는 기능, 즉, 1레벨인 중심 노드와 중심 노드에서 트리형태로 1번 분기된 가지 상에 위치되는 제 1차 노드들을 포함할 수 있다.The function of generating a node by accessing the
제 1차 노드들에서 다시 트리 형태로 분기된 가지 상에 위치되는 제 2차 노드의 경우는, 1차 노드에서 리다이렉트 된 웹 페이지를 기반으로 하여서 넘어가는 경우에 다시 분기되는 노드이고, 입력된 정보를 시각화 모듈(130)을 통해 구조화/시각화함으로써 마인드맵을 생성할 수 있다.In the case of a secondary node located on a branch again branched from the primary nodes in a tree form, it is a node that branches again when passing based on a web page redirected from the primary node, and input information A mind map may be generated by structuring/visualizing .
본 발명의 실시 예에 따른 단말장치(100)는 웹 크롤링 기능을 중심으로, 노드 생성 시 사용자의 조작에 다라 특정 웹 서버(120)에 접속하여, 해당 웹 서버(120)에서 제공되는 웹 페이지의 일부를 크롤링한다.The
단말 장치(100)는, 대상이 되는 시스템 상에서 선택된 설정 영역으로 설정하고, 해당 영역으로 설정된 웹 정보를 이미지/텍스트로 크롤링하여 마인드 맵 상의 사용자가 선택한 노드(또는 노드에 첨부되는 노트)에 첨부/표시하는 기능을 수행하게 된다.The
웹 크롤링에 의한 마인드맵 생성으로 프로젝트를 위한 자료 수집 및 분석 시스템에 있어서, 단말 장치(100)는, 크롤러 설정에 따라 마인드맵을 생성하는 마인드맵 생성부; 및 사용자의 조작에 따라 웹 사이트 내의 특정 부분이 선택되어 웹 크롤링이 요청되는 경우, 웹 크롤링 설정 인터페이스를 출력하고, 상기 웹 크롤링의 설정 인터페이스를 통해 입력되는 웹 크롤링 설정정보를 저장하며, 상기 웹 크롤링 설정정보에 따라 웹 정보를 크롤링하고, 상기 크롤링 웹 정보를 상기 임의의 노드에 표히하는 웹 크롤링부를 포함할 수 있다.In the data collection and analysis system for a project by generating a mind map by crawling the web, the
상기 웹 크롤링부는, 상기 웹 크롤링을 이용한 마인드맵 생성 이후, 상기 크롤링된 웹 정보를 설정 정보에 따라 사용자 검색어를 기준으로 요약할 수 있다.After generating the mind map using the web crawling, the web crawling unit may summarize the crawled web information based on a user search word according to setting information.
상기 웹 크롤링부는, 상기 사용자의 요청에 의한 웹 주소의 웹 페이지를 표시하는 웹 브라우저를 호출하여 출력하는 웹 브라우저 처리모듈; 상기 웹 페이지의 중요도, 사용자 메모 및 이미지 캡쳐를 포함하는 설정 인터페이스를 사용자에게 제공하고, 상기 설정 인터페이스를 통해 설정되는 설정 정보를 저장하는 사용자정보 처리모듈; 상기 웹 페이지의 주소 정보 및 상기 설정 정보를 포함하는 웹 크롤링 설정정보를 생성 또는 저장하는 웹 크롤링 설정모듈; 및 상기 설정 정보에 따라 웹 정보를 크롤링하고, 크롤링된 웹 정보를 선택된 특정 노드에 표시하는 웹 크롤링 처리모듈을 포함할 수 있다.The web crawling unit may include: a web browser processing module for calling and outputting a web browser displaying a web page of a web address according to the user's request; a user information processing module for providing a user with a setting interface including the importance of the web page, user memo, and image capture, and for storing setting information set through the setting interface; a web crawling setting module for generating or storing web crawling setting information including the address information of the web page and the setting information; and a web crawling processing module that crawls web information according to the setting information and displays the crawled web information on a selected specific node.
또한, 보다 바람직한 본 발명에 따른 단말장치(100)는 마인드맵에 포함된 크롤링된 웹 정보를 사용자의 기능에 따라서 따로 마킹을 진행을 하던가 혹은 메모를 적어놓을 수 있게 함으로써, 해당 노드를 클릭하여 다시 정보에 접근하게 될 때 바로 알 수 있도록 구성될 수 있다. In addition, the more preferable
또한 DB 서버(120) 내부의 사용자 DB(120A)와 전처리 단어 DB(120B)가 존재하게 되는데, 사용자 DB(120A)의 경우에는 각 사용자가 방문한 웹 페이지의 정보를 포함하고 있으며 도 3에 자세히 설명이 되어 있다. In addition, there are a
전처리 단어 DB(120B)는, 단어의 벡터 값과 다른 기술을 적용하여 단어를 처리하기 위한 별도의 DB 모듈이다.The
본 발명의 일 실시예에 따르면, 네트워크는 본 발명에 따른 마인드맵 생성장치(100)와 웹 서버(120) 및 DB 서버(130) 간의 데이터 경로로서 이용되며, 유선 및 무선 등과 같은 그 통신 양태를 가리지 않고 구성될 수 있으며, 단거리 통신망(PAN; Personal Area Network), 근거리 통신망(LAN; Local Area Network), 도시권 통신망(MAN; Metopolitan Area Network), 광역 통신망(WAN; Wide Area Network) 등 다양한 통신망으로 구성될 수 있다.According to an embodiment of the present invention, the network is used as a data path between the mind
웹 브라우저 처리모듈은, 상기 마인드맵 상의 특정 부분이 클릭되는 경우, 상기 클릭에 관련된 클릭 정보를 상기 설정 정보에 따라 변환하여 웹 서버로 마우스 이벤트 정보를 전송하고,The web browser processing module, when a specific part on the mind map is clicked, converts click information related to the click according to the setting information and transmits mouse event information to the web server,
상기 마우스 이벤트 정보에 따라 상기 웹 서버로부터 전송되는 웹 정보를 수신하여 출력할 수 있다. 상기 웹 브라우저 처리모듈은, 상기 웹 정보를 상기 크롤링된 웹 정보가 표시되는 노드에 이미지 또는 텍스트로 표시할 수 있다.The web information transmitted from the web server may be received and output according to the mouse event information. The web browser processing module may display the web information as an image or text on a node where the crawled web information is displayed.
상기 웹 브라우저 처리모듈은, 상기 웹 정보를 상기 웹 브라우저를 호출하여 표시할 수 있다.The web browser processing module may display the web information by calling the web browser.
웹 서버(120)는 네트워크를 통해 접속한 개인용 정보통신기기에 웹 서비스를 제공하기 위한 일반적인 구성을 모두 포함할 수 있다. 본 발명의 실시 예에 있어서, 웹 서버(120)는 사용자의 조작에 따라 접속된 단말 장치(100)로 웹 정보들을 포함하는 웹 페이지를 제공하는 기능을 수행할 수 있다.The
본 발명의 단말 장치(100)의 경우에 접근하는 경로가 많이 때문에, 각각의 생성 장치에 맞는 시스템을 개발하는 것이 아닌 하나의 통합된 웹 서버로 작성을 함으로써 접근성을 용이하게 만들며, 별도의 설치나 베포되는 형태가 되는 것이 아닌 기존의 웹 서버를 접속 함으로서 해결이 된다.In the case of the
도 3은 본 발명의 실시 예에 따라 도 1에 기재된 DB서버 내부의 사용자 DB에 대한 통합 과정의 모습을 나타낸다.3 shows a state of an integration process for a user DB inside the DB server shown in FIG. 1 according to an embodiment of the present invention.
도 3을 참조하면, 해당 사용자 DB(120B)의 경우에 각 사용자 DB의 경우 사용자 테이블(200)으로 각각 나누어져 있으며 통합 테이블(210)으로 통합이 진행이 될 수 있다. Referring to FIG. 3 , in the case of a
각각의 사용자는 고유의 번호를 가지고 있으며, 사용자가 방문한 웹 페이지의 정보를 키워드와 노드 레벨, URL, 외부 참조 URL등의 정보를 포함하고 있으며, 통합을 진행하게 될 때에는 노드 레벨을 메인키로 두어서 통합을 진행할 수 있다.Each user has a unique number, and the information of the web page visited by the user includes information such as keywords, node level, URL, and external reference URL. When integration is carried out, the node level is set as the main key. Integration can proceed.
도 4는 본 발명의 실시 예에 따른 사용자DB의 포맷을 나타낸다.4 shows a format of a user DB according to an embodiment of the present invention.
도 5는 본 발명의 실시 예에 따른 자료 수집 및 분석 시스템에서의 시각화 모듈의 결과물을 나타낸다.5 shows a result of a visualization module in a data collection and analysis system according to an embodiment of the present invention.
도 5를 참조하면, 시각화 모듈(130)에 의해서 나오게 되는 예시 결과물이다. 해당 메인 노드(400)의 경우에 해당 프로젝트에서 먼저 검색한 키워드를 나타낸 모듈이다. 사용자 방문 횟수 표시 모듈(410)의 경우에 해당 사용자들이 중복되서 방문하게 되었을 때, 방문한 횟수를 모듈로 표현을 하여서 추후 분류 알고리즘을 적용하여 사용자에게 분석 기능을 제공하기 위한 기초적인 모듈이다. 태그 모듈(420)의 경우 별도의 사용자가 방문하면서 찾은 자료 중에서 중요하다고 생각하다는 모듈을 별도의 표시를 할 수 있도록 만들어서, 다시 찾는 번거로움이 없도록 제공한다.Referring to FIG. 5 , it is an example result output by the
도 6은 본 발명의 실시 예에 따른 다중 방문 표시줄 및 최소 방문 표시줄을 나타내고, 각 사용자의 생각에 대한 가이드라인을 나타낸다.6 shows a multi-visit bar and a minimum-visit bar according to an embodiment of the present invention, and shows guidelines for the thoughts of each user.
도 6을 참조하면, 도 5에서 보여진 것을 분류 알고리즘을 통해서 다중 방문 표시줄 (500) 및 최소 방문 표시줄(510)을 통해서 어느 자료를 많은 사람들이 찾아서 다수의 생각을 나타내는 것인지 그리고 최소 방문 표시줄을 통해서 소수가 생각했지만 특이한 생각이 있는지 확인하는 가이드라인을 제공하게 된다.Referring to FIG. 6 , through the classification algorithm shown in FIG. 5 , through the
도 7은 본 발명의 실시 예에 따라 프로젝트에 대해 각 사용자가 수집한 자료를 기반으로 편집된 노드가 제공되는 모습을 나타낸다.7 shows a state in which an edited node is provided based on data collected by each user for a project according to an embodiment of the present invention.
도 7을 참조하면, 전체적인 흐름을 보기 위한 별도로 사용자에게 제공되어질 서비스이다. 해당 서비스의 경우 사용자가 수집한 자료를 기반으로 해서 별도의 노드를 제공한 이후에 사용자의 편집에 의해서 해당 노드로 보여지게 된다. Referring to FIG. 7 , it is a service to be separately provided to the user in order to view the overall flow. In the case of the service, after providing a separate node based on the data collected by the user, it is displayed as the corresponding node by the user's editing.
도 8은 본 발명의 실시 예에 따라 핵심단어 모듈의 선택시 배열되는 연관 검색어 모듈의 모습을 나타낸다.8 shows a state of a related search word module arranged when a key word module is selected according to an embodiment of the present invention.
도 8을 참조하면, 사용자들이 찾은 자료들을 분석을 통해서 도 1에서 전처리 단어 DB(120B)를 이용하여서 핵심단어 모듈(700)을 분석을 하여서 연관 검색어 모듈(710)을 만들어서 해당 핵심단어 모듈(700)을 누르게 되면 연관 검색어 모듈(710)이 나오도록 설정을 한다. Referring to FIG. 8 , the
위의 모든 도면은 구성도의 단말 장치(100)을 통하여서 편집 및 분석을 실행할 수 있으며, 기존에 이러한 시스템을 구성하여서 별도의 서비스를 제공하려고 한다.All of the above drawings can be edited and analyzed through the
이상에서 대표적인 실시예를 통하여 본 발명을 상세하게 설명하였으나, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 상술한 실시예에 대하여 본 발명의 범주에서 벗어나지 않는 한도 내에서 다양한 변형이 가능함을 이해할 것이다. 그러므로 본 발명의 권리 범위는 설명한 실시예에 국한되어 정해져서는 안 되며, 후술하는 특허청구범위뿐만 아니라 특허청구범위와 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태에 의하여 정해져야 한다.Although the present invention has been described in detail through representative embodiments above, those of ordinary skill in the art will understand that various modifications are possible within the limits without departing from the scope of the present invention with respect to the above-described embodiments. will be. Therefore, the scope of the present invention should not be limited to the described embodiments, but should be defined by all changes or modifications derived from the claims and equivalent concepts as well as the claims to be described later.
100 : 단말 장치 110 : 웹 서버
110A : 인터넷 120 : DB 서버
120A : 사용자 DB 120B : 전처리 단어 DB
130 : 시각화 모듈 200 : 사용자 테이블
210 : 통합 테이블 400 : 메인 노드
410 : 사용자 방문 횟수 표시 모듈 420 : 태그 모듈
500 : 다중 방문 표시줄 510 : 최소 방문 표시줄
600 : 프로젝트 명 610 : 아이디어 프로세스 모듈
700 : 핵심단어 모듈 710 : 연관 검색어 모듈100: terminal device 110: web server
110A: Internet 120: DB Server
120A:
130: visualization module 200: user table
210: unified table 400: main node
410: user visit count display module 420: tag module
500: multi-visit bar 510: minimum visit bar
600: project name 610: idea process module
700: key word module 710: related search word module
Claims (12)
(a) 마인드맵 생성부에서 크롤러 설정에 따라 마인드맵을 생성하는 단계;
(b) 사용자의 웹 접속에 기반하여 자료 수집 및 분석을 수행하는 시스템 내의 마인드맵 상에 임의의 노드가 생성되고 상기 사용자의 조작에 따라 웹 사이트 내의 특정 부분이 선택되어 상기 웹 크롤링이 요청되는 단계;
(c) 상기 요청에 대응되어 입력된 정보에 따라 상기 웹 크롤링의 접속 정보 또는 사용 정보를 포함하는 웹 크롤링 설정 정보가 저장되는 단계; 및
(d) 상기 설정 정보에 따라 웹 정보를 상기 웹에서 크롤링하고, 크롤링된 웹 정보를 상기 임의의 노드에 표시하는 단계를 포함하고,
상기 마인드맵의 생성 이후, 상기 크롤링된 웹 정보를 상기 설정 정보에 따라 사용자 검색어를 기준으로 요약하는 것을 특징으로 하는 프로젝트를 위한 자료 수집 및 분석 시스템의 구축 방법.
In the method of constructing a data collection and analysis system for a project using web crawling,
(a) generating a mind map according to the crawler settings in the mind map generation unit;
(b) a step in which a random node is created on a mind map in a system that performs data collection and analysis based on a user's web access, a specific part in the web site is selected according to the user's operation, and the web crawling is requested ;
(c) storing web crawling setting information including access information or usage information of the web crawling according to information input in response to the request; and
(d) crawling web information on the web according to the setting information, and displaying the crawled web information on the arbitrary node,
After generating the mind map, the method of constructing a data collection and analysis system for a project, characterized in that the crawled web information is summarized based on a user search word according to the setting information.
상기 (b)단계는,
(b1) 웹 브라우저를 호출하는 단계;
(b2) 입력된 키워드에 기반하여 특정 웹 페이지를 상기 웹 브라우저를 통해 출력하는 단계;
(b3) 상기 웹 크롤링 설정 정보에 따라 상기 웹 페이지 중 소정의 영역을 선택 영역으로 설정하는 단계; 및
(b4) 상기 웹 페이지의 주소 정보, 상기 선택 영역에서 추출된 데이터 및 상기 사용자의 메모를 포함한 상기 웹 크롤링 설정 정보를 생성 또는 저장하는 단계를 포함하는 프로젝트를 위한 자료 수집 및 분석 시스템의 구축 방법.
The method of claim 1,
Step (b) is,
(b1) calling a web browser;
(b2) outputting a specific web page through the web browser based on the input keyword;
(b3) setting a predetermined area of the web page as a selection area according to the web crawling setting information; and
(b4) The method of constructing a data collection and analysis system for a project, comprising the step of generating or storing the web crawling setting information including the address information of the web page, the data extracted from the selection area, and the user's memo.
상기 마인드맵의 생성 이후,
(d1) 상기 마인드맵에 대한 “열기(open)” 요청이 있는지 검색 또는 판단하는 단계; 및
(d2) 상기 “열기(open)” 요청이 입력된 웹 정보 및 상기 사용자의 메모를 상기 임의의 노드에 표시하는 단계를 포함하는 프로젝트를 위한 자료 수집 및 분석 시스템의 구축 방법.
The method of claim 1,
After generating the mind map,
(d1) retrieving or determining whether there is an “open” request for the mind map; and
(d2) The method of constructing a data collection and analysis system for a project comprising the step of displaying the web information to which the "open" request is input and the user's memo on the arbitrary node.
상기 마인드맵의 생성은,
(e1) 상기 크롤링된 웹 정보를 포함하는 마인드맵에서 상기 크롤링된 웹 정보가 들어있는 특정 부분이 클릭되는지 여부를 판단하는 단계; 및
(e2) 상기 클릭이 판단되는 경우, 상기 웹 크롤링의 설정 정보에 따라 변환되어 별도의 페이지로 마우스 이벤트 정보를 전송하는 단계를 포함하는 프로젝트를 위한 자료 수집 및 분석 시스템의 구축 방법.
The method of claim 1,
The generation of the mind map is,
(e1) determining whether a specific part containing the crawled web information is clicked in the mind map including the crawled web information; and
(e2) when it is determined that the click is converted according to the setting information of the web crawling, the method of constructing a data collection and analysis system for a project comprising the step of transmitting mouse event information to a separate page.
상기 (e2)단계는,
상기 웹 정보가 표시되는 노드에 상기 웹 정보를 이미지 또는 텍스트로 표시하는 것을 특징으로 하는 프로젝트를 위한 자료 수집 및 분석 시스템의 구축 방법.
5. The method of claim 4,
The step (e2) is,
A method of constructing a data collection and analysis system for a project, characterized in that the web information is displayed as an image or text on a node where the web information is displayed.
상기 (e2)단계는,
상기 웹 정보를 별도의 웹 브라우저로 표시하는 것을 특징으로 하는 프로젝트를 위한 자료 수집 및 분석 시스템의 구축 방법.
5. The method of claim 4,
The step (e2) is,
A method of constructing a data collection and analysis system for a project, characterized in that the web information is displayed in a separate web browser.
A computer-readable recording medium recording a program for executing the method of any one of claims 1 to 6.
크롤러 설정에 따라 마인드맵을 생성하는 마인드맵 생성부; 및
사용자의 조작에 따라 웹 사이트 내의 특정 부분이 선택되어 웹 크롤링이 요청되는 경우, 웹 크롤링 설정 인터페이스를 출력하고, 상기 웹 크롤링의 설정 인터페이스를 통해 입력되는 웹 크롤링 설정정보를 저장하며, 상기 웹 크롤링 설정정보에 따라 웹 정보를 크롤링하고, 상기 크롤링된 웹 정보를 상기 임의의 노드에 표시하는 웹 크롤링부를 포함하고,
상기 웹 크롤링부는,
상기 웹 크롤링을 이용한 마인드맵 생성 이후, 상기 크롤링된 웹 정보를 설정 정보에 따라 사용자 검색어를 기준으로 요약하는 것을 특징으로 하는 프로젝트를 위한 자료 수집 및 분석 시스템.
In a data collection and analysis system for a project by creating a mind map by web crawling,
a mind map generator that generates a mind map according to the crawler settings; and
When a specific part in the website is selected according to a user's operation and web crawling is requested, a web crawling setting interface is outputted, web crawling setting information input through the web crawling setting interface is stored, and the web crawling setting A web crawling unit that crawls web information according to the information and displays the crawled web information on the arbitrary node,
The web crawling unit,
After generating the mind map using the web crawling, the data collection and analysis system for a project, characterized in that the crawled web information is summarized based on a user search word according to setting information.
상기 웹 크롤링부는,
상기 사용자의 요청에 의한 웹 주소의 웹 페이지를 표시하는 웹 브라우저를 호출하여 출력하는 웹 브라우저 처리모듈;
상기 웹 페이지의 중요도, 사용자 메모 및 이미지 캡쳐를 포함하는 설정 인터페이스를 사용자에게 제공하고, 상기 설정 인터페이스를 통해 설정되는 설정 정보를 저장하는 사용자정보 처리모듈;
상기 웹 페이지의 주소 정보 및 상기 설정 정보를 포함하는 웹 크롤링 설정정보를 생성 또는 저장하는 웹 크롤링 설정모듈; 및
상기 설정 정보에 따라 웹 정보를 크롤링하고, 크롤링된 웹 정보를 선택된 특정 노드에 표시하는 웹 크롤링 처리모듈을 포함하는 프로젝트를 위한 자료 수집 및 분석 시스템.
9. The method of claim 8,
The web crawling unit,
a web browser processing module for calling and outputting a web browser displaying a web page of a web address according to the user's request;
a user information processing module for providing a user with a setting interface including the importance of the web page, user memo, and image capture, and for storing setting information set through the setting interface;
a web crawling setting module for generating or storing web crawling setting information including the address information of the web page and the setting information; and
A data collection and analysis system for a project comprising a web crawling processing module that crawls web information according to the setting information and displays the crawled web information on a selected specific node.
상기 웹 브라우저 처리모듈은,
상기 마인드맵 상의 특정 부분이 클릭되는 경우, 상기 설정 정보에 따라 변환하여 웹 서버로 마우스 이벤트 정보를 전송하고,
상기 마우스 이벤트 정보에 따라 상기 웹 서버로부터 전송되는 웹 정보를 수신하여 출력하는 것을 특징으로 하는 프로젝트를 위한 자료 수집 및 분석 시스템.
10. The method of claim 9,
The web browser processing module,
When a specific part on the mind map is clicked, it converts according to the setting information and transmits mouse event information to the web server,
Data collection and analysis system for a project, characterized in that receiving and outputting web information transmitted from the web server according to the mouse event information.
상기 웹 브라우저 처리모듈은,
상기 웹 정보를 상기 크롤링된 웹 정보가 표시되는 노드에 이미지 또는 텍스트로 표시하는 것을 특징으로 하는 프로젝트를 위한 자료 수집 및 분석 시스템.
11. The method of claim 10,
The web browser processing module,
Data collection and analysis system for a project, characterized in that the web information is displayed as an image or text on a node where the crawled web information is displayed.
상기 웹 브라우저 처리모듈은,
상기 웹 정보를 상기 웹 브라우저를 호출하여 표시하는 것을 특징으로 하는 프로젝트를 위한 자료 수집 및 분석 시스템.11. The method of claim 10,
The web browser processing module,
Data collection and analysis system for a project, characterized in that the web information is displayed by calling the web browser.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020190144516A KR102275135B1 (en) | 2019-11-12 | 2019-11-12 | Data collection and analyzing system and construction method of the same for project |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020190144516A KR102275135B1 (en) | 2019-11-12 | 2019-11-12 | Data collection and analyzing system and construction method of the same for project |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20210057583A KR20210057583A (en) | 2021-05-21 |
| KR102275135B1 true KR102275135B1 (en) | 2021-07-09 |
Family
ID=76157699
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020190144516A Active KR102275135B1 (en) | 2019-11-12 | 2019-11-12 | Data collection and analyzing system and construction method of the same for project |
Country Status (1)
| Country | Link |
|---|---|
| KR (1) | KR102275135B1 (en) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN114611025B (en) * | 2022-03-17 | 2024-08-30 | 杭州云深科技有限公司 | Data processing system for acquiring thinking guide diagram |
| CN114936069B (en) * | 2022-05-30 | 2024-03-22 | 易协云(杭州)科技有限公司 | Method and system for carrying out project display by utilizing brain map |
| KR102567371B1 (en) * | 2022-11-18 | 2023-08-16 | (주)아이와즈 | Human-like website crawling system and method for bypassing bot detection |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CA2902485C (en) * | 2013-02-25 | 2019-05-21 | Patrick Soon-Shiong | Link association analysis systems and methods |
| KR101785481B1 (en) | 2015-10-07 | 2017-11-15 | 한국정보통신주식회사 | Method for providing scraping service, server and system thereof |
-
2019
- 2019-11-12 KR KR1020190144516A patent/KR102275135B1/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| KR20210057583A (en) | 2021-05-21 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Lee et al. | Context-aware risk management for architectural heritage using historic building information modeling and virtual reality | |
| US7840604B2 (en) | Method, apparatus and computer program for managing the processing of extracted data | |
| US7424488B2 (en) | Context-aware, adaptive approach to information selection for interactive information analysis | |
| Liu et al. | Data-driven composition for service-oriented situational web applications | |
| US20100318492A1 (en) | Data analysis system and method | |
| US20080301094A1 (en) | Method, apparatus and computer program for managing the processing of extracted data | |
| US8458187B2 (en) | Methods and systems for visualizing topic location in a document redundancy graph | |
| JP2022505837A (en) | Knowledge search system | |
| KR102275135B1 (en) | Data collection and analyzing system and construction method of the same for project | |
| Zagorulko et al. | Ontology-based technology for development of intelligent scientific internet resources | |
| Bone et al. | A geospatial search engine for discovering multi-format geospatial data across the web | |
| Gregory et al. | Human-centered data discovery | |
| JPWO2003060764A1 (en) | Information retrieval system | |
| Rivai et al. | Multimedia big data computing mechanisms: a bibliometric analysis | |
| Berre et al. | Big data and AI pipeline framework: Technology analysis from a benchmarking perspective | |
| JP2021503652A (en) | Automatically connect external data to business analysis processing | |
| JP5639549B2 (en) | Information retrieval apparatus, method, and program | |
| Śpiewanowski et al. | Applications of web scraping in economics and finance | |
| CN116010679A (en) | Data processing method and electronic device | |
| Shah | Supporting research data collection from YouTube with TubeKit | |
| KR20050070955A (en) | Method of scientific information analysis and media that can record computer program thereof | |
| El Mhouti et al. | A web scraping framework for descriptive analysis of meteorological big data for decision-making purposes | |
| KR100361773B1 (en) | Method for constructing search engine of website in internet | |
| Cheng et al. | Context-based page unit recommendation for web-based sensemaking tasks | |
| CN113626028B (en) | Page element mapping method and device |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0109 | Patent application |
St.27 status event code: A-0-1-A10-A12-nap-PA0109 |
|
| PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-3-3-R10-R18-oth-X000 |
|
| PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
St.27 status event code: A-1-2-D10-D22-exm-PE0701 |
|
| PR0701 | Registration of establishment |
St.27 status event code: A-2-4-F10-F11-exm-PR0701 |
|
| PR1002 | Payment of registration fee |
St.27 status event code: A-2-2-U10-U11-oth-PR1002 Fee payment year number: 1 |
|
| PG1601 | Publication of registration |
St.27 status event code: A-4-4-Q10-Q13-nap-PG1601 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 4 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 5 |
|
| R18 | Changes to party contact information recorded |
Free format text: ST27 STATUS EVENT CODE: A-5-5-R10-R18-OTH-X000 (AS PROVIDED BY THE NATIONAL OFFICE) |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |