[go: up one dir, main page]

KR102375507B1 - 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치 및 그 동작 방법 - Google Patents

문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치 및 그 동작 방법 Download PDF

Info

Publication number
KR102375507B1
KR102375507B1 KR1020200031773A KR20200031773A KR102375507B1 KR 102375507 B1 KR102375507 B1 KR 102375507B1 KR 1020200031773 A KR1020200031773 A KR 1020200031773A KR 20200031773 A KR20200031773 A KR 20200031773A KR 102375507 B1 KR102375507 B1 KR 102375507B1
Authority
KR
South Korea
Prior art keywords
keyword
important
keywords
entity
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
KR1020200031773A
Other languages
English (en)
Other versions
KR20210115670A (ko
Inventor
홍승현
전창현
안치연
서종성
최혜영
Original Assignee
주식회사 한글과컴퓨터
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 한글과컴퓨터 filed Critical 주식회사 한글과컴퓨터
Priority to KR1020200031773A priority Critical patent/KR102375507B1/ko
Publication of KR20210115670A publication Critical patent/KR20210115670A/ko
Application granted granted Critical
Publication of KR102375507B1 publication Critical patent/KR102375507B1/ko
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/258Heading extraction; Automatic titling; Numbering
    • G06K9/6201

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치 및 그 동작 방법이 개시된다. 본 발명에 따른 전자 장치 및 그 동작 방법은 문서에 삽입된 개체의 중점으로부터 기설정된(predetermined) 거리 이내에 포함되어 있는 복수의 단어들을 추출한 후, 상기 복수의 단어들에 적용되어 있는 글자 서식을 고려하여 상기 개체에 관련된 중요 키워드들을 선정하고, 상기 개체와 상기 선정된 중요 키워드들이 서로 대응되도록 개체 키워드 테이블에 기록함으로써, 사용자가 중요 키워드를 기초로 자신이 원하는 개체를 검색할 수 있도록 지원할 수 있다.

Description

문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치 및 그 동작 방법{ELECTRONIC DEVICE THAT SUPPORTS RETRIEVAL OF OBJECTS FROM DOCUMENT BY MATCHING OBJECTS AND KEYWORDS INSERTED INTO DOCUMENT AND OPERATING METHOD THEREOF}
본 발명은 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치 및 그 동작 방법에 대한 것이다.
최근, 컴퓨터나 스마트폰 또는 태블릿 PC 등이 널리 보급됨에 따라, 이러한 전자 장치를 이용하여 전자 문서를 열람, 작성, 편집할 수 있도록 하는 다양한 종류의 전자 문서 관련 프로그램들이 출시되고 있다.
이러한 전자 문서 관련 프로그램들로는 기본적인 문서의 작성, 편집 등을 지원하는 워드프로세서, 데이터의 입력, 산술연산, 데이터 관리를 보조하는 스프레드시트, 발표자의 발표를 보조하기 위한 프레젠테이션 프로그램들이 있다.
관련하여, 사용자는 전자 문서 관련 프로그램 상에서 다수의 페이지로 구성된 문서를 편집하는 중, 화면 상에 표시되고 있는 문서의 부분 외에 다른 부분을 참조하려는 경우, 참조하려는 부분과 관련된 키워드를 검색함에 따라 해당 키워드가 삽입되어 있는 문서의 페이지로 화면이 이동하도록 지원하는 '텍스트 검색 기능'을 활용할 수 있다.
다만, 전자 문서에는 텍스트 외에도 이미지, 표, 차트 등과 같은 개체들이 삽입될 수 있는데, 기존의 전자 문서 관련 프로그램들은 텍스트 검색 기능만을 지원할 뿐, 개체 검색 기능은 지원하지 않아 사용자가 문서에 삽입된 다수의 개체들 중 어느 하나의 개체를 참조하려는 경우, 문서 전체에 삽입된 개체들을 하나씩 확인하여 찾아낼 수 밖에 없다는 불편함이 존재하였다.
만약, 문서에 개체가 삽입되는 경우, 해당 개체와 관련된 중요 키워드들을 선정해 둔 후 상기 선정된 중요 키워드들을 기초로 사용자가 해당 개체를 검색할 수 있도록 하는 개체 검색 기능을 지원한다면, 사용자가 문서에서 자신이 원하는 개체를 키워드를 기반으로 쉽게 검색할 수 있을 것이다.
따라서, 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 기술에 대한 연구가 필요하다.
본 발명에 따른 전자 장치 및 그 동작 방법은 문서에 삽입된 개체의 중점으로부터 기설정된(predetermined) 거리 이내에 포함되어 있는 복수의 단어들을 추출한 후, 상기 복수의 단어들에 적용되어 있는 글자 서식을 고려하여 상기 개체에 관련된 중요 키워드들을 선정하고, 상기 개체와 상기 선정된 중요 키워드들이 서로 대응되도록 개체 키워드 테이블에 기록함으로써, 사용자가 중요 키워드를 기초로 자신이 원하는 개체를 검색할 수 있도록 지원하고자 한다.
본 발명의 일실시예에 따른 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치는 문서에 삽입되어 있는 복수의 개체들 각각에 대한 고유 식별자와 상기 복수의 개체들 각각에 관련된 중요 키워드들이 서로 대응되어 기록되어 있는 개체 키워드 테이블을 저장하여 유지하는 개체 키워드 테이블 유지부, 글자에 대해서 적용 가능한 것으로 미리 지정된 서로 다른 종류의 복수의 글자 서식 카테고리들과 상기 복수의 글자 서식 카테고리들 각각에서 지정 가능한 서식 속성 값별로 미리 지정된 중요도 할당 점수가 기록되어 있는 점수 테이블을 저장하여 유지하는 점수 테이블 유지부, 사용자에 의해 상기 문서에 제1 개체가 신규로 삽입되면, 상기 제1 개체에 대한 고유 식별자를 생성하는 고유 식별자 생성부, 상기 문서에 삽입되어 있는 텍스트에서, 상기 제1 개체의 중점으로부터 기설정된(predetermined) 거리 이내에 포함되어 있는 복수의 단어들을 추출하는 단어 추출부, 상기 복수의 단어들 각각에 적용되어 있는 상기 복수의 글자 서식 카테고리들 각각의 서식 속성 값을 확인하는 서식 속성 확인부, 상기 복수의 단어들 각각에 대해, 상기 점수 테이블을 참조하여 각 단어에 적용된 상기 복수의 글자 서식 카테고리들 각각의 서식 속성 값별 중요도 할당 점수의 총 합계를 연산하고, 상기 복수의 단어들 각각에 대해 연산된 총 합계를 각 단어의 중요도 점수로 지정하는 중요도 점수 지정부, 상기 복수의 단어들 중 중요도 점수가 높은 순서로 미리 지정된 개수만큼 단어들을 선택하고, 상기 선택된 단어들을 상기 제1 개체에 관련된 중요 키워드들인 제1 중요 키워드들로 선정하는 중요 키워드 선정부, 상기 제1 중요 키워드들이 선정되면, 상기 개체 키워드 테이블에 상기 제1 개체에 대한 고유 식별자와 상기 제1 중요 키워드들을 서로 대응시켜 기록하는 중요 키워드 기록부 및 상기 사용자로부터 적어도 하나의 검색 키워드가 입력되면서, 상기 적어도 하나의 검색 키워드에 기초한 개체 검색 명령이 수신되면, 상기 개체 키워드 테이블로부터 상기 적어도 하나의 검색 키워드와 일치하는 키워드를 중요 키워드들 내에서 최대로 포함하고 있는 제2 개체에 대한 고유 식별자를 검색한 후, 상기 제2 개체가 검색 결과로 화면 상에 표시되도록 상기 문서에서 상기 제2 개체가 삽입되어 있는 지점으로 화면을 이동시키는 개체 검색부를 포함한다.
또한, 본 발명의 일실시예에 따른 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치의 동작 방법은 문서에 삽입되어 있는 복수의 개체들 각각에 대한 고유 식별자와 상기 복수의 개체들 각각에 관련된 중요 키워드들이 서로 대응되어 기록되어 있는 개체 키워드 테이블을 저장하여 유지하는 단계, 글자에 대해서 적용 가능한 것으로 미리 지정된 서로 다른 종류의 복수의 글자 서식 카테고리들과 상기 복수의 글자 서식 카테고리들 각각에서 지정 가능한 서식 속성 값별로 미리 지정된 중요도 할당 점수가 기록되어 있는 점수 테이블을 저장하여 유지하는 단계, 사용자에 의해 상기 문서에 제1 개체가 신규로 삽입되면, 상기 제1 개체에 대한 고유 식별자를 생성하는 단계, 상기 문서에 삽입되어 있는 텍스트에서, 상기 제1 개체의 중점으로부터 기설정된 거리 이내에 포함되어 있는 복수의 단어들을 추출하는 단계, 상기 복수의 단어들 각각에 적용되어 있는 상기 복수의 글자 서식 카테고리들 각각의 서식 속성 값을 확인하는 단계, 상기 복수의 단어들 각각에 대해, 상기 점수 테이블을 참조하여 각 단어에 적용된 상기 복수의 글자 서식 카테고리들 각각의 서식 속성 값별 중요도 할당 점수의 총 합계를 연산하고, 상기 복수의 단어들 각각에 대해 연산된 총 합계를 각 단어의 중요도 점수로 지정하는 단계, 상기 복수의 단어들 중 중요도 점수가 높은 순서로 미리 지정된 개수만큼 단어들을 선택하고, 상기 선택된 단어들을 상기 제1 개체에 관련된 중요 키워드들인 제1 중요 키워드들로 선정하는 단계, 상기 제1 중요 키워드들이 선정되면, 상기 개체 키워드 테이블에 상기 제1 개체에 대한 고유 식별자와 상기 제1 중요 키워드들을 서로 대응시켜 기록하는 단계 및 상기 사용자로부터 적어도 하나의 검색 키워드가 입력되면서, 상기 적어도 하나의 검색 키워드에 기초한 개체 검색 명령이 수신되면, 상기 개체 키워드 테이블로부터 상기 적어도 하나의 검색 키워드와 일치하는 키워드를 중요 키워드들 내에서 최대로 포함하고 있는 제2 개체에 대한 고유 식별자를 검색한 후, 상기 제2 개체가 검색 결과로 화면 상에 표시되도록 상기 문서에서 상기 제2 개체가 삽입되어 있는 지점으로 화면을 이동시키는 단계를 포함한다.
본 발명에 따른 전자 장치 및 그 동작 방법은 문서에 삽입된 개체의 중점으로부터 기설정된(predetermined) 거리 이내에 포함되어 있는 복수의 단어들을 추출한 후, 상기 복수의 단어들에 적용되어 있는 글자 서식을 고려하여 상기 개체에 관련된 중요 키워드들을 선정하고, 상기 개체와 상기 선정된 중요 키워드들이 서로 대응되도록 개체 키워드 테이블에 기록함으로써, 사용자가 중요 키워드를 기초로 자신이 원하는 개체를 검색할 수 있도록 지원할 수 있다.
도 1은 본 발명의 일실시예에 따른 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치의 구조를 도시한 도면이다.
도 2와 도 3은 본 발명의 일실시예에 따른 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치를 설명하기 위한 도면이다.
도 4는 본 발명의 일실시예에 따른 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치의 동작 방법을 도시한 순서도이다.
이하에서는 본 발명에 따른 실시예들을 첨부된 도면을 참조하여 상세하게 설명하기로 한다. 이러한 설명은 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였으며, 다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 본 명세서 상에서 사용되는 모든 용어들은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 사람에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다.
본 문서에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있다는 것을 의미한다. 또한, 본 발명의 다양한 실시예들에 있어서, 각 구성요소들, 기능 블록들 또는 수단들은 하나 또는 그 이상의 하부 구성요소로 구성될 수 있고, 각 구성요소들이 수행하는 전기, 전자, 기계적 기능들은 전자회로, 집적회로, ASIC(Application Specific Integrated Circuit) 등 공지된 다양한 소자들 또는 기계적 요소들로 구현될 수 있으며, 각각 별개로 구현되거나 2 이상이 하나로 통합되어 구현될 수도 있다.
한편, 첨부된 블록도의 블록들이나 흐름도의 단계들은 범용 컴퓨터, 특수용 컴퓨터, 휴대용 노트북 컴퓨터, 네트워크 컴퓨터 등 데이터 프로세싱이 가능한 장비의 프로세서나 메모리에 탑재되어 지정된 기능들을 수행하는 컴퓨터 프로그램 명령들(instructions)을 의미하는 것으로 해석될 수 있다. 이들 컴퓨터 프로그램 명령들은 컴퓨터 장치에 구비된 메모리 또는 컴퓨터에서 판독 가능한 메모리에 저장될 수 있기 때문에, 블록도의 블록들 또는 흐름도의 단계들에서 설명된 기능들은 이를 수행하는 명령 수단을 내포하는 제조물로 생산될 수도 있다. 아울러, 각 블록 또는 각 단계는 특정된 논리적 기능(들)을 실행하기 위한 하나 이상의 실행 가능한 명령들을 포함하는 모듈, 세그먼트 또는 코드의 일부를 나타낼 수 있다. 또, 몇 가지 대체 가능한 실시예들에서는 블록들 또는 단계들에서 언급된 기능들이 정해진 순서와 달리 실행되는 것도 가능함을 주목해야 한다. 예컨대, 잇달아 도시되어 있는 두 개의 블록들 또는 단계들은 실질적으로 동시에 수행되거나, 역순으로 수행될 수 있으며, 경우에 따라 일부 블록들 또는 단계들이 생략된 채로 수행될 수도 있다.
도 1은 본 발명의 일실시예에 따른 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치의 구조를 도시한 도면이다.
도 1을 참조하면, 본 발명의 일실시예에 따른 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치(110)는 개체 키워드 테이블 유지부(111), 점수 테이블 유지부(112), 고유 식별자 생성부(113), 단어 추출부(114), 서식 속성 확인부(115), 중요도 점수 지정부(116), 중요 키워드 선정부(117), 중요 키워드 기록부(118) 및 개체 검색부(119)를 포함한다.
개체 키워드 테이블 유지부(111)는 문서에 삽입되어 있는 복수의 개체들 각각에 대한 고유 식별자와 상기 복수의 개체들 각각에 관련된 중요 키워드들이 서로 대응되어 기록되어 있는 개체 키워드 테이블을 저장하여 유지한다.
예컨대, 상기 개체 키워드 테이블에는 하기의 표 1과 같이 정보가 기록되어 있을 수 있다.
개체에 대한 고유 식별자 개체에 관련된 중요 키워드들
개체 1에 대한 고유 식별자 1 2017년
한글과컴퓨터
매출현황
개체 2에 대한 고유 식별자 2 2016년
서울시
흡연율
점수 테이블 유지부(112)는 글자에 대해서 적용 가능한 것으로 미리 지정된 서로 다른 종류의 복수의 글자 서식 카테고리들과 상기 복수의 글자 서식 카테고리들 각각에서 지정 가능한 서식 속성 값별로 미리 지정된 중요도 할당 점수가 기록되어 있는 점수 테이블을 저장하여 유지한다.
여기서, 복수의 글자 서식 카테고리들이란 문서에 포함된 글자에 적용할 수 있는 글꼴, 색상, 크기 등과 같은 소정의 서식 카테고리들을 의미하며, 서식 속성 값이란 각 글자 서식 카테고리에 대해 설정할 수 있는 속성 값으로, '글꼴'이라는 글자 서식 카테고리에 대해서는 '명조체', '고딕체' 등이 서식 속성 값이 될 수 있고, '색상'이라는 글자 서식 카테고리에 대해서는 '검은색', '빨간색' 등이 서식 속성 값이 될 수 있다.
이때, 상기 점수 테이블에는 하기의 표 2와 같이 정보가 기록되어 있을 수 있다.
복수의 글자 서식 카테고리들 서식 속성 값 중요도 할당 점수
글꼴 명조체 1점
고딕체 2점
궁서체 10점
... ..
색상 검은색 1점
빨간색 10점
파란색 5점
... ...
크기 0pt~10pt 1점
11pt~13pt 4점
13pt~15pt 8점
... ...
... ... ...
고유 식별자 생성부(113)는 사용자에 의해 상기 문서에 제1 개체가 신규로 삽입되면, 상기 제1 개체에 대한 고유 식별자를 생성한다.
단어 추출부(114)는 상기 문서에 삽입되어 있는 텍스트에서, 상기 제1 개체의 중점으로부터 기설정된(predetermined) 거리 이내에 포함되어 있는 복수의 단어들을 추출한다.
이때, 단어 추출부(114)는 상기 문서에 삽입되어 있는 텍스트에 대해 형태소 분석을 수행하여 상기 복수의 단어들을 추출할 수 있고, 상기 복수의 단어들 간에는 동일한 단어가 중복해서 존재할 수 있다. 만약, 상기 문서에 '문장 1', '문장 2'가 존재한다고 할 때, '문장 1'에서 '컴퓨터'라는 단어가 존재하고, '문장 2'에서도 '컴퓨터'라는 단어가 존재한다고 하면, 단어 추출부(114)는 '문장 1'과 '문장 2' 각각으로부터 '컴퓨터'라는 단어를 추출할 수 있다.
예컨대, 도 2에 도시된 바와 같이 문서(211)가 존재한다고 가정하면, 단어 추출부(114)는 문서(211)에 삽입되어 있는 텍스트에서, 제1 개체(212)의 중점(213)으로부터 기설정된 거리(214) 이내를 나타내는 파란색 바탕의 원 내부에 포함되어 있는 '특허', '상표', '디자인'을 추출할 수 있을 것이다.
서식 속성 확인부(115)는 상기 복수의 단어들 각각에 적용되어 있는 상기 복수의 글자 서식 카테고리들 각각의 서식 속성 값을 확인한다.
중요도 점수 지정부(116)는 상기 복수의 단어들 각각에 대해, 상기 점수 테이블을 참조하여 각 단어에 적용된 상기 복수의 글자 서식 카테고리들 각각의 서식 속성 값별 중요도 할당 점수의 총 합계를 연산하고, 상기 복수의 단어들 각각에 대해 연산된 총 합계를 각 단어의 중요도 점수로 지정한다.
예컨대, 상기 복수의 단어들 중 '특허'라는 단어가 존재하고, '특허'라는 단어의 글꼴이 '명조체', 색상이 '빨간색', 크기가 '11pt'라고 하는 경우, 중요도 점수 지정부(116)는 '특허'라는 단어에 적용된 글자 서식 카테고리들 각각의 서식 속성 값별 중요도 점수인 '1점', '10점', '4점'의 총 합계인 '15점'을 '특허'라는 단어에 대한 중요도 점수로 지정할 수 있다.
중요 키워드 선정부(117)는 상기 복수의 단어들 중 중요도 점수가 높은 순서로 미리 지정된 개수만큼 단어들을 선택하고, 상기 선택된 단어들을 상기 제1 개체에 관련된 중요 키워드들인 제1 중요 키워드들로 선정한다.
예컨대, 상기 미리 지정된 개수가 '3개'라고 하는 경우, 중요 키워드 선정부(117)는 상기 복수의 단어들 중 중요도 점수가 높은 순서로 '3개'의 단어들을 선택하고, 상기 선택된 '3개'의 단어들을 상기 제1 개체에 관련된 중요 키워드들인 상기 제1 중요 키워드들로 선정할 수 있다.
이때, 본 발명의 일실시예에 따르면, 중요 키워드 선정부(117)는 상기 미리 지정된 개수만큼 단어들을 선택할 때, 중요도 점수가 동률인 단어가 존재하는 경우, 상기 미리 지정된 개수만큼 중요도 점수가 동률인 단어들을 상기 제1 중요 키워드들로 선정하고, 마지막 순번에서 동률인 단어가 존재하면, 랜덤하게 단어를 선택하는 방식으로 상기 미리 지정된 개수까지의 단어를 선택함으로써, 상기 제1 중요 키워드들의 선정을 완료할 수 있다.
중요 키워드 기록부(118)는 상기 제1 중요 키워드들이 선정되면, 상기 개체 키워드 테이블에 상기 제1 개체에 대한 고유 식별자와 상기 제1 중요 키워드들을 서로 대응시켜 기록한다.
예컨대, 상기 제1 개체가 '개체 3'이고, 고유 식별자 생성부(113)에 의해 상기 제1 개체인 '개체 3'에 대해 '고유 식별자 3'이 생성되었으며, 중요 키워드 선정부(117)에 의해 '개체 3'에 관련된 제1 중요 키워드들로 '특허', '상표', '디자인'이 선정되었다고 가정하는 경우, 중요 키워드 기록부(118)는 상기 표 1과 같은 상기 개체 키워드 테이블에 하기의 표 3과 같이 '개체 3'에 대한 '고유 식별자 3'과 '개체 3'에 관련된 제1 중요 키워드들인 '특허', '상표', '디자인'을 서로 대응시켜 기록할 수 있다.
개체에 대한 고유 식별자 중요 키워드들
개체 1에 대한 고유 식별자 1 2017년
한글과컴퓨터
매출현황
개체 2에 대한 고유 식별자 2 2016년
서울시
흡연율
개체 3에 대한 고유 식별자 3 특허
상표
디자인
개체 검색부(119)는 상기 사용자로부터 적어도 하나의 검색 키워드가 입력되면서, 상기 적어도 하나의 검색 키워드에 기초한 개체 검색 명령이 수신되면, 상기 개체 키워드 테이블로부터 상기 적어도 하나의 검색 키워드와 일치하는 키워드를 중요 키워드들 내에서 최대로 포함하고 있는 제2 개체에 대한 고유 식별자를 검색한 후, 상기 제2 개체가 검색 결과로 화면 상에 표시되도록 상기 문서에서 상기 제2 개체가 삽입되어 있는 지점으로 화면을 이동시킨다.
즉, 상기 개체 키워드 테이블에 각 개체에 대한 고유 식별자에 대응되도록 중요 키워드들의 매칭이 완료된 이후, 상기 사용자로부터 소정의 적어도 하나의 중요 키워드를 검색 키워드로 하는 개체 검색 명령이 수신되면, 개체 검색부(119)는 검색 키워드로 입력된 적어도 하나의 중요 키워드가 상기 개체 키워드 테이블 상에서 최대로 매칭되어 있는 상기 제2 개체에 대한 고유 식별자를 검색하고, 상기 문서에서 상기 제2 개체가 삽입되어 있는 지점으로 화면을 이동시킴으로써, 상기 사용자에게 빠른 개체 검색 결과를 제공하도록 지원할 수 있다.
이때, 본 발명의 일실시예에 따르면, 전자 장치(110)는 특징 벡터 생성부(120), 코사인 유사도 연산부(121), 연관 키워드 선정부(122) 및 연관 키워드 기록부(124)를 더 포함할 수 있다.
특징 벡터 생성부(120)는 상기 개체 키워드 테이블에 상기 제1 중요 키워드들의 기록이 완료되면, 상기 제1 중요 키워드들 각각에 대해, 각 중요 키워드에 적용된 상기 복수의 글자 서식 카테고리들 각각의 서식 속성 값별 중요도 할당 점수를 성분으로 갖는 특징 벡터를 생성한다.
예컨대, '특허'라는 단어가 상기 제1 중요 키워드들 중 어느 하나로 선정되었고, '특허'라는 단어의 글꼴이 '명조체'인 관계로 중요도 할당 점수가 '1점', 색상이 '빨간색'인 관계로 중요도 할당 점수가 '10점', 크기가 '11pt'인 관계로 중요도 할당 점수가 '4점'이라고 하는 경우, 특징 벡터 생성부(120)는 '특허'라는 단어에 대해 중요도 할당 점수를 성분으로 갖는 '[1 10 4]'라고 하는 3차원의 특징 벡터를 생성할 수 있다.
코사인 유사도 연산부(121)는 상기 제1 중요 키워드들 각각에 대해 생성된 특징 벡터를 기초로 상기 제1 중요 키워드들 각각에 대해, 각 중요 키워드의 특징 벡터와 다른 중요 키워드들의 특징 벡터 간의 코사인 유사도를 연산한다.
예컨대, 상기 제1 중요 키워드들이 '특허', '상표', '디자인'이라는 단어라고 하는 경우, 코사인 유사도 연산부(121)는 '특허'라는 단어에 대해 '상표'라는 단어와 '디자인'이라는 단어 각각과의 특징 벡터 간의 코사인 유사도를 연산하고, '상표'라는 단어에 대해 '특허'라는 단어와 '디자인'이라는 단어 각각과의 특징 벡터 간의 코사인 유사도를 연산하며, '디자인'이라는 단어에 대해 '특허'라는 단어와 '상표'라는 단어 각각과의 특징 벡터 간의 코사인 유사도를 연산할 수 있다.
이때, 본 발명의 일실시예에 따르면, 코사인 유사도 연산부(121)는 하기의 수학식 1에 기초하여 각 중요 키워드의 특징 벡터와 다른 중요 키워드들의 특징 벡터 간의 코사인 유사도를 연산할 수 있다.
Figure 112020027203910-pat00001
여기서, S는 특징 벡터 A와 B 사이의 코사인 유사도로 -1에서 1사이의 값을 가지며, 그 값이 클수록 두 특징 벡터는 유사한 벡터임을 의미하고, Ai는 특징 벡터 A의 i번째 성분, Bi는 특징 벡터 B의 i번째 성분을 의미한다.
연관 키워드 선정부(122)는 상기 제1 중요 키워드들 각각에 대해, 코사인 유사도가 최대로 연산된 다른 중요 키워드를 연관 키워드로 선정한다.
예컨대, 상기 제1 중요 키워드들이 '특허', '상표', '디자인'이라는 단어라고 하고, '특허'에 대해 '상표', '디자인'이라는 단어 각각의 특징 벡터와의 코사인 유사도를 연산한 결과, '상표'라는 단어와의 코사인 유사도가 최대로 연산되었다고 하는 경우, 연관 키워드 선정부(122)는 '특허'라는 중요 키워드에 대해 '상표'라는 중요 키워드를 연관 키워드로 선정할 수 있다.
즉, 연관 키워드 선정부(122)는 상기 제1 중요 키워드들 각각에 대해, 각 중요 키워드에 적용된 복수의 글자 서식 카테고리들 각각의 서식 속성 값에 따른 중요도 할당 점수가 유사한 패턴을 갖는 다른 중요 키워드를 연관 키워드로 선정할 수 있다.
연관 키워드 기록부(123)는 상기 제1 중요 키워드들 각각에 대한 연관 키워드의 선정이 완료되면, 상기 개체 키워드 테이블에 기록되어 있는 상기 제1 중요 키워드들 각각에 대해, 각 중요 키워드에 대한 연관 키워드를 서로 대응시켜 추가로 기록한다.
예컨대, 앞선 예와 같이, 상기 제1 중요 키워드들이 '개체 3'에 대한 '고유 식별자 3'에 대응되는 중요 키워드들인 '특허', '상표', '디자인'이라는 단어이고, '특허'라는 중요 키워드에 대해 '상표'라는 중요 키워드가 연관 키워드로 선정되었으며, '상표'라는 중요 키워드에 대해 '특허'라는 중요 키워드가 연관 키워드로 선정되었고, '디자인'이라는 중요 키워드에 대해 '특허'라는 중요 키워드가 연관 키워드로 선정된 경우, 연관 키워드 기록부(123)는 하기의 표 4와 같이 각 중요 키워드에 대한 연관 키워드를 서로 대응시켜 추가로 기록할 수 있다.
개체에 대한 고유 식별자 중요 키워드들 연관 키워드
개체 3에 대한 고유 식별자 3 특허 상표
상표 특허
디자인 특허
이때, 본 발명의 일실시예에 따르면, 전자 장치(110)는 키워드 표시부(124)를 더 포함할 수 있다.
키워드 표시부(124)는 상기 제2 개체가 삽입되어 있는 지점으로 화면이 이동된 이후, 상기 사용자로부터 상기 제2 개체에 대한 선택 명령이 수신되면, 상기 개체 키워드 테이블에서 상기 제2 개체에 대한 고유 식별자에 대응되어 기록되어 있는 중요 키워드들인 제2 중요 키워드들과 상기 제2 중요 키워드들 각각에 대한 연관 키워드를 추출한 후, 상기 제2 중요 키워드들이 상기 제2 개체에 관련된 중요 키워드들임을 알리는 안내 메시지와 함께 상기 제2 중요 키워드들 각각에 대한 연관 키워드를 화면 상에 표시한다.
예컨대, 전술한 예에 따라 도 3의 도면부호 310이, '개체 3'(311)이 삽입되어 있는 지점으로 이동된 화면을 나타낸다고 가정하면, 키워드 표시부(124)는 '개체 3'(311)이 삽입되어 있는 지점으로 화면이 이동된 이후, 상기 사용자로부터 '개체 3'(311)에 대한 선택 명령이 수신되는 경우, 상기 표 4와 같은 상기 개체 키워드 테이블로부터 '특허', '상표', '디자인'이라는 '개체 3'(311)에 관련된 중요 키워드들과 각 중요 키워드에 대한 연관 키워드를 추출한 후, '특허', '상표', '디자인'이라는 단어들이 '개체 3'(311)에 관련된 중요 키워드들임을 알리는 안내 메시지(312)와, '특허'에 대해서는 '상표'를, '상표'에 대해서는 '디자인'을, '디자인'에 대해서는 '특허'를 연관 키워드로 도면부호 313과 같이 화면 상에 표시할 수 있다.
이렇게, 키워드 표시부(124)는 상기 사용자가 '개체 3'(311)에 관련된 중요 키워드들이 '특허', '상표', '디자인'이라는 것을 인식할 수 있도록 함과 동시에, '개체 3'(311)과 관련된 중요 키워드들 각각에 대한 연관 키워드를 한 눈에 파악할 수 있도록 지원할 수 있다. 즉, 키워드 표시부(124)는 도면부호 312, 313에 도시된 그림과 같이, '개체 3'(311)에 관련된 중요 키워드와 그에 대한 연관 키워드를 화면 상에 표시함으로써, 상기 사용자가 '개체 3'(311)에 대한 정보를 보다 쉽게 파악할 수 있도록 도와줄 수 있다.
또한, 본 발명의 일실시예에 따르면, 전자 장치(110)는 추가 기록부(125)를 더 포함할 수 있다.
추가 기록부(125)는 상기 개체 키워드 테이블에 상기 제1 중요 키워드들이 기록된 이후, 상기 사용자로부터 제1 키워드가 입력되면서 상기 개체 키워드 테이블에 상기 제1 키워드를 상기 제1 개체에 관련된 중요 키워드로 포함시킬 것을 지시하는 중요 키워드 추가 기록 명령이 수신되면, 상기 개체 키워드 테이블에서 상기 제1 중요 키워드들 외에 상기 제1 키워드를 상기 제1 개체에 관련된 중요 키워드로 추가로 기록한다.
즉, 추가 기록부(125)는 상기 문서에 상기 제1 개체가 삽입되면, 상기 제1 개체에 관련된 중요 키워드들이 자동으로 선정되는 것 외에도, 상기 사용자가 상기 제1 개체에 관련된 중요 키워드를 직접 지정할 수 있도록 지원할 수 있다.
도 4는 본 발명의 일실시예에 따른 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치의 동작 방법을 도시한 순서도이다.
단계(S410)에서는 문서에 삽입되어 있는 복수의 개체들 각각에 대한 고유 식별자와 상기 복수의 개체들 각각에 관련된 중요 키워드들이 서로 대응되어 기록되어 있는 개체 키워드 테이블을 저장하여 유지한다.
단계(S420)에서는 글자에 대해서 적용 가능한 것으로 미리 지정된 서로 다른 종류의 복수의 글자 서식 카테고리들과 상기 복수의 글자 서식 카테고리들 각각에서 지정 가능한 서식 속성 값별로 미리 지정된 중요도 할당 점수가 기록되어 있는 점수 테이블을 저장하여 유지한다.
단계(S430)에서는 사용자에 의해 상기 문서에 제1 개체가 신규로 삽입되면, 상기 제1 개체에 대한 고유 식별자를 생성한다.
단계(S440)에서는 상기 문서에 삽입되어 있는 텍스트에서, 상기 제1 개체의 중점으로부터 기설정된 거리 이내에 포함되어 있는 복수의 단어들을 추출한다.
단계(S450)에서는 상기 복수의 단어들 각각에 적용되어 있는 상기 복수의 글자 서식 카테고리들 각각의 서식 속성 값을 확인한다.
단계(S460)에서는 상기 복수의 단어들 각각에 대해, 상기 점수 테이블을 참조하여 각 단어에 적용된 상기 복수의 글자 서식 카테고리들 각각의 서식 속성 값별 중요도 할당 점수의 총 합계를 연산하고, 상기 복수의 단어들 각각에 대해 연산된 총 합계를 각 단어의 중요도 점수로 지정한다.
단계(S470)에서는 상기 복수의 단어들 중 중요도 점수가 높은 순서로 미리 지정된 개수만큼 단어들을 선택하고, 상기 선택된 단어들을 상기 제1 개체에 관련된 중요 키워드들인 제1 중요 키워드들로 선정한다.
단계(S480)에서는 상기 제1 중요 키워드들이 선정되면, 상기 개체 키워드 테이블에 상기 제1 개체에 대한 고유 식별자와 상기 제1 중요 키워드들을 서로 대응시켜 기록한다.
단계(S490)에서는 상기 사용자로부터 적어도 하나의 검색 키워드가 입력되면서, 상기 적어도 하나의 검색 키워드에 기초한 개체 검색 명령이 수신되면, 상기 개체 키워드 테이블로부터 상기 적어도 하나의 검색 키워드와 일치하는 키워드를 중요 키워드들 내에서 최대로 포함하고 있는 제2 개체에 대한 고유 식별자를 검색한 후, 상기 제2 개체가 검색 결과로 화면 상에 표시되도록 상기 문서에서 상기 제2 개체가 삽입되어 있는 지점으로 화면을 이동시킨다.
이때, 본 발명의 일실시예에 따르면, 상기 전자 장치의 동작 방법은 상기 개체 키워드 테이블에 상기 제1 중요 키워드들의 기록이 완료되면, 상기 제1 중요 키워드들 각각에 대해, 각 중요 키워드에 적용된 상기 복수의 글자 서식 카테고리들 각각의 서식 속성 값별 중요도 할당 점수를 성분으로 갖는 특징 벡터를 생성하는 단계, 상기 제1 중요 키워드들 각각에 대해 생성된 특징 벡터를 기초로 상기 제1 중요 키워드들 각각에 대해, 각 중요 키워드의 특징 벡터와 다른 중요 키워드들의 특징 벡터 간의 코사인 유사도를 연산하는 단계, 상기 제1 중요 키워드들 각각에 대해, 코사인 유사도가 최대로 연산된 다른 중요 키워드를 연관 키워드로 선정하는 단계 및 상기 제1 중요 키워드들 각각에 대한 연관 키워드의 선정이 완료되면, 상기 개체 키워드 테이블에 기록되어 있는 상기 제1 중요 키워드들 각각에 대해, 각 중요 키워드에 대한 연관 키워드를 서로 대응시켜 추가로 기록하는 단계를 더 포함할 수 있다.
또한, 본 발명의 일실시예에 따르면, 상기 전자 장치의 동작 방법은 상기 제2 개체가 삽입되어 있는 지점으로 화면이 이동된 이후, 상기 사용자로부터 상기 제2 개체에 대한 선택 명령이 수신되면, 상기 개체 키워드 테이블에서 상기 제2 개체에 대한 고유 식별자에 대응되어 기록되어 있는 중요 키워드들인 제2 중요 키워드들과 상기 제2 중요 키워드들 각각에 대한 연관 키워드를 추출한 후, 상기 제2 중요 키워드들이 상기 제2 개체에 관련된 중요 키워드들임을 알리는 안내 메시지와 함께 상기 제2 중요 키워드들 각각에 대한 연관 키워드를 화면 상에 표시하는 단계를 더 포함할 수 있다.
또한, 본 발명의 일실시예에 따르면, 상기 전자 장치의 동작 방법은 상기 개체 키워드 테이블에 상기 제1 중요 키워드들이 기록된 이후, 상기 사용자로부터 제1 키워드가 입력되면서 상기 개체 키워드 테이블에 상기 제1 키워드를 상기 제1 개체에 관련된 중요 키워드로 포함시킬 것을 지시하는 중요 키워드 추가 기록 명령이 수신되면, 상기 개체 키워드 테이블에서 상기 제1 중요 키워드들 외에 상기 제1 키워드를 상기 제1 개체에 관련된 중요 키워드로 추가로 기록하는 단계를 더 포함할 수 있다.
이상, 도 4를 참조하여 본 발명의 일실시예에 따른 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치의 동작 방법에 대해 설명하였다. 여기서, 본 발명의 일실시예에 따른 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치의 동작 방법은 도 1 내지 도 3을 이용하여 설명한 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치(110)의 동작에 대한 구성과 대응될 수 있으므로, 이에 대한 보다 상세한 설명은 생략하기로 한다.
본 발명의 일실시예에 따른 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치의 동작 방법은 컴퓨터와의 결합을 통해 실행시키기 위한 저장매체에 저장된 컴퓨터 프로그램으로 구현될 수 있다.
또한, 본 발명의 일실시예에 따른 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치의 동작 방법은 컴퓨터와의 결합을 통해 실행시키기 위한 컴퓨터 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
이상과 같이 본 발명에서는 구체적인 구성 요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
따라서, 본 발명의 사상은 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.
110: 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치
111: 개체 키워드 테이블 유지부 112: 점수 테이블 유지부
113: 고유 식별자 생성부 114: 단어 추출부
115: 서식 속성 확인부 116: 중요도 점수 지정부
117: 중요 키워드 선정부 118: 중요 키워드 기록부
119: 개체 검색부 120: 특징 벡터 생성부
121: 코사인 유사도 연산부 122: 연관 키워드 선정부
123: 연관 키워드 기록부 124: 키워드 표시부
125: 추가 기록부

Claims (10)

  1. 문서에 삽입되어 있는 복수의 개체들 각각에 대한 고유 식별자와 상기 복수의 개체들 각각에 관련된 중요 키워드들이 서로 대응되어 기록되어 있는 개체 키워드 테이블을 저장하여 유지하는 개체 키워드 테이블 유지부;
    글자에 대해서 적용 가능한 것으로 미리 지정된 서로 다른 종류의 복수의 글자 서식 카테고리들과 상기 복수의 글자 서식 카테고리들 각각에서 지정 가능한 서식 속성 값별로 미리 지정된 중요도 할당 점수가 기록되어 있는 점수 테이블을 저장하여 유지하는 점수 테이블 유지부;
    사용자에 의해 상기 문서에 제1 개체가 신규로 삽입되면, 상기 제1 개체에 대한 고유 식별자를 생성하는 고유 식별자 생성부;
    상기 문서에 삽입되어 있는 텍스트에서, 상기 제1 개체의 중점으로부터 기설정된(predetermined) 거리 이내에 포함되어 있는 복수의 단어들을 추출하는 단어 추출부;
    상기 복수의 단어들 각각에 적용되어 있는 상기 복수의 글자 서식 카테고리들 각각의 서식 속성 값을 확인하는 서식 속성 확인부;
    상기 복수의 단어들 각각에 대해, 상기 점수 테이블을 참조하여 각 단어에 적용된 상기 복수의 글자 서식 카테고리들 각각의 서식 속성 값별 중요도 할당 점수의 총 합계를 연산하고, 상기 복수의 단어들 각각에 대해 연산된 총 합계를 각 단어의 중요도 점수로 지정하는 중요도 점수 지정부;
    상기 복수의 단어들 중 중요도 점수가 높은 순서로 미리 지정된 개수만큼 단어들을 선택하고, 상기 선택된 단어들을 상기 제1 개체에 관련된 중요 키워드들인 제1 중요 키워드들로 선정하는 중요 키워드 선정부;
    상기 제1 중요 키워드들이 선정되면, 상기 개체 키워드 테이블에 상기 제1 개체에 대한 고유 식별자와 상기 제1 중요 키워드들을 서로 대응시켜 기록하는 중요 키워드 기록부;
    상기 개체 키워드 테이블에 상기 제1 중요 키워드들의 기록이 완료되면, 상기 제1 중요 키워드들 각각에 대해, 각 중요 키워드에 적용된 상기 복수의 글자 서식 카테고리들 각각의 서식 속성 값별 중요도 할당 점수를 성분으로 갖는 특징 벡터를 생성하는 특징 벡터 생성부;
    상기 제1 중요 키워드들 각각에 대해 생성된 특징 벡터를 기초로 상기 제1 중요 키워드들 각각에 대해, 각 중요 키워드의 특징 벡터와 다른 중요 키워드들의 특징 벡터 간의 코사인 유사도를 연산하는 코사인 유사도 연산부;
    상기 제1 중요 키워드들 각각에 대해, 코사인 유사도가 최대로 연산된 다른 중요 키워드를 연관 키워드로 선정하는 연관 키워드 선정부;
    상기 제1 중요 키워드들 각각에 대한 연관 키워드의 선정이 완료되면, 상기 개체 키워드 테이블에 기록되어 있는 상기 제1 중요 키워드들 각각에 대해, 각 중요 키워드에 대한 연관 키워드를 서로 대응시켜 추가로 기록하는 연관 키워드 기록부;
    상기 사용자로부터 적어도 하나의 검색 키워드가 입력되면서, 상기 적어도 하나의 검색 키워드에 기초한 개체 검색 명령이 수신되면, 상기 개체 키워드 테이블로부터 상기 적어도 하나의 검색 키워드와 일치하는 키워드를 중요 키워드들 내에서 최대로 포함하고 있는 제2 개체에 대한 고유 식별자를 검색한 후, 상기 제2 개체가 검색 결과로 화면 상에 표시되도록 상기 문서에서 상기 제2 개체가 삽입되어 있는 지점으로 화면을 이동시키는 개체 검색부; 및
    상기 제2 개체가 삽입되어 있는 지점으로 화면이 이동된 이후, 상기 사용자로부터 상기 제2 개체에 대한 선택 명령이 수신되면, 상기 개체 키워드 테이블에서 상기 제2 개체에 대한 고유 식별자에 대응되어 기록되어 있는 중요 키워드들인 제2 중요 키워드들과 상기 제2 중요 키워드들 각각에 대한 연관 키워드를 추출한 후, 상기 제2 중요 키워드들이 상기 제2 개체에 관련된 중요 키워드들임을 알리는 안내 메시지와 함께 상기 제2 중요 키워드들 각각에 대한 연관 키워드를 화면 상에 표시하는 키워드 표시부
    를 포함하는 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치.
  2. 삭제
  3. 삭제
  4. 제1항에 있어서,
    상기 개체 키워드 테이블에 상기 제1 중요 키워드들이 기록된 이후, 상기 사용자로부터 제1 키워드가 입력되면서 상기 개체 키워드 테이블에 상기 제1 키워드를 상기 제1 개체에 관련된 중요 키워드로 포함시킬 것을 지시하는 중요 키워드 추가 기록 명령이 수신되면, 상기 개체 키워드 테이블에서 상기 제1 중요 키워드들 외에 상기 제1 키워드를 상기 제1 개체에 관련된 중요 키워드로 추가로 기록하는 추가 기록부
    를 더 포함하는 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치.
  5. 문서에 삽입되어 있는 복수의 개체들 각각에 대한 고유 식별자와 상기 복수의 개체들 각각에 관련된 중요 키워드들이 서로 대응되어 기록되어 있는 개체 키워드 테이블을 저장하여 유지하는 단계;
    글자에 대해서 적용 가능한 것으로 미리 지정된 서로 다른 종류의 복수의 글자 서식 카테고리들과 상기 복수의 글자 서식 카테고리들 각각에서 지정 가능한 서식 속성 값별로 미리 지정된 중요도 할당 점수가 기록되어 있는 점수 테이블을 저장하여 유지하는 단계;
    사용자에 의해 상기 문서에 제1 개체가 신규로 삽입되면, 상기 제1 개체에 대한 고유 식별자를 생성하는 단계;
    상기 문서에 삽입되어 있는 텍스트에서, 상기 제1 개체의 중점으로부터 기설정된(predetermined) 거리 이내에 포함되어 있는 복수의 단어들을 추출하는 단계;
    상기 복수의 단어들 각각에 적용되어 있는 상기 복수의 글자 서식 카테고리들 각각의 서식 속성 값을 확인하는 단계;
    상기 복수의 단어들 각각에 대해, 상기 점수 테이블을 참조하여 각 단어에 적용된 상기 복수의 글자 서식 카테고리들 각각의 서식 속성 값별 중요도 할당 점수의 총 합계를 연산하고, 상기 복수의 단어들 각각에 대해 연산된 총 합계를 각 단어의 중요도 점수로 지정하는 단계;
    상기 복수의 단어들 중 중요도 점수가 높은 순서로 미리 지정된 개수만큼 단어들을 선택하고, 상기 선택된 단어들을 상기 제1 개체에 관련된 중요 키워드들인 제1 중요 키워드들로 선정하는 단계;
    상기 제1 중요 키워드들이 선정되면, 상기 개체 키워드 테이블에 상기 제1 개체에 대한 고유 식별자와 상기 제1 중요 키워드들을 서로 대응시켜 기록하는 단계;
    상기 개체 키워드 테이블에 상기 제1 중요 키워드들의 기록이 완료되면, 상기 제1 중요 키워드들 각각에 대해, 각 중요 키워드에 적용된 상기 복수의 글자 서식 카테고리들 각각의 서식 속성 값별 중요도 할당 점수를 성분으로 갖는 특징 벡터를 생성하는 단계;
    상기 제1 중요 키워드들 각각에 대해 생성된 특징 벡터를 기초로 상기 제1 중요 키워드들 각각에 대해, 각 중요 키워드의 특징 벡터와 다른 중요 키워드들의 특징 벡터 간의 코사인 유사도를 연산하는 단계;
    상기 제1 중요 키워드들 각각에 대해, 코사인 유사도가 최대로 연산된 다른 중요 키워드를 연관 키워드로 선정하는 단계;
    상기 제1 중요 키워드들 각각에 대한 연관 키워드의 선정이 완료되면, 상기 개체 키워드 테이블에 기록되어 있는 상기 제1 중요 키워드들 각각에 대해, 각 중요 키워드에 대한 연관 키워드를 서로 대응시켜 추가로 기록하는 단계;
    상기 사용자로부터 적어도 하나의 검색 키워드가 입력되면서, 상기 적어도 하나의 검색 키워드에 기초한 개체 검색 명령이 수신되면, 상기 개체 키워드 테이블로부터 상기 적어도 하나의 검색 키워드와 일치하는 키워드를 중요 키워드들 내에서 최대로 포함하고 있는 제2 개체에 대한 고유 식별자를 검색한 후, 상기 제2 개체가 검색 결과로 화면 상에 표시되도록 상기 문서에서 상기 제2 개체가 삽입되어 있는 지점으로 화면을 이동시키는 단계; 및
    상기 제2 개체가 삽입되어 있는 지점으로 화면이 이동된 이후, 상기 사용자로부터 상기 제2 개체에 대한 선택 명령이 수신되면, 상기 개체 키워드 테이블에서 상기 제2 개체에 대한 고유 식별자에 대응되어 기록되어 있는 중요 키워드들인 제2 중요 키워드들과 상기 제2 중요 키워드들 각각에 대한 연관 키워드를 추출한 후, 상기 제2 중요 키워드들이 상기 제2 개체에 관련된 중요 키워드들임을 알리는 안내 메시지와 함께 상기 제2 중요 키워드들 각각에 대한 연관 키워드를 화면 상에 표시하는 단계
    를 포함하는 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치의 동작 방법.
  6. 삭제
  7. 삭제
  8. 제5항에 있어서,
    상기 개체 키워드 테이블에 상기 제1 중요 키워드들이 기록된 이후, 상기 사용자로부터 제1 키워드가 입력되면서 상기 개체 키워드 테이블에 상기 제1 키워드를 상기 제1 개체에 관련된 중요 키워드로 포함시킬 것을 지시하는 중요 키워드 추가 기록 명령이 수신되면, 상기 개체 키워드 테이블에서 상기 제1 중요 키워드들 외에 상기 제1 키워드를 상기 제1 개체에 관련된 중요 키워드로 추가로 기록하는 단계
    를 더 포함하는 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치의 동작 방법.
  9. 제5항 또는 제8항 중 어느 한 항의 방법을 컴퓨터와의 결합을 통해 실행시키기 위한 컴퓨터 프로그램을 기록한 컴퓨터 판독 가능 기록 매체.
  10. 제5항 또는 제8항 중 어느 한 항의 방법을 컴퓨터와의 결합을 통해 실행시키기 위한 저장매체에 저장된 컴퓨터 프로그램.
KR1020200031773A 2020-03-16 2020-03-16 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치 및 그 동작 방법 Active KR102375507B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200031773A KR102375507B1 (ko) 2020-03-16 2020-03-16 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치 및 그 동작 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200031773A KR102375507B1 (ko) 2020-03-16 2020-03-16 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치 및 그 동작 방법

Publications (2)

Publication Number Publication Date
KR20210115670A KR20210115670A (ko) 2021-09-27
KR102375507B1 true KR102375507B1 (ko) 2022-03-17

Family

ID=77925616

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200031773A Active KR102375507B1 (ko) 2020-03-16 2020-03-16 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치 및 그 동작 방법

Country Status (1)

Country Link
KR (1) KR102375507B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102500756B1 (ko) * 2021-10-20 2023-02-16 주식회사 한글과컴퓨터 채팅 서비스를 통해 사용자들이 입력한 채팅 메시지들이 삽입된 전자 문서를 생성하는 전자 단말 장치 및 그 동작 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005267057A (ja) * 2004-03-17 2005-09-29 Seiko Epson Corp テキストデータ抽出方法、検索用インデックス作成方法、電子ファイリングシステムおよびプログラム
JP2010205060A (ja) * 2009-03-04 2010-09-16 Nomura Research Institute Ltd 文書内画像検索方法および文書内画像検索システム
KR101270958B1 (ko) * 2013-01-02 2013-06-11 주식회사 한글과컴퓨터 전자 문서 내 이미지 검색 장치 및 방법

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101055306B1 (ko) * 2009-06-11 2011-08-09 건국대학교 산학협력단 웹 서비스 기반의 컨텐츠 관리 시스템
KR102076548B1 (ko) * 2018-07-30 2020-02-12 주식회사 한글과컴퓨터 형태소 분석을 활용하여 문서를 관리하는 장치 및 이의 동작 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005267057A (ja) * 2004-03-17 2005-09-29 Seiko Epson Corp テキストデータ抽出方法、検索用インデックス作成方法、電子ファイリングシステムおよびプログラム
JP2010205060A (ja) * 2009-03-04 2010-09-16 Nomura Research Institute Ltd 文書内画像検索方法および文書内画像検索システム
KR101270958B1 (ko) * 2013-01-02 2013-06-11 주식회사 한글과컴퓨터 전자 문서 내 이미지 검색 장치 및 방법

Also Published As

Publication number Publication date
KR20210115670A (ko) 2021-09-27

Similar Documents

Publication Publication Date Title
US20100023505A1 (en) Search method, similarity calculation method, similarity calculation, same document matching system, and program thereof
KR20210033730A (ko) Pdf 문서에서 텍스트 라인 정보를 기초로 단락의 구분선을 표시하는 전자 장치 및 그 동작 방법
KR102187550B1 (ko) 문서에 삽입되는 ole 개체에 대한 요약된 미리보기 화면을 생성할 수 있는 전자 장치 및 그 동작 방법
KR102375507B1 (ko) 문서에 삽입된 개체와 관련 키워드들의 매칭을 통해 문서로부터의 개체 검색을 지원하는 전자 장치 및 그 동작 방법
JP5446877B2 (ja) 目次構造特定装置
KR102215613B1 (ko) 문서에 삽입된 텍스트를 구성하는 언어에 기반한 텍스트 검색을 가능하게 하는 전자 장치 및 그 동작 방법
KR102375557B1 (ko) 검색 키워드에 대응되는 쿼리 실행을 통해 문서에 삽입된 개체에 대한 검색을 수행하는 전자 장치 및 그 동작 방법
KR102215580B1 (ko) 스타일 속성에 기반하여 문서에 대한 중요 키워드를 선정하는 전자 장치 및 그 동작 방법
KR102300437B1 (ko) 입력된 문자를 기초로 전자 문서 상의 특정 위치에 특수문자의 삽입을 가능하게 하는 전자 문서 편집 장치 및 그 동작 방법
KR102300457B1 (ko) 자소 구분에 따른 레벨별 단어 제시를 통해 효율적인 타자 연습을 지원하는 전자 장치 및 그 동작 방법
KR102466701B1 (ko) 스프레드시트 상에서 문장 단위로 줄바꿈이 가능한 전자 장치 및 그 동작 방법
KR102576826B1 (ko) 전자 문서에 삽입되는 이미지 개체 내에 포함된 개인 정보를 식별할 수 있는 전자 단말 장치 및 그 동작 방법
KR102328051B1 (ko) 지원하지 않는 데이터 포맷으로 구성된 글꼴이 적용되어 있는 문서의 표시를 가능하게 하는 문서 편집 장치 및 그 동작 방법
KR102300444B1 (ko) 문서에 적용되어 있는 글꼴이 지원되는 글꼴인지 확인이 가능한 문서 편집 장치 및 그 동작 방법
KR101835994B1 (ko) 키워드 맵을 이용한 전자책 검색 서비스 제공 방법 및 장치
KR102545262B1 (ko) 동시 사용 기준을 기초로 특정 문서와 연관된 다른 연관 문서들의 정보를 제공할 수 있는 전자 단말 장치 및 그 동작 방법
JPH02289087A (ja) マルチメデイア情報入力方法
KR102395674B1 (ko) 검색 키워드 분석을 통해 전자 문서에 대한 상세 검색을 지원하는 전자 장치 및 그 동작 방법
KR102545260B1 (ko) 지원하지 않는 폰트가 적용되어 있는 전자 문서의 로드 시 자연스러운 대체 폰트의 적용을 지원하는 전자 단말 장치 및 그 동작 방법
KR102500730B1 (ko) 문장의 스타일 정보를 유지하는 번역 기능을 제공하는 전자 장치 및 그 동작 방법
KR20250090666A (ko) 전자 문서 상에서 키워드 기반의 빠른 검색을 지원하는 전자 단말 장치 및 그 동작 방법
KR102300486B1 (ko) 전자 문서에서 수식 연산자에 대한 간편한 첨자 입력을 지원하는 전자 단말 장치 및 그 동작 방법
KR102010556B1 (ko) 비동기 방식의 액션을 이용하는 웹 전자 문서 편집 장치 및 이의 동작 방법
KR102507487B1 (ko) 문서를 구성하는 페이지들을 빠르게 편집할 수 있도록 지원하기 위한 전용 문서 파일을 생성하는 전자 장치 및 그 동작 방법
KR102523767B1 (ko) Bleu 스코어를 기초로 유사 문장에 대한 검색을 수행하는 전자 장치 및 그 동작 방법

Legal Events

Date Code Title Description
PA0109 Patent application

Patent event code: PA01091R01D

Comment text: Patent Application

Patent event date: 20200316

PA0201 Request for examination
E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20210817

Patent event code: PE09021S01D

PG1501 Laying open of application
E701 Decision to grant or registration of patent right
PE0701 Decision of registration

Patent event code: PE07011S01D

Comment text: Decision to Grant Registration

Patent event date: 20220225

GRNT Written decision to grant
PR0701 Registration of establishment

Comment text: Registration of Establishment

Patent event date: 20220314

Patent event code: PR07011E01D

PR1002 Payment of registration fee

Payment date: 20220314

End annual number: 3

Start annual number: 1

PG1601 Publication of registration
PR1001 Payment of annual fee

Payment date: 20250304

Start annual number: 4

End annual number: 4