KR102732763B1 - 예문과 재정렬을 이용한 의미론적 검색 방법 및 그 장치 - Google Patents
예문과 재정렬을 이용한 의미론적 검색 방법 및 그 장치 Download PDFInfo
- Publication number
- KR102732763B1 KR102732763B1 KR1020240024270A KR20240024270A KR102732763B1 KR 102732763 B1 KR102732763 B1 KR 102732763B1 KR 1020240024270 A KR1020240024270 A KR 1020240024270A KR 20240024270 A KR20240024270 A KR 20240024270A KR 102732763 B1 KR102732763 B1 KR 102732763B1
- Authority
- KR
- South Korea
- Prior art keywords
- similar data
- data
- examples
- question
- reordering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 239000013598 vector Substances 0.000 claims abstract description 24
- 230000004044 response Effects 0.000 claims abstract description 8
- 230000008569 process Effects 0.000 claims description 7
- 238000009795 derivation Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000008707 rearrangement Effects 0.000 description 4
- 230000003203 everyday effect Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3347—Query execution using vector based model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24578—Query processing with adaptation to user needs using ranking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0475—Generative networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Biomedical Technology (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
도 2는 일 실시예에 따른 예문과 재정렬을 이용한 의미론적 검색 장치의 블록도이다.
도 3은 일 실시예에 따른 예문과 재정렬을 이용한 의미론적 검색 방법의 개괄적인 순서를 나타내는 흐름도이다.
도 4는 일 실시예에 따른 예문과 재정렬을 이용한 의미론적 검색에서 유사데이터를 도출 및 정렬하는 예시를 보여주는 도면이다.
도 5는 일 실시예에 따른 예문과 재정렬을 이용한 의미론적 검색에서 유사데이터를 재정렬하여 결과데이터를 결정하는 예시를 보여주는 도면이다.
도 6은 일 실시예에 따른 예문과 재정렬을 이용한 의미론적 검색 방법의 흐름도이다.
첨부된 도면은 본 발명의 기술사상에 대한 이해를 위하여 참조로서 예시된 것임을 밝히며, 그것에 의해 본 발명의 권리범위가 제한되지는 아니한다.
Claims (7)
- 사용자로부터 질문을 입력받고 상기 질문에 대응하여 결과데이터를 출력하는 컴퓨터장치에 의해 수행되는 의미론적 검색 방법에 있어서,
상기 사용자로부터 상기 질문을 획득하는 단계;
상기 질문에 대하여 답변을 복수회 생성하는 단계;
상기 복수의 답변을 상기 질문에 대한 복수의 예문으로서 규정하는 단계;
상기 복수의 예문과 복수의 저장데이터 사이에 임베딩벡터에 의한 유사도를 산출하는 단계;
상기 유사도에 기반하여 각 예문에 대하여 상기 복수의 저장데이터를 검색하여 유사데이터를 도출하는 단계;
상기 유사도를 기준으로 각 예문에 대하여 상기 유사데이터에 순위를 부여하는 단계;
상기 순위에 따라 각 예문에 대하여 상기 유사데이터를 정렬하는 단계;
재정렬기준에 따라 상기 복수의 예문 모두에 대하여 상기 유사데이터의 최종순위를 결정하는 단계;
상기 최종순위에 따라 상기 유사데이터를 재정렬하는 단계;
상기 재정렬된 유사데이터로부터 상기 결과데이터를 결정하는 단계; 및
상기 사용자에게 상기 결과데이터를 출력하는 단계를 포함하고,
상기 유사데이터를 도출하는 단계는,
도출될 유사데이터의 수를 결정하는 범위변수에 따라 상기 유사데이터를 도출하고, 상기 범위변수는 한 번의 유사데이터 도출 과정에서 도출되도록 요구되는 유사데이터의 수를 결정하는 제1 범위변수 및 상기 도출되도록 요구되는 유사데이터의 수에 대한 배수를 결정하는 제2 범위변수를 포함하며,
상기 유사데이터의 최종순위를 결정하는 단계는,
상기 재정렬기준은, 상기 복수의 예문에 대하여 상기 유사데이터가 공통적으로 도출된 횟수를 나타내는 교집합변수 및, 각 예문에 대한 상기 유사데이터의 순위로부터 상기 복수의 예문 모두에 대하여 상기 유사데이터간 우열을 나타내는 최종순위를 결정하는 순위변수를 포함하고, 상기 교집합변수를 통해 상기 유사데이터가 공통으로 도출된 둘 이상의 예문에 대하여 상기 유사데이터의 순위를 둘 이상 도출하고, 상기 순위변수를 통해 상기 최종순위를 결정하는
예문과 재정렬을 이용한 의미론적 검색 방법. - 제1항에 있어서,
상기 순위변수는, 편차, 빈도, 최소값 또는 평균을 포함하고,
상기 유사데이터의 최종순위를 결정하는 단계는,
각 예문에 대한 상기 유사데이터가 가지는 상기 순위에 편차, 빈도, 최소값 또는 평균을 적용하여 상기 최종순위를 결정하는
예문과 재정렬을 이용한 의미론적 검색 방법. - 제2항에 있어서,
상기 유사데이터의 최종순위를 결정하는 단계는,
상기 유사데이터의 순위가 동일하면, 서로 다른 복수의 재정렬기준을 적용하여 상기 유사데이터의 선후를 결정하는
예문과 재정렬을 이용한 의미론적 검색 방법. - 삭제
- 제1항에 있어서,
상기 답변을 생성하는 단계는,
상기 복수의 예문으로 규정될 상기 복수의 답변의 수를 나타내는 예문변수에 따라 상기 답변을 생성하는
예문과 재정렬을 이용한 의미론적 검색 방법. - 제1항에 있어서,
상기 답변은, 상기 질문에 대응하는 키워드를 포함하도록 생성되고,
상기 답변을 생성하는 단계는,
상기 질문에 대응하되 서로 다른 키워드를 포함하도록 상기 복수의 답변을 생성하는
예문과 재정렬을 이용한 의미론적 검색 방법. - 사용자로부터 질문을 입력받고 상기 질문에 대응하여 결과데이터를 출력하는 의미론적 검색 장치에 있어서,
상기 사용자로부터 상기 질문을 획득하는 입력부;
상기 질문에 대하여 답변을 복수회 생성하고, 상기 복수의 답변을 상기 질문에 대한 복수의 예문으로서 규정하는 생성형 AI모델;
상기 복수의 예문과 복수의 저장데이터 사이에 임베딩벡터에 의한 유사도를 산출하고, 상기 유사도에 기반하여 각 예문에 대하여 상기 복수의 저장데이터를 검색하여 유사데이터를 도출하고, 상기 유사도를 기준으로 각 예문에 대하여 상기 유사데이터에 순위를 부여하며, 상기 순위에 따라 각 예문에 대하여 상기 유사데이터를 정렬하는 예문별 검색부;
재정렬기준에 따라 상기 복수의 예문 모두에 대하여 상기 유사데이터의 최종순위를 결정하고, 상기 최종순위에 따라 상기 유사데이터를 재정렬하고, 상기 재정렬된 유사데이터로부터 상기 결과데이터를 결정하는 재정렬부; 및
상기 사용자에게 상기 결과데이터를 출력하는 출력부를 포함하고,
상기 예문별 검색부는, 도출될 유사데이터의 수를 결정하는 범위변수에 따라 상기 유사데이터를 도출하고, 상기 범위변수는 한 번의 유사데이터 도출 과정에서 도출되도록 요구되는 유사데이터의 수를 결정하는 제1 범위변수 및 상기 도출되도록 요구되는 유사데이터의 수에 대한 배수를 결정하는 제2 범위변수를 포함하며,
상기 재정렬부는, 상기 재정렬기준은, 상기 복수의 예문에 대하여 상기 유사데이터가 공통적으로 도출된 횟수를 나타내는 교집합변수 및, 각 예문에 대한 상기 유사데이터의 순위로부터 상기 복수의 예문 모두에 대하여 상기 유사데이터간 우열을 나타내는 최종순위를 결정하는 순위변수를 포함하고, 상기 교집합변수를 통해 상기 유사데이터가 공통으로 도출된 둘 이상의 예문에 대하여 상기 유사데이터의 순위를 둘 이상 도출하고, 상기 순위변수를 통해 상기 최종순위를 결정하는
예문과 재정렬을 이용한 의미론적 검색 장치.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020240024270A KR102732763B1 (ko) | 2024-02-20 | 2024-02-20 | 예문과 재정렬을 이용한 의미론적 검색 방법 및 그 장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020240024270A KR102732763B1 (ko) | 2024-02-20 | 2024-02-20 | 예문과 재정렬을 이용한 의미론적 검색 방법 및 그 장치 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR102732763B1 true KR102732763B1 (ko) | 2024-11-21 |
Family
ID=93702391
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020240024270A Active KR102732763B1 (ko) | 2024-02-20 | 2024-02-20 | 예문과 재정렬을 이용한 의미론적 검색 방법 및 그 장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102732763B1 (ko) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20040063822A (ko) * | 2003-01-06 | 2004-07-14 | 마이크로소프트 코포레이션 | 구조화 문서 검색 |
KR20060048780A (ko) * | 2004-07-26 | 2006-05-18 | 구글, 인코포레이티드 | 정보 검색 시스템에서의 문구 기반 인덱싱 |
JP2023531345A (ja) * | 2020-06-26 | 2023-07-24 | オラクル・インターナショナル・コーポレイション | 改善された談話構文解析 |
KR20240003389A (ko) * | 2022-06-30 | 2024-01-09 | 주식회사 클라이온 | 챗봇 시스템의 키워드 기반 랭킹 알고리즘을 이용한 의도 분류 방법 |
-
2024
- 2024-02-20 KR KR1020240024270A patent/KR102732763B1/ko active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20040063822A (ko) * | 2003-01-06 | 2004-07-14 | 마이크로소프트 코포레이션 | 구조화 문서 검색 |
KR20060048780A (ko) * | 2004-07-26 | 2006-05-18 | 구글, 인코포레이티드 | 정보 검색 시스템에서의 문구 기반 인덱싱 |
JP2023531345A (ja) * | 2020-06-26 | 2023-07-24 | オラクル・インターナショナル・コーポレイション | 改善された談話構文解析 |
KR20240003389A (ko) * | 2022-06-30 | 2024-01-09 | 주식회사 클라이온 | 챗봇 시스템의 키워드 기반 랭킹 알고리즘을 이용한 의도 분류 방법 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7252914B2 (ja) | 検索提案を提供する方法、装置、機器及び媒体 | |
KR102054514B1 (ko) | 인공지능(ai)을 통한 딥러닝훈련모듈과, 순위화프레임워크모듈을 활용하여, 법률전문가에게 최적화된 모범답안을 제시하는 한편, 법률정보를 의미 벡터로 변환하여, 데이터베이스에 저장하고, 이에 대한 문자열 사전모듈을 활용한 온라인 법률정보사전을 제공하는 시스템 및 그 방법 | |
KR102354716B1 (ko) | 딥 러닝 모델을 이용한 상황 의존 검색 기법 | |
KR101027864B1 (ko) | 대량의 전자 문서 검색을 위한 문서 관련성을 판정하기위한 기계-학습 접근법 | |
US8316007B2 (en) | Automatically finding acronyms and synonyms in a corpus | |
US20190108276A1 (en) | Methods and system for semantic search in large databases | |
KR102090237B1 (ko) | 시맨틱 트리플 기반의 지식 확장 시스템, 방법 및 컴퓨터 프로그램 | |
JP2021531591A (ja) | 関連付け推薦方法、装置、コンピュータ機器及び記憶媒体 | |
CN110737756B (zh) | 确定针对用户输入数据的应答的方法、装置、设备和介质 | |
JP2014528134A (ja) | トピック・ベースのサーチ・ガイダンスの提供 | |
WO2018121198A1 (en) | Topic based intelligent electronic file searching | |
KR20160007040A (ko) | 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법 및 시스템 | |
CN119066172A (zh) | 问答处理方法、装置、计算机设备、可读存储介质和程序产品 | |
WO2011022867A1 (en) | Method and apparatus for searching electronic documents | |
KR102732763B1 (ko) | 예문과 재정렬을 이용한 의미론적 검색 방법 및 그 장치 | |
US11694033B2 (en) | Transparent iterative multi-concept semantic search | |
Secker et al. | AISIID: An artificial immune system for interesting information discovery on the web | |
KR20200109515A (ko) | 빅데이터를 이용한 교육 콘텐츠 생성 방법 | |
CN118568508A (zh) | 文本匹配方法和文本匹配装置 | |
JP7273293B2 (ja) | 情報処理装置、制御方法、プログラム | |
KR102703247B1 (ko) | 생성형 검색을 위한 질의의 복잡도에 따른 검색 결과의 세분성 재조정 방법 및 시스템 | |
JPH09231233A (ja) | ネットワーク検索装置 | |
RU2834217C1 (ru) | Способ и система генерации ответа на поисковый запрос | |
JP7566387B1 (ja) | 情報処理装置、方法、及びプログラム | |
CN111143659A (zh) | 用于执行智能跨域搜索的系统和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20240220 |
|
PA0201 | Request for examination |
Patent event code: PA02011R01I Patent event date: 20240220 Comment text: Patent Application |
|
PA0302 | Request for accelerated examination |
Patent event date: 20240305 Patent event code: PA03022R01D Comment text: Request for Accelerated Examination |
|
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20240521 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20241114 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20241118 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20241118 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |