KR102574512B1 - 은유 탐지 장치 및 방법 - Google Patents
은유 탐지 장치 및 방법 Download PDFInfo
- Publication number
- KR102574512B1 KR102574512B1 KR1020210109660A KR20210109660A KR102574512B1 KR 102574512 B1 KR102574512 B1 KR 102574512B1 KR 1020210109660 A KR1020210109660 A KR 1020210109660A KR 20210109660 A KR20210109660 A KR 20210109660A KR 102574512 B1 KR102574512 B1 KR 102574512B1
- Authority
- KR
- South Korea
- Prior art keywords
- metaphor
- target word
- encoding
- result
- encoder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 39
- 238000001514 detection method Methods 0.000 claims abstract description 48
- 238000004590 computer program Methods 0.000 claims description 10
- 238000012417 linear regression Methods 0.000 claims description 6
- 238000010801 machine learning Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 10
- 230000003993 interaction Effects 0.000 description 10
- 239000013598 vector Substances 0.000 description 8
- 238000012545 processing Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Evolutionary Computation (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Biology (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Machine Translation (AREA)
Abstract
Description
도 2는 본 발명의 일 실시 예에 따른, 제1 인코더 및 제2 인코더에서 수행하는 Late-Interaction 방식의 인코딩을 설명하는 도면이다.
도 3은 본 발명의 일 실시 예에 따른, 은유 탐지 장치의 각 구성의 동작을 구체적으로 나타낸 도면이다.
도 4는 본 발명의 일 실시 예에 따른, 은유 탐지 장치가 수행하는 은유 탐지 방법을 나타낸 흐름도이다.
도 5는 본 발명의 다른 실시 예에 따른, 은유 탐지 장치가 수행하는 은유 탐지 방법을 나타낸 흐름도이다.
110: 입력부
120: 제1 인코더
130: 제2 인코더
140: 제1 은유 판단부
150: 제2 은유 판단부
160: 제3 은유 판단부
190: 메모리
Claims (20)
- 은유 탐지 장치에 있어서,
타겟 단어를 포함하는 문장을 입력 받는 입력부;
상기 입력 받은 문장에 포함된 각 단어를 상호 연관시켜 인코딩하는 제1 인코더;
상기 타겟 단어를 인코딩하는 제2 인코더; 및
상기 타겟 단어에 대하여 상기 제1 인코더로부터 생성된 제1 인코딩 결과 및 상기 제2 인코더로부터 생성된 제2 인코딩 결과를 입력 받고, 상기 제1 인코딩 결과 및 상기 제2 인코딩 결과에 기초하여 상기 타겟 단어가 은유적으로 쓰였는지 여부를 판단하는 제1 은유 판단부;를 포함하고,
상기 제1 인코딩 결과 및 상기 문장 전체에 대하여 상기 제1 인코더로부터 생성된 제3 인코딩 결과를 입력 받고, 상기 제1 인코딩 결과 및 상기 제3 인코딩 결과에 기초하여 상기 타겟 단어가 은유적으로 쓰였는지 여부를 판단하는 제2 은유 판단부; 및
기계 학습을 통해 상기 제1 은유 판단부의 판단 및 상기 제2 은유 판단부의 판단에 가중치를 부여하여 상기 타겟 단어가 은유적으로 쓰였는지 여부를 판단하는 제3 은유 판단부;를 더 포함하는, 은유 탐지 장치. - 삭제
- 삭제
- 삭제
- 제1 항에 있어서,
상기 제1 은유 판단부는 MIP(Metaphor Identification Procedure) 레이어에 대응하고, 상기 제2 은유 판단부는 SPV(Selectional Preference Violation) 레이어에 대응하는 것인, 은유 탐지 장치. - 제1 항에 있어서,
상기 제3 은유 판단부는 Linear 회귀와 Softmax 회귀의 결합을 이용하여 상기 타겟 단어가 은유적으로 쓰였는지 여부를 판단하는, 은유 탐지 장치. - 제1 항에 있어서,
상기 제1 인코더 및 상기 제2 인코더는 Late-Interaction 방식으로 인코딩을 수행하는 것인, 은유 탐지 장치. - 제1 항에 있어서,
상기 제1 인코더는 상기 문장에 포함된 각 단어마다 문맥 정보를 포함하는 인코딩 결과를 생성하는 것인, 은유 탐지 장치. - 제1 항에 있어서,
상기 제1 은유 판단부 및 상기 제2 은유 판단부는 BERT 및 RoBERTa 모델 중에서 적어도 하나에 기초하여 상기 타겟 단어가 은유적으로 쓰였는지 여부를 판단하는 것인, 은유 탐지 장치. - 은유 탐지 장치에 의해 수행되는 은유 탐지 방법에 있어서,
타겟 단어를 포함하는 문장을 입력 받는 동작;
상기 타겟 단어에 대하여 상기 입력 받은 문장에 포함된 각 단어를 상호 연관시켜 인코딩하여 제1 인코딩 결과를 생성하는 동작;
상기 타겟 단어를 독립적으로 인코딩하여 제2 인코딩 결과를 생성하는 동작; 및
상기 제1 인코딩 결과 및 상기 제2 인코딩 결과에 기초하여 상기 타겟 단어가 은유적으로 쓰였는지 여부를 판단하여 제1 은유 판단 결과를 생성하는 동작;을 포함하고,
상기 문장 전체에 대하여 상기 입력 받은 문장에 포함된 각 단어를 상호 연관시켜 인코딩하여 제3 인코딩 결과를 생성하는 동작;
상기 제1 인코딩 결과 및 상기 제3 인코딩 결과에 기초하여 상기 타겟 단어가 은유적으로 쓰였는지 여부를 판단하여 제2 은유 판단 결과를 생성하는 동작; 및
기계 학습을 통해 상기 제1 은유 판단 결과 및 상기 제2 은유 판단 결과에 가중치를 부여하여 상기 타겟 단어가 은유적으로 쓰였는지 여부를 판단하는 동작;을 더 포함하는, 은유 탐지 방법. - 삭제
- 삭제
- 삭제
- 제10 항에 있어서,
상기 제1 은유 판단 결과는 MIP(Metaphor Identification Procedure) 방식에 기초하여 생성되고, 상기 제2 은유 판단 결과는 SPV(Selectional Preference Violation) 방식에 기초하여 생성된 것인, 은유 탐지 방법. - 제10 항에 있어서,
상기 제1 은유 판단 결과 및 상기 제2 은유 판단 결과에 기초하여 상기 타겟 단어가 은유적으로 쓰였는지 여부를 판단하는 동작은 Linear 회귀와 Softmax 회귀의 결합에 기초하여 수행되는, 은유 탐지 방법. - 제10 항에 있어서,
상기 제1 인코딩 결과 및 상기 제2 인코딩 결과는 Late-Interaction 방식에 기초하여 생성된 것인, 은유 탐지 방법. - 제10 항에 있어서,
상기 제1 인코딩 결과는 상기 문장에 포함된 각 단어마다 문맥 정보를 포함하는 것인, 은유 탐지 방법. - 제10 항에 있어서,
상기 제1 은유 판단 결과 및 상기 제2 은유 판단 결과는 BERT 및 RoBERTa 모델 중에서 적어도 하나에 기초하여 생성된 것인, 은유 탐지 방법. - 컴퓨터 판독 가능한 기록매체에 저장되어 있는 컴퓨터 프로그램으로서,
상기 컴퓨터 프로그램은,
제10 항, 제14 항 내지 제18 항 중 어느 한 항에 따른 방법을 프로세서가 수행하도록 하기 위한 명령어를 포함하는
컴퓨터 프로그램. - 컴퓨터 프로그램을 저장하고 있는 컴퓨터 판독 가능 기록매체로서,
상기 기록매체는,
제10 항, 제14 항 내지 제18 항 중 어느 한 항에 따른 방법을 프로세서가 수행하도록 하기 위한 명령어를 포함하는
컴퓨터 판독 가능한 기록매체.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210109660A KR102574512B1 (ko) | 2021-08-19 | 2021-08-19 | 은유 탐지 장치 및 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210109660A KR102574512B1 (ko) | 2021-08-19 | 2021-08-19 | 은유 탐지 장치 및 방법 |
Publications (3)
Publication Number | Publication Date |
---|---|
KR20230028639A KR20230028639A (ko) | 2023-03-02 |
KR102574512B1 true KR102574512B1 (ko) | 2023-09-05 |
KR102574512B9 KR102574512B9 (ko) | 2024-02-08 |
Family
ID=85509013
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210109660A Active KR102574512B1 (ko) | 2021-08-19 | 2021-08-19 | 은유 탐지 장치 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102574512B1 (ko) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2447926A1 (de) * | 1973-10-10 | 1975-04-24 | Malco Plastics Inc | Kenndatenkarte und verfahren zu ihrer herstellung |
KR101948613B1 (ko) * | 2017-04-25 | 2019-02-15 | 강원대학교산학협력단 | 멀티 태스크 학습 기반 포인터 네트워크를 이용한 한국어 의존 구문 분석 시스템 및 방법 |
KR102227939B1 (ko) * | 2019-04-02 | 2021-03-15 | 성균관대학교산학협력단 | 단어의 문맥 정보와 형태론적 정보를 고려한 단어 임베딩 방법 및 장치 |
KR102436900B1 (ko) * | 2019-12-12 | 2022-08-26 | 서울대학교산학협력단 | 양방향 언어 모델을 이용한 문장 평가 방법 및 장치 |
-
2021
- 2021-08-19 KR KR1020210109660A patent/KR102574512B1/ko active Active
Non-Patent Citations (2)
Title |
---|
Hai Wan 외 4명, "Enhancing Metaphor Detection by Gloss-based Interpretations", Findings of the Association for Computational Linguistics: ACL-IJCNLP 2021, 2021.08.01., pp.1971-1981. 1부.* |
Rui Mao 외 2명, "End-to-End Sequential Metaphor Identification Inspired by Linguistic Theories", Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, 2019.07.28., pp.3888-3898. 1부.* |
Also Published As
Publication number | Publication date |
---|---|
KR102574512B9 (ko) | 2024-02-08 |
KR20230028639A (ko) | 2023-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109062937B (zh) | 训练描述文本生成模型的方法、生成描述文本的方法及装置 | |
CN109003624B (zh) | 情绪识别方法、装置、计算机设备及存储介质 | |
CN112699216A (zh) | 端到端的语言模型预训练方法、系统、设备及存储介质 | |
CN112256845B (zh) | 意图识别方法、装置、电子设备和计算机可读存储介质 | |
CN114064487B (zh) | 一种代码缺陷检测方法 | |
CN111309607B (zh) | 一种代码方法级别的软件缺陷定位方法 | |
CN116151256A (zh) | 一种基于多任务和提示学习的小样本命名实体识别方法 | |
CN117332090B (zh) | 一种敏感信息识别方法、装置、设备和存储介质 | |
CN113553245A (zh) | 结合双向切片gru与门控注意力机制日志异常检测方法 | |
CN117933249A (zh) | 一种装备故障知识的智能交互方法及系统 | |
Kyem et al. | Pavecap: The first multimodal framework for comprehensive pavement condition assessment with dense captioning and pci estimation | |
CN116150757A (zh) | 一种基于cnn-lstm多分类模型的智能合约未知漏洞检测方法 | |
CN113076089B (zh) | 一种基于对象类型的api补全方法 | |
KR102439165B1 (ko) | 상식 지식과 언어학적 패턴을 이용한 서술문 신뢰도 평가 시스템 및 그 방법 | |
CN114722798A (zh) | 一种基于卷积神经网络和注意力机制的反讽识别模型 | |
KR102574512B1 (ko) | 은유 탐지 장치 및 방법 | |
Wu et al. | Novel slot detection: A benchmark for discovering unknown slot types in the task-oriented dialogue system | |
CN113487453B (zh) | 基于犯罪要素的法律判决预测方法及系统 | |
CN113342974B (zh) | 一种网络安全实体重叠关系的识别方法、装置及设备 | |
US20220164705A1 (en) | Method and apparatus for providing information based on machine learning | |
CN116467530A (zh) | 一种虚假新闻检测方法及系统 | |
CN118132687A (zh) | 语句处理和类目模型的训练方法、装置、设备及介质 | |
CN115221045A (zh) | 一种基于多任务多视角学习的多目标软件缺陷预测方法 | |
CN113536790A (zh) | 基于自然语言处理的模型训练方法及装置 | |
CN115019149B (zh) | 一种基于模型解释结果的零样本识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20210819 |
|
PA0201 | Request for examination | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20221220 Patent event code: PE09021S01D |
|
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20230828 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20230830 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20230831 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
G170 | Re-publication after modification of scope of protection [patent] | ||
PG1701 | Publication of correction |
Patent event code: PG17011E01I Patent event date: 20240205 Comment text: Request for Publication of Correction Publication date: 20240208 |