KR102439165B1 - 상식 지식과 언어학적 패턴을 이용한 서술문 신뢰도 평가 시스템 및 그 방법 - Google Patents
상식 지식과 언어학적 패턴을 이용한 서술문 신뢰도 평가 시스템 및 그 방법 Download PDFInfo
- Publication number
- KR102439165B1 KR102439165B1 KR1020200161606A KR20200161606A KR102439165B1 KR 102439165 B1 KR102439165 B1 KR 102439165B1 KR 1020200161606 A KR1020200161606 A KR 1020200161606A KR 20200161606 A KR20200161606 A KR 20200161606A KR 102439165 B1 KR102439165 B1 KR 102439165B1
- Authority
- KR
- South Korea
- Prior art keywords
- reliability
- common sense
- statement
- expression vector
- feature expression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 71
- 238000000034 method Methods 0.000 title claims abstract description 23
- 239000013604 expression vector Substances 0.000 claims abstract description 62
- 238000013528 artificial neural network Methods 0.000 claims abstract description 46
- 238000012545 processing Methods 0.000 claims abstract description 35
- 239000013598 vector Substances 0.000 claims description 51
- 230000007246 mechanism Effects 0.000 claims description 14
- 238000000605 extraction Methods 0.000 claims description 6
- 230000010365 information processing Effects 0.000 claims 1
- 238000013527 convolutional neural network Methods 0.000 description 10
- 239000000284 extract Substances 0.000 description 9
- 230000008569 process Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Ultra Sonic Daignosis Equipment (AREA)
- Apparatus For Radiation Diagnosis (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
Description
도 2는 본 발명의 실시예에 따른 상식 처리부의 세부 구성을 블록도로 도시한 것이다.
도 3은 본 발명의 실시예에 따른 주의 집중 메커니즘을 이용한 신경망 구조를 도시한 것이다.
도 4는 본 발명의 실시예에 따른 자가 주의 집중 메커니즘을 이용한 신경망 구조를 도시한 것이다.
도 5는 본 발명의 실시예에 따른 서술문 신뢰도 평가 방법의 동작 흐름도를 도시한 것이다.
사용된 관계 | 'IsA','PartOf','HasA','UsedFor','CapableOf', 'AtLocation','Causes','HasSubevent', 'HasFirstSubevent','HasLastSubevent', 'HasPrerequisite','HasProperty','MotivatedByGoal', 'ObstructedBy','Desires','CreatedBy','Antonym', 'DistinctFrom','SymbolOf','DefinedAs','MannerOf', 'LocatedNear','HasContext','CausesDesire','MadeOf', 'ReceivesAction' |
제외된 관계 | 'RelatedTo','ExternalURL','dbpedia','FormOf', 'DerivedFrom','EtymologicallyRelatedTo', 'EtymologicallyDerivedFrom,'SimilarTo','Synonym', |
모델 | 정확도 (%) | |
NewsTrust | LIAR | |
수동 패턴 모델 | 48.00 | 25.88 |
Hybrid CNN | 47.37 | 26.94 |
MMFD | 46.47 | 31.56 |
본 발명 | 50.04 | 27.22 |
본 발명 (증거 문서 + 메타 정보) | 55.47 | 37.21 |
Claims (13)
- 신뢰도 평가가 요구되는 서술문 텍스트를 수신하는 수신부;
지식베이스를 기반으로 상기 서술문 텍스트에 포함된 내용어(content word) 간의 관계를 이용하여 상식 지식 정보를 추출하며, 상기 서술문 텍스트와 상기 상식 지식 정보를 통해 상식 기반의 신뢰도 자질 표현 벡터를 생성하는 상식 처리부;
상기 서술문 텍스트에서 언어학적 패턴과 각 패턴에 관계된 단어들을 선택하여 언어학적 패턴 기반의 신뢰도 자질 표현 벡터를 생성하는 언어학적 패턴 처리부; 및
상기 상식 기반의 신뢰도 자질 표현 벡터와 상기 언어학적 패턴 기반의 신뢰도 자질 표현 벡터를 결합한 심층 신경망을 통해 신뢰도 분류를 수행하여 신뢰도를 평가하는 신뢰도 평가부
를 포함하되,
상기 상식 처리부는
상기 서술문 텍스트에 포함된 모든 내용어(content word) 간의 관계적 지식을 상기 지식베이스에서 순위화하여 상기 상식 지식 정보를 추출하는 상식 추출부; 및
상기 서술문 텍스트와 상기 상식 지식 정보를 입력으로 하는 심층 신경망(Deep Neural Network)을 통해 상기 상식 기반의 신뢰도 자질 표현 벡터를 추출하는 벡터 생성부를 포함하며,
상기 벡터 생성부는
심층 신경망을 통해 인코딩된 상기 서술문 텍스트에 대한 서술문 벡터와 상기 상식 지식 정보에 대한 상식 지식 벡터 사이의 유사도를 기반으로 각 지식들에 대한 가중치를 산출하며, 상기 상식 지식 벡터의 가중치 합과 상기 서술문 벡터와의 결합(concatenation)을 통해 상기 상식 기반의 신뢰도 자질 표현 벡터를 생성하는 것을 특징으로 하는 서술문 신뢰도 평가 시스템. - 삭제
- 제1항에 있어서,
상기 상식 추출부는
복수의 트리플(triple)을 포함하는 상기 지식베이스를 기반으로, 상기 서술문 텍스트에 포함된 내용어 중에서 최소 한가지를 포함하는 트리플을 상기 지식베이스에서 추출하며, 추출된 트리플의 내용어가 상기 서술문 텍스트에 포함되는지 유무에 따라 유사도 점수를 부여하는, 서술문 신뢰도 평가 시스템. - 제3항에 있어서,
상기 상식 추출부는
상기 추출된 트리플 중 내용어가 상기 서술문 텍스트에 모두 포함되는 경우에 1점을 부여하고, 그렇지 않은 경우에는 단어 사이의 유사도를 측정하여 1점 미만의 기 설정된 유사도 점수를 부여하는 것을 특징으로 하는, 서술문 신뢰도 평가 시스템. - 제4항에 있어서,
상기 상식 추출부는
유사도 점수가 부여된 트리플 중 상위 m개의 트리플로 구성된 상기 상식 지식 정보를 추출하는, 서술문 신뢰도 평가 시스템. - 삭제
- 제1항에 있어서,
상기 언어학적 패턴 처리부는
상기 서술문 텍스트를 입력으로 하는 심층 신경망의 다측면 자가 주의집중 메커니즘을 통해 학습된 서로 다른 N개의 언어학적 패턴과 각 패턴에 관계된 단어들을 선택하여 상기 언어학적 패턴 기반의 자질 표현 벡터를 생성하는, 서술문 신뢰도 평가 시스템. - 제1항에 있어서,
상기 신뢰도 평가부는
상기 상식 기반의 신뢰도 자질 표현 벡터와 상기 언어학적 패턴 기반의 신뢰도 자질 표현 벡터를 결합하여 심층 신경망을 통해 가장 높은 확률 값을 가진 신뢰도 라벨을 최종 신뢰도 점수를 선택하여 상기 서술문 텍스트에 대한 신뢰도를 평가하는, 서술문 신뢰도 평가 시스템. - 서술문 신뢰도 평가 시스템에 의해 각 단계가 수행되는 서술문 신뢰도 평가 방법에 있어서,
상기 서술문 신뢰도 평가 시스템의 수신부에 의해, 신뢰도 평가가 요구되는 서술문 텍스트를 수신하는 단계;
상기 서술문 신뢰도 평가 시스템의 상식 처리부에 의해, 지식베이스를 기반으로 상기 서술문 텍스트에 포함된 내용어(content word) 간의 관계를 이용하여 상식 지식 정보를 추출하며, 상기 서술문 텍스트와 상기 상식 지식 정보를 통해 상식 기반의 신뢰도 자질 표현 벡터를 생성하는 단계;
상기 서술문 신뢰도 평가 시스템의 언어학적 패턴 처리부에 의해, 상기 서술문 텍스트에서 언어학적 패턴과 각 패턴에 관계된 단어들을 선택하여 언어학적 패턴 기반의 신뢰도 자질 표현 벡터를 생성하는 단계; 및
상기 서술문 신뢰도 평가 시스템의 신뢰도 평가부에 의해, 상기 상식 기반의 신뢰도 자질 표현 벡터와 상기 언어학적 패턴 기반의 신뢰도 자질 표현 벡터를 결합한 심층 신경망을 통해 신뢰도 분류를 수행하여 신뢰도를 평가하는 단계
를 포함하되,
상기 상식 기반의 신뢰도 자질 표현 벡터를 생성하는 단계는
상기 서술문 텍스트에 포함된 모든 내용어(content word) 간의 관계적 지식을 상기 지식베이스에서 순위화하여 상기 상식 지식 정보를 추출하는 단계; 및
상기 서술문 텍스트와 상기 상식 지식 정보를 입력으로 하는 심층 신경망(Deep Neural Network)을 통해 상기 상식 기반의 신뢰도 자질 표현 벡터를 추출하는 단계를 포함하며,
상기 상식 기반의 신뢰도 자질 표현 벡터를 추출하는 단계는
심층 신경망을 통해 인코딩된 상기 서술문 텍스트에 대한 서술문 벡터와 상기 상식 지식 정보에 대한 상식 지식 벡터 사이의 유사도를 기반으로 각 지식들에 대한 가중치를 산출하며, 상기 상식 지식 벡터의 가중치 합과 상기 서술문 벡터와의 결합(concatenation)을 통해 상기 상식 기반의 신뢰도 자질 표현 벡터를 생성하는 것을 특징으로 하는 서술문 신뢰도 평가 방법. - 삭제
- 삭제
- 제9항에 있어서,
상기 언어학적 패턴 기반의 신뢰도 자질 표현 벡터를 생성하는 단계는
상기 서술문 텍스트를 입력으로 하는 심층 신경망의 다측면 자가 주의집중 메커니즘을 통해 학습된 서로 다른 N개의 언어학적 패턴과 각 패턴에 관계된 단어들을 선택하여 상기 언어학적 패턴 기반의 자질 표현 벡터를 생성하는, 서술문 신뢰도 평가 방법. - 제9항에 있어서,
상기 신뢰도를 평가하는 단계는
상기 상식 기반의 신뢰도 자질 표현 벡터와 상기 언어학적 패턴 기반의 신뢰도 자질 표현 벡터를 결합하여 심층 신경망을 통해 가장 높은 확률 값을 가진 신뢰도 라벨을 최종 신뢰도 점수를 선택하여 상기 서술문 텍스트에 대한 신뢰도를 평가하는, 서술문 신뢰도 평가 방법.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20190153409 | 2019-11-26 | ||
KR1020190153409 | 2019-11-26 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20210065066A KR20210065066A (ko) | 2021-06-03 |
KR102439165B1 true KR102439165B1 (ko) | 2022-09-01 |
Family
ID=76396772
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200161606A Active KR102439165B1 (ko) | 2019-11-26 | 2020-11-26 | 상식 지식과 언어학적 패턴을 이용한 서술문 신뢰도 평가 시스템 및 그 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102439165B1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114139536B (zh) * | 2021-11-01 | 2025-01-10 | 杭州市健康城市指导中心(杭州市献血服务中心) | 线上健康影响评价方法、装置、计算机设备及存储介质 |
KR102659389B1 (ko) * | 2021-11-29 | 2024-04-23 | 한국과학기술원 | 신뢰도와 언어폭력 간 의존성을 이용한 언어폭력 수정 및 텍스트 신뢰도 증강 시스템 및 그 방법 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140051606A (ko) * | 2012-10-23 | 2014-05-02 | 에스케이텔레콤 주식회사 | Rdf 기반의 문장 온톨로지를 이용한 일관성 평가 방법 및 장치 |
KR101835345B1 (ko) * | 2016-02-29 | 2018-03-07 | 경기대학교 산학협력단 | 지식베이스 기반의 개념그래프 확장 시스템 |
WO2018217948A1 (en) * | 2017-05-23 | 2018-11-29 | Google Llc | Attention-based sequence transduction neural networks |
KR20190123397A (ko) * | 2018-04-24 | 2019-11-01 | 성균관대학교산학협력단 | 가짜 리뷰 판별을 위한 분류 모델 선정 방법 |
-
2020
- 2020-11-26 KR KR1020200161606A patent/KR102439165B1/ko active Active
Non-Patent Citations (1)
Title |
---|
이재윤 외 1인, "지식 그래프를 이용한 영상 기반 상식 추론", 2019 추계학술발표대회 논문집 제26권 제2호, 2019.11.02., pp.994-997. 1부.* |
Also Published As
Publication number | Publication date |
---|---|
KR20210065066A (ko) | 2021-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12141532B2 (en) | Device and method for machine reading comprehension question and answer | |
Saha et al. | Hate-alert@ dravidianlangtech-eacl2021: Ensembling strategies for transformer-based offensive language detection | |
CN110532353B (zh) | 基于深度学习的文本实体匹配方法、系统、装置 | |
US11264023B2 (en) | Using multiple modality input to feedback context for natural language understanding | |
Guibon et al. | Multilingual fake news detection with satire | |
Zhao et al. | ZYJ123@ DravidianLangTech-EACL2021: Offensive language identification based on XLM-RoBERTa with DPCNN | |
Le et al. | Text classification: Naïve bayes classifier with sentiment Lexicon | |
CN112149386B (zh) | 一种事件抽取方法、存储介质及服务器 | |
US20200160196A1 (en) | Methods and systems for detecting check worthy claims for fact checking | |
CN110457585B (zh) | 负面文本的推送方法、装置、系统及计算机设备 | |
CN115146068B (zh) | 关系三元组的抽取方法、装置、设备及存储介质 | |
Schütz et al. | Automatic sexism detection with multilingual transformer models | |
CN113961666B (zh) | 关键词识别方法、装置、设备、介质及计算机程序产品 | |
CN114357204B (zh) | 媒体信息的处理方法及相关设备 | |
Çakır et al. | Multi-task regularization based on infrequent classes for audio captioning | |
KR102439165B1 (ko) | 상식 지식과 언어학적 패턴을 이용한 서술문 신뢰도 평가 시스템 및 그 방법 | |
Tang et al. | OCR-oriented master object for text image captioning | |
Przybyła et al. | Verifying the robustness of automatic credibility assessment | |
Jin et al. | Adversarial robustness for large language NER models using disentanglement and word attributions | |
Oswal | Identifying and categorizing offensive language in social media | |
Lindén et al. | Evaluating combinations of classification algorithms and paragraph vectors for news article classification | |
CN111950265A (zh) | 一种领域词库构建方法和装置 | |
CN112446206A (zh) | 一种菜谱标题的生成方法及装置 | |
KR102690029B1 (ko) | 빅데이터 기반 원고의 상업적 출판 여부에 대한 의사결정 정보 및 출판기획전략 정보의 생성 방법, 장치 및 시스템 | |
Das et al. | Language identification of Bengali-English code-mixed data using character & phonetic based LSTM models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20201126 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20211229 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20220826 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20220829 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20220830 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |