KR102280201B1 - 머신 러닝을 이용하여 은닉 이미지를 추론하는 방법 및 장치 - Google Patents
머신 러닝을 이용하여 은닉 이미지를 추론하는 방법 및 장치 Download PDFInfo
- Publication number
- KR102280201B1 KR102280201B1 KR1020190145789A KR20190145789A KR102280201B1 KR 102280201 B1 KR102280201 B1 KR 102280201B1 KR 1020190145789 A KR1020190145789 A KR 1020190145789A KR 20190145789 A KR20190145789 A KR 20190145789A KR 102280201 B1 KR102280201 B1 KR 102280201B1
- Authority
- KR
- South Korea
- Prior art keywords
- image
- input
- images
- data
- inferred
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000010801 machine learning Methods 0.000 title abstract description 5
- 239000013598 vector Substances 0.000 claims description 75
- 238000010586 diagram Methods 0.000 description 26
- 238000013528 artificial neural network Methods 0.000 description 5
- 230000009466 transformation Effects 0.000 description 4
- 239000011449 brick Substances 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 230000002860 competitive effect Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 208000009119 Giant Axonal Neuropathy Diseases 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 201000003382 giant axonal neuropathy 1 Diseases 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G06K9/20—
-
- G06K9/6201—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/469—Contour-based spatial representations, e.g. vector-coding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
Description
도 2는 도 1에 도시된 분류망(30)의 예시도이다.
도 3은 도 1에 도시된 생성망(40)의 예시도이다.
도 4는 본 발명의 일 실시예에 따른 은닉 이미지 추론 방법의 흐름도이다.
도 5는 도 1에 도시된 분류망(30)의 이미지 적합성 점수 결정 방식을 설명하기 위한 개념도이다.
도 6은 도 4에 도시된 1000 단계에서 입력되는 모든 데이터가 이미지인 경우의 예시도이다.
도 7은 도 4에 도시된 1000 단계에서 입력되는 데이터 일부가 특징값인 경우의 예시도이다.
도 8은 도 4에 도시된 1000 단계에서 입력되는 데이터 일부가 텍스트인 경우의 예시도이다.
도 9는 도 4에 도시된 1000 단계에서 입력되는 데이터 일부가 특징값과 텍스트인 경우의 예시도이다.
도 10은 도 6에 도시된 예에 대한 생성망(40)의 데이터 처리 과정도이다.
도 11은 도 10에 도시된 예에 대한 생성망(40)의 데이터 처리 과정도이다.
도 12는 도 4에 도시된 특징값 프로세싱과 텍스트 프로세싱의 상세도이다.
도 13은 도 1에 도시된 분류망(30)과 생성망(40)의 학습 예를 도시한 도면이다.
도 14는 도 4에 도시된 은닉 이미지 추론 방법의 활용 예를 도시한 도면이다.
20 ... 제어 모듈
30 ... 분류망
40 ... 생성망
50 ... 스토리지
60 ... 출력 모듈
Claims (10)
- 적어도 하나의 이미지, 적어도 하나의 텍스트, 및 적어도 하나의 특징값 중 적어도 두 개의 데이터를 입력하는 단계;
생성망은 학습을 통해 구축된 이미지들간의 연관 관계 모델에 따라 상기 입력된 적어도 두 개의 데이터로부터 추론되는 적어도 하나의 이미지를 생성하는 단계;
분류망은 상기 생성된 각 추론 이미지의 적합성 점수를 결정하는 단계; 및
상기 생성된 추론 이미지의 적합성 점수와 기준 점수의 비교 결과에 기초하여 상기 생성된 각 추론 이미지를 상기 입력된 적어도 두 개의 데이터가 나타내는 이미지들 사이의 은닉 이미지로서 출력하는 단계를 포함하는 것을 특징으로 하는 은닉 이미지 추론 방법. - 제 1 항에 있어서,
상기 적합성 점수를 결정하는 단계는 상기 입력된 적어도 두 개의 데이터로부터 상기 각 추론 이미지의 적합성 점수를 결정하는 것을 특징으로 하는 은닉 이미지 추론 방법. - 제 2 항에 있어서,
상기 적합성 점수를 결정하는 단계는 상기 생성된 각 추론 이미지를 상기 생성망에 입력함으로써 생성된 적어도 하나의 이미지, 적어도 하나의 텍스트, 및 적어도 하나의 특징값 중 적어도 두 개의 데이터와 상기 입력된 적어도 두 개의 데이터의 유사도에 따라 상기 적합성 점수를 결정하는 것을 특징으로 하는 은닉 이미지 추론 방법. - 제 1 항에 있어서,
상기 추론 이미지를 생성하는 단계는
상기 적어도 하나의 이미지, 적어도 하나의 텍스트, 및 적어도 하나의 특징값 중 적어도 두 개의 데이터를 잠재 벡터들로 변환하는 단계;
상기 변환된 잠재 벡터들을 보간함으로써 상기 변환된 잠재 벡터들 사이에 위치하는 잠재 벡터를 산출하는 단계; 및
상기 변환된 잠재 벡터들과 상기 산출된 잠재 벡터를 이용하여 상기 입력된 적어도 두 개의 데이터로부터 추론되는 적어도 하나의 이미지를 생성하는 단계를 포함하는 것을 특징으로 하는 은닉 이미지 추론 방법. - 제 1 항에 있어서,
상기 추론 이미지를 생성하는 단계는
상기 입력된 각 이미지를 잠재 벡터로 변환하는 단계; 및
상기 변환된 잠재 벡터를 이용하여 상기 입력된 각 이미지 관점에서 상기 입력된 적어도 두 개의 데이터가 나타내는 이미지들간의 연관 관계의 특징들을 추론하는 단계를 포함하는 것을 특징으로 하는 은닉 이미지 추론 방법. - 제 1 항에 있어서,
상기 추론 이미지를 생성하는 단계는
상기 입력된 각 텍스트를 잠재 벡터로 변환하는 단계; 및
상기 변환된 잠재 벡터를 이용하여 상기 입력된 각 텍스트 관점에서 상기 입력된 적어도 두 개의 데이터가 나타내는 이미지들간의 연관 관계의 특징들을 추론하는 단계를 포함하는 것을 특징으로 하는 은닉 이미지 추론 방법. - 제 1 항에 있어서,
상기 추론 이미지를 생성하는 단계는
상기 입력된 각 특징값을 잠재 벡터로 변환하는 단계; 및
상기 변환된 잠재 벡터를 이용하여 상기 입력된 각 특징값 관점에서 상기 입력된 적어도 두 개의 데이터가 나타내는 이미지들간의 연관 관계의 특징들을 추론하는 단계를 포함하는 것을 특징으로 하는 은닉 이미지 추론 방법. - 제 1 항에 있어서,
상기 추론 이미지를 생성하는 단계는
상기 입력된 적어도 하나의 이미지, 적어도 하나의 텍스트, 및 적어도 하나의 특징값을 잠재 벡터들로 변환하는 단계;
상기 변환된 잠재 벡터들을 이용하여 상기 입력된 적어도 두 개의 데이터가 나타내는 이미지들간의 연관 관계의 특징들을 추론하는 단계; 및
상기 추론된 특징들을 통합하고, 상기 연관 관계 모델에 따라 상기 통합된 특징들로부터 추론되는 적어도 하나의 이미지를 생성함으로써 상기 입력된 적어도 두 개의 데이터로부터 추론되는 적어도 하나의 이미지를 생성하는 단계를 포함하는 것을 특징으로 하는 은닉 이미지 추론 방법. - 제 1 항 내지 제 8 항 중에 어느 한 항의 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
- 적어도 하나의 이미지, 적어도 하나의 텍스트, 및 적어도 하나의 특징값 중 적어도 두 개의 데이터를 입력하는 입력 모듈;
학습을 통해 구축된 이미지들간의 연관 관계 모델에 따라 상기 입력된 적어도 두 개의 데이터로부터 추론되는 적어도 하나의 이미지를 생성하는 생성망;
상기 생성된 각 추론 이미지의 적합성 점수를 결정하는 분류망; 및
상기 생성된 추론 이미지의 적합성 점수와 기준 점수의 비교 결과에 기초하여 상기 생성된 각 추론 이미지를 상기 입력된 적어도 두 개의 데이터가 나타내는 이미지들 사이의 은닉 이미지로서 출력하는 출력 모듈을 포함하는 것을 특징으로 하는 은닉 이미지 추론 장치.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180146025 | 2018-11-23 | ||
KR20180146025 | 2018-11-23 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200061294A KR20200061294A (ko) | 2020-06-02 |
KR102280201B1 true KR102280201B1 (ko) | 2021-07-21 |
Family
ID=71090835
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190145789A Active KR102280201B1 (ko) | 2018-11-23 | 2019-11-14 | 머신 러닝을 이용하여 은닉 이미지를 추론하는 방법 및 장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102280201B1 (ko) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102427690B1 (ko) * | 2020-08-05 | 2022-08-01 | 라온피플 주식회사 | 딥러닝 기반 클래스 분류 장치 및 방법 |
KR102332114B1 (ko) * | 2020-11-24 | 2021-12-01 | 한국과학기술원 | 이미지 처리 방법 및 장치 |
KR102429411B1 (ko) | 2020-11-24 | 2022-08-04 | 주식회사 유비무환 | 영유아의 영양 및 소화흡수 상태 모니터링에 의한 맞춤형 hmr 이유식 제공방법 및 제공시스템 |
KR102502958B1 (ko) * | 2021-09-01 | 2023-02-24 | 주식회사 델타엑스 | 이미지를 이용해 오디오를 전송하는 방법 및 장치 |
WO2024080647A1 (ko) * | 2022-10-13 | 2024-04-18 | 주식회사 에이슬립 | 사용자 수면 정보 기반의 수면 콘텐츠 생성 및 제공 방법, 장치, 컴퓨터 프로그램 및 컴퓨터 판독 가능한 기록매체 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101308347B1 (ko) * | 2011-04-06 | 2013-09-17 | 아주대학교산학협력단 | 상관관계를 이용한 가려진 얼굴 영상 검출 및 복원 방법 |
KR101919831B1 (ko) * | 2012-01-11 | 2018-11-19 | 삼성전자주식회사 | 오브젝트 인식 장치, 분류 트리 학습 장치 및 그 동작 방법 |
KR101567497B1 (ko) * | 2014-02-11 | 2015-11-11 | 동서대학교산학협력단 | 축 방향 분산 영상 기법(ads)을 이용한 가려진 영상 도출 시스템 및 그 방법 |
KR101925907B1 (ko) * | 2016-06-03 | 2019-02-26 | (주)싸이언테크 | 신경망 생성 모델을 이용한 객체 움직임 패턴 학습장치 및 그 방법 |
-
2019
- 2019-11-14 KR KR1020190145789A patent/KR102280201B1/ko active Active
Also Published As
Publication number | Publication date |
---|---|
KR20200061294A (ko) | 2020-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102280201B1 (ko) | 머신 러닝을 이용하여 은닉 이미지를 추론하는 방법 및 장치 | |
US11836586B2 (en) | Training data generating device, method, and program, and crowd state recognition device, method, and program | |
CN113963445B (zh) | 一种基于姿态估计的行人摔倒动作识别方法及设备 | |
US11106903B1 (en) | Object detection in image data | |
JP2019144830A (ja) | 複数の認識エンジンを用いて人物の行動を認識するプログラム、装置及び方法 | |
US11321866B2 (en) | Approach photographing device and method for controlling the same | |
JP2018022360A (ja) | 画像解析装置、画像解析方法およびプログラム | |
Yi et al. | Human action recognition based on action relevance weighted encoding | |
US20230386185A1 (en) | Statistical model-based false detection removal algorithm from images | |
KR20200092453A (ko) | 키워드에 기초하여 이미지를 생성하는 이미지 생성 장치 및 이미지 생성 방법 | |
JP2019212148A (ja) | 情報処理装置及び情報処理プログラム | |
JP7488674B2 (ja) | 物体認識装置、物体認識方法及び物体認識プログラム | |
CN118840695A (zh) | 一种目标行为的识别方法、系统及设备 | |
JP2019194758A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
Cherian et al. | Generative adversarial networks with stochastic gradient descent with momentum algorithm for video-based facial expression | |
EP3401843A1 (en) | A method, an apparatus and a computer program product for modifying media content | |
Xiong et al. | Deepfakes detection using computer vision and deep learning approaches | |
JP2021064120A (ja) | 情報処理装置、情報処理方法、及びプログラム | |
KR102669951B1 (ko) | Xr 웨딩 스튜디오 시스템 | |
CN117156078B (zh) | 一种视频数据处理方法、装置、电子设备及存储介质 | |
Oludare | Multimodal Data Enhancement and Augmentation Methodologies for Developing Robust Artificial Intelligence Systems | |
Morimoto et al. | Continuous Action Recognition by Action-specific Motion Models. | |
Dinakaran | Robust object detection in the wild via cascaded DCGAN | |
Xu | Automatic Generation of Character Animations based on Dove Swarm Optimization Algorithm with Convolution Neural Network | |
Karlsson et al. | Drone detection using deep neural networks and semi-supervised learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20191114 |
|
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20200207 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20191114 Comment text: Patent Application |
|
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20210427 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20210715 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20210715 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20240919 Start annual number: 4 End annual number: 4 |