[go: up one dir, main page]

RU2009104869A - Способ распознавания трехмерных объектов по единственному двумерному изображению и устройство для его реализации - Google Patents

Способ распознавания трехмерных объектов по единственному двумерному изображению и устройство для его реализации Download PDF

Info

Publication number
RU2009104869A
RU2009104869A RU2009104869/08A RU2009104869A RU2009104869A RU 2009104869 A RU2009104869 A RU 2009104869A RU 2009104869/08 A RU2009104869/08 A RU 2009104869/08A RU 2009104869 A RU2009104869 A RU 2009104869A RU 2009104869 A RU2009104869 A RU 2009104869A
Authority
RU
Russia
Prior art keywords
image
parameters
input
dimensional
unit
Prior art date
Application number
RU2009104869/08A
Other languages
English (en)
Inventor
Виталий Семенович Титов (RU)
Виталий Семенович Титов
Максим Игоревич Труфанов (RU)
Максим Игоревич Труфанов
Сергей Иванович Коростелев (RU)
Сергей Иванович Коростелев
Original Assignee
Государственное образовательное учреждение высшего профессионального образования Курский государственный технический университет (R
Государственное образовательное учреждение высшего профессионального образования Курский государственный технический университет
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Государственное образовательное учреждение высшего профессионального образования Курский государственный технический университет (R, Государственное образовательное учреждение высшего профессионального образования Курский государственный технический университет filed Critical Государственное образовательное учреждение высшего профессионального образования Курский государственный технический университет (R
Priority to RU2009104869/08A priority Critical patent/RU2009104869A/ru
Publication of RU2009104869A publication Critical patent/RU2009104869A/ru

Links

Landscapes

  • Image Analysis (AREA)

Abstract

1. Способ распознавания трехмерных объектов по единственному двумерному изображению, программа которого предусматривает предварительное приведение изображения объекта, вводимого в компьютер, к нормальному, стандартному для данного способа виду - изменению масштаба, поворот в требуемое положение, центрирование, вписание в прямоугольник требуемого размера, преобразование изображения объекта в изображение, выполненное в градациях - различных степенях яркости одного цвета, на которое последовательно, поочередно накладываются изображения хранящихся в памяти компьютера шаблонов, отличающийся тем, что эталонное изображение хранят в виде векторной трехмерной модели, для каждой такой модели фиксируют набор параметров для аффинных преобразований: углы поворота по осям x у z масштаб; этот набор параметров определяют для каждой модели с учетом сложности ее формы с тем, чтобы наиболее точно произвести идентификацию; производят следующую последовательность действий: получают векторную трехмерную модель эталонного объекта путем геометрического построения, затем, изменяя ее положение в пространстве (поворот, отражение, масштабирование), получают ряд вышеуказанных параметров, которые сохраняют и используют в дальнейшем при распознавании для воссоздания соответствующего ракурса эталона объекта; плоское изображение представляют в виде двумерного массива, элементами которого являются значения от 0 до 255 - градации серого цвета; помимо указанных параметров в набор включают дополнительно соотношение сторон габаритного изображения контейнера объекта и кодированное представление объекта, которое позволяет опред�

Claims (2)

1. Способ распознавания трехмерных объектов по единственному двумерному изображению, программа которого предусматривает предварительное приведение изображения объекта, вводимого в компьютер, к нормальному, стандартному для данного способа виду - изменению масштаба, поворот в требуемое положение, центрирование, вписание в прямоугольник требуемого размера, преобразование изображения объекта в изображение, выполненное в градациях - различных степенях яркости одного цвета, на которое последовательно, поочередно накладываются изображения хранящихся в памяти компьютера шаблонов, отличающийся тем, что эталонное изображение хранят в виде векторной трехмерной модели, для каждой такой модели фиксируют набор параметров для аффинных преобразований: углы поворота по осям x у z масштаб; этот набор параметров определяют для каждой модели с учетом сложности ее формы с тем, чтобы наиболее точно произвести идентификацию; производят следующую последовательность действий: получают векторную трехмерную модель эталонного объекта путем геометрического построения, затем, изменяя ее положение в пространстве (поворот, отражение, масштабирование), получают ряд вышеуказанных параметров, которые сохраняют и используют в дальнейшем при распознавании для воссоздания соответствующего ракурса эталона объекта; плоское изображение представляют в виде двумерного массива, элементами которого являются значения от 0 до 255 - градации серого цвета; помимо указанных параметров в набор включают дополнительно соотношение сторон габаритного изображения контейнера объекта и кодированное представление объекта, которое позволяет определить его положение внутри габаритного контейнера, кодирование производят разбиением габаритного контейнера на 121 одинаковых областей и определением наличия части объекта в каждой из них, таким образом получают 121-битный код данного ракурса объекта в двоичном виде: если часть изображения объекта находится в области, то ее помечают единицей; иначе нулем, код получают перебором значений меток в областях слева направо, сверху вниз, на вход распознавателя подают изображение, представленное массивом пикселей в градациях серого, то есть каждый элемент массива имеет значение от 0 до 255, размерность массива зависит от параметров дискретизации изображения, распознавание производят следующим образом: определяют габаритный контейнер входного изображения объекта, затем кодируют вышеуказанным способом, исходя из отношения сторон габаритного контейнера и полученного кода, выбирают набор параметров из базы эталонов, затем выполняют преобразование векторной модели эталонного объекта соответственно установленным ранее параметрам: поворот и масштабирование, после чего строят плоское изображение модели эталона, которое сравнивают с поданным на вход изображением посредством нейросети персептрон, сравнение производят путем анализа градаций серого для каждой дискретной области изображения, причем производят попиксельное сравнение, затем находят модуль разности для каждой пары пикселей изображения поданного на вход распознавателя и полученной проекции векторной модели эталонного объекта и сравнивают его с пороговым значением, полученные данные подают на вход нейросети персептрон, в зависимости от значения функции активации которой принимают решение о схожести проекции векторной модели эталонного объекта и входного изображения.
2. Устройство распознавания трехмерных объектов по единственному двумерному изображению содержит блок ввода и предварительной обработки изображения (БВПО), который выделяет габаритный контейнер, просчитывает необходимые коэффициенты, блок анализа изображения и последующего кодирования (БК), производящий вычисление параметров и кодирование входного изображения, блок, содержащий запоминающее устройство с параметрами эталонов и производящий сравнение (ЗУП), выполняет сравнения полученных ранее параметров исходного изображения с соответствующими параметрами эталонов, блок распознавания (БР), который выполняет сравнение проекции эталона и исходного изображения, блок содержит запоминающее устройство с эталонными изображениями в векторном формате, выполняет просчет трехмерного изображения с учетом имеющихся углов поворота и масштаба; генерирует веса на основе полученных данных и выполняет сравнение посредством нейросети типа персептрон за счет сравнения яркостных составляющих элементов изображения, блок сохранения параметров (БСП) идентифицированного объекта содержит стек для накопления изображений, которые были идентифицированы, блок, выбирающий трехмерный эталон по переданным параметрам и сохраняющий необходимые данные (БВЭ), обеспечивает сохранение результатов распознавания, устройство для коммуникации с ЭВМ (УКЭВМ), причем первый выход блока ввода и предварительной обработки изображения (БВПО) является входом, второй выход блока ввода и предварительной обработки изображения (БВПО) соединен с первым входом блока распознавания (БР), выход блока анализа изображения и последующего кодирования (БК) является первым входом блока, содержащего запоминающее устройство с параметрами эталонов и производящего сравнение (ЗУП), первый выход блока, содержащего запоминающее устройство с параметрами эталонов и производящего сравнение (ЗУП), соединен со вторым входом блока распознавания (БР), второй выход блока, содержащего запоминающее устройство с параметрами эталонов и производящего сравнение (ЗУП) является вторым входом блока, выбирающего трехмерный эталон по переданным параметрам и сохраняющего необходимые данные (БВЭ), первый выход блока распознавания (БР) является входом блока сохранения параметров (БСП), второй выход блока распознавания (БР) соединен с третьим входом блока, выбирающего трехмерный эталон по переданным параметрам и сохраняющего необходимые данные (БВЭ), выход блока сохранения параметров (БСП) является первым входом блока, выбирающего трехмерный эталон по переданным параметрам и сохраняющего необходимые данные (БВЭ), первый выход блока, выбирающего трехмерный эталон по переданным параметрам и сохраняющего необходимые данные (БВЭ), соединен со вторым входом запоминающего устройства с параметрами эталонов и производящего сравнение (ЗУП), второй выход блока, выбирающего трехмерный эталон по переданным параметрам и сохраняющего необходимые данные (БВЭ), подключен к устройству для коммуникации с ЭВМ (УКЭВМ), третий выход блока, выбирающего трехмерный эталон по переданным параметрам и сохраняющего необходимые данные (БВЭ), соединен с третьим входом блока распознавания (БР).
RU2009104869/08A 2009-02-13 2009-02-13 Способ распознавания трехмерных объектов по единственному двумерному изображению и устройство для его реализации RU2009104869A (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2009104869/08A RU2009104869A (ru) 2009-02-13 2009-02-13 Способ распознавания трехмерных объектов по единственному двумерному изображению и устройство для его реализации

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2009104869/08A RU2009104869A (ru) 2009-02-13 2009-02-13 Способ распознавания трехмерных объектов по единственному двумерному изображению и устройство для его реализации

Publications (1)

Publication Number Publication Date
RU2009104869A true RU2009104869A (ru) 2010-08-20

Family

ID=46305185

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2009104869/08A RU2009104869A (ru) 2009-02-13 2009-02-13 Способ распознавания трехмерных объектов по единственному двумерному изображению и устройство для его реализации

Country Status (1)

Country Link
RU (1) RU2009104869A (ru)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2628217C2 (ru) * 2012-11-19 2017-08-15 АйЭйчАй КОРПОРЕЙШН Устройство распознавания трехмерного объекта и способ распознавания трехмерного объекта
CN111989709A (zh) * 2018-04-05 2020-11-24 株式会社小糸制作所 运算处理装置、对象识别系统、对象识别方法、汽车、车辆用灯具

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2628217C2 (ru) * 2012-11-19 2017-08-15 АйЭйчАй КОРПОРЕЙШН Устройство распознавания трехмерного объекта и способ распознавания трехмерного объекта
CN111989709A (zh) * 2018-04-05 2020-11-24 株式会社小糸制作所 运算处理装置、对象识别系统、对象识别方法、汽车、车辆用灯具

Similar Documents

Publication Publication Date Title
US11854283B2 (en) Method and apparatus for visual question answering, computer device and medium
WO2020038205A1 (zh) 目标检测方法、装置、计算机可读存储介质及计算机设备
CN111462120B (zh) 一种基于语义分割模型缺陷检测方法、装置、介质及设备
US10515269B2 (en) Machine vision with dimensional data reduction
CN110059741A (zh) 基于语义胶囊融合网络的图像识别方法
CN110390254B (zh) 基于人脸的性格分析方法、装置、计算机设备及存储介质
CN114005169B (zh) 人脸关键点检测方法、装置、电子设备及存储介质
CN110555424A (zh) 港口集装箱布局检测方法、装置、设备及可读存储介质
RU2007109075A (ru) Способ и устройство для распознавания изображений объектов
CN117314837A (zh) 一种基于改进detr铸件表面缺陷检测方法及系统
US11495049B2 (en) Biometric feature reconstruction method, storage medium and neural network
CN115810197A (zh) 一种多模态电力表单识别方法及装置
RU2009104869A (ru) Способ распознавания трехмерных объектов по единственному двумерному изображению и устройство для его реализации
CN113822871A (zh) 基于动态检测头的目标检测方法、装置、存储介质及设备
CN119049087A (zh) 一种高精度鱼类体态测量方法、设备及存储介质
US20230196718A1 (en) Image augmentation device and method
CN119204863A (zh) 图像关键点检测方法、装置、设备和存储介质
CN116485992A (zh) 一种复合型三维扫描方法和装置、三维扫描仪
CN114663292B (zh) 超轻量级图片去雾及识别网络模型、图片去雾及识别方法
RU2542886C1 (ru) Способ формирования штрихкода по изображениям лиц и устройство для его осуществления
CN119848569B (zh) 融合3d点云的多模态自编码器零配件智能检测方法及装置
Zhang et al. Small vehicle recognition based on attention mechanism and feature fusion
CN110796075B (zh) 人脸多样性数据获取方法、装置、设备及可读存储介质
Yang et al. D2VT: Better Detection and Description of Local Features with Vision Transformers
AU2023321035A1 (en) Training method for image processing network, and coding method, decoding method, and electronic device

Legal Events

Date Code Title Description
FA92 Acknowledgement of application withdrawn (lack of supplementary materials submitted)

Effective date: 20101011

FZ9A Application not withdrawn (correction of the notice of withdrawal)

Effective date: 20101216

FA94 Acknowledgement of application withdrawn (non-payment of fees)

Effective date: 20111129