CN116168410B - 一种基于神经网络的药盒信息识别方法及系统 - Google Patents
一种基于神经网络的药盒信息识别方法及系统 Download PDFInfo
- Publication number
- CN116168410B CN116168410B CN202310433969.7A CN202310433969A CN116168410B CN 116168410 B CN116168410 B CN 116168410B CN 202310433969 A CN202310433969 A CN 202310433969A CN 116168410 B CN116168410 B CN 116168410B
- Authority
- CN
- China
- Prior art keywords
- sub
- network
- identification
- training
- layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/42—Document-oriented image-based pattern recognition based on the type of document
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/1918—Fusion techniques, i.e. combining data from various sources, e.g. sensor fusion
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于神经网络的药盒信息识别方法及系统,其中,一种基于神经网络的药盒信息识别方法包括:采集包含药品监管码和相关文字的图像样本,相关文字包括生产厂家、用法用量;对图像样本进行预处理,包括几何变换、平滑处理和二值化处理;通过线性组合方式对预处理后的图像样本进行扩充,生成训练数据集;利用训练数据集对识别网络进行迭代训练,直到实际输出与目标输出间的误差达到预设要求结束训练,其中,识别网络包括第一子识别网络和第二子识别网络;采用训练后的第一子识别网络和第二子识别网络分别对相关文字、药品监管码进行识别;本发明提高了文字和药品监管码的识别准确率和识别速度,同时实现了药品定位的双重保障。
Description
技术领域
本发明涉及无人售药的技术领域,尤其涉及一种基于神经网络的药盒信息识别方法及系统。
背景技术
近年来,随着科技的快速发展,无人超市、无人便利店、无人酒店等都已经逐渐步入我们的生活中,无人药店与无人售药柜也不例外,随着智能化进程加快,目前无人售药柜已经逐渐融入我们的生活,解决深夜求药难问题。
然而,现有的无人售药柜大部分是通过内置摄像头,顾客在移动终端扫码下单后通过摄像头捕获药盒图像,再通过内置的识别算法进行药品监管码识别,识别通过后找到对应药品并将其送出无人售药柜,识别算法通常为传统的光学图像处理算法,容易受到如印刷质量、扫描距离、光照变化等因素的影响,无法做到准确且快速地读取药品监管码,并且仅通过识别药品监管码以寻找对应药品的方式较为单一。
发明内容
鉴于上述现有存在的问题,提出了本发明。
因此,本发明提供了一种基于神经网络的药盒信息识别方法,能够快速准确地识别药品监管码,且引入生产厂家、用法用量的识别,从而实现药品定位的双重保障。
为解决上述技术问题,本发明提供如下技术方案,包括:采集包含药品监管码和相关文字的图像样本,所述相关文字包括生产厂家、用法用量;对所述图像样本进行预处理,包括几何变换、平滑处理和二值化处理;通过线性组合方式对预处理后的图像样本进行扩充,生成训练数据集;利用所述训练数据集对识别网络进行迭代训练,直到实际输出与目标输出间的误差达到预设要求结束训练,其中,所述识别网络包括第一子识别网络和第二子识别网络;采用训练后的第一子识别网络和第二子识别网络分别对相关文字、药品监管码进行识别。
作为本发明所述的基于神经网络的药盒信息识别方法的一种优选方案,其中:所述扩充包括:将任意两个图像样本x、y按照设定比例进行线性组合,生成新的图像样本z:
z=ax+(1-a)y
式中,a为图像样本x在图像样本z中的权重,a∈(0,1)。
作为本发明所述的基于神经网络的药盒信息识别方法的一种优选方案,其中:所述第一子识别网络包括1层ORB特征提取层、16个残差块、1层MoE层和1层全连接层;通过ORB特征提取层从所述训练数据集中提取文字特征向量,而后输入到残差块中进行多次卷积操作;其中,每个残差块分别由3层卷积层组成;所述MoE层包括门控层、多个专家层和激活层,通过所述门控层对残差块输出的特征向量等维映射到所述专家层,专家层的数量大于残差块输出的特征向量的维度,而后通过激活层计算残差块输出的特征向量被分配到各个专家层的权重,形成概率分布,并输入至全连接层获得识别结果。
作为本发明所述的基于神经网络的药盒信息识别方法的一种优选方案,其中:所述提取文字特征向量包括:设定抽样比例,对所有图像样本进行抽样,构造多尺度金字塔,在所述多尺度金字塔中随机选取候选特征点,检测候选特征点周围的像素值,若候选特征点周围的像素值均大于候选特征点的灰度值,则选取所述候选特征点作为特征点;以所述特征点为中心,选取大小为k*k的邻域窗口,并在所述邻域窗口内随机选取N组点对;对所述N组点对进行随机的二进制赋值,形成文字特征向量,所述文字特征向量为128位的字符串。
作为本发明所述的基于神经网络的药盒信息识别方法的一种优选方案,其中:所述第二子识别网络包括5个CSP块、1层FPN特征融合层、3层卷积层、1层全连接层;通过5个CSP块对输入的训练数据集进行药品监管码特征提取,获得药品监管码特征向量,所述CSP块均为CSPDarknet53网络;通过FPN特征融合层对CSP块提取的药品监管码特征向量进行下采样,以实现特征融合,而后由卷积层对融合的特征向量进行卷积运算,通过全连接层获得识别结果。
作为本发明所述的基于神经网络的药盒信息识别方法的一种优选方案,其中:所述训练包括:选取交叉熵损失函数作为第一子识别网络和第二子识别网络的目标损失函数,分别对第一子识别网络和第二子识别网络进行反向传播训练,不断调整第一子识别网络和第二子识别网络的网络参数和权值偏差,直到实际输出与目标输出间的误差达到预设要求时结束训练,即目标损失函数值达到最小时结束训练。
作为本发明所述的基于神经网络的药盒信息识别方法的一种优选方案,其中:所述识别包括:采用训练后的第一子识别网络对相关文字进行识别,若识别结果与目标文字一致,则通过训练后的第二子识别网络对药品监管码进行识别,若识别结果与目标药品监管码一致,则允许药品出库。
作为本发明所述的基于神经网络的药盒信息识别系统的一种优选方案,其中:包括:采集模块,被配置为执行采集包含药品监管码和相关文字的图像样本,所述相关文字包括生产厂家、用法用量;图像处理模块,用于对所述图像样本进行预处理,包括几何变换、平滑处理和二值化处理;图像扩充模块,被配置为执行通过线性组合方式对预处理后的图像样本进行扩充,生成训练数据集;训练模块,被配置为执行利用所述训练数据集对识别网络进行迭代训练,直到实际输出与目标输出间的误差达到预设要求结束训练,其中,所述识别网络包括第一子识别网络和第二子识别网络;识别模块,被配置为执行采用训练后的第一子识别网络和第二子识别网络分别对相关文字、药品监管码进行识别。
作为本发明所述的基于神经网络的药盒信息识别系统的一种优选方案,其中:包括:所述训练模块,具体被配置为选取交叉熵损失函数作为第一子识别网络和第二子识别网络的目标损失函数,分别对第一子识别网络和第二子识别网络进行反向传播训练,不断调整第一子识别网络和第二子识别网络的网络参数和权值偏差,直到实际输出与目标输出间的误差达到预设要求时结束训练,即目标损失函数值达到最小时结束训练。
作为本发明所述的基于神经网络的药盒信息识别系统的一种优选方案,其中:包括:所述识别模块,具体被配置为采用训练后的第一子识别网络对相关文字进行识别,若识别结果与目标文字一致,则通过训练后的第二子识别网络对药品监管码进行识别,若识别结果与目标药品监管码一致,则允许药品出库。
本发明的有益效果:本发明通过构建对应的识别网络分别对相关文字和药品监管码进行识别,提高了文字和药品监管码的识别准确率和识别速度,同时实现了药品定位的双重保障。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
图1为本发明第一个实施例所述的一种基于神经网络的药盒信息识别方法的流程示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护的范围。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。
同时在本发明的描述中,需要说明的是,术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一、第二或第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
本发明中除非另有明确的规定和限定,术语“安装、相连、连接”应做广义理解,例如:可以是固定连接、可拆卸连接或一体式连接;同样可以是机械连接、电连接或直接连接,也可以通过中间媒介间接相连,也可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
实施例1
参照图1,为本发明的第一个实施例,该实施例提供了一种基于神经网络的药盒信息识别方法,包括:
S1:采集包含药品监管码和相关文字的图像样本,相关文字包括生产厂家、用法用量。
可通过调用图像采集装置,例如CCD图像传感器对药盒进行拍摄,以采集包含药品监管码和相关文字的图像样本。
S2:对图像样本进行预处理,包括几何变换、平滑处理和二值化处理。
几何变换包括平移、镜像、缩放和旋转操作,以改正图像采集装置的系统误差和仪器位置的随机误差;
本实施例可采用高通滤波器进行平滑处理,以过滤图像中存在的噪声,也可采用其他方式进行噪声过滤,此处不再赘述;
进一步地,通过全局阈值法或局部阈值法对去噪后的图像样本进行二值化处理,生成二值化图像。
S3:通过线性组合方式对预处理后的图像样本进行扩充,生成训练数据集。
将所有预处理后的图像样本通过如下方式进行扩充,生成训练数据集,即将任意两个图像样本x、y按照设定比例进行线性组合,生成新的图像样本z:
z=ax+(1-a)y
式中,a为图像样本x在图像样本z中的权重,a∈(0,1)。
通过采用线性组合的方式可以增加数据集的多样性,从而降低模型的方差,提高识别网络的泛化能力。
S4:利用训练数据集对识别网络进行迭代训练,直到实际输出与目标输出间的误差达到预设要求结束训练。
需要说明的是,识别网络包括第一子识别网络和第二子识别网络,具体的:
(1)第一子识别网络包括1层ORB特征提取层、16个残差块、1层MoE层和1层全连接层。
首先通过ORB特征提取层从训练数据集中提取文字特征向量,ORB特征提取层采用ORB(Oriented Fast and Rotated Brief)算法进行特征提取,ORB算法结合了Fast(Features from acceleratedsegment test)算法和Brief算法,提出了构造金字塔,为Fast特征点添加了方向,从而使得关键点具有了尺度不变性和旋转不变性。其中需要说明的是,BRIEF是一种特征描述子提取算法,匹配只需要使用简单的汉明距离(HammingDistance)利用比特之间的异或操作就可以完成,因此,时间代价低,空间代价低。
具体提取文字特征向量的流程描述如下:
设定抽样比例,对所有图像样本进行抽样,构造多尺度金字塔,在多尺度金字塔中随机选取候选特征点,检测候选特征点周围的像素值,若候选特征点周围的像素值均大于候选特征点的灰度值,则选取候选特征点作为特征点;
以特征点为中心,选取大小为k*k的邻域窗口,并在邻域窗口内随机选取N组点对;
对N组点对进行随机的二进制赋值,形成文字特征向量,文字特征向量为128位的字符串。
进一步地,将提取的文字特征向量输入到残差块中进行多次卷积操作,每个残差块分别由3层卷积层组成;通过设置多个残差块以反向更新解决梯度消失的问题。
从而将模型的能力(capacity)提升了超过1000倍并且只有少量的效率损失。
具体的,MoE层(Mixture-of-Experts layer)包括门控层、多个专家层和激活层,门控层为一个可训练的门控网络,通过可训练的门控网络来对专家们进行稀疏组合(sparse combination)来处理每个输入样本,即通过门控层对残差块输出的特征向量等维映射到专家层,每个专家层都是一个简单的前馈(feed-forward)神经网络,专家层的数量大于残差块输出的特征向量的维度,而后通过激活层计算残差块输出的特征向量被分配到各个专家层的权重,形成概率分布,并输入至全连接层获得识别结果。
较佳的,门控网络通过选择最合适的专家来处理数据,从而将模型的能力(capacity)提升了超过1000倍并且只有少量的效率损失。
(2)第二子识别网络包括5个CSP块、1层FPN特征融合层、3层卷积层、1层全连接层。
为了提高识别效率,本实施例基于YOLOv5目标检测器构建第二子识别网络,首先通过5个CSP块对输入的训练数据集进行药品监管码特征提取,获得药品监管码特征向量,CSP块均为CSPDarknet53网络,每个CSPDarknet53网络的下采样可以通过大小为3×3的卷积核来实现;CSPDarknet53网络是具有跨阶段的局部网络架构,CSPDarknet53网络的主要思想是将输入的训练数据集分为两个部分,一部分继续进行卷积操作,另一部分与上一部分进行卷积操作之后的特征图进行融合。较佳的是,本发明使用CSPDarknet53网络结构作为第二子识别网络的主干网络的优点包括了以下两个方面,首先在不损失检测精度的前提下,提升特征提取的能力,提升了检测速度;其次是降低整个模型的计算损耗,使得模型在配置简单的CPU上也能实现对第二子识别网络的训练。
进一步地,通过FPN特征融合层对CSP块提取的药品监管码特征向量进行下采样,以实现特征融合,特征融合的目的是结合不同尺度的特征信息。在FPN特征融合层中,已经获得的有效特征层被用于继续提取特征。
进一步地,由卷积层对融合的特征向量进行卷积运算,通过全连接层获得识别结果。
进一步地,选取交叉熵损失函数作为第一子识别网络和第二子识别网络的目标损失函数,分别对第一子识别网络和第二子识别网络进行反向传播训练,不断调整第一子识别网络和第二子识别网络的网络参数和权值偏差,直到实际输出与目标输出间的误差达到预设要求时结束训练,即目标损失函数值达到最小时结束训练。
其中,交叉熵能够衡量同一个随机变量中的两个不同概率分布的差异程度,在机器学习中表示为真实概率分布与预测概率分布之间的差异,交叉熵的值越小,模型预测效果就越好。
S5:采用训练后的第一子识别网络和第二子识别网络分别对相关文字、药品监管码进行识别。
采用训练后的第一子识别网络对相关文字进行识别,若识别结果与目标文字一致,则通过训练后的第二子识别网络对药品监管码进行识别,若识别结果与目标药品监管码一致,则允许药品出库。
实施例2
本实施例不同于第一个实施例的是,提供了一种基于神经网络的药盒信息识别系统,包括,
采集模块,被配置为执行采集包含药品监管码和相关文字的图像样本,相关文字包括生产厂家、用法用量。
图像处理模块,用于对图像样本进行预处理,包括几何变换、平滑处理和二值化处理;其中,几何变换包括平移、镜像、缩放和旋转操作,以改正图像采集装置的系统误差和仪器位置的随机误差;可采用高通滤波器进行平滑处理,以过滤图像中存在的噪声;通过全局阈值法和局部阈值法对去噪后的图像样本进行二值化处理。
图像扩充模块,被配置为执行通过线性组合方式对预处理后的图像样本进行扩充,生成训练数据集。
训练模块,被配置为执行利用训练数据集对识别网络进行迭代训练,直到实际输出与目标输出间的误差达到预设要求结束训练,其中,识别网络包括第一子识别网络和第二子识别网络;具体被配置为选取交叉熵损失函数作为第一子识别网络和第二子识别网络的目标损失函数,分别对第一子识别网络和第二子识别网络进行反向传播训练,不断调整第一子识别网络和第二子识别网络的网络参数和权值偏差,直到实际输出与目标输出间的误差达到预设要求时结束训练,即目标损失函数值达到最小时结束训练。
识别模块,被配置为执行采用训练后的第一子识别网络和第二子识别网络分别对相关文字、药品监管码进行识别。具体被配置为采用训练后的第一子识别网络对相关文字进行识别,若识别结果与目标文字一致,则通过训练后的第二子识别网络对药品监管码进行识别,若识别结果与目标药品监管码一致,则允许药品出库。
应当认识到,本发明的实施例可以由计算机硬件、硬件和软件的组合、或者通过存储在非暂时性计算机可读存储器中的计算机指令来实现或实施。所述方法可以使用标准编程技术-包括配置有计算机程序的非暂时性计算机可读存储介质在计算机程序中实现,其中如此配置的存储介质使得计算机以特定和预定义的方式操作——根据在具体实施例中描述的方法和附图。每个程序可以以高级过程或面向对象的编程语言来实现以与计算机系统通信。然而,若需要,该程序可以以汇编或机器语言实现。在任何情况下,该语言可以是编译或解释的语言。此外,为此目的该程序能够在编程的专用集成电路上运行。
此外,可按任何合适的顺序来执行本文描述的过程的操作,除非本文另外指示或以其他方式明显地与上下文矛盾。本文描述的过程(或变型和/或其组合)可在配置有可执行指令的一个或多个计算机系统的控制下执行,并且可作为共同地在一个或多个处理器上执行的代码(例如,可执行指令、一个或多个计算机程序或一个或多个应用)、由硬件或其组合来实现。所述计算机程序包括可由一个或多个处理器执行的多个指令。
进一步,所述方法可以在可操作地连接至合适的任何类型的计算平台中实现,包括但不限于个人电脑、迷你计算机、主框架、工作站、网络或分布式计算环境、单独的或集成的计算机平台、或者与带电粒子工具或其它成像装置通信等等。本发明的各方面可以以存储在非暂时性存储介质或设备上的机器可读代码来实现,无论是可移动的还是集成至计算平台,如硬盘、光学读取和/或写入存储介质、RAM、ROM等,使得其可由可编程计算机读取,当存储介质或设备由计算机读取时可用于配置和操作计算机以执行在此所描述的过程。此外,机器可读代码,或其部分可以通过有线或无线网络传输。当此类媒体包括结合微处理器或其他数据处理器实现上文所述步骤的指令或程序时,本文所述的发明包括这些和其他不同类型的非暂时性计算机可读存储介质。当根据本发明所述的方法和技术编程时,本发明还包括计算机本身。计算机程序能够应用于输入数据以执行本文所述的功能,从而转换输入数据以生成存储至非易失性存储器的输出数据。输出信息还可以应用于一个或多个输出设备如显示器。在本发明优选的实施例中,转换的数据表示物理和有形的对象,包括显示器上产生的物理和有形对象的特定视觉描绘。
如在本申请所使用的,术语“组件”、“模块”、“系统”等等旨在指代计算机相关实体,该计算机相关实体可以是硬件、固件、硬件和软件的结合、软件或者运行中的软件。例如,组件可以是,但不限于是:在处理器上运行的处理、处理器、对象、可执行文件、执行中的线程、程序和/或计算机。作为示例,在计算设备上运行的应用和该计算设备都可以是组件。一个或多个组件可以存在于执行中的过程和/或线程中,并且组件可以位于一个计算机中以及/或者分布在两个或更多个计算机之间。此外,这些组件能够从在其上具有各种数据结构的各种计算机可读介质中执行。这些组件可以通过诸如根据具有一个或多个数据分组(例如,来自一个组件的数据,该组件与本地系统、分布式系统中的另一个组件进行交互和/或以信号的方式通过诸如互联网之类的网络与其它系统进行交互)的信号,以本地和/或远程过程的方式进行通信。
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (6)
1.一种基于神经网络的药盒信息识别方法,其特征在于,包括:
采集包含药品监管码和相关文字的图像样本,所述相关文字包括生产厂家、用法用量;
对所述图像样本进行预处理,包括几何变换、平滑处理和二值化处理;
通过线性组合方式对预处理后的图像样本进行扩充,生成训练数据集;
利用所述训练数据集对识别网络进行迭代训练,直到实际输出与目标输出间的误差达到预设要求结束训练,其中,所述识别网络包括第一子识别网络和第二子识别网络;
采用训练后的第一子识别网络和第二子识别网络分别对相关文字、药品监管码进行识别;
其中,所述扩充包括:
将任意两个图像样本x、y按照设定比例进行线性组合,生成新的图像样本z:
z=ax+(1-a)y
式中,a为图像样本x在图像样本z中的权重,a∈(0,1);
其中,所述第一子识别网络包括1层ORB特征提取层、16个残差块、1层MoE层和1层全连接层;通过ORB特征提取层从所述训练数据集中提取文字特征向量,而后输入到残差块中进行多次卷积操作;其中,每个残差块分别由3层卷积层组成;所述MoE层包括门控层、多个专家层和激活层,通过所述门控层对残差块输出的特征向量等维映射到所述专家层,专家层的数量大于残差块输出的特征向量的维度,而后通过激活层计算残差块输出的特征向量被分配到各个专家层的权重,形成概率分布,并输入至全连接层获得识别结果。
2.如权利要求1所述的基于神经网络的药盒信息识别方法,其特征在于,所述提取文字特征向量包括:
设定抽样比例,对所有图像样本进行抽样,构造多尺度金字塔,在所述多尺度金字塔中随机选取候选特征点,检测候选特征点周围的像素值,若候选特征点周围的像素值均大于候选特征点的灰度值,则选取所述候选特征点作为特征点;
以所述特征点为中心,选取大小为k*k的邻域窗口,并在所述邻域窗口内随机选取N组点对;
对所述N组点对进行随机的二进制赋值,形成文字特征向量,所述文字特征向量为128位的字符串。
3.如权利要求1所述的基于神经网络的药盒信息识别方法,其特征在于,所述第二子识别网络包括5个CSP块、1层FPN特征融合层、3层卷积层、1层全连接层;
通过5个CSP块对输入的训练数据集进行药品监管码特征提取,获得药品监管码特征向量,所述CSP块均为CSPDarknet53网络;
通过FPN特征融合层对CSP块提取的药品监管码特征向量进行下采样,以实现特征融合,而后由卷积层对融合的特征向量进行卷积运算,通过全连接层获得识别结果。
4.如权利要求2或3所述的基于神经网络的药盒信息识别方法,其特征在于,所述训练包括:
选取交叉熵损失函数作为第一子识别网络和第二子识别网络的目标损失函数,分别对第一子识别网络和第二子识别网络进行反向传播训练,不断调整第一子识别网络和第二子识别网络的网络参数和权值偏差,直到实际输出与目标输出间的误差达到预设要求时结束训练,即目标损失函数值达到最小时结束训练。
5.如权利要求4所述的基于神经网络的药盒信息识别方法,其特征在于,所述识别包括:
采用训练后的第一子识别网络对相关文字进行识别,若识别结果与目标文字一致,则通过训练后的第二子识别网络对药品监管码进行识别,若识别结果与目标药品监管码一致,则允许药品出库。
6.一种基于神经网络的药盒信息识别系统,其特征在于,包括:
采集模块,被配置为执行采集包含药品监管码和相关文字的图像样本,所述相关文字包括生产厂家、用法用量;
图像处理模块,用于对所述图像样本进行预处理,包括几何变换、平滑处理和二值化处理;
图像扩充模块,被配置为执行通过线性组合方式对预处理后的图像样本进行扩充,生成训练数据集;
训练模块,被配置为执行利用所述训练数据集对识别网络进行迭代训练,直到实际输出与目标输出间的误差达到预设要求结束训练,其中,所述识别网络包括第一子识别网络和第二子识别网络;
识别模块,被配置为执行采用训练后的第一子识别网络和第二子识别网络分别对相关文字、药品监管码进行识别;
其中,所述训练模块,具体被配置为选取交叉熵损失函数作为第一子识别网络和第二子识别网络的目标损失函数,分别对第一子识别网络和第二子识别网络进行反向传播训练,不断调整第一子识别网络和第二子识别网络的网络参数和权值偏差,直到实际输出与目标输出间的误差达到预设要求时结束训练,即目标损失函数值达到最小时结束训练;
其中,所述识别模块,具体被配置为采用训练后的第一子识别网络对相关文字进行识别,若识别结果与目标文字一致,则通过训练后的第二子识别网络对药品监管码进行识别,若识别结果与目标药品监管码一致,则允许药品出库。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310433969.7A CN116168410B (zh) | 2023-04-21 | 2023-04-21 | 一种基于神经网络的药盒信息识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310433969.7A CN116168410B (zh) | 2023-04-21 | 2023-04-21 | 一种基于神经网络的药盒信息识别方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116168410A CN116168410A (zh) | 2023-05-26 |
CN116168410B true CN116168410B (zh) | 2023-06-30 |
Family
ID=86413443
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310433969.7A Active CN116168410B (zh) | 2023-04-21 | 2023-04-21 | 一种基于神经网络的药盒信息识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116168410B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116525060B (zh) * | 2023-06-25 | 2023-10-03 | 中南大学 | 基于医药制品监管模型的智能区域监控方法及系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107545150A (zh) * | 2017-10-13 | 2018-01-05 | 张晨 | 基于深度学习的药品识别系统及其识别方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111382622A (zh) * | 2018-12-28 | 2020-07-07 | 泰芯科技(杭州)有限公司 | 一种基于深度学习的药品识别系统及其实现方法 |
CN113205047B (zh) * | 2021-04-30 | 2024-05-10 | 平安科技(深圳)有限公司 | 药名识别方法、装置、计算机设备和存储介质 |
CN115620305A (zh) * | 2022-10-19 | 2023-01-17 | 重庆康洲大数据(集团)有限公司 | 一种基于深度学习的拍照识药系统及其使用方法 |
CN115830298B (zh) * | 2023-02-17 | 2023-05-05 | 江苏羲辕健康科技有限公司 | 一种基于神经网络的药品监管码识别方法及系统 |
-
2023
- 2023-04-21 CN CN202310433969.7A patent/CN116168410B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107545150A (zh) * | 2017-10-13 | 2018-01-05 | 张晨 | 基于深度学习的药品识别系统及其识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN116168410A (zh) | 2023-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110335316B (zh) | 基于深度信息的位姿确定方法、装置、介质与电子设备 | |
Lan et al. | Joint sparse representation and robust feature-level fusion for multi-cue visual tracking | |
CN110909605B (zh) | 基于对比相关的跨模态行人重识别方法 | |
WO2021218238A1 (zh) | 图像处理方法和图像处理装置 | |
CN111104925B (zh) | 图像处理方法、装置、存储介质和电子设备 | |
CN107633226A (zh) | 一种人体动作跟踪识别方法及系统 | |
dos Santos Rosa et al. | Sparse-to-continuous: Enhancing monocular depth estimation using occupancy maps | |
CN116168410B (zh) | 一种基于神经网络的药盒信息识别方法及系统 | |
CN111353325B (zh) | 关键点检测模型训练方法及装置 | |
Ma et al. | Dynamic gesture contour feature extraction method using residual network transfer learning | |
CN110490058B (zh) | 行人检测模型的训练方法、装置、系统和计算机可读介质 | |
CN111353429A (zh) | 基于眼球转向的感兴趣度方法与系统 | |
CN114998743A (zh) | 一种视觉地图点的构建方法、装置、设备及介质 | |
CN118053174A (zh) | 一种身体特征快速定位方法及系统 | |
Elassal et al. | Unsupervised crowd counting | |
CN116071804A (zh) | 人脸识别的方法、装置和电子设备 | |
CN115345917A (zh) | 低显存占用的多阶段稠密重建方法及装置 | |
CN114549857A (zh) | 图像信息识别方法、装置、计算机设备和存储介质 | |
CN111753625B (zh) | 一种行人检测方法、装置、设备及介质 | |
Qiu et al. | An adaptive kernel‐based target tracking method based on multiple features fusion | |
Ma et al. | A Method of Protein Model Classification and Retrieval Using Bag‐of‐Visual‐Features | |
WO2023041969A1 (en) | Face-hand correlation degree detection method and apparatus, device and storage medium | |
CN113096104A (zh) | 目标分割模型的训练方法及装置和目标分割方法及装置 | |
CN115577728B (zh) | 一维码定位方法、装置、计算机设备及存储介质 | |
Ren et al. | Loop closure detection based on feature pyramids and NetVLAD |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |