CN102982501B - 一种图像样本标定方法 - Google Patents
一种图像样本标定方法 Download PDFInfo
- Publication number
- CN102982501B CN102982501B CN201210464397.0A CN201210464397A CN102982501B CN 102982501 B CN102982501 B CN 102982501B CN 201210464397 A CN201210464397 A CN 201210464397A CN 102982501 B CN102982501 B CN 102982501B
- Authority
- CN
- China
- Prior art keywords
- image
- feature coding
- sample
- original image
- coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000005070 sampling Methods 0.000 claims abstract description 6
- 230000006835 compression Effects 0.000 description 12
- 238000007906 compression Methods 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 8
- 230000001815 facial effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 210000003141 lower extremity Anatomy 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
Landscapes
- Editing Of Facsimile Originals (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种图像样本标定方法,包括从原始图像中获取样本特征编码的步骤,还包括把所获得的所述特征编码按照预定的嵌入方法嵌入到所述原始图像中的步骤,以生成经验样本;以及在调用所述经验样本进行抽样、乱序或重排序时匹配所述嵌入方法读取所述特征编码的步骤。依据本发明的图像样本标定方法能够减少在抽样、乱序、重排序中的工作复杂度。
Description
技术领域
本发明涉及一种图像样本标定方法,被标定的样本通常被称为经验样本。
背景技术
对于目前机器学习方法,训练和预测的样本往往都是图像内部的特征,这些特征往往都是通过手工标定获取特征编码,然后再存储到其他辅助记录文件中,在需要的时候再从这些记录文件中读取出来。由于采用了辅助文件,致使产生这些特征编码的原始样本和特征编码数据分离,在日后的抽样、乱序、重排序中对文件的名称、顺序、以及规则都可能有一定的要求,增加了工作的复杂度。
发明内容
因此,本发明提供一种图像样本标定方法,将获取的样本特征编码存储到原始图像中,从而减少在抽样、乱序、重排序中的工作复杂度。
本发明所采用的技术方案为:
一种图像样本标定方法,包括从原始图像中获取样本特征编码的步骤,还包括把所获得的所述特征编码按照预定的嵌入方法嵌入到所述原始图像中的步骤,以生成经验样本;
以及在调用所述经验样本进行抽样、乱序或重排序时匹配所述嵌入方法读取所述特征编码的步骤。
依据本发明的上述图像样本标定方法,把获取的样本特征编码存储到原始图像中,在需要的时候直接从原始图像中读取特征编码,从而,在以后的抽样、乱序、重排序时,由于将图像样本、特征编码捆绑在一起,减少了工作的复杂度。
上述图像样本标定方法,在一些实施例中,把所获得的所述特征编码按照预定的嵌入方法嵌入到所述原始图像中步骤的目标区域为原始图像的非感兴趣区域,在不影响原始图像质量的情况下,能够存放有效的存放所述特征编码。
进一步地,上述图像样本标定方法,所述嵌入方法为在所述非感兴趣区域选定能够容纳所述特征编码的行列组,一个特征编码对应的特征点的列行值使用固定的特征值表示在一对行列中,相应地,读取所述特征编码的步骤则检索所述特征值,进而得到所述特征编码,主要用来存放信息量比较小的特征编码,对原始图像的质量影响也比较小。
优选地,当特征点少于两个时,优选原始图像的左右第一列和上下第一行作为非感兴趣区域,对原始图像的质量影响非常小,且用于的一半关注点也不在边框附近。
在一些实施例中,所述嵌入方法为在原始图像中加入数字水印的方式嵌入所述特征编码,在不影响载体使用价值的情况下可以存放足够多的信息。
进一步地,在一些实施例中加入所述数字水印的方法是采用最低有效位算法把所述特征编码编入所述原始图像的方法,通过二进制字符串控制,计算量比较小。
在一些实施例中,加入所述数字水印的方法为对原始图像进行压缩,在原有的图像尺寸上偏移被压缩的所述原始图像,留出的空白空间用于存放所述特征编码,由于特征编码的信息量比较小,所需要的空白空间也比较小,原始图像的压缩不会因此而太大,图像质量几乎不受影响。
在另一些实施例中,加入所述数字水印的方法是采用拼凑算法把所述特征编码编入所述原始图像,其中拼凑算法用于统计特性的数字水印嵌入方法,利用统计学方法可以比较容易的检出原始图像中的附加信号。
在一些实施例中,若原始图像为jpeg格式的图片,则把所述特征编码存储到其文件头的EXIF中,充分利用jpeg格式图片的空间,并且不会对图像质量产生任何影响。
优选地,把所述特征编码存储到原始图像文件头的EXIF中的MakerNote字段中,检索相对比较容易。
具体实施方式
本文侧重于样本特征编码(本文都简称为特征编码)存放于原始图像的方式,可以根据特征编码的信息量,选择存放方式。
为了更清楚地进行说明,在下文中,采用树形结构的形式详细展示所采用的技术方案,可以更清晰地理解本文所采用的方案:
依据本文的核心目的,即在原始图像中存储特征编码的教导,应关注于特征编码的信息量和编码方式,这些内容在现有技术中已普遍存在,在下文中会有所展示,本领域的技术人员可以根据这些内容选择合适的把特征编码存储到原始图像中的方式。应当理解,读取样本特征编码的方式与存储方式相对应。
据此,一种图像样本标定方法,其包括以下步骤:
1.获取样本特征编码。
1.1、常用的样本特征编码:
1.1.1、根据1.1,样本特征编码可以是1个点坐标,以区分具有特定坐标点的图像,形成具有该坐标点的经验样本,信息量较小;
1.1.2、根据1.1,样本特征编码可以是多边形的多个端点坐标,具有区分度大于所述单坐标点的能力,信息量稍大;
1.1.3、根据1.1,样本特征编码可以是曲线上的关键点坐标或关键参数,信息量相对也不大,特征编码的选择取决于经验样本使用目的,本领域的技术人员应当清楚的理解,在下文中,对此不再赘述;
1.1.4、根据1.1,样本特征编码可以是不连续点集坐标,信息量稍大;
1.1.5、根据1.1,如果训练样本为人脸照片时,样本特征编码可以是性别,可以是民族,可以是年龄,如性别可以使用0、1进行区分,信息量不大;
1.1.6、根据1.1,如果训练样本为车辆照片时,样本特征编码可以是车颜色,可以是车牌号,可以是车型号,在这样的应用中,信息量相对较大,如车颜色,常用的车的颜色并不太多,但若加上其他特征,会加大信息量。
1.2、样本特征编码获取方式。
1.2.1、根据1.2,获取方式可以是通过图像处理软件标记;
1.2.2、根据1.2,获取方式可以是通过自定义标记程序标记;
1.2.3、根据1.2,获取方式可以是通过肉眼观察方式标记。
2.存储样本特征编码:将样本特征编码存储到原始图片中。
2.1、根据2,样本特征编码存储可以是将样本特征编码存储到图像的非感兴趣区域;
注:非感兴趣区域是感兴趣区域 (ROI,Region Of Interest )的一个相对概念,在图像压缩技术领域较长使用。如在jpeg图片中,感兴趣区域压缩就是指用户可以任意指定图片上感兴趣的区域,然后在压缩时对这些区域指定压缩质量,或在恢复时指定某些区域的解压缩要求。这是因为子波在空间和频率域上具有局域性,要完全恢复图像中的某个局部,并不需要所有编码都被精确保留,只要对应他的一部分编码没有误差就可以了。在实际应用中,我们就可以对一幅图像中感兴趣的部分采用低压缩比以获取较好的图像效果,而对其他部分采用高压缩比以节省存储空间。这样就能在保证不丢失重要信息的同时又有效地压缩了数据量,实现了真正的“交互式”压缩。在经验样本中,感兴趣区域和非感兴趣区域都是确定的,使用者往往对感兴趣区域有更多的关注,非感兴趣区域对附加信息的添附不会影响图像的整体质量。当然,在图像压缩中,首当其冲的是非感兴区域,这里不涉及压缩,因此不考虑压缩对所添加信息的影响。
2.1.1、根据2.1,可以将图像的上下第1行每个像素的3个通道值都设置成原值加1,同时将图像的左右第1列每个像素的3个通道值都设置成原值加1,对于超出255的值,将其赋值成255。对于需要标记的点P(i,j)(第i行j列的点),将第1列第i个像素的3个通道值都设置成0,将第1行第j个像素的3个通道值都设置成0即可。
2.2、根据2,样本特征编码存储可以是借助数字水印技术将样本特征编码存储到当前图像中;
注:数字水印技术将一些标识信息(即数字水印)直接嵌入数字载体当中(包括多媒体、文档、软件等)或是间接表示(修改特定区域的结构),且不影响原载体的使用价值,也不容易被探知和再次修改。但可以被生产方识别和辨认,因此,在本文中,可以被生产方式别和辨认,而不必考虑具体的数字水印方式,只要匹配该方式,就可以对所存储的特征编码进行识别,或者说读取。
2.2.1、根据2.2,数字水印技术可以是采用最低有效位算法把附加信号编入原始信号中的方式。该算法把附加信号看作二进制数据串,用此二进制数据替换原始信号的最低1位或多位数据位;
2.2.2、根据2.2,数字水印技术可以是对于视频信号采用文档结构微调的方法把附加信号写入原始信号中的方式。通过图像的水平微量平移、竖直微量平移、图像微量压缩操作,压缩原始图像的空间尺度,留出空白空间存放附加信号;这里的微量取决于数字编码的大小,显然,大多数情况下,数字编码的信息量非常小,因此,所需要的空白空间也不大,对原始图像的质量不会产生太大的影响。
2.2.3、根据2.2,数字水印技术可以是采用拼凑法把附加信号编入原始信号的方式。该方法是一种基于统计特性的数字水印嵌入方案。它选择任意多对信号点,在增加一点信号强的同时,降低配对的另一点的信号强度。利用统计学方法可以从接收的复合图像中检出附加信号;
2.2.4、根据2.2,数字水印技术可以是采用DCT变换与方法把附加信号编入原始信号的方式;
2.2.5、根据2.2,数字水印技术可以是采用压缩域方法把附加信号编入原始信号的方式;
2.3、根据2,如果原始图像文件为Jpeg格式,可以将样本特征编码存储在文件头中的EXIF部分信息中;
2.3.1、根据2.3,如果图像文件为Jpeg格式,可以将样本特征编码存储在文件头中的EXIF的MakerNote字段中。Exif 文件实际是JPEG文件的一种,遵从JPEG标准,只是在文件头信息中增加了有关拍摄信息的内容和索引图,其包括Image Description、Artist等字段。
3.读取样本特征编码。
3.1、根据3,读取存储于图像中的样本特征编码;
3.1.1、根据3.1、2.1,采用逆过程,读取存储在图像的非感兴趣区域中的特征编码;
3.1.1.1、根据3.1、2.1、2.1.1,读取图像第1列中3个通道值为0的行i,读取图像第1行中3个通道值为0的列j,则图像中第i行j列对应的像素即为标记的图像特征点;
3.1.2、根据3.1、2.2、2.2.1,采用逆过程,读取采用最低有效位算法把附加信号编入原始信号中的数字水印方式存储在图像中的特征编码;
3.1.3、根据3.1、2.2、2.2.2,采用逆过程,读取对于视频信号采用文档结构微调的方法把附加信号写入原始信号中的数字水印方式存储在图像中的特征编码;
3.1.4、根据3.1、2.2、2.2.3,采用逆过程,读取采用拼凑法把附加信号编入原始信号的数字水印方式存储在图像中的特征编码;
3.1.5、根据3.1、2.2、2.2.4,采用逆过程,读取采用DCT变换与方法把附加信号编入原始信号的数字水印方式存储在图像中的特征编码;
3.1.5、根据3.1、2.2、2.2.5,采用逆过程,读取采用压缩域方法把附加信号编入原始信号的数字水印方式存储在图像中的特征编码;
3.1.6、根据3.1、2.3,如果图像文件为Jpeg,读取存储在文件头中的EXIF的MakerNote字段部分的特征编码。
下面以两个更具体的实例说明本文所提出的方案:
实施例一 :
标记人脸图像中下巴的下边缘的纵坐标:
1.样本手工标记:
1.1、通过编写的标记程序标记下巴纵坐标,步骤如下:
1.1.1、标记程序加载尺寸为240x320人脸图像,其人眼中心坐标为(120,160),眼宽为64像素;
1.1.2、在图像区域的(115,200)处生成1个长度为10像素的线段;
1.1.3、通过键盘光标上下移动线段,直到线段位置在下巴的下方边缘处j;
2.样本特征编码存储:
2.1处理非感兴趣区域:
将图像的左边第1列每个像素的3个通道数值修改成原数值加1,对于超出255的通道数值将其赋值成255;
2.2存储标记点:
根据2、1.1.3,将图像左边第1列第j个像素的3个通道数值修改成0,保存图像。
3.提取样本标记信息
根据2,遍历图像第1列中像素,找到3个通道数值都为0的像素点,该点的位置即为下巴的纵坐标。
实施例二:
标记人脸图像中鼻子区域:
1.样本手工标记
1.1、通过编写的标记程序标记鼻子区域,步骤如下:
1.1.1、标记程序加载尺寸为240x320人脸图像,其人眼中心坐标为(120,160),眼宽为64像素;
1.1.2、在图像区域生成以(100,160)、(135、160)、(100,200)、(135,200)为端点的矩形;
1.1.3、通过鼠标移动,拖拽使矩形正好包围住鼻子,得到矩形坐标为P(i0,j0)、P(i0,j1)、P(i1,j0)、P(i1,j1);
2.样本特征编码存储
2.1处理非感兴趣区域:
将图像的左边第1列每个像素的3个通道数值修改成原数值加1,图像上边第1行每个像素的3个通道数值修改成原数值加1,对于超出255的通道数值将其赋值成255;
2.2存储标记点:
根据2、1.1.3,将图像左边第1列第j0 、j1个像素的3个通道数值修改成0,将图像左边第1列第i0 、i1个像素的3个通道数值修改成0,保存图像。
3.提取样本标记信息
根据2,遍历图像第1列中像素,找到3个通道数值都为0的像素点i0 、i1,遍历图像第1行中像素,找到3个通道数值都为0的像素点j0 、j1,由他们构成的P(i0,j0)、P(i0,j1)、P(i1,j0)、P(i1,j1)即为矩形的4个端点。
Claims (1)
1.一种图像样本标定方法,包括从原始图像中获取样本特征编码的步骤,其特征在于,还包括把所获得的所述特征编码按照预定的嵌入方法嵌入到所述原始图像中的步骤,以生成经验样本;
以及在调用所述经验样本进行抽样、乱序或重排序时匹配所述嵌入方法读取所述特征编码的步骤;
把所获得的所述特征编码按照预定的嵌入方法嵌入到所述原始图像中步骤的目标区域为原始图像的非感兴趣区域;
所述嵌入方法为在所述非感兴趣区域选定能够容纳所述特征编码的行列组,一个特征编码对应的特征点的列行值使用固定的特征值表示在一对行列中,相应地,读取所述特征编码的步骤则检索所述特征值,进而得到所述特征编码;
当特征点少于两个时,原始图像的左右第一列和上下第一行作为非感兴趣区域。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210464397.0A CN102982501B (zh) | 2012-11-19 | 2012-11-19 | 一种图像样本标定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210464397.0A CN102982501B (zh) | 2012-11-19 | 2012-11-19 | 一种图像样本标定方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102982501A CN102982501A (zh) | 2013-03-20 |
CN102982501B true CN102982501B (zh) | 2015-07-01 |
Family
ID=47856454
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210464397.0A Active CN102982501B (zh) | 2012-11-19 | 2012-11-19 | 一种图像样本标定方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102982501B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112308098B (zh) * | 2019-07-26 | 2024-06-07 | 杭州海康威视数字技术股份有限公司 | 一种图像处理方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1150283A (zh) * | 1994-12-21 | 1997-05-21 | 伊斯曼柯达公司 | 制作标准化图象模板的方法和设备 |
US6466209B1 (en) * | 1995-12-07 | 2002-10-15 | Ncr Corporation | Method for transparent marking of digital images for storage, retrieval and processing within a computer database |
CN1637775A (zh) * | 2004-01-06 | 2005-07-13 | 微软公司 | 位置编码的文档图像分析和标签 |
CN101777050A (zh) * | 2009-01-09 | 2010-07-14 | 张文标 | 画面嵌入信息的方法 |
CN101990107A (zh) * | 2009-07-31 | 2011-03-23 | 廖礼士 | 编码系统及方法、解码系统及方法、显示系统及方法 |
-
2012
- 2012-11-19 CN CN201210464397.0A patent/CN102982501B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1150283A (zh) * | 1994-12-21 | 1997-05-21 | 伊斯曼柯达公司 | 制作标准化图象模板的方法和设备 |
US6466209B1 (en) * | 1995-12-07 | 2002-10-15 | Ncr Corporation | Method for transparent marking of digital images for storage, retrieval and processing within a computer database |
CN1637775A (zh) * | 2004-01-06 | 2005-07-13 | 微软公司 | 位置编码的文档图像分析和标签 |
CN101777050A (zh) * | 2009-01-09 | 2010-07-14 | 张文标 | 画面嵌入信息的方法 |
CN101990107A (zh) * | 2009-07-31 | 2011-03-23 | 廖礼士 | 编码系统及方法、解码系统及方法、显示系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN102982501A (zh) | 2013-03-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108769731B (zh) | 一种检测视频中目标视频片段的方法、装置及电子设备 | |
US10452919B2 (en) | Detecting segments of a video program through image comparisons | |
JP5238891B2 (ja) | ディジタル画像を処理するための方法および画像表現形式 | |
CN107273301A (zh) | 数据处理系统 | |
JP2003523587A (ja) | ビジュアルアテンションシステム | |
US8145015B2 (en) | Device, system, and method for indexing digital image frames | |
EP2801190B1 (en) | Method for processing an image | |
US8363910B2 (en) | Image processing device, image processing method, and program | |
CN102637302A (zh) | 一种图像编码方法 | |
US11915336B2 (en) | Method and device for watermark-based image integrity verification | |
CN103402091B (zh) | 云桌面图像分类与编码方法 | |
CN114638738B (zh) | 图像中隐藏信息的嵌入方法、检测方法及防伪溯源方法 | |
CN117615075A (zh) | 水印添加及水印鉴别方法、装置、设备、可读存储介质 | |
CN101459854B (zh) | 图像压缩编码/解码装置及图像压缩编码/解码方法 | |
KR20140075791A (ko) | 비디오 분석 인코딩 | |
CN102982501B (zh) | 一种图像样本标定方法 | |
EP0833518B1 (en) | Compression of image data with associated cost data | |
CN103915077B (zh) | 一种在普通显示设备上显示高动态图像的方法 | |
CN100396108C (zh) | 一种对视频编解码系统的视频帧率进行测试的方法 | |
KR101367821B1 (ko) | 계층적 영상블록의 대칭정보를 이용한 비디오 식별 방법 및 장치 | |
CN111510767B (zh) | 一种视频水印的识别方法及其识别装置 | |
CN119788088B (zh) | 芯片的数据压缩方法、装置、设备及存储介质 | |
CN118349529B (zh) | 一种基于深度学习的图片视频存储方法 | |
CN100535940C (zh) | 处理数字图像的方法以及图像表示格式 | |
CN111212284B (zh) | 一种自适应块尺寸的视频隐写方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C56 | Change in the name or address of the patentee | ||
CP01 | Change in the name or title of a patent holder |
Address after: Shun high tech Zone of Ji'nan City, Shandong province 250101 China West Road No. 699 Patentee after: SYNTHESIS ELECTRONIC TECHNOLOGY CO., LTD. Address before: Shun high tech Zone of Ji'nan City, Shandong province 250101 China West Road No. 699 Patentee before: Shandong Synthesis Electronic Technology Co., Ltd. |