CN101842809B - 信息处理装置及信息处理方法 - Google Patents
信息处理装置及信息处理方法 Download PDFInfo
- Publication number
- CN101842809B CN101842809B CN2008801136711A CN200880113671A CN101842809B CN 101842809 B CN101842809 B CN 101842809B CN 2008801136711 A CN2008801136711 A CN 2008801136711A CN 200880113671 A CN200880113671 A CN 200880113671A CN 101842809 B CN101842809 B CN 101842809B
- Authority
- CN
- China
- Prior art keywords
- processing
- weak
- data
- arbiter
- extraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
- G06V10/7747—Organisation of the process, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/94—Hardware or software architectures specially adapted for image or video understanding
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
一种使用级联连接的多个弱判别器处理数据的信息处理装置,存储指定所述多个弱判别器中的各个的处理内容的处理指定信息。通过参照指定了用于基于处理所述数据的条件确定要使用的弱判别器的信息的表来从所述多个弱判别器中选择在处理所述数据中要使用的弱判别器。然后所选择的弱判别器基于与所选择的弱判别器相对应的所述处理指定信息处理所述数据,并使用获得的评价值从所述数据中提取对象。通过这样,当从图像数据中提取特定对象时,能够以灵活地方式改变提取处理速度与提取精度的组合。
Description
技术领域
本发明涉及一种使用级联连接的多个弱判别器(classifier)来处理数据的信息处理技术。
背景技术
近年来,提出了从图像数据中提取诸如人脸的特定对象的各种方法,并且投入实际使用。
在这些方法中,在Viola,P.&Jones,M.’s″Rapid Object Detection usinga Boosted Cascade of Simple Features″,(Proc.of Computer Vision andPattern Recognition,Dec.2001,IEEE Computer Society,pp.511-518)中所公开的方法因其高速性而受到关注(下文中,将该文献称为“文献1”)。该方法将由增强(boosting)学习算法生成的多个弱判别器组构成的判别器级联连接,并在对各个判别器执行终止判定的同时进行处理。注意,在例如Yoav Freund and Robert E.Schapire’s“A decision-theoreticgeneralization of on-line learning and an application to boosting”(inEurocolt’95,Computational Learning and Theory;Springer-Verlag,1995,pp.23-37)中公开了增强学习算法的细节。
图24示出了这种技术所使用的总体结构。2401至240n(其中,n是自然数)是通过学习生成的判别器(也称为“级”),各个判别器由例如处理负荷低的多个矩形过滤器构成。由于这时使用的矩形过滤器中的各个的判别能力不是很高,因此将其通称为“弱判别器”。
图25是示出用于提取特定对象的矩形过滤器的图。2501a至2501c是要使用矩形过滤器进行提取的图像块的示例,其是从整个图像数据中切出的预定尺寸的部分图像。
此外,图26是表示要处理的图像数据的图。在该图中,2601表示要处理的一帧图像数据。此外,2602表示作为对要处理的一帧图像数据进 行实际处理时使用的处理单位的处理块,处理块是尺寸与矩形过滤器2052a至2502c的尺寸相对应的部分图像。通过使用矩形过滤器2052a至2502c计算由白色区域和黑色区域表示的区域数据的总和之间的差,来提取部分图像内的局部区域的特征。
通过使用基于部分图像2602的预定步长依次扫描整个图像数据2601,并使用处理单位处理图像数据,来提取图像数据2601内的特定对象。
判别器2401至240n中的各个累积作为各矩形过滤器的确定结果的输出的评价值,并通过使用识别阈值进行阈值处理来确定是否存在特定对象。如上所述,将判别器2401至240n级联连接,仅当确定在处理单位的部分图像2602中存在特定对象时,各判别器使处理进入到后面的判别器。
以这种方式,所描述的方法在各判别器(也称为级)处确定处理单位的部分图像是特定对象,还是不是特定对象。在确定部分图像不是特定对象的情况下,立即结束计算。在实际图像数据中,经常在初期阶段确定部分图像不是特定对象,因此能够实现高速提取处理。
在此,考虑在嵌入式设备等中实现使用诸如在文献1中描述的方法提取特定对象的功能的情况。这种情况需要根据提取的目的以及嵌入式设备的计算性能来调整提取精度与提取处理速度之间的折衷(tradeoff)。
作为一个示例,可以给出在规格彼此不同的多个嵌入式设备中,作为公用设备安装通过硬件来实现的单元(或集成电路)的情况。在这种情况下,期望基于安装该单元的嵌入式设备的操作时钟、使用条件等,调整提取精度与提取处理速度之间的折衷。
此外,即使在相同的嵌入式设备中安装该单元时,也存在所需的提取精度及提取处理时间根据安装在嵌入式设备中的应用程序的类型而不同的情况。在这些情况下,如果能够调整提取精度与提取处理速度之间的折衷,则还能够将嵌入式设备的性能最优化。
传统上,通过降低要处理的图像数据的分辨率、加宽在基于部分图 像扫描要处理的图像数据时使用的步长等来应对这些情况。例如,文献1公开了一种改变步长的方法。
然而,当应对诸如这些的情况时,存在不能灵活地实现提取精度与提取处理速度之间的折衷的问题。例如,当试着通过改变分辨率来控制提取处理速度时,需要将输入的图像数据的分辨率转换为相应的分辨率。还需要准备与各分辨率相对应的多个判别器。
此外,即使当步长改变时,对折衷点(即提取精度与提取处理速度的适当组合)的类型(例如将步长设定为n个像素的单位)有限制,从而导致不能以灵活的方式实现控制的问题。
如日本特开2005-100121号公报所公开的,考虑由要应用该单元的嵌入式设备执行的计算量,能够很好地应对这种情况。在此,预先使用多个判别器进行学习,并在进行提取处理时从多个判别器组中选择适合该嵌入式设备的判别器组。然而,在这种情况下,需要预先针对各折衷点准备多个不同的判别器组,从而导致需要增大诸如存储器等的资源量的问题。这在参数信息的量大的情况下(例如当要配置大量判别器时)尤其成问题。
发明内容
在鉴于上述问题进行了构想的情况下,本发明的目的是,使得当使用多个级联连接的弱判别器,从输入的数据中提取特定对象时,能够灵活地改变提取处理速度与提取精度的组合。
为了实现上述目的,根据本发明的信息处理装置被配置为包括:多个弱判别器,其相互级联连接,所述多个弱判别器对数据进行处理;第一存储单元,其存储指定所述弱判别器中的各个的处理内容的处理指定信息;第二存储单元,其存储表,在所述表中,针对处理所述数据的条件,以级联连接的多个弱判别器创建的级为单位,指定要使用的弱判别器的数量;选择单元,其通过参照所述表,来从所述弱判别器中选择在对所述数据的处理中要使用的弱判别器;以及提取单元,其基于与所述选择单元选择的所述弱判别器相对应的所述处理指定信息,使用所述弱判别器对所述数据进行处理而获得的评价值,从所述数据中提取对象。
根据本发明,当使用多个级联连接的弱判别器,从输入的数据中提取特定对象时,能够灵活地改变提取处理速度与提取精度的组合。
从以下对示例性实施例的描述(参照附图),本发明的其它特征将变得明显。
附图说明
包括在说明书中并构成说明书的一部分的附图,示出了本发明的实施例,并且与本说明一起,用于解释本发明的原理。
图1是示出根据本发明的第一实施例的信息处理装置的配置的示例的图。
图2是示出识别处理单元的细节的图。
图3是详细示出矩形过滤器计算单元的配置的图。
图4是示出参数信息的示例的图。
图5是示出根据本发明的第一实施例的模式识别装置进行的操作的流程图。
图6是示意性地示出弱判别器的总数与提取精度之间的关系的图。
图7是示出将操作时钟与使用的弱判别器的总数相关联的表的示例的图。
图8是示出根据SAT数据计算矩形块的方法的图。
图9是示出根据本发明的第二实施例的模式识别装置进行的操作的流程图。
图10是示意性地示出使用增强学习算法获得的弱判别器的数量与相应弱判别器的可靠度水平之间的关系的图。
图11是示出将操作时钟与使用的弱判别器的总数相关联的表的示例的图。
图12是示出根据本发明的第三实施例的模式识别装置进行的操作的流程图。
图13是示出将前一帧中的提取目标对象的提取数量与使用的弱判别器的总数相关联的表的示例的图。
图14是示出根据本发明的第四实施例的模式识别装置进行的操作的流程图。
图15是示出摄像模式的图。
图16是示出将摄像模式与使用的弱判别器的总数相关联的表的示例的图。
图17是示出将操作模式与使用的弱判别器的总数相关联的表的示例的图。
图18是示意性地示出定义弱判别器的操作的参数信息及其使用状态的图。
图19是示出存储器映射的示例的图。
图20是示出根据本发明的第七实施例的模式识别装置进行的操作的流程图。
图21是示出根据本发明的第七实施例的模式识别装置中的处理执行确定单元的部分的图。
图22是示出将操作时钟与使用的弱判别器的总数相关联的表的示例的图。
图23是示出在有两个提取模式的情况下用于确定提取条件的表的示例的图。
图24是示出将多个判别器级联连接并在对各个判别器进行终止判定的同时进行处理的方法的图。
图25是示出用于提取特定对象的矩形过滤器的示例的图。
图26是表示要处理的图像数据的图。
具体实施方式
以下,参照附图详细描述本发明的各种实施例。
(第一实施例)
<模式识别装置的硬件配置>
图1是示出根据本发明的第一实施例的信息处理装置(模式识别装置100)的硬件配置的示例的图。模式识别装置100具有从图像数据中提取特定对象(图像模式)的功能。
在图1中,101是图像输入单元,其由光学系统、光电转换设备、控制光电转换设备的驱动器电路、AD转换器、进行各种图像校正的信号处理电路、帧缓冲器等构成。在此描述的光电转换设备包括CCD(电荷耦合器件)、CMOS(互补金属氧化半导体)传感器等。
102是预处理单元,其进行使得能够有效地执行提取处理的各种预处理。更具体地说,预处理单元102使用硬件,基于色彩转换表、对比度校正信息等,进行诸如色彩转换处理、对比度校正处理等的图像数据转换。
103是识别处理单元,其是执行实现根据本实施例的信息处理方法所需的处理的硬件块。稍后将参照图2给出关于识别处理单元103的细节。
106是DMAC(直接存储存取控制器,Direct Memory AccessController)。DMAC 106执行诸如在连接到图像总线104的各种处理设备之间以及连接到图像总线104的设备与连接到CPU(中央处理单元)总线107的RAM110和ROM 109之间进行数据传输的功能。
105是为图像总线104与CPU总线107提供桥接功能的桥。108是控制模式识别装置100的总体操作的CPU。109是存储规定CPU 108的操作的命令以及各种计算所需的数据的ROM(只读存储器)。
110是CPU 108的操作所需的存储器(RAM,即随机存取存储器)。RAM 110由诸如DRAM(动态RAM)等容量比较大的存储器构成。
CPU 108能够经由桥105访问连接到图像总线104的各种处理单元。通过将图像总线104与CPU总线107分离,能够同时操作通过硬件实现的各种处理单元(101至103)和CPU 108。
111是接口单元,其是操作者用来指定模式识别装置100的操作的输入/输出接口。
<识别处理单元103的详细配置>
图2是示出识别处理单元103的细节的图。201是矩形过滤器计算单元,其对存储在RAM 204中的要处理的图像数据210执行预定矩形过滤器计算处理。RAM 204是存储要处理的图像数据210的存储器,其由高速、低延迟存储器构成。205是ROM,其存储指定各矩形过滤器的计算细节的参数信息211。
矩形过滤器计算单元201根据存储在ROM 205中的参数信息211中的矩形坐标信息(稍后描述)访问RAM 204中的图像数据210,并使用通过预先进行的学习而生成的矩形过滤器,依次执行计算处理和弱判别处理。
202是处理数量计数器,其由对处理当前正在使用的矩形过滤器的编号和当前正在进行处理的级的编号进行计数的计数器等构成。203是处理执行确定单元,其根据处理数量计数器202中设置的矩形过滤器处理数量计数器和级处理数量计数器、以及从外部指定的矩形过滤器的执行的有/无和结束条件,来控制矩形过滤器计算单元201。
换句话说,在矩形过滤器计算单元201进行的实际处理中,使用处理执行确定单元203从预先通过学习而获得的多个矩形过滤器中指定的矩形过滤器。
206是识别处理单元103的内部局部总线,假定其经由桥(未示出)连接到图像总线104。CPU 108经由桥访问连接到内部局部总线206的各种设备(201至205)。
<矩形过滤器计算单元201的详细配置>
图3是详细示出矩形过滤器计算单元201的配置的图。图3与图24中的示出2401至240n的细节的图相对应。311至31k均为判别器,多个矩形过滤器根据存储在ROM 205中的参数信息211,执行计算处理和弱判别处理。320是判别处理单元,其使用识别阈值对评价值的累积值进行 阈值处理,评价值是由矩形过滤器311至31k中的各个执行的弱判别处理的结果;然后,判别处理单元320确定是否存在提取目标对象。
<参数信息211的配置>
图4是示出存储在ROM 205中的参数信息211的示例的图。图4示出了一级中的处理所需的参数信息的示例。
在图4中,矩形坐标402表示与一个矩形块相对应的四个顶点的坐标数据。该坐标数据与提取目标对象内的坐标值相对应。矩形坐标402具有与矩形数量401相对应的组的坐标数据。
过滤器阈值404是用于对目标矩形过滤器的输出进行弱判别的阈值。可靠度水平403表示作为从目标矩形过滤器获得的结果的评价值的可靠度水平(贡献率)。各矩形过滤器311到31k使通过将使用过滤器阈值对矩形过滤器计算处理的结果进行弱判别的结果(1或-1)乘以可靠度水平而获得的值,作为其输出。识别阈值405是判别处理单元320用来执行识别处理的阈值。
针对各个矩形过滤器存储上述参数信息211(因此,在图4中存储了k个参数信息211),此外,还针对各级存储上述参数信息211。
[模式识别装置100中的处理的流程]
以下,将使用图5所示的流程图详细描述根据本实施例的模式识别装置100进行的操作。图5使用一个流程图示出了CPU 108和识别处理单元103的操作。由图5中的“识别处理”表示的流程(即步骤S508至S518)与识别处理单元103的操作相对应。
首先,在步骤S501中,在开始识别处理之前,CPU 108执行各种初始化处理。根据来自CPU 108的初始化指令对各种处理单元(101至103)的内部寄存器/存储器进行初始化。
接着,在步骤S502中,指定在实际处理中要使用的矩形过滤器,并确定要在各级进行的矩形过滤器处理的细节。更具体地说,逐级指定在处理中使用的矩形过滤器的数量。
在步骤S503中,指定实际处理使用的级。更具体地说,指定在处理 中使用的级的数量。在此,根据模式识别装置100的操作时钟来确定在处理中使用的矩形过滤器的数量和级的数量。
图6是示意性地示出弱判别器(矩形过滤器)的总数与提取精度之间的关系的图。弱判别器的总数表示在各级中包括的弱判别器的总和,而“误检”表示错误检测的程度。
如图6所示,一般来说,随着弱判别器的总数的增加,误检减少,由此提取精度提高。此外,因为可以认为弱判别器的总数一般与提取处理时间成比例,因此通过控制弱判别器的总数,可以非常容易地调整提取处理速度与提取精度之间的折衷。
图7是将操作时钟与使用的弱判别器的总数相关联的表的示例。在图7中,N1至N3分别表示在操作时钟1至3的情况下的级的数量,Sxy(x:时钟类型;y:级编号)表示各级内的弱判别器的数量。
针对N1至N3以及Sxy中的各个,设定小于或等于通过学习生成的级的数量以及弱判别器的数量的值。此外,THxy(x:时钟类型;y:级编号)是针对各级的识别阈值。使用增强学习算法生成的判别器使用由公式(1)表示的累积值进行识别。
∑i=1 T1αihi(x)…(1)
T:弱判别器的数量;αi:弱判别器i的可靠度水平;hi(x):弱判别器输出的确定结果
在此,T是实际使用的弱判别器的数量;在弱判别器的数量减少的情况下,T是减少后的数量。T的值在级之间可以不同。
αi表示弱判别器的可靠度,其是通过弱判别器的学习而确定的值。还可以将αi称为弱判别器对判别器的贡献率。
hi(x)是作为弱判别器的输出的评价值,其是使用过滤器阈值对图25所示的矩形过滤器2502a至2502c的输出进行弱判别的结果(输出±1)。在弱判别器的数量减少的情况下,公式(1)所示的T的值与学习时的值相比有变化,因此需要针对各预定条件准备新的识别阈值Thxy。注意,在学习时和执行时T的值相同的情况下,直接使用图4所示的识别阈值。
预先使用外部工作站等创建图7所示的表,并将其预先存储在ROM109等中。换句话说,创建表,使得当操作时钟为高时使用很多弱判别器,而当操作时钟为低时使用很少判别器。
注意,可以使用传统上提出的最优化方法等,来确定级数的减少与级内的弱判别器的减少的组合。例如,可以预先使用测试数据集,基于提取精度与提取处理时间之间的关系,来创建期望的组合。通过相互独立地设定级的数量以及级内的弱判别器的数量,能够更灵活地确定折衷点。
此外,当确定弱判别器的数量时,通过利用弱判别器的可靠度水平,能够减少弱判别器的数量,同时还能够抑制提取精度的降低。具有低可靠度水平的弱判别器对识别的影响很小,一般来说,可靠度水平向后级降低。由于该原因,在例如在串联连接的判别器中包括弱判别器,并且在后面的判别器中包括的弱判别器的可靠度水平小于或等于预定值的情况下,可以使用例如将多个判别器全部减少的方法。使用可靠度水平使得能够获得最优化变得容易的效果。
在步骤S502和S503中,参照图7所示的表,并将实际处理中使用的矩形过滤器的数量、级的数量、识别阈值等设定在处理执行确定单元203中包括的寄存器(未示出)中。
当针对识别处理的各种设定结束时,在步骤S504中,启运动图像输入单元101,在步骤S506中,启动预处理单元102。接着,这些相应单元进行以下处理。
首先,图像输入单元101将光电转换设备获得的一帧的图像数据存储在内部缓冲器(未示出)中。
当该存储结束时,图像输入单元101向CPU 108发送表示图像数据的获取结束的中断。当检测到该中断时,CPU 108启动DMAC 106,并将获取的图像数据传送到预处理单元102中的内部存储器(未示出)。
当接收到图像数据时,预处理单元102开始预处理。更具体地说,预处理单元102基于预设的色彩转换表、对比度校正信息等,执行诸如 色彩转换处理、对比度校正处理等的图像数据转换处理。当图像数据转换处理结束时,预处理单元102向CPU 108发送中断信号。
接着,在步骤S506中,CPU 108检测由预处理单元102发送的中断信号,并基于转换处理后的图像数据生成求和面积表(Summed AreaTable)数据(以下称为“SAT数据”)。SAT数据是适于以高速处理诸如图25所示的矩形类型过滤器的数据格式。注意,在上述文献1中公开了SAT数据,因为SAT数据与本发明的特征无关,因此省略其详细描述。
图8是示出根据SAT数据计算矩形块的方法的图。使用SAT数据区域内的四个点的值S1至S4(与输入数据相同的坐标位置),通过公式S4+S1-(S2+S3),能够算出输入数据区域801中的矩形区域802内的数据的总和。通过参照SAT数据,在由图25中的2502a表示的矩形过滤器的情况下,能够使用例如六个数据读取来进行矩形过滤器计算处理。
在步骤S507中,CPU 108传送生成的SAT数据,并将其作为要处理的图像数据存储在识别处理单元103的RAM 204中。当SAT数据到RAM
204的该传送结束时,识别处理单元103进行的识别处理开始。
<识别处理单元103中的识别处理的流程>
以下,将描述如在步骤S508至S518所示的由识别处理单元103进行的识别处理(硬件处理)的流程。
在步骤S508中,在存储在RAM 204中的图像数据中指定用作处理单位的处理块。处理块是由图26中的2602表示的部分图像;通过在以一个像素或一行为单位扫描该窗口的同时进行提取,来提取在一帧图像数据中包括的提取目标对象。
在步骤S509中,矩形过滤器计算单元201从ROM 205中读出参数信息211。接着,在步骤S510中,矩形过滤器计算单元201参照处理块中的预定图像数据来执行矩形过滤器计算处理。如之前所述,矩形过滤器计算处理计算多个矩形过滤器相对于处理块的差值。
接着,在步骤S511中,将在步骤S509中获得的矩形过滤器的输出与ROM 205中针对该过滤器存储的矩形过滤器阈值进行比较。在矩形过 滤器的输出超出过滤器阈值的情况下,针对该矩形过滤器的输出,将通过计算矩形过滤器的可靠度水平的总和而获得的评价值加到累积值。
然而,在矩形过滤器的输出小于或等于过滤器阈值的情况下,针对该矩形过滤器的输出,将通过计算矩形过滤器的可靠度水平的总和而获得的评价值从累积值中减去。
当一个矩形过滤器计算(弱判别器计算)处理结束时,在步骤S512中,处理数量计数器202更新矩形过滤器处理数量计数器。
接着,在步骤S513中,确定针对一级内的所有弱判别器链的矩形过滤器计算处理是否结束。在此,处理执行确定单元203将在步骤S502中指定的矩形过滤器的数量与由处理数量计数器202输出的矩形过滤器处理数量计数器的值进行比较,并确定该级内的矩形过滤器计算处理是否结束。
在步骤S513中确定针对所有矩形过滤器,矩形过滤器计算处理未结束的情况下,该过程返回步骤S509,在步骤S509中,针对下一个过滤器执行矩形过滤器计算处理。
另一方面,在步骤S513中确定针对所有矩形过滤器,矩形过滤器计算处理结束的情况下,该过程进入步骤S514,在步骤S514中,判别处理单元320识别累积值,并确定是否终止该级。
在此,通过将累积值与在步骤S502中设定的识别阈值405进行比较来确定在处理块中是否存在提取目标对象。在判别处理单元320进行的识别的结果表示不存在提取目标对象的情况下,终止识别处理。
当终止识别处理时,在步骤S517中记录在该处理块中不存在提取目标对象(即对象不是提取目标对象)的情况。
然而,在由判别处理单元320进行的识别的结果表示存在提取目标对象的情况下,该过程进入步骤S515,在步骤S515中,更新处理数量计数器202的级数计数器。
在步骤S516中,处理执行确定单元203将级处理数量计数器与在步骤S503中指定的级的数量进行比较。在基于步骤S516中进行的比较的 结果确定未达到指定的级的数量的情况下,该过程返回步骤S509,在步骤S509中,开始针对下一级的矩形过滤器计算处理。
然而,在基于步骤S516中进行的比较的结果确定已达到指定的级的数量的情况下,该过程进入步骤S517,在步骤S517中,记录在该处理块中存在提取目标对象。
在步骤S518中,确定是否针对要处理的图像数据内的所有处理块,执行了识别处理。在确定针对要处理的图像数据内的所有处理块,识别处理未结束的情况下,该过程返回到步骤S508,在步骤S508中,选择相邻一个像素或一行的处理块,并对其重复相同的处理。
然而,在步骤S518中确定针对要处理的图像数据内的所有处理块,识别处理结束的情况下,该过程进入步骤S519,在步骤S519中,确定是否对下一帧的图像数据执行识别处理。在要对下一帧的图像数据执行识别处理的情况下,该过程返回到步骤S504,重复从步骤S504至步骤S518的处理。然而,在确定不对下一帧的图像数据执行识别处理的情况下,处理结束。
如上所述,本实施例具有根据执行识别处理的模式识别装置的操作时钟,指定要使用的弱判别器的数量以及级的数量(其与表示处理顺序的编号相对应)的配置。因此,当执行识别处理时,执行识别处理的模式识别装置不针对在指定的级的数量之后的级执行矩形过滤器计算处理。
换句话说,通过使用这种能够根据操作时钟来控制弱判别器的数量的配置,即使当在具有不同规格的多个嵌入式设备中安装了识别处理单元时,也能够根据嵌入式设备的操作时钟调整提取精度与提取处理速度。
(第二实施例)
尽管上述第一实施例描述了通过指定使用的弱判别器的数量或者级的数量来调整提取精度与提取处理速度之间的折衷的配置,但是本发明不限于此。例如,可以使用通过基于可靠度水平指定是否执行各个单独的弱判别器来调整提取精度与提取处理速度之间的折衷的配置。
以下,将描述根据本实施例的用于调整提取精度与提取处理速度之间的折衷的模式识别装置的细节。注意,根据本实施例的模式识别装置的硬件配置、矩形过滤器计算单元201的配置的细节、参数信息211的配置等与在上述第一实施例中所描述的相同,因此在此省略其描述。
图9是示出根据本发明的第二实施例的模式识别装置100进行的操作的流程图。在此仅描述与第一实施例中不同的项目。
在步骤S902中,确定要使用的弱判别器。图10是示意性地示出使用增强学习算法获得的弱判别器的数量与相应的弱判别器的可靠度水平之间的关系的图。
一般来说,增加弱判别器的数量导致弱判别器的相应可靠度水平降低,但这种降低不是恒定的;相反,这种降低上下波动,从而导致平均降低。
因此,在步骤S902中,当确定要使用的弱判别器时,通过基于预定可靠度水平进行判别来设定弱判别器。例如,在图10所示的情况下,在实际处理中使用具有超过阈值Th的可靠度水平的弱判别器,而不将小于或等于Th的弱判别器用于矩形过滤器计算处理。
通过以这种方式指定要使用的弱判别器,与如同第一实施例那样,基于处理的数量统一确定要使用的弱判别器的情况相比,能够指定具有较高可靠度水平的弱判别器(具有较高贡献率的判别器)。
在此,确定通过学习而生成的弱判别器链的可靠度水平,并预先生成将满足预定条件的弱判别器指定为“要使用的弱判别器”、而将不满足预定条件的弱判别器指定为“不使用的弱判别器”的标记信息。换句话说,在此讨论的“标记信息”是表示是否使用弱判别器的信息。
图11是示出将操作时钟与使用的弱判别器的总数相关联的表的示例的图。在图11中,N1至N3以及Thxy(x:时钟类型;y:级编号)是与第一实施例中相同的变量。Mxy(x:时钟类型;y:级编号)是指定各弱判别器是否执行处理的标记信息,其用二进制位串来表示。下面示出Mxy的示例。在此示出的示例是针对从MSB(最高有效位,Most Significant Bit) 开始以升序分配32个弱判别器中的各个是否执行处理的情况。
M11=11111111111111111010100101010000
对于各个位,在矩形过滤器计算处理中实际使用分配了1的弱判别器,而在矩形过滤器计算处理期间不使用分配了0的弱判别器。例如,在矩形过滤器计算处理中使用第1个弱判别器,而不使用第32个弱判别器。
在步骤S902中,根据操作时钟来选择预定Mxy,并在处理执行确定单元203中的寄存器(未示出)中进行设定。
步骤S903至S907所示的处理与图7中的步骤S703至S707所示的处理相同,因此省略其描述。
此外,对于识别处理单元103的操作,即步骤S908至S919所示的处理,仅描述与图7中的步骤S708至S719所示的处理不同的处理。
在步骤S920中,处理执行确定单元203确定要使用的弱判别器。处理执行确定单元203基于由处理数量计数器202计数的矩形过滤器处理数量计数器以及在步骤S902中设定的标记信息Mxy来确定在矩形过滤器计算处理中是否使用弱判别器。
换句话说,基于矩形过滤器处理数量计数器的值来确定Mxy中的相应位位置,接着确定该位的值是0还是1。在确定与矩形过滤器处理数量计数器的值相对应的位位置的值是1的情况下,确定该弱判别器是“要使用的弱判别器”,并在步骤S909至S911中执行矩形过滤器计算处理和弱判别处理。
在步骤S912中,更新矩形过滤器处理数量计数器,而不管是否使用弱判别器。接着,在步骤S913中,确定针对一级内的所有弱判别器链,矩形过滤器计算处理是否结束。基于预先通过学习生成的弱判别器的数量与矩形过滤器处理数量计数器之间的比较来进行该确定。
接下来的步骤S913至S919中的处理与图5中的步骤S513至S519中的处理相同,因此省略其描述。
如上所述,本实施例具有根据执行识别处理的模式识别装置的操作 时钟指定要使用的弱判别器的数量的配置。使用这种配置,即使当在具有不同规格的多个嵌入式设备中安装了通过硬件作为公用设备实现的识别处理单元时,也能够根据嵌入式设备的操作时钟调整提取精度与提取处理速度。
此外,本实施例具有当指定要使用的弱判别器时根据弱判别器的可靠度水平进行指定的配置。这使得与上述第一实施例相比能够更加抑制提取精度的降低。
(第三实施例)
尽管上述第一和第二实施例描述了通过根据模式识别装置的操作时钟改变要使用的弱判别器的数量来调整提取精度与提取处理速度之间的折衷,但是本发明不限于此。例如,可以通过根据提取目标对象的提取状态动态地改变要使用的弱判别器的数量,来调整提取精度与提取处理速度之间的折衷。
以下,将描述根据本实施例的用于调整提取精度与提取处理速度之间的折衷的模式识别装置的细节。注意,根据本实施例的模式识别装置的硬件配置、矩形过滤器计算单元201的配置的细节、参数信息211的配置等与在上述第一实施例中所描述的相同,因此在此将省略其描述。
图12是示出根据本发明的第三实施例的模式识别装置100进行的操作的流程图。为了简单起见,以下仅描述与第二实施例的不同之处。
步骤S1201至S1220所示的处理与图9中的步骤S901至S920所示的处理相同。然而,步骤S1202、S1203以及S1217中的处理分别具有与图9所示的步骤S902、S903以及S917不同的处理细节。
在步骤S1221中,读出在前一帧中提取的提取目标对象的数量。接着,在步骤S1202和S1203中,基于如在此所描述的读出的前一帧中的提取目标对象的数量,来确定要使用的弱判别器的数量以及级的数量。例如,在前一帧中提取的提取目标对象的数量大的情况下,减少要使用的弱判别器的数量。
图13是示出由本实施例的模式识别装置保持的、将前一帧中的提取 目标对象的提取数量与使用的弱判别器的总数相关联的表的示例的图。在图13中,N1至N3、Thxy(x:时钟类型;y:级编号)以及Mxy(x:时钟类型;y:级编号)与第二实施例中图11所示的变量相对应。
在图13所示的表中存储有与前一帧中的提取目标对象的提取数量相对应的三个参数。图13中的D1和D2与提取的提取目标对象的数量相对应。本实施例被配置为当提取的提取目标对象的数量大时,弱判别器的总数减少。注意,在ROM 109中存储图13所示的表。
在步骤S1202和S1203中,将在前一帧中提取的提取目标对象的数量(步骤S1221)与表中所示的条件(D1、D2)进行比较。通过这样,改变要使用的级的数量等。
换句话说,当提取目标对象的数量改变时,在步骤S1202和S1203中,在处理执行确定单元203的寄存器中设定与其相对应的弱判别器的总数以及参数(N1至N3、Thxy以及Mxy)。
根据在此设定的参数,在步骤S1204至S1220中执行识别处理。
虽然步骤S1204至S1220中的处理与第二实施例中的步骤S904至S920中的处理相当,但是本实施例的不同之处在于在步骤S1217中对提取的提取目标对象的数量进行计数。
在对下一帧进行识别处理期间,在步骤S1221中读出并使用在步骤S1217中记录的提取目标对象的数量(帧处理后的计数值)。在步骤S1221中读出计数器的值之后,将该计数器复位。
如上所述,本实施例具有根据从前一帧的提取结果动态地改变要使用的弱判别器的数量的配置。通过这样,当在前一帧中提取的提取目标对象的数量小时,执行使用很多弱判别器的高精度提取。另一方面,当在前一帧中提取的提取目标对象的数量大时,减少弱判别器的数量,并使提取处理速度优先地执行处理。结果,即使在需要在预定量的时间内实时对运动图像执行提取处理的情况下,也能够实现适当的提取处理。
(第四实施例)
尽管上述第三实施例描述了通过根据从前一帧的提取结果改变要使 用的弱判别器的数量来调整提取精度与提取处理速度之间的折衷,但是本发明不限于此。例如,可以通过根据正在处理的当前帧的提取状态改变要使用的弱判别器的数量来调整提取精度与提取处理速度之间的折衷。
以下将描述根据本实施例的模式识别装置的配置。注意,根据本实施例的模式识别装置的硬件配置、矩形过滤器计算单元201的配置的细节、参数信息211的配置等与在上述第一实施例中描述的相同,因此在此将省略其描述。
图14是示出根据本发明的第四实施例的模式识别装置100进行的操作的流程图。为了简单起见,以下将仅描述与第三实施例的不同之处。
步骤S1401至S1421所示的处理大致与图12中的步骤S1201至S1221所示的处理相当;然而,在本实施例中,处理的顺序以及步骤S1421的处理细节不同。
当在步骤S1404至S1407中将SAT数据作为要处理的图像数据存储在RAM 204中时,对要处理的帧开始识别处理。
在步骤S1421中,读出到当前为止提取的提取目标对象的数量。读出值是在步骤S1417中随提取目标对象的每次提取而递增的计数器值。注意,当在步骤S1421中处理帧中的第一处理块时,将该计数器初始化。
在步骤S1402和S1403中,根据读出的计数值(在帧中提取的提取目标对象的数量)确定要使用的弱判别器。以与第三实施例相同的方式,通过参照图13所示的表来进行弱判别器的确定。
换句话说,确定表中所示的条件是否发生了改变,在确定发生了改变的情况下,在步骤S1402和S1403中设定相应的参数。
在步骤S1408至S1418中,对处理块执行识别处理,并在提取了提取目标对象的情况下,在步骤S1417中,更新对提取的数量进行计数的计数器。当对作为部分图像的处理块的处理结束时,基于该表,在步骤S1421、S1402以及S1403中重新设定要使用的弱判别器的数量。
如上所述,在本实施例中,以处理块为单位来重新设定弱判别器的 数量,处理块是部分图像。换句话说,基于在当前处理的帧中提取的提取目标对象的数量,以处理块为单位动态地改变弱判别器的数量。通过这样,在当前处理的帧内的提取目标对象的数量增加,并且可能没有充裕的提取处理时间的情况下,在处理后续处理块时,能够减少弱判别器的数量,并将缩短处理时间优先。
结果,即使在需要在预定量的时间内实时对运动图像执行识别处理的情况下,也能够执行适当的识别处理。
(第五实施例)
尽管上述第一和第二实施例描述了通过根据操作时钟改变要使用的弱判别器的数量来调整提取精度与提取处理速度之间的折衷,但是本发明不限于此。例如,可以使用根据用户指定的摄像模式改变在处理中使用的弱判别器的数量的配置。
以下,将描述根据本实施例的用于调整提取精度与提取处理速度之间的折衷的模式识别装置的配置的细节。注意,根据本实施例的模式识别装置的硬件配置、矩形过滤器计算单元201的配置的细节、参数信息211的配置等与在上述第一实施例中所描述的相同,因此在此将省略其描述。
此外,将使用上述第二实施例中的流程图(图9)对模式识别装置100的操作进行描述。
在照相机中,一般可以根据要拍摄的被摄体设定多个摄像模式。图15是示出这种摄像模式的示例的图,其示出了当以15a所示的肖像模式以及15b所示的标准模式进行拍摄时使用的典型构图。
1501和1502示意性地表示被摄体。在肖像模式下,在拍摄时,以比较大的尺寸拍摄很少的被摄体1501,被摄体后面的背景变模糊(例如,控制图像输入单元101的光学系统以减小景深)。
因此,在某种程度上能够基于摄像模式预测构图。换句话说,在要从构图中检测被摄体的情况下,能够预测提取目标对象的数量。例如,因为在肖像模式下被摄体的数量少并且背景区域模糊,所以要提取的提 取目标对象的数量少。
在本实施例中,基于该观点来调整提取精度与提取处理速度之间的折衷。更具体地说,在用户使用I/F单元111指定了摄像模式的情况下,在步骤S902以及S903中,基于指定的摄像模式来确定要实际使用的弱判别器的数量。
图16是示出将摄像模式与使用的弱判别器的总数相关联的表的示例的图;该表在步骤S902以及S903中确定要使用的弱判别器时使用。
N1至N2、Thxy(x:时钟类型;y:级编号)以及Mxy(x:时钟类型;y:级编号)与第二实施例中描述的表(图11)相同。在这种情况下,N1>N2,并对M1y中的所有位指定1等。
换句话说,当使用肖像模式时,使用更多的弱判别器(预先通过学习生成的所有判别器)进行识别,而在所有其它情况下减少弱判别器的数量。注意,该表存储在ROM 109中。在其它步骤中,根据在此设定的条件执行识别处理。其它步骤与第二实施例中的步骤相同,因此省略其描述。
如上所述,本实施例具有在肖像模式下使用在学习期间确定的所有弱判别器进行高精度识别处理,而在标准模式下减少弱判别器的数量并进行高速处理的配置。
通过这样,能够根据摄像模式控制使用的弱判别器的数量,因此能够适当地调整提取精度与提取处理速度之间的折衷。
(第六实施例)
尽管上述第五实施例描述了根据摄像模式来控制要使用的弱判别器的数量的配置,但是本发明不限于此。例如,可以使用根据用户指定的操作模式来改变要使用的弱判别器的数量的配置。
根据摄像装置的操作模式,存在与图像数据的生成并行地对提取目标对象进行实时提取的情况,以及在图像数据的生成之后不从存储在摄像装置的存储单元中的图像数据中对提取目标对象进行实时提取的情况。通常,将前者称为联机(online)模式,而将后者称为脱机(offline) 模式。联机模式与拍摄操作相对应,而脱机模式与例如对拍摄后的图像数据进行某种编辑、查询等的操作模式相对应。
为此,在联机模式下将提取处理速度优先,而在脱机模式下将提取精度优先。在本实施例中,以这种方式根据模式识别装置的操作模式来控制要使用的弱判别器的数量。注意,也使用第二实施例的流程图(图9)来描述本实施例的操作。
更具体地说,在用户使用I/F单元111指定了操作模式的情况下,在步骤S902以及S903中,根据指定的操作模式,确定要使用的弱判别器的数量。
图17是示出将操作模式与使用的弱判别器的总数相关联的表的示例的图;该表在步骤S902以及S903中确定要使用的弱判别器时使用。
N1至N2、Thxy(x:时钟类型;y:级编号)以及Mxy(x:时钟类型;y:级编号)与第二实施例中描述的表(图11)相同。
在图17中,设定参数,使得在脱机模式下时,使用在学习期间生成的所有弱判别器进行识别处理,而在联机模式下时,使用数量减少的弱判别器进行识别处理。注意,该表存储在ROM 109中。在其它步骤中,根据在此设定的条件来执行识别处理。其它步骤与第二实施例中的步骤相同,因此将省略其描述。
如上所述,本实施例具有在脱机模式下使用在学习期间确定的所有弱判别器进行高精度识别处理,而在联机模式下减少弱判别器的数量并进行高速识别处理的配置。
通过这样,能够根据操作模式来控制使用的弱判别器的数量,因此能够适当地调整提取精度与提取处理速度之间的折衷。
(第七实施例)
上述第一至第六实施例具有在调整提取精度与提取处理速度之间的折衷时将定义弱判别器的操作的参数信息211存储在ROM 205中的配置。然而,本发明不限于此。
在本实施例中,描述将定义弱判别器的操作的参数信息211存储在 不可变存储单元(例如ROM)与可变存储单元(例如RAM)两者中的情况。
图18是示意性地示出存储在ROM 205和RAM 204中的、定义弱判别器的操作的参数信息及其使用状态的图。图18中的18a示出在ROM205中存储通过学习生成的弱判别器的参数信息的状态。
各个箱(box)表示存储在ROM 205中的预定区域中的、定义一个矩形过滤器的参数信息数据集。换句话说,将图4所示的一个矩形过滤器的参数信息存储在一个箱中。从左边开始,按照箱的布置顺序,存储要依次处理的多个矩形过滤器的参数信息。
图18的18b表示如在第一实施例中所描述的弱判别器的实际操作。各个阴影线箱表示与该箱相对应的矩形过滤器是在实际处理中使用的矩形过滤器。在这种情况下,通过提前结束通过学习而生成的矩形过滤器的链来控制弱判别器(矩形过滤器)的数量。
图18中的18c表示如在第二实施例中描述的弱判别器的实际操作。在这种情况下,通过进行跳过具有低可靠度水平的特定矩形过滤器的处理,来控制实际使用的弱判别器(矩形过滤器)的数量。
图18中的18d和18e表示的操作代表本实施例的特征。换句话说,在该配置中,不仅在ROM 205中,而且在RAM 204中保持用于配置矩形过滤器的参数信息。此外,在预定位置(以下称为“分支点”)之后或在预定区间中使用存储在RAM 204中的参数信息来执行矩形过滤器处理。
图19是示出ROM 205和RAM 204的存储器映射的图。将预先通过学习生成的参数信息存储在从ADR0至(ADR1-1)的范围中。
另一方面,RAM 204确保从ADR1往上的地址,使得能够在装置出厂后存储用于提高模式识别装置的性能的附加参数信息等。在将参照的参数信息从ROM 205改变到RAM 204的情况下,在分支点,在稍后描述的指针寄存器中设定RAM 204区域的地址值(即ADR1之后的值)。
以下,使用图20所示的流程图描述本实施例的细节。为了简单起见, 以下仅描述与第一实施例的不同之处。
在步骤S2002中,基于操作时钟来设定用于指定用于处理的矩形过滤器链的条件。更具体地说,在处理执行确定单元203内的寄存器中设定分支的矩形过滤器数量(相当于矩形过滤器编号)以及存储相应参数信息的地址。注意,以下,将从不同的物理存储位置加载参数信息的点称为“分支”。
图21是示出本实施例特有的处理执行确定单元203的部分的图。2111至211n是指针地址,其构成存储对指定矩形过滤器的参数信息进行参照的起始地址的寄存器。2121至212n是指定矩形过滤器链的分支点的寄存器,其与矩形过滤器的数量相对应。
2130是将分支点寄存器与处理后的寄存器计数器进行比较并确定分支点的比较器。当确定到达分支点时,比较器2130输出地址加载信号和地址。
2140是基于比较器的输出从指针地址2111至211n中选择与分支点相对应的分支目的地地址的选择器。在步骤S2002中,设定分支点寄存器2121至212n以及指针地址2111至211n。
在图18的d或e中示出的示例中,针对每级设定一个分支点寄存器和一个指针地址。
图22是示出将操作时钟与使用的弱判别器的总数相关联的表的示例的图。在图22中,N1至N3以及Thxy(x:时钟类型;y:级编号)是与第一实施例中相同的变量。
ADxy(x:时钟类型;y:级编号)是指定分支目的地地址的指针信息,Pxy(x:时钟类型;y:级编号)是发生分支的矩形过滤器编号。
在步骤S2002中,根据操作时钟来参照所述表,在指针地址2111至211n中设定ADxy,在指针寄存器2121至212n中设定Pxy。
在图18的d所示的示例中,还将矩形过滤器的参数信息添加到预先通过学习而生成的、使用ROM 205作为硬件来实现的矩形过滤器的参数信息中。在步骤S2021中,将用于提高提取精度的附加的矩形过滤器的 参数信息加载到作为在步骤S2002中指定的分支目的地地址的RAM 204中。
将附加的矩形过滤器的参数信息存储在ROM 205等中,并且CPU108在该步骤中将参数信息传送到RAM 204。
当识别处理单元103使用高速操作时钟进行操作时,处理时间充裕,因此以这种方式增加矩形过滤器的数量会提高提取精度。
在图18e所示的示例中,切换预先通过学习而生成的、使用ROM 205作为硬件来实现的矩形过滤器的参数信息的部分。在步骤S2021中,将用于提高提取精度或提取处理速度的交换矩形过滤器的参数信息加载到作为在步骤S2002中指定的分支目的地地址的RAM 204中。该参数信息是存储在ROM 109等中的数据,并且CPU 108在该步骤中将参数信息传送到RAM 204。
通过这种配置,即使作为硬件来实现识别处理单元103并最终确定了ROM 205中的细节,也能够切换矩形过滤器的参数信息的部分。在该切换中插入的参数信息可以是为提高性能而新学习的参数信息,或可以是作为用于限制提取处理速度的条件而新附加地学习的参数信息。因此,能够通过切换参数信息的部分来调整提取精度与提取处理速度之间的折衷。
在步骤S2003中,基于操作时钟来确定级的数量。该处理与步骤S503中的处理相同。
接着,在步骤S2004至S2007中,将要处理的图像数据传送到RAM204。在步骤S2008中,确定处理块,在步骤S2009中,开始参数信息的读出。
接着,基于作为预定矩形过滤器计算处理的结果的评价值,来计算累积值(步骤S2010至S2011)。在步骤S2012中,更新处理后的矩形过滤器的数量。
在步骤S2020中,确定矩形过滤器链的分支。更具体地说,通过使用先前参照图21讨论的比较器2130,对过滤器处理数量计数器与指定的 分支点过滤器编号进行比较来进行确定。
当确定了分支点时,在步骤S2021中,针对参数信息设定新的参照目的地起始地址。更具体地说,根据地址加载信号,将图21所示的指针地址2111加载到矩形过滤器计算单元201的存储器访问地址计数器(未示出)中。
之后,在参照在此设定的区域的同时,对矩形过滤器处理所需的参数信息进行处理。这里假定将RAM 204的起始地址存储在指针地址2111中(步骤S2002)。
矩形过滤器计算单元201使用在此重新设定的地址作为起始地址,在按顺序读出指定矩形过滤器的参数信息的同时,继续进行处理(步骤S2009至S2013)。
注意,基于预先生成并存储在ROM 205中的弱判别器的数量与指定的用于提取的弱判别器的数量之间的关系,从图18的18d和18e中确定类型,因此就配置而言是相同的。
下面的步骤S2013至S2019与第一实施例中的步骤S513至S519相同,因此省略其描述。
根据上述本实施例,能够根据预定前提条件,灵活地切换弱判别器的链。
尽管本实施例描述了在步骤S2021中加载添加到已有的参数信息中或者用于改变已有的参数信息的参数信息,但是注意,可以配置为在各级加载信息。在这种情况下,当确定一级结束时(步骤S2013),将参数信息加载到RAM 204中。因为当存在多级时,在级之间共享RAM 204,因此这种配置使得能够用较小的RAM 204来实现本实施例。
此外,尽管图18的18d和18e示出了有一个分支点的情况,但是分支点不限于一个点,也可以有多个点。此外,尽管本实施例讨论了在级内以弱判别器为单位对弱判别器链进行分支,但是本实施例不限于此。可以配置为以级为单位进行分支。换句话说,在特定级的所有矩形过滤器计算处理所需的所有参数信息的存储目的地可以是RAM 204。
根据如上所述的本实施例,即使在作为一个硬件创建了识别处理单元103之后,也能够实现性能的提高以及折衷调整。此外,能够以小于使用将所有参数信息保持在RAM中的配置时的规模来实现本发明。
(第八实施例)
尽管上述第五及第六实施例描述了根据摄像模式、操作模式等来确定要使用的弱判别器的数量的配置,但是本发明不限于此,而可以被配置为用户直接选择提取条件。在这种情况下,用户经由I/F单元111指定提取模式。
图23是示出用于在有两个提取模式的情况下,确定提取条件的表的示例的图。N1至N2、Thxy(x:时钟类型;y:级编号)以及Mxy(x:时钟类型;y:级编号)与第二实施例中的相同。通过预先创建该表,用户能够直接调整提取精度与提取处理速度之间的折衷。
此外,上述实施例中的各个讨论了将文献1公开的方法应用到本发明,但是本发明不限于此。本发明可以应用于基于多个级联连接的弱判别器进行识别的各种识别处理。
此外,上述实施例的各个讨论了使用矩形过滤器作为弱判别器,但是本发明不限于此,也可以将本发明应用于其它各种弱判别器。
另外,虽然上述实施例中的各个讨论了改变级的数量以及级内的矩形过滤器的数量,但是本发明不限于此。可以配置为将级的数量固定而仅改变级内的弱判别器的数量。此外,根据算法,还存在仅有一级的情况,但是也可以将本发明应用到这样的方案中。
此外,虽然上述实施例中的各个描述了从图像数据中提取特定对象的情况,但是本发明不限于此。还可以将本发明应用到从诸如音频信号的一维信号中识别特定对象(模式)的设备。
此外,尽管上述第二实施例描述了基于可靠度水平来创建预先指定要使用的弱判别器的标记信息的配置,但是本发明不限于此。例如,可以配置为在处理执行确定单元203中直接设定可靠度水平阈值,而不在处理执行确定单元203中设定图11所示的标记信息Mxy。此外,可以配 置为每次在步骤S902中比较参数信息的可靠度水平与设定的可靠度水平,并确定是否使用相应的矩形过滤器。
最后,尽管上述实施例中的各个描述了作为硬件设备来实现识别处理单元103,但是注意,可以配置为使用DSP(数字信号处理器)等,作为软件来实现识别处理设备103。
(其它实施例)
本发明可以应用于由多个设备(例如,主计算机、接口设备、读取器、打印机等)构成的系统,也可以应用于由一个设备构成的装置(例如,复印机、传真机等)。
此外,毋庸置疑,通过向系统或装置提供存储有实现上述实施例功能的软件的程序代码的存储介质,也能够实现本发明的目的。在这种情况下,系统或装置的计算机(或CPU或MPU)加载并执行存储在记录介质中的程序代码,由此实现上述功能。注意,在这种情况下,本发明由存储有程序代码的存储介质构成。
可以用于提供程序代码的记录介质的示例包括软(floppy(注册商标))盘、硬盘、光盘、磁光盘、CD-ROM、CD-R、磁带、非易失性存储卡以及ROM。
然而,本发明不限于通过计算机读出程序代码并执行该程序代码来实现上述实施例的功能的情况。毋庸置疑,本发明还包括例如在计算机上运行的操作系统(OS)基于程序代码的指令执行部分或全部实际处理、通过该处理实现上述实施例的功能的情况。
此外,还包括将从记录介质读出的程序代码写入安装在计算机的功能扩展板或连接到计算机的功能扩展单元中设置的存储器之后,实现上述实施例的功能的情况。也就是说,在程序代码被写入存储器之后,包含在功能扩展板或功能扩展单元中的CPU等基于程序代码的指令执行部分或全部实际处理,并通过该处理实现功能。
虽然参照示例性实施例描述了本发明,但是应当理解,本发明不限于所公开的示例性实施例。应对所附权利要求的范围给予最宽的解释, 以使其覆盖所有这种变型、等同结构和功能。
本申请要求2007年11月1日提交的日本专利申请第2007-285401号的优先权,该申请的全部内容通过引用包含于此。
Claims (11)
1.一种信息处理装置,所述信息处理装置包括:
多个弱判别器,其相互级联连接,所述多个弱判别器对数据进行处理;
第一存储单元,其存储指定所述弱判别器中的各个的处理内容的处理指定信息;
第二存储单元,其存储表,在所述表中,针对处理所述数据的条件,以级联连接的多个弱判别器创建的级为单位,指定要使用的弱判别器的数量;
选择单元,其通过参照所述表,来从所述弱判别器中选择在对所述数据的处理中要使用的弱判别器;以及
提取单元,其基于与所述选择单元选择的所述弱判别器相对应的所述处理指定信息,使用所述弱判别器对所述数据进行处理而获得的评价值,从所述数据中提取对象。
2.根据权利要求1所述的信息处理装置,其中,使用所述提取单元的处理速度作为所述条件。
3.根据权利要求2所述的信息处理装置,其中,所述处理速度与所述信息处理装置的操作时钟相对应。
4.根据权利要求1所述的信息处理装置,
其中,所述数据是由多个帧构成的图像数据;并且
使用所述提取单元从所述图像数据的前一帧中提取的对象的数量作为所述条件。
5.根据权利要求1所述的信息处理装置,
其中,所述数据是由摄像装置生成的图像数据;并且
使用当所述摄像装置生成所述图像数据时使用的摄像模式作为所述条件。
6.根据权利要求5所述的信息处理装置,其中,所述摄像模式包括标准模式和肖像模式,并且在所述表中,与针对所述肖像模式相比,针对所述标准模式指定更少的要使用的弱判别器的数量。
7.根据权利要求1所述的信息处理装置,
其中,所述数据是由摄像装置生成的图像数据;并且
使用所述摄像装置的操作模式作为所述条件。
8.根据权利要求7所述的信息处理装置,其中,所述操作模式包括联机模式和脱机模式,在所述联机模式中,与所述摄像装置生成所述图像数据的操作并行地处理所述图像数据;在所述脱机模式中,在所述摄像装置完成生成所述图像数据的操作之后,处理所述图像数据,并且在所述表中,与针对所述脱机模式相比,针对所述联机模式指定更少的要使用的弱判别器的数量。
9.根据权利要求2所述的信息处理装置,
其中,所述提取单元使用通过使用所指定的级的数量,在每一级对所述数据进行处理而获得的所述弱判别器的评价值的累积值,从所述数据中提取对象。
10.根据权利要求1所述的信息处理装置,
其中,所述第一存储单元包括只读的第一存储部和可重写的第二存储部;并且
所述提取单元基于存储在所述第二存储部中的、针对所述级联连接的多个弱判别器中位于预定区间的弱判别器的所述处理指定信息,并基于存储在所述第一存储部中的、针对所述级联连接的多个弱判别器中不位于所述预定区间的弱判别器的所述处理指定信息,从所述数据中提取对象。
11.一种信息处理装置的信息处理方法,该信息处理装置使用级联连接的多个弱判别器对数据进行处理,所述信息处理方法包括以下步骤:
通过参照表,来选择在对所述数据的处理中要使用的弱判别器,在所述表中,针对处理所述数据的条件,以级联连接的多个弱判别器创建的级为单位,指定要使用的弱判别器的数量;
基于指定所述弱判别器中的各个的处理内容的处理指定信息中的、与在所述选择步骤中选择的所述弱判别器相对应的所述处理指定信息,使用所述弱判别器来对所述数据进行处理;并且
使用在所述处理步骤中获得的评价值,从所述数据中提取对象。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007285401A JP5101993B2 (ja) | 2007-11-01 | 2007-11-01 | 情報処理装置および情報処理方法 |
JP2007-285401 | 2007-11-01 | ||
PCT/JP2008/070158 WO2009057815A1 (en) | 2007-11-01 | 2008-10-29 | Information processing apparatus and information processing method |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101842809A CN101842809A (zh) | 2010-09-22 |
CN101842809B true CN101842809B (zh) | 2012-09-05 |
Family
ID=40591189
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008801136711A Expired - Fee Related CN101842809B (zh) | 2007-11-01 | 2008-10-29 | 信息处理装置及信息处理方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8655057B2 (zh) |
JP (1) | JP5101993B2 (zh) |
CN (1) | CN101842809B (zh) |
WO (1) | WO2009057815A1 (zh) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010272004A (ja) * | 2009-05-22 | 2010-12-02 | Sony Corp | 判別装置及び判別方法、並びにコンピューター・プログラム |
JP5517504B2 (ja) * | 2009-06-29 | 2014-06-11 | キヤノン株式会社 | 画像処理装置、画像処理方法、およびプログラム |
JP5340088B2 (ja) * | 2009-09-07 | 2013-11-13 | キヤノン株式会社 | 情報処理方法及び装置 |
JP5448711B2 (ja) * | 2009-10-19 | 2014-03-19 | キヤノン株式会社 | データ処理装置及びその処理方法 |
US8700860B2 (en) | 2009-10-16 | 2014-04-15 | Canon Kabushiki Kaisha | Information processing apparatus, method and computer program |
JP5692987B2 (ja) * | 2009-10-16 | 2015-04-01 | キヤノン株式会社 | 情報処理装置、情報処理方法、およびコンピュータプログラム |
JP5336995B2 (ja) * | 2009-10-19 | 2013-11-06 | キヤノン株式会社 | 特徴点位置決め装置、画像認識装置、その処理方法及びプログラム |
JP5451302B2 (ja) * | 2009-10-19 | 2014-03-26 | キヤノン株式会社 | 画像処理装置及び方法、プログラム及び記憶媒体 |
JP2011128990A (ja) * | 2009-12-18 | 2011-06-30 | Canon Inc | 画像処理装置とその方法 |
JP5406705B2 (ja) * | 2009-12-28 | 2014-02-05 | キヤノン株式会社 | データ補正装置及び方法 |
JP5574816B2 (ja) * | 2010-05-14 | 2014-08-20 | キヤノン株式会社 | データ処理装置及びデータ処理方法 |
JP5618670B2 (ja) * | 2010-07-21 | 2014-11-05 | キヤノン株式会社 | データ処理装置及びその制御方法 |
JP5686548B2 (ja) * | 2010-08-24 | 2015-03-18 | キヤノン株式会社 | 情報処理装置、情報処理方法、プログラム |
JP5778983B2 (ja) * | 2011-05-17 | 2015-09-16 | キヤノン株式会社 | データ処理装置、データ処理装置の制御方法、およびプログラム |
JP5285748B2 (ja) | 2011-07-08 | 2013-09-11 | 富士フイルム株式会社 | オブジェクト検出装置、方法およびプログラム |
US8873112B2 (en) | 2011-10-21 | 2014-10-28 | Canon Kabushiki Kaisha | Image processing apparatus and determination method |
JP6225844B2 (ja) * | 2014-06-30 | 2017-11-08 | 株式会社デンソー | 対象物検出装置 |
JP7402623B2 (ja) | 2019-06-17 | 2023-12-21 | キヤノン株式会社 | フィルタ処理装置及びその制御方法 |
CN111339749B (zh) * | 2020-03-02 | 2022-05-20 | 乐山师范学院 | 无条件文本生成方法、文本生成装置及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1731418A (zh) * | 2005-08-19 | 2006-02-08 | 清华大学 | 复杂背景图像中鲁棒的眼睛精确定位方法 |
CN1952954A (zh) * | 2005-10-09 | 2007-04-25 | 欧姆龙株式会社 | 特定被摄体检测装置及方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5508823A (en) * | 1991-08-28 | 1996-04-16 | Canon Kabushiki Kaisha | Image processing method and apparatus |
JP4053764B2 (ja) * | 2001-11-22 | 2008-02-27 | コニカミノルタオプト株式会社 | 被写体抽出装置及び撮影装置 |
JP2005100121A (ja) * | 2003-09-25 | 2005-04-14 | Fuji Photo Film Co Ltd | 識別処理に用いる特徴量の種類と識別条件を決定する装置、プログラムならびにプログラムを記録した記録媒体、および特定内容のデータを選別する装置 |
KR100682906B1 (ko) * | 2004-12-09 | 2007-02-15 | 삼성전자주식회사 | 부스트 알고리즘을 이용한 영상의 얼굴 검출 장치 및 방법 |
JP5008269B2 (ja) * | 2005-04-08 | 2012-08-22 | キヤノン株式会社 | 情報処理装置、情報処理方法 |
JP4624889B2 (ja) * | 2005-08-30 | 2011-02-02 | 富士フイルム株式会社 | 顔検出方法および装置並びにプログラム |
CN101491075B (zh) * | 2006-07-07 | 2013-01-30 | 佳能株式会社 | 图像处理设备和图像处理方法 |
JP4948379B2 (ja) * | 2007-12-18 | 2012-06-06 | キヤノン株式会社 | パターン識別器生成方法、情報処理装置、プログラム及び記憶媒体 |
-
2007
- 2007-11-01 JP JP2007285401A patent/JP5101993B2/ja not_active Expired - Fee Related
-
2008
- 2008-10-29 CN CN2008801136711A patent/CN101842809B/zh not_active Expired - Fee Related
- 2008-10-29 US US12/682,028 patent/US8655057B2/en active Active
- 2008-10-29 WO PCT/JP2008/070158 patent/WO2009057815A1/en active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1731418A (zh) * | 2005-08-19 | 2006-02-08 | 清华大学 | 复杂背景图像中鲁棒的眼睛精确定位方法 |
CN1952954A (zh) * | 2005-10-09 | 2007-04-25 | 欧姆龙株式会社 | 特定被摄体检测装置及方法 |
Non-Patent Citations (4)
Title |
---|
JP特开2003-163827A 2003.06.06 |
JP特开2005-100121A 2005.04.14 |
JP特开2007-109229A 2007.04.26 |
Paul Viola,Michael Jones.Rapid Object Detection using a Boosted Cascade of Simple Features.《2001.CVPR 2001.Proceedings of the 2001 IEEE Computer Society Conference on Computer Vision and Pattern Recognition》.2001,第1卷P.511-518. * |
Also Published As
Publication number | Publication date |
---|---|
WO2009057815A1 (en) | 2009-05-07 |
US20100209010A1 (en) | 2010-08-19 |
US8655057B2 (en) | 2014-02-18 |
JP2009116400A (ja) | 2009-05-28 |
CN101842809A (zh) | 2010-09-22 |
JP5101993B2 (ja) | 2012-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101842809B (zh) | 信息处理装置及信息处理方法 | |
WO2008146934A1 (en) | Information processing method and apparatus, program, and storage medium | |
US7457432B2 (en) | Specified object detection apparatus | |
JP5235691B2 (ja) | 情報処理装置及び情報処理方法 | |
JP6161266B2 (ja) | 情報処理装置及びその制御方法及び電子デバイス及びプログラム及び記憶媒体 | |
JP5675233B2 (ja) | 情報処理装置、その認識方法及びプログラム | |
CN106469455B (zh) | 图像处理方法、图像处理设备以及记录介质 | |
US11354238B2 (en) | Method and device for determining memory size | |
JP2008102611A (ja) | 画像処理装置 | |
JP2007065844A (ja) | 顔検出方法および装置並びにプログラム | |
US9858293B2 (en) | Image processing apparatus and image processing method | |
JP4460368B2 (ja) | 画像補正装置および方法,ならびに画像補正プログラム | |
JP6911995B2 (ja) | 特徴抽出方法、照合システム、およびプログラム | |
JP2014010633A (ja) | 画像認識装置、画像認識方法、及び画像認識プログラム | |
JP5371541B2 (ja) | データ処理装置及びその処理方法 | |
US8611599B2 (en) | Information processing apparatus, information processing method, and storage medium | |
JP4966080B2 (ja) | 対象物検出装置 | |
JP2010026804A (ja) | 画像処理装置、画像処理プログラム、および画像処理方法 | |
CN105635596B (zh) | 用于控制相机的曝光的系统及其方法 | |
JP7408973B2 (ja) | 学習モデル生成装置、画像補正装置、学習モデル生成プログラム、及び画像補正プログラム | |
CN114550062A (zh) | 图像中运动对象的确定方法、装置、电子设备和存储介质 | |
JP2002358316A (ja) | 画像処理装置及びその方法、プログラム | |
JP7151501B2 (ja) | Dnn選択プログラム、dnn選択方法および情報処理装置 | |
JP2018022315A (ja) | 画像認識装置、画像認識システム、及び画像認識方法 | |
JP2018128930A (ja) | 画像処理装置およびその制御方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120905 |