[go: up one dir, main page]

CN103226692B - 一种视频流图像帧的识别系统及其方法 - Google Patents

一种视频流图像帧的识别系统及其方法 Download PDF

Info

Publication number
CN103226692B
CN103226692B CN201210480917.7A CN201210480917A CN103226692B CN 103226692 B CN103226692 B CN 103226692B CN 201210480917 A CN201210480917 A CN 201210480917A CN 103226692 B CN103226692 B CN 103226692B
Authority
CN
China
Prior art keywords
frame
picture frame
stored
buffer
district
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201210480917.7A
Other languages
English (en)
Other versions
CN103226692A (zh
Inventor
王磊
郑伟龙
张文山
姚以鹏
陈曦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Science Center
Original Assignee
Guangdong Science Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Science Center filed Critical Guangdong Science Center
Priority to CN201210480917.7A priority Critical patent/CN103226692B/zh
Publication of CN103226692A publication Critical patent/CN103226692A/zh
Application granted granted Critical
Publication of CN103226692B publication Critical patent/CN103226692B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明提供了一种视频流图像帧的识别系统及其方法,其中,一级缓冲区接收联想手势形成的数据包并将其分割转存为连续的图像帧,匹配单元从一级缓冲区内依次取出图像帧存入二级缓冲区,并将二级缓冲区内存储的图像帧与常规帧匹配库进行匹配,在匹配单元匹配成功后将二级缓冲区内存储的图像帧存入语句缓存区,并启动联想匹配单元进行双线匹配识别。本发明提供了新的视觉手势识别方案,利用逐帧递增与常数帧库进行匹配处理,不需要提取特征值,而是通过逐一对应数据帧库进行匹配,而当识别出后由联想识别功能直接截取帧数进匹配,大大减少了计算机的工作量,显著提高了运算速度和匹配精度。

Description

一种视频流图像帧的识别系统及其方法
技术领域
本发明涉及手势视频流识别技术领域,具体的涉及一种视频流图像帧的识别系统及其方法。
背景技术
手势作为人类最自然的表达方式之一,在日常生活中得到了广泛的应用。其中,手语是用手势表示意思的语言,但对不熟悉手语的普通人来说,理解手语是非常困难的,所以如果有能够对手语进行翻译的技术,将大大方便聋哑人与正常人之间的交流。在手势及手语的识别中,一个关键环节便是手势跟踪。
按现有技术,手势识别根据外围设备采集手势图像方式的不同可以分为:基于数据手套的手势识别和基于计算机视觉的手势识别。基于数据手套的手势识别是通过数据手套和位置跟踪来测量手势运动的轨迹和时序信息,其优点是识别率高,缺点是输入设备昂贵,并且要求打手势的人必须穿戴复杂的数据手套。
而基于计算机视觉的手势识别,一般采用单目普通摄像头下的目标跟踪原理,其过程中比较难解决的一个问题就是遮挡,当一个目标物被另一个物体部分遮挡或完全遮挡时,跟踪的特征就会不完整或者消失,进而导致跟踪过程中断,此时需要重新检测目标物进行跟踪的重新初始化,非常不方便。为了解决这个问题,可以采用多个摄像头进行跟踪,但是跟踪算法会变得比较复杂,增加了技术难度和不稳定性。所以,基于计算机视觉的手势识别会使能够识别的手势种类受到很大的限制。
为了解决上述问题,专利号为200810068423.1的中国专利“一种数据流图像帧的分割识别方法及其装置”,提供了积累一定的周期图像数据,通过判断区域图像是否满足识别区域的边界条件来进行模式识别,再通过特征值提取来进行模式比对从而得出想要的结果。该篇专利虽然提供了一定的技术解决方案,但如果实际进行应用则依然存在较多的缺陷,如识别种类少、识别速度慢、匹配精度不够等。
发明内容
本发明的目的在于克服现有技术的不足,提供一种视频流图像帧的识别系统及方法,主要通过对图像帧的分割,再通过逐帧递增的方式将帧与常规常规帧匹配库进行匹配,从而避免了对来的图像数据进行提取关键帧的步骤,再通过联想功能进行联想,进而有效的缩短了识别匹配时间。
本发明通过以下技术方案实现:
一种视频流图像帧的识别系统,包括匹配单元、联想匹配单元、常规帧匹配库、语句缓存区、一级缓冲区和二级缓冲区;其中,一级缓冲区和二级缓冲区与相连;匹配单元与联想匹配单元、常规帧匹配库、语句缓存区、一级缓冲区、二级缓冲区相连;同时联想匹配单元与常规帧匹配库、语句缓存区、一级缓冲区、二级缓冲区相连。
具体的,一级缓冲区接收联想手势形成的数据包并将其分割转存为连续的图像帧,匹配单元从一级缓冲区内依次取出图像帧存入二级缓冲区,并将二级缓冲区内存储的图像帧与常规帧匹配库进行匹配,在匹配单元匹配成功后将二级缓冲区内存储的图像帧存入语句缓存区,并启动联想匹配单元进行双线匹配识别。
其中,常规帧匹配库将每种相同帧数构成的手语分类存储,依次形成一帧匹配库、二帧匹配库、……N-1帧匹配库和N帧匹配库。
举例来说,如:“我”、“你”、“他”,假如都由2个帧就可以构成,那么将这些由2个帧组成的手势都归纳在“二帧匹配库”中,其他以此类推。
其中,匹配单元将一级缓冲区内的图像帧从第一个图像帧开始依次递增存入二级缓冲区内,其中,当二级缓冲区内每存入新的一个图像帧时,匹配单元将二级缓冲区内存储的图像帧与常规帧匹配库进行匹配,匹配成功后将二级缓冲区内存储的图像帧存入语句缓存区。
其中,在匹配单元匹配成功后,根据联想手势需要的帧数和二级缓冲区内存储的图像帧联想出三组词帧值(依次设为M1、M2、M3),清空二级缓冲区;接着开始匹配过程,通过三组词帧值依次读取一级缓冲区内未匹配的图像帧,将所读取的图像帧存入二级缓冲区并与常规帧匹配库进行匹配,如匹配成功则将二级缓冲区内存储的图像帧送往语句缓存区进行待处理;反复执行上述匹配过程,直至三组词帧值都不能匹配成功时,联想匹配单元结束双线匹配识别。
其中,匹配单元即时检测语句缓存区内所存储的图像帧,当语句缓存区内所存储的图像帧能够形成完整的句式时,由匹配单元优化并输出结果。
根据上述系统所实现的一种视频流图像帧的识别方法,包括以下步骤:
1)匹配单元运行;
2)对当前接收到的数据包分割成连续的图像帧,将分割完成的连续图像帧存储在一级缓冲区中;
3)将一级缓冲区内的连续图像帧从还未进行匹配的第一帧开始依次递增存入二级缓冲区,再与常规帧匹配库进行匹配处理,如匹配成功则进行步骤5,如匹配不成功则进行步骤4;
4)将匹配不成功的图像帧加上其后面的一个图像帧一起,与常规帧匹配库进行再一次匹配;如匹配成功则进行步骤5,如匹配不成功则再一次进行步骤4;
5)将匹配成功的图像帧送往语句缓存区进行待处理,当语句缓存区内所存储的图像帧能够形成完整的句式时,进行步骤8;
6)联想匹配单元进行双线匹配识别;
7)根据联想手势需要的帧数和二级缓冲区内存储的图像帧联想出三组词帧值(依次设为M1、M2、M3),清空二级缓冲区;接着开始匹配过程,通过三组词帧值依次读取一级缓冲区内未匹配的图像帧,将所读取的图像帧存入二级缓冲区并与常规帧匹配库进行匹配,如匹配成功则将二级缓冲区内存储的图像帧送往语句缓存区进行待处理,当语句缓存区内所存储的图像帧能够形成完整的句式时则进行步骤8;反复执行上述的匹配过程,直至三组词帧值都不能匹配成功时,联想匹配单元结束双线匹配识别,清空二级缓冲区,返回步骤3;
8)对语句缓存区内所存储的图像帧进行优化排列处理;
9)输出结果。
其中,所述的步骤8中,因为手语语法与人们正常的说话语法不同,所以需要进行优化处理,如:手语打的比如:一杯可乐,应该打可乐一(杯),这个时候就需要用到优化把可乐一翻译成一杯可乐。
其中,所述的步骤7中包括如下匹配过程:
7.1)将词帧值M1发往一级缓存区,读取一级缓冲区内未匹配的图像帧,将所读取的图像帧存入二级缓冲区并与常规帧匹配库进行匹配,如匹配不成功则进行步骤7.2,如匹配成功则将二级缓冲区内存储的图像帧送往语句缓存区进行待处理,当语句缓存区内所存储的图像帧能够形成完整的句式时则进行所述的步骤8,否则继续进行步骤7.1;
7.2)如不能匹配成功,则将词帧值M2发往一级缓存区,读取一级缓冲区内未匹配的图像帧,将所读取的图像帧存入二级缓冲区并与常规帧匹配库进行匹配,如匹配不成功则进行步骤7.3;如匹配成功则将二级缓冲区内存储的图像帧送往语句缓存区进行待处理,当语句缓存区内所存储的图像帧能够形成完整的句式时则进行所述的步骤8,否则进行步骤7.1;
7.3)如不能匹配成功,则将词帧值M3发往一级缓存区,读取一级缓冲区内未匹配的图像帧,将所读取的图像帧存入二级缓冲区并与常规帧匹配库进行匹配,如匹配不成功则进行步骤7.4;如匹配成功则将二级缓冲区内存储的图像帧送往语句缓存区进行待处理,当语句缓存区内所存储的图像帧能够形成完整的句式时则进行所述的步骤8,否则进行步骤7.1;
7.4)联想匹配单元结束双线匹配识别,清空二级缓冲区,返回所述步骤3。
与现有技术相比,本发明具有以下有益效果:
本发明提供了新的视觉手势识别方案,利用逐帧递增与常数帧库进行匹配处理,不需要提取特征值,而是通过逐一对应数据帧库进行匹配,而当识别出后由联想识别功能直接截取帧数进匹配,大大减少了计算机的工作量,显著提高了运算速度和匹配精度,有效解决了基于计算机视觉手势方式识别种类少、识别速度慢的问题,能够适用于各个领域中,应用前景广泛,具备突出的效率性。
附图说明
下面将结合实施例和附图对本发明作进一步的详细描述:
图1为本发明一具体实施例的系统结构示意图;
图2为本发明一具体实施例的方法流程示意图;
图3为本发明一具体实施例的方法细致流程示意图;
图4为本发明一具体实施例的联想匹配单元的流程示意图;
图5为为本发明一具体实施例的常规帧匹配库的结构示意图。
具体实施方式
下面结合实施例及附图,对本发明作进一步的详细说明,但理应理解本发明的实施方式并不限于此。
如图1所示为本发明的一种视频流图像帧的识别系统,包括匹配单元、联想匹配单元、常规帧匹配库、语句缓存区、一级缓冲区和二级缓冲区;其中,一级缓冲区和二级缓冲区与相连;匹配单元与联想匹配单元、常规帧匹配库、语句缓存区、一级缓冲区、二级缓冲区相连;同时联想匹配单元与常规帧匹配库、语句缓存区、一级缓冲区、二级缓冲区相连。
具体的,如图2所示,一级缓冲区接收联想手势形成的数据包并将其分割转存为连续的图像帧,匹配单元从一级缓冲区内依次取出图像帧存入二级缓冲区,并将二级缓冲区内存储的图像帧与常规帧匹配库进行匹配,在匹配单元匹配成功后将二级缓冲区内存储的图像帧存入语句缓存区,并启动联想匹配单元进行双线匹配识别。
其中,如图5所示,常规帧匹配库将每种相同帧数构成的手语分类存储,依次形成一帧匹配库、二帧匹配库、……N-1帧匹配库和N帧匹配库。
举例来说:“我”、“你”、“他”,假如都由2个帧就可以构成,那么将这些由2个帧组成的手势都归纳在“二帧匹配库”中,其他类型的帧按现有技术和行业知识,以此类推。
其中,匹配单元将一级缓冲区内的图像帧从第一个图像帧开始依次递增存入二级缓冲区内,其中,当二级缓冲区内每存入新的一个图像帧时,匹配单元将二级缓冲区内存储的图像帧与常规帧匹配库进行匹配,匹配成功后将二级缓冲区内存储的图像帧存入语句缓存区。
具体的,如图4所示,在匹配单元匹配成功后,根据联想手势需要的帧数和二级缓冲区内存储的图像帧联想出三组词帧值(可依次设为M1、M2、M3),清空二级缓冲区;接着开始匹配过程,通过三组词帧值依次读取一级缓冲区内未匹配的图像帧,将所读取的图像帧存入二级缓冲区并与常规帧匹配库进行匹配,如匹配成功则将二级缓冲区内存储的图像帧送往语句缓存区进行待处理;反复执行上述匹配过程,直至三组词帧值都不能匹配成功时,联想匹配单元结束双线匹配识别。
其中,匹配单元即时检测语句缓存区内所存储的图像帧,当语句缓存区内所存储的图像帧能够形成完整的句式时,由匹配单元优化并输出结果。
如图2~图3所示,根据上述系统所实现的一种视频流图像帧的识别方法,包括以下步骤:
1)运行匹配单元;
2)对当前接收到的数据包分割成连续的图像帧,将分割完成的连续图像帧存储在一级缓冲区中;
3)将一级缓冲区内的连续图像帧从还未进行匹配的第一帧开始依次递增存入二级缓冲区,再与常规帧匹配库进行匹配处理,如匹配成功则进行步骤5,如匹配不成功则进行步骤4;
4)将匹配不成功的图像帧加上其后面的一个图像帧一起,与常规帧匹配库进行再一次匹配;如匹配成功则进行步骤5,如匹配不成功则再一次进行步骤4;
5)将匹配成功的图像帧送往语句缓存区进行待处理,当语句缓存区内所存储的图像帧能够形成完整的句式时,进行步骤8;
6)联想匹配单元进行双线匹配识别;
7)根据联想手势需要的帧数和二级缓冲区内存储的图像帧联想出三组词帧值(依次设为M1、M2、M3),清空二级缓冲区;接着开始匹配过程,通过三组词帧值依次读取一级缓冲区内未匹配的图像帧,将所读取的图像帧存入二级缓冲区并与常规帧匹配库进行匹配,如匹配成功则将二级缓冲区内存储的图像帧送往语句缓存区进行待处理,当语句缓存区内所存储的图像帧能够形成完整的句式时则进行步骤8;反复执行上述的匹配过程,直至三组词帧值都不能匹配成功时,联想匹配单元结束双线匹配识别,清空二级缓冲区,返回步骤3;
8)对语句缓存区内所存储的图像帧进行优化排列处理;
9)输出结果。
其中,所述的步骤8中,因为手语语法与人们正常的说话语法不同,所以需要进行优化处理,如:手语打的比如:一杯可乐,应该打“可乐一(杯)”,如二包吃的,应该打“吃的二(包)”这个时候就需要用到优化把可乐一翻译成一杯可乐。
其中,所述的步骤7中包括如下匹配过程:
7.1)将词帧值M1发往一级缓存区,读取一级缓冲区内未匹配的图像帧,将所读取的图像帧存入二级缓冲区并与常规帧匹配库进行匹配,如匹配不成功则进行步骤7.2,如匹配成功则将二级缓冲区内存储的图像帧送往语句缓存区进行待处理,当语句缓存区内所存储的图像帧能够形成完整的句式时则进行所述的步骤8,否则继续进行步骤7.1;
7.2)如不能匹配成功,则将词帧值M2发往一级缓存区,读取一级缓冲区内未匹配的图像帧,将所读取的图像帧存入二级缓冲区并与常规帧匹配库进行匹配,如匹配不成功则进行步骤7.3;如匹配成功则将二级缓冲区内存储的图像帧送往语句缓存区进行待处理,当语句缓存区内所存储的图像帧能够形成完整的句式时则进行所述的步骤8,否则进行步骤7.1;
7.3)如不能匹配成功,则将词帧值M3发往一级缓存区,读取一级缓冲区内未匹配的图像帧,将所读取的图像帧存入二级缓冲区并与常规帧匹配库进行匹配,如匹配不成功则进行步骤7.4;如匹配成功则将二级缓冲区内存储的图像帧送往语句缓存区进行待处理,当语句缓存区内所存储的图像帧能够形成完整的句式时则进行所述的步骤8,否则进行步骤7.1;
7.4)联想匹配单元结束双线匹配识别,清空二级缓冲区,返回所述步骤3。

Claims (6)

1.一种视频流图像帧的识别系统,其特征在于包括匹配单元、联想匹配单元、常规帧匹配库、语句缓存区、一级缓冲区和二级缓冲区;其中,一级缓冲区和二级缓冲区与相连;匹配单元与联想匹配单元、常规帧匹配库、语句缓存区、一级缓冲区、二级缓冲区相连;同时联想匹配单元与常规帧匹配库、语句缓存区、一级缓冲区、二级缓冲区相连;具体的,一级缓冲区接收联想手势形成的数据包并将其分割转存为连续的图像帧,匹配单元从一级缓冲区内依次取出图像帧存入二级缓冲区,并将二级缓冲区内存储的图像帧与常规帧匹配库进行匹配,在匹配单元匹配成功后将二级缓冲区内存储的图像帧存入语句缓存区,并启动联想匹配单元进行双线匹配识别;
其中,在匹配单元匹配成功后,根据联想手势需要的帧数和二级缓冲区内存储的图像帧联想出三组词帧值,依次设为M1、M2、M3,清空二级缓冲区;接着开始匹配过程,通过三组词帧值依次读取一级缓冲区内未匹配的图像帧,将所读取的图像帧存入二级缓冲区并与常规帧匹配库进行匹配,如匹配成功则将二级缓冲区内存储的图像帧送往语句缓存区进行待处理;反复执行上述匹配过程,直至三组词帧值都不能匹配成功时,联想匹配单元结束双线匹配识别。
2.根据权利要求1所述的视频流图像帧的识别系统,其特征在于所述的常规帧匹配库将每种相同帧数构成的手语分类存储,依次形成一帧匹配库、二帧匹配库、……N-1帧匹配库和N帧匹配库。
3.根据权利要求1所述的视频流图像帧的识别系统,其特征在于所述的匹配单元将一级缓冲区内的图像帧从第一个图像帧开始依次递增存入二级缓冲区内,其中,当二级缓冲区内每存入新的一个图像帧时,匹配单元将二级缓冲区内存储的图像帧与常规帧匹配库进行匹配,匹配成功后将二级缓冲区内存储的图像帧存入语句缓存区。
4.根据权利要求1所述的视频流图像帧的识别系统,其特征在于所述的匹配单元即时检测语句缓存区内所存储的图像帧,当语句缓存区内所存储的图像帧能够形成完整的句式时,由匹配单元优化并输出结果。
5.根据权利要求1所述的系统实现的视频流图像帧的识别方法,其特征在于包括以下步骤:
1)匹配单元运行;
2)对当前接收到的数据包分割成连续的图像帧,将分割完成的连续图像帧存储在一级缓冲区中;
3)将一级缓冲区内的连续图像帧从还未进行匹配的第一帧开始依次递增存入二级缓冲区,再与常规帧匹配库进行匹配处理,如匹配成功则进行步骤5,如匹配不成功则进行步骤4;
4)将匹配不成功的图像帧加上其后面的一个图像帧一起,与常规帧匹配库进行再一次匹配;如匹配成功则进行步骤5,如匹配不成功则再一次进行步骤4;
5)将匹配成功的图像帧送往语句缓存区进行待处理,当语句缓存区内所存储的图像帧能够形成完整的句式时,进行步骤8;
6)联想匹配单元进行双线匹配识别;
7)根据联想手势需要的帧数和二级缓冲区内存储的图像帧联想出三组词帧值,依次设为M1、M2、M3,清空二级缓冲区;接着开始匹配过程,通过三组词帧值依次读取一级缓冲区内未匹配的图像帧,将所读取的图像帧存入二级缓冲区并与常规帧匹配库进行匹配,如匹配成功则将二级缓冲区内存储的图像帧送往语句缓存区进行待处理,当语句缓存区内所存储的图像帧能够形成完整的句式时则进行步骤8;反复执行上述的匹配过程,直至三组词帧值都不能匹配成功时,联想匹配单元结束双线匹配识别,清空二级缓冲区,返回步骤3;
8)对语句缓存区内所存储的图像帧进行优化排列处理;
9)输出结果。
6.根据权利要求5所述的视频流图像帧的识别方法,其特征在于所述的步骤7中包括如下匹配过程:
7.1)将词帧值M1发往一级缓存区,读取一级缓冲区内未匹配的图像帧,将所读取的图像帧存入二级缓冲区并与常规帧匹配库进行匹配,如匹配不成功则进行步骤7.2,如匹配成功则将二级缓冲区内存储的图像帧送往语句缓存区进行待处理,当语句缓存区内所存储的图像帧能够形成完整的句式时则进行所述的步骤8,否则继续进行步骤7.1;
7.2)如不能匹配成功,则将词帧值M2发往一级缓存区,读取一级缓冲区内未匹配的图像帧,将所读取的图像帧存入二级缓冲区并与常规帧匹配库进行匹配,如匹配不成功则进行步骤7.3;如匹配成功则将二级缓冲区内存储的图像帧送往语句缓存区进行待处理,当语句缓存区内所存储的图像帧能够形成完整的句式时则进行所述的步骤8,否则进行步骤7.1;
7.3)如不能匹配成功,则将词帧值M3发往一级缓存区,读取一级缓冲区内未匹配的图像帧,将所读取的图像帧存入二级缓冲区并与常规帧匹配库进行匹配,如匹配不成功则进行步骤7.4;如匹配成功则将二级缓冲区内存储的图像帧送往语句缓存区进行待处理,当语句缓存区内所存储的图像帧能够形成完整的句式时则进行所述的步骤8,否则进行步骤7.1;
7.4)联想匹配单元结束双线匹配识别。
CN201210480917.7A 2012-11-22 2012-11-22 一种视频流图像帧的识别系统及其方法 Expired - Fee Related CN103226692B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210480917.7A CN103226692B (zh) 2012-11-22 2012-11-22 一种视频流图像帧的识别系统及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210480917.7A CN103226692B (zh) 2012-11-22 2012-11-22 一种视频流图像帧的识别系统及其方法

Publications (2)

Publication Number Publication Date
CN103226692A CN103226692A (zh) 2013-07-31
CN103226692B true CN103226692B (zh) 2016-01-20

Family

ID=48837133

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210480917.7A Expired - Fee Related CN103226692B (zh) 2012-11-22 2012-11-22 一种视频流图像帧的识别系统及其方法

Country Status (1)

Country Link
CN (1) CN103226692B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106875538A (zh) * 2017-01-20 2017-06-20 深圳怡化电脑股份有限公司 获取冠字号信息的方法和装置
CN111679272A (zh) * 2020-06-01 2020-09-18 南京欧曼智能科技有限公司 一种基于缓冲技术的目标轨迹跟踪处理方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5982853A (en) * 1995-03-01 1999-11-09 Liebermann; Raanan Telephone for the deaf and method of using same
EP0905644A3 (en) * 1997-09-26 2004-02-25 Matsushita Electric Industrial Co., Ltd. Hand gesture recognizing device
CN101452705A (zh) * 2007-12-07 2009-06-10 希姆通信息技术(上海)有限公司 语音文字转换、手语文字转换的方法和装置
CN102592112B (zh) * 2011-12-20 2014-01-29 四川长虹电器股份有限公司 基于隐马尔科夫模型判断手势运动方向的方法

Also Published As

Publication number Publication date
CN103226692A (zh) 2013-07-31

Similar Documents

Publication Publication Date Title
Yuliang et al. Detecting curve text in the wild: New dataset and new solution
CN110458059B (zh) 一种基于计算机视觉的手势识别方法及识别装置
CN105512638B (zh) 一种基于融合特征的人脸检测与对齐方法
CN103093196B (zh) 一种基于手势的汉字交互输入与识别方法
CN101807256B (zh) 一种基于多分辨率框架的物体识别检测方法
CN102331990B (zh) 一种基于字幕提取的新闻视频检索方法
CN106570564B (zh) 基于深度网络的多尺度行人检测方法
CN107346420A (zh) 一种基于深度学习的自然场景下文字检测定位方法
CN103576840A (zh) 基于立体视觉的手势体感控制系统
CN117994837A (zh) 一种人脸图像检测方法、装置及设备
CN102609093A (zh) 用手势控制视频播放的方法及装置
CN102724485A (zh) 采用双核处理器对输入视频进行结构化描述的装置和方法
CN111950515A (zh) 一种基于语义特征金字塔网络的小人脸检测方法
CN106708813A (zh) 一种标题处理方法及设备
CN112101060A (zh) 基于平移不变性和小区域模板匹配的二维码定位方法
CN108830269A (zh) 确定满文单词中轴线宽度的方法
CN103226692B (zh) 一种视频流图像帧的识别系统及其方法
CN116958996A (zh) Ocr信息提取方法、系统及设备
CN115830330A (zh) 利用通用模型来处理视觉任务的方法、装置、设备和介质
CN108537109A (zh) 基于OpenPose的单目相机手语识别方法
Li et al. Class imbalance mitigation: A select-then-extract learning framework for emotion-cause pair extraction
CN114937311A (zh) 一种基于精确边界预测的时序动作检测方法
CN103729934A (zh) 一种基于dsp的高速纸币冠字号码提取及识别系统
CN204302987U (zh) 一种二维码识别装置
CN110633666A (zh) 一种基于手指颜色贴片的手势轨迹识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CB03 Change of inventor or designer information

Inventor after: Wang Lei

Inventor after: Zheng Weilong

Inventor after: Zhang Wenshan

Inventor after: Yao Yipeng

Inventor after: Chen Xi

Inventor after: Wu Huanbin

Inventor after: Wen Yingying

Inventor after: Lian Junwei

Inventor before: Wang Lei

Inventor before: Zheng Weilong

Inventor before: Zhang Wenshan

Inventor before: Yao Yipeng

Inventor before: Chen Xi

COR Change of bibliographic data
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160120

Termination date: 20171122