[go: up one dir, main page]

CN102831200A - 一种基于图像文字识别的商品推送方法和装置 - Google Patents

一种基于图像文字识别的商品推送方法和装置 Download PDF

Info

Publication number
CN102831200A
CN102831200A CN2012102793672A CN201210279367A CN102831200A CN 102831200 A CN102831200 A CN 102831200A CN 2012102793672 A CN2012102793672 A CN 2012102793672A CN 201210279367 A CN201210279367 A CN 201210279367A CN 102831200 A CN102831200 A CN 102831200A
Authority
CN
China
Prior art keywords
commodity
commodity information
character
weight
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012102793672A
Other languages
English (en)
Inventor
韩钧宇
丁二锐
吴中勤
文林福
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN2012102793672A priority Critical patent/CN102831200A/zh
Publication of CN102831200A publication Critical patent/CN102831200A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于图像文字识别的商品推送方法和装置,其中方法包括:S1、获取待识别图像中的文字区域;S2、对所述文字区域进行文字识别;S3、利用识别结果查询商品库获得识别结果对应的商品信息;S4、推送包含所述商品信息的商品查询列表。通过本发明用户能够通过上传图像的方式直接获取到商品信息,而无需人工通过搜索引擎从大量的搜索结果中搜寻商品信息,大大减少了用户操作,实现更加方便。

Description

一种基于图像文字识别的商品推送方法和装置
【技术领域】
本发明涉及计算机应用技术领域,特别涉及一种基于图像文字识别的商品推送方法和装置。
【背景技术】
随着移动互联网的迅速发展,基于移动终端摄像头采集到的图像的应用越来越广泛。其中图像文字识别技术将图像中的文字进行识别,转换为文本文字,从而减轻了用户输入对应文字信息的负担,方便用户存储、编辑对应的文字信息。
在实际应用过程中存在如下情况,用户看到某个商品后想查询该商品的相关信息,例如商品用途、厂家、价格、哪里有售等等,现有的方式就是用户通过搜索引擎手工输入商品名称等作为query,并从大量搜索结果中找寻想要的商品信息,显然这种方式操作十分繁琐,需要大量的手工操作。
【发明内容】
有鉴于此,本发明提供了一种基于图像文字识别的商品推送方法和装置,以便于减少用户获得商品信息的操作,实现更加方便。
具体技术方案如下:
一种基于图像文字识别的商品推送方法,该方法包括:
S1、获取待识别图像中的文字区域;
S2、对所述文字区域进行文字识别;
S3、利用识别结果查询商品库获得识别结果对应的商品信息;
S4、推送包含所述商品信息的商品查询列表。
根据本发明一优选实施例,所述步骤S1具体包括:
服务器接收移动终端发送来的待识别图像,从所述待识别图像中提取文字区域;或者,
服务器接收移动终端从待识别图像中提取并发送来的文字区域。
根据本发明一优选实施例,所述步骤S2具体包括:
对文字区域进行二值化;
对二值化后的文字区域分割为各字块;
提取各字块的特征信息并与特征数据库进行匹配,将匹配结果作为各字块的识别结果;
按顺序将各字块的识别结果进行组合得到所述文字区域的识别结果。
根据本发明一优选实施例,所述商品库包括一个以上类别的商品库;
在所述步骤S3中查询所有商品库;或者,
在所述步骤S1中还获取用户选择的个性化选项内容,在所述步骤S3中查询所述用户选择的个性化选项内容对应的商品库。
根据本发明一优选实施例,所述查询商品库获得识别结果对应的商品信息具体包括:
依据商品库的商品信息中文字内容与识别结果之间的语义相似度,计算商品信息的文字匹配权重,将文字匹配权重排在前n1个的商品信息包含在商品查询列表中,n1为预设的正整数;或者,
依据商品库的商品信息中文字内容与识别结果之间的语义相似度,计算商品信息的文字匹配权重,以及依据所述待识别图像与商品库的商品信息中图像之间的相似度计算商品信息的图像匹配权重,结合文字匹配权重和图像匹配权重计算商品信息对应的查询权重,将查询权重排在前n2个的商品信息包含在商品查询列表中,n2为预设的正整数;或者,
依据商品库的商品信息中文字内容与识别结果之间的语义相似度,计算商品信息的文字匹配权重,以及依据所述待识别图像与商品库的商品信息中图像之间的相似度计算商品信息的图像匹配权重,结合文字匹配权重和图像匹配权重计算商品信息对应的查询权重,基于商品信息的被查询状况计算商品信息的选择权重,结合所述查询权重和选择权重计算商品信息的总权重,将总权重值排在前n3个的商品信息生成商品查询列表,n3为预设的正整数。
根据本发明一优选实施例,所述计算商品信息的选择权重包括:
根据商品信息被查询到的总次数计算商品信息的选择权重,总次数越大选择权重值越大;或者,
利用商品信息被查询到的总次数确定商品信息的商品权重,总次数越大商品权重值越大,再利用商品信息所属类别的所有商品信息被当前用户查看的总次数确定用户个性化权重,利用商品信息的商品权重与用户个性化权重的乘积确定该商品信息的选择权重。
一种基于图像文字识别的商品推送装置,该装置包括:
区域获取单元,用于获取待识别图像中的文字区域;
文字识别单元,用于对所述文字区域进行文字识别;
商品查询单元,用于所述文字识别单元的识别结果查询商品库获得识别结果对应的商品信息;
结果推送单元,用于推送包含所述商品信息的商品查询列表。
根据本发明一优选实施例,所述区域获取单元接收移动终端发送来的待识别图像,从所述待识别图像中提取文字区域;或者,接收移动终端从待识别图像中提取并发送来的文字区域。
根据本发明一优选实施例,所述文字识别单元具体执行:对文字区域进行二值化,对二值化后的文字区域分割为各字块,提取各字块的特征信息并与特征数据库进行匹配,将匹配结果作为各字块的识别结果,按顺序将各字块的识别结果进行组合得到所述文字区域的识别结果。
根据本发明一优选实施例,所述商品库包括一个以上类别的商品库;
所述商品查询单元查询所有商品库;或者,
所述区域获取单元还获取用户选择的个性化选项内容,所述商品查询单元查询所述用户选择的个性化选项内容对应的商品库。
根据本发明一优选实施例,所述商品查询单元在查询商品库获得识别结果对应的商品信息时,具体:
依据商品库的商品信息中文字内容与识别结果之间的语义相似度,计算商品信息的文字匹配权重,将文字匹配权重排在前n1个的商品信息包含在商品查询列表中,n1为预设的正整数;或者,
依据商品库的商品信息中文字内容与识别结果之间的语义相似度,计算商品信息的文字匹配权重,以及依据所述待识别图像与商品库的商品信息中图像之间的相似度计算商品信息的图像匹配权重,结合文字匹配权重和图像匹配权重计算商品信息对应的查询权重,将查询权重排在前n2个的商品信息包含在商品查询列表中,n2为预设的正整数;或者,
依据商品库的商品信息中文字内容与识别结果之间的语义相似度,计算商品信息的文字匹配权重,以及依据所述待识别图像与商品库的商品信息中图像之间的相似度计算商品信息的图像匹配权重,结合文字匹配权重和图像匹配权重计算商品信息对应的查询权重,基于商品信息的被查询状况计算商品信息的选择权重,结合所述查询权重和选择权重计算商品信息的总权重,将总权重值排在前n3个的商品信息生成商品查询列表,n3为预设的正整数。
根据本发明一优选实施例,所述商品查询单元在计算商品信息的选择权重时,具体:
根据商品信息被查询到的总次数计算商品信息的选择权重,总次数越大选择权重值越大;或者,
利用商品信息被查询到的总次数确定商品信息的商品权重,总次数越大商品权重值越大,再利用商品信息所属类别的所有商品信息被当前用户查看的总次数确定用户个性化权重,利用商品信息的商品权重与用户个性化权重的乘积确定该商品信息的选择权重。
由以上技术方案可以看出,本发明在图像文字识别的基础上,利用识别结果查询商品库获得识别结果对应的商品信息,并推送包含商品信息的商品查询列表,从而使得用户能够通过上传图像的方式直接获取到商品信息,而无需人工通过搜索引擎从大量的搜索结果中搜寻商品信息,大大减少了用户操作,实现更加方便。
【附图说明】
图1为本发明实施例提供的基于图像文字识别的商品推送方法流程图;
图2为本发明实施例提供的系统结构图;
图3为本发明实施例提供的基于图像文字识别的商品推送装置结构图;
图4和图5为本发明实施例提供的移动终端的两个展示效果示意图。
【具体实施方式】
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
实施例一、
图1为本发明实施例提供的基于图像文字识别的商品推送方法流程图,如图1所示,该方法可以包括以下步骤:
步骤101:获取待识别图像中的文字区域。
服务器获取移动终端发送来的包含文字信息的图像,该图像可以是移动终端拍摄到的原始图像,服务器在本步骤中提取待识别图像中的文字区域。或者,该图像可以是移动终端拍摄到原始图像并提取出待识别图像中的文字区域后,将待识别图像中的文字区域发送给服务器。
在提取文字区域时可以采用现有的方式,去除图像背景后提取文字区域,可以采用但不限于以下方式:
方式一、首先根据彩色欧式距离进行彩色游程编码,然后进行颜色聚类,基于聚类结果进行文字层的生成和选择,例如保留面积大于一定值的连通域,基于连通域与各颜色聚类中心的欧式距离生成各图像层面,最后依据各图像层面的像素个数与该层分割阈值的像素个数的关系确定文字层面、噪声层面或背景层面,最后取出噪声层面和背景层面后就得到文字层面,即文字区域。
方式二、选择大量的文字样本图像和不含文字的图片,使用canny算子提取这两类图片的边缘信息作为稀疏表示分类字典的训练样本;将两类训练样本输入分类稀疏表示字典训练算法得到文字稀疏表示分类字典和非文字稀疏表示分类字典;将待识别图像转为灰度图像,使用canny算子提取灰度图像的边缘信息;利用基于分类字典的稀疏表示提取灰度图像边缘信息中的候选文字区域;在水平方向上和垂直方向上分别使用游程平滑算法将候选文字区域孤立的边缘连接为较大的区域,再进行投影分析找出相应的文字行,同时舍去候选文字区域中文字行以外的孤立边缘;将检测出的文字区域标识出来。
如果移动终端进行文字区域的提取,则可以采用已有的文字区域提取软件或者手动的方式进行文字区域的提取。
另外,本步骤中获取的文字区域可以是一个,也可以是两个以上。由于本步骤中的内容为现有技术,在此不再赘述。
步骤102:对文字区域进行文字识别。
其中对文字区域进行文字识别的过程同样可以采用现有技术,即包括以下步骤:对文字区域进行二值化;对二值化后的文字区域分割为各字块;提取各字块的特征信息并与特征数据库进行匹配,将匹配结果作为各字块的识别结果,按顺序将各字块的识别结果进行组合就得到文字区域的识别结果。
另外,文字识别的方式多种多样,除了上述方式之外还可以采用其他任意能够实现文字识别的方式,具体不再赘述。
步骤103:利用识别结果查询商品库获得识别结果对应的商品信息。
本步骤中查询的商品库可以是实体商品库,也可以是虚拟商品库,这些商品库可以是本地的商品库,也可以是网络的商品库,也可以是第三方开放了访问接口的商品库。
实体商品库可以包含但不限于包含图书商品信息的图书商品库、包含食品商品信息的食品商品库、包含服装商品信息的服装商品库、包含药品信息的药品商品库等各实体类商品库。虚拟商品库可以包含但不限于包含电子图书商品信息的电子图书商品库、包含游戏点卡商品信息的游戏点卡商品库、包含应用软件商品信息的应用软件商品库、包含服务商品信息的服务商品库等虚拟类商品库。
在查询实体商品库或虚拟商品库时,计算商品信息中文字内容与识别结果的文字匹配权重,该文字匹配权重取决于商品信息与识别结果之间的语义相似度,将文字匹配权重达到预设文字匹配权重阈值的商品信息作为查询结果。
其中语义相似度的确定可以采用现有技术,目的是计算商品信息的文字内容和识别结果在语义上的相似程度,确定方法可以采用但不限于以下方式:提取识别结果中的关键语义词汇,查询商品信息的文字内容,获得匹配成功的关键语义词汇文字个数,以该个数作为语义相似度的确定基础。匹配成功的关键语义词汇文字个数越大表示语义相似度越大,对应的文字匹配权重越大。
另外,鉴于实体商品的特殊性,实体商品会存在图像,在查询实体商品库时还可以进一步计算待识别图像与商品库的商品信息中图像之间的图像匹配权重,该图像匹配权重取决于商品信息中图像与待识别图像之间的相似度。然后结合商品信息对应的文字匹配权重和图像匹配权重计算商品信息对应的查询权重。其中在计算商品信息对应的查询权重时,可以将文字匹配权重和图像匹配权重的乘积,或者求和作为对应的查询权重。
上述商品信息中图像与待识别图像之间的相似度的确定也可以采用现有技术,可以采用但不限于该方法:分别提取待识别图像与商品图像的颜色直方图,计算颜色直方图之间的欧式距离,基于该欧式距离确定两图像之间的相似度。欧式距离越小两图像之间的相似度越大,对应的图像匹配权重越大。
一种实现方式是,在查询了所有商品库后,将文字匹配权重排在前n1个的商品信息包含在商品查询列表中以供返回给移动终端。特殊地,其中对于实体商品的商品信息可以将查询权重排在前n2个的商品信息包含在商品查询列表中以供返回给移动终端。其中n1和n2为预设的正整数。
另一种实现方式是,移动终端向用户提供个性化设置选项,在向服务器发送图像时同时发送用户选择的选项内容,服务器在本步骤中查询各类别的商品库时,仅查询用户选择的选项内容对应类别的商品库。然后将文字匹配权重排在前n1个的商品信息包含在商品查询列表中以供返回给移动终端。特殊地,其中对于实体商品的商品信息可以将查询权重排在前n2个的商品信息包含在商品查询列表中以供返回给移动终端。其中n1和n2为预设的正整数。
举个例子,移动终端向用户提供实体商品、虚拟商品等个性化设置选项,或者更具体地提供图书商品、食品商品、服装商品、电子图书商品、游戏点卡商品、应用软件商品、服务商品等个性化设置选项,如果用户通过移动终端拍摄了一种食品包装的图像,可以选择食品商品这一选项,然后移动终端将图像和用户选择的选项内容发送给服务器,服务器在针对图像的文字识别结果查询商品库时,就可以仅查询食品商品库,将获得的查询结果生成商品查询列表,然后在步骤104中返回给移动终端。当然,用户也可以选择一个以上的选项。
还存在一种实现方式,在查询商品库时,依旧查询所有商品库或者查询用户选择的选项内容对应类别的商品库,但在返回商品信息时结合商品信息的查询权重和选择权重计算各商品信息的总权重,将总权重值排在前n3个的商品信息生成商品查询列表供返回给移动终端,n3为预设的正整数。
其中商品信息的选择权重可以采用但不限于以下方式确定:其一、该商品信息被查询到的总次数,该总次数越大选择权重值越大,这里的总次数指的是被所有用户查询到的总次数。其二、利用商品信息被所有用户查询到的总次数确定该商品信息对应的商品权重,再利用商品信息所属类别的所有商品信息被当前用户查看(即将商品信息推送给移动终端后,用户会查看其中某些类别的商品信息,例如向用户推送了食品商品信息和服装商品信息,如果用户查看了其中的食品商品信息,则会更新食品商品信息被查看的次数,用于更新食品商品信息的用户个性化权重)的总次数确定用户个性化权重,利用商品信息的商品权重与用户个性化权重的乘积确定该商品信息的选择权重。
在得到商品信息的选择权重后,可以利用商品信息的选择权重和查询权重的乘积得到商品信息的总权重,当然也可以采用求和等方式得到商品信息的总权重。
另外,本步骤在查询商品库时可以基于识别结果的全部文字信息,也可以基于对识别结果进行切词后获得的关键意义文字信息。
步骤104:向移动终端推送包含对应商品信息的商品查询列表。
服务器将商品信息返回给移动终端后,用户就能够从移动终端的显示获取到对应的商品信息。并且,其中的商品信息可能是一种以上类别的,如果用户查看了其中某一个或几个类别,则会向服务器上报,由服务器更新各商品信息被所有用户查询的总次数,同时更新商品信息所属商品类别对应的选择。
另外,除了将商品查询列表返回给移动终端之外,可以将识别结果同时返回给移动终端。
以上是对本发明所提供的方法进行的描述,下面通过实施例二对本发明所提供的装置进行详细描述。为了方便理解首先对本发明上述方法所应用的系统进行描述,如图2所示,该系统由移动终端和服务器构成,其中移动终端可以将拍摄到的包含文字的图像作为待识别图像发送给服务器,由服务器从中提取文字区域,或者,移动终端将拍摄到的包含文字的图像作为待识别图像后,从中提取出文字区域,将该文字区域发送给服务器。之后服务器执行实施例一中所示流程,向移动终端返回商品查询列表。本发明下述实施例二所提供的装置设置在服务器中,用于完成实施例一中所示流程。
实施例二、
图3为本发明实施例二提供的图像文字识别的装置结构图,如图3所示,该装置包括:区域获取单元301、文字识别单元302、商品查询单元303和结果推送单元304。
首先,区域获取单元301获取待识别图像中的文字区域。
此处,区域获取单元301接收移动终端发送来的待识别图像,从待识别图像中提取文字区域;或者,接收移动终端从待识别图像中提取并发送来的文字区域。在提取文字区域时,可以采用实施例一中步骤101中所述的两种方式,由于该部分内容为现有技术,在此不再详述。
然后文字识别单元302对文字区域进行文字识别。具体的识别过程可以包括:对文字区域进行二值化,对二值化后的文字区域分割为各字块,提取各字块的特征信息并与特征数据库进行匹配,将匹配结果作为各字块的识别结果,按顺序将各字块的识别结果进行组合得到文字区域的识别结果。
商品查询单元303利用文字识别单元302的识别结果查询商品库获得识别结果对应的商品信息。
由于本发明中涉及的商品库包括一个以上类别的商品库,即可以是一个类别的商品库,也可以是多个类别的商品库,因此商品查询单元303在查询商品库时可以执行以下中的任一种:
商品查询单元查询所有商品库;或者,
区域获取单元还获取用户选择的个性化选项内容,商品查询单元查询用户选择的个性化选项内容对应的商品库。
其中在查询商品库获得识别结果对应的商品信息时,可以采用以下实施方式:
第一种实施方式:依据商品库的商品信息中文字内容与识别结果之间的语义相似度,计算商品信息的文字匹配权重,将文字匹配权重排在前n1个的商品信息包含在商品查询列表中,n1为预设的正整数。
第二种实施方式:依据商品库的商品信息中文字内容与识别结果之间的语义相似度,计算商品信息的文字匹配权重,以及依据所述待识别图像与商品库的商品信息中图像之间的相似度计算商品信息的图像匹配权重,结合文字匹配权重和图像匹配权重计算商品信息对应的查询权重,将查询权重排在前n2个的商品信息包含在商品查询列表中,n2为预设的正整数。
第三种实施方式:依据商品库的商品信息中文字内容与识别结果之间的语义相似度,计算商品信息的文字匹配权重,以及依据所述待识别图像与商品库的商品信息中图像之间的相似度计算商品信息的图像匹配权重,结合文字匹配权重和图像匹配权重计算商品信息对应的查询权重,基于商品信息的被查询状况计算商品信息的选择权重,结合所述查询权重和选择权重计算商品信息的总权重,将总权重值排在前n3个的商品信息生成商品查询列表,n3为预设的正整数。
具体地,商品查询单元303在计算商品信息的选择权重时,可以具体采用以下方式:
方式一、根据商品信息被所有用户查询到的总次数计算商品信息的选择权重,总次数越大选择权重值越大。
方式二、利用商品信息被查询到的总次数确定商品信息的商品权重,总次数越大商品权重值越大,再利用商品信息所属类别的所有商品信息被当前用户查看的总次数确定用户个性化权重,利用商品信息的商品权重与用户个性化权重的乘积确定该商品信息的选择权重。
最后,结果推送单元304推送包含商品信息的商品查询列表。也可以将识别结果同时返回给移动终端。
将商品查询列表返回给移动终端后,用户就能够从移动终端的显示获取商品信息。并且,其中的商品信息可能是一种以上类别的,如果用户查看了其中某一个或几个类别,则会向服务器上报,由商品查询单元303更新各商品信息被所有用户查询的总次数,同时更新商品信息所属商品类别对应的选择。
通过本发明的上述方法和装置,用户能够通过上传图片的方式获得对应的商品信息,而无需手工通过搜索引擎的方式从大量搜索结果中获得商品信息,显然更加方便和省力。
例如,用户通过移动终端拍摄到包含文字“千年一叹”的图像,将其发送给服务器后,服务器经过上述过程进行图像文字识别和查询商品库后,返回识别结果和商品查询列表,其中商品查询列表的展示方式在本发明中并不加以限制,可以采用任意方式,例如图4中所示的引用框的方式。
再例如,用户通过移动终端拍摄到包含文字“天黑请闭眼”的图像,将其发送给服务器后,服务器经过上述过程进行图像文字识别和查询商品库后,返回的商品查询列表中包含多种类别的商品,其中各类别商品的展示方式在本发明中也不加以限制,例如图5中所示的采用标号的方式。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (12)

1.一种基于图像文字识别的商品推送方法,其特征在于,该方法包括:
S1、获取待识别图像中的文字区域;
S2、对所述文字区域进行文字识别;
S3、利用识别结果查询商品库获得识别结果对应的商品信息;
S4、推送包含所述商品信息的商品查询列表。
2.根据权利要求1所述的方法,其特征在于,所述步骤S1具体包括:
服务器接收移动终端发送来的待识别图像,从所述待识别图像中提取文字区域;或者,
服务器接收移动终端从待识别图像中提取并发送来的文字区域。
3.根据权利要求1所述的方法,其特征在于,所述步骤S2具体包括:
对文字区域进行二值化;
对二值化后的文字区域分割为各字块;
提取各字块的特征信息并与特征数据库进行匹配,将匹配结果作为各字块的识别结果;
按顺序将各字块的识别结果进行组合得到所述文字区域的识别结果。
4.根据权利要求1所述的方法,其特征在于,所述商品库包括一个以上类别的商品库;
在所述步骤S3中查询所有商品库;或者,
在所述步骤S1中还获取用户选择的个性化选项内容,在所述步骤S3中查询所述用户选择的个性化选项内容对应的商品库。
5.根据权利要求4所述的方法,其特征在于,所述查询商品库获得识别结果对应的商品信息具体包括:
依据商品库的商品信息中文字内容与识别结果之间的语义相似度,计算商品信息的文字匹配权重,将文字匹配权重排在前n1个的商品信息包含在商品查询列表中,n1为预设的正整数;或者,
依据商品库的商品信息中文字内容与识别结果之间的语义相似度,计算商品信息的文字匹配权重,以及依据所述待识别图像与商品库的商品信息中图像之间的相似度计算商品信息的图像匹配权重,结合文字匹配权重和图像匹配权重计算商品信息对应的查询权重,将查询权重排在前n2个的商品信息包含在商品查询列表中,n2为预设的正整数;或者,
依据商品库的商品信息中文字内容与识别结果之间的语义相似度,计算商品信息的文字匹配权重,以及依据所述待识别图像与商品库的商品信息中图像之间的相似度计算商品信息的图像匹配权重,结合文字匹配权重和图像匹配权重计算商品信息对应的查询权重,基于商品信息的被查询状况计算商品信息的选择权重,结合所述查询权重和选择权重计算商品信息的总权重,将总权重值排在前n3个的商品信息生成商品查询列表,n3为预设的正整数。
6.根据权利要求5所述的方法,其特征在于,所述计算商品信息的选择权重包括:
根据商品信息被查询到的总次数计算商品信息的选择权重,总次数越大选择权重值越大;或者,
利用商品信息被查询到的总次数确定商品信息的商品权重,总次数越大商品权重值越大,再利用商品信息所属类别的所有商品信息被当前用户查看的总次数确定用户个性化权重,利用商品信息的商品权重与用户个性化权重的乘积确定该商品信息的选择权重。
7.一种基于图像文字识别的商品推送装置,其特征在于,该装置包括:
区域获取单元,用于获取待识别图像中的文字区域;
文字识别单元,用于对所述文字区域进行文字识别;
商品查询单元,用于所述文字识别单元的识别结果查询商品库获得识别结果对应的商品信息;
结果推送单元,用于推送包含所述商品信息的商品查询列表。
8.根据权利要求7所述的装置,其特征在于,所述区域获取单元接收移动终端发送来的待识别图像,从所述待识别图像中提取文字区域;或者,接收移动终端从待识别图像中提取并发送来的文字区域。
9.根据权利要求7所述的装置,其特征在于,所述文字识别单元具体执行:对文字区域进行二值化,对二值化后的文字区域分割为各字块,提取各字块的特征信息并与特征数据库进行匹配,将匹配结果作为各字块的识别结果,按顺序将各字块的识别结果进行组合得到所述文字区域的识别结果。
10.根据权利要求7所述的装置,其特征在于,所述商品库包括一个以上类别的商品库;
所述商品查询单元查询所有商品库;或者,
所述区域获取单元还获取用户选择的个性化选项内容,所述商品查询单元查询所述用户选择的个性化选项内容对应的商品库。
11.根据权利要求10所述的装置,其特征在于,所述商品查询单元在查询商品库获得识别结果对应的商品信息时,具体:
依据商品库的商品信息中文字内容与识别结果之间的语义相似度,计算商品信息的文字匹配权重,将文字匹配权重排在前n1个的商品信息包含在商品查询列表中,n1为预设的正整数;或者,
依据商品库的商品信息中文字内容与识别结果之间的语义相似度,计算商品信息的文字匹配权重,以及依据所述待识别图像与商品库的商品信息中图像之间的相似度计算商品信息的图像匹配权重,结合文字匹配权重和图像匹配权重计算商品信息对应的查询权重,将查询权重排在前n2个的商品信息包含在商品查询列表中,n2为预设的正整数;或者,
依据商品库的商品信息中文字内容与识别结果之间的语义相似度,计算商品信息的文字匹配权重,以及依据所述待识别图像与商品库的商品信息中图像之间的相似度计算商品信息的图像匹配权重,结合文字匹配权重和图像匹配权重计算商品信息对应的查询权重,基于商品信息的被查询状况计算商品信息的选择权重,结合所述查询权重和选择权重计算商品信息的总权重,将总权重值排在前n3个的商品信息生成商品查询列表,n3为预设的正整数。
12.根据权利要求11所述的装置,其特征在于,所述商品查询单元在计算商品信息的选择权重时,具体:
根据商品信息被查询到的总次数计算商品信息的选择权重,总次数越大选择权重值越大;或者,
利用商品信息被查询到的总次数确定商品信息的商品权重,总次数越大商品权重值越大,再利用商品信息所属类别的所有商品信息被当前用户查看的总次数确定用户个性化权重,利用商品信息的商品权重与用户个性化权重的乘积确定该商品信息的选择权重。
CN2012102793672A 2012-08-07 2012-08-07 一种基于图像文字识别的商品推送方法和装置 Pending CN102831200A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012102793672A CN102831200A (zh) 2012-08-07 2012-08-07 一种基于图像文字识别的商品推送方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012102793672A CN102831200A (zh) 2012-08-07 2012-08-07 一种基于图像文字识别的商品推送方法和装置

Publications (1)

Publication Number Publication Date
CN102831200A true CN102831200A (zh) 2012-12-19

Family

ID=47334337

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012102793672A Pending CN102831200A (zh) 2012-08-07 2012-08-07 一种基于图像文字识别的商品推送方法和装置

Country Status (1)

Country Link
CN (1) CN102831200A (zh)

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103064936A (zh) * 2012-12-24 2013-04-24 北京百度网讯科技有限公司 一种基于语音输入的图像信息提取分析方法及装置
CN103294779A (zh) * 2013-05-13 2013-09-11 北京百度网讯科技有限公司 对象信息获取方法及设备
CN103412938A (zh) * 2013-08-22 2013-11-27 成都数之联科技有限公司 一种基于图片交互式多目标提取的商品比价方法
CN104008388A (zh) * 2014-06-06 2014-08-27 杨军辉 通过识别产品标识获取商家业务数据的方法及系统
CN104240096A (zh) * 2014-08-27 2014-12-24 小米科技有限责任公司 信息显示方法及装置、电子设备
CN104268168A (zh) * 2014-09-10 2015-01-07 百度在线网络技术(北京)有限公司 一种向用户推送信息的方法与装置
CN105095446A (zh) * 2015-07-24 2015-11-25 百度在线网络技术(北京)有限公司 药品的搜索处理方法、服务器及终端设备
CN105321146A (zh) * 2015-09-25 2016-02-10 广东小天才科技有限公司 一种处理移动终端拍摄的题目图片的方法及装置
CN105426462A (zh) * 2015-11-13 2016-03-23 深圳码隆科技有限公司 一种基于图像元素的图像搜索方法和装置
CN105447708A (zh) * 2014-08-28 2016-03-30 阿里巴巴集团控股有限公司 一种信息提供方法及装置
CN105653733A (zh) * 2016-02-26 2016-06-08 百度在线网络技术(北京)有限公司 搜索方法和装置
CN105912642A (zh) * 2016-04-08 2016-08-31 世纪禾光科技发展(北京)有限公司 产品价格数据采集方法及系统
CN106126755A (zh) * 2016-08-24 2016-11-16 广东华邦云计算股份有限公司 一种基于图像识别的购物方法
CN106294527A (zh) * 2015-06-26 2017-01-04 阿里巴巴集团控股有限公司 一种信息推荐方法和设备
CN106708823A (zh) * 2015-07-20 2017-05-24 阿里巴巴集团控股有限公司 一种搜索处理方法、装置及系统
CN107292642A (zh) * 2016-03-31 2017-10-24 苏宁云商集团股份有限公司 一种基于图像的商品推荐方法及系统
CN107291352A (zh) * 2017-06-20 2017-10-24 广州阿里巴巴文学信息技术有限公司 一种文字阅读中应用程序跳转的方法及其装置
CN107330391A (zh) * 2017-06-26 2017-11-07 北京小米移动软件有限公司 产品信息提示方法及装置
CN107580047A (zh) * 2017-08-31 2018-01-12 广东美的制冷设备有限公司 设备推送方法、电子设备和计算机可读存储介质
CN107798070A (zh) * 2017-09-26 2018-03-13 平安普惠企业管理有限公司 一种网页数据获取方法及终端设备
CN108804978A (zh) * 2017-04-28 2018-11-13 腾讯科技(深圳)有限公司 一种版面分析方法及装置
CN109429077A (zh) * 2017-08-24 2019-03-05 北京搜狗科技发展有限公司 视频处理方法和装置、用于视频处理的装置
CN110858233A (zh) * 2018-08-17 2020-03-03 珠海格力电器股份有限公司 一种基于图像理解的移动终端信息推荐系统及其方法
CN111258409A (zh) * 2020-05-06 2020-06-09 北京深光科技有限公司 一种用于人机交互的特征点识别方法及设备
CN112801737A (zh) * 2021-01-27 2021-05-14 广州微框物联科技有限公司 一种智能镜子的口红导购方法及装置
CN113724030A (zh) * 2020-07-23 2021-11-30 景德镇陶瓷大学 一种物品在线定制的方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101000623A (zh) * 2007-01-08 2007-07-18 深圳市宜搜科技发展有限公司 通过手机拍照进行图像识别搜索的方法及采用该方法的装置
CN101044494A (zh) * 2004-10-20 2007-09-26 摩托罗拉公司 用于可视文本解释的电子装置和方法
CN101136096A (zh) * 2006-08-31 2008-03-05 林�智 一种网上服饰评价与搭配系统及方法
US20080059526A1 (en) * 2006-09-01 2008-03-06 Sony Corporation Playback apparatus, searching method, and program
CN101414307A (zh) * 2008-11-26 2009-04-22 阿里巴巴集团控股有限公司 提供图片搜索的方法和服务器
CN101751566A (zh) * 2008-12-12 2010-06-23 汉王科技股份有限公司 一种基于手持设备的菜谱识别及注解方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101044494A (zh) * 2004-10-20 2007-09-26 摩托罗拉公司 用于可视文本解释的电子装置和方法
CN101136096A (zh) * 2006-08-31 2008-03-05 林�智 一种网上服饰评价与搭配系统及方法
US20080059526A1 (en) * 2006-09-01 2008-03-06 Sony Corporation Playback apparatus, searching method, and program
CN101000623A (zh) * 2007-01-08 2007-07-18 深圳市宜搜科技发展有限公司 通过手机拍照进行图像识别搜索的方法及采用该方法的装置
CN101414307A (zh) * 2008-11-26 2009-04-22 阿里巴巴集团控股有限公司 提供图片搜索的方法和服务器
CN101751566A (zh) * 2008-12-12 2010-06-23 汉王科技股份有限公司 一种基于手持设备的菜谱识别及注解方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
唐一之: "《无形的市场——知识本体与网络消费研究(2009年1月第1版)》", 31 January 2009, 湖南师范大学出版社 *

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103064936B (zh) * 2012-12-24 2018-03-30 北京百度网讯科技有限公司 一种基于语音输入的图像信息提取分析方法及装置
CN103064936A (zh) * 2012-12-24 2013-04-24 北京百度网讯科技有限公司 一种基于语音输入的图像信息提取分析方法及装置
CN103294779A (zh) * 2013-05-13 2013-09-11 北京百度网讯科技有限公司 对象信息获取方法及设备
CN103412938A (zh) * 2013-08-22 2013-11-27 成都数之联科技有限公司 一种基于图片交互式多目标提取的商品比价方法
CN103412938B (zh) * 2013-08-22 2016-06-29 成都数之联科技有限公司 一种基于图片交互式多目标提取的商品比价方法
CN104008388A (zh) * 2014-06-06 2014-08-27 杨军辉 通过识别产品标识获取商家业务数据的方法及系统
CN104240096A (zh) * 2014-08-27 2014-12-24 小米科技有限责任公司 信息显示方法及装置、电子设备
CN105447708A (zh) * 2014-08-28 2016-03-30 阿里巴巴集团控股有限公司 一种信息提供方法及装置
CN104268168A (zh) * 2014-09-10 2015-01-07 百度在线网络技术(北京)有限公司 一种向用户推送信息的方法与装置
CN106294527A (zh) * 2015-06-26 2017-01-04 阿里巴巴集团控股有限公司 一种信息推荐方法和设备
CN106708823A (zh) * 2015-07-20 2017-05-24 阿里巴巴集团控股有限公司 一种搜索处理方法、装置及系统
CN105095446A (zh) * 2015-07-24 2015-11-25 百度在线网络技术(北京)有限公司 药品的搜索处理方法、服务器及终端设备
CN105321146A (zh) * 2015-09-25 2016-02-10 广东小天才科技有限公司 一种处理移动终端拍摄的题目图片的方法及装置
CN105426462A (zh) * 2015-11-13 2016-03-23 深圳码隆科技有限公司 一种基于图像元素的图像搜索方法和装置
CN105653733A (zh) * 2016-02-26 2016-06-08 百度在线网络技术(北京)有限公司 搜索方法和装置
CN107292642A (zh) * 2016-03-31 2017-10-24 苏宁云商集团股份有限公司 一种基于图像的商品推荐方法及系统
CN105912642A (zh) * 2016-04-08 2016-08-31 世纪禾光科技发展(北京)有限公司 产品价格数据采集方法及系统
CN106126755A (zh) * 2016-08-24 2016-11-16 广东华邦云计算股份有限公司 一种基于图像识别的购物方法
CN108804978B (zh) * 2017-04-28 2022-04-12 腾讯科技(深圳)有限公司 一种版面分析方法及装置
CN108804978A (zh) * 2017-04-28 2018-11-13 腾讯科技(深圳)有限公司 一种版面分析方法及装置
CN107291352A (zh) * 2017-06-20 2017-10-24 广州阿里巴巴文学信息技术有限公司 一种文字阅读中应用程序跳转的方法及其装置
CN107330391A (zh) * 2017-06-26 2017-11-07 北京小米移动软件有限公司 产品信息提示方法及装置
CN109429077A (zh) * 2017-08-24 2019-03-05 北京搜狗科技发展有限公司 视频处理方法和装置、用于视频处理的装置
CN107580047A (zh) * 2017-08-31 2018-01-12 广东美的制冷设备有限公司 设备推送方法、电子设备和计算机可读存储介质
WO2019041595A1 (zh) * 2017-08-31 2019-03-07 广东美的制冷设备有限公司 设备推送方法、电子设备和计算机可读存储介质
CN107798070A (zh) * 2017-09-26 2018-03-13 平安普惠企业管理有限公司 一种网页数据获取方法及终端设备
CN110858233A (zh) * 2018-08-17 2020-03-03 珠海格力电器股份有限公司 一种基于图像理解的移动终端信息推荐系统及其方法
CN111258409A (zh) * 2020-05-06 2020-06-09 北京深光科技有限公司 一种用于人机交互的特征点识别方法及设备
CN113724030A (zh) * 2020-07-23 2021-11-30 景德镇陶瓷大学 一种物品在线定制的方法及系统
CN112801737A (zh) * 2021-01-27 2021-05-14 广州微框物联科技有限公司 一种智能镜子的口红导购方法及装置

Similar Documents

Publication Publication Date Title
CN102831200A (zh) 一种基于图像文字识别的商品推送方法和装置
CN102855480A (zh) 一种图像文字识别方法和装置
EP2585979B1 (en) Method and system for fast and robust identification of specific products in images
CN101620680B (zh) 字符图像的识别和翻译方法以及装置
CN110110577B (zh) 识别菜名的方法及装置、存储介质、电子装置
WO2020005731A1 (en) Text entity detection and recognition from images
KR20130142191A (ko) 비주얼 탐색을 위한 강건한 특징 매칭
US8254678B2 (en) Image segmentation
CN112738556A (zh) 视频处理方法及装置
CN104991954A (zh) 基于图像搜索的购物搜索系统及其实现方法
CN111460888B (zh) 基于机器学习的物品识别方法及装置
CN107133854A (zh) 信息推荐方法和装置
CN111767420B (zh) 一种生成服饰搭配数据的方法和装置
WO2006122164A2 (en) System and method for enabling the use of captured images through recognition
CN108984576A (zh) 一种基于卷积神经网络的专利文献获取方法及系统
CN111177450A (zh) 一种图像检索云识别方法、系统及计算机可读存储介质
US9910864B2 (en) Method for object recognition, corresponding system, apparatus and computer program product
CN110674388A (zh) 推送项目的配图方法、装置、存储介质和终端设备
CN108875828A (zh) 一种相似图像的快速匹配方法和系统
CN113657273B (zh) 确定商品信息的方法、装置、电子设备及介质
Hwang et al. Enabling product recognition and tracking based on text detection for mobile augmented reality
KR101910825B1 (ko) 이미지 검색 모델을 제공하는 방법, 장치, 시스템 및 컴퓨터 프로그램
CN113495987B (zh) 数据搜索方法、装置、设备和存储介质
CN113705209A (zh) 一种副标题的生成方法、装置、电子设备和存储介质
CN114117110A (zh) 商品数据的处理方法、装置、存储介质和处理器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20121219