[go: up one dir, main page]

CN103617422A - 一种基于名片识别的社交关系管理方法 - Google Patents

一种基于名片识别的社交关系管理方法 Download PDF

Info

Publication number
CN103617422A
CN103617422A CN201310521182.2A CN201310521182A CN103617422A CN 103617422 A CN103617422 A CN 103617422A CN 201310521182 A CN201310521182 A CN 201310521182A CN 103617422 A CN103617422 A CN 103617422A
Authority
CN
China
Prior art keywords
contact person
address
node
user
business card
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310521182.2A
Other languages
English (en)
Other versions
CN103617422B (zh
Inventor
高飞
梅凯城
张元鸣
胡伟江
陆佳炜
卢书芳
李泽界
胡小燕
张雪君
肖刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201310521182.2A priority Critical patent/CN103617422B/zh
Publication of CN103617422A publication Critical patent/CN103617422A/zh
Application granted granted Critical
Publication of CN103617422B publication Critical patent/CN103617422B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

一种基于名片识别的社交关系管理方法,包括以下四个步骤:步骤1、录入名片信息,利用摄像头或扫描仪进行名片图像采集,根据名片图像的特征划分出文字块并利用OCR引擎进行字符识别,根据关键字段进行分词处理,对提取的信息归类录入,将其填入相应的表单,最后与用户进行交互,对可能存在的无法识别信息进行人工确认与调整;步骤2、建立社交关系网络;步骤3、实现智能检索;步骤4、完成移动终端同步。

Description

一种基于名片识别的社交关系管理方法
技术领域
本发明涉及将名片信息快速录入计算机以及由名片所形成的社交关系的管理方法。
背景技术
经济的迅猛发展促使人际交往日益频繁,一张小小的名片,承载着的实际上是资源,是商机,甚至可以说是效益。
虽然时下的手机、PDA(Personal Digital Assistant)、平板电脑、笔记本甚至台式PC都可安装相应的名片管理系统,但这些系统所采用的管理方法没能很好地解决一个最根本、也是最重要的问题,即社交关系管理——由大量的联系人而产生的复杂人际关系,常常让人无法以最快的速度找到想要合作或寻求帮助的合适人选。
目前主流的名片管理方法都采用分组的方式进行名片分类。例如,将联系人按“朋友”、“客户”、“同事”、“领导”等关键词分组。这种分组管理方式局限于传统的习惯,不仅不直观,而且无法基于人际关系来提供一条合适的联系途径,只能针对“人”而不能针对“事”。在人际关系中,常常存在着一种情况,某个人有过一面之缘,并不熟悉,其姓名或手机号码或工作单位等信息只是知道其中片断信息,比如只知道他(她)在市一医院工作,但其他信息却难以记住,当“我”的通讯录里有上千名联系人时,很难查找到这位联系人,因此,有必要提供更智能化的方法进行管理。一面之缘的朋友通常发生在某种特点场合,或与一个与自己关系更亲密的朋友有关,或者是由该朋友介绍,因此,通过某种智能化查询可以顺藤摸瓜,找到该位朋友。比如:用户现在想要去医院看病,希望联系到一个医院。但是按照传统的方式,他只能先定位一个合适的分组,再一个个查看有没有医生朋友,无法实现模糊的定位。而更为常见的情况是:用户有一个医生朋友的名片,却与其不熟,需要一个或多个朋友的引荐。这时,传统的分组管理方式就无法提供一条合适的引荐途径,而需要用户花费大量时间去思考、整理。而人工的整理往往是不全面的,所能想到的引荐途径也不一定是最合适的。这也是大量用户最为头疼的问题,也是目前的各种名片与社交关系管理方法无法解决的问题。此外,对于自己的朋友圈子与自己的亲密程度通过传统名片与社交关系管理方法也无法给出,因此难以开展高效的社交活动。
归结起来,本发明重点解决了三方面的创新问题:(1)基于计算机视觉技术以及语义分词方法解决了名片信息的快速录入;(2)社交关系的智能定位及最优的引荐途径;(3)移动终端与系统数据库之间的智能同步。
发明内容
本发明克服了目前采用的名片与社交关系管理方法存在的上述问题,实现了基于计算机视觉的名片信息自动录入以及社交关系的智能定位,节省了用户人工考虑的时间,并能提供一条最合适的联系渠道与引荐途径,给出最优、最可靠的联系方案。
本发明解决其技术问题所采用的技术方案包括四个步骤:
步骤1.录入名片信息
利用摄像头或扫描仪进行名片图像采集,根据名片图像的特征划分出文字块并利用OCR引擎进行字符识别,根据关键字段进行分词处理,对提取的信息归类录入,将其填入相应的表单,最后与用户进行交互,对可能存在的无法识别信息进行人工确认与调整。所述流程应包含如下操作:
1.1、灰度化。首先对摄像头或扫描仪采集的名片图像采用加权平均法进行灰度化:
f(i,j)=0.30R(i,j)+0.59G(i,j)+0.11B(i,j)
其中(i,j)表示像素坐标,彩色图像中红、绿、蓝三个分量分别为R(i,j)、G(i,j)、B(i,j),f(i,j)则为该点的灰度值。
1.2、边缘提取。结合Sobel算子与LOG(Laplacian of Gauss)算子,形成修正LOG算法,即选取下列Sobel算子(Sx为水平方向的中心分差,Sy为垂直方向的中心分差,选取其中较大值作为梯度S)
S x = - 1 0 1 - 2 0 2 - 1 0 1 , S y = - 1 - 2 - 1 0 0 0 1 2 1 , S = max { | S x | , | S y | }
作为边缘检测的前提条件,减少多余的零交叉点。再利用如下函数作为滤波器,进行LOG检测。
LOG ( i , j ) = ( ∂ 2 ∂ x 2 + ∂ 2 ∂ y 2 ) 1 2 πσ
LOG算子模板如下
LOG = - 2 - 4 - 4 - 4 - 2 - 4 0 8 0 - 4 - 4 8 24 8 - 4 - 4 0 8 0 - 4 - 2 - 4 - 4 - 4 - 2
其中的LOG算子模板为LOG的数字形式,将其作为内核对图像做卷积,σ为高斯分布的均方差。
1.3、二值化。计算阈值,并对灰度图进行二值化。若灰度图高为h,宽为w,由下式求得阈值,即灰度平均值Threshold:
Threshold = Σ i ∈ [ 0 , w - 1 ] , j ∈ [ 0 , h - 1 ] f ( i , j ) h × w
再根据阈值Threshold进行二值化:
B ( i , j ) = 1 iff ( i , j ) &GreaterEqual; Threshold 0 iff ( i , j ) < Threshold
1.4、倾斜检测与矫正。通过霍夫变换(Hough Transform)检测名片框的边缘线,获得名片区域并判断出名片的倾斜角度进行矫正。
由于y=kx+b形式的直线方程无法表示x=c形式的直线(c为常数,即与x轴平行的直线,斜率k→∞)。故这里采用参数方程ρ=x*cosθ+y*sinθ,其中通过选取p1(x1,y1),p2(x2,y2)两监测点,由下式可以得到倾斜角θ:
&theta; = arctan y 2 - y 1 x 2 - x 1 if x 2 &NotEqual; x 1 &pi; 2 if x 2 = x 1 and y 2 > y 1 - &pi; 2 if x 2 = x 1 and y 2 < y 1
根据倾斜角θ对原图与二值图像同时进行仿射变换(使用齐次矩阵表示),P'=P·R,将-θ代入2D旋转矩阵得到矫正矩阵 R = cos &theta; sin &theta; 0 - sin &theta; cos &theta; 0 0 0 1 , P &prime; = x &prime; y &prime; 1 由点 P = x y 1 矫正后得到。具体运算如下:
x'=xcosθ+ysinθ
y'=-xsinθ+ycosθ
1.5、图像分割。根据名片图像的特征划分出文字块。包括步骤如下:
1.5.1、定义探测密度Density,为当前像素上下左右及斜对角线共8个方向上的相邻像素中黑色像素的数量,计算公式如下:
Density = Density + 1 ifB ( i , j ) = 1 Density ifB ( i , j ) = 0
其中i∈[x-1,x+1]∩N*,j∈[y-1,y+1]∩N*,(x,y)为当前探测点坐标,N*为正整数集。
1.5.2、将名片区域的图像转化为密度矩阵,去掉余下噪点。操作方法如下:逐个判断各个像素的密度,当Density<2时,对应矩阵元素记为0,即当作噪声处理。当Density>=2时,对应矩阵元素记为1,表明该像素为文字块一部分。
1.5.3、通过转换公式 d ( i , j ) = 1 ifDensity ( i , j ) &GreaterEqual; 2 0 ifDensity ( i , j ) < 2 将矫正后的二值单色图转化为如下的二维数组形式:
d ( 0,0 ) &CenterDot; &CenterDot; &CenterDot; d ( w , 0 ) &CenterDot; &CenterDot; &CenterDot; d ( i , j ) &CenterDot; &CenterDot; &CenterDot; d ( 0 , h ) &CenterDot; &CenterDot; &CenterDot; d ( w , h )
1.5.4、根据密度矩阵,定位文字块区域(至此有两种策略分别应用于快速识别模式与精准识别模式),然后依据区域对名片图像进行分割。
快速识别策略:逐行判断密度矩阵,每一行内“1”元素占单元个数的比例超过一定阈值,则视为文本行,低于此阈值则视为空白。
精准识别策略:逐行判断密度矩阵,将行内连续的“0”元素连结成“探测线”,根据“探测线”起始端的深浅、长度差异与末端位置特征判断是否为文本区域。即去除长度小于阈值的探测线;然后标记出第一条探测线的末端与第二条探测线的始端;对所有行进行探测与标记后,由标记围成的区域即文本区域。
1.5.5、定义Ri∈{d(i,y)|y∈[0,h]∩N*},当且仅当
Figure BDA0000403990670000052
时记录下j值。最后所得的一组区域[j1,j2],[j2,j3],[j3,j4]…即若干文字块,其中h表示行数,w表示列数,N*为正整数集,Ri为步骤3的二维数组中第i行的元素,Sumj为Ri所在行所有元素之和。
1.6、字符识别。利用OCR(Optical Character Recognition)技术提取出每一个文字块的信息。这里采用MODI(Microsoft Office Document Imaging)的OCR模块对分割出的图像逐一进行识别,将每一文字块图像都变成一组文字。即对文字块[j1,j2],[j2,j3],[j3,j4]…逐一调用OCR识别引擎,得到与每个区域对应的字符集C1,2,C2,3,C3,4…。
1.7、分词处理。根据关键字段进行分词处理,对提取的信息归类录入。这需要建立关键词库以及语义库,例如:公司、职位、地址、联系电话、email、路、号等等。定义关键字集合W={公司,职位,地址,联系电话,email,…}并定义关键字语义库,例如Address、Addr、通讯地址、联系地址等均为地址的近义词,即在语义上是一致的,建立对应的映射关系,形成语义库。
根据关键词,基于上下文特征,提取出每组文字中的对应信息,填入相应表单,完成分词处理。具体步骤如下:
1.7.1、寻找“:”分隔符,利用分隔符界定关键词与内容。如果界定出的关键词不在关键字集合中则交由用户决定是否将其视为关键词收录到集合中。通过此步骤实现分词策略的学习功能。
1.7.2、然后匹配出关键字Key=Cx,y∩W,将字符串
Figure BDA0000403990670000054
填入名为Key的表单项中。当
Figure BDA0000403990670000053
时,将字符集Cx,y填入“未分类”表单项。
基于语义库的策略包括:
定位姓名策略(中文):排除其他语义,字符数在2~4之间,跟随有职位、头衔,或带有“姓名”类标签;
定位手机号码策略:以13、15、18开头的11位纯数字字符串,或带有“手机”类标签;
定位电话号码策略:7~8位纯数字字符串,或以区号开头,包含括号、连字符、空格等分隔符,或带有“电话”类标签;
定位公司名称策略:排除其他语义,出现“公司”、“集团”、各机关单位关键词,或带有“公司”类标签;
定位地址策略:出现“省”、“市”、“县”、“乡”、“镇”、“路”、“区”、“幢”、“单位”、“室”与数字混合的字符串,或带有“地址”类标签;
定位邮编策略:6位纯数字字符串,或带有“邮编”类标签;
定位邮箱策略:出现数字、字母、“”、“.”字符,或带有“邮箱”类标签;
定位网址策略:出现“http”、“.”、“www”、“com”、“cn”、“edu”字符,或带有“网址”类标签。
1.8、人工校正。分词完成后,需与用户进行交互,对可能存在的无法识别信息进行人工确认与调整,即对“未分类”表单项进行人工分类,分类过程结束后,将自动学习进入语义库。
步骤2.建立社交关系网络
其步骤如下:
2.1、通过用鼠标移动联系人结点来建立两个联系人的关系。将新加入的结点Aj附加到已有结点Ai(即要建立关系的联系人)上,确定操作双方后利用连线的形式表示两个联系人之间建立的关系Li,j,它表示Ai与Aj彼此互相认识(双向)。
2.1.1(可选)、如果新建立的联系人结点Ai是用户O(即“我”)的第一接触人,则将新结点Ai连接到用户结点O上建立联系线路OAi,其关系为L0,i
2.1.2(可选)、如果新建立的联系人结点Aj是用户O通过朋友Ai得知了此联系人,且对方并不认识用户O的情况下,则将新结点Aj连接到用户朋友结点Ai上建立联系线路AiAj,其关系为Li,j
2.1.3(可选)、如果原先是用户O通过朋友Ai得知的联系人Aj与用户朋友Ai是第一接触人(单向),而在进一步的合作交流后,用户O与该联系人Aj成为了第一接触人(双向),则将该联系人结点Aj连接到用户结点O上,形成与用户结点直接的联系路径OAj,其关系为L0,j
2.2、对于每个关系Li,j通过使用权值Ki,j来表示关系的强弱。Li,j的权值Ki,j取决于联系人Ai与联系人Aj的结识时间T(单位:天)以及联系次数Count。具体计算方法如下:
K i , j = 0.5 * T 2 ( 1 + T 2 ) - 1 + Min ( Count T + 8 , 0.5 ) , K i , j &Element; [ 0,1 )
2.3、根据度数D与权值K得出“我”与各联系人的“亲密度”Intimacy。约定用户结点O的度数D0=0通过路径OAi上的关系L0,i相连的结点Ai的度数Di=1+D0;通过路径AiAj上的关系Li,j相连的结点Aj的度数Dj=1+Di。“我”与结点Aj的“亲密度”计算公式为:
Intimacyj=Dj+Ki,j,Di∈N*,Ki,j∈[0,1)
“亲密度”Intimacy的整数部分代表了六度分割中的度数,小数部分将同等度数下的各个关系进一步划分开。因此,“亲密度”能较好的反应出以“我”为中心到各个结点的亲疏关系,其中N*为正整数集。
步骤3.实现智能检索
通过用户输入的检索关键词与已录入的个人信息进行模糊匹配,筛选出可能的目标列表,其具体步骤如下:
3.1、设用户输入的关键词为字符串WORD,其中的元素为Char,名片数据集DATA,若
Figure BDA0000403990670000072
Figure BDA0000403990670000073
则返回其对应的联系人A(Char∩DATA)
3.2、用户从返回的列表中,根据实际需求,选择出具体目标,定位到某一联系人Ai
3.3、根据关系L上的权值K,通过最短路径算法(这里采用Dijkstra算法),得到“我”与目标之间“最有效”的沟通途径,即通过最亲密的(抑或最少的)联系人联系到最需要的联系人。
这里将联系人结点A视作Dijkstra算法中的点集;关系L视作算法中的边集;边的长度为对应K值;用户结点O作为算法中的源。
步骤4.完成移动终端同步
其步骤如下:
4.1、启动服务。PC服务器端要求采用Socket和多线程等相关技术设计服务器程序,它可以是驻留服务程序,即随着操作系统启动而启动,也可以手工启动,启动后将与数据库服务器建立连接,然后自动监听移动终端的请求。
4.2、自动配置IP。当用户点击移动终端的同步客户端程序时,它将从移动终端中的配置文件中读取服务器IP地址、服务器端口号PORT;如果无法连接上PC服务器端,它将智能自动扫描服务器端程序。
一次性IP扫描配置策略:终端加入PC服务器所在网段后,终端程序自动获取其IP地址,根据字符串定位算法获取IP地址前三个区域的数据,利用循环程序自动扫描由0-255与前三个区域数据构成的IP地址(作为可能的PC服务器端程序IP地址),若能连接成功,则将其保存于配置文件中,供下次自动连接服务器使用。
4.3、设置系统。移动终端的系统设置功能技术特征为:当终端程序自动扫描无法连接上PC服务器端程序时,可以交互式地修改IP地址、端口号PORT,同时还可以设置备份和导入时的完全覆盖、差异覆盖两个选项。
4.4、备份移动终端。移动终端的备份功能技术特征为:用户在移动终端上点击备份功能按钮时,当系统设置中的选项为完全覆盖,移动终端程序读取该终端的通讯录中第i个联系人(i=1,2,…,n),然后将第i个联系人通过PC服务器端程序写入到对应的数据库中,若数据库中存在该联系人,则更新数据,若不存在,则插入。如果系统设置中的选项为差异时,移动终端程序读取该终端的通讯录中第i个联系人(i=1,2,…,n),然后将第i个联系人通过PC服务器端程序写入到对应的数据库中,若数据库中存在该联系人,则忽略,若不存在,则插入。
4.5、导入移动终端。移动终端的导入功能技术特征为:用户在移动终端上点击导入功能按钮时,当系统设置中的选项为完全覆盖,PC服务器端程序读取数据库通讯录中第i个联系人(i=1,2,…,n),然后将第i个联系人通过移动终端程序写入到终端的通讯录中,若通讯录中存在该联系人,则更新数据,若不存在,则插入。如果当系统设置中的选项为差异时,PC服务器端程序读取数据库通讯录中第i个联系人(i=1,2,…,n),然后将第i个联系人通过移动终端程序写入到终端的通讯录中,若通讯录中存在该联系人,则忽略,若不存在,则插入。
附图说明
图1是名片录入流程图。
图2是Density取值时,八个相邻像素位置示意图。
图3是Density取值举例。
图4是图3转换的密度矩阵。
图5是名片图像处理算法示意图
图6是名片信息分词处理算法示意图
图7是一种以“我”为中心的社交网络结构示意图。
图8是检索的结果在社交网络上的具体表现效果。
具体实施方式
本发明所采用的技术方案各步骤实施方式如下:
步骤1.录入名片信息
利用摄像头或扫描仪进行名片图像采集,根据名片图像的特征划分出文字块并利用OCR引擎进行字符识别,根据关键字段进行分词处理,对提取的信息归类录入,将其填入相应的表单,最后与用户进行交互,对可能存在的无法识别信息进行人工确认与调整。
整个过程从影像到结果输出,须经过影像输入、影像前处理、文字特征抽取、比对识别、最后经人工校正将认错的文字更正,将结果存入数据库,参照图1。
所述流程应包含如下操作:
1.1、灰度化。首先对摄像头或扫描仪采集的名片图像采用加权平均法进行灰度化。由于人眼对绿色的敏感最高,对蓝色敏感最低,因此,使用下式能得到较合理的灰度图像。
f(i,j)=0.30R(i,j)+0.59G(i,j)+0.11B(i,j)
其中(i,j)表示像素坐标,彩色图像中红、绿、蓝三个分量分别为R(i,j)、G(i,j)、B(i,j),f(i,j)则为该点的灰度值。
1.2、边缘提取。结合Sobel算子与LOG(Laplacian of Gauss)算子,形成修正LOG算法,即选取下列Sobel算子(Sx为水平方向的中心分差,Sy为垂直方向的中心分差,选取其中较大值作为梯度S)
S x = - 1 0 1 - 2 0 2 - 1 0 1 , S y = - 1 - 2 - 1 0 0 0 1 2 1 , S = max { | S x | , | S y | }
作为边缘检测的前提条件,减少多余的零交叉点。再利用如下函数作为滤波器,进行LOG检测。
LOG ( x , y ) = ( &PartialD; 2 &PartialD; x 2 + &PartialD; 2 &PartialD; y 2 ) 1 2 &pi;&sigma;
LOG算子模板如下
LOG = - 2 - 4 - 4 - 4 - 2 - 4 0 8 0 - 4 - 4 8 24 8 - 4 - 4 0 8 0 - 4 - 2 - 4 - 4 - 4 - 2
其中的LOG算子模板为LOG的数字形式,将其作为内核对图像做卷积,σ为高斯分布的均方差。
1.3、二值化。计算阈值,并对灰度图进行二值化。若灰度图高为h,宽为w,由下式求得阈值,即灰度平均值Threshold:
Threshold = &Sigma; i &Element; [ 0 , w - 1 ] , j &Element; [ 0 , h - 1 ] f ( i , j ) h &times; w
再根据阈值Threshold进行二值化:
B ( i , j ) = 1 iff ( i , j ) &GreaterEqual; Threshold 0 iff ( i , j ) < Threshold
1.4、倾斜检测与矫正。通过霍夫变换(Hough Transform)检测名片框的边缘线,获得名片区域并判断出名片的倾斜角度进行矫正。
由于y=kx+b形式的直线方程无法表示x=c形式的直线(c为常数,即与x轴平行的直线,斜率k→∞)。故这里采用参数方程ρ=x*cosθ+y*sinθ,其中通过选取p1(x1,y1),p2(x2,y2)两监测点,由下式可以得到倾斜角θ:
&theta; = arctan y 2 - y 1 x 2 - x 1 if x 2 &NotEqual; x 1 &pi; 2 if x 2 = x 1 and y 2 > y 1 - &pi; 2 if x 2 = x 1 and y 2 < y 1
根据倾斜角θ对原图与二值图像同时进行仿射变换(使用齐次矩阵表示),P'=P·R,将-θ代入2D旋转矩阵得到矫正矩阵 R = cos &theta; sin &theta; 0 - sin &theta; cos &theta; 0 0 0 1 , P &prime; = x &prime; y &prime; 1 由点 P = x y 1 矫正后得到。具体运算如下:
x'=xcosθ+ysinθ
y'=-xsinθ+ycosθ
1.5、图像分割。根据名片图像的特征划分出文字块。包括步骤如下:
1.5.1、定义探测密度Density,为当前像素上下左右及斜对角线共8个方向上的相邻像素中黑色像素的数量,参照图2,计算公式如下:
Density = Density + 1 ifB ( i , j ) = 1 Density ifB ( i , j ) = 0
其中i∈[x-1,x+1]∩N*,j∈[x-1,x+1]∩N*,(x,y)为当前探测点坐标,N*为正整数集。
1.5.2、将名片区域的图像转化为密度矩阵,去掉余下噪点。操作方法如下:逐个判断各个像素的密度,当Density<2时,对应矩阵元素记为0,即当作噪声处理。当Density>=2时,对应矩阵元素记为1,表明该像素为文字块一部分。如图3中,右上标注的像素Density=0;左上标注的像素Density=2,其转化为密度矩阵见图4。
1.5.3、通过转换公式 d ( i , j ) = 1 ifDensity ( i , j ) &GreaterEqual; 2 0 ifDensity ( i , j ) < 2 将矫正后的二值单色图转化为如下的二维数组形式:
d ( 0,0 ) &CenterDot; &CenterDot; &CenterDot; d ( w , 0 ) &CenterDot; &CenterDot; &CenterDot; d ( i , j ) &CenterDot; &CenterDot; &CenterDot; d ( 0 , h ) &CenterDot; &CenterDot; &CenterDot; d ( w , h )
1.5.4、根据密度矩阵,定位文字块区域(此次有两种策略分辨应用于快速识别模式与精准识别模式),然后依据区域对名片图像进行分割。
快速识别策略:逐行判断密度矩阵,每一行内“1”元素占单元个数的比例超过一定阈值,则视为文本行,低于此阈值则视为空白。
精准识别策略:逐行判断密度矩阵,将行内连续的“0”元素连结成“探测线”,根据“探测线”起始端的深浅、长度差异与末端位置特征判断是否为文本区域。即去除长度小于阈值的探测线;然后标记出第一条探测线的末端与第二条探测线的始端;对所有行进行探测与标记后,由标记围成的区域即文本区域。
1.5.5、定义Ri∈{d(i,y)|y∈[0,h]∩N*},
Figure BDA0000403990670000122
当且仅当
Figure BDA0000403990670000123
时记录下j值。最后所得的一组区域[j1,j2],[j2,j3],[j3,j4]…即若干文字块,其中h表示行数,w表示列数,N*为正整数集,Ri为步骤3的二维数组中第i行的元素,Sumj为Ri所在行所有元素之和。
由于中文名片多为横向排版,文字块之间呈垂直分布,故此处仅采用水平分割文字块。若遇到复杂版面样式的名片需要进行垂直分割的话,可按同样方法再细分竖直文字块。
1.6、字符识别。利用OCR(Optical Character Recognition)技术提取出每一个文字块的信息。这里采用MODI(Microsoft Office Document Imaging)的OCR模块对分割出的图像逐一进行识别,将每一文字块图像都变成一组文字。
即对文字块[j1,j2],[j2,j3],[j3,j4]…逐一调用OCR识别引擎,得到与每个区域对应的字符集C1,2,C2,3,C3,4
名片图像处理至此结束,图5简述了此处理过程及所用算法。
1.7、分词处理。根据关键字段进行分词处理,对提取的信息归类录入。这需要建立关键词库以及语义库,例如:公司、职位、地址、联系电话、email、路、号等等。定义关键字集合W={公司,职位,地址,联系电话,email,…}并定义关键字语义库,例如Address、Addr、通讯地址、联系地址等均为地址的近义词,即在语义上是一致的,建立对应的映射关系,形成具有自学习功能的语义库。
然后根据关键词,基于上下文特征,提取出每组文字中的对应信息,填入相应表单,完成分词处理。具体步骤如下:
1.7.1、寻找“:”分隔符,利用分隔符界定关键词与内容。如果界定出的关键词不在关键字集合中则交由用户决定是否将其视为关键词收录到集合中。通过此步骤实现分词策略的自学习功能。
1.7.2、然后匹配出关键字Key=Cx,y∩W,将字符串
Figure BDA0000403990670000132
填入名为Key的表单项中。当
Figure BDA0000403990670000131
时,将字符集Cx,y填入“未分类”表单项。
基于语义库的策略包括:
定位姓名策略(中文):排除其他语义,字符数在2~4之间,跟随有职位、头衔,或带有“姓名”类标签;
定位手机号码策略:以13、15、18开头的11位纯数字字符串,或带有“手机”类标签;
定位电话号码策略:7~8位纯数字字符串,或以区号开头,包含括号、连字符、空格等分隔符,或带有“电话”类标签;
定位公司名称策略:排除其他语义,出现“公司”、“集团”、各机关单位关键词,或带有“公司”类标签;
定位地址策略:出现“省”、“市”、“县”、“乡”、“镇”、“路”、“区”、“幢”、“单位”、“室”与数字混合的字符串,或带有“地址”类标签;
定位邮编策略:6位纯数字字符串,或带有“邮编”类标签;
定位邮箱策略:出现数字、字母、“”、“.”字符,或带有“邮箱”类标签;
定位网址策略:出现“http”、“.”、“www”、“com”、“cn”、“edu”字符,或带有“网址”类标签;
1.8人工校正。分词完成后,需与用户进行交互,对可能存在的无法识别信息进行人工确认与调整,即对“未分类”表单项进行人工分类,分类过程结束后,将自动学习进入语义库。
名片信息分词处理至此结束,图6简述了其处理过程与逻辑。
步骤2.建立社交关系网络
根据社会学中的六度分隔理论,建立一种以“我”为中心的社交网络。
具体表现为基于“我”为出发点O,呈蛛网状向四周辐射的形式,见示意图7。
将联系人与“我”之间的熟悉程度作为依据,同“我”直接相关的联系人Ai通过连线直接连结在“我”的周围,成为同“我”最为密切的第一层联系人。以此类推,将每一层的联系人向与“我”相反的方向OAi辐散。
除此以外,关系的强弱还会由六度理论的度数D决定。1度关系即“我”与我所认识的朋友之间的关系,2度关系即“我”与“我”的朋友所认识的朋友之间的关系,以此类推,可以理解的是:1度关系肯定要比2度关系强。
在此,引入“亲密度”Intimacy的概念来表达“我”与各联系人的熟悉程度。其取决于权值K(表示了关系的强弱)以及六度理论的度数D。这里,将联系人作为结点,并提供可视化的交互工具对联系人进行分组以建立关系网络。建立该网络的步骤如下:
2.1、通过移动联系人结点来建立两个联系人的关系。将新加入的结点Aj附加到已有结点Ai(即要建立关系的联系人)上,确定操作双方后利用连线的形式表示两个联系人之间建立的关系Li,j。本文中出现的所有关系如Li,j,表明Ai与Aj彼此互相认识(双向)。
2.1.1(可选)、如果新建立的联系人结点Ai是用户O(即“我”)的第一接触人,则将新结点Ai连接到用户结点O上建立联系线路OAi,其关系为L0,i
2.1.2(可选)、如果新建立的联系人结点Aj是用户O通过朋友Ai得知了此联系人,且对方并不认识用户O的情况下,则将新结点Aj连接到用户朋友结点Ai上建立联系线路AiAj,其关系为Li,j
2.1.3(可选)、如果原先是用户O通过朋友Ai得知的联系人Aj与用户朋友Ai是第一接触人(单向),而在进一步的合作交流后,用户O与该联系人Aj成为了第一接触人(双向),则将该联系人结点Aj连接到用户结点O上,形成与用户结点直接的联系路径OAj,其关系为L0,j
2.2、对于每个关系L通过使用权值K来表示关系的强弱。Li,j的权值Ki,j取决于联系人Ai与联系人Aj的结识时间T(单位:天)以及联系次数Count。具体计算方法如下:
K i , j = 0.5 * T 2 ( 1 + T 2 ) - 1 + Min ( Count T + 8 , 0.5 ) , K i , j &Element; [ 0,1 )
2.3、根据度数D与权值K得出“我”与各联系人的“亲密度”Intimacy。约定用户结点O的度数D0=0通过路径OAi上的关系L0,i相连的结点Ai的度数Di=1+D0;通过路径AiAj上的关系Li,j相连的结点Aj的度数Dj=1+Di。“我”与结点Aj的“亲密度”计算公式为:
Intimacyj=Dj+Ki,j,Di∈N*,Ki,j∈[0,1)
“亲密度”Intimacy的整数部分代表了六度分割中的度数,小数部分将同等度数下的各个关系进一步划分开,其中N*为正整数集。因此,“亲密度”能较好的反应出以“我”为中心到各个结点的亲疏关系。
步骤3.实现智能检索
通过以“我”为中心的社交网络,智能检索与定位最佳联系途径。
检索的结果通过可视化的社交网络图表现为:将路径上的联系人结点与连线高亮显示,见示意图8。当用户选择高亮结点联系人时,联系人基本信息在结点旁显现。由此,用户可以通过高亮显示的路线查看用户可以查看可以通过哪几位朋友可以联系到所需要的联系人。所述检索流程应实现:
●机器筛选:模糊匹配检索信息,筛选出可能的目标列表。
●人工定位:从目标列表,手动定位目标。
●结果反馈:得到“我”与目标之间“最有效”的沟通途径,即通过最亲密的(抑或最少的)联系人联系到最需要的联系人。
具体实施时,通过用户输入的检索关键词与已录入的个人信息进行模糊匹配,筛选出可能的目标列表,步骤如下:
3.1、设用户输入的关键词为字符串WORD,其中的元素为Char,名片数据集DATA,若
Figure BDA0000403990670000151
满足
Figure BDA0000403990670000152
则返回其对应的联系人A(Char∩DATA)
3.2、用户从返回的列表中,根据实际需求,选择出具体目标,定位到某一联系人Ai
3.3、根据关系L上的权值K,通过最短路径算法(这里采用Dijkstra算法),得到“我”与目标之间“最有效”的沟通途径,即通过最亲密的(抑或最少的)联系人联系到最需要的联系人。
将联系人结点A视作Dijkstra算法中的点集;关系L视作算法中的边集;边的长度为对应K值;用户结点O作为算法中的源。
步骤4.完成移动终端同步
此步骤将实现数据库中的名片信息与移动终端平台如Android、iOS等手机的通讯录之间的智能同步。具体实施时,应完成如下步骤:
4.1、启动服务。PC服务器端要求采用Socket和多线程等相关技术设计服务器程序,它可以是驻留服务程序,即随着操作系统启动而启动,也可以手工启动,启动后将与数据库服务器建立连接,然后自动监听移动终端的请求。
4.2、自动配置IP。当用户点击移动终端的同步客户端程序时,它将从移动终端中的配置文件中读取服务器IP地址、服务器端口号PORT;如果无法连接上PC服务器端,它将自动扫描服务器端程序。
一次性IP扫描配置策略:终端加入PC服务器所在网段后,终端程序自动获取其IP地址,根据字符串定位算法获取IP地址前三个区域的数据,利用循环程序自动扫描由0-255与前三个区域数据构成的IP地址(作为可能的PC服务器端程序IP地址),若能连接成功,则将其保存于配置文件中,供下次自动连接服务器使用。
4.3、设置系统。移动终端的系统设置功能技术特征为:当终端程序自动扫描无法连接上PC服务器端程序时,可以交互式地修改IP地址、端口号PORT,同时还可以设置备份和导入时的完全覆盖、差异两个选项。
4.4、备份移动终端。移动终端的备份功能技术特征为:用户在移动终端上点击备份功能按钮时,当系统设置中的选项为完全覆盖,移动终端程序读取该终端的通讯录中第i个联系人(i=1,2,…,n),然后将第i个联系人通过PC服务器端程序写入到对应的数据库中,若数据库中存在该联系人,则更新数据,若不存在,则插入。如果当系统设置中的选项为差异时,移动终端程序读取该终端的通讯录中第i个联系人(i=1,2,…,n),然后将第i个联系人通过PC服务器端程序写入到对应的数据库中,若数据库中存在该联系人,则忽略,若不存在,则插入。
4.5、导入移动终端。移动终端的导入功能技术特征为:用户在移动终端上点击导入功能按钮时,当系统设置中的选项为完全覆盖,PC服务器端程序读取数据库通讯录中第i个联系人(i=1,2,…,n),然后将第i个联系人通过移动终端程序写入到终端的通讯录中,若通讯录中存在该联系人,则更新数据,若不存在,则插入。如果当系统设置中的选项为差异时,PC服务器端程序读取数据库通讯录中第i个联系人(i=1,2,…,n),然后将第i个联系人通过移动终端程序写入到终端的通讯录中,若通讯录中存在该联系人,则忽略,若不存在,则插入。

Claims (6)

1.一种基于名片识别的社交关系管理方法,包括以下四个步骤: 
步骤1、录入名片信息,利用摄像头或扫描仪进行名片图像采集,根据名片图像的特征划分出文字块并利用OCR引擎进行字符识别,根据关键字段进行分词处理,对提取的信息归类录入,将其填入相应的表单,最后与用户进行交互,对可能存在的无法识别信息进行人工确认与调整; 
步骤2、建立社交关系网络; 
步骤3、实现智能检索; 
步骤4、完成移动终端同步。 
2.如权利要求1所述的一种基于名片识别的社交关系管理方法,其特征在于:, 
步骤1)中根据名片图像的特征划分文字块并利用OCR引擎进行字符识别的的具体步骤如下: 
1.1、灰度化。首先对摄像头或扫描仪采集的名片图像采用加权平均法进行灰度化。由于人眼对绿色的敏感最高,对蓝色敏感最低,因此使用f(i,j)=0.30R(i,j)+0.59G(i,j)+0.11B(i,j)能得到较合理的灰度图像。其中(i,j)表示像素坐标,彩色图像中红、绿、蓝三个分量分别为R(i,j)、G(i,j)、B(i,j),f(i,j)则为该点的灰度值; 
1.2、边缘提取。结合Sobel算子与LOG(Laplacian of Gauss)算子,形成修正LOG算法,即选取下列Sobel算子(Sx为水平方向的中心分差,Sy为垂直方向的中心分差,选取其中较大值作为梯度S)
Figure FDA0000403990660000012
S=max{|Sx|,|Sy|}作为边缘检测的前提条件,减少多余的零交叉点。再利用
Figure FDA0000403990660000013
此函数作为滤波器,进行LOG检测。 LOG算子模板为
Figure FDA0000403990660000021
它是LOG的数字形式,将其作为内核对图像做卷积。σ为高斯分布的均方差; 
1.3、二值化。计算出阈值对灰度图进行二值化。若灰度图高为h,宽为w,求得阈值,即灰度平均值
Figure FDA0000403990660000022
再根据阈值Threshold进行二值化:
Figure FDA0000403990660000023
1.4、倾斜检测与矫正。通过霍夫变换(Hough Transform)检测名片框的边缘线,获得名片区域并判断出名片的倾斜角度进行矫正。由于y=kx+b形式的直线方程无法表示x=c形式的直线(c为常数,即与x轴平行的直线,斜率k→∞)。故这里采用参数方程ρ=x*cosθ+y*sinθ,其中通过选取p1(x1,y1),p2(x2,y2)两监测点,可以得到倾斜角
Figure FDA0000403990660000024
根据倾斜角θ对原图与二值图像同时进行仿射变换(使用齐次矩阵表示),P'=P·R,将-θ代入2D旋转矩阵得到矫正矩阵
Figure FDA0000403990660000025
Figure FDA0000403990660000026
由点
Figure FDA0000403990660000027
矫正后得到。具体运算为:
Figure FDA0000403990660000028
1.5、图像分割。根据名片图像的特征划分出文字块。包括步骤如下: 
1.5.1、定义探测密度Density,为当前像素上下左右及斜对角线共8个方向上的相邻像素中黑色像素的数量,计算公式为:
Figure FDA0000403990660000029
 其中i∈[x-1,x+1]∩N*,j∈[x-1,x+1]∩N*,(x,y)为当前探测点坐标,N*为正整数集; 
1.5.2、将名片区域的图像转化为密度矩阵,去掉余下噪点。操作方法如下:逐个判断各个像素的密度,当Density<2时,对应矩阵元素记为0,即当作噪声处理。当Density>=2时,对应矩阵元素记为1,表明该像素为文字块一部分; 
1.5.3、通过转换公式
Figure FDA0000403990660000031
将矫正后的二值单色图转化为以下的二维数组形式:
Figure FDA0000403990660000032
1.5.4、根据密度矩阵,定位文字块区域(此次有两种策略分辨应用于快速识别模式与精准识别模式),然后依据区域对名片图像进行分割。快速识别策略:逐行判断密度矩阵,每一行内“1”元素占单元个数的比例超过一定阈值,则视为文本行,低于此阈值则视为空白。精准识别策略:逐行判断密度矩阵,将行内连续的“0”元素连结成“探测线”,根据“探测线”起始端的深浅、长度差异与末端位置特征判断是否为文本区域。即去除长度小于阈值的探测线;然后标记出第一条探测线的末端与第二条探测线的始端;对所有行进行探测与标记后,由标记围成的区域即文本区域; 
1.5.5、定义Ri∈{d(i,y)|y∈[0,h]∩N*},
Figure FDA0000403990660000033
当且仅当 
Figure FDA0000403990660000034
时记录下j值。最后所得的一组区域[j1,j2],[j2,j3],[j3,j4]…即若干文字块,其中h表示行数,w表示列数,N*为正整数集,Ri为步骤3的二维数组中第i行的元素,Sumj为Ri所在行所有元素之和。 
1.6、字符识别。利用OCR(Optical Character Recognition)技术提取出每一个文字块的信息。这里采用MODI(Microsoft Office Document Imaging)的OCR模块对分割出的图像逐一进行识别,将每一文字块图像都变成一组文字。即对文字块[j1,j2],[j2,j3],[j3,j4]…逐一调用OCR识别引擎,得到与每个区域对应的字符集C1,2,C2,3,C3,4…。 
3.如权利要求1所述的一种基于名片识别的社交关系管理方法,其特征在于: 
步骤1)中根据关键字段进行分词处理的具体步骤如下: 
1.7、分词处理。根据关键字段进行分词处理,对提取的信息归类录入。这首先需要建立关键词库以及语义库,例如:公司、职位、地址、联系电话、email、路、号等等。定义关键字集合W={公司,职位,地址,联系电话,email,…}并定义关键字语义库,例如Address、Addr、通讯地址、联系地址等均为地址的近义词,即在语义上是一致的,建立对应的映射关系,形成语义库。然后根据关键词,基于上下文特征,提取出每组文字中的对应信息,填入相应表单,完成分词处理。具体步骤如下: 
1.7.1、寻找“:”分隔符,利用分隔符界定关键词与内容。如果界定出的关键词不在关键字集合中则交由用户决定是否将其视为关键词收录到集合中。通过此步骤实现分词策略的学习功能; 
1.7.2、然后匹配出关键字Key=Cx,y∩W,将字符串
Figure FDA0000403990660000041
填入名为Key的表单项中。当
Figure FDA0000403990660000042
时,将字符集Cx,y填入“未分类”表单项; 
基于语义库的策略包括: 
定位姓名策略(中文):排除其他语义,字符数在2~4之间,跟随有职位、头衔,或带有“姓名”类标签; 
定位手机号码策略:以13、15、18开头的11位纯数字字符串,或带有“手机”类标签; 
定位电话号码策略:7~8位纯数字字符串,或以区号开头,包含括号、连字符、空格等分隔符,或带有“电话”类标签; 
定位公司名称策略:排除其他语义,出现“公司”、“集团”、各机关单位关键词,或带有“公司”类标签; 
定位地址策略:出现“省”、“市”、“县”、“乡”、“镇”、“路”、“区”、“幢”、“单位”、“室”与数字混合的字符串,或带有“地址”类标签; 
定位邮编策略:6位纯数字字符串,或带有“邮编”类标签; 
定位邮箱策略:出现数字、字母、“”、“.”字符,或带有“邮箱”类标签; 
定位网址策略:出现“http”、“.”、“www”、“com”、“cn”、“edu”字符,或带有“网址”类标签。 
4.如权利要求1所述的一种基于名片识别的社交关系管理方法,其特征在于: 
步骤2)中建立社交关系网络的步骤如下: 
2.1、通过用鼠标移动联系人结点来建立两个联系人的关系。将新加入的结点Aj附加到已有结点Ai(即要建立关系的联系人)上,确定操作双方后利用连线的形式表示两个联系人之间建立的关系Li,j,它表示Ai与Aj彼此互相认识(双向); 
2.1.1、(可选):如果新建立的联系人结点Ai是用户O(即“我”)的第一接触人,则将新结点Ai连接到用户结点O上建立联系线路OAi,其关系为L0,i; 
2.1.2、(可选):如果新建立的联系人结点Aj是用户O通过朋友Ai得知了此联系人,且对方并不认识用户O的情况下,则将新结点Aj连接到用户朋友结点Ai上建立联系线路AiAj,其关系为Li,j; 
2.1.3、(可选):如果原先是用户O通过朋友Ai得知的联系人Aj与用户朋友Ai是第一接触人(单向),而在进一步的合作交流后,用户O与该联系人Aj成为了第一接触人(双向),则将该联系人结点Aj连接到用户结点O上,形成与用户结点直接的联系路径OAj,其关系为L0,j; 
2.2、对于每个关系Li,j通过使用权值Ki,j来表示关系的强弱。Li,j的权值Ki,j取决于联系人Ai与联系人Aj的结识时间T(单位:天)以及联系次数Count。具体计算方法为:
Figure FDA0000403990660000051
2.3、根据度数D与权值K得出“我”与各联系人的“亲密度”Intimacy。约定用户结点O的度数D0=0通过路径OAi上的关系L0,i相连的结点Ai的度数Di=1+D0;通过路径AiAj上的关系Li,j相连的结点Aj的度数Dj=1+Di。“我”与结点Aj的“亲密度”计算公式为:Intimacyj=Dj+Ki,j,Di∈N*,Ki,j∈[0,1),“亲密度”Intimacy的整数部分代表了六度分割中的度数,小数部分将同等度数下的各个关系进一步划分开。因此,“亲密度”能较好的反应出以“我”为中心到各个结点的亲疏关系,其中N*为正整数集。 
5.如权利要求1所述的一种基于名片识别的社交关系管理方法所,其特征在于: 
步骤3)中通过用户输入的检索关键词与已录入的个人信息进行模糊匹配,筛选出可能的目标列表智能检索,其具体步骤如下: 
3.1、设用户输入的关键词为字符串WORD,其中的元素为Char,名片数据集DATA,若
Figure FDA0000403990660000061
Figure FDA0000403990660000062
则返回其对应的联系人A(Char∩DATA)。 
3.2、用户从返回的列表中,根据实际需求,选择出具体目标,定位到某一联系人Ai。 
3.3、根据关系L上的权值K,通过最短路径算法(这里采用Dijkstra算法),得到“我”与目标之间“最有效”的沟通途径,即通过最亲密的(抑或最少的)联系人联系到最需要的联系人。这里将联系人结点A视作Dijkstra算法中的点集;关系L视作算法中的边集;边的长度为对应K值;用户结点O作为算法中的源。 
6.如权利要求1所述的一种基于名片识别的社交关系管理方法,其特征在于:步骤4)中完成移动终端同步的步骤如下: 
4.1、启动服务。PC服务器端要求采用Socket和多线程等相关技术设计服务器程序,它可以是驻留服务程序,即随着操作系统启动而启动,也可以手工启动,启动后将与数据库服务器建立连接,然后自动监听移动终端的请求; 
4.2、自动配置IP。当用户点击移动终端的同步客户端程序时,它将从移动终端中的配置文件中读取服务器IP地址、服务器端口号PORT;如果无法连接上PC服务器端,它将自动扫描服务器端程序。一次性IP扫描配置策略:终端加入PC服务器所在网段后,终端程序自动获取其IP地址,根据字符串定位算法获取IP地址前三个区域的数据,利用循环程序自动扫描由0-255与前三个区域数据构成的IP地址(作为可能的PC服务器端程序IP地址),若能连接成功,则将其保存于配置文件中,供下次自动连接服务器使用; 
4.3、设置系统。移动终端的系统设置功能技术特征为:当终端程序自动扫描无法连接上PC服务器端程序时,可以交互式地修改IP地址、端口号PORT,同时还可以设置备份和导入时的完全覆盖、差异两个选项; 
4.4、备份移动终端。移动终端的备份功能技术特征为:用户在移动终端上点击备份功能按钮时,当系统设置中的选项为完全覆盖,移动终端程序读取该终端的通讯录中第i个联系人(i=1,2,...,n),然后将第i个联系人通过PC服务器端程序写入到对应的数据库中,若数据库中存在该联系人,则更新数据,若不存在, 则插入。如果当系统设置中的选项为差异时,移动终端程序读取该终端的通讯录中第i个联系人(i=1,2,…,n),然后将第i个联系人通过PC服务器端程序写入到对应的数据库中,若数据库中存在该联系人,则忽略,若不存在,则插入; 
4.5、导入移动终端。移动终端的导入功能技术特征为:用户在移动终端上点击导入功能按钮时,当系统设置中的选项为完全覆盖,PC服务器端程序读取数据库通讯录中第i个联系人(i=1,2,…,n),然后将第i个联系人通过移动终端程序写入到终端的通讯录中,若通讯录中存在该联系人,则更新数据,若不存在,则插入。如果当系统设置中的选项为差异时,PC服务器端程序读取数据库通讯录中第i个联系人(i=1,2,…,n),然后将第i个联系人通过移动终端程序写入到终端的通讯录中,若通讯录中存在该联系人,则忽略,若不存在,则插入。 
CN201310521182.2A 2013-10-29 2013-10-29 一种基于名片识别的社交关系管理方法 Active CN103617422B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310521182.2A CN103617422B (zh) 2013-10-29 2013-10-29 一种基于名片识别的社交关系管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310521182.2A CN103617422B (zh) 2013-10-29 2013-10-29 一种基于名片识别的社交关系管理方法

Publications (2)

Publication Number Publication Date
CN103617422A true CN103617422A (zh) 2014-03-05
CN103617422B CN103617422B (zh) 2017-01-11

Family

ID=50168125

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310521182.2A Active CN103617422B (zh) 2013-10-29 2013-10-29 一种基于名片识别的社交关系管理方法

Country Status (1)

Country Link
CN (1) CN103617422B (zh)

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104020847A (zh) * 2014-05-15 2014-09-03 上海合合信息科技发展有限公司 字符输入方法及装置
CN104504069A (zh) * 2014-12-22 2015-04-08 北京奇虎科技有限公司 一种文档索引的建立方法和装置
CN105490811A (zh) * 2015-11-25 2016-04-13 小米科技有限责任公司 签名信息获取方法及装置
CN105631752A (zh) * 2016-03-22 2016-06-01 南京信息工程大学 一种改进Dijkstra权重的社交网络抽样生成算法
CN105631486A (zh) * 2014-10-27 2016-06-01 深圳Tcl数字技术有限公司 图像文字识别方法及装置
CN105718972A (zh) * 2016-01-15 2016-06-29 卢怀农 一种信息智能采集方法
CN105791503A (zh) * 2016-04-28 2016-07-20 乐视控股(北京)有限公司 一种将名片信息存储到通讯录的方法及装置
CN106230968A (zh) * 2016-08-22 2016-12-14 杨玲 基于Apache服务器的跨平台文件传输APP软件系统
CN106326854A (zh) * 2016-08-19 2017-01-11 掌阅科技股份有限公司 一种版式文档段落识别方法
CN106709488A (zh) * 2016-12-20 2017-05-24 深圳市深信服电子科技有限公司 名片识别方法及装置
CN107239453A (zh) * 2016-03-28 2017-10-10 平安科技(深圳)有限公司 信息写入方法和装置
CN107402927A (zh) * 2016-05-19 2017-11-28 上海斯睿德信息技术有限公司 一种基于图模型的企业关联关系拓扑建立方法及查询方法
CN107679240A (zh) * 2017-10-27 2018-02-09 中国计量大学 一种虚拟身份挖掘方法
CN108009546A (zh) * 2016-10-28 2018-05-08 北京京东尚科信息技术有限公司 信息识别方法和装置
CN108446697A (zh) * 2018-03-06 2018-08-24 平安科技(深圳)有限公司 图片处理方法、电子装置及存储介质
CN108509783A (zh) * 2018-04-09 2018-09-07 陈静 一种智能终端应用程序管理系统
CN109358067A (zh) * 2018-11-30 2019-02-19 桂林电子科技大学 基于计算机视觉的马达环形压敏电阻缺陷检测系统及方法
CN111147361A (zh) * 2019-12-30 2020-05-12 论客科技(广州)有限公司 一种添加邮箱账号的方法、装置及存储介质
CN111414536A (zh) * 2020-03-17 2020-07-14 支付宝(杭州)信息技术有限公司 业务处理方法及装置
CN111797729A (zh) * 2020-06-19 2020-10-20 翰博瑞强(上海)医药科技有限公司 一种化验报告单自动识别方法
CN112199545A (zh) * 2020-11-23 2021-01-08 湖南蚁坊软件股份有限公司 基于图片文字定位的关键词显示方法、装置及存储介质
CN112733834A (zh) * 2021-03-30 2021-04-30 恒银金融科技股份有限公司 一种基于非矩阵窗方式的字符区域定位方法
CN113569738A (zh) * 2021-07-28 2021-10-29 深圳思谋信息科技有限公司 制表信息提取处理方法、装置、计算机设备和存储介质
CN115170040A (zh) * 2022-09-08 2022-10-11 南方电网数字电网研究院有限公司 一种资产目录动态更新方法及系统
CN119026615A (zh) * 2024-10-29 2024-11-26 成都市特种设备检验检测研究院(成都市特种设备应急处置中心) 基于rfid的埋地管线全生命周期追踪数字孪生系统建立方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101882264A (zh) * 2009-11-27 2010-11-10 镇立新 添加联系人的方法
CN101916271A (zh) * 2010-08-10 2010-12-15 上海合合信息科技发展有限公司 自动获取联系人头像的方法及系统
CN102622592A (zh) * 2012-01-19 2012-08-01 北京友录在线科技发展有限公司 一种基于云技术的名片识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101882264A (zh) * 2009-11-27 2010-11-10 镇立新 添加联系人的方法
CN101916271A (zh) * 2010-08-10 2010-12-15 上海合合信息科技发展有限公司 自动获取联系人头像的方法及系统
CN102622592A (zh) * 2012-01-19 2012-08-01 北京友录在线科技发展有限公司 一种基于云技术的名片识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
张纯等: "中文商务名片识别系统的实现", 《中文信息学报》 *
牛华网: "到底谁更实用 经纬名片通VS名片全能王", 《HTTP://WWW.NEWHUA.COM/2013/0105/191386.SHTML》 *

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104020847A (zh) * 2014-05-15 2014-09-03 上海合合信息科技发展有限公司 字符输入方法及装置
CN105631486A (zh) * 2014-10-27 2016-06-01 深圳Tcl数字技术有限公司 图像文字识别方法及装置
CN104504069A (zh) * 2014-12-22 2015-04-08 北京奇虎科技有限公司 一种文档索引的建立方法和装置
CN105490811A (zh) * 2015-11-25 2016-04-13 小米科技有限责任公司 签名信息获取方法及装置
CN105718972A (zh) * 2016-01-15 2016-06-29 卢怀农 一种信息智能采集方法
CN105718972B (zh) * 2016-01-15 2019-01-29 卢怀农 一种信息智能采集方法
CN105631752A (zh) * 2016-03-22 2016-06-01 南京信息工程大学 一种改进Dijkstra权重的社交网络抽样生成算法
CN107239453A (zh) * 2016-03-28 2017-10-10 平安科技(深圳)有限公司 信息写入方法和装置
CN105791503A (zh) * 2016-04-28 2016-07-20 乐视控股(北京)有限公司 一种将名片信息存储到通讯录的方法及装置
CN107402927A (zh) * 2016-05-19 2017-11-28 上海斯睿德信息技术有限公司 一种基于图模型的企业关联关系拓扑建立方法及查询方法
CN106326854A (zh) * 2016-08-19 2017-01-11 掌阅科技股份有限公司 一种版式文档段落识别方法
CN106326854B (zh) * 2016-08-19 2019-09-06 掌阅科技股份有限公司 一种版式文档段落识别方法
CN106230968A (zh) * 2016-08-22 2016-12-14 杨玲 基于Apache服务器的跨平台文件传输APP软件系统
CN108009546A (zh) * 2016-10-28 2018-05-08 北京京东尚科信息技术有限公司 信息识别方法和装置
CN106709488A (zh) * 2016-12-20 2017-05-24 深圳市深信服电子科技有限公司 名片识别方法及装置
CN107679240A (zh) * 2017-10-27 2018-02-09 中国计量大学 一种虚拟身份挖掘方法
CN108446697A (zh) * 2018-03-06 2018-08-24 平安科技(深圳)有限公司 图片处理方法、电子装置及存储介质
CN108446697B (zh) * 2018-03-06 2019-11-12 平安科技(深圳)有限公司 图片处理方法、电子装置及存储介质
CN108509783A (zh) * 2018-04-09 2018-09-07 陈静 一种智能终端应用程序管理系统
CN109358067A (zh) * 2018-11-30 2019-02-19 桂林电子科技大学 基于计算机视觉的马达环形压敏电阻缺陷检测系统及方法
CN111147361B (zh) * 2019-12-30 2022-06-07 论客科技(广州)有限公司 一种添加邮箱账号的方法、装置及存储介质
CN111147361A (zh) * 2019-12-30 2020-05-12 论客科技(广州)有限公司 一种添加邮箱账号的方法、装置及存储介质
CN111414536A (zh) * 2020-03-17 2020-07-14 支付宝(杭州)信息技术有限公司 业务处理方法及装置
CN111797729A (zh) * 2020-06-19 2020-10-20 翰博瑞强(上海)医药科技有限公司 一种化验报告单自动识别方法
CN112199545A (zh) * 2020-11-23 2021-01-08 湖南蚁坊软件股份有限公司 基于图片文字定位的关键词显示方法、装置及存储介质
CN112733834B (zh) * 2021-03-30 2021-07-06 恒银金融科技股份有限公司 一种基于非矩阵窗方式的字符区域定位方法
CN112733834A (zh) * 2021-03-30 2021-04-30 恒银金融科技股份有限公司 一种基于非矩阵窗方式的字符区域定位方法
CN113569738A (zh) * 2021-07-28 2021-10-29 深圳思谋信息科技有限公司 制表信息提取处理方法、装置、计算机设备和存储介质
CN115170040A (zh) * 2022-09-08 2022-10-11 南方电网数字电网研究院有限公司 一种资产目录动态更新方法及系统
CN119026615A (zh) * 2024-10-29 2024-11-26 成都市特种设备检验检测研究院(成都市特种设备应急处置中心) 基于rfid的埋地管线全生命周期追踪数字孪生系统建立方法

Also Published As

Publication number Publication date
CN103617422B (zh) 2017-01-11

Similar Documents

Publication Publication Date Title
CN103617422A (zh) 一种基于名片识别的社交关系管理方法
CN110569832B (zh) 基于深度学习注意力机制的文本实时定位识别方法
US10200336B2 (en) Generating a conversation in a social network based on mixed media object context
CN110442744B (zh) 提取图像中目标信息的方法、装置、电子设备及可读介质
CN101297318B (zh) 用于混合介质文档系统的数据组织和访问
US10990814B2 (en) Converting an image into a structured table
US9020265B2 (en) System and method of determining building numbers
CN103577818A (zh) 一种图像文字识别的方法和装置
CN103597500A (zh) 用于辨识对象中的文本信息的系统和方法
CN102779140A (zh) 一种关键词获取方法及装置
CN116052186A (zh) 多模态发票自动分类识别方法、校验方法及系统
Song et al. Remote sensing image registration approach based on a retrofitted SIFT algorithm and Lissajous-curve trajectories
Guo et al. Exploring GIS knowledge to improve building extraction and change detection from VHR imagery in urban areas
Ma et al. Simple and efficient registration of 3D point cloud and image data for an indoor mobile mapping system
Lu et al. Efficient descriptor of histogram of salient edge orientation map for finger vein recognition
CN116092231A (zh) 票证识别方法、装置、终端设备以及存储介质
Lu et al. Anchor‐Free Braille Character Detection Based on Edge Feature in Natural Scene Images
Guo et al. Text line detection based on cost optimized local text line direction estimation
CN113591657B (zh) Ocr版面识别的方法、装置、电子设备及介质
CN116050379A (zh) 文档对比方法及存储介质
CN115659964A (zh) 一种基于多模态信息的表格实体抽取方法及系统
US20170262726A1 (en) Tex line detection
Rahul et al. Deep reader: Information extraction from document images via relation extraction and natural language
US11704924B2 (en) Method, apparatus, and computer-readable storage medium for recognizing characters in a digital document
CN117217940B (zh) 报销凭证审核方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant