CN1484165A - 文件信息的输入设备,输入方法,输入程序以及记录介质 - Google Patents
文件信息的输入设备,输入方法,输入程序以及记录介质 Download PDFInfo
- Publication number
- CN1484165A CN1484165A CNA031498140A CN03149814A CN1484165A CN 1484165 A CN1484165 A CN 1484165A CN A031498140 A CNA031498140 A CN A031498140A CN 03149814 A CN03149814 A CN 03149814A CN 1484165 A CN1484165 A CN 1484165A
- Authority
- CN
- China
- Prior art keywords
- processed
- zone
- attribute
- input device
- file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/10—Image acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
- G06F3/0486—Drag-and-drop
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/1444—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Human Computer Interaction (AREA)
- Character Input (AREA)
- User Interface Of Digital Computer (AREA)
- Processing Or Creating Images (AREA)
- Image Processing (AREA)
- Character Discrimination (AREA)
- Studio Devices (AREA)
Abstract
文件信息的输入设备,输入方法,输入程序以及记录介质。一种文件信息输入设备可以高精度检测由用户指定的要输入的实际文件的一个区域的位置和属性。根据所检测的位置和属性,文件信息输入设备通过执行诸如字符识别、表识别和图处理那样的适合于所检测的属性的识别处理,可把区域图像识别为文本信息。然后,文件信息输入设备把所生成的信息粘贴到显示器上的电子文件的相关位置。结果,可高速和高精度实现从实际文件到电子文件的诸如字符序列、表和图那样的信息的输入。
Description
技术领域
本发明一般涉及一种可识别实际文件中的信息并可把该信息输入到由计算机显示的另一文件的文件信息输入设备、文件信息输入方法、文件信息输入程序和记录介质。
背景技术
常规上,当用户想要把在实际文件中写入的一系列字符粘贴到计算机显示器上的另一文件时,用户需要使用扫描器等来读取实际文件,以生成实际文件的图像信息。然后,用户使计算机把图像信息识别为文本信息。用户复制所识别的文本信息中的有关字符序列,然后把该字符序列粘贴到计算机屏幕上的文件。
第11-203403号日本专利申请公报揭示了一种信息处理器。该信息处理器使用CCD(电荷耦合二极管)摄像机以低分辨率对文件图像进行摄像。然后,当把手指或笔与文件一起摄像时,信息处理器获取原始文件图像和包括手指或笔在内的文件图像之间的差异,以判定要识别的指定局部区域。之后,信息处理器重新以高分辨率对指定局部区域进行摄像,然后把指定局部区域的图像信息识别为文本信息。
然而,上述方法存在一些问题。前者常规方法存在有关效率的问题。在前者常规方法中,要花费较长时间来执行所有处理,从用于对实际文件中要粘贴的部分进行指定和识别的处理,到用于把所识别的文本信息粘贴到显示器上的另一文件的处理,并且这些处理很复杂。
另一方面,后者常规方法也存在一些问题。在后者常规方法中,有必要对所摄像的文件图像进行处理,以判定手指或笔是否包括在所摄像的文件图像内。结果,该处理使工作负担增加。此外,有必要从以低分辨率摄像的文件图像中检测手指尖端或笔尖端的位置,以判定要处理的指定局部区域。结果,由于以低分辨率摄像的信息量少,因而难以以高精度抽出要识别的局部区域。为了解决该问题,有必要按以上所述以高分辨率来对文件图像进行摄像。结果,所需处理时间延长。
发明内容
本发明的一般目的是提供一种能消除上述问题的文件信息输入设备、文件信息输入方法和文件信息输入程序。
本发明的一个更具体目的是提供一种能以高速和高精度把实际文件中诸如字符序列、表和图那样的信息输入到由计算机显示的另一文件的文件信息输入设备、文件信息输入方法和文件信息输入程序。
为了达到上述目的,根据本发明的一个方面,提供了一种文件信息输入方法,用于识别实际文件中的信息,并把所识别的信息输入到由计算机显示的文件,该方法包括以下步骤:指定实际文件中要处理的区域;检测要处理的指定区域;读取要处理的区域的图像;把要处理的区域的图像识别为文本信息;以及把用于识别图像的步骤的结果粘贴到由计算机显示的文件中的相关位置。
在上述文件信息输入方法中,文件信息输入方法还可以包括以下步骤,即:当检测要处理的区域时,判定要处理的区域具有文本属性、表属性和图属性中的哪种属性。
在上述文件信息输入方法中,可以根据指定区域,把要处理的区域判定为具有文本属性、表属性和图属性中的一种。
在上述文件信息输入方法中,可以根据指定要处理的区域所用的方法,把要处理的区域判定为具有文本属性、表属性和图属性中的一种。
在上述文件信息输入方法中,当把要处理的区域判定为具有文本属性时,要处理的区域还可以具有指定的模式,该模式用于把要处理的区域识别为具有文本信息。
在上述文件信息输入方法中,当把要处理的区域判定为具有表属性并且一个指定位置在单元格内时,可以从包括该单元格在内的区域检测要处理的区域,并且其中,当把要处理的区域判定为具有表属性并且指定位置在任何单元格外时,可以从包括距该位置预定距离内的字符序列在内的区域检测要处理的区域。
根据上述发明,文件信息输入方法可以高精度检测由用户指定的要输入的区域的位置和属性。根据所检测的位置和属性,文件信息输入方法通过执行诸如字符识别、表识别和图处理那样的适合于所检测的属性的识别处理,可把区域的图像识别为文本信息。然后,文件信息输入方法把所生成的信息粘贴到显示器上的电子文件的相关位置。结果,可高速和高精度实现从实际文件到电子文件的诸如字符序列、表和图那样的信息的输入。
通过结合附图阅读以下详细说明,将更明白本发明的其他目的、特点和优点。
附图说明
图1是示出计算机的硬件构成的方框图;
图2是示出根据本发明第一实施例的文件信息输入设备的系统结构的方框图;
图3是由根据第一实施例的文件信息输入设备执行的过程的流程图;
图4是用于对由根据第一实施例的文件信息输入设备执行的过程进行说明的图;
图5是由根据第一实施例的文件信息输入设备执行的坐标获得处理和图像获得处理的流程图;
图6是当要识别的指定区域是表区域时的识别处理和粘贴处理的流程图;
图7是用于对由根据第一实施例的文件信息输入设备执行的属性判定处理进行说明的图;
图8是用于对属性和模式进行详细说明的图;
图9是由根据第一实施例的文件信息输入设备执行的属性指定处理的流程图;
图10是由根据第一实施例的文件信息输入设备执行的过程的详细流程图;
图11是由根据第二实施例的文件信息输入设备执行的坐标获得处理、图像获得处理和属性判定处理的流程图;
图12是由根据第二实施例的变化例的文件信息输入设备执行的过程的流程图;以及
图13是由根据第三实施例的文件信息输入设备执行的过程的流程图。
具体实施方式
以下将参照附图,对本发明的实施例进行说明。
图1示出了计算机1的硬件构成的方框图。如图1所示,计算机1包括:CPU(中央处理器)2,用于处理信息;一级存储设备3,例如RAM(随机存取存储器),用于在CPU2执行过程中临时存储信息;二级存储设备4,例如HDD(硬盘驱动器),用于存储诸如执行结果那样的某些数据;可换式介质6(例如CD-ROM)的驱动设备5,用于把信息存储/分配到计算机1的外部,并从计算机1的外部获得信息;显示设备7,用于把执行过程和结果显示给用户;以及输入设备,例如键盘8和鼠标9,通过该输入设备,用户可输入指令和信息。这些部件通过总线相互连接。
图2示出了根据本发明第一实施例的文件信息输入设备的系统结构。
文件信息输入设备包含:处理部10,摄像部15,指定部16,以及输出部17。
文件信息输入设备读取实际文件的指定部分,把指定部分的图像识别为文本信息,以及把所识别的文本信息粘贴到在显示设备7上显示的电子文件的指定位置。此处,这种实际文件形成为纸文件、汽车牌照、广告标志等。而且,假定实际文件包含字符、表、图、公式等。另一方面,这种电子文件形成为文件信息、图像信息、电子表格等。
如图2所示,处理部10包括:属性判定部11,检测部12,识别部13以及粘贴部14。
属性判定部11判定从实际文件读取的区域的属性。通常有文本属性、表属性和图属性。
检测部12对识别出文本信息的实际文件中的区域进行检测。
识别部13根据所判定的属性,从所检测区域的图像中识别文本信息。
粘贴部14把所识别的文本信息粘贴到在计算机1的显示设备7上的电子文件中的指定位置。
此处,文件信息输入设备可根据程序来执行上述过程。该程序可以存储在二级存储设备4内。当CPU执行该程序时,根据需要把该程序从二级存储设备4读取到一级存储设备3。而且,该程序可以存储在记录介质6内,并可以通过驱动设备5读取到一级存储设备3或二级存储设备4。
摄像部15读取实际文件的图像。例如,摄像部15可以是数字摄像机或扫描器。
指定部16指定要输入到显示设备7上的电子文件的实际文件的一部分。例如,指定部16可以是电子笔等。
输出部17由显示设备、打印机等形成。
图3示出了由根据第一实施例的文件信息输入设备执行的过程的流程图。
用户使用指定部16来指定用于定义由用户想要粘贴到显示设备7上的电子文件的实际文件的一部分的坐标。
在步骤S1,文件信息输入设备获得坐标信息。例如,如图4所示,如果用户通过拖动电子笔来指定该部分,也就是说,如果用户通过在起点接通电子笔、拖动电子笔并然后在终点断开电子笔来指定该部分,则坐标信息可以由起点和终点的坐标形成。在该例中,起点和终点由图4中的实际文件的左上区域所示的接收设备来检测。
包括上述指定部分在内的区域由摄像部15来摄像。在步骤S2,文件信息输入设备获得所摄像区域的图像。
在步骤S3,文件信息输入设备判定指定部分的属性。如下详述,根据第一实施例的文件信息输入设备根据由指定部16指定的区域来判定属性。文件信息输入设备把与指定区域对应的属性判定为要识别的区域的属性。
在步骤S4,文件信息输入设备检测实际文件的指定区域。如上所述,根据电子笔的起点和终点来检测指定区域。以下将对此进行详细说明。
在步骤S5,文件信息输入设备根据在步骤S3判定的属性,把所检测区域的图像识别为文本信息等。
在步骤S6,文件信息输入设备把诸如文本信息那样的识别信息粘贴在显示设备7上的电子文件的指定区域内。
首先,文件信息输入设备对纸文件的一部分及其属性进行检测。然后,文件信息输入设备根据所判定的属性,把所检测部分的图像识别为文本信息。最后,把所识别的部分粘贴在显示设备7上的电子文件的指定区域内。结果,可容易和快速地把纸文件中的字符序列、表、图等输入到电子文件的指定区域。以下将对由文件信息输入设备执行的过程进行详细说明。
图4是用于对由根据第一实施例的文件信息输入设备执行的过程进行说明的图。
如图4所示,纸文件具有:文本区域,其内打印某些字符;表区域,其内打印表;以及图区域,其内打印图。
以下将对图3概述的坐标获得处理和图像获得处理进行详细说明。
当用户把电子笔放置在纸文件的某一位置并然后接通电子笔时,接收机把接通电子笔所在的坐标检测为起点。然后,当用户拖动电子笔时,接收机跟踪电子笔。当断开电子笔时,接收机把断开电子笔所在的坐标检测为终点。文件信息输入设备使用常规接收机来执行该处理。
这样,文件信息输入设备可检测起点和终点的坐标。根据所检测的坐标,文件信息输入设备使用数字摄像机、扫描器等来读取纸文件的指定部分,以获得该部分的图像。
图5示出了坐标获得处理和图像获得处理的流程图。在步骤S11,文件信息输入设备判定是否接通电子笔。在图4所示的例子中,文件信息输入设备判定用户是否在纸文件上的某一位置放置和接通电子笔。如果判定为电子笔接通,则文件信息输入设备进到步骤S12。如果判定为未接通电子笔,则文件信息输入设备重复步骤S11,直到接通电子笔。
在步骤S12,文件信息输入设备获得接通电子笔所在的位置作为起点。
在步骤S13,文件信息输入设备判定是否拖动并然后断开电子笔。如果判定为拖动并然后断开电子笔,则文件信息输入设备进到步骤S14。如果判定为未拖动并然后断开电子笔,则文件信息输入设备重复步骤S13,直到断开电子笔。
在步骤S14,文件信息输入设备获得断开电子笔所在的位置作为终点。
在步骤S15,文件信息输入设备使用摄像部15来获得根据所获得的起点和所获得的终点判定的区域的图像。
结果,当文件信息输入设备对图4所示的纸文件中的起点和终点进行检测时,文件信息输入设备可使用摄像部15来获得由图4中的虚线围绕并由起点和终点定义的矩形区域的图像信息。然后,文件信息输入设备进到识别处理。
以下将对图3概述的识别处理进行详细说明。文件信息输入设备识别所获得的文件图像。在图4所示的该例中,所获得的文件图像包含三种信息形式,即:文本形式,表形式和图形式。关于纸文件的文本区域,文件信息输入设备把文本区域的图像识别为文本信息。关于表区域,文件信息输入设备把表区域中的表内的各单元格识别为文本信息。关于图区域,文件信息输入设备针对图区域中的图不进行识别处理。
这样,纸文件中的文本区域和表区域被识别为文本信息。此处,文件信息输入设备可通过使用以下详述的所获得的属性信息,以较高精度执行识别处理。
最后,将对图3所述的粘贴处理进行详细说明。文件信息输入设备把所处理的信息粘贴到显示设备7上的电子文件。如图4所示,关于纸文件的文本区域,文件信息输入设备把所识别的文本信息粘贴在由光标指向的电子文件中的某一位置。关于纸文件的表区域,文件信息输入设备同样把所识别的文本信息粘贴在由光标指向的电子文件的某一位置。关于纸文件的图区域,文件信息输入设备直接把图区域粘贴在电子文件的指定区域中的所获得的图像内。注意,根据需要来指定图区域大小和粘贴位置。
这样,可以高精度、容易和快速地把纸文件的文本区域中的某些字符、表区域中的字符序列以及图区域中的图输入到显示设备7上的电子文件中的指定位置。
图6示出了当要识别的指定区域是表区域时的识别处理和粘贴处理的流程图。由于字符序列是通过使用下述属性信息来识别的,因而以下将对字符序列进行详细说明。
在步骤S21,文件信息输入设备抽出根据起点和终点判定的表区域的图像。
在步骤S22,对于所抽出的表区域中的表的各单元格,文件信息输入设备从单元格内的字符序列的图像中识别文本信息。
在步骤S23,文件信息输入设备根据表中的划线来识别表的逻辑结构。例如,逻辑结构包含与表的矩阵大小有关的信息。
在步骤S24,如图4所示,文件信息输入设备把为各单元格识别的文本信息粘贴在显示设备7上的电子文件中的对应单元格内。
这样,关于纸文件中的表区域,文件信息输入设备可快速识别表的字符序列和逻辑结构,然后可以高精度把所识别的字符信息输入到电子文件中的对应单元格。
图7是用于对由根据第一实施例的文件信息输入设备执行的属性判定处理进行说明的图。
在图7的属性指定区域中,为图7的上部区域中的纸文件内的各信息区域指定属性。用户通过在属性指定区域中的对应属性区域上点击电子笔,为纸文件中的信息区域指定属性。此处,如果用户在某一位置接通并然后断开电子笔,则电子笔被认为是在该位置进行点击。在用户指定属性之后,用户拖动电子笔,以便指定要识别的矩形区域。文件信息输入设备根据所指定的属性来识别指定区域,然后把所识别的文本信息粘贴在电子文件的对应位置。
如图7所示,属性指定区域包含以下属性:
·文本:
·姓名字符序列:
·地址字符序列:
·电话号码字符序列:
·表:
·图:
当用户通过在其上点击电子笔来指定姓名字符序列、地址字符序列和电话号码字符序列中的一项时,如参照图4和图5所述,文件信息输入设备获得由起点和终点判定的矩形区域的图像。根据指定属性,文件信息输入设备分别根据姓名字符序列、地址字符序列和电话号码字符序列来编制姓名字典、地址字典和电话号码字典。并且,文件信息输入设备遵循一种最适合于指定属性的抽出方法。结果,文件信息输入设备可通过使用最合适的字典和抽出方法,以较高精度把指定字符序列的图像识别为文本信息。
而且,如果用户为指定的表信息选择表属性,则文件信息输入设备启动识别引擎,用于通过对表中的垂直和水平划线进行检测来正确识别表的各单元格的位置和大小。并且,文件信息输入设备遵循一种最适合于识别表中的字符序列的识别方法。结果,文件信息输入设备可以较高精度把表中的各单元格内的字符序列的图像识别为文本信息。
而且,如果用户为指定的图信息选择图属性,则文件信息输入设备根据需要,针对指定图进行比例配置和旋转操作。然后,文件信息输入设备把所生成的图粘贴到电子文件的对应位置。
如上所述,当用户通过点击电子笔来指定属性时,文件信息输入设备根据指定属性来识别所获得的图像,然后把所识别的信息粘贴到电子文件的对应位置。由于文件信息输入设备根据最适合于指定属性的识别方法来识别图像,因而文件信息输入设备可以较高精度识别图像,并可把所识别的信息输入到电子文件的对应位置。
图8是用于对属性和模式进行详细说明的图。
如图8所示,属性“文本”还包含模式“姓名”、“地址”、“电话号码”等。当用户想要把纸文件中的字符序列输入到电子文件时,用户还可指定这种模式。文件信息输入设备可通过使用最适合指定模式的字典和抽出方法,以高精度快速地把指定的字符序列的图像识别为文本信息。
与属性“文本”不同,属性“表”不包含任何模式。在表识别中,文件信息输入设备启动用于识别表的识别引擎,这是因为文件信息输入设备需要检测垂直和水平划线,以判定诸如表大小及其矩阵信息那样的表的逻辑结构。
与属性“文本”不同,属性“图”不包含任何模式。在图输入中,文件信息输入设备获得纸文件中的指定图区域的图像。文件信息输入设备启动用于更改图的比例并旋转该图的引擎。结果,文件信息输入设备可根据需要更改图的比例或旋转该图,然后可把所生成的图粘贴在电子文件的对应位置。
图9示出了属性指定处理的流程图。
在步骤S31,文件信息输入设备判定用户指定哪种属性。如上所述,例如,用户通过在图7所示的属性指定区域中的一个区域上点击电子笔来指定属性。
当用户在步骤S31指定文本属性中的姓名模式、地址模式和电话号码模式中的一项时,文件信息输入设备使用最适合于指定属性的字典和抽出方法,以便以高精度快速地把所获得的图像识别为文本信息。然后,文件信息输入设备把所识别的文本信息粘贴到由光标指向的电子文件的位置。
在步骤S33,当用户在步骤S31选择表属性时,文件信息输入设备启动被设计成最适合于识别表的表识别处理。然后,文件信息输入设备检测表的逻辑结构,并以高精度快速地把表中的各单元格内的字符序列识别为文本信息。文件信息输入设备在电子文件的对应位置复制逻辑结构,然后把所识别的文本信息粘贴在电子文件中的所复制表内的对应单元格中。
在步骤S34,当用户在步骤S31选择图属性时,文件信息输入设备启动被设计成最适合于图的引擎。然后,文件信息输入设备根据需要按比例放大或缩小该图,并把所缩放的图粘贴到电子文件中的对应位置。
如上所述,当用户使用电子笔为要识别的区域指定属性时,文件信息输入设备可使用最适合于指定属性的方法,以便以高精度快速地识别图像信息,并把所识别的信息输入到电子文件的对应位置。
在上述说明中,属性被划分为文本属性、表属性和图属性。然而,文件信息输入设备可以为其他类型的文件编制其他属性。如果纸文件包含诸如数学公式那样的特种字符和符号,则该属性被提供给文件信息输入设备。并且,为文件信息输入设备编制最适合于该属性的字典和抽出方法。结果,文件信息输入设备可通过以高速和高精度抽出和识别信息来输入电子文件中的指定信息。
图10示出了由根据第一实施例的文件信息输入设备执行的过程的详细流程图。
在步骤S41,文件信息输入设备获得用户在纸文件上操作的电子笔的坐标信息,以判定用户在上述属性指定区域中指定哪种属性。此处,假定用户指定包括姓名字符序列在内的区域。
在步骤S42,文件信息输入设备根据所获得的坐标信息来判定指定属性。
在步骤S43,文件信息输入设备编制最适合于指定属性模式的字典和抽出方法。
在步骤S44,文件信息输入设备获得用户在纸文件上操作的电子笔的坐标信息,以判定要粘贴到显示设备7上的电子文件的区域。
在步骤S45,文件信息输入设备根据在步骤S44获得的坐标信息来抽出要粘贴的区域的图像。
在步骤S46,文件信息输入设备通过使用所选字典,把所抽出的图像识别为文本信息。文件信息输入设备使用最合适的姓名字典和字符抽出方法,以便从所抽出的图像中识别文本信息。结果,可以高精度识别文本信息。
在步骤S47,文件信息输入设备把所识别的文本信息粘贴到电子文件中的某一位置,例如,放置光标的位置。
这样,当用户把字符序列输入到电子文件时,文件信息输入设备对诸如姓名模式、地址模式和电话号码模式那样的指定字符模式进行检测,然后编制最适合于指定字符模式的字典和字符抽出方法。然后,文件信息输入设备使用该字典和字符抽出方法,以便从指定区域的所抽出图像中识别文本信息。文件信息输入设备把所识别的文本信息粘贴到电子文件的对应位置。由于字符识别是通过使用合适的字典和抽出方法来进行的,因而可以高精度识别纸文件中的字符序列。
以下将参照图11中的流程图,对本发明的第二实施例进行说明,其中,根据第二实施例的文件信息输入设备与根据第一实施例的文件信息输入设备的不同在于坐标获得处理、图像获得处理和属性判定处理,以下将对此进行说明。
图11示出了由根据第二实施例的文件信息输入设备执行的坐标获得处理、图像获得处理和属性判定处理的流程图。
在步骤S51,文件信息输入设备获得用户在纸文件上操作的电子笔的坐标信息。
根据坐标信息,如图11所示,如果电子笔的轨迹是近似右方向水平线,则文件信息输入设备在步骤S52判定为用户指定在起点和终点之间包括的一行字符。因此,如上所述,文件信息输入设备获得包括该行字符在内的矩形区域的图像,然后把该图像识别为文本信息。
在步骤S53,如图11所示,如果电子笔在右上方向移动,则文件信息输入设备判定为用户指定在起点和终点之间包括的多行字符。因此,如上所述,文件信息输入设备获得包括这些行字符在内的矩形区域的图像,然后把该图像识别为文本信息。
在步骤S54,如图11所示,如果电子笔在右下方向移动,则文件信息输入设备判定为用户指定位于起点和终点之间的表。因此,文件信息输入设备获得包括该表在内的矩形区域的图像,然后根据上述表识别方法把该图像识别为文本信息。
在步骤S55,如图11所示,如果电子笔在左下方向移动,则文件信息输入设备判定为用户指定位于起点和终点之间的图。因此,文件信息输入设备获得包括该图在内的矩形区域的图像。
这样,根据用户在纸文件上操作的电子笔的预定移动,文件信息输入设备可判定要在纸文件中识别的信息及其属性。然后,文件信息输入设备可根据其属性模式,以高精度把要识别的信息的图像识别为文本信息。结果,可更快速和更方便地把纸文件的信息输入到电子文件中的指定位置。
以下将参照图12中的流程图,对本发明的第二实施例的变化例进行说明,其中,该文件信息输入设备与根据第二实施例的文件信息输入设备的不同在于表识别。
图12示出了由根据第二实施例的变化例的文件信息输入设备执行的过程的流程图。
在步骤S61,与根据第二实施例的文件信息输入设备一样,文件信息输入设备获得电子笔的坐标信息。在本说明中,假定文件信息输入设备检测出用户指定了纸文件中的表。
在步骤S62,文件信息输入设备根据电子笔的坐标信息来获得包括表在内的矩形区域的图像。
在步骤S63,文件信息输入设备从所获得的图像中抽出诸如表的划线和单元格那样的表的逻辑结构。
在步骤S64,文件信息输入设备判定电子笔尖端是否在表的单元格内。如果尖端在单元格内,则文件信息输入设备在步骤S65抽出包括由电子笔指向的单元格在内的内部矩形区域,然后对该内部矩形区域中的各单元格的文本信息进行识别。相比之下,如果尖端在表外,则文件信息输入设备抽出包括距电子笔尖端的预定距离内的字符序列在内的区域的图像。然后,文件信息输入设备把所抽出的图像识别为文本信息。
这样,文件信息输入设备不仅能识别指定矩形区域中的表内的字符,而且还能识别表外的字符,然后可快速地把所识别的文本信息输入到电子文件的指定位置。
以下将参照图13中的流程图,对根据本发明的第三实施例的文件信息输入设备进行说明,其中,该文件信息输入设备与根据第一实施例的文件信息输入设备的不同在于属性判定处理。
根据第一实施例的文件信息输入设备根据事先为各属性分配的预定位置上发生的电子笔点击来判定指定属性。另一方面,根据第三实施例的文件信息输入设备根据表示属性/模式类型的各字符序列的字符识别来判定指定属性。
图13示出了由根据第三实施例的文件信息输入设备执行的过程的流程图。
在步骤S71,文件信息输入设备获得用户在纸文件上操作的电子笔的坐标信息,以判定用户在上述属性指定区域中指定哪种属性。
在步骤S72,文件信息输入设备根据所获得的坐标信息来抽出属性指定区域中的区域的图像。此处,假定用户指定了包括表示姓名模式的字符序列“姓名”在内的区域。
在步骤S73,文件信息输入设备把所抽出的图像识别为文本信息。在此情况下,从所抽出的图像来检测字符序列“姓名”。根据识别结果,文件信息输入设备根据所识别的字符序列“姓名”判定出用户指定了姓名属性。
在步骤S74,文件信息输入设备编制最适合于指定的属性模式的字典和抽出方法。
在步骤S75,文件信息输入设备获得用户在纸文件上操作的电子笔的坐标信息,以判定要粘贴到显示设备7上的电子文件的区域。
在步骤S76,文件信息输入设备根据在步骤S75获得的坐标信息来抽出要粘贴的区域。
在步骤S77,文件信息输入设备通过使用所选字典,把所抽出的图像识别为文本信息。文件信息输入设备使用最合适的姓名字典和字符抽出方法,以便从所抽出的图像中识别文本信息。结果,可以高精度识别文本信息。
在步骤S78,文件信息输入设备10把所识别的文本信息粘贴到电子文件中的某一位置,例如,放置光标的位置。
这样,即使事先未针对各属性分配区域,文件信息输入设备也能通过识别与属性对应的字符序列来判定指定属性。由于字符识别是根据所判定的属性,使用字典和字符抽出方法来进行的,因而可以高精度识别纸文件中的字符序列。
本发明不限于具体揭示的实施例,而是可以在不背离本发明范围的情况下进行变动和修改。
Claims (19)
1.一种文件信息输入设备,用于识别实际文件中的信息,并把所述识别信息输入到由计算机显示的文件,该设备包括:
指定部,用于指定所述实际文件中要处理的区域;
检测部,用于对由所述指定部指定的所述要处理的区域进行检测;
读取部,用于读取所述要处理的区域的图像;
字符识别部,用于把所述要处理的区域的图像识别为文本信息;以及
粘贴部,用于把所述字符识别部的结果粘贴到由计算机显示的所述文件的相关位置。
2.根据权利要求1所述的文件信息输入设备,该设备还包括属性判定部,用于当所述检测部对所述要处理的区域进行检测时,判定所述要处理的区域具有文本属性、表属性和图属性中的哪种属性:
3.根据权利要求2所述的文件信息输入设备,其中,所述属性判定部根据由所述指定部指定的区域,把所述要处理的区域判定为具有所述文本属性、所述表属性和所述图属性中的一种。
4.根据权利要求2所述的文件信息输入设备,其中,所述属性判定部根据所述指定部的移动,把所述要处理的区域判定为具有所述文本属性、所述表属性和所述图属性中的一种。
5.根据权利要求2所述的文件信息输入设备,其中,当所述属性判定部把所述要处理的区域判定为具有文本属性时,所述属性判定部还判定由所述指定部指定的模式,所述模式用于把所述要处理的区域识别为具有文本信息。
6.根据权利要求2所述的文件信息输入设备,其中,当所述属性判定部判定出所述要处理的区域具有表属性并且由所述指定部指定的位置在单元格内时,所述检测部把包括所述单元格在内的区域检测为所述要处理的区域,并且其中,当所述属性判定部判定出所述要处理的区域具有表属性并且由所述指定部指定的位置在任何单元格外时,所述检测部把包括距所述位置预定距离内的字符序列在内的区域检测为所述要处理的区域。
7.一种文件信息输入方法,用于识别实际文件中的信息,并把所述识别信息输入到由计算机显示的文件;该方法包括以下步骤:
指定所述实际文件中要处理的区域;
检测所述要处理的区域;
读取所述要处理的区域的图像;
把所述要处理的区域的图像识别为文本信息;以及
把所述用于识别所述图像的步骤的结果粘贴到由计算机显示的所述文件的相关位置。
8.根据权利要求7所述的文件信息输入方法,该方法还包括以下步骤,即:当检测所述要处理的区域时,判定所述要处理的区域具有文本属性、表属性和图属性中的哪种属性。
9.根据权利要求8所述的文件信息输入方法,其中,根据指定区域,把所述要处理的区域判定为具有所述文本属性、所述表属性和所述图属性中的一种。
10.根据权利要求8所述的文件信息输入方法,其中,根据指定所述要处理的区域所用的方法,把所述要处理的区域判定为具有所述文本属性、所述表属性和所述图属性中的一种。
11.根据权利要求8所述的文件信息输入方法,其中,当把所述要处理的区域判定为具有文本属性时,还把所述要处理的区域判定为具有指定模式,所述模式用于把所述要处理的区域识别为具有文本信息。
12.根据权利要求8所述的文件信息输入方法,其中,当把所述要处理的区域判定为具有表属性并且一个指定位置在单元格内时,从包括所述单元格在内的区域检测所述要处理的区域,并且其中,当把所述要处理的区域判定为具有表属性并且该指定位置在任何单元格外时,从包括距所述位置预定距离内的字符序列在内的区域检测所述要处理的区域。
13.一种文件信息输入程序,用于识别实际文件中的信息,并把所述识别信息输入到由计算机显示的文件,该程序使计算机执行以下步骤:
指定所述实际文件中要处理的区域;
检测所述要处理的区域;
读取所述要处理的区域的图像;
把所述要处理的区域的图像识别为文本信息;以及
把所述用于识别所述图像的步骤的结果粘贴到由计算机显示的所述文件的相关位置。
14.根据权利要求13所述的文件信息输入程序,该程序还使计算机执行以下步骤,即:当检测所述要处理的区域时,判定所述要处理的区域具有文本属性、表属性和图属性中的哪种属性。
15.根据权利要求14所述的文件信息输入程序,其中,根据指定区域,把所述要处理的区域判定为具有所述文本属性、所述表属性和所述图属性中的一种。
16.根据权利要求14所述的文件信息输入程序,其中,根据指定所述要处理的区域所用的方法,把所述要处理的区域判定为具有所述文本属性、所述表属性和所述图属性中的一种。
17.根据权利要求14所述的文件信息输入程序,其中,当把所述要处理的区域判定为具有文本属性时,还把所述要处理的区域判定为具有指定模式,所述模式用于把所述要处理的区域识别为具有文本信息。
18.根据权利要求14所述的文件信息输入程序,其中,当把所述要处理的区域判定为具有表属性并且一个指定位置在单元格内时,从包括所述单元格在内的区域检测所述要处理的区域,并且其中,当把所述要处理的区域判定为具有表属性并且该指定位置在任何单元格外时,从包括距所述位置预定距离内的字符序列在内的区域检测所述要处理的区域。
19.一种计算机可读取记录介质,用于记录文件信息输入程序,该文件信息输入程序用于识别实际文件中的信息,并把所述识别信息输入到由计算机显示的文件,该程序使计算机执行以下步骤:
指定所述实际文件中要处理的区域;
检测所述要处理的区域;
读取所述要处理的区域的图像;
把所述要处理的区域的图像识别为文本信息;以及
把所述用于识别所述图像的步骤的结果粘贴到由计算机显示的所述文件的相关位置。
20.一种计算机可读取记录介质,用于记录文件信息输入程序,该文件信息输入程序用于识别实际文件中的信息,并把所述识别信息输入到由计算机显示的文件,该程序使计算机执行以下步骤:
指定所述实际文件中要处理的区域;
判定所述要处理的区域具有文本属性、表属性和图属性中的哪种属性;
检测所述要处理的区域;
读取所述要处理的区域的图像;
把所述要处理的区域的图像识别为文本信息;以及
把所述用于识别所述图像的步骤的结果粘贴到由计算机显示的所述文件的相关位置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP217386/2002 | 2002-07-26 | ||
JP2002217386A JP2004062350A (ja) | 2002-07-26 | 2002-07-26 | 文書情報入力プログラム、文書情報入力装置、および文書情報入力方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1484165A true CN1484165A (zh) | 2004-03-24 |
Family
ID=30767971
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA031498140A Pending CN1484165A (zh) | 2002-07-26 | 2003-07-25 | 文件信息的输入设备,输入方法,输入程序以及记录介质 |
Country Status (4)
Country | Link |
---|---|
US (1) | US7280693B2 (zh) |
JP (1) | JP2004062350A (zh) |
KR (1) | KR20040010364A (zh) |
CN (1) | CN1484165A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1940912B (zh) * | 2005-09-28 | 2010-05-26 | 精工爱普生株式会社 | 文件作成系统、文件作成方法 |
CN101183355B (zh) * | 2006-11-15 | 2010-10-06 | 富士通株式会社 | 复制和粘贴处理方法及装置 |
WO2011009343A1 (zh) * | 2009-07-21 | 2011-01-27 | 上海合合信息科技发展有限公司 | 字符输入方法及系统、电子设备及其键盘 |
WO2011079432A1 (en) * | 2009-12-29 | 2011-07-07 | Nokia Corporation | Method and apparatus for generating a text image |
CN101667251B (zh) * | 2008-09-05 | 2014-07-23 | 三星电子株式会社 | 具备辅助定位功能的ocr识别方法和装置 |
CN104020847A (zh) * | 2014-05-15 | 2014-09-03 | 上海合合信息科技发展有限公司 | 字符输入方法及装置 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006209687A (ja) * | 2005-01-31 | 2006-08-10 | Sony Corp | データ処理回路 |
US7787158B2 (en) * | 2005-02-01 | 2010-08-31 | Canon Kabushiki Kaisha | Data processing apparatus, image processing apparatus, data processing method, image processing method, and programs for implementing the methods |
JP4920928B2 (ja) * | 2005-08-08 | 2012-04-18 | キヤノン株式会社 | 画像処理装置及びその制御方法、プログラム |
JP2008276487A (ja) * | 2007-04-27 | 2008-11-13 | Fuji Xerox Co Ltd | 文書処理プログラム、文書処理装置及び文書処理システム |
JP5849389B2 (ja) * | 2010-11-04 | 2016-01-27 | 株式会社リコー | 撮像装置および撮像方法 |
JP6337678B2 (ja) * | 2014-07-31 | 2018-06-06 | ブラザー工業株式会社 | プログラム、情報処理装置および情報処理装置の制御方法 |
JP6540597B2 (ja) * | 2016-05-17 | 2019-07-10 | 京セラドキュメントソリューションズ株式会社 | 情報処理装置、情報処理方法及びプログラム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5258855A (en) * | 1991-03-20 | 1993-11-02 | System X, L. P. | Information processing methodology |
JP3173067B2 (ja) * | 1991-10-17 | 2001-06-04 | 富士ゼロックス株式会社 | グラフ作成装置および方法 |
JPH11203403A (ja) | 1998-01-16 | 1999-07-30 | Oki Electric Ind Co Ltd | 情報処理装置 |
JP2000331117A (ja) | 1999-05-24 | 2000-11-30 | Oki Electric Ind Co Ltd | 文書読取システム |
JP2001297303A (ja) * | 2000-02-09 | 2001-10-26 | Ricoh Co Ltd | 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体 |
US7162084B2 (en) * | 2003-01-29 | 2007-01-09 | Microsoft Corporation | System and method for automatically detecting and extracting objects in digital image data |
US7305612B2 (en) * | 2003-03-31 | 2007-12-04 | Siemens Corporate Research, Inc. | Systems and methods for automatic form segmentation for raster-based passive electronic documents |
-
2002
- 2002-07-26 JP JP2002217386A patent/JP2004062350A/ja active Pending
-
2003
- 2003-06-25 US US10/602,624 patent/US7280693B2/en not_active Expired - Fee Related
- 2003-07-24 KR KR1020030050906A patent/KR20040010364A/ko not_active Application Discontinuation
- 2003-07-25 CN CNA031498140A patent/CN1484165A/zh active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1940912B (zh) * | 2005-09-28 | 2010-05-26 | 精工爱普生株式会社 | 文件作成系统、文件作成方法 |
CN101183355B (zh) * | 2006-11-15 | 2010-10-06 | 富士通株式会社 | 复制和粘贴处理方法及装置 |
CN101667251B (zh) * | 2008-09-05 | 2014-07-23 | 三星电子株式会社 | 具备辅助定位功能的ocr识别方法和装置 |
WO2011009343A1 (zh) * | 2009-07-21 | 2011-01-27 | 上海合合信息科技发展有限公司 | 字符输入方法及系统、电子设备及其键盘 |
US10248878B2 (en) | 2009-07-21 | 2019-04-02 | Intsig Information Co., Ltd. | Character input method and system as well as electronic device and keyboard thereof |
WO2011079432A1 (en) * | 2009-12-29 | 2011-07-07 | Nokia Corporation | Method and apparatus for generating a text image |
CN104020847A (zh) * | 2014-05-15 | 2014-09-03 | 上海合合信息科技发展有限公司 | 字符输入方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
US7280693B2 (en) | 2007-10-09 |
JP2004062350A (ja) | 2004-02-26 |
KR20040010364A (ko) | 2004-01-31 |
US20040017940A1 (en) | 2004-01-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1143239C (zh) | 用来分析表格图像的方法和设备 | |
CN1103518C (zh) | 数据发送/接收装置 | |
CN1145872C (zh) | 手写汉字自动分割和识别方法以及使用该方法的系统 | |
JP5699623B2 (ja) | 画像処理装置、画像処理システム、画像処理方法、および、プログラム | |
CN1484165A (zh) | 文件信息的输入设备,输入方法,输入程序以及记录介质 | |
CN1834992A (zh) | 检测文档图像中的字符的方向 | |
CN101059814A (zh) | 图像处理设备与图像处理方法 | |
CN1609846A (zh) | 用于识别,锚定和回流数字墨水注释的数字墨水注释方法和系统 | |
CN1258894A (zh) | 用于识别字符的装置和方法 | |
US11341733B2 (en) | Method and system for training and using a neural network for image-processing | |
CN101051367A (zh) | 信息管理方法和信息管理系统 | |
CN1874395A (zh) | 图像处理装置、图像处理方法及计算机产品 | |
CN1711559A (zh) | 特征区域提取装置、特征区域提取方法和特征区域提取程序 | |
CN101039369A (zh) | 电子邮件编辑设备、图像形成装置以及电子邮件编辑方法 | |
CN101079952A (zh) | 图像处理方法和图像处理设备 | |
CN1838725A (zh) | 记录数据记录装置和记录数据记录方法 | |
CN1991865A (zh) | 从复杂背景文档图像提取文本的装置、方法、程序及介质 | |
CN1677430A (zh) | 边界提取方法,程序,及使用该方法和程序的装置 | |
US11245803B2 (en) | Information processing apparatus and non-transitory computer readable medium storing information processing program | |
CN1292377C (zh) | 便携终端的字符识别中的处理对象选择方法及便携终端 | |
CN1173682A (zh) | 利用标准笔划识别输入字符的在线字符识别系统 | |
CN1351312A (zh) | 字符识别方法、程序以及记录介质 | |
CN1825892A (zh) | 信息提取方法,信息提取装置,信息提取程序及存储介质 | |
CN1838112A (zh) | 翻译装置、翻译方法及存储介质 | |
JP4232679B2 (ja) | 画像形成装置およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |