CN113497860B - 提供属性信息的图像处理系统、图像处理方法及存储介质 - Google Patents
提供属性信息的图像处理系统、图像处理方法及存储介质 Download PDFInfo
- Publication number
- CN113497860B CN113497860B CN202110346079.3A CN202110346079A CN113497860B CN 113497860 B CN113497860 B CN 113497860B CN 202110346079 A CN202110346079 A CN 202110346079A CN 113497860 B CN113497860 B CN 113497860B
- Authority
- CN
- China
- Prior art keywords
- mouse
- character
- image
- area
- character area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims abstract description 73
- 238000003672 processing method Methods 0.000 title claims abstract description 5
- 238000004458 analytical method Methods 0.000 claims description 12
- 230000008859 change Effects 0.000 claims description 2
- 238000000034 method Methods 0.000 description 39
- 230000008569 process Effects 0.000 description 31
- 230000006870 function Effects 0.000 description 26
- 230000004044 response Effects 0.000 description 24
- 238000010586 diagram Methods 0.000 description 17
- 238000010191 image analysis Methods 0.000 description 15
- 230000005540 biological transmission Effects 0.000 description 7
- 239000003086 colorant Substances 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000013523 data management Methods 0.000 description 4
- 238000013500 data storage Methods 0.000 description 4
- 238000012015 optical character recognition Methods 0.000 description 4
- 239000011521 glass Substances 0.000 description 3
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 239000000344 soap Substances 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/0035—User-machine interface; Control console
- H04N1/00405—Output means
- H04N1/00408—Display of information to the user, e.g. menus
- H04N1/0044—Display of information to the user, e.g. menus for image preview or review, e.g. to help the user position a sheet
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/94—Hardware or software architectures specially adapted for image or video understanding
- G06V10/945—User interactive design; Environments; Toolboxes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/94—Hardware or software architectures specially adapted for image or video understanding
- G06V10/95—Hardware or software architectures specially adapted for image or video understanding structured as a network, e.g. client-server architectures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00132—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture in a digital photofinishing system, i.e. a system where digital photographic images undergo typical photofinishing processing, e.g. printing ordering
- H04N1/00161—Viewing or previewing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00204—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
- H04N1/00244—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server with a server, e.g. an internet server
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/04—Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/40—Picture signal circuits
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/40—Picture signal circuits
- H04N1/40062—Discrimination between different image types, e.g. two-tone, continuous tone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/41—Bandwidth or redundancy reduction
- H04N1/411—Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures
- H04N1/413—Systems or arrangements allowing the picture to be reproduced without loss or modification of picture-information
- H04N1/417—Systems or arrangements allowing the picture to be reproduced without loss or modification of picture-information using predictive or differential encoding
- H04N1/4177—Systems or arrangements allowing the picture to be reproduced without loss or modification of picture-information using predictive or differential encoding encoding document change data, e.g. form drop out data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/0077—Types of the still picture apparatus
- H04N2201/0094—Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Human Computer Interaction (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Facsimiles In General (AREA)
- User Interface Of Digital Computer (AREA)
- Processing Or Creating Images (AREA)
Abstract
本发明涉及提供属性信息的图像处理系统、图像处理方法及存储介质。在本公开的图像处理系统中,显示设置窗口,该设置窗口至少包括预览扫描图像的预览区域和输入关于扫描图像的属性信息的文本字段,在将鼠标悬停在设置窗口中预览的扫描图像内的字符区域的情况下,进行控制以在文本字段中初步显示与鼠标悬停的字符区域相对应的字符串,并且在用鼠标点击鼠标悬停的字符区域的情况下,进行控制以固定在文本字段中初步显示的字符串。
Description
技术领域
本公开涉及一种用于对扫描图像设置属性信息的图像处理系统。
背景技术
传统的图像处理系统扫描纸质商业表单并将其数字化,基于商业表单的记载内容来对数字化商业表单的扫描图像设置诸如文件名等的属性,从而管理商业表单。设置这种属性的一种方法是基于通过对商业表单的扫描图像进行字符识别处理而获得的识别结果来设置属性的方法。
在如上所述的系统中,一种可想到的方法是响应于在对商业表单图像进行字符识别之后显示的预览图像中的字符区域上的点击,来将图像中的字符设置为属性。日本特开第2001-154779号公报公开了,作为用于清楚地指示用户想要设置的字符并防止对字符区域的点击操作中的错误选择的处理方法,当指点较大字符时,显示较大的鼠标光标,当指点较小字符时,显示较小的鼠标光标。
发明内容
在本公开的图像处理系统中,该图像处理系统包括:显示单元,其显示设置窗口,该设置窗口至少包括预览扫描图像的预览区域和输入关于扫描图像的属性信息的文本字段;以及控制单元,当将鼠标悬停在设置窗口中预览的扫描图像内的字符区域时,进行控制以在文本字段中初步显示与鼠标悬停的字符区域相对应的字符串,并且当用鼠标点击鼠标悬停的字符区域时,进行控制以将在文本字段中初步显示的字符串固定。
通过以下参照附图对示例性实施例的描述,本公开的其他特征将变得清楚。
附图说明
图1是例示本公开的总体构造的图。
图2是MFP的硬件构造图。
图3是客户端PC和MFP协同服务服务器的硬件构造图。
图4是本公开的软件构造图。
图5是例示各设备之间的处理流程的序列图。
图6A是例示在MFP的操作单元上显示的窗口的示例的图。
图6B是例示在MFP的操作单元上显示的窗口的示例的图。
图7是本公开中的扫描图像的字符区域的显示处理的流程。
图8A和图8B是例示第二实施例中的MFP的操作单元上的窗口的示例的图。
具体实施方式
图1是例示第一实施例的系统的硬件的整体构造的图。图像处理系统包括作为图像处理装置的多功能外围设备(MFP)110、客户端PC 111、MFP协同服务服务器120和云存储(cloud storage)130。MFP 110和客户端PC 111经由局域网(LAN)112以可通信的方式连接到服务器,该服务器在互联网上提供各种服务。
MFP 110是具有诸如扫描仪或打印机等的多种功能的多功能机,并且是图像处理装置的示例。
客户端PC 111是接收从MFP协同服务服务器120请求的服务的计算机。
MFP协同服务服务器120是具有以下功能的服务器:将由MFP 110扫描的图像文件存储在其自身的服务器上,或者将这样的图像文件传输到可以存储文件的服务,诸如另一存储服务。
云存储130对应于可以经由互联网存储文件或获取网络浏览器上的文件的服务。
注意,尽管本实施例的图像处理系统具有由MFP 110、客户端PC 111、MFP协同服务服务器120和云存储130形成的构造,但是该构造不限于此。例如,MFP 110可以具有客户端PC 111和MFP协同服务服务器120两者的角色。此外,替代布置在互联网上,MFP协同服务服务器120可以布置在LAN 112上的服务器中。此外,云存储130可以用邮件服务器等代替,并将扫描图像附加到邮件并发送该邮件。
图2是MFP 110的硬件构造图。MFP 110由控制单元210、操作单元220、打印机单元221、扫描仪单元222和调制解调器223形成。控制单元210由经由系统总线240彼此连接的下述单元211至219形成,并控制MFP 110的整体操作。CPU 211读取存储在ROM 212中的控制程序,并执行和控制MFP 110的各种功能,诸如读取、打印或通信。RAM 213用作诸如CPU 211的主存储器、工作区域等的临时存储区域。注意,尽管单个CPU 211使用单个存储区域(RAM213或HDD 214)以进行在本实施例中稍后描述的流程图中例示的各处理,但实施例不限于此。例如,可以多个CPU或多个RAM或HDD协作地进行各处理。HDD 214是存储图像数据或各种程序的大容量存储单元。
操作单元I/F 215是将操作单元220与控制单元210彼此连接的接口。操作单元220配备有触摸面板或键盘等,并且接受用户操作、输入或指令。
打印机I/F 216是将打印机单元221和控制单元210彼此连接的接口。用于打印的图像数据经由打印机I/F 216从控制单元210传输到打印机单元221,并打印在记录介质上。扫描仪I/F 217是将扫描仪单元222和控制单元210彼此连接的接口。扫描仪单元222读取放置在原稿玻璃台(未例示)或自动原稿进给器(ADF)上的原稿,生成图像数据,并将所生成的图像数据经由扫描仪I/F 217输入至控制单元210。对于扫描仪单元222生成的图像数据,除了从打印机单元221打印输出(复印)之外,MFP 110还可以进行文件发送或邮件发送。调制解调器I/F 218是将调制解调器223连接至控制单元210的接口。调制解调器223用PSTN上的传真装置进行图像数据的传真通信。网络I/F 219是将控制单元210(MFP110)连接至LAN112的接口。MFP 110通过使用网络I/F 219向互联网上的各服务发送图像数据或信息,或者接收各种信息。
图3是客户端PC 111和MFP协同服务服务器120的硬件构造图。客户端PC 111和MFP协同服务服务器120中的各个是所谓的信息处理装置,并且由经由系统总线316彼此连接的CPU 311、ROM 312、RAM 313、HDD 314和网络I/F 315形成。
CPU 311读取存储在ROM 312中的控制程序以进行各种处理,从而控制整体操作。RAM 313用作诸如CPU 311的主存储器、工作区域等的临时存储区域。HDD 314是存储图像数据或各种程序的大容量存储单元。网络I/F 315是将客户端PC 111、MFP协同服务服务器120和云存储130连接到网络的接口。客户端PC 111连接到本地部署的LAN 112,并且MFP协同服务服务器120和云存储130经由本地部署的LAN 112连接到互联网。此外,响应于来自另一装置(MFP 110等)的处理请求,MFP协同服务服务器120和云存储130经由网络I/F 315发送和接收各种信息。
图4是根据本实施例的图像处理系统的软件构造图。
MFP 110通常被划分为两个,即,本机功能单元410和附加功能单元420。包括在本机功能单元410中的各单元典型地被提供给MFP 110,并且附加功能单元420是附加地安装到MFP 110中的应用。附加功能单元420是基于Java(注册商标)的应用,并且可以容易地实现对MFP 110的功能的增加。注意,可以在MFP 110中安装其他附加应用(未例示)。本机功能单元410具有扫描执行单元411和图像数据存储单元412。附加功能单元420具有显示控制单元421、扫描指令单元422和协同服务请求单元423。
显示控制单元421在MFP 110的操作单元220的、具有触摸面板功能的液晶显示单元上显示用于接受用户操作的UI窗口。例如,显示控制单元421显示UI窗口,诸如用于对访问MFP协同服务服务器120的认证信息的输入、扫描的设置和扫描的开始的操作的窗口、预览窗口等。
扫描指令单元422根据经由UI窗口输入的用户指令以及扫描设置,请求扫描执行单元411进行扫描处理。
扫描执行单元411从扫描指令单元422接收包括扫描设置的扫描请求。扫描执行单元411根据扫描请求,生成放置在原稿玻璃台上并由扫描仪单元222经由扫描仪I/F 217读取的原稿的扫描图像数据。所生成的扫描图像数据被发送到图像数据存储单元412。此外,扫描执行单元411将唯一指示所存储的扫描图像数据的扫描图像标识符发送到扫描指令单元422。扫描图像标识符是用于唯一地识别由MFP 110扫描的图像的一串数字、符号、字母等(未例示)。图像数据存储单元412将从扫描执行单元411接收的扫描图像数据存储在HDD214中。
扫描指令单元422从图像数据存储单元412获取与从扫描执行单元411接收的扫描图像标识符相对应的扫描图像数据。扫描指令单元422请求协同服务请求单元423指示MFP协同服务服务器120处理获取的扫描图像数据。
协同服务请求单元423请求MFP协同服务服务器120进行各种处理,例如登录、扫描图像的分析、扫描图像的发送等。协同服务请求单元423通过使用诸如REST或SOAP的协议与MFP协同服务服务器120进行通信,然而也可以使用其他通信方式。
MFP协同服务服务器120具有请求控制单元431、图像处理单元432、云存储访问单元433、数据管理单元434和显示控制单元435。
请求控制单元431一直处于能够接收来自外部装置的请求的待机状态。响应于接收到处理请求,请求控制单元431指示图像处理单元432、云存储访问单元433和数据管理单元434根据请求适当地进行处理。
图像处理单元432对图像进行识别处理或图像加工处理,诸如字符区域分析、光学字符识别(OCR)、类似商业表单确定(将在稍后描述的图5的S510的处理中描述)、图像的旋转或倾斜的校正等。
云存储访问单元433请求云存储130进行处理。通常,云服务公开各种接口,这些接口用于通过使用诸如REST或SOAP等协议将文件存储在云存储中或获取存储的文件。云存储访问单元433通过使用公开的云存储的接口来操作云存储130。
数据管理单元434保持由MFP协同服务服务器120管理的用户信息、各种设置数据等。
显示控制单元435响应于在经由互联网连接的诸如PC或移动电话等的另一终端(未例示)上操作的网络浏览器的请求,返回窗口显示所需的窗口构造信息(HTML、CSS等)。用户可以经由网络浏览器中显示的窗口来确认在MFP协同服务服务器120中登记的用户信息,或者在进行扫描时改变设置。
注意,尽管在图4中例示了将附加功能单元420安装在MFP 110中的构造的示例,但本发明不限于这种构造,并且附加功能单元420的功能可以包括在客户端PC 111中。
图5是例示当将由MFP 110扫描的图像处理为文件并将该文件发送至云存储时各个装置之间的处理流程的序列图。在该示例中,主要描述各个装置之间的通信。注意,尽管图5例示了MFP 110与MFP协同服务服务器120进行通信的操作,但是代替MFP 110,可以由客户端PC 111进行稍后描述的分析结果的获取、窗口的显示、学习的指令等。
MFP 110在操作单元220的触摸面板上显示主窗口,在该主窗口中以通常状态布置用于实现要提供的各个功能的按钮。当在MFP 110中安装了用于扫描商业表单并将其图像文件发送到云存储130的附加应用(以下称为“扫描应用”)时,则在MFP 110的主窗口上显示用于使用该应用的功能的按钮。当按下该按钮时,则显示用于将扫描的商业表单发送到云存储130的窗口,并且进行图5的序列中例示的处理。
在S501中,扫描应用显示用于输入用于访问MFP协同服务服务器120的认证信息的登录窗口(未例示)。
在S502中,响应于用户将用户ID等输入到登录窗口,扫描应用请求登录MFP协同服务服务器120。
在S503中,MFP协同服务服务器120将登录请求中包括的用户名和密码与数据管理单元434管理的用户信息进行匹配并检查,以确定该用户名和密码是否正确,如果正确,则将访问令牌返回给MFP 110。随后从MFP 110向MFP协同服务服务器120发出的各种请求与该访问令牌一起提供,并且可以通过该访问令牌来识别要处理的用户。通过使用公知的方式(使用基本认证的授权、摘要式认证、使用OAuth的认证等)来进行用户认证方法。
MFP 110响应于登录处理的完成而在S504中显示扫描设置窗口。用户进行与各种扫描读取有关的设置,将要扫描的纸质商业表单放在原稿玻璃台或ADF上,并按下“扫描开始”按钮。作为响应,在S505中,MFP 110进行扫描并生成从纸质商业表单数字化的扫描图像的数据。
在随后的S506中,MFP 110将扫描图像的分析请求与通过扫描处理生成的图像一起发送到MFP协同服务服务器120。
在S507中,MFP协同服务服务器120的请求控制单元431响应于接收到扫描图像的分析请求而请求从图像处理单元432进行图像分析。然后,MFP协同服务服务器120的请求控制单元431将“处理ID”返回到MFP 110,而无需等待图像分析处理的结束,“处理ID”是唯一地识别对所请求的扫描图像的分析请求的标识符。
另一方面,已经接收到图像分析请求的MFP协同服务服务器120的图像处理单元432进行图像分析处理(S508至S510)。
在图像分析处理的S508中,图像处理单元432分析图像中存在的字符区域。这是为了分析关于字符区域的布置信息等。
随后,在S509中,图像处理单元432通过使用关于商业表单内字符区域的布置信息,将关于过去扫描的图像的布置信息与关于当前扫描的图像的布置信息进行比较,并确定是否扫描具有相似字符区域布置的图像。该处理称为类似商业表单确定。通过稍后描述的S517的处理,来存储在该确定中使用的关于过去扫描图像的信息并进行累积。
然后,在S510中,基于确定结果,对所分析的字符区域进行字符识别处理。注意,稍后将参照图7描述基于S508至S510的图像分析处理的结果的显示处理的详情。
另一方面,在S511中,MFP 110使用在S506的响应中接收到的“处理ID”来周期性地(例如,大约每几百毫秒到几毫秒等)跟MFP协同服务服务器120确认与“处理ID”有关的扫描图像的分析处理的状态。尽管未例示,但是S511的处理周期性地继续直到获取MFP协同服务服务器120的图像处理完成的响应(直到S512的定时)为止。响应于接收到S511的对处理状态确认的请求,MFP协同服务服务器120的请求控制单元431确认“处理ID”的处理状态,并返回处理状态作为响应。
在这种响应中,指示当前处理状态的字符串被存储在“状态”中。例如,当“状态”为“处理中”时,这指示MFP协同服务服务器120正在处理中,而当“状态”为“完成”时,这指示处理完成的状态。请注意,当处理失败时,可以返回诸如“失败”的其他状态。此外,处理完成时(“状态”为“完成”时)的响应包括状态以及关于扫描图像的分析结果、扫描设置等的信息。当图像分析处理结束时,从图像处理单元432向请求控制单元431发出指示图像分析处理完成的通知。
在MFP协同服务服务器120中完成图像分析处理之后,当在S512中MFP 110与MFP协同服务服务器120确认处理状态时,从请求控制单元431返回指示图像分析处理完成的处理状态的响应。
随后,在S513中,MFP 110向请求控制单元431请求获取图像分析结果,并从请求控制单元431接收与分析结果有关的响应。然后MFP 110从存储有响应中包括的结果信息的URL获取图像分析结果信息。当存在类似商业表单时,还包括作为图像分析结果的属性信息。MFP 110在操作单元220上显示扫描商业表单列表窗口600(图6A)。
在S514中,一旦用户从操作单元220上显示的扫描商业表单列表窗口600中选择了扫描图像,MFP 110就在操作单元220上显示用于设置诸如文件名的属性信息的属性设置窗口610(图6B)。注意,尽管在图6B中将设置文件名和与公司名称相对应的值的示例例示为属性信息,但是属性(项目名称)的类型不限于此。例如,作为属性,可以新添加诸如地址或数额的属性(项目名称),并且能够设置与之相对应的属性值。稍后将描述属性设置窗口610的详情。
用户在属性设置窗口中为扫描的商业表单设置属性信息之后,按下“OK”按钮。在S515中,MFP 110通过使用用于设置属性的、关于字符区域的信息作为输入信息,向MFP协同服务服务器120发送学习商业表单的请求。
在S516中,接收到用于设置属性的关于字符区域的信息的MFP协同服务服务器120的请求控制单元431请求图像处理单元432学习商业表单。
在S517中,图像处理单元432将关于整个图像的字符区域的信息和在S516中接收的用户用于设置属性的、关于字符区域的信息存储为用于学习的输入信息。
此外,在S518中,如果存在与在S517中存储的商业表单类似的商业表单,则MFP协同服务服务器120再次进行类似商业表单确定处理。当学习结束时,MFP协同服务服务器120向MFP 110通知学习结束。这里,学习是将商业表单和关于商业表单的字符区域的布置信息的数据彼此关联地存储的操作。
然后,在S519中,MFP 110向MFP协同服务服务器120发送扫描图像和在将扫描图像处理成文件之后设置的诸如文件名等的属性信息。响应于接收到请求,MFP协同服务服务器120回复MFP 110以指示已经成功接收到该请求。响应于接收到对发送的响应,MFP 110结束处理并且移回到S504的扫描设置窗口的显示。
在S520中,MFP协同服务服务器120的请求控制单元431开始文件生成处理。这里,MFP协同服务服务器120从MFP协同服务服务器120中登记的扫描设置,获取要发送到云存储130的关于文件格式的信息,并基于该设置从扫描图像生成文件。
然后,在S521中,MFP协同服务服务器120的请求控制单元431设置在S519中接收到的属性信息,并将生成的文件发送到云存储130。响应于接收到该文件,云存储130向MFP协同服务服务器120返回发送完成的响应。
图6A和图6B是例示由MFP 110显示的窗口的示例的图。这些窗口的显示控制由显示控制单元421进行。注意,可以如前所述在客户端PC111上显示这样的窗口。
图6A是例示扫描商业表单列表窗口600的示例的图。该窗口使得能够在完成扫描和图像分析处理之后并且在向云存储130发送之前查看商业表单的列表(图5的S513)。此外,该窗口由扫描商业表单列表601、发送按钮602、编辑按钮603和删除按钮604组成。
扫描商业表单列表601是显示扫描和图像分析处理(S505至S510)完成的商业表单列表的区域。该区域由商业表单名称605、目的地606、状态607和类型608的字段组成。商业表单名称605是唯一识别商业表单名称的标识符。目的地606是作为商业表单的文件的目的地的云存储130的名称。状态607指示对商业表单进行类似商业表单确定时的结果,并且显示“尚未学习”或“已学习”。“尚未学习”是指确定不存在类似商业表单,而“已学习”是指确定存在类似商业表单。类型608表示商业表单的类型。例如,显示“估价(estimate)”或“发票(invoice)”。此外,对于状态607为“已学习”的商业表单,显示该商业表单对应的发票格式的详细类型,诸如“发票AAA”或“发票BBB”。这与通过类似商业表单确定处理确定的最佳类似商业表单相关联。
发送按钮602是用于将商业表单发送到云存储130的按钮。用户可以从扫描商业表单列表601中选择任何商业表单,并按下发送按钮602以进行向显示在目的地606中的云存储130的发送。注意,在成功完成发送时,从列表中删除该商业表单。
编辑按钮603是用于移动到稍后描述的属性设置窗口610的按钮。用户可以从扫描商业表单列表601中选择任何商业表单并按下编辑按钮603,窗口从而移动到用于所选择的商业表单的属性设置窗口610(图6B),这使得用户能够编辑属性设置。
删除按钮604是用于删除商业表单的按钮。用户可以从扫描商业表单列表601中选择任何商业表单,并且按下删除按钮604以删除所选择的商业表单。
图6B是例示属性设置窗口610(图5的S514)的示例的图。属性区域611是显示由用户设置的属性信息的区域。在属性区域611中,显示用于输入属性信息的文本字段618和稍后描述的字符区域的裁剪图像(cutout image)619。当未选择字符区域时,在文本字段为空且未设置裁剪图像的状态下显示属性区域611。此外,可通过点击等来选择的字符区域可以用改变的背景颜色的方式显示或者用包围所选字符区域的框的方式显示,使得用户可以识别该字符区域。
预览区域612显示扫描图像。当将鼠标悬停在图像的字符区域时,字符区域以包围字符区域的彩色框线的方式显示或以改变其颜色的方式显示,使得用户可以识别鼠标悬停的字符区域。此外,在文本字段618中初步显示字符区域的字符串。此外,在裁剪图像619中初步显示字符区域的裁剪图像。每当鼠标悬停的字符区域改变时,切换文本字段618和裁剪图像619。此时,为了通知用户所显示的是初步设置,以与通过在字符区域上进行点击来固定选择(稍后描述)时所应用的显示形式不同的显示形式,来显示字符区域的框线或裁剪图像。将参照图7的流程图描述详情。然后,当用鼠标点击鼠标悬停的字符区域时,对与点击位置相对应的字符区域的选择被固定。为了使选择被固定可视化,选择被固定的字符区域用诸如线或框线的图形、背景颜色等显示。注意,对于要设置的各个属性,可以用不同的颜色显示所选字符区域的框,或者当针对单个属性选择多个字符区域时,各个字符区域的颜色可以是不同的颜色。此外,可以改变预览显示位置,使得选择的字符区域位于中心,或者可以改变放大率。此外,还可以用改变的显示颜色来显示在文本字段618中初步显示的字符串,以使得字符串被固定可视化。例如,文本字段的字符串在初步显示期间可以用灰色字符显示,并且在固定后可以用黑色字符显示。
当再次点击曾经选择的字符区域时,选择被取消,并且对应文件名的字符串被删除,回到对字符区域添加的线及颜色均不显示的状态。在示例中例示,当字符串处于未选择状态时,在预览上不显示字符区域。
然而,为了向用户指示可以点击哪个区域,可以使用带有颜色或框线的显示来使字符区域可区分。此外,可以通过按钮等在显示状态和非显示状态之间切换用于区分字符区域的显示。此外,当在预览区域上进行滑动操作时,在预览区域中显示的图像的位置被移动。
字符区域删除按钮613用于删除链接到字符区域删除按钮613的字符区域和更新与字符区域有关的属性区域611。具体地,删除文本字段618的对应字符串,并且将裁剪图像619设置为非设定状态。
预览放大按钮614增大在预览区域中显示的图像的放大率。预览缩小按钮615减小在预览区域中显示的图像的放大率。注意,调整显示位置,使得放大或缩小之后的预览区域的中心坐标与放大或缩小之前的预览区域的中心坐标相同。在通过滑动操作移动了预览图像的显示位置或者通过按下预览放大按钮或预览缩小按钮改变了显示倍率的情况下,预览初始显示按钮616用于将显示倍率和显示位置恢复到初始状态。
OK按钮617用于将扫描的图像与由属性设置窗口610设置的文件名一起发送到MFP协同服务服务器120,并且进行机器学习处理(S515至S518)。响应于发送完成,窗口返回到扫描商业表单列表窗口600。
图7是例示当将鼠标悬停在字符区域时,该系统中的显示处理的详情的流程图。当光标位于预览窗口上时,重复进行此处理。
首先,在S1中,确定鼠标悬停的位置是否在字符区域中。如果在S1中确定鼠标悬停位置在字符区域中(是),则处理进行到S2,如果在S1中确定鼠标悬停位置不在字符区域中(否),则处理进行到S7。
如果鼠标悬停位置在字符区域中,则在S2中,显示鼠标悬停的字符区域以使用户能够识别。例如,用诸如线或框线等的图形显示字符区域,或者用改变的背景颜色显示字符区域。
在随后的S3中,沿着鼠标悬停的字符区域的框裁剪图像,从而提取裁剪图像。
在S4中,提取鼠标悬停的字符区域中的字符串。在S4时,可以进行OCR处理,并且可以提取字符串。此外,可以预先对预览图像内的整个字符区域进行OCR处理,或者可以获取在S510中对整个字符区域进行的字符识别处理的结果,并将其用作对S513的分析结果的获取请求的响应。
在S5中,在属性区域中显示在S3中提取的裁剪图像619。此外,在S6中,将在S4中提取的字符串显示在属性区域的文本字段618中,并且该流程结束。
注意,如果在S1中确定鼠标悬停位置不在字符区域中,则在S7中,移除添加到该字符区域的框或线,属性区域的裁剪图像和文本字段恢复到原始显示,并且该流程结束。
接下来,将描述第二实施例。在第一实施例中,当在图7的确定处理中将鼠标悬停在字符区域时,在属性区域中显示字符区域的裁剪图像和字符串,并且这使得用户能够确认是否设置了正确的字符区域。但是,由于只有将鼠标悬停在字符区域,才以可识别的方式将诸如框或线等的图形或颜色添加到字符区域,因此用户不太可能意识到字符区域上的鼠标悬停操作。在第二实施例中,将描述当将鼠标悬停在显示预览图像的预览区域时向预览图像内的整个字符区域添加诸如框、线等的图形或颜色的示例。
图8A和图8B是例示属性设置窗口610的示例的图。
图8A例示了鼠标光标801在预览图像802的区域之外的情况。在该时间点,诸如框或线的图形或颜色都不被添加到预览图像802内的字符区域。
另一方面,当鼠标光标801在预览图像的区域内时,如图8B所示,添加诸如框或线等的图形或颜色,使得预览图像802内的整个字符区域(803)可被识别。然后,在该状态下,如在第一实施例中所述,当将鼠标悬停在预览图像内的字符区域上时,将与添加到整个字符区域的颜色或图形不同的颜色或图形添加到鼠标悬停的字符区域,从而以可识别的方式显示字符区域。
其他实施例
已经将本发明描述为结合了图像处理装置(MFP)、MFP协同服务服务器和云存储的系统,但是,可以在其他装置中分别提供描述的各功能。例如,可以在图像处理装置(MFP)中提供所有功能,或者服务服务器(service server)可以是具有存储功能的服务器。
此外,在本发明中,尽管根据关于商业表单的字符区域的布置信息来确定类似商业表单,但是也可以使用学习了关于字符区域的布置信息与商业表单之间的关系的神经网络来进行确定。
此外,本发明中的图像的字符区域的选择功能适用于可以显示图像并且可以选择图像的任何信息处理装置。
还可以通过读出并执行记录在储存介质(也可更完整地称为“非暂时性计算机可读储存介质”)上的计算机可执行指令(例如,一个或更多个程序)以执行上述实施例中的一个或更多个的功能、并且/或者包括用于执行上述实施例中的一个或更多个的功能的一个或更多个电路(例如,专用集成电路(ASIC))的系统或装置的计算机,来实现本公开的实施例,并且,可以利用通过由所述系统或装置的所述计算机例如读出并执行来自所述储存介质的所述计算机可执行指令以执行上述实施例中的一个或更多个的功能、并且/或者控制所述一个或更多个电路执行上述实施例中的一个或更多个的功能的方法,来实现本发明的实施例。所述计算机可以包括一个或更多个处理器(例如,中央处理单元(CPU),微处理单元(MPU)),并且可以包括分开的计算机或分开的处理器的网络,以读出并执行所述计算机可执行指令。所述计算机可执行指令可以例如从网络或所述储存介质被提供给计算机。所述储存介质可以包括例如硬盘、随机存取存储器(RAM)、只读存储器(ROM)、分布式计算系统的存储器、光盘(诸如压缩光盘(CD)、数字通用光盘(DVD)或蓝光光盘(BD)TM)、闪存设备以及存储卡等中的一个或更多个。
本发明的实施例还可以通过如下的方法来实现,即,通过网络或者各种存储介质将执行上述实施例的功能的软件(程序)提供给系统或装置,该系统或装置的计算机或是中央处理单元(CPU)、微处理单元(MPU)读出并执行程序的方法。
尽管已经参照示例性实施例描述了本公开,但是应当理解,本发明不限于所公开的示例性实施例。所附权利要求的范围应被赋予最宽的解释,以涵盖所有这类变型例以及等同的结构和功能。
Claims (10)
1.一种图像处理系统,包括:
显示单元,其显示设置窗口,所述设置窗口至少包括预览扫描图像的预览区域和输入关于扫描图像的属性信息的文本字段;以及
控制单元,其在将鼠标悬停在设置窗口中预览的扫描图像内的字符区域的情况下,进行控制以在文本字段中初步显示与鼠标悬停的字符区域相对应的字符串并初步显示鼠标悬停的字符区域的裁剪图像,并且在用鼠标点击鼠标悬停的字符区域的情况下,进行控制以将在文本字段中初步显示的字符串固定。
2.根据权利要求1所述的图像处理系统,其中,在将鼠标悬停在设置窗口中预览的扫描图像内的字符区域的情况下,所述控制单元还改变鼠标悬停的字符区域的显示,使得在预览区域中显示的扫描图像中能够识别鼠标悬停的字符区域。
3.根据权利要求1所述的图像处理系统,其中,在将鼠标悬停在设置窗口中预览的扫描图像内的字符区域的情况下,所述控制单元还显示包围鼠标悬停的字符区域的框,使得在预览区域中显示的扫描图像中能够识别鼠标悬停的字符区域。
4.根据权利要求1所述的图像处理系统,其中,在鼠标光标进入所述预览区域的情况下,所述控制单元显示预览图像中的整个字符区域,以使得用户能够识别,并且,在将鼠标悬停在预览的扫描图像内的字符区域的情况下,进一步进行控制以与识别整个字符区域的显示的形式不同的形式改变鼠标悬停的字符区域的显示,使得在预览区域中显示的扫描图像中能够识别鼠标悬停的字符区域。
5.根据权利要求1所述的图像处理系统,所述图像处理系统还包括区域分析单元,所述区域分析单元通过对所述扫描图像进行区域分析来识别所述扫描图像内的字符区域。
6.根据权利要求1所述的图像处理系统,所述图像处理系统还包括字符识别单元,所述字符识别单元通过对所述扫描图像内的字符区域进行字符识别处理来获取与所述字符区域相对应的字符串。
7.根据权利要求1所述的图像处理系统,所述图像处理系统还包括存储单元,所述存储单元将由所述控制单元固定的字符串存储为关于所述扫描图像的属性信息。
8.根据权利要求7所述的图像处理系统,其中,所述存储单元将由所述控制单元固定的字符串存储在外部存储器中,作为关于所述扫描图像的属性信息。
9.一种图像处理方法,包括:
显示设置窗口,所述设置窗口至少包括预览扫描图像的预览区域和输入关于扫描图像的属性信息的文本字段;以及
在将鼠标悬停在设置窗口中预览的扫描图像内的字符区域的情况下,进行控制以在文本字段中初步显示与鼠标悬停的字符区域相对应的字符串并初步显示鼠标悬停的字符区域的裁剪图像,并且在用鼠标点击鼠标悬停的字符区域的情况下,进行控制以将在文本字段中初步显示的字符串固定。
10.一种存储有程序的计算机可读存储介质,其中,所述程序使计算机进行:
显示设置窗口,所述设置窗口至少包括预览扫描图像的预览区域和输入关于扫描图像的属性信息的文本字段;以及
在将鼠标悬停在设置窗口中预览的扫描图像内的字符区域的情况下,进行控制以在文本字段中初步显示与鼠标悬停的字符区域相对应的字符串并初步显示鼠标悬停的字符区域的裁剪图像,并且在用鼠标点击鼠标悬停的字符区域的情况下,进行控制以将在文本字段中初步显示的字符串固定。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020-067335 | 2020-04-03 | ||
JP2020067335A JP7542980B2 (ja) | 2020-04-03 | 2020-04-03 | 画像処理システム、画像処理方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113497860A CN113497860A (zh) | 2021-10-12 |
CN113497860B true CN113497860B (zh) | 2025-02-11 |
Family
ID=77922646
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110346079.3A Active CN113497860B (zh) | 2020-04-03 | 2021-03-31 | 提供属性信息的图像处理系统、图像处理方法及存储介质 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11528372B2 (zh) |
JP (1) | JP7542980B2 (zh) |
CN (1) | CN113497860B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023160049A (ja) * | 2022-04-21 | 2023-11-02 | キヤノン株式会社 | 情報処理装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106575203A (zh) * | 2014-08-12 | 2017-04-19 | 微软技术许可有限责任公司 | 与再现的内容的基于悬停的交互 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001154779A (ja) | 1999-11-25 | 2001-06-08 | Sharp Corp | マウスカーソル制御方法 |
US20020188669A1 (en) * | 2001-06-11 | 2002-12-12 | Levine Marc Jay | Integrated method for disseminating large spatial data sets in a distributed form via the internet |
US7188316B2 (en) * | 2003-03-24 | 2007-03-06 | Microsoft Corporation | System and method for viewing and editing multi-value properties |
US20070192719A1 (en) * | 2006-02-10 | 2007-08-16 | Microsoft Corporation | Hover indicator for objects |
JP5491774B2 (ja) | 2009-06-12 | 2014-05-14 | 株式会社東芝 | データエントリシステムおよびデータエントリ方法 |
JP2012009005A (ja) * | 2010-05-24 | 2012-01-12 | Pfu Ltd | 帳票処理システム、ocr装置、ocr処理プログラム、帳票作成装置、帳票作成プログラム、および帳票処理方法 |
US9015141B2 (en) * | 2011-02-08 | 2015-04-21 | The Nielsen Company (Us), Llc | Methods, apparatus, and articles of manufacture to measure search results |
US8953228B1 (en) * | 2013-01-07 | 2015-02-10 | Evernote Corporation | Automatic assignment of note attributes using partial image recognition results |
JP2014203219A (ja) | 2013-04-03 | 2014-10-27 | 日本電信電話株式会社 | エリア消費電力可視化システム |
US10146424B2 (en) * | 2014-02-28 | 2018-12-04 | Dell Products, Lp | Display of objects on a touch screen and their selection |
JP6370162B2 (ja) * | 2014-08-22 | 2018-08-08 | キヤノン株式会社 | 情報処理装置、情報処理方法、プログラム |
KR102399764B1 (ko) * | 2015-09-22 | 2022-05-19 | 삼성전자 주식회사 | 전자 장치 및 촬영 방법 |
JP6968647B2 (ja) * | 2017-10-03 | 2021-11-17 | キヤノン株式会社 | スキャン画像にファイル名を設定するための装置、その制御方法及びプログラム |
JP7034730B2 (ja) * | 2018-01-23 | 2022-03-14 | キヤノン株式会社 | スキャン画像に関連する情報を設定するための装置、方法、およびプログラム |
JP6983675B2 (ja) * | 2018-01-23 | 2021-12-17 | キヤノン株式会社 | スキャン画像に関連する情報を設定するための装置、方法、プログラム、およびシステム |
JP7077127B2 (ja) | 2018-05-09 | 2022-05-30 | キヤノン株式会社 | スキャン画像データに関連する情報を設定するための装置、方法、及びプログラム |
US10921975B2 (en) * | 2018-06-03 | 2021-02-16 | Apple Inc. | Devices, methods, and user interfaces for conveying proximity-based and contact-based input events |
-
2020
- 2020-04-03 JP JP2020067335A patent/JP7542980B2/ja active Active
-
2021
- 2021-03-30 US US17/217,256 patent/US11528372B2/en active Active
- 2021-03-31 CN CN202110346079.3A patent/CN113497860B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106575203A (zh) * | 2014-08-12 | 2017-04-19 | 微软技术许可有限责任公司 | 与再现的内容的基于悬停的交互 |
Also Published As
Publication number | Publication date |
---|---|
US20210314449A1 (en) | 2021-10-07 |
JP2021164132A (ja) | 2021-10-11 |
CN113497860A (zh) | 2021-10-12 |
JP7542980B2 (ja) | 2024-09-02 |
US11528372B2 (en) | 2022-12-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113225446B (zh) | 使文档计算机化的图像处理系统及其控制方法和存储介质 | |
US10075597B2 (en) | Image processing apparatus having file server function, and control method and storage medium therefor | |
CN113468944A (zh) | 用于获得字符串的信息处理装置 | |
CN115695667A (zh) | 信息处理设备及其控制方法和存储介质 | |
US12028490B2 (en) | Server for providing a setting screen with previously used settings to a client apparatus for image transmission | |
JP7225017B2 (ja) | タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム | |
EP4002085B1 (en) | Information processing system and program | |
CN115801963A (zh) | 服务器、控制服务器的方法和存储介质 | |
CN113497860B (zh) | 提供属性信息的图像处理系统、图像处理方法及存储介质 | |
JP2022113038A (ja) | 画像処理装置、方法、及びプログラム | |
US11800032B2 (en) | Apparatus, information processing method, and storage medium | |
US20230156138A1 (en) | Information processing apparatus, method of controlling information processing apparatus, and storage medium | |
US20140176995A1 (en) | Information processing system, information processing method, and storage medium | |
JP2024040612A (ja) | 情報処理装置、情報処理装置の制御方法、及びプログラム | |
JP2023167871A (ja) | 画像処理装置、情報処理装置、画像処理システム、画像処理方法、情報処理方法、およびプログラム | |
JP2021190834A (ja) | 情報処理装置、その処理方法、およびプログラム | |
JP7707862B2 (ja) | 情報処理システム、サービス提供システム、アプリ実行方法 | |
JP2024072113A (ja) | 情報処理装置、情報処理装置の処理方法およびプログラム | |
US20100095355A1 (en) | Information processing apparatus and information processing method | |
US11758060B2 (en) | Information processing apparatus, method of controlling information processing apparatus, and storage medium | |
JP2022083074A (ja) | 情報処理システム | |
JP2023071227A (ja) | 情報処理装置、情報処理装置の制御方法及びプログラム | |
JP2024032563A (ja) | 情報処理装置、情報処理装置の制御方法及びプログラム | |
JP2024032387A (ja) | 情報処理装置、情報処理装置の制御方法、及びプログラム | |
JP2024007023A (ja) | 画像処理システム、中継サーバ、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |