[go: up one dir, main page]

CN1578347A - 信息处理装置、信息处理方法及软件产品 - Google Patents

信息处理装置、信息处理方法及软件产品 Download PDF

Info

Publication number
CN1578347A
CN1578347A CNA2004100635171A CN200410063517A CN1578347A CN 1578347 A CN1578347 A CN 1578347A CN A2004100635171 A CNA2004100635171 A CN A2004100635171A CN 200410063517 A CN200410063517 A CN 200410063517A CN 1578347 A CN1578347 A CN 1578347A
Authority
CN
China
Prior art keywords
image
camera
character
information
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2004100635171A
Other languages
English (en)
Inventor
山崎正裕
桑本英树
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of CN1578347A publication Critical patent/CN1578347A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00281Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a telecommunication apparatus, e.g. a switched network of teleprinters for the distribution of text-based information, a selective call terminal
    • H04N1/00307Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a telecommunication apparatus, e.g. a switched network of teleprinters for the distribution of text-based information, a selective call terminal with a mobile telephone apparatus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K7/00Methods or arrangements for sensing record carriers, e.g. for reading patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/142Image acquisition using hand-held instruments; Constructional details of the instruments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/38Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
    • H04B1/40Circuits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72439User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for image or video messaging
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00326Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00326Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
    • H04N1/00328Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
    • H04N1/00331Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00488Output means providing an audible output to the user
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0008Connection or combination of a still picture apparatus with another apparatus
    • H04N2201/007Selecting or switching between a still picture apparatus or function and another apparatus or function
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0084Digital still camera

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Telephone Function (AREA)
  • User Interface Of Digital Computer (AREA)
  • Studio Devices (AREA)

Abstract

一种信息处理装置,包括:照相机,用于输出图像信息;选择器,用于从多个模式中选择照相机的一种模式,该多个模式包含用于作为普通照相机功能而获取图像的普通图像获取模式,和用于识别照相机输出图像信息中所包含的字符的识别模式;和扬声器,用于输出提示音。该信息处理装置包括CPU,用于执行控制从而当用户操作快门按钮来使用照相机时,如果选择了普通图像获取模式,则扬声器以第一输出级别输出该提示音,以及如果选择了识别模式,则扬声器不输出提示音或以低于第一输出级别的第二输出级别来输出提示音。

Description

信息处理装置,信息处理方法及软件产品
技术领域
本发明涉及一种诸如蜂窝电话,PHS(个人手持电话系统),PDA(个人数字助理),或膝上型电脑或手持个人计算机这样的信息处理装置,以及该装置所采用的信息处理方法和该装置中使用的软件。
背景技术
日本专利公开No.2002-252691公开了一种便携式电话终端,能够通过OCR(光学字符识别)功能而输入诸如地址,电话号码和URL(统一资源定位符)这样的印刷信息。
但上述文献并未描述处理快门声音的方法。
在日本公开了一种具有照相机的蜂窝电话。该蜂窝电话可输出一种快门声音以便避免在用户照相时误用照相机。该照相机只有在提供了提示其他人该操作的声音后才能使用,因此,用户就不能秘密地对其他人照相。然而,如果在每次使用OCR功能时都输出快门声音,则该声音可能会使用户感到厌烦。
因此需要一种改进的信息处理装置。
发明内容
上述需要可通过下面提供的信息处理装置得到满足,该装置包括照相机,用于输出图像信息;选择器,用于从多个模式中选择照相机的一种模式,该多个模式包含用于作为普通照相机功能而获取图像的普通图像获取模式,和用于辨别照相机输出图像信息中所包含字符的识别模式;和扬声器,用于输出提示音。该信息处理装置包括CPU,用于执行控制以便当用户操作快门按钮来使用照相机时,如果选择了普通图像获取模式,则扬声器以第一输出级别输出该提示音,如果选择了识别模式,则扬声器不输出提示音或以低于第一输出级别的第二输出级别来输出提示音。
附图说明
图1是表示信息处理装置的结构的框图。
图2是表示信息处理装置的处理过程的流程图。
图3是表示信息处理装置的示例性显示屏的示意图。
图4是表示信息处理装置的处理过程的流程图。
图5是表示信息处理装置的示例性显示屏的示意图。
图6是表示信息处理装置的示例性显示屏的示意图。
图7是表示在识别字符和显示图像之间的关系的表格。
图8是表示显示信息处理装置中的识别结果的示例性显示屏的示意图。
图9是表示显示信息处理装置中的字符识别结果的示例性显示屏的示意图。
图10是表示信息处理装置的示例性显示屏的示意图。
图11是表示信息处理装置的简要示意图。
具体实施方式
下面将参照附图详细说明诸如蜂窝电话,PHS,PDA和膝上型电脑或手持个人计算机这样的信息处理装置的优选实施例。在所有附图中,相同的结构元件将采用相同的参考标记。
图1是表示信息处理装置10的结构的框图。
输入单元101包括快门按钮,电源按钮,和包括数字键的多个按键。用户操作输入单元101以输入各种信息,例如请求照相机103获取图像的图像获取命令,电源开/关命令,电话号码和邮件地址等等。CPU(中央处理单元)102通过执行存储器104中存储的程序来控制信息处理装置100的各部件。
照相机103将拍摄的目标转换为YUV系统的图像信息,并将该图像信息提供到CPU 102。拍摄目标的例子包括人的面部,一幅景色和字符等等。YUV系统的图像是由亮度信号(Y),亮度信号和红色分量之间的差值(U)以及亮度信号和蓝色分量之间的差值(V)来表示的3条信息。
照相机103可转换的图像信息并不局限于YUV系统。只要CPU 102可以处理该图像信息,拍摄的目标可以被转换为任何形式的图像信息。
CPU 102将YUV系统的图像信息转换为RGB(红绿蓝)等系统的图像信息,并将转换后的图像信息输出到显示器107。
当观看输出到显示器107的图像信息时,用户选择将要拍摄的图像并按下快门按钮。当用户按下快门按钮时,存储器104存储照相机103输出的图像信息。
存储器104通常是一个ROM(只读存储器)或RAM(随机存储器)。存储器104也可用于存储视频和/或音频数据,以及CPU 102将要执行的软件等,以便进行操作。
图像识别存储器105存储CPU 102执行OCR(光学字符识别)功能的软件程序。OCR功能是一种用于识别包括字母,记号,符号,标记,数字和图像中包含的识别信息的功能。
识别信息的例子可以是主页地址,邮件地址,邮政地址,电话号码,地理信息等等。识别信息的范围并不局限于这些例子。只要该信息可以被用于识别事物,所述识别信息可以是任何信息。
字符识别包括以下步骤,由照相机103获取的图像识别包括字符的地点,将该包含字符部分的图像数据划分成预定的多个部分,将这些部分的每个数据转换为参数值,并根据该参数值来判断各部分中包含的信息。
作为例子,下面将说明图像中包含的字符‘abc’的识别。首先,识别该图像中包含的字符‘abc’的位置。然后,包含字符‘abc’的该图像数据部分被分割为包含字符‘a’,‘b’,‘c’的多个部分。将包含字符‘a’,‘b’,‘c’的数据部分转换为各自的参数值。例如,参数值数字‘0’表示字符的白色部分,‘1’表示字符的黑色部分。对于每个部分,在字符模式数据内包含的字符中选择与该参数值最相近的字符。字符模式数据是将每个参数值与一个字符相关联的数据,该字符例如是对应于参数值的字母符号。可将字符模式数据预先存储在存储器104中,或者由用户下载或安装。
在此例子中,将专用于图像处理软件的存储器作为图像识别存储器105。或者,在CPU 102或存储器104中内置有图像处理软件,以便向CPU102提供OCR功能。通过在CPU 102或存储器104中内置图像处理软件,可以减少元件的数目,并能够降低制造成本。
在此例中,为缩减电路规模,由CPU 102执行OCR功能。然而,本发明的结构并不局限于该例子。例如可以使用专用的处理器来实施OCR功能。
扬声器106可输出例如快门音和呼入音等声音。可以分别提供多个扬声器来输出呼叫音和输出例如MP3文件、来电旋律这样的再现声音。作为另一种选择,扬声器不仅可以被设置成单声道再现还可以被设置成立体声再现。
显示器107可显示照相机103获取的图像及CPU 102辨别的识别信息。显示器107还显示使用该信息处理装置的功能所需的屏幕。该屏幕包括各种信息,例如电源状态,电波强度,电池中的剩余电荷量,服务器连接状态,出现未读邮件,呼入的电话号码,邮件的目的地,发送邮件的文本,从呼叫者接收的呼入电话的电话号码,接收邮件的文本和从连接的互联网屏幕接收的数据。
以下说明描述了存在两种图像获取模式的情况,即识别模式,用于获取将要识别的图像的识别模式,和普通图像获取模式,用于获取普通照相功能将要存储的人物和场景等的图像。然而,本发明的范围并不局限于这些模式。标识存储器108是一个存储模式判断标识的存储器,CPU 102使用该模式判断标识来判断模式种类。模式判断标识在存储器104存储的软件程序中被作为变量来处理。识别模式使用的模式判断标识的值不同于普通图像获取模式的值。CPU 102根据此变量来判断该图像获取模式是识别模式还是普通图像获取模式。在此例子中,设置一个专用存储器。然而,模式判断标识也可被存储在存储器104中。
通过参阅图2所示的流程图,以下的说明描述了根据该图像获取模式的种类的处理过程。
该信息处理装置的用户按下输入单元101的快门按钮(步骤S201)。然后,CPU 102从标识存储器108读出模式判断标识的值,并判断该图像获取模式是识别模式还是普通图像获取模式(步骤S202)。
如果该图像获取模式是识别模式,则CPU 102向照相机103发出一个图像命令(步骤S203)。在此例子中,CPU 102执行控制,以避免输出快门声音。然后将照相机103获取并转换的图像存储在存储器104中。
CPU 102提取图像中的字符(步骤S204)。字符的例子可以是邮件地址,例如通常被印刷在名片上的‘yamazaki@..yokohama.ne.jp’。将这些字符保存在存储器104中作为识别的结果。在显示器107上显示识别的结果(步骤S205)。
例如,用户将显示器107中心处出现的标记如‘+’、‘?’等等放在例如名字、邮件地址等等这样的字符上面的位置处。这样,可将显示器107用作一个取景器。或者,用户可操作输入单元101来移动显示器上的光标以便指定将要识别的区域。
在用户通过标记或光标指定区域后,当用户按下快门按钮时,照相机103将图像信息输出到CPU 102,CPU 102执行字符的识别。当字符包含‘@’标记时,CPU 102识别‘@’标记之前和之后的字符作为邮件地址。
如果在移动图像的再现期间执行识别信息的识别处理,则再现模式切换到帧提供模式。从帧提供模式中显示的静止图像中选择识别信息的识别目标。
也可以提供一种用户不需按下快门按钮的结构。而是使用标记或光标来自动识别用户指定的信息。
此外,也可以提供一种当用户按下快门按钮时执行识别范围指定的结构。该识别处理是在用户再次按下快门按钮或按下其他键之后执行的。用户可能会错误地将标记或光标移动到除了所需识别目标位置之外的其他位置。通过确认识别目标,就可以避免执行多余的识别处理。
如果步骤S202中图像获取模式是普通的图像获取模式,则扬声器106根据CPU 102发出的命令而输出快门声音(步骤S206)。照相机103获取拍摄目标的图像(步骤S207)。将照相机103输出的图像存储在存储器104中(步骤S208)。
例如,在识别模式中,可将该信息处理装置用作电子词典。在此情况下,如果每次用户试图在词典中查找单词时都输出快门声音,则该声音会使用户感到厌烦。另外,在例如图书馆这样的安静场所中产生的快门声音会使周围的人产生不愉快的感觉。另外,人们希望仅仅是字符识别时产生的快门声音不会使周围的人误以为被拍了照片。
通过上述的在普通图像获取模式中输出快门声音并避免在识别模式中输出快门声音,就可以避免用户和周围的人产生不愉快的感觉。
根据此例子中的识别模式,在拍照之前,用户将显示器107上的识别区域指定为一个取景器,从而可以避免用户不发出快门声音就秘密地拍照。最好,用户能够切换到其他操作过程,在该其他操作中,用户能够在拍照之后选择识别区域。对用户来说,将照相机103瞄准纸张时使用标记或光标来指定识别区域可能是很困难的。在拍照之后,通过允许用户指示识别区域,用户就可以很容易地指定该区域。在此情况下,将图像临时地存储在存储器104中,并在三分钟或五分钟的预定时间之后删除该图像。即使在预定的时间段之前从信息处理装置100输出该图像也是禁止的。通过禁止图像的输出,可以避免用户的误用。
在上述例子中,执行控制以避免产生快门声音。应当注意,也可以执行控制来降低快门声音的输出级别(减少音量)。在此情况下,当CPU 102判断图像获取模式是识别模式时,CPU 102将快门声音的输出级别降低到低于普通图像获取模式的输出级别。例如,CPU 102执行控制以产生最低输出级别的快门声音。在此情况下,通过将作为识别目标的字符封闭在闭合线中,并显示该封闭的字符,用户能够很容易地得知从显示器识别出了哪个字符。
图3示出信息处理装置的示例性显示屏幕。屏幕301到303示出从普通图像获取模式变为识别模式的操作过程。屏幕304到306显示出向显示器107输出在识别模式中对URL或邮件地址的字符识别结果的操作过程。
用户操作输入单元101从而在显示器107上输出特定的菜单屏幕。例如,用户按下位于信息处理装置的背面上的开关。通过选择例如“开始照相”的菜单项目,显示屏幕301。如果按下位于屏幕301右下角的“菜单”按钮,则显示屏幕302。屏幕302示出涉及图像获取操作的菜单。如果选择了“(1)识别模式”,则显示屏幕303。
屏幕303用于提示用户已经将识别模式设定为图像获取模式。当按下“识别”按钮时,显示屏幕304。屏幕304示出识别模式已经开始后的状态。当按下“识别”按钮时,显示屏幕305但不发出快门声音。屏幕305用于提示用户正在执行识别处理。当识别处理结束时,显示屏幕306。屏幕306显示出识别处理的结果。
通过向显示器107输出上述的显示屏幕,用户可以很容易地选择识别模式,识别作为识别目标的标识符,例如邮件地址和URL。
图4示出当将识别模式设定为图像获取模式时,编辑所获取的图像并显示作为编辑处理结果而得到的图像的处理过程的流程图。
信息处理装置在存储器104存储有用于执行图像编辑处理所需的软件。CPU 102执行基于该软件的处理。在该例子中,为了缩小电路规模,将图像编辑功能嵌入到CPU 102中。但是,本发明的结构并不局限于该例子。例如,可以使用专用芯片来执行图像处理功能。
当按下快门按钮时,CPU 102向照相机103发出获取图像的命令(步骤S401)。照相机103将照相目标转换为图像信息并将该图像信息存储在存储器104中(步骤S402)。
CPU 102执行图像识别存储器105中的程序,并从存储器104中所存储的图像信息中确定作为识别目标的包括字符的目标范围(步骤S403)。例如,假设将一矩形范围确定为目标范围。该矩形范围具有一对角线,该对角线将在右方向上偏离图像左上角处的原点x0个像素且在下方向上偏离该原点Y0个像素的点与在右方向上偏离该原点X1个像素且在下方向上偏离该原点Y1个像素的另一个点连接起来。在该例子中,图像识别操作自动确定目标范围。但是,用户通常可以通过使用光标来任意地设定目标范围。
CPU 102识别该图像的目标范围内的字符并将识别结果存储在存储器104中(步骤S404)。CPU 102编辑识别范围以外的部分,产生不同于原始图像的新图像,并将该新图像存储在存储器104中。
然后,CPU 102从存储器104中读出该新图像和识别目标的图像,在显示器107上显示这些图像(步骤S406)。最后,在下一步骤S407中,CPU102从存储器104中读出字符识别处理的结果并将该结果输出到显示器107。
图5示出信息处理装置的示例性显示屏幕。说明书中解释了从例如名片等纸上读出印刷在该纸上的例如URL等字符的情况。
屏幕501示出显示出已经启动了识别模式的状态的屏幕。当按下屏幕501上的“识别”按钮时,显示出屏幕502。屏幕502显示出正在执行识别处理。当识别处理结束时,显示屏幕503。屏幕503是用于编辑除了如字符这样的识别目标以外的一部分图像并将识别结果与作为编辑结果的所获得的图像一起显示出来的屏幕。
下面的描述解释了在识别模式中对一个人照相的情况。当如在屏幕504中所示的屏幕107上显示一个人时操作“识别”按钮时,显示屏幕505。屏幕505示出正在执行识别处理。如果例如字符等识别信息没有出现如对一个人照相的情况下,则利用黑色对所获取图像的整个屏幕着色,从而显示出例如屏幕506这样的屏幕。
应当注意,如果可以在很短的时间内执行识别处理,则CPU 102可以从扬声器106中发出快门声音,而不是显示不同于所获取图像的图像。
识别模式用于偷拍操作等,因为可以在不发出快门声音或发出很小的快门声音的情况下拍照。即使执行了偷拍操作,也不会显示除了字符和符号之外的图像,或者会发出快门声音。因此,可以防止偷拍操作。
应当注意识别目标以外的部分的颜色并不局限于黑色。就是说可以利用例如红色或黄色等其他颜色来对该部分进行着色。或者,可以将该部分表现为如图6所示的格子图案、条纹图案或圆点花样图案。另外,如果可以肉眼检测到作为识别目标的字符,则可以利用马赛克显示出该部分。或者,可以显示另外图像的图案或一部分。
另外,为了使识别的结果容易理解,可以通过将黑色转变为白色或将白色转变为黑色从而使显示反转,或者可以改变显示画面的颜色。但是,本发明并不局限于上述的通常显示画面。可以将识别的结果显示在任何显示画面中,只要在该图像中可以清楚的辨认出该识别结果即可。例如,除了显示对字符的识别结果外,还可以将识别结果显示为花体字符,静态图像或动态图像来表现该结果。
图7示出表示所识别的字符和所显示的图像之间的关系的表格。该表格将CPU 102所识别出的标识信息701的类型与图像文件名称702联系起来,该图像文件名称702是包含所显示图像的文件的名称。该表格存储在存储器104中。例如,CPU 102根据标识信息中出现的字符“http:”或字符“@”,识别该标识信息的类型。
图8示出显示字符识别结果的屏幕。在该屏幕中,确定作为识别目标的字符为邮件地址。从存储器104中读出该邮件地址的图像文件名称e-mail.jpg。
通过以这种方式显示与识别目标相关的图像,用户可以直观地知道所需字符的识别结果。另外,如果提供了用于将把各邮件地址与该邮件地址所指定的个人图像相关联起来的关系分类的表格,则用户可以很容易的知道从识别结果所获得的邮件地址所指定的个人。这样,用户就可以高度方便地使用该信息处理装置。
或者,将从所照的图像中随机选择出的图像显示在除了作为识别目标的字符以外的部分上。当在识别模式中识别出字符以后,向CPU 102施加表示识别处理结束的识别结束信号。CPU 102接收该识别结束信号,然后随机选择存储在存储器104中的图像,并将该图像显示在显示器107上。由于所显示的图像随识别而改变,因此用户并不熟悉每次识别标识时所显示的图像。因此,用户并不会由于每次识别所显示的图像都相同而对所显示的图像感到厌倦。因此,用户可以更好地享受该信息处理装置。
应当注意在识别目标以外的部分中所显示的图像并不一定是预先存储在存储器104中的图像。例如,图像也可以是用户利用图像生成软件所创造的图像或者从互联网上下载的图像。因此,所显示的图像变化数目增加,从而允许用户更方便地使用该信息处理装置。
另外,可以将例如字符等识别目标按照放大或缩小的尺寸显示。放大显示画面的例子是利用2×2像素的显示画面来显示1×1的原始显示画面。通过显示放大或缩小尺寸的识别目标,用户可以很容易地识别该识别结果。另外,如果将所识别的字符放大,则可以隐藏原始获取的图像的大部分,从而可以也可以实现避免偷拍操作。
下面将解释与该识别结果相关的信息和该结果一起显示的例子。
存储器104存储了字典数据,例如英-英字典。当利用字符识别功能识别出单词时,从存储器104中读出该单词的解释。将该单词和解释分别作为识别结果和与该结果相关的信息显示出来。存储器104可以存储出了英-英字典之外的多种字典日期,例如英-日字典和英-西字典等。例如,当选择英-日字典且识别出英语单词时,可以将日语翻译作为与该识别结果相关的信息显示出来。
在该情况下,该单词的解释的量可能非常大,以至于在一或两行内显示不下。为了解决这种问题,可以将用于显示识别结果的位置移到显示器107的屏幕的顶部、底部、左侧或右侧,从而可以为显示与该识别结果相关的信息提供更大的空间。
图9示出用于识别字符的处理的典型显示屏幕。屏幕901显示出一个状态,其中正在监视的一页纸的页面。该页面包含单词。如果在利用标记或光标指示显示屏107上的字符“识别”时按下“识别”按钮时,开始识别字符的处理并显示屏幕902以替换屏幕901。当识别字符的处理结束时,显示屏幕903以替换屏幕902。在屏幕903上,将所获得的图像的全部显示画面向上移,从而提供可用于显示单词“识别”的定义的空间,该单词“识别”作为识别的目标。通过以这种方式移动显示位置,可以显示与识别目标相关的信息,从而使用户可以更自由地使用该信息处理装置。
应注意,在该例子中,预先在存储器104中存储了显示位置位移的数据。该显示位置位移数据包括所识别的字符的位移方向、距离和目的地。CPU 102根据该显示位置位移数据对作为识别目标的字符执行位移。但是本发明并不局限于该例子。例如,根据所获得的图像信息的量和/或相关信息的量,还可以得到最佳新位置和/或位移距离。这样,根据显示内容,CPU 102就可以将作为识别目标的字符移位到用户可以很容易地看到的新位置。
在这种情况下,需要提供这样一种结构,它可以通过保持识别目标和未改变的目标图像之间的位置关系不变,来将作为识别目标的字符移位。这样,用户就可以很容易地知道哪些字符已经被识别,从而更方便地使用该信息处理装置。如果例如已经识别出不同字符,则很容易知道需要识别的字符位置与误识别的字符的位置之间的关系。这样,用户就可以很容易地利用光标等将识别范围移动到所需字符处。
图10示出显示字符识别结果的示例性屏幕。屏幕1001示出所监视的写有单词的纸页的屏幕。当执行字符识别处理时,可以显示屏幕1002以替换屏幕1001。在字符识别处理结束时,显示屏幕1003来替换屏幕1002。
在屏幕1003上,在与监视处理过程中相同的位置处显示出作为识别目标的字符串“识别”。屏幕1004和1005显示出一个状态,其中整个图像逐步向上移动。然后,如图1006所示,仅显示出作为识别目标的字符串“识别”的图像部分,可用空间可用于显示相关信息,例如单词的解释。
通过以这种方式逐步改变显示格式,用户可以知道识别目标的位置,且即使在具有很小屏幕的终端上也可以显示与该识别结果相关的大量信息。因此,用户可以更方便地使用该信息处理装置。
另外,可以提供音频合成单元,作为用于从扬声器106输出声音的装置,该声音作为字符的替换物。或者,还可以提供一按照摩尔斯信号震动的震动单元,或产生光的灯。或者,可以提供用于根据字符信息创建盲文的盲文发生单元和用于通过改变形状来显示盲文的盲文显示器。在该结构中,盲文用作字符的替代物。
除了显示以外,还可以提供其他结果提示方法,包括一种提示技术或多种提示技术的组合。这样,仅仅懂得一点语言的孩子或者视力和听觉比较差的人就可以很容易地获知识别结果。
图11示出信息处理装置的外部示图。该信息处理装置包括具有显示器107的外壳200和具有输入单元101的外壳201。该外壳200和201利用铰链1103彼此结合在一起,从而可以使外壳200和201折叠。另外,信息处理装置具有普通照相按钮1101和识别图像按钮1102。
当按下普通照相按钮1101时,照相机103对作为照相目标的物体照相,并将获取的图像存储在存储器104中。如果需要,可以显示该所获取的图像。相反,如果按下识别图像按钮1102,则照相机103对作为识别目标的物体照相,在CPU 102执行识别处理之后,将识别结果显示在显示器107上。
通过如上所述提供专用于识别模式和普通图像获取模式的独立按钮,用户可以很容易地选择这些模式中的一个,从而高度方便地使用该信息处理装置。另外,通过如图11所示,在信息处理装置的侧表面上提供按钮,用户可以在不考虑该信息处理装置打开还是折叠的情况下执行相同的操作,从而高度方便地使用该信息处理装置。
理想情况下应当将普通照相按钮1101和识别图像按钮1102作为不同的按钮来提供。但是,也可以利用单一按钮来替换该普通照相按钮1101和识别图像按钮1102。通过利用单一按钮来替换该普通照相按钮1101和识别图像按钮1102,可以节约空间,使得信息处理装置的大小减小。在这种情况下,需要将一个按钮的操作区分为正常照相和用于识别的按钮操作。例如,可以根据按钮按下的持续时间或按下按钮的次数,即根据按钮是单击操作还是双击操作将模式从普通图像获取模式转换为识别模式,反之亦然。该普通照相按钮1101和识别图像按钮1102可以是属于信息处理装置100的多个传感器中的任意几个,只要用户可以区分他们即可。
另外,在信息处理装置具有呼叫功能,即是蜂窝电话的情况下,存在正在执行OCR功能的同时打入电话的情况。在这种情况下,当利用图中未示出的通信单元通知电话进入时,CPU 102中断识别模式,将例如图像信息或字符参数值等数据存储在存储器104中,并处理该呼叫。在电话结束时,重新恢复识别模式状态。
这样,即使在正在执行OCR的时候有电话打入,也可以响应该打入的电话。另外,在接收和处理电话的处理过程结束之后,可以恢复在电话打入之前的状态。因此,不再需要故意重新开始识别模式。因此,用户可以很方便地使用该信息处理装置。
另外,在信息处理装置可以同时执行声音通信和数据通信的情况下,CPU 102可以执行处理从而同时执行OCR功能和电话功能。这样,用户就可以在进行电话交流的同时,利用OCR功能识别印刷在名片上的信息。
另外,还可以提供这样一种结构,其中利用信息处理装置例如蜂窝电话中给出的邮件功能,可以将OCR功能所给出的识别结果发送到指定目的地。
在这种情况下,当用户在电话期间对输入单元101执行预定操作时,CPU 102可以执行处理从而转换到识别模式。然后,在识别了字符之后,用户可以操作输入单元101以启动邮件功能。当邮件功能启动时,CPU 102执行存储在存储器104中的邮件功能,在显示器107上显示邮件创建屏幕。此时,如果已经识别出名片等上所写的邮件地址,则CPU 102执行处理从而自动地将作为识别结果而获得的邮件地址插入到正在创建的邮件的主文本区域。
或者,还可以提供这样一种结构,其中用户可以从预先存储在存储器104中的地址信息中选择出邮件地址,并将该邮件地址插入到地址区域中。该地址信息包括名字、电话号码和邮件地址。
如上所述,可以通过执行简单的操作,将OCR产生的识别结果发送给所需的通信对方。这样,用户就可以高度方便地使用该信息处理装置。另外,如果可以将目标描述自动插入到主题区域,则可以省略输入该主题描述的操作。因此,用户可以更方便地使用该信息处理装置。在这种情况下,目标的描述可以是“OCR结果”等。
另外,在上述描述中,考虑到了主文本区域、地址区域和主题区域。但是,所创建的邮件的区域并不局限于这三个区域。即,也可以提供其他区域。在这种情况下,可以提供将对应该新提供的区域的信息自动插入到该新区域中的结构。
另外,根据上述描述,提供了可以将例如邮件地址等识别结果自动插入到邮件创建屏幕的区域中的结构。但是,该结构并不局限于此。例如,用户可以通过操作输入单元101输入其他信息,例如注释。就是说,发送到电话对方的信息并不仅包括由OCR功能产生的识别结果,还有例如对该识别结果的注释等信息。应当注意在这种情况下,如果使用了预先存储在存储器104中的预定短语、花体字符等,则可以更方便地使用该信息处理装置。
还应当注意为了实现上述例子功能而执行的软件并不必须地预先存储在存储器104中。相反,可以在用户购买信息处理装置之后,利用互联网或记录介质在该信息处理装置中安装该软件。在这种情况下,不需要新购买其他信息处理装置。由于可以将新的功能增加到所购买的信息处理装置中,因此可以降低费用。
这里使用的词汇“记录介质”是指在实现该处理中所用到的任何介质。这种介质可以采用很多中形式,包括但不局限于非易失介质、易失介质和传输介质,非易失介质包括例如光盘或磁盘。易失介质包括动态存储器。传输介质可包括同轴电缆;铜线和光纤以及在这些物理连接中传输的电、电磁或光信号。传输介质还可以采用例如那些在射频和红外无线数据通信中所产生的电或电磁信号或者声音或光波的形式。机器可读介质的通常形式包括例如软盘、软盘、硬盘、磁盘、磁带、任何其他磁介质、CD-ROM、DVD、任何其他光介质、RAM、PROM、FLASH-EPROM、任何其他存储芯片或盒式磁带、载波传输数据或指令。
如上所述,可以提供一种信息处理装置,它可以高度方便地被使用。
应当注意本发明的范围并不局限于上述的例子,相反,在该说明书中描述的新的特征和原理包括着更为广泛的技术范围。

Claims (15)

1、一种信息处理装置,包括:
照相机,用于输出图像信息;
选择器,用于从多个模式中选择照相机的一种模式,该多个模式包含用于作为普通照相机功能而获取图像的普通图像获取模式,和用于识别照相机输出图像信息中所包含字符的识别模式;和
扬声器,用于输出提示音;和
CPU,用于执行控制从而:
当用户操作快门按钮来操作照相机时,如果选择了普通图像获取模式,则扬声器以第一输出级别输出该提示音,如果选择了识别模式,则扬声器不输出提示音或以低于第一输出级别的第二输出级别来输出提示音。
2、如权利要求1所述的信息处理装置,还包括:
存储器,用于存储至少一个图像;和
显示器,其中在识别模式中,当用户操作快门按钮时,显示器在第一显示区域中显示包括在照相机所输出的图像信息中的字符,并在第二显示区域中显示存储器中所存储的图像。
3、如权利要求2所述的信息处理装置,其中在识别模式中,所述存储器存储与多个字符相关联的多个图像,并且当用户操作快门按钮时,显示器在第二显示区域中显示与照相机所输出的图像信息中所包括的字符相关联的图像。
4、如权利要求1所述的信息处理装置,还包括:
存储器,用于存储多个图像;和
显示器,在选择了识别模式并同时操作了快门按钮时,该显示器在第一显示区域中显示包括在照相机所输出的图像信息中的字符,并在第二显示区域中显示一个图像,该图像是从存储器中所存储的多个图像中随机选择出来的。
5、如权利要求1所述的信息处理装置,还包括:
显示器,其中在识别模式中,该显示器在用户操作快门按钮之前作为相机取景器显示字符,并在用户操作快门按钮之后使该字符的显示位置移位。
6、如权利要求1所述的信息处理装置,其中该字符包括字母、符号、记号、标记、数字和识别信息中的至少一个。
7、一种信息处理装置,包括:
照相机,用于输出图像信息;
选择器,用于从多个模式中选择照相机的一种模式,该多个模式包含用于作为普通照相机功能而获取图像的普通图像获取模式,和用于识别照相机输出图像信息中所包含字符的识别模式;
存储器,用于存储至少一个图像;和
显示器,如果选择了识别模式,则当用户操作了照相机的快门按钮时,显示器在第一显示区域中显示包括在照相机所输出的图像信息中的字符,并在第二显示区域中显示存储器中所存储的图像。
8、如权利要求7所述的信息处理装置,其中存储器存储与多个字符相关联的多个图像;如果选择了识别模式,则当用户操作快门按钮时,显示器在第二显示区域中显示与照相机所输出的图像信息中所包括的字符相关联的图像。
9、如权利要求7所述的信息处理装置,其中存储器存储与多个字符相关联的多个图像;如果选择了识别模式,则当用户操作了快门按钮时,该显示器在第二显示区域中显示一个图像,该图像是从存储器中所存储的多个图像中随机选择出来的。
10、一种信息处理方法,包括以下步骤:
从多个模式中选择信息处理装置中的照相机的一种模式,该多个模式包含用于作为普通照相机功能而获取图像的普通图像获取模式,和用于识别照相机输出图像信息中所包含字符的识别模式;和
当照相机用户操作快门按钮时,如果选择了普通图像获取模式,则控制信息处理装置的扬声器以第一输出级别输出提示音;如果选择了识别模式,则控制扬声器不输出提示音或以低于第一输出级别的第二输出级别来输出提示音。
11、一种信息处理方法,包括以下步骤:
在信息处理装置的存储器中存储至少一个图像;和
从多个模式中选择信息处理装置中的照相机的一种模式,该多个模式包含用于识别照相机输出图像信息中所包含字符的识别模式;
如果选择了识别模式,则当用户操作快门按钮时,识别在照相机所输出的图像信息中所包括的字符;
在第一显示区域中显示所识别的字符,并在第二显示区域中显示存储器中所存储的图像。
12、一种软件产品,包括:
记录介质;
由记录介质记录并由信息处理装置执行的程序编码,其中执行程序编码从而使信息处理装置执行一系列步骤,这些步骤包括:
从多个模式中选择信息处理装置中的照相机的一种模式,该多个模式包含用于作为普通照相机功能而获取图像的普通图像获取模式,和用于识别照相机输出的图像信息中所包含字符的识别模式;和
当照相机用户操作快门按钮时,如果选择了普通图像获取模式,则控制信息处理装置的扬声器以第一输出级别输出提示音,以及如果选择了识别模式,则控制扬声器不输出提示音或以低于第一输出级别的第二输出级别来输出提示音。
13、一种软件产品,包括:
记录介质;
由记录介质记录并由信息处理装置执行的程序编码,其中执行程序编码从而使信息处理装置执行一系列步骤,这些步骤包括:
在信息处理装置的存储器中存储至少一个图像;和
从多个模式中选择信息处理装置中的照相机的一种模式,该多个模式包含用于识别照相机输出的图像信息中所包含的字符的识别模式;
如果选择了识别模式,则当用户操作快门按钮时,识别在照相机所输出的图像信息中所包括的字符;
在第一显示区域中显示所识别的字符,并在第二显示区域中显示存储器中所存储的图像。
14.一种包括可执行指令的产品,其中执行程序编码从而使信息处理装置执行一系列步骤,这些步骤包括:
从多个模式中选择信息处理装置中的照相机的一种模式,该多个模式包含用于作为普通照相机功能而获取图像的普通图像获取模式,和用于识别照相机输出的图像信息中所包含字符的识别模式;和
当照相机用户操作快门按钮时,如果选择了普通图像获取模式,则控制信息处理装置的扬声器以第一输出级别输出提示音,以及如果选择了识别模式,则控制扬声器不输出提示音或以低于第一输出级别的第二输出级别来输出提示音。
15.一种包括可执行指令的产品,其中执行程序编码从而使信息处理装置执行一系列步骤,这些步骤包括:
在信息处理装置的存储器中存储至少一个图像;和
从多个模式中选择信息处理装置中的照相机的一种模式,该多个模式包含用于识别照相机输出的图像信息中所包含字符的识别模式;
如果选择了识别模式,则当用户操作快门按钮时,识别在照相机所输出的图像信息中所包括的字符;
在第一显示区域中显示所识别的字符,并在第二显示区域中显示存储器中所存储的图像。
CNA2004100635171A 2003-07-09 2004-07-09 信息处理装置、信息处理方法及软件产品 Pending CN1578347A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003194008 2003-07-09
JP2003194008A JP2005033346A (ja) 2003-07-09 2003-07-09 情報処理装置、情報処理方法及びソフトウェア

Publications (1)

Publication Number Publication Date
CN1578347A true CN1578347A (zh) 2005-02-09

Family

ID=33562496

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2004100635171A Pending CN1578347A (zh) 2003-07-09 2004-07-09 信息处理装置、信息处理方法及软件产品

Country Status (4)

Country Link
US (1) US20050007455A1 (zh)
JP (1) JP2005033346A (zh)
KR (1) KR20050007157A (zh)
CN (1) CN1578347A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103092507A (zh) * 2011-11-08 2013-05-08 三星电子株式会社 用于在便携式终端中表现图像的设备和方法
CN104052917A (zh) * 2013-03-12 2014-09-17 索尼公司 通知控制设备、通知控制方法和存储介质
CN111371974A (zh) * 2020-03-02 2020-07-03 Oppo(重庆)智能科技有限公司 一种终端拍摄控制方法、装置、终端及存储介质

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4625370B2 (ja) * 2005-05-26 2011-02-02 富士フイルム株式会社 撮影装置
KR100630200B1 (ko) * 2005-08-24 2006-10-02 삼성전자주식회사 휴대용 단말기에서 계산기 모드 동작 방법
WO2007135732A1 (ja) * 2006-05-23 2007-11-29 Panasonic Corporation 電子機器
US7953804B2 (en) * 2006-06-02 2011-05-31 Research In Motion Limited User interface for a handheld device
CN101639760A (zh) * 2009-08-27 2010-02-03 上海合合信息科技发展有限公司 联系信息输入方法及系统
US20110054880A1 (en) * 2009-09-02 2011-03-03 Apple Inc. External Content Transformation
JP4851604B2 (ja) * 2010-01-27 2012-01-11 京セラ株式会社 携帯電子機器および携帯電子機器の制御方法
CN102508286B (zh) * 2011-09-30 2013-08-28 深圳市宇恒互动科技开发有限公司 主动振动侦测定位的方法、系统、及环境监控系统
JP5939278B2 (ja) * 2013-10-08 2016-06-22 キヤノンマーケティングジャパン株式会社 情報処理装置、その制御方法、及びプログラム、並びに、投影システム、その制御方法、及びプログラム
KR102411890B1 (ko) * 2014-09-02 2022-06-23 삼성전자주식회사 컨텐츠를 처리하는 방법 및 이를 위한 전자 장치
KR20210121779A (ko) * 2020-03-31 2021-10-08 휴렛-팩커드 디벨롭먼트 컴퍼니, 엘.피. 문서의 속성 정보가 기록된 인쇄물을 이용하여 음성 정보를 제공

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3337798B2 (ja) * 1993-12-24 2002-10-21 キヤノン株式会社 画像データ及び音声データを処理する装置、データ処理装置並びにデータ処理方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103092507A (zh) * 2011-11-08 2013-05-08 三星电子株式会社 用于在便携式终端中表现图像的设备和方法
US9971562B2 (en) 2011-11-08 2018-05-15 Samsung Electronics Co., Ltd. Apparatus and method for representing an image in a portable terminal
CN104052917A (zh) * 2013-03-12 2014-09-17 索尼公司 通知控制设备、通知控制方法和存储介质
CN104052917B (zh) * 2013-03-12 2018-03-13 索尼公司 通知控制设备、通知控制方法和存储介质
CN111371974A (zh) * 2020-03-02 2020-07-03 Oppo(重庆)智能科技有限公司 一种终端拍摄控制方法、装置、终端及存储介质

Also Published As

Publication number Publication date
KR20050007157A (ko) 2005-01-17
JP2005033346A (ja) 2005-02-03
US20050007455A1 (en) 2005-01-13

Similar Documents

Publication Publication Date Title
CN1268158C (zh) 便携通信终端及图像显示方法
CN100338619C (zh) 字符识别处理设备、字符识别处理方法和便携式终端设备
JP4374610B2 (ja) 撮像装置、画像データ記憶方法、及び、プログラム
KR100689309B1 (ko) 촬영화상 편집용 휴대용 무선통신 단말기
JP4576427B2 (ja) 注釈付画像生成方法及びカメラ
JP3856813B2 (ja) 携帯端末装置及び撮影画像認識方法
JP4397054B2 (ja) 情報入力装置
CN1578347A (zh) 信息处理装置、信息处理方法及软件产品
CN103297681B (zh) 图像处理装置以及图像处理方法
WO2004070469A1 (ja) 合焦状態表示装置及び合焦状態表示方法
CN1518828A (zh) 具备摄影控制功能的带有照相机的折叠式移动通信终端和该终端中的摄影功能控制方法
US20110227951A1 (en) Conference system, information processing apparatus, display method, and non-transitory computer-readable recording medium encoded with display program
CN1788485A (zh) 数据通信设备、图像发送方法及图像发送程序
CN1353557A (zh) 移动电话
CN1575007A (zh) 在带有图像输入单元的便携式终端中识别字符的方法
CN1836439A (zh) 带有发送功能的照相机和携带电话机、图像数据取得发送程序
JP2006195592A (ja) 通信端末、通信端末の表示方法、及び、コンピュータプログラム
JP2006109437A (ja) 移動通信端末機の画像ファイル保存方法及び装置
JP4446242B2 (ja) データ送信装置、メールデータ送信方法、および、メールデータ送信プログラム
KR20110083095A (ko) 멀티미디어 컨텐츠와 연동된 이미지를 생성하고 재생할 수 있는 디지털 영상 처리 장치 및 그 제어 방법
JP2006268245A (ja) 情報取得装置、および、プログラム
CN105791700B (zh) 一种实现图像拍摄的方法及终端
JP2007019611A (ja) 携帯情報端末、画面生成方法
JP2005347933A (ja) 携帯通信端末
JP2005191940A (ja) 動画撮影装置、動画編集方法、および、動画編集プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication