[go: up one dir, main page]

CN1123844C - 识别手写字符的装置和方法 - Google Patents

识别手写字符的装置和方法 Download PDF

Info

Publication number
CN1123844C
CN1123844C CN96110777A CN96110777A CN1123844C CN 1123844 C CN1123844 C CN 1123844C CN 96110777 A CN96110777 A CN 96110777A CN 96110777 A CN96110777 A CN 96110777A CN 1123844 C CN1123844 C CN 1123844C
Authority
CN
China
Prior art keywords
character
dictionary
hand
judgment value
written
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN96110777A
Other languages
English (en)
Other versions
CN1150279A (zh
Inventor
田中秀和
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN1150279A publication Critical patent/CN1150279A/zh
Application granted granted Critical
Publication of CN1123844C publication Critical patent/CN1123844C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • G06F40/157Transformation using dictionaries or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/36Matching; Classification
    • G06V30/373Matching; Classification using a special pattern or subpattern alphabet
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

手写字符识别装置,可通过减少用户手写笔划习惯造成的错误识别来提高识别效率。首先探测写入的用户笔划,然后经字符识别预处理和根据标准判断点选择指定字符进行识别处理,再经后续识别处理,最后把处理结果送到操作装置。通过使用指定字符字典和减字典,根据出错次序,从标准判断点处减去因用户手写笔划习惯造成的被错误识别的字符。在指定字符字典的判断点处,写入了识别处理的标准笔划,而在减字典中,写入了使用者习惯的手写笔划。

Description

识别手写字符的装置和方法
技术领域
本发明涉及识别手写字符的装置和方法,它能在识别输入的手写字符时,防止由于有意减少字符判断值而错误识别使用频率低和容易被错误识别的字符,特别是涉及这样一种识别手写字符的装置和方法,它设置了在识别手写字符时减少手写字符判断值的特定字典或所谓的减字典。
背景技术
目前,在电子笔记本或便携式计算机、电子字典、个人计算机等技术领域中,手写字符识别装置或类似的装置作为一种容易操作的输入装置受到了人们的显著关注。
图1是显示手写字符识别装置构造的系统示意图。
如图1所示,这个例子的手写字符识别装置通过手写字符输入装置即笔划深测装置1审查由光笔或图形输入板写入的手写字符,由识别处理装置3识别该字符并把识别结果送入操作装置6。在识别处理装置3的前面和后面还分别设置识别预处理装置2和识别后续处理装置5。识别预处理装置2完成这样一种处理工作,即把来自手写字符输入装置1的输出信号或手写信号转换为容易识别的类型。在识别处理装置3中,通过使用识别字典识别与识别预处理装置2处理的手写信号对应的字符。另一方面,识别后续处理装置5确定识别处理装置3识别的结果是否正确。如果识别结果不正确,则修正该结果或者再一次识别。
上述被识别的字符送入操作装置6,例如根据目的、用途来使用的便携式计算机、电子字典、个人计算机和类似装置。
图2是显示本发明的用于执行字符识别处理的装置的系统安排的方框图。
在该装置中,由图形输入板(20)或键盘(由虚线框25示出)输入的要被识别的字符送到处理装置或中央处理单元(CPU)21,该单元通过使用存储在只读存储器(ROM)22中的必需的识别信息识别该输入字符。识别结果在显示装置23上显示并存入随机存取存储器(RAM)24中。
尽管已经粗略地说明了传统的字符识别装置,但是由于它的手写字符识别率低,因此它的手写字符识别率不能达到实际使用的水平。因而,人们非常希望有一组新的手写字符识别装置来改善手写字符的识别精确性。
顺便指出,由于有许多类型的日本字符,因此不能避免出现不能识别或难以识别的字符。在这方面,已经提出了设置手写字符用户字典的系统。然而,这种字典装置不足以消除手写字符错误识别的问题。
为消除传统装置的缺点,一个新字符字典通过手写字符用户字典被加入,这样,在使用用户字典前通常就可识别出有问题的字符。反之,在用户字典使用前,若能正常识别一个字符,则难以发现对它识别中的问题。
发明内容
因此,本发明的目的是提供一种手写字符识别装置和方法,以消除现有技术的缺点,或消除在出现错误识别前正常识别字符时难以发现对它识别的问题。
按照本发明一个方面,提供了一种使用字典和减字典的字符识别装置,包括:手写字符输入装置,用于接收写入的手写字符;判断装置,用于判断手写字符与字典中记录的字符之间的相似性,并为每一字符产生一个判断值,以表示其相似程度;减少装置,其中进一步包含:探测装置,用于探测在减字典中是否记录了预定数目的具有较高判断值的候选字符中的任一个字符;和降低判断值装置,用于如果在减字典中找到这种字符,降低该字符的判断值;以及确定装置,用于确定在减少了判断值之后具有最高判断值的字符所对应的手写字符。
按照本发明的另一方面,提供了一种使用字典和减字典的字符识别方法,包括以下步骤:输入写入的手写字符;判断手写字符与字典中记录的字符之间的相似性,并为每一字符产生一个判断值,以表示其相似程度;探测在减字典中是否记录了预定数目的具有较高判断值的候选字符中的任一个字符;和如果在减字典中找到这种字符,降低该字符的判断值;以及确定在减少了判断值之后具有最高判断值的字符所对应的手写字符。
附图说明
图1是系统方框图,显示了本发明的用于完成字符识别的装置的原理结构;
图2是系统方框图,显示了本发明的用于执行字符识别处理的装置;
图3是方框图,显示了本发明手写字符识别装置的一个实施例的结构;
图4是用于解释字符识别操作的图表;
图5是用于解释根据本发明在字符识别装置中使用减字典的工作方式的流程图。
具体实施方式
根据本发明使用减字典的手写字符识别装置的实施例将参照图3至图5详细说明。
图3是显示根据本发明的手写字符识别装置的一个实施例的方框图。图3中,由于由手写字符输入装置1、识别预处理装置2、识别处理装置3和识别后续处理装置5完成的处理过程和把识别结果送入操作装置6的情况与图1相同,因此这里省略对它们的说明。
图3所示的本发明的装置与图1所示的传统装置的区别是,本发明在识别装置3和识别后续处理装置5之间设置了一个用减字典构成的总判断装置4。下面将说明这种区别。
错误识别发生在字符识别装置中是很自然的,每个人手写的字符都有其自己的习惯笔划。因此,容易出现个别用户书写的某个特定字符不同于目标字符的相应字符,这种错误会经常出现。
尽管用户书写例如日本字符“け”,该日本字符由字符识别装置当作中文字符“什”被错误识别。在这种情况中,与正确识别指定字符“け”有关的、与识别装置字典中输入的手写字符“什”对应的一系列字符自然会出现。然而就使用者手写而言,在指定字符中中文字符“什”具有比日本字符“け”高的判断点。这样,日本字符“け”就成为第二指定字符。
为避免上述错误识别,在总判断装置4中设置了一个减字典。当识别判断时,从特定字符的判断点处减少减字典中记录的字符,并全面判断其效果。例如,在上述识别中,如果用户在他的减字典中记录了中文字符“什”,则日本字符“け”就成为第一指定字符,而不是将很少使用的中国字符“什”作为第一指定字符。
图3所示的使用减字典的总判断装置4的总判断用来避免用户笔划字符的错误识别,它依靠后面将要描述的减字典提供的字符来避免用户笔划习惯造成的错误识别。
上述处理将参照图4进行详细描述。假设用户使用光笔、图形输入板输入手写的日本字符“け”,由于用户手写笔划习惯的原因,也许会有中国字符“什”作为主要的或第一指定字符出现的情况。
由于用户输入的字符确实是日本字符“け”而不是中国字符“什”,因此这个识别是错误的。这样,当用户输入日本字符“け”时,为了识别日本字符“け”,只要降低中国字符“什”的指定字符次序就能实现。
上面的指定字符次序的确定如以下所述。从图4所示识别字符图表的下面的行和列中可以清楚地看到,识别装置3识别手写日本字符“け”的结果是这样的,主要和第一指定的字符是中国字符“什”,第二指定字符是日本字符“け”,第三指定字符是字母“H”,第四指定字符是中国字符“氏”。这一次序由每个字的判断点确定。
如上述图表指定的字符为判断点的那一列所示,第一指定字符“什”的判断点是88,第二指定字符“け”的判断点是75,所以手写日本字符“け”作为中国字符“什”被识别。因此,当用户输入手写日本字符“け”时,为了能够正确地识别该字符“け”,如果在与第一指定字符“什”相应的行上的减字典列中写上数值-50,那么字“什”的总判断值就成为38(88-50=38)。这样,指定字符“什”就成为总判断值最小的第四指定字符,而第二指定字符“け”则成为第一指定字符。
使用中国字符“什”的频率通常很低,而且对用户来说该字又很可能被错误识别。因此,如果像上面所说的那样,根据用户的手写习惯在减字典中增加减(负)的数值以减少判断值,这样就可以增加识别效率。
将使用频率低和容易被错误识别的字符预先记录在手写字符识别装置的减字典中以便有意地减少该字符的判断值,就可以避免该字被错误识别。
减字典的实际使用将参照流程图5进行说明。如图5所示,参照步骤1启动减字典,接着,识别指定字符的总数被设置为参数N。而参数n被设置为零(n=0)。
步骤4判断参数n是否达到识别指定的总数N即是否n≤N。如果该参数超过总数(n>N),则流程转到步骤11,然后结束。如果n<N,则流程转到步骤5,并把参数i设置为零(i=0)。
接着,流程转到步骤6,把减字典的总数设置为参数j。然后,流程转到是否满足i<j的步骤7。如果i达到j,那么处理跳到步骤10。
如如i未达到j,则在是否在减字典中记录了字符的步骤8中对其进行检查。如果减字典中没有记录该字符,则流程跳到步骤10。如果减字典中记录了该字符,则该字符的判断值在步骤9中被减少。在这个实例中,尽管判断值被减少到50,但这只是举例,实际上该减少值可以根据实际情况被改变。
在步骤10中,算出n=n+1以便继续减字典中的下一个字符。然后流程返回到步骤4。此后重复步骤4到步骤10的处理过程。最后,n>N,即参数超出指定字符的总数时,流程转到步骤11,结束工作。
当错误识别的字符是上述例子中(这个例子是“什”)不常使用的字符时,该错误识别可以由减字典的防范指施被基本上避免。
根据上述对本发明的描述我们就会明白,由于准备了一个减字典,并用它来减少手写字符识别装置的字典内写入的指定字符判断值中特定或预定字符的判断值,使得在使用减字典前难以识别的字符可以被正常识别,而对使用减字典前正常识别的字符则没有不良的影响或干扰。
虽然参照附图对本发明的优选实施例进行了说明,但应该明白,本发明不局限于这个严谨的实施例。在不背离权利要求书限定的本发明的精神或范围的条件下,本领域的技术人员可以完成本发明的各种变化和变形。

Claims (3)

1.一种使用字典和减字典的字符识别装置,包括:
手写字符输入装置,用于接收写入的手写字符;
判断装置,用于判断手写字符与字典中记录的字符之间的相似性,并为每一字符产生一个判断值,以表示其相似程度;
减少装置,其中进一步包含:探测装置,用于探测在减字典中是否记录了预定数目的具有较高判断值的候选字符中的任一个字符;和降低判断值装置,用于如果在减字典中找到这种字符,降低该字符的判断值;以及
确定装置,用于确定在减少了判断值之后具有最高判断值的字符所对应的手写字符。
2.根据权利要求1所述的字符识别装置,其特征在于,所述减字典包括须要减少判断值的字符以及要减的幅度的字符列表。
3.一种使用字典和减字典的字符识别方法,包括以下步骤:
输入写入的手写字符;
判断手写字符与字典中记录的字符之间的相似性,并为每一字符产生一个判断值,以表示其相似程度;
探测在减字典中是否记录了预定数目的具有较高判断值的候选字符中的任一个字符;和
如果在减字典中找到这种字符,降低该字符的判断值;以及
确定在减少了判断值之后具有最高判断值的字符所对应的手写字符。
CN96110777A 1995-06-20 1996-06-19 识别手写字符的装置和方法 Expired - Fee Related CN1123844C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP7153454A JPH096922A (ja) 1995-06-20 1995-06-20 手書き文字認識装置
JP153454/95 1995-06-20
JP153454/1995 1995-06-20

Publications (2)

Publication Number Publication Date
CN1150279A CN1150279A (zh) 1997-05-21
CN1123844C true CN1123844C (zh) 2003-10-08

Family

ID=15562914

Family Applications (1)

Application Number Title Priority Date Filing Date
CN96110777A Expired - Fee Related CN1123844C (zh) 1995-06-20 1996-06-19 识别手写字符的装置和方法

Country Status (3)

Country Link
US (1) US5940532A (zh)
JP (1) JPH096922A (zh)
CN (1) CN1123844C (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6640006B2 (en) 1998-02-13 2003-10-28 Microsoft Corporation Word segmentation in chinese text
US6694055B2 (en) * 1998-07-15 2004-02-17 Microsoft Corporation Proper name identification in chinese
US6219448B1 (en) * 1999-06-25 2001-04-17 Gim Yee Pong Three-stroke chinese dictionary
US6678409B1 (en) 2000-01-14 2004-01-13 Microsoft Corporation Parameterized word segmentation of unsegmented text
US6707942B1 (en) 2000-03-01 2004-03-16 Palm Source, Inc. Method and apparatus for using pressure information for improved computer controlled handwriting recognition, data entry and user authentication
US7266236B2 (en) * 2000-05-03 2007-09-04 California Institute Of Technology Accelerated handwritten symbol recognition in a pen based tablet computer
US6721452B2 (en) 2001-09-12 2004-04-13 Auburn University System and method of handwritten character recognition
US7496232B2 (en) * 2004-06-23 2009-02-24 Microsoft Corporation Distinguishing text from non-text in digital ink
CN100373399C (zh) * 2004-08-18 2008-03-05 富士通株式会社 建立劣化字典的方法和装置
JP4744317B2 (ja) * 2006-02-16 2011-08-10 富士通株式会社 単語検索装置、単語検索方法、及びコンピュータプログラム
JP2007272473A (ja) * 2006-03-30 2007-10-18 Toshiba Corp 文字認識装置、方法およびプログラム
US20090060338A1 (en) * 2007-09-04 2009-03-05 Por-Sen Jaw Method of indexing Chinese characters
JP2009146052A (ja) * 2007-12-12 2009-07-02 Casio Comput Co Ltd 手書き入力機能を備えた電子辞書装置
JP4636078B2 (ja) * 2007-12-14 2011-02-23 カシオ計算機株式会社 電子辞書装置
US8363947B2 (en) 2010-07-31 2013-01-29 International Business Machines Corporation Handwritten character recognition based on frequency variations in characters
CN104205018A (zh) * 2013-02-12 2014-12-10 林广生 汉字输入方法
US10643067B2 (en) 2015-10-19 2020-05-05 Myscript System and method of handwriting recognition in diagrams

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4531231A (en) * 1983-01-19 1985-07-23 Communication Intelligence Corporation Method for distinguishing between complex character sets
US4672677A (en) * 1984-11-19 1987-06-09 Canon Kabushiki Kaisha Character and figure processing apparatus
CN1041050A (zh) * 1988-09-06 1990-04-04 索尼公司 联机手写字符识别装置
EP0588074A2 (en) * 1992-08-18 1994-03-23 Eastman Kodak Company Method and apparatus for character recognition with supervised training

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5649027A (en) * 1992-07-24 1997-07-15 Microsoft Corporation Recognition of handwritten words

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4531231A (en) * 1983-01-19 1985-07-23 Communication Intelligence Corporation Method for distinguishing between complex character sets
US4672677A (en) * 1984-11-19 1987-06-09 Canon Kabushiki Kaisha Character and figure processing apparatus
CN1041050A (zh) * 1988-09-06 1990-04-04 索尼公司 联机手写字符识别装置
EP0588074A2 (en) * 1992-08-18 1994-03-23 Eastman Kodak Company Method and apparatus for character recognition with supervised training

Also Published As

Publication number Publication date
CN1150279A (zh) 1997-05-21
JPH096922A (ja) 1997-01-10
US5940532A (en) 1999-08-17

Similar Documents

Publication Publication Date Title
CN1123844C (zh) 识别手写字符的装置和方法
KR100297482B1 (ko) 수기입력의문자인식방법및장치
AU690781B2 (en) Method of splitting handwritten input
US5034989A (en) On-line handwritten character recognition apparatus with non-ambiguity algorithm
CN111753767A (zh) 一种作业自动批改的方法、装置、电子设备和存储介质
US5737443A (en) Method of joining handwritten input
CN1046624A (zh) 数据识别设备
JP3172762B2 (ja) オブジェクト認識装置
CN101051352A (zh) 字符识别装置和方法
CN112364867B (zh) 一种书法作业智能批改方法、系统、电子设备及存储介质
US6208756B1 (en) Hand-written character recognition device with noise removal
KR940007345B1 (ko) 온라인 한글 필기체 문자의 인식방법
CN1041050A (zh) 联机手写字符识别装置
CN1259635C (zh) 用于识别文本行的方法
CN1110002C (zh) 提高单词辨识率系统与方法
CN1148218A (zh) 一种计算机数字识别系统的图象聚类快速校对方法
JPH0950490A (ja) 手書き文字認識装置
CN1024723C (zh) 手写体字符识别方法
CN1113309C (zh) 上下文相关的多国语言自动辨识方法
JP2953162B2 (ja) 文字認識装置
CN114419626A (zh) 一种基于ocr技术的高精度单据识别方法和系统
CN1372186A (zh) 具智能联想中文输入方法
JPH07141468A (ja) 手書入力文字装置における手書文字認識処理方法
McQueen et al. A language model based optical character recogniser (OCR) for reading incidental text
CN1119299A (zh) 辞典登录方法,文字识别方法及文字识别装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
CI02 Correction of invention patent application

Correction item: Claims

Correct: Specific character

False: Specific features

Page: 1 0xing

Correction item: Claims

Correct: Used for......

False: And an added step for......

Page: Dao 2xing

Correction item: Description

Correct: Zhu

False: Zhu

Page: 1 pages and 8 lines

Correction item: Description

Page: 4 pages and 3 lines

Correction item: Description

Page: 5 Xing

Correction item: Description

Page: 7 Xing

Correction item: Description

Page: 8 Xing

Correction item: Description

Page: 1 2xing

Correction item: Description

Page: Dao 7xing

Correction item: Description

Page: Dao 4xing

Correction item: Description

Page: Dao 3xing

Correction item: Description

Page: Dao 2xing

Correction item: Claims

Correct: The reduction device is located in the device

False: Located device

Page: First pages and 5 lines

COR Change of bibliographic data

Free format text: CORRECT: RIGHT-CLAIMING DOCUMENT

C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee