[go: up one dir, main page]

KR20010090435A - 문자 인식 방법 - Google Patents

문자 인식 방법 Download PDF

Info

Publication number
KR20010090435A
KR20010090435A KR1020017002454A KR20017002454A KR20010090435A KR 20010090435 A KR20010090435 A KR 20010090435A KR 1020017002454 A KR1020017002454 A KR 1020017002454A KR 20017002454 A KR20017002454 A KR 20017002454A KR 20010090435 A KR20010090435 A KR 20010090435A
Authority
KR
South Korea
Prior art keywords
characters
combination
template
curves
curve
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
KR1020017002454A
Other languages
English (en)
Other versions
KR100615124B1 (ko
Inventor
구나르 슈파르
리카르트 베르틸손
Original Assignee
로저 라르손
데쿠마 아베
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 로저 라르손, 데쿠마 아베 filed Critical 로저 라르손
Publication of KR20010090435A publication Critical patent/KR20010090435A/ko
Application granted granted Critical
Publication of KR100615124B1 publication Critical patent/KR100615124B1/ko
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/142Image acquisition using hand-held instruments; Constructional details of the instruments
    • G06V30/1423Image acquisition using hand-held instruments; Constructional details of the instruments the instrument generating sequences of position coordinates corresponding to handwriting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/1801Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Holo Graphy (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

문자 인식을 위한 방법과 관련된 본 발명은 문자들의 결합을 검출하고, 상기 문자들의 결합을 전 처리하고, 상기 전처리된 문자들의 결합을 하나 이상의 템플레이트 심볼들과 비교하며, 템플레이트 심볼을 거절 또는 상기 템플레이트 심볼이 상기 문자들의 결합에 포함되는지를 결정하기 위해 결정 규칙을 적용하는 단계를 포함한다. 상기 문자들의 결합을 전 처리하는 단계는, 상기 문자들의 결합을 하나 이상의 곡선들로서 표현하고, 상기 곡선 또는 곡선들을 매개변수화하며, 변환의 다양한 종류들에 대해, 상기 곡선 또는 곡선들을 위한 하나 이상의 형상들을 형성하는 단계를 더 포함한다. 상기 비교하는 단계는, 하나 이상의 기하학적 근사 측정치들을 형성하고, 상기 템플레이트 심볼들에 대한 상기 형상 및 대응적으로 결정된 형상들 사이의 상기 기하학적 근사 측정치들의 값들을 모든 형상에 대해 결정하는 단계를 포함한다. 마지막으로, 상기 결정 규칙을 적용하는 단계는, 상기 값들을 고려하여 하나 이상의 템플레이트 심볼들을 선택하는 단계를 포함한다.

Description

문자 인식 방법 {CHARACTER RECOGNITION}
문자 인식 특히, 손으로 작성된 글자를 인지하기 위하여 알려진 다수의 방법이 있으며, 그것은 특히 글자의 양호한 해석을 요구한다. 손으로 작성된 글자가 형성되어 지고 있는 경우, 알려진 몇몇 방법들은 펜의 각 한 획(stroke)의 감지를 바탕으로 한다. 각 획 또는 획의 일부분의 방향, 경사 및 각도들 같은 기하학적 특성들은, 이미 알고 있는 글자들을 저장하기 위하여, 대응하는 데이터와 비교하여 결정되어진다. 손으로 작성된 글자는 상기 작성된 특성의 기하학적 특성들에 가장 잘 대응하는 상기 저장된 글자일 수가 있다. 상기 기하학적 문자들은 사용된 필적 표면을 커버할 수 있는 xy 좌표계와 관련이 있다. 상기 알려진 방법들로는 예를 들어 미국 특허 제 5,481,625호 및 미국 특허 제 5,710,916호에 공개되어 있다. 상기와 같은 방법들에 있어서, 문제점은 그것들이 회전되는 것에 예민하다는 것이다. 예를들어, 누군가가 상기 필적 표면에 사선으로 쓴 경우, 상기 방법은 문자들이 씌여졌다는 것을 정확하게 판단하는 것에 어려움을 갖는다.
미국 특허 제 5,537,489호는 글자들을 표준화함에 의하여 글자들을 전처리하는 방법이 공개되어 있다. 씌여진 글자는 표본이 되며, 각 표본은 좌표 쌍으로서 표현되어 진다. 상기 좌표 평면에서 상기 문자들을 단독으로 비교하는 대신, 씌여진 문자를 모델 문자에 잘 맞춘 변형을 판단한다. 간접적으로, 상기 언급된 방법이 다룰수 없는 회전와 변형의 어떤 모양이 참작되어야 한다. 상기 변형은 상기 씌여진 글자를 표준화하곤 한다. 특히, 상기 글자가 해석되어짐에 의해 표준화되어서, 그것의 중앙점이 좌표이 원점이 되는데, 그곳에서 상기 모델 문자의 중앙점을 찾으며, 상기 글자가 어떤 방법으로 비교되고 회전되어서, 그것은 가장 가능한 방법으로 상기 모델 문자에 대응한다 .
상기 방법의 문제점은 표준화가 컴퓨팅 파우어(computing power)를 요구한다는 것과, 어떤 경우에 있어서, 모델 문자들의 선택은 어떤 모델 문자가 상기 작성된 글자와 가장 유사한지를 판단함에 의하여 행해져야만 한다.
회전들을 확실히 다룰 수 있는 다른 방법은, 미국 특허 제 5,768,420호에 공개되어 있다. 상기 알려진 방법에서, 곡선을 인지하는 것은 "탄젠트의 비율"이라고 명명된 비율에 의하여 기술된다. 곡선, 예를 들어, 문자의 부분은 상기 곡선을 따르는 점들 쌍의 연결을 선택함으로서 매핑된다. 여기서, 각 쌍의 두 점들에 있어서 탄젠트는 어떤 각에서 교차한다. 상기 교차점으로부터 상기 쌍의 상대적인 점들까지의 거리 사이의 비율은 계산되어지며, 곡선의 식별을 완전하게 한다. 상기 방법은 본질적으로 옮김, 비교 및 회전에 민감하지 않다. 그러나, 그것은 많은 면에서 한정된다. 결국, 그것은 두 점들이 없는 어떤 곡선 모양들을 허락하지 않으며, 상기 두 점들의 접선들은 결정된 각에서 교차한다. 글자의 최소 부분들이 선택된 교차각을 위한 확정할 수 없는 곡선 형상들로 구성되어진다. 그것은 상기 방법의 신뢰성을 감소시킨다.
본 발명은 청구항 제1항의 서문에 따라 문자 인식을 위한 방법에 관한 것이다. "문자(Character)"는 단어와 같은 몇 개의 문자들의 구성 뿐만 아니라, 수와 관련하는 분명치 않은 복합어에 있어서, 즉, 글자들과 숫자들 같은 분리된 문자들도 여기에 귀착된다. 물론, 일반적으로 사용되는 글자들과 가공의 글자들 모두가 포함된다.
본 발명 및 본 발명의 이점들이 첨부된 도면을 참조한 실시예들에 의하여 하기에 더욱 자세히 도시되어질 것이다.
도 1은 손으로 작성된 문자로 이루어진 문자들의 결합의 일예를 도시하고 있으며, 본 발명에 따른 방법의 바람직한 실시예에서 몇 단계를 도시하고 있다.
도 2 및 도 3은 손으로 작성된 문자로 이루어진 문자들의 결합의 다양한 변형의 실시예를 도시하고 있다.
도 4는 여러 개의 글자들로 이루어진 문자들의 결합의 인지의 일예를 도시하고 있다.
도 5는 본 방법을 수행하기 위한 장치의 일실시예를 도시하고 있다.
본 발명의 목적은 상기 언급된 문제점들을 갖고 있지 않으며, 손으로 작성된 문자들의 개별적인 스타일들 및 타이프로 친 글자들의 특별한 폰트들을 더 넓은 영역으로 수용하며, 제한된 컴퓨팅 파우어를 실행하여 쉽게 문자 인식을 하기 위한 방법을 제공하는 것이다.
본 발명은 청구항 제 1항에서 정의된 발명에 따른 방법에 의하여 성취된다.
본 발명에 따라서, 용어 "템플레이트 심볼(template symbol)"은 청구항에서 정의된 대로, 별도의 문자의 부분으로부터 단어들의 결합 또는 다른 문자들의 복합에 이르는 모든 것을 의미한다. 상기 문자의 부분은, 예를 들어, 호나 부분적 한 획이며, 상기 문자는 글자 또는 숫자이다. 유사한 방법으로, 용어 "문자들의 결합(union of characters)"은 떨어진 문자로부터 여러 문자들의 결합에 이르기까지 모든 것을 의미한다. 언급된 용어의 확장은 하기의 실시예로부터 증명되어질 것이다.
본 발명에 따라, 문자 인식 방법은 다수의 주요 단계들로 구성된다:
a) 문자들의 결합이 감지된다.
b) 상기 문자들의 결합이 전처리된다.
c) 상기 전처리된 문자들의 결합은 하나 이상의 템플레이트 심볼들과 비교된다. 그리고,
d) 결정법은 상기 템플레이트 심볼들 중 하나가 상기 문자들의 결합에 포함되는지 여부를 결정하기 위하여 적용된다.
바람직한 실시예에 따라, 다양한 주요 단계들이 다음의 명세서와 관련하여 수행된다. 상기 실시예는 바람직하게 압력에 민감한 디스플레이 위에 쓰여진 문글자들의 결합을 인지하려 하며, 그것은 시장에서 가능하다. 본 발명은 타자기로 친 문자를 인자하기 위한 유용성은 손으로 작성된 문자들의 결합들과 마찬가지임을 주지해야만 한다. 여기서 타자기로 작성된 문자들은 컴퓨터로 스캔된 하드 카피(hard copy)로부터 유래한다. 특히 타자기로 친 문자 인식에 적용되는 실시예는 하기 기술될 문자들의 결합을 정밀검사한다. 본 실시예의 하기 기술된 단계들에서, 단순성을 위하여, 문자들의 결합은 한 문자를 포함한다는 것이 가정된다.
단계 a)에서, 상기 문자가 상기 압력에 민감한 디스플레이 위헤 작성됨에 따라, 상기 문자 위의 점들은 동시에 정기적인 시간 간격으로 감지된다. 따라서, 점들이 질서 정연하게 연속하게 된다. 단계 b)에서, 다음의 동작들이 수행된다. 상기 점들사이의 인터폴레이션(interpolation)에 의하여, 상기 문자의 곡선 표현이 발생된다. 상기 곡선 표현은 점들의 연속을 통하여 지나는 하나 이상의 곡선들로 구성된다. 상기 펜을 들어올리는 것은 상기 인터폴레이션이 상기 펜을 들어올린 곳의 점들 사이의 공간을 확장하는 것을 막는다. 상기 인터폴레이션은 하나 이상의 곡선들로 구성되도록 고려되는 "t", "" 및 "s"와 같은 문자들에 귀착한다. 각 곡선 또는 곡선들의 결합은 개별적인 기하학상의 유닛에 따라 전체적으로 인지된다. 이것은 예를 들어, 본 발명에 따른 상기 방법이 많은 방법으로 완전한 문자들에 동작한다는 것을 의미한다(글로벌 문자 인터폴레이션). 각 점은 두 개의 좌표로 표시되는데, 상기 좌표는 상기 디스플레이가 구성하고 있는 한정된 평면에서 점의 위치를 지시한다. 다음에 따르는 좌표 중 x1 은 횡측을 표시하며, x2 는 수직 방향을 표시한다. 상기 곡선은 φ(t)=(φ1(t), φ2(t)), a≤ t ≤ b, 로서 편리하게 매개변수화 된다. 여기에서 단순성을 위하여, a=0, 및 b=1 이고, 상기 곡선은 적당한 파라미터리제이션(parameterisation) 법칙에 따라, n 개의 점들 t 〈 t2 ...〈 tn에서 샘플된다. 우선, 호의 길이는 상기 파라미터리제이션(parameterisation)이 바람직하게 수행됨에 따라, 상기 법칙은 상기 점들이 등거리에 위치됨을 의미한다. 글자를 쓰는 사람의 일정하지 않은 동작 속도 때문에, 초기 좌표 샘플들은 상기 경우가 아니다. 호 길이의 사용은 파라미터리제이션(parameterisation)의 표준으로서 보여질 수 있고, 그것은 다음의 템플레이트 심볼들과의 비교를 용이하게 하며, 상기 템플레이트 심볼들은 대응하는 방법으로 매개변수화 및 견본이 된다. 변형의 몇몇 부류에 대하여, 재매개변수화(reparameterise)하는 것이 필요하다는 것을 이하 기술될 것이다.
상기 글자와 템플레이트 심볼들을 비교하기 위하여, 양적인 비교들을 인정하는 표시를 구체화할 필요가 있다. 미리 정의된 상기 템플레이트 심볼들로부터의 몇몇 일탈은 묵인되어야만 한다. 즉, 예를 들어, 비록, 그것의 모양 면에서, 상기 템플레이트 심볼들과 어떤 범위에서 다르다고 하더라도, "a"는 "a"로서 해석되어야 한다. 본 발명에 따라서, 정의는 다른 변형에 근간하여 적용되어진다. 유연성과 정확성에 대한 요구에 의존하여, 다양한 부류의 변형이 참작될 수 있으며, 상기 부류는 옮김(translation), 회전(rotation), 축소 또는 확대(scaling), 시어링(sheaing) 및 반전(reflection) 같은 변형의 하나 이상의 타입들로 구성된다. 이것은 도 2 및 도 3에 도시되어 있다. 도 2는 박스 2a 에서 손으로 작성된 "a"를 도시한다. 다른 3개의 문자들은 다양하지만 밀접하게 관련된 변형을 받았다.상기 밀접하게 관련된 변형에 의하여 구성된 변형의 부류는 옮김(translation), 회전(rotation), 축소 또는 확대(scaling), 시어링(sheaing) 및 반전(reflection)을 인정한다. 박스 2b 및 2c 안의 글자들은 박스 2a 안의 글자와 관련하여 옮김, 회전, 축소 또는 확대, 및 시어링을 받았다. 박스 2d의 글자는 옮김, 회전, 축소 또는 확대, 및 반전을 받았다.
도 3은 오직 축소 또는 확대, 회전, 및 옮김으로 구성된 완전히 유사한 변형을 도시하고 있다. 본 발명에 따른 방법의 상기 실시예에 따라서, 허용되는 일탈들이 완전히 유사한 변형에 한정된다. 이것은 쓰여진 문자 또는 문자의 부분이 상기 템플레이트 심볼에 의하여 표시된 상기 동일한 문자 또는 상기 문자의 부분으로서 해석되는 것을 의미한다. 상기 쓰여진 문자 또는 문자의 부분은 축소 또는 확대, 회전 및 옮김의 적절한 결합에 의하여, 템플레이트 심볼과의 대응으로 초래될 수 있다. 상기 대응이 완전할 필요는 없으며, 하기에 기술될 것이다.
본 발명에 따라 바람직해지는 표현은 매개변수화된 곡선의 불변요소를 형성함으로서 제공된다. 유용한 불변요소들은 본 발명에 따라서, 특정한 문자에 대한 인간이 내리는 해석에 가까운 해석을 내려야 한다. 이것은 정확히 가늠할 수 있는 인간이 서명자가 자신이 썼다고 말하는 문자로 올바르게 해석할 수 있는 문자들이, 본 발명에 따른 방법에 의하여 정확하게 해석되어야 한다. 구조화된 다양성은 잘 균형 잡힌 방법으로 선택한다. 본 발명에 따라, 불변요소들은 그러므로, 다음의 정의를 기초로 하여 구성된다. φ가 상기에 따라 매개변수화된 곡선이고, G 는 곡선들의 변형들의 그룹인 경우, 세트 d(φ)={ψ│ψ=g(φ), g ∈ G} 및 그것의 동등한재작성은 φ의 모양으로 간주된다. 상기 정의는 많은 가능한 불변요소들을 인정하는데, 그러나 모든 불변요소들은 일반적으로 그들이 상기 언급된 개별적인 유닛에 따라 상기 곡선을 다룬다는 것은 당업자에 의해서 이해될 것이다.
본 발명의 바람직한 실시예에 따라서, 긍정적 유사 변형의 그룹에 대응한 형상이 s(φ) = linhull({φ1, φ2), (-φ21),(1,0),(0,1)}, 즉, 매개변수화된 곡선 φ 으로부터 구성된 선형 공간에 의하여 주어진다. 당업자에 의하여 이해됨에 따라, s(φ)는 정확하게 d(φ)의 동등한 치환이다. 실제로, 본 모양의 사용은 긍정적인 유사 변형들에 의하여 각각 다르게 변형되어질 수 있는 모든 매개변수화된 곡선들이 모양에서 동일한 일차공간을 갖는다.
대조적으로, 본 발명에 따른 다른 실시예에 따라, 밀접한 변형들이 허락될 수 있다. 재 작성 후에 상기 모양은 s(φ) = linhull({φ1, φ2, 1)에 의하여 주어지는데, 이는 예를 들어, "밀접한 모양에 대한 확장", Technical report, Dept. of Mathematics, Lund Institute of Techology 1997 by R. Berthilsson 에 보다 자세하게 기술되어 있다.
단계 c) 에서, 상기 작성된 문자의 상기 모양은 많은 템플레이트 심볼들을 위하여 형성된 모양들과 대응하게 비교된다. 본 발명의 본 실시예에서, 상기 디스플레이 위에 사용자가 손으로 쓰도록 함으로서 제공되는 지시에 의하여, 상기 템플레이트 심볼들은 그 또는 그녀가 한번에 하나씩 필요로 할 수도 있는 모든 문자들이다. 상기 모든 문자들은 상기 설명된 단계 a) 및 b)에 따라 진행되며, 템플레이트 심볼에 따라 저장된다. 상기 언급된 바에 따라, 각 템플레이트 심볼은 하나 이상의 곡선들로 구성되며, 문자의 부분 또는 상기 완전한 문자를 표시하고, 실제로 몇개의 템플레이트 심볼들이 글자를 형성하도록 요구되는 것을 의미한다. 그러나, 하기에 더 기술되는 템플레이트 심볼은 대조적으로 또한, 몇 개의 문자들의 연속을 표시한다.
본 발명에 의하면, 상기 형상들을 비교하는 일 방법은 기하학적인 근사 측정을 이용하는 것이다. 본 발명의 바람직한 실시예 및 다른 실시예에 따라 형성된 상기 형상들에 있어서, 형상들에 대한 기하학적인 근사 측정 값 μ은 가능한 파라미터 곡선들 S의 공간 내에 선형 부분 공간들은 갖는다. 그러한 기하학적 근사 측정은 다음과 같다.:
여기서, HS는 힐베르트-쉬미트 놈을 나타내고 I는 항등식을 나타낸다.
상기 정의에 있어서, s(φ) 및 s(ψ)는 그러한 선형 부분 공간들을 나타낸다. PS(φ)및 PS(Ψ)은 각각 s(φ) 및 s(ψ)으로의 정사 투영을 나타낸다. HS는 힐베르트-쉬미트 놈을 나타내고 I는 항등식을 나타낸다. 기하학적인 측정 값 μ에 대한 계산은 스칼라 곱을 선택하는 단계를 포함한다.에서 2개의 함수 φ(t) 및 ψ(t)의 스칼라 곱의 일반적인 예는 다음과 같다.:
여기서, dmk는 양의 라돈(Radon) 측정값들이고에서의 스칼라 곱을 나타낸다.
각 샘플링된 곡선이 각각 2개의 좌표를 갖는 다수의 포인트들을 가지므로, 상기 형상들에 대한 비교 처리용 행렬 표시법을 이용하는 것이 편리하다. 행렬 표시법에서 상기 곡선들을 설명하고 기하학적 근사 측정을 구성하는 단계들은 다음과 같이 설명되고 수학적으로 수행된다. 검출된 문자 ψ(t)=(ψ1(t), ψ2(t)), 0≤t≤1의 곡선 및 템프레이트 심벌 φ(t)=(φ1(t), φ2(t)), 0≤t≤1의 곡선을 명명하자. 상기 곡선을 0 = t1< t2... <tn= 1의 시간 포인트들에서 샘플링함으로써 다음 행렬들이 형성될 수 있다.
상기 행렬들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 널리 알려진 방법에 의해 QR-인수 분해된다. 즉, M1=Q1R1및 M2=Q2R2로서, 여기서, Q1및 Q2는 직교 행렬들이고 R1및 R2는 어퍼(upper) 삼각형이다. 행렬들 Q1및 Q2는 각각 검출된 문자 및 템프레이트 심벌의 형상들을 나타내고 상기 파라미터리제이션들(parameterisations) 및 상기 샘플링이 주어진다.
기하학적인 근사 측정 값 μ은 다음과 같이 구성될 수 있다.
여기서, 놈은 프로베니우스 놈을 나타낸다. 상기 스칼라 곱의 일반적인 예에 있어서, I=0이고 dm0이 간격 [0, 1]에서의 보통의 리이베스그(Lebesgue) 측정 값인 경우, 상기 기하학적인 근사 측정 값이 정확하게 얻어진다. 스칼라 곱에 대한 선택이 상기 방법의 실행에 영향이 미친다. 상기 검출된 문자의 형상과 상기 템프레이트 심벌들의 모든 또는 부분-결합의 형상들 사이의 근사 측정 값들을 결정한 후, 단계 d)가 수행된다. 상기 단계에서, 각 값은 각 템프레이트 심벌에 대해 형성된 개별 수용 한계와 비교된다. 그 근사 측정 값들이 그들의 각 수용 한계들보다 작은 템프레이트 심벌들은 기입된 문자의 그럴듯한 해석들로 고려된다. 상기 템프레이트 심벌은 상기 그럴듯한 해석들 중에 그 값이 가장 작은 것이 선택된다. 이에 반해서, 어떤 값도 그 수용 한계 보다 작지 않은 경우, 정밀한 결정이 이루어진다. 상기 수용 한계들은 또한 1이고 모든 템프레이트 심벌들에 대해 동일할 수 있다. 개별 수용 한계들을 사용하는 장점은 @과 같은 더욱 복잡한 문자들이 적합한 경우에 상기 근사 측정의 최고 값을 가지는 경향이 있고, "1"과 같은 단순한 문자들은 적합한 경우에 작은 근사 측정 값을 가지는 경향이 있다는 것이다. 부가적인 변형이 가능하며, 이러한 변형은 아래에 설명되어 있다.
원리적으로, 상기 곡선들을 양성의 유사 변환(positive similaritytransformation)으로 상호로부터 얻게되는 경우 φ 및 ψ가 동일한 곡선의 파라미터리제이션들인 경우, 상기 근사 측정은 μ(s(φ)), (s(ψ)=0을 이행해야 한다. 그러나, 쓸 때 사람들은 상기 템플레이트 심볼들의 허용가능한 유사 변환들에 정확하게 지키지 않으므로, 수용 한계들을 제로이상이 되도록 선택해야만 한다.
한편, 상기 수용 한계들은 그러한 까닦에, 〉0인 값들로 결정되며, 다른 한편으로는, 그것의 수용 한계보다 작은 값들이 없는 경우에는 상기 쓴 문자는 상기 템플레이트 심보들 중에 동등한 것을 갖고 있지 않은 것과 같이 해석된다. 대신에, 상기 파라미터리제이션이 상당히 넓은 범위까지 최종 결과에 영향을 끼치므로 본 실시예에 따른 리파라미터리제이션이 이행된다. 곡선 ψ의 바람직한 리파라미터리제이션이라는 것은 일대일 함수 γ: [0, 1] → [0, 1]과 함께 놓인다는 것을 의미한다. 예컨대, γ(t)=1-t이 이행되며, 이것은 문자가 반대 방향으로 쓰여졌다는 것을 의미한다. 어떤 리파라미터라이제이션이 이행되어야 하는지는 최소화 문제를 풀므로써 결정되며,
여기서 최소화는 위에서 설명한 모든 γ에 대해 이행된다.
위에서 설명한 단계들은 이어 반복되며 상기 근사 측정의 새로운 값들이 얻어진다. 만일 그것의 수용 한계 미만이 그들중 없다면, 쓴 문자는 거절되고 사용자에게 이것에 대해 예컨대, 그 문자를 다시 쓸 것을 요구함으로써 알린다. 만일 리파라미터리제이션 이 후 근사 측정의 결정의 속도를 증가시키기 원한다면, 가장 작은 예컨대, 제1 결정으로부터의 근사 측정치들중 3개의 가장 작은 값들이 선택될 수 있으며, 제2 결정에서는, 그룹내에 포함된 템플레이트 심볼들과 단지 비교될 수 있다. 그러나, 어떤 경우에 있어서, 이것은 모든 템플레이트 심볼들이 제2 결정에서 고려되는 경우와는 다르게 최종적인 결과를 발생시킬 수 있다.
기하학적 근사 측정치 μ는 문자의 다른 해석들 사이의 순위 순서를 발생시킬 뿐만 아니라 두 문자들이 얼마나 유사한지 그 정도를 나타낸다. 이것은 서명들(여기서는 첫 글자들을 서명으로 감지된다)의 검증 및 확인 각각을 위해 본 방법을 또한 사용할 가능성을 제공한다. 그러서, 이러한 사용에 있어서, 아크-파라미터라이제이션(arc-parameterisation)은 쓸때의 역동의 정보를 배제함으로, 파라미터라이제이션의 바람직한 형태는 아니다. 그러한 정보는 이러한 용도에서는 유용하다. 그러나, 보다 적절한 변형들이 있다.
지금까지 쓰여진 문자를 비교할 수 있는 적절한 템플레이트 심볼들이 있다는 사실을 기초로 바람직한 실시예를 설명하였다. 또한, 하나의 문자에 대해서 설명하였다. 보통, 분리된 문자들이 아니라 디스플레이상에 쓰여진 완전한 단어들을 갖는 런닝 텍스트이다. 사용자의 관점으로부터, 런닝 텍스트를 쓸수 있게 하는 것이 바람직하다.
문맥에서의 문제는 문자들의 결합은 다수의 문자 결합들을 포함할 수 있다. 사용자에게 템플레이트 심볼들로서 모든 가능한 문자들 또는 단어들을 쓸 것을 요구하는 것은 부당하다.
동시에, 만일 필적의 형상들의 제한을 회피할 수 있다면 유익할 것이다. 만일 사용자가 예컨대, 위에서 설명한 경우가 늘 존재하도록 단지 한 번에 하나의 문자만을 쓰도록 엄격히 제한 받는다면, 그러한 상황은 비교적 명백하지만 사용자-친숙은 아니다. 본 발명에 따르면, 사용자는 런닝 텍스트를 쓸 수 있다. 따라서, 곡선/곡선들 예컨대, 문자의 모서리들 및 시작들이 어디인지 알기는 어렵다. 문자의 시작 및 끝을 지적하는 점들을 브레이크포인트들(breakpoints)이라 하며, 가능한 브레이크포인트들을 찾는 것은 인식 문제에 복잡성을 부가시킨다. 이러한 복잡성 문제는 다음과 같은 방식의 본 발명에 따른 방법의 실시예에 따라 해결된다. 위의 단계들이 본 실시예에서 동일한 방식으로 이행된다라는 것이 언급되어야 한다. 다음의 설명은 근본적으로 문자들의 결합을 사전 처리하는 단계 및 비교하는 단계와 관련된다.
만일 팬이 단어내의 각 문자 뒤에서 들어올려진다면, 이것은 이점을 갖을 수 있다. 팬의 올려짐은 불연속을 발생시키며 공간 또는 시간상 비교적 멀리 떨어져 있는 두 점들에 의해 감지될 수 있다. 물론, 이러한 검출은 아크-길이 파라미터라이제이션 이전에 이행된다. 여기서 문자들의 결합은 n 곡선들로 구성된다. 두 개의 문자들을 상호 구분하기 위해 불연속 점들을 그럴듯한 브레이크 포인트들로서 여길 수 있다. 이것은 획들 사이에서 펜을 들어올림으로써 쓰여지는 몇몇의 획들을 포함하는 문자들의 문제에 초점을 맞춘 것이다. 그러한 문자는 불연속성 검출을 통한 몇몇 곡선들에 의해 표현될 수 있다. 그러나, 각 곡선은 다시 스케일된 아크-길이에 의해 파라미터라이제이션될 수 있으며, 이것은 각 곡선이 동일한 수의 샘플링점들을 포함한다는 것을 의미한다. 11, 12, ..., 1n이 곡선들이고 sk1이 곡선들 1 내지 k의 합성이라고 가정한다. 곡선들 s1, s2, ..., sk를 템플레이트 심볼들과 비교하라, 여기서 k는 템플레이트 심볼에 포함된 커브들의 가장 큰 수이다. sk1이 대응/대응들을 주는 즉, 템플레이트 심볼들을 비교할 때 수용 한계/ 수용 한계들 이하인 근사 측정들의 하나 이상의 값들을 부여하는 가장 긴 결합이라고 가정한다. sk1이 하나 이상의 템플레이트 심볼들에 대응하는 경우에서 조차 이것이 올바른 해석을 주는지는 불확실하다. 상기 방법의 본 실시예에 따르면, 그러한 까닭에 아래에서 설명하게 될 그럴듯함 테스트가 이행된다. 만일 해석이 그럴듯하지 않다면, sk1는 대응성을 부여하는 곡선들 sk2의 가장 긴 결합 단지 하나까지 짧아진다. 그럴듯함 테스트는 한 번 더 이행된다.
어떤 Sk에 대해 그럴듯한 해석이 없다면, S1의 최선의 해석이 선택된다. 나머지 곡선들은 대응적으로 처리된다. 단지, 불연속성(discontinuity)의 점들은 간결한(이해가 쉬운) 필적(coherent writing)에 관한한 그럴듯한 구분점들(breakpoints)로서는 충분치 않으며, 곡선내의 구분점들일 수 있다. 실제로 모든 쓰여진 곡선들의 구성의 리파라메터리제이션들(reparameterisations)으로 구분점들을 찾기 위한 위의 절차가 성취된다는 것에 주목해야 한다.
상기 용어 "그럴듯함 테스트(plausibility tests)"는 특히, 소위 신뢰성 세트들(confidence sets)을 포함한다. 몇몇 문자들로 구성되는 문자들의 결합들의 인식의 위의 추리, 및 몇몇 곡선들로 구성되는 문자들을 그럴듯함 테스트로서 상기 신뢰성 세트들을 사용하여, 도 4를 참조로 지금부터 각각 예시한다.
쓴 문자가 ""(영어 "eat") 즉, 도 4a에 따라 쓰여진 완전한 단어라고 가정한다. 재배율된(rescaled) 호 길이로 리파라메터리제이션 및 비연속성들의 검출 수단에 의해, ""는 확인되며, 그 다음 차례로 "t"가 확인된다. 수직뿐만 아니라 수평의 획은 "1"로서 해석 즉, "t"는 "11"로서 해석될 수 있다. 템플레이트 심볼들(template symbols)은 도 4b에 따라 관련된 신뢰성 세트들과 함께 저장되며, 여기서 상기 템플레이트 심볼들 "1" 및 "t"은 음영된 영역으로 각각 신뢰성 세트들이 함께 도시되어 있다. "t"의 수직 획은 상기 템플레이트 심볼 "1"로서 해석된다. 이어, 변환 a:은 -형상을 발생시키는 종류내에서- 상기 수직 획에서 어느 것이 상기 템플레이트 심볼을 변환시키는지가 결정될 수 있다. a가 신뢰성 세트에 적용되면, 도 4c의 결과가 성취된다. 다음 곡선 즉, 수평 획은 금지된 신뢰성 세트내에 있으며, 그 해석은 그럴듯함이 없는 것으로로서 분류된다. 상기 신뢰성 세트들은 단지 직선의 획으로 확인될 필요는 없으며, 당업자라면 이해할 수 있는 바와 같이, 보다 일반적인 모습을 갖을 수 있다. 제1 세트를 포함하는 다른 신뢰성 세트는 각각의 템플레이트 심볼에 연결될 수 있다. 이어 만일 다음 곡선이 또한 제2 신뢰성 세트의 바깥쪽에 또한 존재한다면, 그것은 다음 문자가 새로운 단어내의 첫 번째 문자인 것으로 해석될 것이다.
다른 그럴듯함 테스트는 신뢰성 세트들의 설명에서 결정된 변환을 검토하는것을 의미한다. 만일 상기 변환이 일정 범위 이상을 넘는 다면, 상기 해석은 그럴듯함이 없는 것으로서 분류될 것이다. 예컨대, 그러한 범위는 보다 일찍이 해석된 문자들을 얼마만큼 회전시킬 것인지와 관련하여 상기 변환이 상기 문자를 얼마만큼 회전시키게 할지를 결정할 수 있다. 또한, 지나친 변형을 배제시킬 수 있다. 예컨대, "S"와 "s"를 구분하기 위해, 상기 변환의 확대를 이전에 해석된 심볼들의 확대와 관련시켜 계산할 수 있다.
본 발명에 따른 방법의 위에서 설명한 실시예들은 단지 예들을 제한하지 않는 것으로서 보아야 하며, 위에서 언급한 것들과는 별개로 많은 변형들이 첨부된 청구항들에서 정의된 바와 같이 본 발명의 범위내에서 가능하다. 다른 그러한 변형들의 예들은 다음과 같다.
위에서 설명한 리파라메터리제이션에 대한 대체로서, 근접 측정의 첫번째로 결정된 가장 작은 값을 기초로 직접적으로 결정된다.
다른 변형들의 예들은 다른 근접 측정의 선택, 다양한 사용자들에게 어떤 적응을 요구하는 용인 한도들의 값들의 다양한 선택, 리파라메터리제이션의 다양한 형태들 및 형상의 다양한 형태들 예컨대, 밀접하게 결합된 형상이 있다.
형상의 다양한 형태에 관한한, 두 개의 이상의 형상들은 선택적인 것으로서, 문자들의 각 결합을 위해 병행하여 사용된다. 이것은 몇몇 비변형체들이 문자들의 각 결합들을 위해 제공되고, 이어 다음 단계들에서 병행하여 처리된다. 이것은 보다 높은 정확도 및 보다 빠른 인식성을 부여한다.
실질적으로, 본 발명에 따른 방법은 예컨대, 전자 노트북 및 그와 같은 것및 쓰기가 가능한 창에 의해 통신의 높은 가능성을 갖는 이동 전화에 사용될 수 있다. 본 발명에 따른 방법은 C, C++ 또는 FORTRAN과 같은 수학적인 계산을 위한 상업적으로 이용가능한 프로그래밍 언어를 사용하여 컴퓨터내의 컴퓨터 프로그램으로서, 또는 아래에서 설명하게 될, 본 발명에 따라 특별히 만들어진 디바이스로서 실행될 수 있다. 양 경우에 있어서, 상기 템플레이트 심볼들은 데이터베이스로서 저장된다. 필요하다면, 상기 데이터베이스를 가변시킬 수 있다.
도 5에 도시된 바와 같이, 상기 방법을 실현하는 디바이스의 실시예는 압력-감응 디스플레이(42), 검출기(46)를 갖는 디스플레이 통신 유니트(44), 제어 유니트(48), 메모리 제어 유니트(50), 메모리 유니트(52), 및 프로세싱 유니트(54)를 포함한다. 상기 디스플레이 통신 유니트(44), 상기 제어 유니트(48), 상기 메모리 제어 유니트(50), 및 상기 프로세싱 유니트(54)는 상기 유니트들 사이의 데이터, 어드레스 및 제어 신호들을 전송하는 버스를 통해 통신한다. 점들의 배열된 시퀀스를 제공하는 문자들의 결합들은 상기 디스플레이(42)상에 쓰여지고 상기 검출기(46)에 의해 검출된다. 상기 메모리 유니트(52)에 상기 템플레이트 심볼들 및 문자들의 검출된 결합들이 저장된다. 상기 프로세싱 유니트에 의해 연산 동작들이 이행되며, 상기 연산 동작들은 하나 이상의 곡선들로서 상기 점들의 시퀀스들의 해석, 각 곡선의 파라미터제이션(parameterisation), 템플레이트 심볼들과 문자들의 앞서 처리된 결합과의 비교 및 결정 규칙의 적용을 포함한다. 상기 메모리 유니트(50)에 상기 방법을 이행하기 위한 소프트웨어가 또한 저장된다. 상기 제어 유니트(48)는 제어 유니트(48)는 상기 프로그램을 구동하고 상기 디스플레이 통신 유니트(44) 및 상기 디스플레이(42)를 통해 사용자와 통신한다.
상기 디바이스는 특히 형상들의 선택, 근사 측정의 선택, 파라미터라이제이션들의 선택 및 결정 규칙의 선택을 포함할 수 있는 선택적인 설정들을 위해 또한 적용된다. 상기 선택들은 디스플레이(42)를 통해 이행된다.
위에서는, 필연적으로 디스플레이상에 쓰여지고 쓰여짐과 동시에 검출되는 문자들을 기초로 설명했다.
문자들이 종이에 앞서 써짐에 따라, 문자들을 검출 예컨대, 스케닝하는 선택이 있다. 이것은 타이핑된 문자들뿐만 아니라 손으로 쓴 문자들과 관련된다. 따라서, 검출은 디스플레이상의 기록을 인식하는 동작 대신에 종이상 문자들을 읽는(스케닝하는) 동작을 포함한다. 유익하게는, 읽힌 데이터는 모서리 검출에 의한 상기 점들의 배열된 시퀀스로 변환된다. 그러나, 그것 또한 본 발명의 범위내에서의 변형이다. 본 실시예에서, 사전의 처리는 상기 모서리 검출 및 파라미터라이제이션을 기초로, 하나 이상의 특성 곡선들 예컨대, 문자들의 모서리 곡선 또는 모서리 곡선들을 형성하는 과정을 포함한다. 이와 같이, 상기 모서리 곡선들을 정의된 경우, 다음 단계들은 위에서 설명한 바람직한 실시예들에와 동일하다.
상기 결정 규칙은 많은 다른 방법들에서 선택될 수 있다. 위에서 언급한 변형은 허용 한계 미만의 근사 측정 값이 선택되는 모든 템플레이트 심볼들이다. 이어, 상기 템플레이트 심볼들은 위에서 설명한 형태의 정제된 결정에 따라 또한 처리될 수 있다. 가장 그럴둣한 선택을 지적하는 다른 선택 방법으로 결합하는 것이 또한 가능하다. 그러한 방법의 한 예는 텍스트들내에서 분리된 문자들 또는 문자들의 결합이 출현할 확률을 나타내는 문자들의 통계이다.
더욱이, 수용 한계들을 결정하는 선택은 상기 템플레이트 심볼들을 그룹화하는 것이고, 그러한 경우 동일한 한계가 그룹내에서 적용된다.
본 발명에 따른 방법은 오히려 일그러진 문자들을 인식가능하다는 데에 신뢰할 수 있으며, 런닝 텍스트(running text)를 잘 관리한다. 데이터베이스의 내용은 어렵지는 않으나, 원리적으로 분리된 문자들의 세트들은 충분하다. 그러나, 다양한 폰트들 및 육필들을 높은 정확도를 가지고 인식하기 위해, 비교시 적절하고 허용가능한 변환 종류 이외의 일그러짐들을 포함하는 각 문자의 여러 변형들을 저장하는 것이 이점이 있을 수 있다. 예컨대, "u"와 연결된 두 개의 1들 "11"을 보다 안전하게 구분할 수 있도록, 어떤 문자들의 결합들을 저장하는 것이 또한 유익할 수 있다.

Claims (15)

  1. 문자들의 결합을 검출하는 단계;
    상기 문자들의 결합을 전 처리하는 단계;
    상기 전처리된 문자들의 결합을 하나 이상의 템플레이트 심볼들과 비교하는 단계; 및
    템플레이트 심볼을 거절하거나 또는 상기 템플레이트 심볼이 상기 문자들의 결합에 포함되는지를 결정하기 위해 결정 규칙을 적용하는 단계를 포함하는 방법에 있어서,
    상기 문자들의 결합을 전 처리하는 단계는,
    상기 문자들의 결합을 하나 이상의 곡선들로서 표현하는 단계; 및
    상기 곡선 또는 곡선들을 파라미터라이제이션하는 단계를 포함하며,
    상기 문자들의 결합을 전 처리하는 단계는,
    변환의 다양한 종류들에 대해, 상기 곡선 또는 곡선들을 위한 하나 이상의 형상들을 형성하는 단계를 더 포함하며,
    상기 비교하는 단계는,
    하나 이상의 기하학적 근사 측정치들을 형성하는 단계;
    상기 템플레이트 심볼들에 대한 상기 형상 및 대응적으로 결정된 형상들 사이의 상기 기하학적 근사 측정치들의 값들을 모든 형상에 대해 결정하는 단계를 포함하며,
    상기 결정 규칙을 적용하는 단계는,
    상기 값들을 고려하여 하나 이상의 템플레이트 심볼들을 선택하는 단계를 포함하는 것을 특징으로 하는 문자 인식을 위한 방법.
  2. 제1 항에 있어서, 상기 문자들의 결합을 검출하는 단계는 상기 문자들의 결합을 점들의 세트로서 나타내는 단계를 포함하며,
    상기 문자들의 결합을 하나 이상의 곡선들로서 나타내는 단계는,
    상기 점들의 세트로부터 점들의 순서화된 시퀀스를 발생시키는 단계; 및
    상기 하나 이상의 곡선들을 발생시키기 위해 상기 점들 사이에 기입하는 단계를 포함하는 것을 특징으로 하는 문자 인식을 위한 방법.
  3. 제1 항 또는 제2 항에 있어서, 상기 파라미터라이제이션하는 단계는,
    파라미터라이제이션의 편리한 규칙에 따라 상기 곡선을 따르는 함수를 배치하는 단계; 및
    다수의 등거리 점들에서 상기 함수를 샘플링하는 단계를 포함하는 것을 특징으로 하는 문자 인식을 위한 방법.
  4. 제3 항에 있어서, 상기 파라미터라이제이션의 규칙은 호 길이인 것을 특징으로 하는 문자 인식을 위한 방법.
  5. 제1 항 내지 제4 항중 어느 한 항에 있어서, 상기 문자들의 결합체는 디스플레이상에 직접 기입되어 검출되며, 상기 검출하는 단계는 기입되는 동안 이행되는 것을 특징으로 하는 문자 인식을 위한 방법.
  6. 제1 항 내지 제4 항중 어느 한 항에 있어서, 상기 문자들의 결합은 스케너로부터 발생되는 데이터 양에서 검출되는 것을 특징으로 하는 문자 인식을 위한 방법.
  7. 제6 항에 있어서, 상기 문자들의 결합체를 전 처리하는 단계는 상기 문자들의 결합체를 모서리 검출하는 것을 특징으로 하는 문자 인식을 위한 방법.
  8. 제1 항 내지 제7 항중 어느 한 항에 있어서, 상기 결정 규칙을 적용하는 단계는,
    상기 근사 측정들의 값들의 수용 한계들을 결정하고, 단지 만일 템플레이트 심볼과 관련된 적어도 하나의 값이 상기 수용 한계들내에 있다면, 상기 템플레이트 심볼을 선택하는 것을 특징으로 하는 문자 인식을 위한 방법.
  9. 제8 항에 있어서, 개별적인 수용 한계들이 템플레이트 심볼 각각에 할당되는 것을 특징으로 하는 문자 인식을 위한 방법.
  10. 제8 항에 있어서, 상기 방법은,
    적어도 두 개의 템플레이트 심볼들이 동일한 수용 한계들을 갖는 것을 특징으로 하는 문자 인식을 위한 방법.
  11. 제8 항 내지 제10 항중 어느 한 항에 있어서, 파라미터라이제이션된 곡선의 형상 및 상기 템플레이트 심보들 사이의 상기 근사 측정들의 상기 값들이 상기 수용 한계들 이상인 경우 상기 파라미터라이제이션 곡선을 재파라미터라이제이션하는 단계는 상기 템플레이트 심볼들 및 상기 재파라미터라이제이션된 곡선 사이에서 감소하는 것을 특징으로 하는 문자 인식을 위한 방법.
  12. 제8 항 내지 제11 항중 어느 한 항에 있어서, 상기 수용 한계들은 단지 유사성 변환들이 용납된다는 사실을 기초로 결정되는 것을 특징으로 하는 문자 인식을 위한 방법.
  13. 제1 항 내지 제12 항중 어느 한 항에 있어서, 상기 결정 규칙을 적용하는 단계는 상기 선택된 템플레이트 심볼들의 그럴듯함 테스트를 이행하는 것을 특징으로 하는 문자 인식을 위한 방법.
  14. 제13 항에 있어서, 상기 그럴듯함 테스트는 상기 신뢰성 세트들을 기초로 하는 것을 특징으로 하는 문자 인식을 위한 방법.
  15. 서명들의 조회 및 확인을 위해서 제1 항 내지 제14 항중 어느 한 항을 따르는 방법의 사용방법.
KR1020017002454A 1998-08-26 1999-08-25 문자 인식 방법 Expired - Fee Related KR100615124B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
SE9802832A SE514377C2 (sv) 1998-08-26 1998-08-26 Teckenigenkänning
SE9802832-7 1998-08-26

Publications (2)

Publication Number Publication Date
KR20010090435A true KR20010090435A (ko) 2001-10-18
KR100615124B1 KR100615124B1 (ko) 2006-09-11

Family

ID=20412341

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020017002454A Expired - Fee Related KR100615124B1 (ko) 1998-08-26 1999-08-25 문자 인식 방법

Country Status (14)

Country Link
US (2) US6711290B2 (ko)
EP (1) EP1105833B1 (ko)
JP (1) JP4580554B2 (ko)
KR (1) KR100615124B1 (ko)
CN (1) CN1163842C (ko)
AT (1) ATE331994T1 (ko)
AU (1) AU749849B2 (ko)
CA (1) CA2341266C (ko)
DE (1) DE69932167T2 (ko)
HK (1) HK1038975A1 (ko)
IL (2) IL141294A0 (ko)
RU (1) RU2001107822A (ko)
SE (1) SE514377C2 (ko)
WO (1) WO2000013131A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100787134B1 (ko) * 2005-08-05 2007-12-21 한국정보통신주식회사 정규화된 전자서명 인쇄 장치
KR100826820B1 (ko) 2003-09-29 2008-05-02 모토로라 인코포레이티드 사용자 인터페이스상에 스크라이빙된 인디시아 인식

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE514377C2 (sv) * 1998-08-26 2001-02-19 Gunnar Sparr Teckenigenkänning
US7679534B2 (en) * 1998-12-04 2010-03-16 Tegic Communications, Inc. Contextual prediction of user words and user actions
US7712053B2 (en) 1998-12-04 2010-05-04 Tegic Communications, Inc. Explicit character filtering of ambiguous text entry
US8938688B2 (en) * 1998-12-04 2015-01-20 Nuance Communications, Inc. Contextual prediction of user words and user actions
US7881936B2 (en) * 1998-12-04 2011-02-01 Tegic Communications, Inc. Multimodal disambiguation of speech recognition
US7720682B2 (en) 1998-12-04 2010-05-18 Tegic Communications, Inc. Method and apparatus utilizing voice input to resolve ambiguous manually entered text input
US7030863B2 (en) * 2000-05-26 2006-04-18 America Online, Incorporated Virtual keyboard system with automatic correction
US7750891B2 (en) 2003-04-09 2010-07-06 Tegic Communications, Inc. Selective input system based on tracking of motion parameters of an input device
US7610194B2 (en) * 2002-07-18 2009-10-27 Tegic Communications, Inc. Dynamic database reordering system
US7821503B2 (en) * 2003-04-09 2010-10-26 Tegic Communications, Inc. Touch screen and graphical user interface
US7286115B2 (en) * 2000-05-26 2007-10-23 Tegic Communications, Inc. Directional input system with automatic correction
AU5299700A (en) * 1999-05-27 2000-12-18 America Online, Inc. Keyboard system with automatic correction
RU2230361C2 (ru) * 2001-03-01 2004-06-10 Стреж Сергей Васильевич Способ считывания и адресного кодирования графических изображений и устройство для его осуществления
US20040037463A1 (en) * 2002-01-28 2004-02-26 Calhoun Christopher L. Recognizing multi-stroke symbols
US8238718B2 (en) * 2002-06-19 2012-08-07 Microsoft Corporaton System and method for automatically generating video cliplets from digital video
US8583440B2 (en) * 2002-06-20 2013-11-12 Tegic Communications, Inc. Apparatus and method for providing visual indication of character ambiguity during text entry
SE0202446D0 (sv) 2002-08-16 2002-08-16 Decuma Ab Ideon Res Park Presenting recognised handwritten symbols
CN100429716C (zh) * 2002-08-19 2008-10-29 皇家飞利浦电子股份有限公司 用于检测记录载体上的异常的扫描设备和方法
US20050281467A1 (en) * 2003-01-24 2005-12-22 Stahovich Thomas F Recognizing multi-stroke symbols
US7636083B2 (en) * 2004-02-20 2009-12-22 Tegic Communications, Inc. Method and apparatus for text input in various languages
WO2005112811A1 (en) * 2004-05-14 2005-12-01 Cardima, Inc. Ablation probe with stabilizing member
US8095364B2 (en) 2004-06-02 2012-01-10 Tegic Communications, Inc. Multimodal disambiguation of speech recognition
US7623685B2 (en) * 2004-08-20 2009-11-24 The Regents Of The University Of Colorado Biometric signatures and identification through the use of projective invariants
US20060227065A1 (en) * 2005-04-08 2006-10-12 Matsushita Electric Industrial Co. Ltd. Human machine interface system for automotive application
US20060227066A1 (en) * 2005-04-08 2006-10-12 Matsushita Electric Industrial Co., Ltd. Human machine interface method and device for automotive entertainment systems
US8504606B2 (en) * 2005-11-09 2013-08-06 Tegic Communications Learner for resource constrained devices
KR100825209B1 (ko) * 2005-11-17 2008-04-25 김진우 서명 데이터의 암호화장치 및 암호화방법
US7587378B2 (en) * 2005-12-09 2009-09-08 Tegic Communications, Inc. Embedded rule engine for rendering text and other applications
TW200809660A (en) * 2006-03-01 2008-02-16 Zi Decuma Ab A method for additive character recognition and an apparatus thereof
US7580925B2 (en) 2006-04-19 2009-08-25 Tegic Communications, Inc. Efficient storage and search of word lists and other text
US20080154576A1 (en) * 2006-12-21 2008-06-26 Jianchao Wu Processing of reduced-set user input text with selected one of multiple vocabularies and resolution modalities
US8225203B2 (en) * 2007-02-01 2012-07-17 Nuance Communications, Inc. Spell-check for a keyboard system with automatic correction
US8201087B2 (en) * 2007-02-01 2012-06-12 Tegic Communications, Inc. Spell-check for a keyboard system with automatic correction
US8103499B2 (en) * 2007-03-22 2012-01-24 Tegic Communications, Inc. Disambiguation of telephone style key presses to yield Chinese text using segmentation and selective shifting
US8299943B2 (en) 2007-05-22 2012-10-30 Tegic Communications, Inc. Multiple predictions in a reduced keyboard disambiguating system
JP2009199102A (ja) * 2008-02-19 2009-09-03 Fujitsu Ltd 文字認識プログラム、文字認識装置及び文字認識方法
US20090245646A1 (en) * 2008-03-28 2009-10-01 Microsoft Corporation Online Handwriting Expression Recognition
US8917935B2 (en) 2008-05-19 2014-12-23 Microsoft Corporation Detecting text using stroke width based text detection
US20100166314A1 (en) * 2008-12-30 2010-07-01 Microsoft Corporation Segment Sequence-Based Handwritten Expression Recognition
JP5343617B2 (ja) * 2009-02-25 2013-11-13 富士通株式会社 文字認識プログラム、文字認識方法および文字認識装置
CN101763516B (zh) * 2010-01-15 2012-02-29 南京航空航天大学 一种基于拟合函数的文字识别方法
US8310461B2 (en) 2010-05-13 2012-11-13 Nuance Communications Inc. Method and apparatus for on-top writing
DE102010023557A1 (de) 2010-06-07 2011-12-08 Dirk Benyoucef Auslesen des Zählerstandes eines mechanischen Zählwerks mittels einer Graustufenerkennung der Ziffern
DE202010007896U1 (de) 2010-06-07 2010-10-07 Benyoucef, Dirk, Dr.-Ing. Auslesen des Zählerstandes eines mechanischen Zählwerks mittels einer Graustufenerkennung der Ziffern
TWI478074B (zh) * 2010-12-01 2015-03-21 Inst Information Industry 文字辨識方法、裝置以及儲存其之電腦可讀取紀錄媒體
US10061997B2 (en) 2011-04-11 2018-08-28 Apple Inc. Handwriting capture techniques
CN103324925A (zh) * 2012-03-22 2013-09-25 佳能株式会社 用于获得用于手写字符识别的字符数据的方法和装置
US10748031B1 (en) * 2019-05-22 2020-08-18 Read-Ink Corporation Handwriting recognition systems and methods

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3614736A (en) 1968-05-21 1971-10-19 Ibm Pattern recognition apparatus and methods invariant to translation, scale change and rotation
US3636513A (en) 1969-10-17 1972-01-18 Westinghouse Electric Corp Preprocessing method and apparatus for pattern recognition
JPS6282486A (ja) * 1985-10-08 1987-04-15 Hitachi Ltd オンライン手書き図形認識装置
JPH05189617A (ja) * 1991-04-15 1993-07-30 Microsoft Corp 手書き文字認識に於けるアークのセグメント化の方法と装置
US5333209A (en) * 1992-03-24 1994-07-26 At&T Bell Laboratories Method of recognizing handwritten symbols
JPH05290221A (ja) 1992-04-15 1993-11-05 Pioneer Electron Corp オンライン手書文字認識装置
CA2097095A1 (en) 1992-07-29 1994-01-30 Frank William Sinden Method of normalizing handwritten symbols
WO1994004992A1 (en) * 1992-08-20 1994-03-03 Communication Intelligence Corporation A method for dynamic reconstruction of handwritten data
JP3113769B2 (ja) * 1993-10-15 2000-12-04 株式会社日本デジタル研究所 文字認識装置
US5745599A (en) 1994-01-19 1998-04-28 Nippon Telegraph And Telephone Corporation Character recognition method
US5768420A (en) * 1994-01-21 1998-06-16 Lucent Technologies Inc. Method and apparatus for handwriting recognition using invariant features
US5699456A (en) * 1994-01-21 1997-12-16 Lucent Technologies Inc. Large vocabulary connected speech recognition system and method of language representation using evolutional grammar to represent context free grammars
US5710916A (en) 1994-05-24 1998-01-20 Panasonic Technologies, Inc. Method and apparatus for similarity matching of handwritten data objects
US5854855A (en) * 1994-09-09 1998-12-29 Motorola, Inc. Method and system using meta-classes and polynomial discriminant functions for handwriting recognition
JPH08163270A (ja) * 1994-12-05 1996-06-21 Nippon Telegr & Teleph Corp <Ntt> 無声電話通信端末装置
JP3454335B2 (ja) * 1995-07-17 2003-10-06 日本電信電話株式会社 オンライン手書き文字認識方法及びその装置
JPH0962773A (ja) * 1995-08-19 1997-03-07 Ricoh Co Ltd 文字認識装置
JPH0957204A (ja) * 1995-08-24 1997-03-04 Toshiba Corp 郵便物の宛先自動読取システム
US5828772A (en) * 1995-12-27 1998-10-27 Lucent Technologies Inc. Method and apparatus for parametric signature verification using global features and stroke-direction codes
JP3534537B2 (ja) * 1996-05-10 2004-06-07 日本電信電話株式会社 形状マッチング方法および装置
US6044174A (en) * 1996-10-11 2000-03-28 Lucent Technologies Inc. Method and apparatus for parametric representation of handwritten symbols
US6208757B1 (en) * 1996-10-11 2001-03-27 Lucent Technologies Inc. Method and apparatus for reconstructing handwritten symbols from parametric representations thereof
US5889889A (en) * 1996-12-13 1999-03-30 Lucent Technologies Inc. Method and apparatus for machine recognition of handwritten symbols from stroke-parameter data
SE514377C2 (sv) * 1998-08-26 2001-02-19 Gunnar Sparr Teckenigenkänning

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100826820B1 (ko) 2003-09-29 2008-05-02 모토로라 인코포레이티드 사용자 인터페이스상에 스크라이빙된 인디시아 인식
KR100787134B1 (ko) * 2005-08-05 2007-12-21 한국정보통신주식회사 정규화된 전자서명 인쇄 장치

Also Published As

Publication number Publication date
AU5890799A (en) 2000-03-21
US7139430B2 (en) 2006-11-21
IL141294A (en) 2007-02-11
IL141294A0 (en) 2002-03-10
KR100615124B1 (ko) 2006-09-11
JP4580554B2 (ja) 2010-11-17
CA2341266C (en) 2009-05-19
RU2001107822A (ru) 2003-02-20
JP2002523844A (ja) 2002-07-30
SE9802832D0 (sv) 1998-08-26
ATE331994T1 (de) 2006-07-15
SE9802832L (sv) 2000-02-27
DE69932167T2 (de) 2006-11-23
WO2000013131A1 (en) 2000-03-09
AU749849B2 (en) 2002-07-04
CN1315024A (zh) 2001-09-26
SE514377C2 (sv) 2001-02-19
US20040234129A1 (en) 2004-11-25
DE69932167D1 (de) 2006-08-10
EP1105833A1 (en) 2001-06-13
CA2341266A1 (en) 2000-03-09
US20010026639A1 (en) 2001-10-04
EP1105833B1 (en) 2006-06-28
HK1038975A1 (zh) 2002-04-04
US6711290B2 (en) 2004-03-23
CN1163842C (zh) 2004-08-25

Similar Documents

Publication Publication Date Title
KR100615124B1 (ko) 문자 인식 방법
US7349576B2 (en) Method, device and computer program for recognition of a handwritten character
US5784490A (en) Method and apparatus for automated recognition of text embedded in cluttered observations
CN101160592B (zh) 手写字符识别方法和手写字符识别系统
US7437001B2 (en) Method and device for recognition of a handwritten pattern
US5333209A (en) Method of recognizing handwritten symbols
US5687254A (en) Searching and Matching unrecognized handwriting
US7630551B2 (en) Method and system for line extraction in digital ink
JP4607633B2 (ja) 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法
US7412095B2 (en) Preprocessing of multi-line rotated electronic ink
US7068821B2 (en) Information processing method and apparatus
EP1519302B1 (en) System and method for detecting a hand-drawn object in electronic ink input
JPH08190604A (ja) ラスタ画像表示用ハイブリッドデータ構造生成方法及び装置
Doermann Document image understanding: integrating recovery and interpretation
US7133556B1 (en) Character recognition device and method for detecting erroneously read characters, and computer readable medium to implement character recognition
HUT75820A (en) Method of stroke segmentation for handwritten input
US7146046B2 (en) Method and apparatus for scale independent cusp detection
US7346213B2 (en) Method for optically recognizing alpha-numerical characters
JP3015137B2 (ja) 手書文字認識装置
Parker et al. Vector templates for symbol recognition
Mapari et al. A Study Of Devnagri Handwritten Character Recognition System
JPH01266689A (ja) 画像認識装置
Tiwari et al. A Novel Approach for Identify Small and Capital Handwritten Letter

Legal Events

Date Code Title Description
PA0105 International application

Patent event date: 20010226

Patent event code: PA01051R01D

Comment text: International Patent Application

N231 Notification of change of applicant
PN2301 Change of applicant

Patent event date: 20010305

Comment text: Notification of Change of Applicant

Patent event code: PN23011R01D

PG1501 Laying open of application
A201 Request for examination
PA0201 Request for examination

Patent event code: PA02012R01D

Patent event date: 20040809

Comment text: Request for Examination of Application

N231 Notification of change of applicant
PN2301 Change of applicant

Patent event date: 20050621

Comment text: Notification of Change of Applicant

Patent event code: PN23011R01D

E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20060123

Patent event code: PE09021S01D

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

Patent event code: PE07011S01D

Comment text: Decision to Grant Registration

Patent event date: 20060623

GRNT Written decision to grant
PR0701 Registration of establishment

Comment text: Registration of Establishment

Patent event date: 20060816

Patent event code: PR07011E01D

PR1002 Payment of registration fee

Payment date: 20060814

End annual number: 3

Start annual number: 1

PG1601 Publication of registration
PR1001 Payment of annual fee

Payment date: 20090721

Start annual number: 4

End annual number: 4

PR1001 Payment of annual fee

Payment date: 20100805

Start annual number: 5

End annual number: 5

PR1001 Payment of annual fee

Payment date: 20110916

Start annual number: 6

End annual number: 6

FPAY Annual fee payment

Payment date: 20120727

Year of fee payment: 7

PR1001 Payment of annual fee

Payment date: 20120727

Start annual number: 7

End annual number: 7

FPAY Annual fee payment

Payment date: 20130723

Year of fee payment: 8

PR1001 Payment of annual fee

Payment date: 20130723

Start annual number: 8

End annual number: 8

FPAY Annual fee payment

Payment date: 20140722

Year of fee payment: 9

PR1001 Payment of annual fee

Payment date: 20140722

Start annual number: 9

End annual number: 9

FPAY Annual fee payment

Payment date: 20150717

Year of fee payment: 10

PR1001 Payment of annual fee

Payment date: 20150717

Start annual number: 10

End annual number: 10

FPAY Annual fee payment

Payment date: 20160720

Year of fee payment: 11

PR1001 Payment of annual fee

Payment date: 20160720

Start annual number: 11

End annual number: 11

FPAY Annual fee payment

Payment date: 20170803

Year of fee payment: 12

PR1001 Payment of annual fee

Payment date: 20170803

Start annual number: 12

End annual number: 12

LAPS Lapse due to unpaid annual fee
PC1903 Unpaid annual fee

Termination category: Default of registration fee

Termination date: 20190527