[go: up one dir, main page]

KR100301216B1 - 온라인문자인식장치 - Google Patents

온라인문자인식장치 Download PDF

Info

Publication number
KR100301216B1
KR100301216B1 KR1019980005891A KR19980005891A KR100301216B1 KR 100301216 B1 KR100301216 B1 KR 100301216B1 KR 1019980005891 A KR1019980005891 A KR 1019980005891A KR 19980005891 A KR19980005891 A KR 19980005891A KR 100301216 B1 KR100301216 B1 KR 100301216B1
Authority
KR
South Korea
Prior art keywords
feature
segment
stroke
character
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
KR1019980005891A
Other languages
English (en)
Other versions
KR19980079762A (ko
Inventor
다이조 가메시로
다케로리 가와마타
Original Assignee
다니구찌 이찌로오, 기타오카 다카시
미쓰비시덴키 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 다니구찌 이찌로오, 기타오카 다카시, 미쓰비시덴키 가부시키가이샤 filed Critical 다니구찌 이찌로오, 기타오카 다카시
Publication of KR19980079762A publication Critical patent/KR19980079762A/ko
Application granted granted Critical
Publication of KR100301216B1 publication Critical patent/KR100301216B1/ko
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/03Arrangements for converting the position or the displacement of a member into a coded form
    • G06F3/033Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor
    • G06F3/0354Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor with detection of 2D relative movements between the device, or an operating part thereof, and a plane or surface, e.g. 2D mice, trackballs, pens or pucks
    • G06F3/03545Pens or stylus

Landscapes

  • Character Discrimination (AREA)

Abstract

입력 문자 패턴 중의 예기치 않은 성분으로 기인하는 인식율의 저하를 방지하고, 또한, 계속되는 글자 등에 대한 인식율의 향상을 도모하는 온라인 문자 인식 장치를 제공한다.
입력부(1)로부터의 입력문자 패턴상의 좌표점을 절선 근사함으로써 얻은 각 세그먼트에 관한 방향 및 길이 및 특징점을 추출하는 특징 추출부(2)와, 사전내의 문자의 세그먼트와 입력 문자 패턴에서 얻은 세그먼트와의 대응짓기를 행하고 세그먼트 대응짓기 거리를 산출하는 특징점 대응짓기부(3)와, 사전내의 문자의 특징점조에 대응한 입력 문자 패턴상의 특징점조(特徵点組)에 의해 결정되는 구간의 특징정보를 대응 스트로그 특징으로서 추출하는 지정구간 특징 추출부(4)와, 산출한 대응 스트로그 특징의 거리와 세그먼트 대응짓기 거리를 병용해서 후보문자를 산출하는 특징 조합부(5)를 갖춘다.

Description

온라인 문자 인식 장치
본 발명은 펜 컴퓨터 등으로 문자를 수기해서 입력하는 온라인 문자 인식 장치, 특히 계속되는 글자 등에 대한 문자 인식율의 향상을 도모하는 온라인 문자 인식 장치에 관한 것이다.
펜과 태블릿(tablet)을 입력 수단으로 하는 펜 컴퓨터에 문자코드를 입력하기 위한 요소기술인 온라인 문자 인식에 있어서, 해서(楷書)로 필기된 문자는 공지의 기본 스트로크 방식(미리 수 종류의 스트로크의 형상을 기본 스트로크로서 정의하고, 문자를 기본 스트로크의 조합으로 표한한다)이나 그 밖의 각종 인식방식에 의해 고정밀도 인식이 가능하다. 그러나 계속되는 글자에 대한 인식 성능은 해서에 비해 충분하지 않다. 이 때문에 종래부터 계속되는 글자에 대응한 온라인 문자 인식 방식의 연구가 행해져 왔다. 예를 들면 전자 통신 학회 논문지 J66-D No. 5, 제593~600페이지에 기재된 「선택적 스트로크 결합에 의한 획수ㆍ필순에 의존하지 않는 온라인 문자 인식」이 있다. 이하, 이것을 종래예 1로 한다. 종래예 1에 의하면 입력 패턴과 사전에 있어서 스토로크(펜다운(pen down)에서 펜업(pen up)까지의 좌표열의 단위) 수의 작은 편의 스트로크를 스트로크 수가 많은 편으로 1 대 1로 대응시켜 스트로크가 많은 편에서 대응 지어지지 않은 스트로크는 이미 대응짓고 있는 스트로크에 선택적으로 결합하고, 결합후의 사전과 입력 패턴의 좌표점간의 거리를 DP(Dynamic Programing) 매칭을 사용해서 산출하고, 후보문자를 출력함으로써 계속되는 글자 인식을 가능케 하고 있다. DP 매칭에 대해서는 예를 들면 「패턴인식」(후나구보 노보루 저: 교리쓰출판)의 제62페이지부터 기술되어 있으므로 여기에서는 상세한 언급은 않는다. 종래예 1에서는 좌표점을 DP 매칭의 특징에 사용하고 있으나, 이밖에는 제18도에 도시하는 운필에 따라 등분할한 좌표점간의 방향성분(방향코드)을 사용하는 방법도 있다.
제18도에서는, 입력 패턴에 대해 운필 방향에 따라 스트로크를 흡사 한 획으로 쓰고 있는 것과 같이 모두 연결된 상태로 하고, 스트로크를 적당한 폭으로 등분할 근사하고 있다. 제18도의 각각의 분할점간(a1, a2, a3, a4, …, a21)의 방향 성분을 예를 들면 제19도에 도시하는 8방향 코드로 근사하여, 이 방향 성분을 DP 매칭의 특징으로 사용해서 계속되는 글자 인식을 할 수도 있다.
또한, 기본 스트로크를 사용한 방법에서는, 계속되는 글자에 대응한 사전을 작성하여 인식하는 방법 혹은 스트로크의 분리정보를 사전에 가지고, 입력 패턴과 사전의 스트로크 수가 동일하게 되도록 스트로크를 분해하는 방법이 있다.
예를 들면, 기본 스트로크를 사용한 종래예로서, 일본 특허공개 평2-10473호가 있다. 이하, 이것을 종래예 2로 한다. 여기에서 이 종래예 2에 있어서 구성 및 동작을 설명한다.
제20도는 종래예 2의 온라인 문자 인식 장치의 기본 구성을 도시한 블록 구성도이다. 제20도에는 좌표 입력 장치(21)와, 좌표 입력 장치(21)의 출력을 입력하는 기본선분 식별회로(22)와, 기본선분 식별회로(22)의 출력을 입력하고 순차 출력하는 선분 코드 송출회로(23)와, 선분코드 버퍼(24)와, 판정회로(29)가 재인식으로 한 경우 스트로크의 선분을 순차 분해하는 선분 분해회로(25)와, 제어회로(26)와, 선분코드 송출회로(23)의 출력과 사전 기억부(28)의 출력을 비교하는 비교회로(27)와, 비교회로(27)의 출력을 입력해서 문자의 판정을 행하는 판정회로(29)와, 기억되어 있는 사전 데이타를 비교회로(27)에 순차 송출하는 사전 기억부(28)가 도시되어 있다.
좌표 입력장치(21)로부터 출력되는 좌표점의 시계열 정보를 공급된 기본선분 식별 회로(22)에서는, 스트로크를 절선 근사하고, 각각의 절선(세그먼트)의 방향 선분을 제19도에 도시하는 8방향 코드로 나타낸다. 다음에, 제21도에 도시하는 방향 코드열과 기본 스트로크의 대응표를 사용해서 입력 스트로크가 어느 기본 스트로크에 속하는지를 결정한다.
다음에, 제22도의 패턴을 사용해서 종래예 2의 동작을 설명한다. 제22도에서는 선 101, 102, 103, 104, 105의 순으로 스트로크를 기입하고 있다. 각 스트로크를 절선 근사하고, 8방향 코드로 필순에 따라서 나타내면, {(1), (6), (7), (1, 7), (1)}로 된다. 이것을 제21도에 도시하는 기본 스트로크 표를 사용해서 기본 스트로크 열{(1), (3), (4), (7), (1)}을 얻는다.
제22도의 문자 패턴은, 5획으로 기입하고 있으므로, 비교회로(27)의 5획 사전과 조합처리를 하고, 판정회로(29)로 후보문자 판정을 한다. 그 결과, 사전내의 문자 「石」과 일치하고, 문자코드를 출력한다.
다음에, 제23도의 계속되는 글자 패턴으로 동작을 설명한다. 제23도에서는 선 106, 107, 108, 109의 순으로 기입하고 있다. 제23도의 계속되는 글자 패턴에 대해서는, 마찬가지로 기본선분 식별회로(22)에서 기본 스트로크열{(1), (3), (4), (21)}을 얻는다. 획수가 4이므로 비교회로(27)는 4획 사전과 비교한다. 이 경우 판정회로(29)는, 사전기억부(28)내에 「石」의 4획 사전이 존재하지 않으면 문자를 출력할 수가 없다. 거기에서, 제어회로(26)로 되돌아가고, 선분 분해회로(25)를 사용해서 스트로크를 순차 분해한다. 분해 스트로크와 분해룰은, 미리 사전기억부(28)에 등록되어 있고, 여기에서는 제24도에 도시하는 룰을 사용해서 기본 스트로크(21)를 (7), (1)로 분할하고, 다시 획수를 5로 한다. 이 결과, 입력 패턴의 기본 스트로크 열은 {(1), (3), (4), (7), (1)}로 수정되고, 비교회로(27)는 사전 기억부(28)내의 5획 사전과 조합 작업을 한다. 그 결과, 사전내의 문자 「石」과 일치하고, 판정회로(29)는 결과를 출력한다.
그런, 종래예 1에 의하면 계속되는 글자의 인식이 가능하나, 예를 들면 제25(a)도 및 제25(b)도에 도시한 바와 같이 사전 패턴(제25(a)도)과 입력패턴(제25(b)도)을 조합하는 경우, 제25(c)도에 도시한 바와 같이, 위치 어긋남 혹은 변형에 의해 대응하는 좌표점간의 거리가 커져, 그 결과, 사전과의 거리가 커져서 잘못 판독하기 쉬운 문제점이 있었다.
또한, 제18도에 도시하는 바와 같이 DP 매칭에 사용하는 특징에 방향 코드를 사용하면, 계속되는 글자 인식이 가능한 외에 제25(c)도에 도시한 바와 같이 위치의 어긋남에 대해서는 강해지나, 운필 방향이 유사한 문자끼리, 예를 들면 「伎」와 「」, 「却」과 「劫」, 혹은 「村」과 「杖」등의 문자를 잘못 인식하기 쉬운 문제점이 있었다.
또한, 자형(字形)이 흐트러져 사전과의 대응부분의 방향차가 큰 문자를 인식하는 경우, 입력 패턴과 사전과의 DP 매칭으로 얻어지는 코스트값이 자형이 정돈된 패턴에 비해 커져 그 결과 다른 문자에 잘못 판독하기 쉬운 문제점이 있었다.
다시, 예를 들면 제26(a)도 및 제26(b)도에 도시하는 바와 같이, 「꺽임 부분」 「눌림 부분」의 성분을 갖는 문자(제26(a)도)와 「꺽임 부분」 「눌림 부분」의 성분을 갖지 않는(즉, 대응하는 성분을 갖지 아니함) 사전(제26(b)도)와의 정합의 거리가 커져 잘못 판독하기 쉬운 문제점이 있었다. 이것에 대해서, 예를 들면 스트로크의 시점, 종점 부근의 꺾어접는 성분(예를 들면 연속하는 직선부의 각도차가 90도 이하인 시점 또는 종점의 선분)의 방향 코드를 무시하는, 혹은 가중치 처리를 하는 등의 방법이 고려되나, 시점, 종점 부근의 꺾어접는 성분의 노이즈이거나 문자에 필요한 특징인가는 문자를 인식하지 않으면 판정되지 않는다. 이 때문에, 스트로크의 시점, 종점 부근의 성분을 단순하게 무시할 수가 없는 문제점이 있었다.
한편, 기본 스트로크 등의 스트로크 특징을 사용해서 인식하는 방법은, 사전과 입력 패턴의 획수를 일치시키지 않으면 거리를 계산할 수 없는 문제점이 있고,이어짐 글자에 대응하기 위해서는, 미리 이어짐 글자의 패턴을 사전에 등록하거나 사전의 문자 패턴으로 이어지기 쉬운 부분을 문자마다 기술할 필요가 있었다. 즉, 종래예 2에서는 입력 패턴의 계속된 스트로크의 분해룰이 분해사전에 존재하지 않으면 스트로크를 분해할 수 없고 잘못 인식하는 문제가 있었다. 이것에 대해서 모든 문자의 갖가지 이어짐 글자 스트로크에 대처하려면 막대한 사전용량을 필요로 하는 문제점이 있었다.
또한, 예를 들면 분해사전을 사용하지 않고, 복수의 방향 코드를 갖는 스트로크에 대해 방향 코드마다 분해하는 방법을 사용해서 해결하려해도, 이어서 쓴 스트로크 부분에는 본래 스트로크로서 표출하는 실제 스트로크 이외에 해서에서는 표출하지 않는 가상 스트로크를 포함하는 경우가 있다. 제27(a)도 및 제27(b)도에 이 예를 도시한다. 제27(a)도의 입력 패턴은 제27(b)도의 사전에 비해, 정확한 획수에서는 가상 스트로크로 되는 성분(30 및 31)을 여분으로 갖는다. 이 때문에 단지 직선 성분으로 분해한 직선 코드열은 실제 스트로크만의 특징을 갖는 사전과는 반드시 일치하지 않기 때문에 잘못 인식하는 경우가 있고, 방향코드로 단순하게 분할할 수 없는 문제점이 있었다.
본 발명은 이상과 같은 문제를 해결하기 위해 이루어진 것이며, 그 목적은, 입력 문자 패턴중의 예기치 않은 성분에 기인하는 인식율의 저하를 방지하고, 또한 이어짐 글자(띄어쓰지 않고 연달아 붙여 쓴 글자) 등에 대한 인식율의 향상을 도모하는 온라인 문자 인식 장치를 제공하는데 있다.
제1도는 본 발명에 관한 온라인 문자 인식 장치의 실시예 1을 도시한 블록 구성도.
제2도는 실시예 1에 있어서 사용하는 사전에 수록된 문자 「家」에 관한 정보의 내용예를 도시한 도면.
제3도는 실시예 1에 있어서 사용하는 사전에 수록된 문자 「琢」에 관한 정보의 내용예를 도시한 도면.
제4도는 실시예 1에 있어서 문자 인식 처리를 도시한 플로차트.
제5도는 실시예 1에 있어서 문자 인식 처리중 특징 추출부가 행하는 처리를 도시한 플로차트.
제6(a)도는 실시예 1에 있어서 사용하는 16방향 코드의 예를 도시한 도면.
제6(b)도는 DP 매칭에 사용하는 값을 설정한 표를 도시한 도면.
제7도는 실시예 1에 있어서 입력패턴에 대해 특징 추출 처리를 한 후의 패턴을 도시한 도면.
제8도는 실시예 1에 있어서 입력패턴에 대해서 특징 추출 처리를 행함으로써 추출된 형식을 표형식으로 도시한 도면.
제9도는 사전내의 문자 「家」의 시점, 종점에 대응하는 입력 패턴의 좌표점을 도시한 도면.
제10도는 사전내의 문자 「家」에 대한 입력 패턴의 대응 스트로크 특징을 도시한 도면.
제11도는 사전내의 문자 「琢」의 시점, 종점에 대응하는 입력 패턴의 좌표점을 도시한 도면.
제12도는 사전내의 문자 「琢」에 대한 입력 패턴의 대응 스트로크 특징을 도시한 도면.
제13(a)도 내지 제13(d)도는 문자 패턴에 의해 변동이 큰 부분의 예를 도시한 도면.
제14도는 사전내의 문자 「木」의 세그먼트 사전의 내용예를 도시한 도면.
제15도는 제13(d)도에 도시한 문자 「木」의 세그먼트 특징을 도시한 도면.
제16도는 방향 비의존 코드를 사용한 문자 「木」의 세그먼트 사전을 도시한 도면.
제17(a)도 및 제17(b)도는 실시예 2에 있어서 방향 비의존 코드와의 대응짓기 수의 제한을 설명하기 위해 사용하는 도면.
제18도는 종래예 1에 있어서 방향 코드를 사용한 인식 방식의 특징을 도시한 도면.
제19도는 8방향 코드의 예를 도시한 도면.
제20도는 종래예 1의 온라인 문자 인식 장치의 기본 구성을 도시한 블록 구성도.
제21도는 방향 코드열과 스트로크 코드와의 대응표를 도시한 도면.
제22도는 종래예 2의 동작을 설명하기 위해 사용하는 문자 「石」의 입력 패턴을 도시한 도면.
제23도는 종래예 2의 동작을 설명하기 위해 사용하는 문자 「石」의 입력 패턴을 도시한 도면.
제24도는 계속되는 글자 스트로크의 분해룰(rule)을 도시한 도면.
제25(a)도 내지 제25(c)도는 종래예 1에 있어서 거리계산시의 위치의 벗어남에 의한 영향을 도시한 도면.
제26(a)도 및 제26(b)도는 「꺽임 부분」 「눌린 부분」을 포함하는 입력 패턴과 「꺽임 부분」 「눌린 부분」을 포함하지 않은 사전의 예를 도시한 도면.
제27(a)도 및 제27(b)도는 계속되는 글자에 의해 가상 스트로크가 표출하는 경우의 예를 도시한 도면.
* 도면의 주요부분에 대한 부호의 설명
1 : 입력부 2 : 특징 추출부
3 : 특징점 대응짓기부 4 : 지정구간 특징 추출부
5 : 특징 조합부 6 : 사전기억부
7 : 출력부
이상과 같은 목적을 달성하기 위해, 제1의 발명에 관한 온라인 문자 인식 장치는 문자패턴의 좌표점열 데이타를 입력으로 하여, 그것의 입력 문자 패턴에 해당한 문자 코드를 출력하는 온라인 문자 인식 장치에 있어서, 상기 입력문자 패턴을 기술할 때의 스트로크 상의 좌표점열 데이타를 입력하는 입력 수단과, 상기 입력 수단에서 입력된 좌표점열 데이타에 포함되는 시계열순으로 정열된 좌표점을 절선 근사함으로써 얻은 각 직선 부분을 세그먼트로 하고, 그의 각 세그먼트에 관한 특징 정보와 각 세그먼트의 끝점인 특징점을 추출하는 특징추출 수단과, 문자를 구성하는 세그먼트에 관한 특징 정보 및 특징점을 문자마다 수록한 사전을 미리 기억하는 사전 기억 수단과, 상기 사전에 기술된 각 문자의 특징 정보와 상기 특징 추출 수단에서 추출된 특징 정보에 의거해서 상기 사전내의 각 문자를 구성하는 세그먼트와 상기 입력 문자 패턴에서 얻은 세그먼트를 대응짓기를 행하고, 세그먼트 대응짓기 거리를 산출하는 특징점 대응짓기 수단과, 상기 사전이 지정하는 스트로크 상의 특징점조에 대응한 상기 입력 패턴의 스트로크 상의 특징점조에 의해 결정되는 구간의 특징 정보를 대응 스트로크 특징으로 해서 추출하는 지정 구간 특징 추출 수단과, 상기 지정구간 특징 추출 수단에 의해 추출된 대응 스트로크 특징을 사전내의 특징 정보와 조합하고, 대응 스트로크 특징의 거리를 산출하는 특징 조합 수단과, 상기 특징 조합 수단으로 얻어진 후보 문자 코드를 출력하는 출력 수단을 구비하며, 상기 특징 조합 수단은, 산출한 대응 스트로크 특징의 거리 및 상기 특징점 대응짓기 수단에 의해 산출된 세그먼트 대응짓기 거리에 의거해서 상기 사전내의 입력 문자 패턴에 대응한 문자를 특정하는 것이다.
제2의 발명에 관한 온라인 문자 인식 장치는, 제1의 발명에 있어서, 상기 특징점 대응짓기 수단은, 상기 사전내의 문자의 각 스트로크의 시점과 종점에 대해 상기 입력 문자 패턴의 좌표점을 각각 1개 대응시켜, 상기 지정 구간 특징추출 수단은, 상기 시점에 대응하는 상기 입력 문자 패턴의 특징점과 상기 종점에 대응하는 상기 입력 문자 패턴의 특징점을 특징점조로 하는 것이다.
제3의 발명에 관한 온라인 문자 인식장치는, 제1의 발명에 있어서, 각 세그먼트에 관한 정보에는, 각 세그먼트의 방향 및 길이가 포함되어 있고, 상기 특징점 대응짓기 수단은 특징 추출 수단이 산출한 각 세그먼트의 방향 및 길이에 의거해서, 대응짓기된 각 세그먼트의 코스트를 산출하고 그 코스트에 의거해서 세그먼트 대응짓기 거리를 산출하는 것이다.
다음에 도면에 의거해서 본 발명의 가장 적합한 실시예에 대해서 설명한다.
[실시예 1]
제1도는 본 발명에 관한 온라인 문자 인식 장치의 실시예 1을 도시한 블록 구성도이다. 본 실시예에 있어서 온라인 문자 인식 장치는 입력부(1), 특징추출부(2), 특징점 대응짓기부(3), 지정구간 특징추출부(4), 특징조합부(5), 사전기억부(6) 및 출력부(7)로 구성된다. 입력부(1)는 입력 수단으로서 준비되고, 사용자가 태블릿 등에 펜으로 입력한 문자 데이타(입력 문자 패턴)를 기술할 때의 스트로크 상의 좌표점열 데이타를 입력한다. 특징 추출부(2)는 특징 추출 수단으로서 준비되고, 입력부(1)에 입력된 좌표점열 데이타에 포함되는 시계열 순으로 정렬된 좌표점을 절선에 근사함으로써 얻은 각 직선부분을 세그먼트로 하고, 그의 각 세그먼트에 관한 특징 정보와 각 세그먼트의 끝점인 특징점을 추출한다. 특징점 대응짓기부(3)는 특징점 대응짓기 수단으로서 준비되고, 사전에 기술된 각 문자의 특징 정보와 특징추출부(2)에서 추출된 특징 정보에 의거해서 사전내의 각 문자를 구성하는 세그먼트와 입력 문자 패턴으로부터 얻은 세그먼트와의 대응짓기를 행하고, 세그먼트 대응짓기 거리를 산출한다. 지정 구간 특징 추출부(4)는 지정구간 특징 추출수단으로서 준비되고, 사전이 지정하는 스트로크 상의 특징점조에 대응한 입력문자 패턴의 스트로크 상의 특징점조에 의해 결정되는 구간의 특징 정보를 대응 스트로크 특징으로서 추출한다. 특징조합부(5)는 특징 조합 수단으로서 준비되고, 지정구간 특징 추출부(4)에 의해 추출된 대응 스트로크 특징의 거리를 산출한다. 사전 기억부(6)는 사전기억 수단으로서 준비되고, 전술한 사전을 미리 기억한다. 본 실시예에 있어서 사전에는 문자를 구성하는 세그먼트에 대한 특징 정보 및 특징점이 문자마다 수록되어 있다. 출력부(7)는 출력 수단으로서 준비되고, 특징 조합부(5)에서 얻어진 후보 문자 코드를 출력한다.
제2도는 사전중의 문자 「家」에 관한 정보를 표 형식으로 도시한 도면이고 제3도는 사전중의 문자 「琢」에 관한 정보를 표 형식으로 도시한 도면이다. 사전 기억부(6)가 기억하는 사전에 포함되는 내용 및 특징은 문자코드, 세그먼트의 특징 정보로서 방향 코드 및 세그먼트 길이, 스트로크의 외접 구형(직사각형) 폭, 스트로크의 외접 구형 높이이다. 세그먼트의 방향 코드와 세그먼트 길이는 스트로크 이외에 가상 스트로크에 대해서도 유지한다. 또한 스트로크란 펜다운에서 펜업까지의 좌표열의 단위를 말하나, 여기에서는 이 스트로크를 실제 스트로크 혹은 스트로크의 종점(펜업위치)으로부터 다음의 스트로크의 시점(펜다운 위치)을 잇는 스트로크를 가상 스트로크라 하기로 한다. 실제 스트로크는 1 스트로크에 대해 복수의 세그먼트를 유지할 수 있으나 가상 스트로크는 1 스트로크에 대해 1 세그먼트로 한다. 복수의 세그먼트를 갖는 스트로크의 시점으로부터 종점의 방향은 제2도, 제3도에서 괄호 내에 표시한다. 또한 제2도, 제3도에는 도시하지 않았으나 각각의 세그먼트가 실제 스트로크이거나 가상 스트로크인가를 식별하는 스트로크 식별코드를 유지한다.
제4도는 본 실시예에 있어서 문자 인식처리의 플로차트이고, 제5도는 특징 추출부(2)의 처리를 도시한 플로차트이다. 제6(a)도는 16방향 코드의 예이고 제6(b)도는 DP 매칭에 사용하는 값을 설정한 표를 도시한 도면이다. 또한 본 실시예에 있어서는 사전내의 각 문자를 구성하는 세그먼트와 입력 문자 패턴에서 얻은 세그먼트와의 대응짓기를 DP 매칭에 의해 행하는 것으로 한다.
다음으로 본 실시예에 있어서 인식 처리의 흐름을 제4도의 플로차트에 의거해서 설명한다.
먼저, 입력부(1)는 사용자가 태블릿에 펜으로 기입한 수기 문자 데이타의 시계열 순으로 정렬된 좌표열을 얻는다(스텝 100). 다음으로, 특징 추출부(2)는 전처리, 특징 추출을 행하나(스텝 101), 이 처리의 상세한 것에 대해서는 제5도에 도시한 플로차트를 사용해서 설명한다.
특징추출부(2)는 입력 좌표열에 대해 연속되는 좌표점간의 거리를 기준폭과 비교하고 거리가 기준폭을 넘지 않는 점의 추출 처리를 행한다(스텝 201). 본 실시예에서는 이 추출 후의 좌표점에서 다음의 좌표 즉 시계열 순으로 정열한 좌표점을 절선 근사함으로써 얻은 각 직선 부분을 세그먼트라 칭하기로 한다. 다음으로 세그먼트의 방향 코드를 추출한다(스텝 202). 세그먼트 방향 코드는 실제 스트로크 이외에 가상 스트로크에 대해서도 추출한다. 여기에서는 제6(a)도에 도시하는 16방향 코드를 사용해서 방향 코드열을 추출한다. 그래서 세그먼트의 결합 처리를 한다(스텝 203). 여기에서는 인접한 세그먼트의 방향이 근사한 경우 구체적으로는 인접하는 세그먼트간의 방향차가 ±1의 경우 그 세그먼트 끼리를 결합하고 결합한 세그먼트 방향 코드를 재계산한다. 예를 들면 방향 코드(8)의 세그먼트에 이어서 방향코드(9)의 세그먼트가 나타난 경우 이들의 세그먼트를 결합해서 방향 코드(8)의 단일한 세그먼트로 한다. 단, 가상 스트로크에 대해서는 결합 처리를 실행하지 않는다. 그래서 결합후의 세그먼트 길이를 산출한다(스텝 204). 세그먼트 길이는 추출 처리에 사용한 기준폭의 몇 배 인지로 표기한다. 본 실시예에서는 특징 정보로서 세그먼트의 방향을 나타내는 방향 코드와 길이를 추출한다. 이상의 특징 추출 처리후의 입력 패턴을 제7도에 도시한다. 또한 추출한 특징을 표 형식으로 도시한 것을 제8도에 도시한다.
다음에 제4도로 되돌아가, 특징점 대응짓기부(3)는 사전에서 문자 데이타를 1개 인출한다(스텝 102). 이 예에서는 제2도에 도시한 「家」의 사전을 인출한다. 다음에 특징점 대응짓기부(3)는 입력패턴과 사전내의 문자 「家」 사이에 있어서 DP 매칭에 의한 세그먼트의 대응짓기를 행한다(스텝 103). DP 매칭은 다음과 같이 행한다.
입력 패턴의 세그먼트를 Si={si(1), si(2), ‥ si(i), ‥si(I)}, 사전의 세그먼트를 Sd={sd(1), sd(2), ‥sd(j), ‥sd(J)}라 하면,
[수학식 1]
를 실행한다. 다음에 이 식을 수학식 1로 한다. 또한 함수 min는 최소값을 구하기 위한 함수이다.
여기에서, 다음 수학식 2를 사용한다.
[수학식 2]
D[si(i+1)] [sd(j+1)] = a[si(i+1), sd(j+1)] * (|si(i+1)| + |sd(j+1)|)
이하 이 식을 수학식 2로 한다. 수학식 1에서 d[i+1] [j+1]은 시점에서 si(i+1), sd(j+1)까지의 대응 짓는 코스트의 누적을 표시한다. 수학식 2에서 D[si(i+1)] [sd(j+1)]는 세그먼트 si(i+1)와 세그먼트 si(i+1)와 세그먼트 sd(j+1)의 대응짓는 코스트를 나타낸다. a[si(i+1), sd(j+1)]는 세그먼트 si(i+1)와 세그먼트 sd(j+1)의 방향차에 의해 결정되는 값이고 여기에서는 제6(b)도에 도시하는 표의 값을 사용한다. |si(i+1)| 및 |sd(j+1)|는 세그먼트 si(i+1), sd(j+1)의 세그먼트 길이 이다. 또 여기에서는 도시하지 않았으나 최소값을 부여하는 대응짓기 경로표도 유지한다.
수학식 1을 점차적으로 계산하고 최종적으로
[수학식 3]
dist dp=d[I][J]/(I+J)
를 계산한다. 이하 이 식을 수학식 3으로 한다. 이 수학식 3을 사전과의 DP 매칭의 코스트(세그먼트 대응짓기 거리)로 한다. 수학식 3내의 dist는, DP 매칭의 코스트를 구하기 위한 함수(distance)를 의미한다. 또한 이 DP 매칭은 상술한 「패턴인식」(후나구보노보루 저: 쿄리쓰 출판)에 기재되어 있는 방법을 사용하고 있다.
여기에서, 이어짐 글자는 정확한 획수로 쓰여진 경우에 비해 획수가 감소하고 있으므로, 정확한 획수의 문자사전과 이어짐 글자 입력 패턴의 스트로크 및 세그먼트를 대응지음으로써 입력패턴에 대해 사전의 성분이 복수로 대응하는 경우가 있다. 그러나 통상 사전의 실제 스트로크 또는 실제 세그먼트가 입력 패턴의 가상 스트로크로 되는 것은 아니다. 따라서 사전중의 문자를 구성하는 부분으로서 표출되는 스트로크에 대응한 세그먼트와 입력 문자 패턴을 구성하는 스트로크 중 표출하지 않은 부분에 대응한 세그먼트를 대응짓지 않도록 할 필요가 있다. 거기에서, 세그먼트의 DP 매칭 때에 입력패턴의 가상 스트로크와 사전의 실제 스트로크 성분의 계산시에는 이들 세그먼트가 대응지어 지지 않도록 D[si(i)][sd(j)]의 값에 큰 페날티 거리를 주고, 이에 따라 실제로는 있을 수 없는 대응짓기를 저지한다. 이에 따라, 이어짐 글자라도 문자의 오인을 보다 확실하게 방지할 수가 있다. 물론 다른 방법을 써서 세그먼트가 대응지어지지 않도록 하여도 좋다.
제2도에서 도시하는 「家」의 사전의 특징과 제8도에 도시하는 입력 패턴의 특징의 대응 짓기를 수학식 1 내지 수학식 3 및 제6(a)도 및 제6(b)도를 사용해서 계산하면 dist dp=682를 얻는다.
다음에 제4도에 있어서, 특징점 대응짓기부(3)는 스텝(103)에서 얻은 도시하지 않은 파스 표를 사용해서 사전스트로크의 시점, 종점에 대응하는 입력 패턴의 좌표점을 얻는다.
다음에 제4도에 있어서 특징점 대응짓기부(3)는 스텝(103)에서 얻은 도시하지 않은 파스 표를 사용해서 사전 스트로크의 시점, 종점에 대응하는 입력 패턴의 좌표점을 얻는다(스텝 104). 제9도에 사전내의 문자 「家」의 스트로크의 시점, 종점에 대응하는 입력 패턴의 좌표점을 도시한다. 이어서 지정 구간 특징 추출부(4)는, 입력 패턴의 대응점간의 특징추출을 행한다(스텝 105). 여기에서는 제9도에 도시하는 「家」의 각 스트로크의 시점, 종점에 대응하는 점의 조(組)를 특징점조로 하고 이 특징점조를 구성하는 시점에 대응하는 입력문자 패턴의 특징점(시점)과 이 종점에 대응하는 입력문자 패턴의 특징점(종점)을 입력문자 패턴에 있어서 특징점조로 한다. 그래서 이 입력문자 패턴에 있어서 특징점조에 끼워지는 좌표점열에서 문자입력패턴의 시점, 종점간의 외접 구형 폭, 외접 구형 높이, 시점에서 종점으로의 방향을 구하고 또 각 특징점조간의 가상스트로크(종점에 대응하는 점에서 다음의 스트로크의 시점에 대응하는 점으로의 벡터)의 방향 및 거리를 구한다. 이후 이들의 특징을 대응 스트로크 특징이라 칭하기로 한다. 그 결과를 제10도에 도시한다.
다음에, 특징 조합부(5)는 사전의 스트로크 특징과 입력패턴의 대응스트로크 특징의 조합을 행한다(스텝 106). 대응 스트로크 특징의 조합은 예를 들면(외접 구형 폭의 차)+(외접 구형 높이의 차)+(시점에서 종점으로의 방향의 차)+(가상 스트로크의 방향차)+(가상 스트로크의 길이차)를 사용해서 계산한다. 사전에 대응하는 가상 스트로크가 입력패턴에 존재하지 않은 경우는 그 부분의 계산은 하지 않는다. 제2도와 제10도의 특징 사이에서 상기한 계산을 하고 사전 「家」와의 대응스트로크 특징의 거리 dist st=93를 얻는다.
다음으로, 특징조합부(5)는 조합하는 사전이 존재하는가를 판단한다(스텝 107). 사전내의 다른 문자가 존재하는 경우는 스텝(102)으로 되돌아가고 다음의 문자와의 조합을 한다. 이 경우는 다른 문자가 존재하고 제3도의 사전 「琢」과 조합한다. 특징점 대응짓기부(3)는 스텝 102 및 스텝 103을 위와 같은 처리를 하고 「琢」의 DP 매칭의 코스트 disp dp=674를 얻는다. 마찬가지로 특징점 대응짓기부(3)는 스텝 104를 실행하고 입력 패턴의 문자 「琢」의 스트로크의 시점, 종점에 대응하는 좌표점을 구한다. 이 결과를 제11도에 도시한다.
다음에 지정구간 특징 추출부(4)는 스텝 105를 실행하고 사전 「家」와 같이 대응스트로크 특징을 추출한다. 그 결과를 제12도에 도시한다. 그래서 특징 조합부(5)는 제12도에 도시하는 스트로크 특징과 제3도의 사전을 참조해서 계산하고 스트로크 특징의 거리 dist st=223을 얻는다.
이상의 흐름을 참조하는 문자가 사전중에 없어질 때까지 계속하고, 문자가 없어지면 출력부(7)는 인식 결과의 소팅(sorting) 작업을 한다(스텝 108). 결과의 소팅은,
[수학식 4]
dist all = α x dist dp + β x dist st(α, β는 무게의 정수)
을 각각의 사전에 대해 구한다. 다음에 이식을 수학식 4로 한다. 이제 α=1, β=1라 하면,
dist all 「家」 = 682 + 93 = 775
dist all 「琢」 = 674 + 223 = 897
로 된다. dist all을 오름차순으로 소팅 함으로써 「家」를 제1후보문자로, 「琢」을 제2후보문자로 한다. 최후로, 출력부(7)는 후보문자 「家」 및 「琢」을 출력해서 종료한다(스텝 109).
상기한 처리를 한 결과 「家」가 최종적으로 인식결과로 된다. DP 매칭만의 결과로서는 「琢」이 후보 1위이지만, 대응 스트로크가 특징을 병용해서 후보문자를 산출함으로써 정답을 얻을 수가 있다.
이상과 같이, 본 실시예에 의하면 DP 매칭과 대응 스트로크 특징을 병용해서 인식 처리를 행함으로써, 자형에 일그러진 이어짐 글자 패턴에 대해, 이어짐 글자에 대응한 사전 데이타를 유지하지 않아도 인식할 수 있다.
또한, 실시예 1에서는 입력문자 패턴을 모든 사전중의 문자와 매칭을 하고 있으나 소수의 특징을 써서 대분류를 행하고 대분류 결과에 대해서 DP 매칭의 계산을 하고 대응스트로크 특징을 계산할 수도 있다. 또한 상기한 예에서는 α=1, β=1로 하여 DP 매칭과 대응스트로크 특징의 가중치 처리를 같게 하였으나 이 값은 이것에 한정된 것은 아니다. 또한 최종적으로 거리를 계산하는 식(수학식 4)은 DP 매칭의 결과와 대응 스트로크 특징의 결과에 가중치 처리를 한 값의 합으로 하였으나 예를 들면 대응 스트로크 특징을 써서 소팅하고 제1의 후보문자의 거리가 어떤 값보다 큰 경우 DP 매칭의 결과만을 써서 소팅을 고치고 제1위를 후보문자로 하는 등 단순한 계수로서가 아니고 다른 계산 방법이나 조건을 부가하는 등으로 가중치 처리를 해서 바른 해법을 얻도록 할 수도 있다.
다시, 세그먼트의 대응짓기를 DP 매칭을 사용하고 있었으나 DP 매칭에 한정되지 않고, 이완법, 그 밖의 방법이라도 관계없다. 또한 대응스트로크 특징은 대응 부분의 폭, 높이, 시점에서 종점으로의 방향, 가상 스트로크의 폭, 방향으로 사용해서 설명하였으나 이 대신에 다른 특징, 예를 들면 기본 스트로크를 추출해도 좋다.
[실시예 2]
다음으로 실시예 1의 DP 매칭에 있어서 문자 패턴의 변동에 의한 코스트의 상승을 억제하는 방법을 실시예 1에서 사용한 제6(a)도 및 제6(b)도와, 제13(a)도 내지 제13(d)도, 제14도, 제15도 및 제16도를 써서 설명한다. 제13(a)도 내지 제13(d)도는 변동이 큰 부분을 포함하는 문자의 예, 제14도는 문자 「木」의 세그먼트 사전의 내용예, 제15도는 제13(d)도의 세그먼트 특징, 그리고, 제16도는 방향 비의존 코드를 사용한 문자 「木」의 세그먼트 사전을 각각 도시한 도면이다.
실시예 1과 같이 세그먼트의 방향 코드 및 세그먼트 길이를 써서 DP 매칭을 하는 경우 개인에 따라서는 입력문자가 있는 스트로크에 「꺽임 부분」을 붙이는 경우 혹은 문자 패턴이 있는 스트로크의 종점과 다음의 스트로크의 시점과의 거리가 가까운 경우 등 세그먼트 또는 가상 스트로크의 방향 코드가 상당히 변동하는 경우가 있다. 제13(a)도~제13(c)도에 도시하는 바와 같은 문자에서는 도면중 ○내의 부분의 가상 스트로크의 방향차는 16방향 코드를 사용하면 패턴간에서 8로 되고 DP 매칭의 코스트를 증가시키는 원인으로 된다. 또한 제13(d)도에 도시하는 바와 같이 「꺽임 부분」이 있는 패턴에 대해 사전에 「꺽임 부분」이 없는 경우, DP 매칭에서는 코스트가 커지고 이와 같은 스트로크가 동일문자 중에 다수 존재하면 결과로서 다른 문자로 잘못 판독하는 경우가 있다.
본 실시예에 있어서는 이것을 방지하기 위해 미리 방향차가 개인 혹은 문자 패턴에 의해 크게 다른 부분은 방향차를 계산하지 않고, 스트로크의 길이 정보만을 이용하여 계산하는 세그먼트를 준비함으로써 이 문제점을 회피하도록 한 것을 특징으로 하고 있다.
예를 들면 제13(d)도의 패턴이 세그먼트의 방향 코드 열과 세그먼트 길이를 제15도와 같이 추출하고, 「木」의 사전에 세그먼트의 방향 코드열과 세그먼트길이를 제14도와 같이 도시한다. 세그먼트 특징의 DP 매칭 때 입력 패턴의 가상 스트로크와 사전의 실제 스트로크가 대응하는 것을 금지하면 제14도, 제15도에서는 함께 획수가 4획과 동등하므로 각각 필순에 따라서 스트로크를 1대 1로 대응짓기 된다. 즉 제15도의 입력 스트로크의 2획째의 방향코드{9, 1, 3}는 사전의 2획째의 방향 코드 {9}와 대응짓도록 되고, 입력 패턴의 2획째의 「꺽임 부분」의 세그먼트와 사전의 대응짓기 코스트는 수학식 2 및 제6(d)도를 써서 계산하면 코스트=방향차(4)*세그먼트 길이의 합=20x(7+1)=160으로 된다.
이것에 대해, 방향 코드의 변동에 대처한 본 실시예에 있어서 특징적인 사전의 예를 제16도에 도시한다. 본 실시예에 있어서는 소정의 세그먼트 즉 상술한 바와 같이 입력되는 문자 패턴에 따라서는 개인차가 나기 쉽고 「꺽임 부분」 등의 방향이 분산되는 것으로 생각되고 방향 코드가 상당히 변동하는 경우의 어떤 세그먼트에 관한 특징 정보에 방향 비의존 정보를 부가하도록 하였다. 본 실시예에서는 방향 비의존 정보로서 방향 비의존 코드 번호를 쓰고 있다. 제6(a)도의 16방향 코드에 있어서 방향 비의존 코드 번호를 17로 가상적으로 준비하고 제16도의 2획째에 유지한다. 방향코드가 17인 세그먼트의 세그먼트 계산은 방향차를 0으로 해서 DP 매칭을 하도록 정의하고, 제16도의 2획째의 스트로크와 제15도의 2획째의 스트로크의 코스트 계산을 제14도의 경우와 같이 DP 매칭을 계산하고 수학식 5를 써서 계산한다. 제14도의 경우와 같이 2획째의 대응짓기 결과, 사전{9, 17}과 입력패턴{9, 13}에 대해 {9}와 {9}, {17}과 {13}이 대응짓고, 수학식 5에서의 {17}와 {13}의 코스트 계산은 방향차 0x(1+1)=0으로 되고 {9}와 {9}의 코스트 계산 0x(7x7)=0을 가하면 스트로크 단위에서의 코스트는 반드시 일정한 값 0으로 된다. 이와 같이 방향 비의존 코드를 사용함으로써 제14도의 사전과의 코스트 160에 비해 DP 매칭에 있어서 코스트가 작아지고 결과로서 사전과의 거리가 작아지고 잘못 인식을 방지할 수가 있다.
그러나, 방향 비의존 코드와의 DP 매칭을 하는 경우 대응짓기가 기대대로 되지 않는 경우가 존재한다. 이것을 제17(a)도 및 제17(b)도를 써서 설명한다. 이제 제17(a)도의 절선과 제17(b)도의 사전과의 DP 매칭을 하는 것으로 한다. 제17(a)도는 5개의 세그먼트(11~15)를 갖추고 제17(b)도는 2개의 세그먼트(16, 17)를 갖춘 것으로 한다. 제6(a)도를 사용하면 각각의 세그먼트의 방향 코드는 세그먼트(11)가 9, 세그먼트(12)가 5, 세그먼트(13)가 9, 세그먼트(14)가 5, 세그먼트(15)가 9이고 또 세그먼트(16)는 9, 세그먼트(17)는 방향 비의존 코드 17로 한다. 또한 세그먼트 길이는 모두 1로 한다. 여기에서 제17(a) 및 17(b)도를 수학식 1 및 수학식 2를 사용해서 대응짓기를 행한다. 먼저 세그먼트(11)와 세그먼트(16)를 대응짓고 그것의 코스트는 방향차 0x(1+1)=0이다. 다음에 수학식 1로 세그먼트 12와 세그먼트 16은 방향차가 4이므로 코스트는 제6(b)도와 수학식 2에서 20x(1+1)=40, 세그먼트 11과 세그먼트 17은 방향 비의존 코드와의 대응지어져 있으므로 코스트 0, 세그먼트 12와 세그먼트 17도 방향 비의존 코드와의 대응지어져 있으므로 코스트 0으로 되고, 가장 코스트가 작은 세그먼트 11와 세그먼트 17 혹은 세그먼트 12와 세그먼트 17이 대응짓는다. 마찬가지로 계산하여 나머지의 세그먼트(13, 14, 15)는 모든 세그먼트(17)와 대응짓고 코스트도 각각 0으로 된다. 그 결과 제17(a) 및 17(b)도와의 세그먼트 대응짓기 코스트는 수학식 3을 써서 0/(5+2)=0으로 된다.
이 결과는, 제17(a) 및 17(b)도가 동일한 것을 의미하고 잘못된 대응짓기로 된다. 이와 같은 대응짓기를 허여해 버리면 방향 비의존 코드를 포함하나 전혀 형상이 유사하지 않은 문자와 인식되는 일이 있다. 이것을 방지하기 위해 본 실시예에 있어서는 방향 비의존 코드가 부가된 세그먼트에 대응지어지는 입력 문자 패턴에서 얻은 세그먼트의 수의 상한을 준비하도록 하였다.
예를 들면 방향 비의존 코드와의 대응짓는 상한 수를 1로 하면 제17(a) 및 17(b)도와의 코스트는 세그먼트(11~15)와 세그먼트 16이 대응짓고, 세그먼트 15와 세그먼트 17이 대응짓는다. 그것의 코스트는(세그먼트 11와 세그먼트 16이 코스트=)0+(세그먼트 12와 세그먼트16의 코스트=)40+(세그먼트 13과 세그먼트 16의 코스트=)0+(세그먼트 14와 세그먼트 16의 코스트)40+(세그먼트 15와 세그먼트 16의 코스트=))+(세그먼트 15와 세그먼트 17의 코스트=) 0=80으로 되어 앞서의 코스트 0에 비해서 기대대로의 코스트를 얻는다.
또한 실시예에서는 방향 코드가 17인 세그먼트에 의거해 산출되는 코스트를 0으로 되도록 그것의 방향차를 0으로 해서 「꺽임 부분」 등의 세그먼트를 무시하도록 하였으나 코스트를 0이외의 일정값으로 하거나 0으로 되지 않도록 방향차를 설정하는 등 응용할 수도 있다.
또한 상기한 예에서는 DP 매칭의 대응점의 계산식을 수학식 1 내지 수학식 3을 사용하였으나 이것에 한정되지 않고 다른 식을 써도 된다.
본 발명에 의하면, 잘못 인식하기 쉬운 이어짐 글자(띄어쓰지 않고 연달아 붙여 쓴 글자)나, 운필 방향이 유사한 문자 끼리에 대해서, 세그먼트 대응짓기와 대응 스크로크 특징을 병용해서 문자인식 처리를 함으로써, 보다 상세한 문자 검정이 가능해지고, 그 결과 정밀도가 양호한 문자인식을 행할 수 있다. 또한, 동일한 필순에서는, 문자의 어느 부분을 계속해도, 1종류의 사전으로 인식이 가능하고, 다른 이어짐 글자에 각각 대응하는 사전을 준비할 필요가 없다. 따라서, 예를 들면, 자형이 일그러진 이어짐 글자 패턴에 대해, 이어짐 글자에 대응한 사전 데이타를 유지하지 않아도 인식할 수 있도록 되며, 사전 작성의 노력 및 사전 용량의 삭감 등 부수하는 각종 효과도 거둘 수가 있다.
또한, 계산에 의해 최종적인 문자인식을 할 때에 세그먼트 대응짓기와 대응 스트로크 특징의 가중치 처리를 설정할 수 있도록 함으로써, 보다 정확한 문자인식 처리를 제공할 수가 있다.
또한, 방향 비의존 정보가 부가된 세그먼트에 대응 지어지는 입력문자 패턴으로부터 얻은 세그먼트의 수의 상한을 준비하도록 함으로써, 더욱 고정밀도의 문자인식을 할 수 있다.

Claims (3)

  1. 문자 패턴의 좌표점열 데이타를 입력으로 하여, 그의 입력문자 패턴에 해당한 문자 코드를 출력하는 온라인 문자 인식장치에 있어서, 상기 입력문자 패턴을 기술할 때의 스트로크(stroke) 상의 좌표점열 데이타를 입력하는 입력수단과, 상기 입력 수단에서 입력된 좌표점열 데이타에 포함되는 시계열순으로 정열한 좌표점을 절선 근사(segmented approximation)시켜 얻은 각 직선 부분을 세그먼트로 하고, 상기 각 세그먼트에 관한 특징 정보와 각 세그먼트의 끝점인 특징점을 추출하는 특징추출 수단과, 문자를 구성하는 세그먼트에 관한 특징 정보 및 특징점을 문자마다 수록한 사전을 미리 기억하는 사전 기억 수단과, 상기 사전에 기술된 각 문자의 특징 정보와 상기 특징 추출수단에서 추출된 특징 정보에 의거해서 상기 사전내의 각 문자를 구성하는 세그먼트와 상기 입력문자 패턴에서 얻은 세그먼트와의 대응짓기를 행하고, 세그먼트 대응짓기 거리를 산출하는 특징점 대응짓기 수단과, 상기 사전이 지정하는 스트로크 상의 특징점조에 대응한 상기 입력문자 패턴의 스트로크 상의 특징점조에 의해 결정되는 구간의 특징 정보를 대응 스트로크 특징으로서 추출하는 지정 구간 특징 추출수단과, 상기 지정구간 특징 추출 수단에 의해 추출된 대응 스트로크 특징을 상기 사전내의 특징 정보와 조합(照合)시켜, 대응 스트로크 특징의 거리를 산출하는 특징 조합 수단과, 상기 특징 조합 수단으로 얻어진 후보문자코드를 출력하는 출력 수단을 구비하며, 상기 특징 조합 수단은, 상기 산출한 대응 스트로크 특징의 거리 및 상기 특징점 대응짓기 수단에 의해 산출된 세그먼트 대응짓기 거리에 의거해서 상기 사전내의 상기 입력문자 패턴에 대응한 문자를 특정하는 것을 특징으로 하는 온라인 문자 인식 장치.
  2. 제1항에 있어서, 상기 특징점 대응짓기 수단은, 상기 사전내의 문자의 각 스트로크의 시점과 종점에 대해 상기 입력문자 패턴의 좌표점을 각각 1개 대응짓고, 상기 지정구간 특징 추출 수단은, 상기 시점에 대응하는 상기 입력 문자 패턴의 특징점과 상기 종점에 대응하는 입력문자 패턴의 특징점을 특징점조로 하는 것을 특징으로 하는 온라인 문자 인식 장치.
  3. 제1항에 있어서, 상기 각 세그먼트에 관한 정보에는, 각 세그먼트의 방향 및 길이가 포함되어 있고, 상기 특징점 대응짓기 수단은, 상기 특징 추출 수단이 산출한 각 세그먼트의 방향 및 길이에 의거해서, 대응짓기된 각 세그먼트의 코스트를 산출하고, 상기 코스트에 의거해서 세그먼트 대응짓기 거리를 산출하는 것을 특징으로 하는 온라인 문자 인식장치.
KR1019980005891A 1997-03-04 1998-02-25 온라인문자인식장치 Expired - Fee Related KR100301216B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP04864897A JP3657077B2 (ja) 1997-03-04 1997-03-04 オンライン文字認識装置
JP97-048648 1997-03-04

Publications (2)

Publication Number Publication Date
KR19980079762A KR19980079762A (ko) 1998-11-25
KR100301216B1 true KR100301216B1 (ko) 2001-11-30

Family

ID=12809190

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019980005891A Expired - Fee Related KR100301216B1 (ko) 1997-03-04 1998-02-25 온라인문자인식장치

Country Status (4)

Country Link
JP (1) JP3657077B2 (ko)
KR (1) KR100301216B1 (ko)
CN (1) CN1096043C (ko)
TW (1) TW399187B (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4817297B2 (ja) * 2006-02-10 2011-11-16 富士通株式会社 文字検索装置
US20080049969A1 (en) * 2006-08-25 2008-02-28 Jason David Koziol Methods And Systems For Generating A Symbol Identification Challenge For An Automated Agent
CN109101973B (zh) * 2018-08-06 2019-12-10 掌阅科技股份有限公司 文字识别方法、电子设备、存储介质

Also Published As

Publication number Publication date
JP3657077B2 (ja) 2005-06-08
CN1201207A (zh) 1998-12-09
JPH10247221A (ja) 1998-09-14
CN1096043C (zh) 2002-12-11
TW399187B (en) 2000-07-21
KR19980079762A (ko) 1998-11-25

Similar Documents

Publication Publication Date Title
US7756335B2 (en) Handwriting recognition using a graph of segmentation candidates and dictionary search
US5768417A (en) Method and system for velocity-based handwriting recognition
KR100297482B1 (ko) 수기입력의문자인식방법및장치
US5854855A (en) Method and system using meta-classes and polynomial discriminant functions for handwriting recognition
US5802205A (en) Method and system for lexical processing
EP0564827A2 (en) A post-processing error correction scheme using a dictionary for on-line handwriting recognition
EP0459746A2 (en) Pattern recognition method, and apparatus therefor
KR19990013306A (ko) 온라인 수기 입력문자 인식방법과 장치 및 그 방법을 실행하기위한 기록 매체
US6339655B1 (en) Handwriting recognition system using substroke analysis
US5659633A (en) Character recognition method utilizing compass directions and torsion points as features
KR100301216B1 (ko) 온라인문자인식장치
JP2002063548A (ja) 手書き文字認識方法
CN100541522C (zh) 用于识别手写图形的方法和设备
KR940015910A (ko) 온라인 필기체 인식 시스템
Airphaiboon et al. Recognition of handprinted Thai characters using loop structures
JP2903779B2 (ja) 文字列認識方法及びその装置
JPH0962788A (ja) オンライン手書き文字認識方法
JP2930996B2 (ja) 画像認識方法および画像認識装置
KR940001739B1 (ko) 스트로크인식을 통한 온라인 필기체 문자인식방법
KR960013818B1 (ko) 다중획인식을 이용한 한글조합인식장치
JPH09114926A (ja) オンライン文字認識における入力文字大分類方法および装置
KR940001048B1 (ko) 온라인 필기체문자인식방법
EP0382432A2 (en) Manuscript recognition
JPH081660B2 (ja) オンライン手書き図形認識装置
JP2002063547A (ja) 手書き文字認識方法

Legal Events

Date Code Title Description
A201 Request for examination
PA0109 Patent application

Patent event code: PA01091R01D

Comment text: Patent Application

Patent event date: 19980225

PA0201 Request for examination

Patent event code: PA02012R01D

Patent event date: 19980225

Comment text: Request for Examination of Application

PG1501 Laying open of application
E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20000525

Patent event code: PE09021S01D

E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20010221

Patent event code: PE09021S01D

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

Patent event code: PE07011S01D

Comment text: Decision to Grant Registration

Patent event date: 20010409

GRNT Written decision to grant
PR0701 Registration of establishment

Comment text: Registration of Establishment

Patent event date: 20010622

Patent event code: PR07011E01D

PR1002 Payment of registration fee

Payment date: 20010623

End annual number: 3

Start annual number: 1

PG1601 Publication of registration
PR1001 Payment of annual fee

Payment date: 20040623

Start annual number: 4

End annual number: 4

PR1001 Payment of annual fee

Payment date: 20050614

Start annual number: 5

End annual number: 5

PR1001 Payment of annual fee

Payment date: 20060612

Start annual number: 6

End annual number: 6

FPAY Annual fee payment

Payment date: 20070608

Year of fee payment: 7

PR1001 Payment of annual fee

Payment date: 20070608

Start annual number: 7

End annual number: 7

LAPS Lapse due to unpaid annual fee
PC1903 Unpaid annual fee