JP4504702B2 - 文書処理装置、文書処理方法、および文書処理プログラム - Google Patents
文書処理装置、文書処理方法、および文書処理プログラム Download PDFInfo
- Publication number
- JP4504702B2 JP4504702B2 JP2004050165A JP2004050165A JP4504702B2 JP 4504702 B2 JP4504702 B2 JP 4504702B2 JP 2004050165 A JP2004050165 A JP 2004050165A JP 2004050165 A JP2004050165 A JP 2004050165A JP 4504702 B2 JP4504702 B2 JP 4504702B2
- Authority
- JP
- Japan
- Prior art keywords
- line
- symbol
- rectangle
- height
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000012545 processing Methods 0.000 title claims description 85
- 238000003672 processing method Methods 0.000 title claims description 11
- 238000012360 testing method Methods 0.000 claims description 25
- 239000013598 vector Substances 0.000 claims description 21
- 238000012549 training Methods 0.000 claims description 19
- 238000013139 quantization Methods 0.000 claims description 17
- 239000000284 extract Substances 0.000 claims description 14
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 238000011156 evaluation Methods 0.000 claims description 7
- 238000004220 aggregation Methods 0.000 claims description 5
- 230000002776 aggregation Effects 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000000034 method Methods 0.000 description 51
- 238000000605 extraction Methods 0.000 description 12
- 238000005259 measurement Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 238000003860 storage Methods 0.000 description 3
- 238000005520 cutting process Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005309 stochastic process Methods 0.000 description 1
Images
Landscapes
- Character Discrimination (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Description
まず、本発明の実施の形態にかかる文書処理装置のハードウェア構成について説明する。図1は、この文書処理装置のハードウェア構成を示す図である。この文書処理装置は、CPU101、ROM102、RAM103、HDD(ハードディスクドライブ)104、HD(ハードディスク)105、FDD(フレキシブルディスクドライブ)106、FD112、ディスプレイ107、ネットワークボード108、キーボード109、マウス110、およびスキャナ111が、バス100によって接続され構成されている。
次に、本発明の実施の形態にかかる文書処理装置の機能的構成を説明する。図2は、この文書処理装置の機能的構成を示すブロック図である。この文書処理装置は、画像入力部201、矩形抽出部202、行切り出し部203、シンボル生成部204、出現頻度集計部205、判定部206、および表示部207を含み構成される。
(ただし、ysは行内矩形始点の高さ、Hは行高さを示す。)
YsVal=INT(YsRate*(N−1)) ・・・(2)
(ただし、INT():小数点以下切捨て)
とすればよい。各段階は0〜(N−1)とラベル付けされる。なお、原稿をスキャンする際に原稿が傾いてしまうと、図10の文字行も傾いてしまう。極端な傾きの場合には、行切り出し処理が失敗してしまうが、少々の傾きであれば、行間の空白部を利用して、行を切り出すことができる。
HeightRate=h/H ・・・(3)
HeightVal=INT((HeightRate*(N−1))+0.5) ・・・(4)
(ただし、INT():小数点以下切捨て)
各段階は0〜(N−1)とラベル付けされる。
WidthRate=w/H ・・・(5)
WidthVal=INT((WidthRate*(N−1))+0.5) ・・・(6)
(ただし、INT():小数点以下切捨て)
各段階は0〜(N−1)とラベル付けされる。
RightDistanceRate=d/H ・・・(7)
(ただし、dは矩形間距離を示す。)
RightDistanceVal
=INT_PLUS((RightDistanceRate*(N−1))+0.5) ・・・(8)
(ただし、INT_PLUS():正数化して、小数点以下切捨て)
を求め、注目矩形と隣接矩形との距離の割合を固定段階に量子化する。各段階は0〜(N−1)とラベル付けされる。これによって、アジア系文字を多く含む文字行の特徴を、より詳細に定義でき、厳密な文字行の判定を実施することができる。
4bits+3bits+1bit=8bits
であるから、1byteの各ビットに全情報を格納することができる。そして、これらの3種の情報を一つにまとめたシンボルの種類は、
15段階×8段階×2段階=240種
となる。なお、まとめる情報の種類および、その格納のための記憶エリア、記憶サイズは固定ではなく、識別対象である文字行を特定するに好適な情報を適宜選択し、決定することは云うまでもない。
Rxy=1−(6*Σ(Rxi−Ryi)^2)/(n*(n^2−1)) ・・・(11)
(ただし、nはデータ数、Rxi,Ryiはデータの順位数値を示す。)
以下、本発明の文書処理装置を用いた文書処理の手順を説明する。図16は、この文書処理の手順を示すフローチャートである。まず、画像入力部201が、識別対象の原稿画像を入力する(ステップS1601)。次に、矩形抽出部202が、入力された原稿画像から矩形を抽出する(ステップS1602)。次いで、行切り出し部203が、矩形抽出部202で抽出された矩形から行内矩形の切り出し処理を行う(ステップS1603)。シンボル生成部204が、行切り出し部203で切り出された行内矩形から、矩形の配置状態を表す特徴を抽出し、これらを量子化してシンボルを生成する(ステップS1604)。出現頻度集計部205が、シンボル生成部204で生成された各シンボル系列に対し、言語別にあらかじめ訓練用の行内矩形シンボルデータで学習したtrigram表を適用し、当該シンボル系列の出現頻度を言語別に算出し、集計する(ステップS1605)。最後に、判定部206が、出現頻度集計部205による集計結果から、最も高い出現頻度を示した言語が、照合対象行の属する言語だと判断する(ステップS1606)。
次に、ステップS1604の矩形配置状態シンボル生成処理の手順をより詳しく説明する。図17は、この矩形配置状態シンボル生成処理の手順を示すフローチャートである。まず、原稿画像に表現された文字の行高さを推定する(ステップS1701)。次に、行高さに対する行内矩形の始点位置を基準に当該行内矩形を分類する(ステップS1702)。次いで、分類された各行内矩形の配置状態を表す特徴(行内矩形の始点の高さ、矩形サイズ(高さ、幅)、黒画素密度、隣接矩形との距離など)を測定する(ステップS1703)。そして、矩形の配置状態を表す特徴を量子化してシンボルを生成する(ステップS1704)。最後に、ステップS1704で生成されたシンボル系列を記録する(ステップS1705)。
101 CPU
102 ROM
103 RAM
104 HDD(ハードディスクドライブ)
105 HD(ハードディスク)
106 FDD(フレキシブルディスクドライブ)
107 ディスプレイ
108 ネットワークボード
109 キーボード
110 マウス
111 スキャナ
112 FD(フレキシブルディスク)
113 通信ケーブル
114 ネットワーク
201 画像入力部
202 矩形抽出部
203 行切り出し部
204 シンボル生成部
205 出現頻度集計部
206 判定部
207 表示部
Claims (12)
- 入力された文書画像に対して所定の画像処理を行い、画像の特徴を抽出し、文書処理を行う装置であって、
前記文書画像から抽出した文字行画像の行内矩形の始点の行内における高さを固定段階に量子化して固定種類のシンボルを生成する行内高さシンボル生成手段と、
前記文字行画像の行高さを推定する行高さ推定手段と、
行高さに対する行内矩形の高さの割合を固定段階に量子化して固定種類のシンボルを生成する行内矩形高さ割合シンボル生成手段と、
行高さに対する行内矩形の幅の割合を固定段階に量子化して固定種類のシンボルを生成する行内矩形幅割合シンボル生成手段と、
前記矩形内の黒画素密度を固定段階に量子化して固定種類のシンボルを生成する黒画素密度シンボル生成手段と、
試験行における行内矩形の配置状態を表す特徴をシンボル系列に変換し、試験行における行内矩形のシンボルの出現頻度を集計する出現頻度集計手段と、
前記出現頻度集計手段により集計されたシンボルの出現頻度と予め学習したシンボル系列の並び傾向とに基づいて類似性を判定する類似性判定手段と、
を有することを特徴とする文書処理装置。 - さらに、行内矩形の配置状態を表す複数の特徴のなかから代表的なものを一つ以上抽出し、これに基づいた固定種類のシンボルを生成する代表シンボル生成手段を備えたことを特徴とする請求項1に記載の文書処理装置。
- さらに、行高さに対する、注目矩形と隣接矩形との距離の割合を固定段階に量子化して固定種類のシンボルを生成する距離割合シンボル生成手段を備えたことを特徴とする請求項2に記載の文書処理装置。
- 注目する行内矩形の終点と、隣接する行内矩形の始点との距離を算出する距離算出手段と、前記距離算出手段により算出された距離と行高さとを比較し、その割合が一定値を超えている場合に、空白シンボルを挿入して、行内矩形の配置状態をシンボル系列に変換するシンボル系列変換手段と、
を備えたことを特徴とする請求項1に記載の文書処理装置。 - さらに、行内矩形の配置状態を表す複数の特徴を複数次元ベクトルの各次元に対応させてベクトル量子化し、行内矩形の配置状態を示す固定種類のシンボルを生成する行内矩形配置状態シンボル生成手段を備えたことを特徴とする請求項2に記載の文書処理装置。
- さらに、前記代表シンボル生成手段で生成された文字行のシンボル情報を原稿全体、所定領域全体などの特定の範囲において集計して、訓練文書と試験文書との類似性を判定する特定範囲内類似性判定手段を備えたことを特徴とする請求項2に記載の文書処理装置。
- 文字入力手段と、
文字フォントセットと、
前記文字入力手段から入力された文字テキストから前記文字フォントセットに基づいて文字フォントに展開し文字画像を得る文書画像取得手段と、
前記文字入力手段から入力された文字テキストの文字列から文字列画像を生成し、この文字列画像の行内矩形シンボルを生成する行内矩形シンボル生成手段と、
を備えたことを特徴とする請求項1に記載の文書処理装置。 - さらに、文字毎にあらかじめ生成された行内矩形シンボルに対して、文字毎にその文字内の矩形の配置状態を表現するシンボルを対応させるシンボル対応手段と、
前記文字入力手段から入力された入力テキストの文字列を矩形シンボル系列へ変換する矩形シンボル変換手段と、
を備えたことを特徴とする請求項7に記載の文書処理装置。 - 入力された文書画像に対して所定の画像処理を行い、画像の特徴を抽出し、文書処理を行う装置であって、
前記文書画像から抽出した文字行画像の行内矩形の始点の行内における高さを固定段階に量子化して固定種類のシンボルを生成する行内高さシンボル生成手段と、
前記文字行画像の行高さを推定する行高さ推定手段と、
行高さに対する行内矩形の高さの割合を固定段階に量子化して固定種類のシンボルを生成する行内矩形高さ割合シンボル生成手段と、
行高さに対する行内矩形の幅の割合を固定段階に量子化して固定種類のシンボルを生成する行内矩形幅割合シンボル生成手段と、
前記矩形内の黒画素密度を固定段階に量子化して固定種類のシンボルを生成する黒画素密度シンボル生成手段と、
訓練行における行内矩形の配置状態を表す特徴をシンボル系列に変換し、その傾向を学習する訓練行学習手段と、
試験行における行内矩形の配置状態を表す特徴をシンボル系列に変換し、前記訓練行学習手段による訓練行の学習結果を用いて、試験行の評価値を算出する評価値算出手段と、
前記訓練行学習手段による訓練行の学習結果と前記評価値算出手段により算出された試験行の評価値とを照合し、その類似性を判定する類似性判定手段と、
を含み構成されることを特徴とする文書処理装置。 - 文書画像から抽出した文字行画像の類似性を判定する文書処理装置であって、
前記文字行画像の行内矩形の始点の行内における高さを固定段階に量子化する行内始点高さ量子化手段と、
前記文字行画像の行内矩形の高さを固定段階に量子化する行内矩形高さ量子化手段と、
前記文字行画像の行内矩形の幅を固定段階に量子化する行内矩形幅量子化手段と、
前記行内始点高さ量子化手段で量子化された行内矩形の始点の行内における高さと、前記行内矩形高さ量子化手段で量子化された行内矩形の高さと、前記行内矩形幅量子化手段で量子化された行内矩形の幅とに基づいて決定される配置状態からシンボルを生成するシンボル生成手段と、
前記シンボル生成手段で試験行において生成されたシンボルの出現頻度を集計する出現頻度集計手段と、
前記出現頻度集計手段により集計されたシンボルの出現頻度と予め学習したシンボル系列の並び傾向とに基づいて類似性を判定する類似性判定手段と、
を有することを特徴とする文書処理装置。 - 入力された文書画像に対して所定の画像処理を行い、画像の特徴を抽出し、文書処理を行う文書処理装置によってなされる文書処理方法であって、
前記文書処理装置が、
前記文書画像から抽出した文字行画像の行内矩形の始点の行内における高さを固定段階に量子化して固定種類のシンボルを生成する行内高さシンボル生成工程と、
前記文字行画像の行高さを推定する行高さ推定工程と、
行高さに対する行内矩形の高さの割合を固定段階に量子化して固定種類のシンボルを生成する行内矩形高さ割合シンボル生成工程と、
行高さに対する行内矩形の幅の割合を固定段階に量子化して固定種類のシンボルを生成する行内矩形幅割合シンボル生成工程と、
前記矩形内の黒画素密度を固定段階に量子化して固定種類のシンボルを生成する黒画素密度シンボル生成工程と、
試験行における行内矩形の配置状態を表す特徴をシンボル系列に変換し、試験行におけるシンボルの出現頻度を集計する出現頻度集計工程と、
前記出現頻度集計工程により集計された試験行におけるシンボルの出現頻度と予め学習したシンボル系列の並び傾向とに基づいて類似性を判定する類似性判定工程と、
を実行することを特徴とする文書処理方法。 - 入力された文書画像に対して所定の画像処理を行い、画像の特徴を抽出し、文書処理を行うプログラムであって、
前記文書画像から抽出した文字行画像の行内矩形の始点の行内における高さを固定段階に量子化して固定種類のシンボルを生成する行内高さシンボル生成工程と、
前記文字行画像の行高さを推定する行高さ推定工程と、
行高さに対する行内矩形の高さの割合を固定段階に量子化して固定種類のシンボルを生成する行内矩形高さ割合シンボル生成工程と、
行高さに対する行内矩形の幅の割合を固定段階に量子化して固定種類のシンボルを生成する行内矩形幅割合シンボル生成工程と、
前記矩形内の黒画素密度を固定段階に量子化して固定種類のシンボルを生成する黒画素密度シンボル生成工程と、
試験行における行内矩形の配置状態を表す特徴をシンボル系列に変換し、試験行におけるシンボルの出現頻度を集計する出現頻度集計工程と、
前記出現頻度集計工程により集計された試験行におけるシンボルの出現頻度と予め学習したシンボル系列の並び傾向とに基づいて類似性を判定する類似性判定工程と、
をコンピュータに実行させることを特徴とする文書処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004050165A JP4504702B2 (ja) | 2004-02-25 | 2004-02-25 | 文書処理装置、文書処理方法、および文書処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004050165A JP4504702B2 (ja) | 2004-02-25 | 2004-02-25 | 文書処理装置、文書処理方法、および文書処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005242579A JP2005242579A (ja) | 2005-09-08 |
JP4504702B2 true JP4504702B2 (ja) | 2010-07-14 |
Family
ID=35024271
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004050165A Expired - Lifetime JP4504702B2 (ja) | 2004-02-25 | 2004-02-25 | 文書処理装置、文書処理方法、および文書処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4504702B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104112287A (zh) * | 2013-04-17 | 2014-10-22 | 北大方正集团有限公司 | 切分图片中文字的方法和装置 |
Families Citing this family (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9405751B2 (en) | 2005-08-23 | 2016-08-02 | Ricoh Co., Ltd. | Database for mixed media document system |
US8989431B1 (en) | 2007-07-11 | 2015-03-24 | Ricoh Co., Ltd. | Ad hoc paper-based networking with mixed media reality |
US8369655B2 (en) | 2006-07-31 | 2013-02-05 | Ricoh Co., Ltd. | Mixed media reality recognition using multiple specialized indexes |
US7702673B2 (en) | 2004-10-01 | 2010-04-20 | Ricoh Co., Ltd. | System and methods for creation and use of a mixed media environment |
US8868555B2 (en) | 2006-07-31 | 2014-10-21 | Ricoh Co., Ltd. | Computation of a recongnizability score (quality predictor) for image retrieval |
US9530050B1 (en) | 2007-07-11 | 2016-12-27 | Ricoh Co., Ltd. | Document annotation sharing |
US8156116B2 (en) | 2006-07-31 | 2012-04-10 | Ricoh Co., Ltd | Dynamic presentation of targeted information in a mixed media reality recognition system |
US8385589B2 (en) | 2008-05-15 | 2013-02-26 | Berna Erol | Web-based content detection in images, extraction and recognition |
US8949287B2 (en) | 2005-08-23 | 2015-02-03 | Ricoh Co., Ltd. | Embedding hot spots in imaged documents |
US8510283B2 (en) | 2006-07-31 | 2013-08-13 | Ricoh Co., Ltd. | Automatic adaption of an image recognition system to image capture devices |
US8176054B2 (en) | 2007-07-12 | 2012-05-08 | Ricoh Co. Ltd | Retrieving electronic documents by converting them to synthetic text |
US8856108B2 (en) | 2006-07-31 | 2014-10-07 | Ricoh Co., Ltd. | Combining results of image retrieval processes |
US8825682B2 (en) | 2006-07-31 | 2014-09-02 | Ricoh Co., Ltd. | Architecture for mixed media reality retrieval of locations and registration of images |
US9384619B2 (en) | 2006-07-31 | 2016-07-05 | Ricoh Co., Ltd. | Searching media content for objects specified using identifiers |
US8838591B2 (en) | 2005-08-23 | 2014-09-16 | Ricoh Co., Ltd. | Embedding hot spots in electronic documents |
US9373029B2 (en) | 2007-07-11 | 2016-06-21 | Ricoh Co., Ltd. | Invisible junction feature recognition for document security or annotation |
US8521737B2 (en) | 2004-10-01 | 2013-08-27 | Ricoh Co., Ltd. | Method and system for multi-tier image matching in a mixed media environment |
US7812986B2 (en) | 2005-08-23 | 2010-10-12 | Ricoh Co. Ltd. | System and methods for use of voice mail and email in a mixed media environment |
US9171202B2 (en) | 2005-08-23 | 2015-10-27 | Ricoh Co., Ltd. | Data organization and access for mixed media document system |
US8600989B2 (en) | 2004-10-01 | 2013-12-03 | Ricoh Co., Ltd. | Method and system for image matching in a mixed media environment |
US9176984B2 (en) | 2006-07-31 | 2015-11-03 | Ricoh Co., Ltd | Mixed media reality retrieval of differentially-weighted links |
US9020966B2 (en) | 2006-07-31 | 2015-04-28 | Ricoh Co., Ltd. | Client device for interacting with a mixed media reality recognition system |
US8676810B2 (en) | 2006-07-31 | 2014-03-18 | Ricoh Co., Ltd. | Multiple index mixed media reality recognition using unequal priority indexes |
US8201076B2 (en) | 2006-07-31 | 2012-06-12 | Ricoh Co., Ltd. | Capturing symbolic information from documents upon printing |
US9063952B2 (en) | 2006-07-31 | 2015-06-23 | Ricoh Co., Ltd. | Mixed media reality recognition with image tracking |
US8489987B2 (en) | 2006-07-31 | 2013-07-16 | Ricoh Co., Ltd. | Monitoring and analyzing creation and usage of visual content using image and hotspot interaction |
JP4851353B2 (ja) | 2007-01-31 | 2012-01-11 | 株式会社リコー | 画像処理装置及び画像処理方法 |
US8065321B2 (en) | 2007-06-20 | 2011-11-22 | Ricoh Company, Ltd. | Apparatus and method of searching document data |
JP2009048621A (ja) * | 2007-07-26 | 2009-03-05 | Ricoh Co Ltd | データ提供装置、データ提供方法、及びプログラム |
EP2026219A1 (en) | 2007-07-26 | 2009-02-18 | Ricoh Company, Ltd. | Data providing apparatus, data providing method and program |
JP5046241B2 (ja) * | 2008-06-23 | 2012-10-10 | 株式会社リコー | 画像処理装置、画像処理方法およびプログラム |
JP5298830B2 (ja) * | 2008-12-19 | 2013-09-25 | 富士ゼロックス株式会社 | 画像処理プログラム、画像処理装置及び画像処理システム |
US8385660B2 (en) | 2009-06-24 | 2013-02-26 | Ricoh Co., Ltd. | Mixed media reality indexing and retrieval for repeated content |
CN101944091A (zh) * | 2009-07-07 | 2011-01-12 | 夏普株式会社 | 图像检索装置 |
US9058331B2 (en) | 2011-07-27 | 2015-06-16 | Ricoh Co., Ltd. | Generating a conversation in a social network based on visual search results |
JP5462917B2 (ja) * | 2012-10-05 | 2014-04-02 | 楽天株式会社 | 画像検索インデックス生成方法、画像検索インデックス生成プログラム及び画像検索インデックス生成装置 |
US9501554B2 (en) * | 2013-03-06 | 2016-11-22 | Rakuten, Inc. | Image processing system, image processing method, and image processing program |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10232866A (ja) * | 1996-12-04 | 1998-09-02 | Canon Inc | データ処理方法及び装置 |
JP2004046723A (ja) * | 2002-07-15 | 2004-02-12 | Ricoh Co Ltd | 文字認識方法、該方法の実行に用いるプログラム及び文字認識装置 |
-
2004
- 2004-02-25 JP JP2004050165A patent/JP4504702B2/ja not_active Expired - Lifetime
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10232866A (ja) * | 1996-12-04 | 1998-09-02 | Canon Inc | データ処理方法及び装置 |
JP2004046723A (ja) * | 2002-07-15 | 2004-02-12 | Ricoh Co Ltd | 文字認識方法、該方法の実行に用いるプログラム及び文字認識装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104112287A (zh) * | 2013-04-17 | 2014-10-22 | 北大方正集团有限公司 | 切分图片中文字的方法和装置 |
CN104112287B (zh) * | 2013-04-17 | 2017-05-24 | 北大方正集团有限公司 | 切分图片中文字的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2005242579A (ja) | 2005-09-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4504702B2 (ja) | 文書処理装置、文書処理方法、および文書処理プログラム | |
AU2020279921B2 (en) | Representative document hierarchy generation | |
JP2750057B2 (ja) | 自動手書き文字認識に対する統計的混合手法 | |
US20200302208A1 (en) | Recognizing typewritten and handwritten characters using end-to-end deep learning | |
US8249344B2 (en) | Grammatical parsing of document visual structures | |
JP2667954B2 (ja) | 静的及び動的パラメータを使用する自動手書き文字認識装置及び方法 | |
JP4607633B2 (ja) | 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法 | |
KR101769918B1 (ko) | 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치 | |
EP2015228A1 (en) | Retrieving electronic documents by converting them to synthetic text | |
JP2001167131A (ja) | 文書シグネチュアを使用する文書の自動分類方法 | |
CN112434691A (zh) | 基于智能解析识别的hs编码匹配、展示方法、系统及存储介质 | |
CN112560849B (zh) | 基于神经网络算法的文理分割方法及系统 | |
EP2497053A2 (en) | System and method for increasing the accuracy of optical character recognition (ocr) | |
JP4300098B2 (ja) | オブジェクト識別方法とその装置、プログラム及び記録媒体 | |
JPH06508465A (ja) | 文字ビットマップにおける終点特性を測定する手段を用いる文字認識システム及び方法 | |
JP2003524258A (ja) | 電子ドキュメントを処理する方法および装置 | |
JP2008225695A (ja) | 文字認識誤り修正装置およびプログラム | |
JP2015069256A (ja) | 文字識別システム | |
JP4885112B2 (ja) | 文書処理装置、文書処理方法及び文書処理プログラム | |
CN114495139B (zh) | 一种基于图像的作业查重系统及方法 | |
KR20180126352A (ko) | 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치 | |
CN113468979A (zh) | 文本行语种识别方法、装置、电子设备 | |
JPH0567237A (ja) | 空白認識方法、空白認識装置、文字認識装置、英日翻 訳装置 | |
JP5683287B2 (ja) | パターン認識装置及びパターン認識方法 | |
Ball et al. | Writer verification of historical documents among cohort writers |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061228 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20090730 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091002 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091013 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091209 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091209 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100202 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100331 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100420 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100423 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4504702 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130430 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140430 Year of fee payment: 4 |
|
EXPY | Cancellation because of completion of term |