Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP4194301B2 - Character recognition system and character recognition program - Google Patents
[go: Go Back, main page]

JP4194301B2 - Character recognition system and character recognition program - Google Patents

Character recognition system and character recognition program Download PDF

Info

Publication number
JP4194301B2
JP4194301B2 JP2002159690A JP2002159690A JP4194301B2 JP 4194301 B2 JP4194301 B2 JP 4194301B2 JP 2002159690 A JP2002159690 A JP 2002159690A JP 2002159690 A JP2002159690 A JP 2002159690A JP 4194301 B2 JP4194301 B2 JP 4194301B2
Authority
JP
Japan
Prior art keywords
image
edge
character recognition
upper side
detected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002159690A
Other languages
Japanese (ja)
Other versions
JP2004005177A (en
Inventor
艶彦 島田
嘉治 島田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2002159690A priority Critical patent/JP4194301B2/en
Publication of JP2004005177A publication Critical patent/JP2004005177A/en
Application granted granted Critical
Publication of JP4194301B2 publication Critical patent/JP4194301B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、帳票の文字認識を行う文字認識システムおよび文字認識プログラムに関するものである。
【0002】
【従来の技術】
従来、帳票をスキャナにて読み取ってイメージをディスプレイ上に表示すると、帳票部分の文字が読み取られた部分と、帳票のない部分も白画像として表示されてしまうので、オペレータが文字認識する範囲を枠で囲み、当該枠内をスキャナーで読み取って文字認識ソフトに渡して当該帳票の文字認識を行うようにしていた。
【0003】
また、帳票原点を決定するため、3点マークと呼ばれるマークを帳票の左上、右上、左下に印刷する必要があった。
【0004】
【発明が解決しようとする課題】
このため、帳票の文字の印刷されていない部分と、帳票のない背景部分とが共に白画像となってしまうため、上述したようにオペレータが帳票に相当する範囲を枠で囲んで当該枠の内部をスキャナで読み取って文字認識するという面倒な作業が必要となってしまうなどの問題があった。
【0005】
また、帳票原点を決定するため、3点マークと呼ばれるマークを帳票の左上、右上、左下に印刷する必要があり、帳票の制約が生じるという問題もあった。
【0006】
本発明は、これらの問題を解決するため、帳票をイメージスキャナで読み取ったときにエッジ強調およびコントラスト変更して当該帳票の各端の部分を検出あるいは推定して帳票の外側を黒背景にした帳票画像を自動生成し、当該黒背景の帳票画像が黒から白に変化する点を基準点として文字認識を行い、帳票から外側を黒背景とした帳票画像を自動生成して文字認識を簡易かつ精度良好に実現することを目的としている。
【0007】
【課題を解決するための手段】
図1を参照して課題を解決するための手段を説明する。
【0008】
図1において、処理装置1は、プログラムに従い各種処理を実行するものであって、ここでは、エッジ強調処理手段13、コントラスト変更手段14、帳票端検出手段15、黒背景付加手段16、文字認識手段17などから構成されるものである。
【0009】
エッジ強調処理手段13は、画像のエッジを強調するものである。
コントラスト変更手段14は、画像のコントラストを変更するものである。
【0010】
黒背景付加手段16は、画像中の帳票の外側の部分に黒背景を付加するものである。
【0011】
文字認識手段17は、画像中の黒画素から白画素に変化して点を基点(原点)に、文字認識を行うものである。
【0012】
イメージスキャナ3は、帳票2を読み取って画像を生成するものである。
次に、動作を説明する。
【0013】
イメージスキャナ3によって帳票3を読み取って画像を生成し、エッジ強調処理手段13が当該画像中のエッジを強調し、帳票検出手段15が画像中から帳票の端(例えば上、下、左、右の各端)を検出し、黒背景付加手段16が画像中の帳票の画像の外側に黒背景を付加し、文字認識手段17が黒背景の付加された画像中で黒画素から白画素に変化した点を基点(原点)に、文字認識を行うようにしている。
【0014】
この際、エッジ強調して帳票の用紙端が検出できないときに、コントラスト変更手段14が画像のコントラストおよび必要に応じて明るさを増減して帳票(用紙)の端を検出することを繰り返して用紙端を検出するようにしている。
【0015】
また、帳票端検出手段15が画像上で帳票(用紙)端の上、下、左、右のうちのいずれか1つあるいは2つが検出できなかったときに他の検出できた位置から当該検出できなかった位置を、帳票のサイズから推定するようにしている。
【0016】
従って、帳票をイメージスキャナで読み取ったときにエッジ強調およびコントラスト変更して当該帳票の各端の部分を検出あるいは推定して帳票の外側を黒背景にした帳票画像を自動生成し、当該黒背景の帳票画像が黒から白に変化する点を基準点として文字認識を行うことにより、帳票から外側を黒背景とした帳票画像を自動生成して文字認識を簡易かつ精度良好に実現することが可能となる。
【0017】
【発明の実施の形態】
次に、図1から図5を用いて本発明の実施の形態および動作を順次詳細に説明する。
【0018】
図1は、本発明のシステム構成図を示す。
図1において、処理装置1は、プログラムに従い各種処理を実行するものであって、11ないし18などから構成されるものである。
【0019】
イメージスキャナ制御手段11は、イメージスキャナ3を制御して帳票2から画像を読み取るものである。
【0020】
画像格納手段12は、イメージスキャナ制御手段11によってイメージスキャナ3から読み取られた帳票の画像を一時的に格納するものである。
【0021】
エッジ強調処理手段13は、帳票から読み取った画像中の帳票画像のエッジを強調して当該帳票の用紙端(エッジ)を検出し易くするものである。
【0022】
コントラスト変更手段14は、帳票から読み取った画像中の帳票の用紙端(エッジ)のコントラストを変更および必要に応じて明るさを変更して当該用紙端(エッジ)を検出し易くするものである。
【0023】
帳票端検出手段15は、エッジ強調処理手段13およびコントラスト変更手段14によってエッジ強調、コントラスト変更した後の画像から帳票の用紙端の位置(上、下、右、左の端の位置)を検出するものである。
【0024】
黒背景付加手段16は、帳票端検出手段15によって検出された画像中の帳票の用紙の外側の部分に、黒背景を付加した画像を生成するものである。
【0025】
文字認識手段17は、黒背景を付加した画像中で、黒画素から白画素に変化する位置を基点として、周知の手法に従い、文字認識を行うものである(図5参照)。
【0026】
認識結果表示手段18は、文字認識手段17で文字認識された認識結果を、ディスプレイ4上に表示するものである。
【0027】
帳票2は、文字認識の対象の帳票である。
イメージスキャナ3は、帳票2の画像を読み取るものである。
【0028】
ディスプレイ4は、認識結果を表示するものである。
次に、図2のフローチャートの順番に従い、図1の構成の動作を詳細に説明する。
【0029】
図2は、本発明の動作説明フローチャートを示す。
図2において、S1は、読み取り画像を保存する。これは、帳票2をイメージスキャナ3で読み取って生成した画像を作業域に保存する。
【0030】
S2は、エッジ強調する。この際、S3でコントラスト変更を行い、画像中の帳票の用紙端が検出し易くする(図3を用いて後述する)。
【0031】
S4は、帳票端を検出する。これは、S2でエッジ強調、S3でコントラスト変更し、帳票の用紙の端(エッジ部分)の位置(用紙の上、下、左、右の位置)をそれぞれ検出する。尚、用紙の端の上下左右のうち1つあるいは2つが検出できないときは他の検出できた位置から推定する。
【0032】
S5は、黒背景を付加する。これは、S4で検出した帳票の用紙の外側に、黒背景を付加した画像を生成する。
【0033】
S6は、文字認識する。これは、S5で黒背景の付加された画像中で、黒画素から白画素に変化する点を基点にし、周知の文字認識を行う(図5参照)。そして、文字認識した結果を、文字認識データとして出力する。
【0034】
以上によって、帳票2からイメージスキャナ3で読み取った画像のエッジ強調、コントラスト変更して帳票の端(エッジ)を検出し、当該検出した帳票の端の外側に黒背景を付加した画像を生成し、当該生成した画像中で黒画素から白画素に変わる点を基点にして、帳票上の文字認識することが可能となる。
【0035】
図4は、本発明の詳細フローチャートを示す。
図4において、S11は、コントラスト初期設定する。これは、帳票からイメージスキャナ3で読み取るときのコントラストをデフォルトの初期設定値に設定する。
【0036】
S12は、画像読み取りする。これは、S11で初期設定値のコントラスト、あるいはS21でコントラスト値変更された後のコントラストで、イメージスキャナ3で帳票2の画像を読み取る。
【0037】
S13は、エッジ強調処理を行う。これはS12で読み取った画像について、帳票のエッジ(用紙端)を強調する処理を行う。
【0038】
S14は、上辺、左辺、右辺、下辺を検出する。
S15は、上辺、左辺が検出できたか判別する。YESの場合には、S16で検出した帳票端の上辺、左辺の交点を検出し、S17に進む。一方、S15のNOの場合には、上辺、左辺が検出できなかったのでS21でコントラスト値を変更してS12以降を繰り返す。
【0039】
S17は、交点が画像内にあるか判別する。これは、S15のYESで検出した帳票の上辺と左辺との交点が、画像内にある、即ち、帳票の上辺と左辺の交点がイメージスキャナ3で読み取った画像内に含まれるか判別する。YESの場合には、S18で黒背景付加(画像中の帳票の外側に黒背景を付加)した画像を生成し、S19で文字認識(画像中で黒画素から白画素に変化した点を基点として、周知の文字認識)を行い、S20に進む。一方、S17のNOの場合には、交点が画像内にない、即ち、画像内に帳票の画像が全部含まれていないと判明し、帳票の端(エッジ)の検出位置が誤検出と判明したので、S21でコントラスト値変更し、S12以降を繰り返す。
【0040】
S20は、文字認識エラーか判別する。これは、S19の文字認識の結果、エラーか判別する。YESの場合には、画像中の帳票のエッジ(端)の誤検出と判明したので、S21でコントラスト値変更してS12以降を繰り返す。一方、S20のNOの場合には、文字認識エラーが発生しなく、正常に文字認識されたと判明したので、終了する。
【0041】
以上によって、イメージスキャナ3で帳票2の画像を読み取るコントラストを変更して当該帳票2から読み取った画像についてエッジ強調して画像中から帳票のエッジ(端)を検出し、上辺と左辺の交点が画像内にあるときに正常な帳票の辺の検出ができたと判定し、当該検出した帳票の外側に黒背景を付加した画像を生成し、当該画像上で黒画素から白画素に変化する点を基点にして文字認識することにより、正確かつ精度良好に文字認識することが可能となる。
【0042】
図4および図5は、本発明の説明図を示す。
図4の(a)は、画像を読み込む。これは、既述した図1のイメージスキャナ3を制御して帳票2から読み取った画像を取り込む。ここでは、中央の矩形の部分が帳票2から読み取った画像であり、その外側が帳票の外側の部分に配置されていたイメージスキャナ3の読み取り台から読み取った白背景の画像である。
【0043】
図4の(b)は、エッジ強調し、帳票端を強調した様子を示す。ここでは、帳票端は、帳票2から読み取った画像の端の部分を強調したものである。
【0044】
図4の(c)は、帳票端を検出して、黒背景を付加した様子を示す。ここでは、図4の(b)で検出した帳票端の外側を黒背景を付加した画像を示す。
【0045】
図5の(d)は、画像端からスキャンして黒から白に切り替わる位置を検出し、切り替わった位置を帳票端とした様子を示す。ここでは、上辺および左辺からそれぞれスキャンして黒から白に切り替わった位置を、帳票端とそれぞれ決定する。
【0046】
図5の(e)は、帳票上で上辺と左辺が交差する位置(帳票原点)を抽出する様子を示す。帳票原点(帳票基点)は、画像上で帳票の上辺と左辺が交差する位置である。画像原点(画像基点)は、画像上で左上の位置である。
【0047】
図5の(f)は、OCR定義体に従い、画像原点からのX方向、Y方向の位置をそれぞれ算出して文字位置を決定し、文字認識する様子を示す。これは、図5の(g)に定義したOCR定義体中の
・例えば項目名Aは、帳票原点からX座標”30”、Y座標”20”の位置に、X方向サイズ”5”、Y方向サイズ”1”の領域に当該項目名Aの文字列が記載されていると判明するので、
これを画像原点からの値に変換し、図5の(f)の画像原点からの当該変換後の値の領域から項目名Aの文字認識を、周知の手法で行う。
【0048】
図5の(g)は、OCR定義体の例を示す。ここでは、帳票2上に記載されている文字列は、項目名に対応づけて帳票原点からのX座標、Y座標、X座標からのX方向サイズ、Y座標からのY方向サイズがそれぞれ定義されている。
【0049】
(付記1)
帳票の文字認識を行う文字認識システムにおいて、
帳票からイメージスキャナを用いて画像を読み取る手段と、
前記読み取った画像について、エッジ強調して帳票の用紙端を検出する手段と、
前記検出した帳票の用紙端の外側を黒画像とした帳票画像を生成する手段と、前記帳票画像の外側の黒画像から白画像に変化した位置をもとに文字認識する手段と
を備えたことを特徴とする文字認識システム。
【0050】
(付記2)
前記エッジ強調して帳票の用紙端が検出できないときに、画像のコントラストおよび必要に応じて明るさを増減して用紙端を検出することを繰り返して当該用紙端を検出する手段を備えたことを特徴とする付記1記載の文字認識システム。
【0051】
(付記3)
前記用紙端の上、下、左、右のうちのいずれか1つあるいは2つが検出できなかったときに他の検出できた位置から当該検出できなかった位置を、帳票のサイズから推定する手段を備えたことを特徴とする付記1あるいは付記2記載の文字認識システム。
【0052】
(付記4)
帳票の文字認識を行う文字認識プログラムにおいて、
帳票からイメージスキャナを用いて画像を読み取る手段と、
前記イメージスキャナで前記帳票を読み取った画像について、エッジ強調して帳票の用紙端を検出する手段と、
前記検出した帳票の用紙端の外側を黒画像とした帳票画像を生成する手段と、前記帳票画像の外側の黒画像から白画像に変化した位置をもとに文字認識する手段と
してコンピュータに機能させるための文字認識プログラム。
【0053】
【発明の効果】
以上説明したように、本発明によれば、帳票2をイメージスキャナ3で読み取ったときにエッジ強調および必要に応じてコントラスト変更して当該帳票2の各端の部分を検出あるいは推定して帳票2の外側を黒背景にした帳票画像を自動生成し、当該黒背景の帳票画像が黒から白に変化する点を基準点(帳票原点)として文字認識を行う構成を採用しているため、帳票2から外側を黒背景とした帳票画像を自動生成して文字認識を簡易かつ精度良好に実現することが可能となる。
【図面の簡単な説明】
【図1】本発明のシステム構成図である。
【図2】本発明の動作説明フローチャートである。
【図3】本発明の詳細フローチャートである。
【図4】本発明の説明図(その1)である。
【図5】本発明の説明図(その2)である。
【符号の説明】
1:処理装置
11:イメージスキャナ制御手段
12:画像格納手段
13:エッジ強調処理手段
14:コントラスト変更手段
15:帳票端検出手段
16:黒背景付加手段
17:文字認識手段
18:認識結果表示手段
2:帳票
3:イメージスキャナ
4:ディスプレイ
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a character recognition system and a character recognition program for performing character recognition of a form.
[0002]
[Prior art]
Conventionally, when a form is read with a scanner and the image is displayed on the display, the part where the characters in the form part are read and the part without the form are also displayed as white images. And the inside of the frame is read by a scanner and passed to character recognition software for character recognition of the form.
[0003]
Also, in order to determine the form origin, marks called three-point marks have to be printed on the upper left, upper right, and lower left of the form.
[0004]
[Problems to be solved by the invention]
For this reason, both the non-printed part of the form and the background part without the form become a white image. Therefore, as described above, the operator surrounds the range corresponding to the form with a frame, There is a problem that the troublesome work of recognizing the characters by reading them with a scanner becomes necessary.
[0005]
In addition, in order to determine the form origin, it is necessary to print marks called three-point marks on the upper left, upper right, and lower left of the form, which causes a problem of form restrictions.
[0006]
In order to solve these problems, the present invention detects a form at each end of the form by changing edge emphasis and contrast when the form is read by an image scanner, and forms the form with a black background outside the form. Automatic image generation, character recognition is performed using the point where the black background form image changes from black to white as a reference point, and form images with a black background outside the form are automatically generated for easy and accurate character recognition. The goal is to achieve it well.
[0007]
[Means for Solving the Problems]
Means for solving the problem will be described with reference to FIG.
[0008]
In FIG. 1, a processing device 1 executes various processes according to a program. Here, an edge enhancement processing means 13, a contrast changing means 14, a form edge detecting means 15, a black background adding means 16, a character recognizing means. 17 or the like.
[0009]
The edge enhancement processing means 13 is for enhancing the edge of the image.
The contrast changing means 14 is for changing the contrast of the image.
[0010]
The black background adding means 16 adds a black background to the outside portion of the form in the image.
[0011]
The character recognition unit 17 performs character recognition using a point as a base point (origin) by changing from a black pixel to a white pixel in the image.
[0012]
The image scanner 3 reads the form 2 and generates an image.
Next, the operation will be described.
[0013]
The image scanner 3 reads the form 3 to generate an image, the edge enhancement processing unit 13 emphasizes the edge in the image, and the form detection unit 15 detects the edge of the form (for example, upper, lower, left, right) from the image. The black background adding means 16 added a black background outside the form image in the image, and the character recognizing means 17 changed from a black pixel to a white pixel in the black background added image. Character recognition is performed using the point as the base point (origin).
[0014]
At this time, when the edge of the form cannot be detected due to edge enhancement, the contrast changing unit 14 repeatedly detects the edge of the form (paper) by increasing or decreasing the contrast of the image and brightness as necessary. The edge is detected.
[0015]
Further, when the form edge detecting means 15 cannot detect any one or two of the top, bottom, left, and right of the form (paper) edge on the image, it can detect the position from the other detectable positions. The position that did not exist is estimated from the size of the form.
[0016]
Therefore, when a form is read by an image scanner, edge enhancement and contrast change are performed to detect or estimate each end portion of the form and automatically generate a form image with the outside of the form as a black background. By performing character recognition using the point where the form image changes from black to white as a reference point, it is possible to automatically generate a form image with the black background on the outside from the form and realize character recognition simply and accurately. Become.
[0017]
DETAILED DESCRIPTION OF THE INVENTION
Next, embodiments and operations of the present invention will be sequentially described in detail with reference to FIGS.
[0018]
FIG. 1 shows a system configuration diagram of the present invention.
In FIG. 1, a processing device 1 executes various processes according to a program, and includes 11 to 18 and the like.
[0019]
The image scanner control means 11 controls the image scanner 3 to read an image from the form 2.
[0020]
The image storage means 12 temporarily stores the form image read from the image scanner 3 by the image scanner control means 11.
[0021]
The edge enhancement processing means 13 enhances the edge of the form image in the image read from the form to facilitate detection of the paper edge (edge) of the form.
[0022]
The contrast changing unit 14 changes the contrast of the paper edge (edge) of the form in the image read from the form, and changes the brightness as necessary to easily detect the paper edge (edge).
[0023]
The form edge detection means 15 detects the position of the paper edge of the form (upper, lower, right, left edge positions) from the image after edge enhancement and contrast change by the edge enhancement processing means 13 and the contrast changing means 14. Is.
[0024]
The black background adding unit 16 generates an image in which a black background is added to the outside portion of the form paper in the image detected by the form edge detecting unit 15.
[0025]
The character recognizing means 17 performs character recognition according to a well-known method, starting from the position where the black pixel is changed to the white pixel in the image with the black background added (see FIG. 5).
[0026]
The recognition result display means 18 displays the recognition result recognized by the character recognition means 17 on the display 4.
[0027]
Form 2 is a form for character recognition.
The image scanner 3 reads an image on the form 2.
[0028]
The display 4 displays the recognition result.
Next, the operation of the configuration of FIG. 1 will be described in detail according to the order of the flowchart of FIG.
[0029]
FIG. 2 shows a flowchart for explaining the operation of the present invention.
In FIG. 2, S1 stores the read image. This stores an image generated by reading the form 2 with the image scanner 3 in the work area.
[0030]
In S2, edge enhancement is performed. At this time, the contrast is changed in S3 to facilitate detection of the paper edge of the form in the image (described later with reference to FIG. 3).
[0031]
In step S4, the form edge is detected. In this case, edge enhancement is performed in S2, contrast is changed in S3, and the positions (edge positions on the top, bottom, left, and right) of the paper edge of the form are detected. When one or two of the top, bottom, left, and right edges of the sheet cannot be detected, the position is estimated from the other detected positions.
[0032]
S5 adds a black background. This generates an image with a black background added to the outside of the form sheet detected in S4.
[0033]
S6 recognizes characters. This is based on the point that changes from a black pixel to a white pixel in the image added with a black background in S5, and performs well-known character recognition (see FIG. 5). The result of character recognition is output as character recognition data.
[0034]
By the above, edge enhancement and contrast change of the image read from the form 2 with the image scanner 3 are detected to detect the edge (edge) of the form, and an image with a black background added to the outside of the detected edge of the form is generated. Characters on the form can be recognized based on the point where the black pixel is changed to the white pixel in the generated image.
[0035]
FIG. 4 shows a detailed flowchart of the present invention.
In FIG. 4, the contrast is initially set in S11. This sets the contrast when reading from a form by the image scanner 3 to a default initial setting value.
[0036]
In step S12, an image is read. This is the contrast of the initial setting value in S11 or the contrast after the contrast value is changed in S21, and the image scanner 3 reads the image of the form 2.
[0037]
In step S13, edge enhancement processing is performed. This performs processing for emphasizing the edge (paper edge) of the form for the image read in S12.
[0038]
S14 detects an upper side, a left side, a right side, and a lower side.
In step S15, it is determined whether the upper side and the left side are detected. In the case of YES, the intersection of the upper side and the left side of the form edge detected in S16 is detected, and the process proceeds to S17. On the other hand, in the case of NO in S15, since the upper side and the left side could not be detected, the contrast value is changed in S21 and S12 and subsequent steps are repeated.
[0039]
In S17, it is determined whether or not the intersection is in the image. This is to determine whether the intersection of the upper side and the left side of the form detected in YES of S15 is in the image, that is, whether the intersection of the upper side and the left side of the form is included in the image read by the image scanner 3. In the case of YES, an image with a black background added (added a black background outside the form in the image) is generated in S18, and character recognition (a point changed from a black pixel to a white pixel in the image is used as a base point in S19). , Well-known character recognition) is performed, and the process proceeds to S20. On the other hand, in the case of NO in S17, it is found that the intersection is not in the image, that is, the image of the form is not included in the image, and the detection position of the edge (edge) of the form is found to be erroneous detection. Therefore, the contrast value is changed in S21, and S12 and subsequent steps are repeated.
[0040]
In S20, it is determined whether a character recognition error has occurred. This is determined as an error as a result of the character recognition in S19. In the case of YES, since it is found that the edge of the form in the image is erroneously detected, the contrast value is changed in S21, and S12 and subsequent steps are repeated. On the other hand, in the case of NO in S20, it is determined that the character recognition error has not occurred and the character recognition has been normally performed, and thus the process ends.
[0041]
As described above, the contrast of reading the image of the form 2 by the image scanner 3 is changed, and the edge of the image read from the form 2 is edge-enhanced to detect the edge of the form from the image, and the intersection of the upper side and the left side is the image. It is determined that the sides of the normal form can be detected when it is inside, and an image with a black background added to the outside of the detected form is generated, and the point that changes from the black pixel to the white pixel on the image is the base point Thus, it is possible to recognize characters accurately and with good accuracy.
[0042]
4 and 5 are explanatory diagrams of the present invention.
In FIG. 4A, an image is read. This takes in the image read from the form 2 by controlling the image scanner 3 shown in FIG. Here, the central rectangular portion is an image read from the form 2, and the outside is an image of a white background read from the reading stand of the image scanner 3 arranged in the outer portion of the form.
[0043]
FIG. 4B shows a state in which the edge is emphasized and the form edge is emphasized. Here, the form edge emphasizes the edge part of the image read from the form 2.
[0044]
FIG. 4C shows a state in which a form edge is detected and a black background is added. Here, an image is shown in which a black background is added to the outside of the form edge detected in FIG.
[0045]
FIG. 5D shows a state in which a position where scanning is switched from black to white is detected from the edge of the image, and the position where the switching is performed is used as a form edge. Here, the positions at which the scan is switched from black to white by scanning from the upper side and the left side are respectively determined as the form edges.
[0046]
FIG. 5E shows a state where a position (form origin) where the upper side and the left side intersect on the form is extracted. The form origin (form base point) is a position where the upper side and the left side of the form intersect on the image. The image origin (image base point) is the upper left position on the image.
[0047]
(F) of FIG. 5 shows a state in which the character position is determined by calculating the position in the X direction and the Y direction from the image origin in accordance with the OCR definition body to determine the character position. This is because, for example, the item name A in the OCR definition defined in FIG. 5G is located at the X coordinate “30”, Y coordinate “20” from the form origin at the X direction size “5”, Y Since it turns out that the character string of the item name A is described in the area of the direction size “1”,
This is converted into a value from the image origin, and the character recognition of the item name A is performed by a well-known method from the region of the converted value from the image origin in FIG.
[0048]
FIG. 5G shows an example of an OCR definition body. Here, the character string described on the form 2 is defined with the X coordinate from the form origin, the Y coordinate, the X direction size from the X coordinate, and the Y direction size from the Y coordinate in association with the item name. ing.
[0049]
(Appendix 1)
In a character recognition system that performs character recognition of forms,
Means for reading an image from a form using an image scanner;
Means for detecting the paper edge of the form with edge enhancement for the read image;
Means for generating a form image in which the outside of the paper edge of the detected form is a black image, and means for recognizing characters based on a position where the black image outside the form image has changed to a white image. Character recognition system characterized by
[0050]
(Appendix 2)
When the edge of the form cannot be detected by edge enhancement, means for detecting the edge of the sheet by repeatedly detecting the edge of the sheet by increasing / decreasing the image contrast and brightness as necessary is provided. The character recognition system according to appendix 1, which is characterized.
[0051]
(Appendix 3)
Means for estimating, based on the size of the form, the position that could not be detected from the other detected positions when any one or two of the top, bottom, left, and right of the paper edge could not be detected; The character recognition system according to Supplementary Note 1 or Supplementary Note 2, which is provided.
[0052]
(Appendix 4)
In a character recognition program that performs character recognition on forms,
Means for reading an image from a form using an image scanner;
Means for detecting the edge of the form by emphasizing the edge of the image read by the image scanner;
Let the computer function as means for generating a form image in which the outside of the paper edge of the detected form is a black image, and means for recognizing characters based on the position where the black image outside the form image has changed to a white image Character recognition program.
[0053]
【The invention's effect】
As described above, according to the present invention, when the form 2 is read by the image scanner 3, edge enhancement and contrast change as necessary are performed to detect or estimate each end portion of the form 2 to thereby detect the form 2. Since a form image having a black background outside is automatically generated and character recognition is performed using a point where the black background form image changes from black to white as a reference point (form origin), form 2 is used. From this, it is possible to automatically generate a form image with the outside as a black background to realize character recognition simply and with good accuracy.
[Brief description of the drawings]
FIG. 1 is a system configuration diagram of the present invention.
FIG. 2 is a flowchart explaining the operation of the present invention.
FIG. 3 is a detailed flowchart of the present invention.
FIG. 4 is an explanatory diagram (part 1) of the present invention.
FIG. 5 is an explanatory diagram (part 2) of the present invention.
[Explanation of symbols]
1: Processing device 11: Image scanner control means 12: Image storage means 13: Edge enhancement processing means 14: Contrast change means 15: Form edge detection means 16: Black background addition means 17: Character recognition means 18: Recognition result display means 2 : Form 3: Image scanner 4: Display

Claims (4)

帳票の文字認識を行う文字認識システムにおいて、
帳票からイメージスキャナを用いて当該帳票の全体を含む画像を読み取る手段と、
前記読み取った前記帳票の全体を含む画像について、エッジ強調して帳票の上辺、左辺、下辺、および右辺の用紙端を検出する手段と、
前記検出した用紙端の上辺、左辺、下辺、および右辺について隣接するものの交点が前記読み取った画像内に含まれるときに正しいと判定、一方、含まれないときに誤検出と判定する手段と、
前記正しいと判定された帳票の用紙端の上辺、左辺、下辺、および上辺の外側を黒画素とした帳票画像を生成する手段と、
前記帳票画像の外側の黒画素から白画素に変化する用紙端の上辺、左辺、下辺、および上辺について隣接するものの交点を基点として文字認識する手段とを備えたことを特徴とする文字認識システム。
In a character recognition system that performs character recognition of forms,
Means for reading an image including the entire form from the form using an image scanner;
For the image including the whole of the read form, means for edge detection to detect the upper edge , the left edge , the lower edge , and the right edge of the form;
Means for determining that the intersections of the upper side, the left side, the lower side, and the right side adjacent to the detected paper edge are correct when included in the read image, while determining that it is a false detection when not included;
Means for generating a form image with black pixels on the upper side, left side, lower side, and upper side of the paper edge of the form determined to be correct ;
A character recognition system comprising: character recognition means based on intersections of adjacent ones of the upper side, left side, lower side, and upper side of the paper edge that change from black pixels to white pixels outside the form image.
前記誤検出と判定された場合に、画像のコントラスト値および明るさのいずれか一方あるいは両者を増減して用紙端を検出することを繰り返して当該用紙端を検出する手段を備えたことを特徴とする請求項1記載の文字認識システム。 And a means for detecting the paper edge by repeatedly increasing or decreasing either or both of the contrast value and the brightness of the image and detecting the paper edge when it is determined as the erroneous detection. The character recognition system according to claim 1. 前記帳票の用紙端の上辺、左辺、下辺、および右辺のいずれかが検出されなかった場合には、当該帳票のサイズをもとに他のものから検出できなかった用紙端を推定する手段を備えたことを特徴とする請求項1あるいは請求項2記載の文字認識システム。When any of the upper side, the left side, the lower side, and the right side of the paper edge of the form is not detected, means for estimating the paper edge that could not be detected from the other based on the size of the form The character recognition system according to claim 1 or claim 2, wherein 帳票の文字認識を行う文字認識プログラムにおいて、
帳票からイメージスキャナを用いて当該帳票の全体を含む画像を読み取る手段と、
前記読み取った前記帳票の全体を含む画像について、エッジ強調して帳票の上辺、左辺、下辺、および右辺の用紙端を検出する手段と、
前記検出した用紙端の上辺、左辺、下辺、および右辺について隣接するものの交点が前記読み取った画像内に含まれるときに正しいと判定、一方、含まれないときに誤検出と判定する手段と、
前記正しいと判定された帳票の用紙端の上辺、左辺、下辺、および上辺の外側を黒画素とした帳票画像を生成する手段と、
前記帳票画像の外側の黒画素から白画素に変化する用紙端の上辺、左辺、下辺、および上辺について隣接するものの交点を基点として文字認識する手段としてコンピュータに機能させるための文字認識プログラム。
In a character recognition program that performs character recognition on forms,
Means for reading an image including the entire form from the form using an image scanner;
For the image including the whole of the read form, means for edge detection to detect the upper edge , the left edge , the lower edge , and the right edge of the form;
Means for determining that the intersections of the upper side, the left side, the lower side, and the right side adjacent to the detected paper edge are correct when included in the read image, while determining that it is a false detection when not included;
Means for generating a form image with black pixels on the upper side, left side, lower side, and upper side of the paper edge of the form determined to be correct ;
A character recognition program for causing a computer to function as means for recognizing characters based on intersections of adjacent top and left sides, bottom sides, and top sides of a paper edge changing from black pixels to white pixels outside the form image.
JP2002159690A 2002-05-31 2002-05-31 Character recognition system and character recognition program Expired - Fee Related JP4194301B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002159690A JP4194301B2 (en) 2002-05-31 2002-05-31 Character recognition system and character recognition program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002159690A JP4194301B2 (en) 2002-05-31 2002-05-31 Character recognition system and character recognition program

Publications (2)

Publication Number Publication Date
JP2004005177A JP2004005177A (en) 2004-01-08
JP4194301B2 true JP4194301B2 (en) 2008-12-10

Family

ID=30429364

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002159690A Expired - Fee Related JP4194301B2 (en) 2002-05-31 2002-05-31 Character recognition system and character recognition program

Country Status (1)

Country Link
JP (1) JP4194301B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20240177123A1 (en) * 2015-09-30 2024-05-30 Groupon, Inc. Optical receipt processing

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4598426B2 (en) * 2004-03-30 2010-12-15 富士通株式会社 Boundary extraction method, program, and apparatus using the same
JP6981140B2 (en) * 2017-09-26 2021-12-15 株式会社リコー Image processing equipment, image processing methods, and programs

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20240177123A1 (en) * 2015-09-30 2024-05-30 Groupon, Inc. Optical receipt processing
US12361393B2 (en) * 2015-09-30 2025-07-15 Bytedance Inc. Optical receipt processing

Also Published As

Publication number Publication date
JP2004005177A (en) 2004-01-08

Similar Documents

Publication Publication Date Title
US8422773B2 (en) Image zone detecting using color gradation levels, method, apparatus and computer readable medium
JPH03144863A (en) Image tilt detection method and correction method, and image information processing device
JP2005073015A (en) Image processing apparatus, image processing method, and computer program
JPH0535938A (en) Picture processor
JPH08287184A (en) Image cropping device and character recognition device
JP4574503B2 (en) Image processing apparatus, image processing method, and program
US20070172123A1 (en) Image processing apparatus, image processing method and computer readable medium
JP4194301B2 (en) Character recognition system and character recognition program
JP3582988B2 (en) Non-contact image reader
JP6883199B2 (en) Image processor, image reader, and program
JP2012073769A (en) Musical score recognition device and computer program
JPH03263282A (en) Character segmenting method for character reader
JP7532124B2 (en) Information processing device, information processing method, and program
JPH117493A (en) Character recognition processor
JP2000011192A (en) Image registration method
JPH07160814A (en) Optical character recognition method
JPH04156694A (en) Character recognition system
JP2004318896A (en) Non-contact image reader
JP2636866B2 (en) Information processing method
JP3334369B2 (en) Selection item recognition device
JPH0573718A (en) Area attribute identification method
JP4270767B2 (en) Ruled line information processing method, ruled line information processing program, image processing apparatus, and storage medium
JPH0758927A (en) Picture data creation device
JP3221969B2 (en) Character recognition device
JPH05128305A (en) Area division method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050324

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080624

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080821

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080916

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080922

R150 Certificate of patent or registration of utility model

Ref document number: 4194301

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111003

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111003

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121003

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121003

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131003

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees