JP4194301B2 - Character recognition system and character recognition program - Google Patents
Character recognition system and character recognition program Download PDFInfo
- Publication number
- JP4194301B2 JP4194301B2 JP2002159690A JP2002159690A JP4194301B2 JP 4194301 B2 JP4194301 B2 JP 4194301B2 JP 2002159690 A JP2002159690 A JP 2002159690A JP 2002159690 A JP2002159690 A JP 2002159690A JP 4194301 B2 JP4194301 B2 JP 4194301B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- edge
- character recognition
- upper side
- detected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Input (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、帳票の文字認識を行う文字認識システムおよび文字認識プログラムに関するものである。
【0002】
【従来の技術】
従来、帳票をスキャナにて読み取ってイメージをディスプレイ上に表示すると、帳票部分の文字が読み取られた部分と、帳票のない部分も白画像として表示されてしまうので、オペレータが文字認識する範囲を枠で囲み、当該枠内をスキャナーで読み取って文字認識ソフトに渡して当該帳票の文字認識を行うようにしていた。
【0003】
また、帳票原点を決定するため、3点マークと呼ばれるマークを帳票の左上、右上、左下に印刷する必要があった。
【0004】
【発明が解決しようとする課題】
このため、帳票の文字の印刷されていない部分と、帳票のない背景部分とが共に白画像となってしまうため、上述したようにオペレータが帳票に相当する範囲を枠で囲んで当該枠の内部をスキャナで読み取って文字認識するという面倒な作業が必要となってしまうなどの問題があった。
【0005】
また、帳票原点を決定するため、3点マークと呼ばれるマークを帳票の左上、右上、左下に印刷する必要があり、帳票の制約が生じるという問題もあった。
【0006】
本発明は、これらの問題を解決するため、帳票をイメージスキャナで読み取ったときにエッジ強調およびコントラスト変更して当該帳票の各端の部分を検出あるいは推定して帳票の外側を黒背景にした帳票画像を自動生成し、当該黒背景の帳票画像が黒から白に変化する点を基準点として文字認識を行い、帳票から外側を黒背景とした帳票画像を自動生成して文字認識を簡易かつ精度良好に実現することを目的としている。
【0007】
【課題を解決するための手段】
図1を参照して課題を解決するための手段を説明する。
【0008】
図1において、処理装置1は、プログラムに従い各種処理を実行するものであって、ここでは、エッジ強調処理手段13、コントラスト変更手段14、帳票端検出手段15、黒背景付加手段16、文字認識手段17などから構成されるものである。
【0009】
エッジ強調処理手段13は、画像のエッジを強調するものである。
コントラスト変更手段14は、画像のコントラストを変更するものである。
【0010】
黒背景付加手段16は、画像中の帳票の外側の部分に黒背景を付加するものである。
【0011】
文字認識手段17は、画像中の黒画素から白画素に変化して点を基点(原点)に、文字認識を行うものである。
【0012】
イメージスキャナ3は、帳票2を読み取って画像を生成するものである。
次に、動作を説明する。
【0013】
イメージスキャナ3によって帳票3を読み取って画像を生成し、エッジ強調処理手段13が当該画像中のエッジを強調し、帳票検出手段15が画像中から帳票の端(例えば上、下、左、右の各端)を検出し、黒背景付加手段16が画像中の帳票の画像の外側に黒背景を付加し、文字認識手段17が黒背景の付加された画像中で黒画素から白画素に変化した点を基点(原点)に、文字認識を行うようにしている。
【0014】
この際、エッジ強調して帳票の用紙端が検出できないときに、コントラスト変更手段14が画像のコントラストおよび必要に応じて明るさを増減して帳票(用紙)の端を検出することを繰り返して用紙端を検出するようにしている。
【0015】
また、帳票端検出手段15が画像上で帳票(用紙)端の上、下、左、右のうちのいずれか1つあるいは2つが検出できなかったときに他の検出できた位置から当該検出できなかった位置を、帳票のサイズから推定するようにしている。
【0016】
従って、帳票をイメージスキャナで読み取ったときにエッジ強調およびコントラスト変更して当該帳票の各端の部分を検出あるいは推定して帳票の外側を黒背景にした帳票画像を自動生成し、当該黒背景の帳票画像が黒から白に変化する点を基準点として文字認識を行うことにより、帳票から外側を黒背景とした帳票画像を自動生成して文字認識を簡易かつ精度良好に実現することが可能となる。
【0017】
【発明の実施の形態】
次に、図1から図5を用いて本発明の実施の形態および動作を順次詳細に説明する。
【0018】
図1は、本発明のシステム構成図を示す。
図1において、処理装置1は、プログラムに従い各種処理を実行するものであって、11ないし18などから構成されるものである。
【0019】
イメージスキャナ制御手段11は、イメージスキャナ3を制御して帳票2から画像を読み取るものである。
【0020】
画像格納手段12は、イメージスキャナ制御手段11によってイメージスキャナ3から読み取られた帳票の画像を一時的に格納するものである。
【0021】
エッジ強調処理手段13は、帳票から読み取った画像中の帳票画像のエッジを強調して当該帳票の用紙端(エッジ)を検出し易くするものである。
【0022】
コントラスト変更手段14は、帳票から読み取った画像中の帳票の用紙端(エッジ)のコントラストを変更および必要に応じて明るさを変更して当該用紙端(エッジ)を検出し易くするものである。
【0023】
帳票端検出手段15は、エッジ強調処理手段13およびコントラスト変更手段14によってエッジ強調、コントラスト変更した後の画像から帳票の用紙端の位置(上、下、右、左の端の位置)を検出するものである。
【0024】
黒背景付加手段16は、帳票端検出手段15によって検出された画像中の帳票の用紙の外側の部分に、黒背景を付加した画像を生成するものである。
【0025】
文字認識手段17は、黒背景を付加した画像中で、黒画素から白画素に変化する位置を基点として、周知の手法に従い、文字認識を行うものである(図5参照)。
【0026】
認識結果表示手段18は、文字認識手段17で文字認識された認識結果を、ディスプレイ4上に表示するものである。
【0027】
帳票2は、文字認識の対象の帳票である。
イメージスキャナ3は、帳票2の画像を読み取るものである。
【0028】
ディスプレイ4は、認識結果を表示するものである。
次に、図2のフローチャートの順番に従い、図1の構成の動作を詳細に説明する。
【0029】
図2は、本発明の動作説明フローチャートを示す。
図2において、S1は、読み取り画像を保存する。これは、帳票2をイメージスキャナ3で読み取って生成した画像を作業域に保存する。
【0030】
S2は、エッジ強調する。この際、S3でコントラスト変更を行い、画像中の帳票の用紙端が検出し易くする(図3を用いて後述する)。
【0031】
S4は、帳票端を検出する。これは、S2でエッジ強調、S3でコントラスト変更し、帳票の用紙の端(エッジ部分)の位置(用紙の上、下、左、右の位置)をそれぞれ検出する。尚、用紙の端の上下左右のうち1つあるいは2つが検出できないときは他の検出できた位置から推定する。
【0032】
S5は、黒背景を付加する。これは、S4で検出した帳票の用紙の外側に、黒背景を付加した画像を生成する。
【0033】
S6は、文字認識する。これは、S5で黒背景の付加された画像中で、黒画素から白画素に変化する点を基点にし、周知の文字認識を行う(図5参照)。そして、文字認識した結果を、文字認識データとして出力する。
【0034】
以上によって、帳票2からイメージスキャナ3で読み取った画像のエッジ強調、コントラスト変更して帳票の端(エッジ)を検出し、当該検出した帳票の端の外側に黒背景を付加した画像を生成し、当該生成した画像中で黒画素から白画素に変わる点を基点にして、帳票上の文字認識することが可能となる。
【0035】
図4は、本発明の詳細フローチャートを示す。
図4において、S11は、コントラスト初期設定する。これは、帳票からイメージスキャナ3で読み取るときのコントラストをデフォルトの初期設定値に設定する。
【0036】
S12は、画像読み取りする。これは、S11で初期設定値のコントラスト、あるいはS21でコントラスト値変更された後のコントラストで、イメージスキャナ3で帳票2の画像を読み取る。
【0037】
S13は、エッジ強調処理を行う。これはS12で読み取った画像について、帳票のエッジ(用紙端)を強調する処理を行う。
【0038】
S14は、上辺、左辺、右辺、下辺を検出する。
S15は、上辺、左辺が検出できたか判別する。YESの場合には、S16で検出した帳票端の上辺、左辺の交点を検出し、S17に進む。一方、S15のNOの場合には、上辺、左辺が検出できなかったのでS21でコントラスト値を変更してS12以降を繰り返す。
【0039】
S17は、交点が画像内にあるか判別する。これは、S15のYESで検出した帳票の上辺と左辺との交点が、画像内にある、即ち、帳票の上辺と左辺の交点がイメージスキャナ3で読み取った画像内に含まれるか判別する。YESの場合には、S18で黒背景付加(画像中の帳票の外側に黒背景を付加)した画像を生成し、S19で文字認識(画像中で黒画素から白画素に変化した点を基点として、周知の文字認識)を行い、S20に進む。一方、S17のNOの場合には、交点が画像内にない、即ち、画像内に帳票の画像が全部含まれていないと判明し、帳票の端(エッジ)の検出位置が誤検出と判明したので、S21でコントラスト値変更し、S12以降を繰り返す。
【0040】
S20は、文字認識エラーか判別する。これは、S19の文字認識の結果、エラーか判別する。YESの場合には、画像中の帳票のエッジ(端)の誤検出と判明したので、S21でコントラスト値変更してS12以降を繰り返す。一方、S20のNOの場合には、文字認識エラーが発生しなく、正常に文字認識されたと判明したので、終了する。
【0041】
以上によって、イメージスキャナ3で帳票2の画像を読み取るコントラストを変更して当該帳票2から読み取った画像についてエッジ強調して画像中から帳票のエッジ(端)を検出し、上辺と左辺の交点が画像内にあるときに正常な帳票の辺の検出ができたと判定し、当該検出した帳票の外側に黒背景を付加した画像を生成し、当該画像上で黒画素から白画素に変化する点を基点にして文字認識することにより、正確かつ精度良好に文字認識することが可能となる。
【0042】
図4および図5は、本発明の説明図を示す。
図4の(a)は、画像を読み込む。これは、既述した図1のイメージスキャナ3を制御して帳票2から読み取った画像を取り込む。ここでは、中央の矩形の部分が帳票2から読み取った画像であり、その外側が帳票の外側の部分に配置されていたイメージスキャナ3の読み取り台から読み取った白背景の画像である。
【0043】
図4の(b)は、エッジ強調し、帳票端を強調した様子を示す。ここでは、帳票端は、帳票2から読み取った画像の端の部分を強調したものである。
【0044】
図4の(c)は、帳票端を検出して、黒背景を付加した様子を示す。ここでは、図4の(b)で検出した帳票端の外側を黒背景を付加した画像を示す。
【0045】
図5の(d)は、画像端からスキャンして黒から白に切り替わる位置を検出し、切り替わった位置を帳票端とした様子を示す。ここでは、上辺および左辺からそれぞれスキャンして黒から白に切り替わった位置を、帳票端とそれぞれ決定する。
【0046】
図5の(e)は、帳票上で上辺と左辺が交差する位置(帳票原点)を抽出する様子を示す。帳票原点(帳票基点)は、画像上で帳票の上辺と左辺が交差する位置である。画像原点(画像基点)は、画像上で左上の位置である。
【0047】
図5の(f)は、OCR定義体に従い、画像原点からのX方向、Y方向の位置をそれぞれ算出して文字位置を決定し、文字認識する様子を示す。これは、図5の(g)に定義したOCR定義体中の
・例えば項目名Aは、帳票原点からX座標”30”、Y座標”20”の位置に、X方向サイズ”5”、Y方向サイズ”1”の領域に当該項目名Aの文字列が記載されていると判明するので、
これを画像原点からの値に変換し、図5の(f)の画像原点からの当該変換後の値の領域から項目名Aの文字認識を、周知の手法で行う。
【0048】
図5の(g)は、OCR定義体の例を示す。ここでは、帳票2上に記載されている文字列は、項目名に対応づけて帳票原点からのX座標、Y座標、X座標からのX方向サイズ、Y座標からのY方向サイズがそれぞれ定義されている。
【0049】
(付記1)
帳票の文字認識を行う文字認識システムにおいて、
帳票からイメージスキャナを用いて画像を読み取る手段と、
前記読み取った画像について、エッジ強調して帳票の用紙端を検出する手段と、
前記検出した帳票の用紙端の外側を黒画像とした帳票画像を生成する手段と、前記帳票画像の外側の黒画像から白画像に変化した位置をもとに文字認識する手段と
を備えたことを特徴とする文字認識システム。
【0050】
(付記2)
前記エッジ強調して帳票の用紙端が検出できないときに、画像のコントラストおよび必要に応じて明るさを増減して用紙端を検出することを繰り返して当該用紙端を検出する手段を備えたことを特徴とする付記1記載の文字認識システム。
【0051】
(付記3)
前記用紙端の上、下、左、右のうちのいずれか1つあるいは2つが検出できなかったときに他の検出できた位置から当該検出できなかった位置を、帳票のサイズから推定する手段を備えたことを特徴とする付記1あるいは付記2記載の文字認識システム。
【0052】
(付記4)
帳票の文字認識を行う文字認識プログラムにおいて、
帳票からイメージスキャナを用いて画像を読み取る手段と、
前記イメージスキャナで前記帳票を読み取った画像について、エッジ強調して帳票の用紙端を検出する手段と、
前記検出した帳票の用紙端の外側を黒画像とした帳票画像を生成する手段と、前記帳票画像の外側の黒画像から白画像に変化した位置をもとに文字認識する手段と
してコンピュータに機能させるための文字認識プログラム。
【0053】
【発明の効果】
以上説明したように、本発明によれば、帳票2をイメージスキャナ3で読み取ったときにエッジ強調および必要に応じてコントラスト変更して当該帳票2の各端の部分を検出あるいは推定して帳票2の外側を黒背景にした帳票画像を自動生成し、当該黒背景の帳票画像が黒から白に変化する点を基準点(帳票原点)として文字認識を行う構成を採用しているため、帳票2から外側を黒背景とした帳票画像を自動生成して文字認識を簡易かつ精度良好に実現することが可能となる。
【図面の簡単な説明】
【図1】本発明のシステム構成図である。
【図2】本発明の動作説明フローチャートである。
【図3】本発明の詳細フローチャートである。
【図4】本発明の説明図(その1)である。
【図5】本発明の説明図(その2)である。
【符号の説明】
1:処理装置
11:イメージスキャナ制御手段
12:画像格納手段
13:エッジ強調処理手段
14:コントラスト変更手段
15:帳票端検出手段
16:黒背景付加手段
17:文字認識手段
18:認識結果表示手段
2:帳票
3:イメージスキャナ
4:ディスプレイ[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a character recognition system and a character recognition program for performing character recognition of a form.
[0002]
[Prior art]
Conventionally, when a form is read with a scanner and the image is displayed on the display, the part where the characters in the form part are read and the part without the form are also displayed as white images. And the inside of the frame is read by a scanner and passed to character recognition software for character recognition of the form.
[0003]
Also, in order to determine the form origin, marks called three-point marks have to be printed on the upper left, upper right, and lower left of the form.
[0004]
[Problems to be solved by the invention]
For this reason, both the non-printed part of the form and the background part without the form become a white image. Therefore, as described above, the operator surrounds the range corresponding to the form with a frame, There is a problem that the troublesome work of recognizing the characters by reading them with a scanner becomes necessary.
[0005]
In addition, in order to determine the form origin, it is necessary to print marks called three-point marks on the upper left, upper right, and lower left of the form, which causes a problem of form restrictions.
[0006]
In order to solve these problems, the present invention detects a form at each end of the form by changing edge emphasis and contrast when the form is read by an image scanner, and forms the form with a black background outside the form. Automatic image generation, character recognition is performed using the point where the black background form image changes from black to white as a reference point, and form images with a black background outside the form are automatically generated for easy and accurate character recognition. The goal is to achieve it well.
[0007]
[Means for Solving the Problems]
Means for solving the problem will be described with reference to FIG.
[0008]
In FIG. 1, a processing device 1 executes various processes according to a program. Here, an edge enhancement processing means 13, a contrast changing
[0009]
The edge enhancement processing means 13 is for enhancing the edge of the image.
The contrast changing
[0010]
The black
[0011]
The
[0012]
The
Next, the operation will be described.
[0013]
The
[0014]
At this time, when the edge of the form cannot be detected due to edge enhancement, the
[0015]
Further, when the form edge detecting means 15 cannot detect any one or two of the top, bottom, left, and right of the form (paper) edge on the image, it can detect the position from the other detectable positions. The position that did not exist is estimated from the size of the form.
[0016]
Therefore, when a form is read by an image scanner, edge enhancement and contrast change are performed to detect or estimate each end portion of the form and automatically generate a form image with the outside of the form as a black background. By performing character recognition using the point where the form image changes from black to white as a reference point, it is possible to automatically generate a form image with the black background on the outside from the form and realize character recognition simply and accurately. Become.
[0017]
DETAILED DESCRIPTION OF THE INVENTION
Next, embodiments and operations of the present invention will be sequentially described in detail with reference to FIGS.
[0018]
FIG. 1 shows a system configuration diagram of the present invention.
In FIG. 1, a processing device 1 executes various processes according to a program, and includes 11 to 18 and the like.
[0019]
The image scanner control means 11 controls the
[0020]
The image storage means 12 temporarily stores the form image read from the
[0021]
The edge enhancement processing means 13 enhances the edge of the form image in the image read from the form to facilitate detection of the paper edge (edge) of the form.
[0022]
The
[0023]
The form edge detection means 15 detects the position of the paper edge of the form (upper, lower, right, left edge positions) from the image after edge enhancement and contrast change by the edge enhancement processing means 13 and the
[0024]
The black
[0025]
The character recognizing means 17 performs character recognition according to a well-known method, starting from the position where the black pixel is changed to the white pixel in the image with the black background added (see FIG. 5).
[0026]
The recognition result display means 18 displays the recognition result recognized by the character recognition means 17 on the display 4.
[0027]
The
[0028]
The display 4 displays the recognition result.
Next, the operation of the configuration of FIG. 1 will be described in detail according to the order of the flowchart of FIG.
[0029]
FIG. 2 shows a flowchart for explaining the operation of the present invention.
In FIG. 2, S1 stores the read image. This stores an image generated by reading the
[0030]
In S2, edge enhancement is performed. At this time, the contrast is changed in S3 to facilitate detection of the paper edge of the form in the image (described later with reference to FIG. 3).
[0031]
In step S4, the form edge is detected. In this case, edge enhancement is performed in S2, contrast is changed in S3, and the positions (edge positions on the top, bottom, left, and right) of the paper edge of the form are detected. When one or two of the top, bottom, left, and right edges of the sheet cannot be detected, the position is estimated from the other detected positions.
[0032]
S5 adds a black background. This generates an image with a black background added to the outside of the form sheet detected in S4.
[0033]
S6 recognizes characters. This is based on the point that changes from a black pixel to a white pixel in the image added with a black background in S5, and performs well-known character recognition (see FIG. 5). The result of character recognition is output as character recognition data.
[0034]
By the above, edge enhancement and contrast change of the image read from the
[0035]
FIG. 4 shows a detailed flowchart of the present invention.
In FIG. 4, the contrast is initially set in S11. This sets the contrast when reading from a form by the
[0036]
In step S12, an image is read. This is the contrast of the initial setting value in S11 or the contrast after the contrast value is changed in S21, and the
[0037]
In step S13, edge enhancement processing is performed. This performs processing for emphasizing the edge (paper edge) of the form for the image read in S12.
[0038]
S14 detects an upper side, a left side, a right side, and a lower side.
In step S15, it is determined whether the upper side and the left side are detected. In the case of YES, the intersection of the upper side and the left side of the form edge detected in S16 is detected, and the process proceeds to S17. On the other hand, in the case of NO in S15, since the upper side and the left side could not be detected, the contrast value is changed in S21 and S12 and subsequent steps are repeated.
[0039]
In S17, it is determined whether or not the intersection is in the image. This is to determine whether the intersection of the upper side and the left side of the form detected in YES of S15 is in the image, that is, whether the intersection of the upper side and the left side of the form is included in the image read by the
[0040]
In S20, it is determined whether a character recognition error has occurred. This is determined as an error as a result of the character recognition in S19. In the case of YES, since it is found that the edge of the form in the image is erroneously detected, the contrast value is changed in S21, and S12 and subsequent steps are repeated. On the other hand, in the case of NO in S20, it is determined that the character recognition error has not occurred and the character recognition has been normally performed, and thus the process ends.
[0041]
As described above, the contrast of reading the image of the
[0042]
4 and 5 are explanatory diagrams of the present invention.
In FIG. 4A, an image is read. This takes in the image read from the
[0043]
FIG. 4B shows a state in which the edge is emphasized and the form edge is emphasized. Here, the form edge emphasizes the edge part of the image read from the
[0044]
FIG. 4C shows a state in which a form edge is detected and a black background is added. Here, an image is shown in which a black background is added to the outside of the form edge detected in FIG.
[0045]
FIG. 5D shows a state in which a position where scanning is switched from black to white is detected from the edge of the image, and the position where the switching is performed is used as a form edge. Here, the positions at which the scan is switched from black to white by scanning from the upper side and the left side are respectively determined as the form edges.
[0046]
FIG. 5E shows a state where a position (form origin) where the upper side and the left side intersect on the form is extracted. The form origin (form base point) is a position where the upper side and the left side of the form intersect on the image. The image origin (image base point) is the upper left position on the image.
[0047]
(F) of FIG. 5 shows a state in which the character position is determined by calculating the position in the X direction and the Y direction from the image origin in accordance with the OCR definition body to determine the character position. This is because, for example, the item name A in the OCR definition defined in FIG. 5G is located at the X coordinate “30”, Y coordinate “20” from the form origin at the X direction size “5”, Y Since it turns out that the character string of the item name A is described in the area of the direction size “1”,
This is converted into a value from the image origin, and the character recognition of the item name A is performed by a well-known method from the region of the converted value from the image origin in FIG.
[0048]
FIG. 5G shows an example of an OCR definition body. Here, the character string described on the
[0049]
(Appendix 1)
In a character recognition system that performs character recognition of forms,
Means for reading an image from a form using an image scanner;
Means for detecting the paper edge of the form with edge enhancement for the read image;
Means for generating a form image in which the outside of the paper edge of the detected form is a black image, and means for recognizing characters based on a position where the black image outside the form image has changed to a white image. Character recognition system characterized by
[0050]
(Appendix 2)
When the edge of the form cannot be detected by edge enhancement, means for detecting the edge of the sheet by repeatedly detecting the edge of the sheet by increasing / decreasing the image contrast and brightness as necessary is provided. The character recognition system according to appendix 1, which is characterized.
[0051]
(Appendix 3)
Means for estimating, based on the size of the form, the position that could not be detected from the other detected positions when any one or two of the top, bottom, left, and right of the paper edge could not be detected; The character recognition system according to Supplementary Note 1 or
[0052]
(Appendix 4)
In a character recognition program that performs character recognition on forms,
Means for reading an image from a form using an image scanner;
Means for detecting the edge of the form by emphasizing the edge of the image read by the image scanner;
Let the computer function as means for generating a form image in which the outside of the paper edge of the detected form is a black image, and means for recognizing characters based on the position where the black image outside the form image has changed to a white image Character recognition program.
[0053]
【The invention's effect】
As described above, according to the present invention, when the
[Brief description of the drawings]
FIG. 1 is a system configuration diagram of the present invention.
FIG. 2 is a flowchart explaining the operation of the present invention.
FIG. 3 is a detailed flowchart of the present invention.
FIG. 4 is an explanatory diagram (part 1) of the present invention.
FIG. 5 is an explanatory diagram (part 2) of the present invention.
[Explanation of symbols]
1: Processing device 11: Image scanner control means 12: Image storage means 13: Edge enhancement processing means 14: Contrast change means 15: Form edge detection means 16: Black background addition means 17: Character recognition means 18: Recognition result display means 2 : Form 3: Image scanner 4: Display
Claims (4)
帳票からイメージスキャナを用いて当該帳票の全体を含む画像を読み取る手段と、
前記読み取った前記帳票の全体を含む画像について、エッジ強調して帳票の上辺、左辺、下辺、および右辺の用紙端を検出する手段と、
前記検出した用紙端の上辺、左辺、下辺、および右辺について隣接するものの交点が前記読み取った画像内に含まれるときに正しいと判定、一方、含まれないときに誤検出と判定する手段と、
前記正しいと判定された帳票の用紙端の上辺、左辺、下辺、および上辺の外側を黒画素とした帳票画像を生成する手段と、
前記帳票画像の外側の黒画素から白画素に変化する用紙端の上辺、左辺、下辺、および上辺について隣接するものの交点を基点として文字認識する手段とを備えたことを特徴とする文字認識システム。In a character recognition system that performs character recognition of forms,
Means for reading an image including the entire form from the form using an image scanner;
For the image including the whole of the read form, means for edge detection to detect the upper edge , the left edge , the lower edge , and the right edge of the form;
Means for determining that the intersections of the upper side, the left side, the lower side, and the right side adjacent to the detected paper edge are correct when included in the read image, while determining that it is a false detection when not included;
Means for generating a form image with black pixels on the upper side, left side, lower side, and upper side of the paper edge of the form determined to be correct ;
A character recognition system comprising: character recognition means based on intersections of adjacent ones of the upper side, left side, lower side, and upper side of the paper edge that change from black pixels to white pixels outside the form image.
帳票からイメージスキャナを用いて当該帳票の全体を含む画像を読み取る手段と、
前記読み取った前記帳票の全体を含む画像について、エッジ強調して帳票の上辺、左辺、下辺、および右辺の用紙端を検出する手段と、
前記検出した用紙端の上辺、左辺、下辺、および右辺について隣接するものの交点が前記読み取った画像内に含まれるときに正しいと判定、一方、含まれないときに誤検出と判定する手段と、
前記正しいと判定された帳票の用紙端の上辺、左辺、下辺、および上辺の外側を黒画素とした帳票画像を生成する手段と、
前記帳票画像の外側の黒画素から白画素に変化する用紙端の上辺、左辺、下辺、および上辺について隣接するものの交点を基点として文字認識する手段としてコンピュータに機能させるための文字認識プログラム。In a character recognition program that performs character recognition on forms,
Means for reading an image including the entire form from the form using an image scanner;
For the image including the whole of the read form, means for edge detection to detect the upper edge , the left edge , the lower edge , and the right edge of the form;
Means for determining that the intersections of the upper side, the left side, the lower side, and the right side adjacent to the detected paper edge are correct when included in the read image, while determining that it is a false detection when not included;
Means for generating a form image with black pixels on the upper side, left side, lower side, and upper side of the paper edge of the form determined to be correct ;
A character recognition program for causing a computer to function as means for recognizing characters based on intersections of adjacent top and left sides, bottom sides, and top sides of a paper edge changing from black pixels to white pixels outside the form image.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2002159690A JP4194301B2 (en) | 2002-05-31 | 2002-05-31 | Character recognition system and character recognition program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2002159690A JP4194301B2 (en) | 2002-05-31 | 2002-05-31 | Character recognition system and character recognition program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2004005177A JP2004005177A (en) | 2004-01-08 |
| JP4194301B2 true JP4194301B2 (en) | 2008-12-10 |
Family
ID=30429364
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2002159690A Expired - Fee Related JP4194301B2 (en) | 2002-05-31 | 2002-05-31 | Character recognition system and character recognition program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4194301B2 (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20240177123A1 (en) * | 2015-09-30 | 2024-05-30 | Groupon, Inc. | Optical receipt processing |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4598426B2 (en) * | 2004-03-30 | 2010-12-15 | 富士通株式会社 | Boundary extraction method, program, and apparatus using the same |
| JP6981140B2 (en) * | 2017-09-26 | 2021-12-15 | 株式会社リコー | Image processing equipment, image processing methods, and programs |
-
2002
- 2002-05-31 JP JP2002159690A patent/JP4194301B2/en not_active Expired - Fee Related
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20240177123A1 (en) * | 2015-09-30 | 2024-05-30 | Groupon, Inc. | Optical receipt processing |
| US12361393B2 (en) * | 2015-09-30 | 2025-07-15 | Bytedance Inc. | Optical receipt processing |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2004005177A (en) | 2004-01-08 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8422773B2 (en) | Image zone detecting using color gradation levels, method, apparatus and computer readable medium | |
| JPH03144863A (en) | Image tilt detection method and correction method, and image information processing device | |
| JP2005073015A (en) | Image processing apparatus, image processing method, and computer program | |
| JPH0535938A (en) | Picture processor | |
| JPH08287184A (en) | Image cropping device and character recognition device | |
| JP4574503B2 (en) | Image processing apparatus, image processing method, and program | |
| US20070172123A1 (en) | Image processing apparatus, image processing method and computer readable medium | |
| JP4194301B2 (en) | Character recognition system and character recognition program | |
| JP3582988B2 (en) | Non-contact image reader | |
| JP6883199B2 (en) | Image processor, image reader, and program | |
| JP2012073769A (en) | Musical score recognition device and computer program | |
| JPH03263282A (en) | Character segmenting method for character reader | |
| JP7532124B2 (en) | Information processing device, information processing method, and program | |
| JPH117493A (en) | Character recognition processor | |
| JP2000011192A (en) | Image registration method | |
| JPH07160814A (en) | Optical character recognition method | |
| JPH04156694A (en) | Character recognition system | |
| JP2004318896A (en) | Non-contact image reader | |
| JP2636866B2 (en) | Information processing method | |
| JP3334369B2 (en) | Selection item recognition device | |
| JPH0573718A (en) | Area attribute identification method | |
| JP4270767B2 (en) | Ruled line information processing method, ruled line information processing program, image processing apparatus, and storage medium | |
| JPH0758927A (en) | Picture data creation device | |
| JP3221969B2 (en) | Character recognition device | |
| JPH05128305A (en) | Area division method |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050324 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080624 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080821 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080916 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080922 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 4194301 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111003 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111003 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121003 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121003 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131003 Year of fee payment: 5 |
|
| LAPS | Cancellation because of no payment of annual fees |