JPH0317150B2 - - Google Patents
Info
- Publication number
- JPH0317150B2 JPH0317150B2 JP58182633A JP18263383A JPH0317150B2 JP H0317150 B2 JPH0317150 B2 JP H0317150B2 JP 58182633 A JP58182633 A JP 58182633A JP 18263383 A JP18263383 A JP 18263383A JP H0317150 B2 JPH0317150 B2 JP H0317150B2
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- character
- subset
- pattern
- memory
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 230000015654 memory Effects 0.000 claims description 31
- 238000012015 optical character recognition Methods 0.000 claims 1
- 238000000034 method Methods 0.000 description 11
- 230000003287 optical effect Effects 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 235000016496 Panda oleosa Nutrition 0.000 description 3
- 240000000220 Panda oleosa Species 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Description
【発明の詳細な説明】
〔発明の技術分野〕
本発明は、特に誤読の発生を低減する機能を有
した光学的文字読取装置に関する。DETAILED DESCRIPTION OF THE INVENTION [Technical Field of the Invention] The present invention particularly relates to an optical character reading device having a function of reducing the occurrence of misreading.
光学的文字読取装置(以下OCRと称する)で
は、読取率の向上と共に誤読の防止が性能を決定
する上で極めて重要である。従来、誤読を防止す
る方式として、同一文字パターンに対して2度の
読取処理を行なうものが開発されている。
In optical character reading devices (hereinafter referred to as OCR), improving the reading rate and preventing misreading are extremely important in determining the performance. Conventionally, as a method for preventing misreading, a method has been developed in which the same character pattern is read twice.
上記のような方式のOCRでは、通常光電変換
部での白、黒の判定基準となるスライスレベル値
が複数種(例えば2種類)設定され、この複数種
のスライスレベル値に基づいて同一文字に対する
複数種の2値化パターンが作成される。そして、
各2値化パターンに対する認識処理が行なわれ、
その各認識結果の間で比較処理が行なわれる。こ
の比較結果により、一致した場合にはその認識結
果を答として出力し、また不一致の場合にはリジ
エクトすることになる。 In the above-mentioned OCR, multiple types (for example, two types) of slice level values are usually set as standards for determining white and black in the photoelectric conversion unit, and based on these multiple types of slice level values, the same character is A plurality of types of binarization patterns are created. and,
Recognition processing is performed for each binarization pattern,
Comparison processing is performed between the respective recognition results. Based on the comparison result, if they match, the recognition result is output as an answer, and if they do not match, it is rejected.
しかしながら、上記のような従来のOCRでは、
複数種の2値化パターンを作成し各2値化パター
ンを格納するために複数の2値化パターン格納用
メモリを必要とする。このため、OCR全体の構
成が複雑となり、またメモリ等の部品点数が多い
ためコストが増大するなどの欠点があつた。 However, with conventional OCR as mentioned above,
In order to create a plurality of types of binarization patterns and store each binarization pattern, a plurality of binarization pattern storage memories are required. This has resulted in drawbacks such as the overall configuration of the OCR becoming complex and the cost increasing due to the large number of parts such as memory.
本発明は上記の事情に鑑みてなされたもので、
その目的は、簡単な構成で読取対象である文字の
誤認識を大幅に減少できる光学的文字読取装置を
提供することにある。
The present invention was made in view of the above circumstances, and
The purpose is to provide an optical character reading device that has a simple configuration and can significantly reduce misrecognition of characters to be read.
本発明では、予め複数回の認識動作に応じた認
識用サブセツトの組合せ情報を記憶するサブセツ
トテーブルメモリが設けられる。認識制御手段
は、同一の文字パターンに対して上記認識用サブ
セツトの組合せ情報に基づいた認識手段のマツチ
ング処理を複数回行なうように制御する。さら
に、認識手段から出力される同一文字パターンに
対する複数の認識結果が比較手段で比較される。
比較手段は、比較結果が一致した場合に認識結果
を答として出力し、また不一致の場合にはリジエ
クト信号を出力する。これにより、文字パターン
は認識用サブセツトの所定の組合せに基づいて複
数回の認識処理が行なわれる。
In the present invention, a subset table memory is provided which stores in advance combination information of recognition subsets corresponding to a plurality of recognition operations. The recognition control means controls the recognition means to perform matching processing multiple times on the same character pattern based on the combination information of the recognition subsets. Further, a plurality of recognition results for the same character pattern outputted from the recognition means are compared by a comparison means.
The comparison means outputs the recognition result as an answer when the comparison results match, and outputs a reject signal when they do not match. Thereby, the character pattern is recognized multiple times based on a predetermined combination of recognition subsets.
以下図面を参照して本発明の一実施例について
説明する。第1図は一実施例に係るOCRの部分
的構成を示すブロツク図である。第1図におい
て、認識部コントロール回路(以下単にコントロ
ール回路と称する)10はOCRの認識部全体を
制御する回路である。文字切出しパターンメモリ
11は、コントロール回路10の制御信号2に応
じて1文字分の文字パターンPを格納する。この
文字パターンPはメモリ11からマツチング回路
12に送られる。マツチング回路12は、コント
ロール回路10からの制御信号mに応じて文字パ
ターンPと標準パターンメモリ(辞書メモリ)1
3からの標準パターンFP1〜FP4とのマツチン
グ処理を行なう。標準パターンメモリ13は、例
えば数字(0〜9)、英字(A〜Z)、仮名文字お
よび特殊記号等の各サブセツトからなる標準パタ
ーンFP1〜FP4を予め格納しており、コントロ
ール回路10からの辞書ロード信号b1〜b4に応じ
てマツチング回路12へ標準パターンFP1〜FP
4を出力する。コントロール回路10は、サブセ
ツトテーブルメモリ14に予め格納された認識用
サブセツトの組合せ情報に基づいて上記辞書ロー
ド信号b1〜b4を標準パターンメモリ13に出力す
る。この場合、コントロール回路10はマツチン
グ回路12からの認識処理回数を指示する指示信
号COに応じて辞書ロード信号b1〜b4を出力する。
一方、コンパレータ15はマツチング回路12か
ら出力される同一文字パターンに対する複数の認
識結果R1,R2を比較し、その比較結果が一致
した場合には認識結果(R1またはR2)を答と
して出力する。また、比較結果が不一致の場合に
はリジエクト信号を出力することになる。
An embodiment of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing a partial configuration of an OCR according to an embodiment. In FIG. 1, a recognition unit control circuit (hereinafter simply referred to as a control circuit) 10 is a circuit that controls the entire recognition unit of OCR. The character cutout pattern memory 11 stores a character pattern P for one character in response to the control signal 2 of the control circuit 10. This character pattern P is sent from memory 11 to matching circuit 12. A matching circuit 12 matches a character pattern P and a standard pattern memory (dictionary memory) 1 according to a control signal m from a control circuit 10.
Matching processing with standard patterns FP1 to FP4 from 3 is performed. The standard pattern memory 13 stores in advance standard patterns FP1 to FP4 each consisting of a subset of numbers (0 to 9), alphabetic characters (A to Z), kana characters, special symbols, etc., and a dictionary from the control circuit 10. Standard patterns FP1 to FP are sent to the matching circuit 12 according to the load signals b1 to b4.
Outputs 4. The control circuit 10 outputs the dictionary load signals b 1 to b 4 to the standard pattern memory 13 based on the recognition subset combination information stored in the subset table memory 14 in advance. In this case, the control circuit 10 outputs dictionary load signals b 1 to b 4 in response to an instruction signal CO from the matching circuit 12 instructing the number of recognition processing.
On the other hand, the comparator 15 compares a plurality of recognition results R1 and R2 for the same character pattern output from the matching circuit 12, and if the comparison results match, outputs the recognition result (R1 or R2) as an answer. Further, if the comparison result is a non-coincidence, a reject signal is output.
上記のような構成のOCRにおいて、その動作
を説明する。先ず、コントロール回路10は外部
(通常OCR全体の制御部)からの駆動信号dを受
信すると、文字切出しパターンメモリ11に制御
信号aを出力する。この制御信号aにより、文字
切出しパターンメモリ11には1文字分の文字パ
ターンPが切出されて格納される。この場合、文
字パターンPは通常1行分の文字パターンを格納
しているラインバツフアから1文字毎に切出され
る。さらに、コントロール回路10には外部から
予め文字パターンPの認識処理に必要なサブセツ
ト情報(例えば英数字および仮名文字等)Eが与
えられる。コントロール回路10は、メモリ14
内のサブセツトテーブルを参照して第1回目の認
識動作に必要なサブセツトを決定して、そのサブ
セツトに基づいた辞書ロード信号b1〜b4を標準パ
ターンメモリ13に出力する。 The operation of the OCR configured as described above will be explained. First, when the control circuit 10 receives a drive signal d from the outside (usually a control section for the entire OCR), it outputs a control signal a to the character cutting pattern memory 11. In response to this control signal a, a character pattern P for one character is cut out and stored in the character cutout pattern memory 11. In this case, the character pattern P is cut out character by character from a line buffer that normally stores character patterns for one line. Furthermore, the control circuit 10 is supplied with subset information E (for example, alphanumeric characters, kana characters, etc.) necessary for recognition processing of the character pattern P from the outside. The control circuit 10 includes a memory 14
A subset necessary for the first recognition operation is determined by referring to the subset table in the dictionary, and dictionary load signals b 1 to b 4 based on the subset are output to the standard pattern memory 13 .
ここで、サブセツトテーブルメモリ14には例
えば第2図に示すようなサブセツトテーブルが格
納されており、認識動作の回数に応じたサブセツ
トの組合せ情報が記憶されている。即ち、例えば
数字サブセツトをN、英字サブセツトをAとした
場合、コントロール回路10の数字のサブセツト
情報Eが与えられたとする。このため、コントロ
ール回路10は第2図から明らかなように、1回
目の認識動作ではサブセツトNを設定しそのサブ
セツトNに応じた辞書ロード信号b1を標準パター
ンメモリ13に出力する。標準パターンメモリ1
3では予め格納された標準パターンFP1〜FP4
から辞書ロード信号b1即ちサブセツトNに応じた
標準パターンFP1が設定されて、マツチング回
路12へ送られる。マツチング回路12では、コ
ントロール回路10からの制御信号mに応じて文
字切出しパターンメモリ11からの文字パターン
Pおよび標準パターン(数字サブセツトNからな
る)FP1とのマツチング処理が行なわれる。こ
のマツチング処理による第1回目の認識結果R1
がコンパレータ15に与えられる。マツチング回
路12は1回目のマツチング処理が終了すると、
その指示信号COをコントロール部14へ供給す
る。 Here, the subset table memory 14 stores a subset table as shown in FIG. 2, for example, and stores combination information of subsets corresponding to the number of recognition operations. That is, for example, if the numerical subset is N and the alphabetic subset is A, it is assumed that the numerical subset information E of the control circuit 10 is given. Therefore, as is clear from FIG. 2, the control circuit 10 sets a subset N in the first recognition operation and outputs a dictionary load signal b1 corresponding to the subset N to the standard pattern memory 13. Standard pattern memory 1
3, pre-stored standard patterns FP1 to FP4
From there, a dictionary load signal b1 , that is, a standard pattern FP1 corresponding to the subset N is set and sent to the matching circuit 12. In the matching circuit 12, matching processing is performed between the character pattern P from the character cutting pattern memory 11 and the standard pattern (consisting of numeric subset N) FP1 in response to the control signal m from the control circuit 10. The first recognition result R1 by this matching process
is given to the comparator 15. When the matching circuit 12 completes the first matching process,
The instruction signal CO is supplied to the control section 14.
コントロール部10は、指示信号COの受信に
応じて同一文字パターンPに対する第2回目の認
識動作の制御を行なう。即ち、コントロール部1
0は第2図のサブセツトテーブルにより数字サブ
セツトNおよび英字サブセツトAを組合せたサブ
セツトNAを決定し、そのサブセツトNAに応じ
た辞書ロード信号b1,b2を標準パターンメモリ1
3に出力する。これにより、標準パターンメモリ
13からはサブセツトNAに応じた標準パターン
FP1,FP2がマツチング回路12に与えられ
る。そして、マツチング回路12では1回目のマ
ツチング処理の際と同一の文字パターンPおよび
標準パターンメモリ13からの標準パターンFP
1,FP2とのマツチング処理が行なわれて、第
2回目の認識結果R2がコンパレータ15に出力
される。コンパレータ15では、各認識結果R
1,R2の間で比較処理行なわれ、比較結果が一
致の場合には認識結果R1またはR2が答として
出力される。また、比較結果が不一致の場合には
リジエクト信号が出力される。 The control unit 10 controls the second recognition operation for the same character pattern P in response to receiving the instruction signal CO. That is, the control section 1
0 determines a subset NA that is a combination of numeric subset N and alphabetic subset A using the subset table shown in FIG.
Output to 3. As a result, the standard pattern corresponding to the subset NA is stored from the standard pattern memory 13.
FP1 and FP2 are applied to a matching circuit 12. Then, the matching circuit 12 uses the same character pattern P and the standard pattern FP from the standard pattern memory 13 as in the first matching process.
1 and FP2 is performed, and the second recognition result R2 is output to the comparator 15. In the comparator 15, each recognition result R
1 and R2, and if the comparison result is a match, the recognition result R1 or R2 is output as the answer. Further, if the comparison result is a mismatch, a reject signal is output.
上記のようにして、同一の文字パターンPに対
して例えば2回の認識処理が行なわれる。この場
合、各認識処理毎にサブセツトテーブルで設定さ
れたサブセツトの組合せによる標準パターンが設
定される。具体的には、例えば帳票上の数字フイ
ールド内に英字の「B」,「S」,「T」の文字が記
入されている場合、1回目の認識処理では数字サ
ブセツトN(0〜9)に基づくマツチング処理が
行なわれるため、各文字パターンは数字の「8」,
「5」,「7」と認識される可能性が高い。さらに、
2回目の認識処理では数字サブセツトN(0〜9)
および英字サブセツトA(A〜Z)の組合せから
なるサブセツトNAに基づくマツチング処理が行
なわれる。このため、2回目の認識処理では、英
字の「B」,「S」,「T」と認識されることにな
る。そして、上記のように1回目および2回目の
各認識結果R1,R2間の比較処理が行なわれ、
比較結果が不一致となるため、最終的出力として
はリジエクト信号が出力される。したがつて、帳
票上に数字の代りに誤まつて英字が記入された場
合、従来では数字サブセツトに応じて誤まつた数
字として読取られることになるが、本発明では上
記のようにリジエクトされ、誤まつて読取られる
事態を防止できる。また、帳票上に標準字体でな
い数字「1」,「2」,「5」が記入されている場
合、従来では「7」,「0」,「6」等のように誤読
される可能性が多い。このような場合でも、本発
明では2回目の認識処理では英字の「I」,「Q」,
「S」と認識される可能性が高いため、1回目と
2回目の認識結果の比較がそれぞれ「7」と
「I」,「0」と「Q」,「6」と「S」で行なわれ
ることにより、比較結果が不一致となる。このた
めリジエクトされ、誤まつて認識されることを防
止できる。 As described above, the same character pattern P is recognized twice, for example. In this case, a standard pattern is set for each recognition process by a combination of subsets set in the subset table. Specifically, for example, if the letters "B", "S", and "T" are written in a numeric field on a form, the first recognition process uses numeric subset N (0 to 9). Since matching processing is performed based on
There is a high possibility that it will be recognized as "5" or "7". moreover,
In the second recognition process, the number subset N (0 to 9)
Matching processing is performed based on subset NA, which is a combination of alphabetical character subsets A (A to Z). Therefore, in the second recognition process, the alphabetic characters "B", "S", and "T" are recognized. Then, as described above, a comparison process is performed between the first and second recognition results R1 and R2,
Since the comparison results do not match, a reject signal is output as the final output. Therefore, if an alphabetic character is mistakenly written in place of a number on a form, conventionally it would be read as a mistaken number depending on the numeric subset, but in the present invention, it is rejected as described above, It is possible to prevent a situation where the information is read by mistake. Additionally, if the numbers "1", "2", and "5" are written in non-standard fonts on a form, there is a possibility that they may be misread as "7", "0", "6", etc. in the past. many. Even in such a case, in the second recognition process of the present invention, the alphabetic characters "I", "Q",
Since there is a high possibility that "S" will be recognized, the first and second recognition results are compared for "7" and "I", "0" and "Q", and "6" and "S", respectively. As a result, the comparison results will be inconsistent. Therefore, it is possible to prevent the message from being rejected and mistakenly recognized.
なお、上記実施例においてサブセツトテーブル
メモリ14内のサブセツトの組合せが数字および
英字の場合について述べたが、これに限ることな
く他の組合せでもよい。例えば第2図に示すよう
に仮名文字サブセツトKおよび特殊記号サブセツ
トSの組合せでもよい。 In the above embodiment, the combination of subsets in the subset table memory 14 is a combination of numbers and letters, but the combination is not limited to this and other combinations may be used. For example, as shown in FIG. 2, a combination of a kana character subset K and a special symbol subset S may be used.
以上詳述したように本発明によれば、簡単な構
成で同一の文字パターンに対して認識用サブセツ
トの組合せに基づく複数回の認識処理を行なつ
て、誤読する可能性の高い文字に対する誤認識を
大幅に減少することができる。したがつて、例え
ば2値化パターン格納用メモリ等の部品点数を特
に増大することなく、誤読の発生を低減して確実
な読取動作を実現できる光学的文字読取装置を提
供できるものである。
As described in detail above, according to the present invention, recognition processing is performed multiple times on the same character pattern based on combinations of recognition subsets with a simple configuration, and characters that are likely to be misread are misrecognized. can be significantly reduced. Therefore, it is possible to provide an optical character reading device that can reduce the occurrence of misreading and realize a reliable reading operation without particularly increasing the number of components such as a memory for storing binarized patterns.
第1図は本発明の一実施例に係る光学的文字読
取装置の部分的構成を示すブロツク図、第2図は
第1図のサブセツトテーブルメモリに格納される
サブセツトテーブルの一例を示す図である。
10…認識部コントロール回路、11…文字切
出しパターンメモリ、12…マツチング回路、1
3…標準パターンメモリ、14…サブセツトテー
ブルメモリ、15…コンパレータ。
FIG. 1 is a block diagram showing a partial configuration of an optical character reading device according to an embodiment of the present invention, and FIG. 2 is a diagram showing an example of a subset table stored in the subset table memory of FIG. 1. It is. 10... Recognition unit control circuit, 11... Character cutout pattern memory, 12... Matching circuit, 1
3...Standard pattern memory, 14...Subset table memory, 15...Comparator.
Claims (1)
ーンメモリと、予め複数回の認識動作に応じた認
識用サブセツトの組合せ情報を記憶するサブセツ
トテーブルメモリと、上記文字パターンメモリ内
の文字パターンと上記サブセツトテーブルメモリ
の認識用サブセツトの組合せ情報に基づき選択さ
れた標準パターンとのマツチング処理により上記
文字パターンの認識結果を出力する認識手段と、
同一の上記文字パターンに対して予め設定される
上記認識用サブセツトの組合せ情報に基づいた上
記認識手段のマツチング処理を複数回行なうよう
に制御する認識制御手段と、上記認識手段から出
力される同一文字パターンに対する複数の認識結
果を比較してその比較結果が一致した場合の認識
結果を答として出力し不一致の場合にはリジエク
ト信号を出力する比較手段とを具備したことを特
徴とする光学的文字読取装置。1. A character pattern memory that stores a character pattern for one character, a subset table memory that stores combination information of recognition subsets according to recognition operations performed multiple times in advance, and a character pattern memory that stores character patterns in the character pattern memory and the aforementioned subsets. recognition means for outputting a recognition result of the character pattern through matching processing with a standard pattern selected based on the combination information of the recognition subset in the set table memory;
recognition control means for controlling the recognition means to perform matching processing multiple times based on combination information of the recognition subsets set in advance for the same character pattern; and the same character output from the recognition means. An optical character reader characterized by comprising: comparing means for comparing a plurality of recognition results for a pattern and outputting a recognition result as an answer when the comparison results match, and outputting a reject signal when they do not match. Device.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58182633A JPS6075973A (en) | 1983-09-30 | 1983-09-30 | Optical character reader |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58182633A JPS6075973A (en) | 1983-09-30 | 1983-09-30 | Optical character reader |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS6075973A JPS6075973A (en) | 1985-04-30 |
| JPH0317150B2 true JPH0317150B2 (en) | 1991-03-07 |
Family
ID=16121698
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP58182633A Granted JPS6075973A (en) | 1983-09-30 | 1983-09-30 | Optical character reader |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS6075973A (en) |
-
1983
- 1983-09-30 JP JP58182633A patent/JPS6075973A/en active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS6075973A (en) | 1985-04-30 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US4689768A (en) | Spelling verification system with immediate operator alerts to non-matches between inputted words and words stored in plural dictionary memories | |
| US3259883A (en) | Reading system with dictionary look-up | |
| JPS58103075A (en) | Character reader | |
| JPH0317150B2 (en) | ||
| JPS5853390B2 (en) | pattern recognition device | |
| US5270524A (en) | Automatic discriminating and decoding apparatus | |
| JPH0338787A (en) | Character recognition processor | |
| JPS5932829B2 (en) | How to read characters | |
| JPS5853791B2 (en) | character recognition device | |
| JPS5842904B2 (en) | Handwritten kana/kanji character recognition device | |
| JP2784004B2 (en) | Character recognition device | |
| JPS5949628B2 (en) | optical character reader | |
| JP3217442B2 (en) | Optical character reader | |
| JPS5847066B2 (en) | character recognition device | |
| JPS6095689A (en) | Optical character reader | |
| JPS5851390A (en) | Font character recognizing device | |
| JPS5935466B2 (en) | Character reading method and device | |
| JPS5972511A (en) | Special code input device using ordinary code | |
| JP2570571B2 (en) | Optical character reader | |
| JPH0475556B2 (en) | ||
| JPS6160184A (en) | Optical character reader | |
| JPS6081688A (en) | Information recognition method | |
| JPH0896080A (en) | Optical character reader | |
| JPH04130978A (en) | Color compatible optical character reader | |
| JPH04318687A (en) | Character recognition unit |