Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JPH061504B2 - Feature extraction circuit - Google Patents
[go: Go Back, main page]

JPH061504B2 - Feature extraction circuit - Google Patents

Feature extraction circuit

Info

Publication number
JPH061504B2
JPH061504B2 JP62127963A JP12796387A JPH061504B2 JP H061504 B2 JPH061504 B2 JP H061504B2 JP 62127963 A JP62127963 A JP 62127963A JP 12796387 A JP12796387 A JP 12796387A JP H061504 B2 JPH061504 B2 JP H061504B2
Authority
JP
Japan
Prior art keywords
character
contour
feature amount
interest
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62127963A
Other languages
Japanese (ja)
Other versions
JPS63293691A (en
Inventor
正夫 仁藤
成英 山田
章子 紺野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuji Electric Co Ltd
Original Assignee
Fuji Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Electric Co Ltd filed Critical Fuji Electric Co Ltd
Priority to JP62127963A priority Critical patent/JPH061504B2/en
Publication of JPS63293691A publication Critical patent/JPS63293691A/en
Publication of JPH061504B2 publication Critical patent/JPH061504B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は、例えば光学式文字読取装置(OCR)の如
き文字識別装置において必要となる、文字は特徴量抽出
回路に関する。
Description: BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character extraction circuit for characters, which is required in a character identification device such as an optical character reader (OCR).

〔従来の技術〕[Conventional technology]

第6図は特徴量抽出方法の従来例を説明するための説明
図である。すなわち、識別しようとする文字パターンP
について文字枠Wとサブ文字枠W1〜W10を設定し、
各サブ文字枠内に存在する文字パターンPの面積A1〜
A10を求め、これらを綜合して文字パターンPの特徴
量とするものである。なお、このように抽出された特徴
量は、各文字毎に予め定義されたサブ文字枠毎の標準面
積とその偏差からなる辞書と比較され、着目入力文字の
識別が行なわれる。
FIG. 6 is an explanatory diagram for explaining a conventional example of a feature quantity extraction method. That is, the character pattern P to be identified
About character frame W and sub character frames W1 to W10 are set,
Area A1 to the character pattern P existing in each sub-character frame
A10 is obtained, and these are combined to be the characteristic amount of the character pattern P. The feature amount extracted in this way is compared with a dictionary consisting of a standard area for each sub-character frame defined in advance for each character and its deviation to identify the input character of interest.

〔発明が解決しようとする問題点〕[Problems to be solved by the invention]

しかしながら、上記の如き特徴量抽出方法では、管理さ
れた紙上に活字で記録された文字パターン等に対しては
有効であるが、文字線幅が大きく変化する捺印文字など
では、各サブ文字枠で面積のバラツキが大きくなり、適
用できなくなると云う問題がある。
However, the feature amount extraction method as described above is effective for a character pattern or the like recorded in print on a managed paper, but for a stamp character or the like in which the character line width greatly changes, it is not possible to use each sub character frame. There is a problem that the variation of the area becomes large and it cannot be applied.

したがって、この発明は文字線幅が変化しても安定に特
徴量を抽出し得る特徴抽出回路を提供することを目的と
する。
Therefore, an object of the present invention is to provide a feature extraction circuit capable of stably extracting a feature amount even if the character line width changes.

〔問題点を解決するための手段〕[Means for solving problems]

文字パターン列を撮像し画素毎に2値化して得られる画
像データから着目する1文字領域を決定してその特徴量
を抽出すべく、着目文字の輪郭を1周にわたって追跡
し、各輪郭点の座標位置と次の輪郭点への方向コードと
を求める輪郭追跡手段と、該輪郭追跡手段からの位置情
報により決定される着目文字の各部分毎に所定の方向コ
ードをもつ輪郭点数をカウントする複数のカウント手段
と、を設け、該各カウント出力を綜合して着目文字の特
徴量とする。
In order to determine one character area of interest from image data obtained by imaging a character pattern string and binarizing it for each pixel and extracting the feature amount, the contour of the character of interest is tracked over one round, and each contour point Contour tracing means for obtaining a coordinate position and a direction code to the next contour point, and a plurality of contour points for counting the number of contour points having a predetermined direction code for each part of the character of interest determined by the position information from the contour tracing means And a counting unit for counting the count outputs, and the count outputs are combined to obtain the feature amount of the target character.

〔作用〕[Action]

文字パターンの輪郭による特徴量は文字線幅の影響を殆
んど受けないので、これを利用して安定な特徴量を抽出
する。
Since the feature amount due to the outline of the character pattern is hardly affected by the character line width, a stable feature amount is extracted using this.

〔実施例〕〔Example〕

第1図はこの発明の特徴を最も良く表わす主要図、第2
図はこの発明を含む一般的な光学式文字読取装置の一例
を示す全体構成図、第3図は方向コードを説明するため
の説明図、第4図はこの発明の実施例を具体的に説明す
るための説明図、第5図は第4図の各サブ文字枠ごとに
設定される方向コードを説明するための説明図である。
FIG. 1 is a main view which best shows the features of the present invention, and FIG.
FIG. 1 is an overall configuration diagram showing an example of a general optical character reading device including the present invention, FIG. 3 is an explanatory diagram for explaining a direction code, and FIG. 4 is a detailed description of an embodiment of the present invention. FIG. 5 is an explanatory diagram for explaining the direction code set for each sub-character frame in FIG. 4.

まず、第2図から説明する。同図において、DTは入力
であり、例えば紙に記録された文字パターン列である。
1は入力DTを光電変換により電気信号に変換するテレ
ビカメラ等のスキャナであり、2はスキャナ1からの出
力に対して種々の操作を施し、背景と文字パターンをデ
イジタル的に“0”と“1”に変換する2値化回路であ
る。3は2値化回路2からの出力を、入力イメージDT
にしたがって記憶するメモリであり、こゝでは1ページ
分記憶するのでページメモリと呼ぶことにする。4はペ
ージメモリ3に記憶されている文字パターン列から、着
目文字1文字分のパターン領域を読み出す1文字切出し
回路である。なお、1文字領域の決定の仕方について
は、こゝでは特に関係がないので説明は省略する。5は
1文字切出し回路4により切り出される1文字パターン
について良く知られている輪郭追跡をして輪郭点情報を
得、サブ文字枠(サブウインドウ)毎に予め設定された
方向(設定方向)をもつ輪郭点の数をカウントし、文字
パターンの特徴量を得る特徴抽出回路である。この回路
の詳細については後述する。6は特徴抽出回路5からの
着目文字パターンの特徴量について、予め設定登録して
ある既知(標準)文字に対する各サブウインドウ毎の特
徴量を示す辞書との照合を行ない、文字を識別する識別
回路である。7は識別回路6からの1文字ごとの識別結
果を蓄積、編集する編集回路であり、必要に応じて外部
への出力を行なう。
First, FIG. 2 will be described. In the figure, DT is an input, for example, a character pattern string recorded on paper.
Reference numeral 1 is a scanner such as a television camera for converting an input DT into an electric signal by photoelectric conversion, and 2 is various operations for the output from the scanner 1 to digitally change the background and character pattern to "0" and "0". This is a binarization circuit for converting into 1 ". 3 indicates the output from the binarization circuit 2 as the input image DT
According to this, it is a memory for storing one page, and is called a page memory here. Reference numeral 4 denotes a one-character cutout circuit that reads out a pattern area for one character of interest from the character pattern string stored in the page memory 3. Note that the method of determining the one-character area is not particularly relevant here, so the description thereof will be omitted. Reference numeral 5 obtains contour point information by performing contour tracing, which is well known for a 1-character pattern cut out by the 1-character cutting circuit 4, and has a preset direction (setting direction) for each sub-character frame (sub-window). A feature extraction circuit that counts the number of contour points and obtains the feature amount of a character pattern. Details of this circuit will be described later. Reference numeral 6 is an identification circuit for identifying the character amount of the character pattern of interest from the feature extraction circuit 5 by collating it with a dictionary showing the characteristic amount of each sub-window for a known (standard) character that has been set and registered in advance. Is. An editing circuit 7 stores and edits the identification result for each character from the identification circuit 6, and outputs it to the outside as needed.

こゝで、第1図にもどり、特徴抽出回路につき詳細に説
明する。同図において、51は着目1文字分のイメージ
を記憶し、輪郭追跡等のためにランダムアクセスが可能
な1文字メモリである。52はメモリ51から着目輪郭
画素とその隣接画素情報を取り出し、所定方向(例えば
反時計方向)に次の輪郭点を順次決定し、着目文字の輪
郭点情報を得る輪郭追跡部である。輪郭追跡部52は次
の輪郭点を決定するごとに輪郭追跡制御記号Cを更新す
るが、この制御信号Cには次の輪郭点の座標値(x,
y)とその方向コード(V)が含まれる。こゝに、方向
コードとは、第3図に示すように0〜360°の範囲を
45°間隔で8つの方向に分け、これに0,1,2……
7の番号を付けたものを云う。第4図はこのようにして
“5”と云う着目文字イメージPを、例えばST点を起
点として反時計方向に輪郭追跡した例である。
Now, returning to FIG. 1, the feature extraction circuit will be described in detail. In the figure, reference numeral 51 denotes a one-character memory that stores an image of one character of interest and that can be randomly accessed for contour tracking and the like. Reference numeral 52 denotes a contour tracking unit that extracts the contour pixel of interest and the adjacent pixel information from the memory 51, sequentially determines the next contour point in a predetermined direction (for example, counterclockwise direction), and obtains contour point information of the focused character. The contour tracking unit 52 updates the contour tracking control symbol C each time the next contour point is determined. The control signal C includes the coordinate value (x,
y) and its direction code (V). Here, as shown in FIG. 3, the direction code means that the range of 0 to 360 ° is divided into 8 directions at 45 ° intervals, and 0, 1, 2, ...
It is the one with the number 7. FIG. 4 shows an example in which the contour of the character image P of interest called "5" is traced counterclockwise, for example, starting from the ST point.

いま、第4図の如く着目文字イメージPの文字枠を4つ
のサブウインドウW1〜W4に分割し、その各々に対し
て第5図の如き方向コードを設定する。こゝでは、サブ
ウインドウW1,W4に対しては1,2,3の方向コー
ド(S1,S4)が、またサブウインドウW2,W3に
対しては5,6,7の方向コード(S2,S3)がそれ
ぞれ設定されている。第1図のカウンタ53A,53
B,53C,53DではサブウインドウW1,W2,W
3,W4ごとに設定された方向コードS1,S2,S
3,S4をもつ輪郭点の数をカウントする。すなわち、
この例ではサブウインドウW1,W4では方向コード
1,2,3をもつ輪郭点の数を、またサブウインドウW
2,W3では方向コード5,6,7をもつ輪郭点の数を
それぞれカウントすることになる。このとき、各カウン
タ53A,53B,53C,53Dには、サブウインド
ウ決定情報SW1,SW2,SW3,SW4がそれぞれ
与えられているので、これによって各サブウインドウ毎
にカウント値を得ることが可能になる。
Now, as shown in FIG. 4, the character frame of the target character image P is divided into four sub windows W1 to W4, and the direction code as shown in FIG. 5 is set for each of them. Here, the direction codes 1, 2, and 3 (S1, S4) are assigned to the subwindows W1 and W4, and the direction codes (S2 and S3) are assigned to the subwindows W2 and W3. ) Are set respectively. Counters 53A and 53 of FIG.
In B, 53C, 53D, sub-windows W1, W2, W
Direction codes S1, S2, S set for 3 and W4
Count the number of contour points with 3, S4. That is,
In this example, the number of contour points having the direction codes 1, 2 and 3 is set in the sub windows W1 and W4, and
In 2 and W3, the number of contour points having the direction codes 5, 6 and 7 is counted respectively. At this time, since the sub-window determination information SW1, SW2, SW3, SW4 is given to each of the counters 53A, 53B, 53C, 53D, the count value can be obtained for each sub-window. .

以上の如き特徴量を抽出することにより、文字線幅の変
動や文字の傾き変動等に対し安定な特徴量を得ることが
でき、その結果、精度の高い文字識別が可能となる。
By extracting the feature amount as described above, it is possible to obtain a stable feature amount against variations in the character line width, variations in the inclination of characters, etc. As a result, it is possible to perform highly accurate character identification.

〔発明の効果〕〔The invention's effect〕

この発明によれば、二次元的な文字パターンに対し、輪
郭追跡を行なって輪郭位置と方向コードを求め、着目文
字の部分領域毎に設定方向コードをもつ輪郭点の数をカ
ウントし、これを着目文字パターンの特徴量とするよう
にしたので、文字線幅の変動等に影響されることなく、
安定な特徴量を得ることができ、その結果、高精度の文
字識別が可能となる利点がもたらされる。
According to the present invention, contour tracing is performed on a two-dimensional character pattern to obtain a contour position and a direction code, and the number of contour points having a set direction code is counted for each partial area of the focused character, and this is calculated. Since it is set as the feature amount of the character pattern of interest, it is not affected by variations in character line width, etc.
It is possible to obtain a stable feature amount, and as a result, there is an advantage that high-precision character identification is possible.

【図面の簡単な説明】[Brief description of drawings]

第1図はこの発明の特徴を最も良く表わす主要図、第2
図はこの発明を含む一般的な光学式文字読取装置の一例
を示す全体構成図、第3図は方向コードを説明するため
の説明図、第4図はこの発明の実施例を具体的に説明す
るための説明図、第5図は第4図の各サブ文字枠毎に設
定される方向コードを説明するための説明図、第6図は
特徴量抽出方法の従来例を説明するための説明図であ
る。 符号説明 1……スキャナ、2……2値化回路、3……ページメモ
リ、4……1文字切出し回路、5……特徴抽出回路、6
……識別回路、7……編集回路、51……1文字メモ
リ、52……輪郭追跡部、53A〜53D……カウン
タ、DT……文書、W……文字枠、W1〜W10……サ
ブ文字枠、P……文字パターン。
FIG. 1 is a main view which best shows the features of the present invention, and FIG.
FIG. 1 is an overall configuration diagram showing an example of a general optical character reading device including the present invention, FIG. 3 is an explanatory diagram for explaining a direction code, and FIG. 4 is a detailed description of an embodiment of the present invention. FIG. 5 is an explanatory view for explaining the direction code set for each sub-character frame in FIG. 4, and FIG. 6 is an explanatory view for explaining a conventional example of the feature amount extraction method. It is a figure. Description of symbols 1 ... Scanner, 2 ... Binarization circuit, 3 ... Page memory, 4 ... 1 character cut-out circuit, 5 ... Feature extraction circuit, 6
...... Identification circuit, 7 ...... Editing circuit, 51 ...... 1 character memory, 52 ...... Contour tracking unit, 53A to 53D ...... Counter, DT ...... Document, W ...... character frame, W 1 to W 10 ...... sub character Frame, P ... Character pattern.

───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭57−212582(JP,A) 特開 昭57−161985(JP,A) 電子通信学会技術研究報告PRL81− 93,(昭57−02−19),pp.85−92 ─────────────────────────────────────────────────── ─── Continuation of the front page (56) References JP-A-57-212582 (JP, A) JP-A-57-161985 (JP, A) Technical Report of the Institute of Electronics and Communication Engineers PRL81-93, (SHO-57-02- 19), pp. 85-92

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】文字パターン列を撮像し画素毎に2値化し
て得られる画像データから着目する1文字領域を決定し
てその特徴量を抽出する特徴抽出回路において、 着目文字の輪郭を1周にわたって追跡し、各輪郭点の座
標位置と次の輪郭点への方向コードとを求める輪郭追跡
手段と、 該輪郭追跡手段からの位置情報により決定される着目文
字の各部分毎に所定の方向コードをもつ輪郭点数をカウ
ントする複数のカウント手段と、 を設け、該各カウント出力を綜合して着目文字の特徴量
とすることを特徴とする特徴抽出回路。
1. A feature extraction circuit for determining a character region of interest from image data obtained by picking up a character pattern string and binarizing it for each pixel, and extracting the feature amount thereof. Contour tracing means for tracing the coordinate position of each contour point and a direction code to the next contour point, and a predetermined direction code for each part of the character of interest determined by the position information from the contour tracing means. And a plurality of counting means for counting the number of contour points having, and summing the respective count outputs to obtain the feature amount of the target character.
JP62127963A 1987-05-27 1987-05-27 Feature extraction circuit Expired - Lifetime JPH061504B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62127963A JPH061504B2 (en) 1987-05-27 1987-05-27 Feature extraction circuit

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62127963A JPH061504B2 (en) 1987-05-27 1987-05-27 Feature extraction circuit

Publications (2)

Publication Number Publication Date
JPS63293691A JPS63293691A (en) 1988-11-30
JPH061504B2 true JPH061504B2 (en) 1994-01-05

Family

ID=14973002

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62127963A Expired - Lifetime JPH061504B2 (en) 1987-05-27 1987-05-27 Feature extraction circuit

Country Status (1)

Country Link
JP (1) JPH061504B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2954218B2 (en) * 1988-04-19 1999-09-27 キヤノン株式会社 Image processing method and apparatus
JP2681599B2 (en) * 1993-06-26 1997-11-26 典弘 加藤 Character recognition device

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
電子通信学会技術研究報告PRL81−93,(昭57−02−19),pp.85−92

Also Published As

Publication number Publication date
JPS63293691A (en) 1988-11-30

Similar Documents

Publication Publication Date Title
US4408342A (en) Method for recognizing a machine encoded character
JPS6159568A (en) document processing device
US10573346B2 (en) Case video log data generating apparatus, case video processing system, and case video log data generating method
GB1567287A (en) Pattern encoding apparatus
US20060113390A1 (en) Barcode recognition apparatus
US5471041A (en) Bar-code reader device
JPH061504B2 (en) Feature extraction circuit
JP2000181988A (en) Optical character reader
JPH0250284A (en) Feature extracting circuit
US3217295A (en) Correlation pattern recognition apparatus
JP2832928B2 (en) Character recognition method
JP2975720B2 (en) Optical character reader
JPH11184965A (en) Slip identification register device
JP3655661B2 (en) Digital information record carrier and digital information reading method using the same
JP2605807B2 (en) Feature extraction method
EP1303830B1 (en) Method and device for recording of information
JPH0799532B2 (en) Character cutting device
JPS62117530A (en) X-ray photographing apparatus with name printer and image searching control apparatus
JP3009237B2 (en) Feature extraction method
JP2964684B2 (en) Character data collection method for character reading
JP2954218B2 (en) Image processing method and apparatus
JPS63271588A (en) Character recognition device
US7054486B2 (en) Image processing method, system, computer program and data carrier
JP4544691B2 (en) Character reader
JP3084833B2 (en) Feature extraction device