JPH0711819B2 - Pattern recognition method - Google Patents
Pattern recognition methodInfo
- Publication number
- JPH0711819B2 JPH0711819B2 JP61144486A JP14448686A JPH0711819B2 JP H0711819 B2 JPH0711819 B2 JP H0711819B2 JP 61144486 A JP61144486 A JP 61144486A JP 14448686 A JP14448686 A JP 14448686A JP H0711819 B2 JPH0711819 B2 JP H0711819B2
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- matching
- dictionary
- character
- feature vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Discrimination (AREA)
Description
【発明の詳細な説明】 [技術分野] 本発明は手書き漢字などのパターンの認識方法に関し、
さらに詳細には、多層方向ヒストグラム法による特徴ベ
クトルを用いるパターン認識方法に関する。TECHNICAL FIELD The present invention relates to a method for recognizing patterns such as handwritten Chinese characters,
More specifically, the present invention relates to a pattern recognition method using a feature vector based on the multi-direction histogram method.
[従来技術] 本出願人は、特願昭第59−202822号、特願昭58−202825
号になどによって、多層方向ヒストグラム法によるパタ
ーン認識方法を既に提案している。本発明は、このよう
なパターン認識方法の改良に関するものである。[Prior Art] The applicants of the present invention are directed to Japanese Patent Application Nos. 59-202822 and 58-202825.
Have already proposed a pattern recognition method based on the multilayer histogram method. The present invention relates to an improvement of such a pattern recognition method.
この多層方向ヒストグラム法によるパターン認識方法に
おいては、文字などのパターンの輪郭画素に方向コード
を付け、そのパターンの枠の各辺から対向する辺に向か
ってパターンを走査して白画素(背景)の次に出現する
方向コードを検出し、その方向コードをそれが走査線上
で何番目に検出されたかによって複数の層に属別する。
そして、パターンの枠内の分割領域毎に、ある層までの
層別の方向コードのヒストグラムを求め、それぞれのヒ
ストグラムを成分(特徴量)としたベクトルを、パター
ンの特徴ベクトルとして用いる。In this pattern recognition method using the multilayer direction histogram method, a direction code is attached to the contour pixels of a pattern such as a character, and the pattern is scanned from each side of the frame of the pattern toward the opposite side, and white pixels (background) are formed. The next appearing direction code is detected and the direction code is classified into a plurality of layers depending on how many times it is detected on the scan line.
Then, for each of the divided areas within the frame of the pattern, a histogram of the direction code for each layer up to a certain layer is obtained, and a vector having each histogram as a component (feature amount) is used as a feature vector of the pattern.
例えば、方向コードとして8種類のコードを付け、パタ
ーン枠内の4×4のメッシュ領域に分割し、第1層およ
び第2層の方向コードまでを対象とすると、特徴ベクト
ルの次元数は256(=4×4×2×8)となる。For example, if 8 kinds of codes are added as direction codes, the mesh is divided into 4 × 4 mesh areas in the pattern frame, and the direction codes of the first layer and the second layer are also targeted, the dimension number of the feature vector is 256 ( = 4 × 4 × 2 × 8).
辞書に関しては、パターン種毎に複数のパターンから同
様の特徴ベクトルを抽出し、その平均を辞書パターン
(標準パターン)の特徴ベクトルとして登録する。Regarding the dictionary, similar feature vectors are extracted from a plurality of patterns for each pattern type, and the average thereof is registered as the feature vector of the dictionary pattern (standard pattern).
また、本出願人は、層別のための走査方向も加味してさ
らに詳細に方向コードを層別する同様のパターン認識方
法も既に提案している。本発明は、このパターン認識方
法にも同様に適用できるものである。Further, the present applicant has already proposed a similar pattern recognition method in which the direction code is stratified in more detail in consideration of the scanning direction for stratification. The present invention can be applied to this pattern recognition method as well.
さらに、パターン枠内の領域分割の方法は、前記先願の
明細書および図面に開示した方法に限らない。例えば、
前記先願のパターン認識方法と同様に、方向コードが均
質に分配されるようにパターン枠内をメッシュ分割し、
そのメッシュ領域を予め設定されたパラメータに従って
部分的に重ね合わせて、少ない領域に統合するような方
法を採用してもよい。このような領域分割方法を採用し
た多層方向ヒストグラム法によるパターン認識方法は、
本出願人により提案済みであるが、このようなパターン
認識方法にも、本発明は同様に適用し得るものである。Further, the method of dividing the area within the pattern frame is not limited to the method disclosed in the specification and drawings of the above-mentioned prior application. For example,
Similar to the pattern recognition method of the previous application, the pattern frame is divided into meshes so that the direction codes are uniformly distributed,
A method may be adopted in which the mesh areas are partially overlapped according to preset parameters and integrated into a small area. The pattern recognition method by the multilayer direction histogram method adopting such a region division method is
The present invention has been proposed by the present applicant, but the present invention can be similarly applied to such a pattern recognition method.
さて、このような多層方向ヒストグラム法によるパター
ン認識方法においては、未知パターンから抽出された特
徴ベクトルと、辞書パターンの特徴ベクトルとのマッチ
ング距離を演算することによって、未知パターンのパタ
ーン種を同定する(未知パターンを認識する)。By the way, in such a pattern recognition method by the multi-direction histogram method, the pattern type of the unknown pattern is identified by calculating the matching distance between the feature vector extracted from the unknown pattern and the feature vector of the dictionary pattern ( Recognize unknown patterns).
しかし、前記のように特徴ベクトルの次元数が大きくな
ると、距離演算量が多く、マッチング処理時間が長くな
るという問題があった。However, when the dimension number of the feature vector becomes large as described above, there is a problem that the distance calculation amount becomes large and the matching processing time becomes long.
[目 的] したがって本発明の目的は、多層方向ヒストグラム法に
よるパターン認識方法において、マッチング処理の効率
化を図ることにある。[Objective] Therefore, an object of the present invention is to improve the efficiency of the matching process in the pattern recognition method by the multi-layered direction histogram method.
[構 成] 多層方向ヒストグラム法による特徴ベクトルは、パター
ン識別効果の大きい次元の成分と、その効果がそれほど
顕著でない次元の成分とがある。これに関し、説明を簡
単にするために、2次元の特徴ベクトルを考える。[Structure] The feature vector obtained by the multi-layered histogram method has a dimensional component with a large pattern identification effect and a dimensional component with a less pronounced effect. In this regard, consider a two-dimensional feature vector for ease of explanation.
次元数を2として多層方向ヒストグラム法による辞書を
作成した場合、“文",“字",“認",“識”のそれぞれの
辞書パターンの特徴ベクトルは、それぞれ第4図のg1,g
2,g3,g4のようになる。この例では、図から明らかなよ
うに、各特徴ベクトルは成分(特徴量)Aのほうが、成
分(特徴量)Bよりも分散(または標準偏差)が大き
い。換言すれば、成分Aのほうが、未知パターンに対す
る識別能力が高い。When a dictionary is created by the multi-directional histogram method with the number of dimensions being 2, the feature vectors of the dictionary patterns of “sentence”, “letter”, “recognition”, and “knowledge” are respectively g 1 and g in FIG.
It looks like 2 , g 3 , g 4 . In this example, as is clear from the figure, the component (feature amount) A of each feature vector has a larger variance (or standard deviation) than the component (feature amount) B. In other words, the component A has a higher ability to identify an unknown pattern.
このような特徴ベクトルの性質に着目すれば、パターン
識別能力の高い成分から優先的にマッチング距離を演算
することにより、パターン識別能力の高い一部の次元ま
でマッチング距離演算を実行した段階で、候補となり得
ない辞書パターンを排除し、候補となり得る辞書パター
ンを早い段階で絞り込むことができるであろう。Focusing on the characteristics of such a feature vector, the matching distance is preferentially calculated from a component having a high pattern identification ability, so that the matching distance calculation is performed up to a part of the dimensions having a high pattern identification ability. It will be possible to exclude dictionary patterns that cannot be candidates and narrow down the dictionary patterns that can be candidates at an early stage.
また、多層方向ヒストグラム法による特徴ベクトルは、
その各次元成分の順番を入れ替えてもパターンの特徴は
保存されるという性質がある。Also, the feature vector by the multi-direction histogram method is
The characteristics of the pattern are preserved even if the order of the respective dimensional components is changed.
以上のような点に着目し、本発明にあっては、多層方向
ヒストグラム法によって全パターン種の仮辞書パターン
の特徴ベクトルを得て、その特徴ベクトルの成分を標準
偏差または分散の大きい順の並べ替えたベクトルを辞書
パターンの特徴ベクトルとして辞書に登録してする。Focusing on the above points, in the present invention, the feature vectors of the temporary dictionary patterns of all the pattern types are obtained by the multilayer directional histogram method, and the components of the feature vectors are arranged in the descending order of standard deviation or variance. The changed vector is registered in the dictionary as a feature vector of the dictionary pattern.
そして、パターン認識は次のようにして行う。未知パタ
ーンから多層方向ヒストグラム法によって特徴ベクトル
を抽出し、その成分を前記標準偏差または分散の大きい
順に並べ替えたベクトルと、各パターン種の辞書パター
ンの特徴ベクトルとのマッチングを上位N次元まで行
い、そのマッチング距離と当該パターン種に対応した閾
値とを比較し、その比較結果によって当該パターン種に
関するマッチングを中断するか、さらに下位次元までの
詳細マッチングを行うか否かの判定を行う。Then, pattern recognition is performed as follows. A feature vector is extracted from an unknown pattern by the multilayer directional histogram method, and a vector obtained by rearranging the components in the descending order of the standard deviation or variance and the feature vector of the dictionary pattern of each pattern type are matched up to upper N dimensions, The matching distance is compared with the threshold value corresponding to the pattern type, and it is determined whether the matching regarding the pattern type is interrupted or the detailed matching up to the lower dimension is performed according to the comparison result.
また、その閾値は次のようにして決定する。パターン種
毎に複数のパターンから多層方向ヒストグラム法によっ
て特徴ベクトルをそれぞれ抽出して、その成分を前記標
準偏差または分散の大きい順に並べかえたベクトルと、
同一パターン種の前記辞書パターンの特徴ベクトルとの
上位N次元までのマッチング距離の標準偏差または分散
を求め、この標準偏差または分散に基づいて前記パター
ン種毎の閾値を決定する。The threshold value is determined as follows. A feature vector is extracted by a multi-direction histogram method from a plurality of patterns for each pattern type, and a vector in which the components are arranged in the descending order of the standard deviation or variance,
The standard deviation or variance of the matching distance to the upper N dimensions with the feature vector of the dictionary pattern of the same pattern type is obtained, and the threshold value for each pattern type is determined based on this standard deviation or variance.
このようなパターン認識方法によれば、未知パターンの
候補となり得ないような辞書パターンとのマッチング処
理が早期に中断するので、マッチング効果が向上してパ
ターン認識速度が上がる。また、マッチング中断の判定
用閾値を前記のようにパターン種別に決定するので、候
補から排除すべきでない辞書パターンとのマッチングが
誤って中断するエラーも確実に防止できるため、多層方
向ヒストグラム法によるパターン認識方法の本質的な利
点は損なわれず、高い認識率を達成できる。According to such a pattern recognition method, the matching process with a dictionary pattern that cannot be a candidate for an unknown pattern is interrupted early, so that the matching effect is improved and the pattern recognition speed is increased. In addition, since the threshold value for determining the interruption of matching is determined as the pattern type as described above, it is possible to reliably prevent an error in which matching with a dictionary pattern that should not be excluded from candidates is interrupted by mistake. The essential advantages of the recognition method are not impaired and a high recognition rate can be achieved.
[実施例] 以下、本発明の実施例について図面を参照し説明する。EXAMPLES Examples of the present invention will be described below with reference to the drawings.
第1図は、本発明の一実施例の機能的構成を簡略化して
示す概略ブロック図である。なお、この実施例において
は、認識対象のパターンとして手書き漢字などの文字パ
ターンを想定している。FIG. 1 is a schematic block diagram showing a simplified functional structure of an embodiment of the present invention. In this embodiment, a character pattern such as a handwritten Chinese character is assumed as the recognition target pattern.
図において、10は原稿から文字パターンを読み取り、文
字パターン情報を前処理部12に入力するパターン読み取
り部である。前処理部12は、入力文字パターンの文字切
り出し、正規化などの前処理を行い、処理後の文字パタ
ーンを1字毎に特徴抽出部14に入力する部分である。In the figure, 10 is a pattern reading unit for reading a character pattern from a document and inputting the character pattern information to the preprocessing unit 12. The preprocessing unit 12 is a unit that performs preprocessing such as character cutting and normalization of the input character pattern and inputs the processed character pattern to the feature extraction unit 14 for each character.
特徴抽出部14は、入力文字パターンから前記多層方向ヒ
ストグラム法により特徴ベクトル抽出する部分である。The feature extraction unit 14 is a unit that extracts a feature vector from the input character pattern by the multi-layered direction histogram method.
こゝで、この実施例においては、動作モードとして辞書
作成モードとパターン認識モードがある。まず、辞書作
成モードの場合について以下に説明する。また、このモ
ードにおける辞書作成処理の概略フローチャートを第2
図に示し、以下の説明について対応するステップ番号を
( )内に示す。Here, in this embodiment, there are a dictionary creation mode and a pattern recognition mode as operation modes. First, the case of the dictionary creation mode will be described below. In addition, the second part of the schematic flowchart of the dictionary creation processing in this mode is shown.
In the figure, the corresponding step numbers in the following description are shown in parentheses.
一つの文字種について、M個の文字パターンがパターン
読み取り部10より順次入力される(ステップ50)。その
入力文字パターンは前処理部12で前処理を受け(ステッ
プ52)、特徴抽出部14に入力されて多層方向ヒストグラ
ム法による特徴ベクトル(例えば256次元のベクトル)
を抽出される(ステップ54)。抽出された特徴ベクトル
は並べ替え部16を介して辞書作成部20に入力される。こ
の辞書作成部20により、M個の入力文字パターンから抽
出された特徴ベクトルを平均したベクトルが求められ
(ステップ56)、その平均ベクトルは、その文字種の仮
辞書パターンの特徴ベクトルとして辞書22に仮登録され
る(ステップ58)。For one character type, M character patterns are sequentially input from the pattern reading unit 10 (step 50). The input character pattern is pre-processed by the pre-processing unit 12 (step 52) and input to the feature extraction unit 14 to be a feature vector (for example, a 256-dimensional vector) by the multi-directional histogram method.
Are extracted (step 54). The extracted feature vector is input to the dictionary creating unit 20 via the rearrangement unit 16. The dictionary creation unit 20 obtains an average vector of the feature vectors extracted from the M input character patterns (step 56), and the average vector is temporarily stored in the dictionary 22 as the feature vector of the temporary dictionary pattern of the character type. It is registered (step 58).
辞書作成部20により、最後の文字種まで処理が終了した
か調べられ(ステップ60)、未処理の文字種が残ってい
れば、ステップ51に戻り、次の文字種に対する同様の処
理が行われる。The dictionary creating unit 20 checks whether the processing has been completed up to the last character type (step 60), and if there is an unprocessed character type, the process returns to step 51 and the same processing is performed for the next character type.
全ての文字種についえ処理が終ると、並べ替えテーブル
作成部26において、辞書22に仮登録されている全仮辞書
パターンの特徴ベクトルの、次元毎の標準偏差または分
散が計算される(ステップ62)。そして、もとの特徴ベ
クトルを標準偏差または分散の大きい順に並べ替えるた
めの並べ替えテーブルが作成され、並べ替えテーブル18
に登録される(ステップ64)。When the processing for all character types is completed, the rearrangement table creating unit 26 calculates the standard deviation or variance for each dimension of the feature vectors of all the temporary dictionary patterns temporarily registered in the dictionary 22 (step 62). . Then, a sorting table for sorting the original feature vectors in descending order of standard deviation or variance is created.
Is registered in (step 64).
こゝまでは、並べ替えテーブルを作成するための処理段
階であり、この後に実際の辞書作成処理が始まる。Up to this point, this is the processing stage for creating the rearrangement table, after which the actual dictionary creation processing begins.
一つの文字種kについて、M個の文字パターンがパター
ン読み取り部10より順次入力される(ステップ66)。そ
の入力文字パターンは前処理部12で前処理を受け(ステ
ップ68)、特徴抽出部14に入力されて多層方向ヒストグ
ラム法による特徴ベクトルを抽出される(ステップ7
0)。For one character type k, M character patterns are sequentially input from the pattern reading unit 10 (step 66). The input character pattern is subjected to preprocessing by the preprocessing unit 12 (step 68) and input to the feature extraction unit 14 to extract a feature vector by the multi-directional histogram method (step 7).
0).
抽出された特徴ベクトルの各成分は、並べ替え部16によ
って、並べ替えテーブル部18に登録されている並べ替え
テーブルに従い、前記標準偏差または分散の大きい順に
並べ替えられる(ステップ72)。このように成分の並べ
替え後のM個の特徴ベクトルは辞書作成部20に送られ、
それらの平均ベクトルが、その文字値kの辞書パターン
の特徴ベクトルとして辞書20に本登録される(ステップ
74)。The respective components of the extracted feature vector are rearranged by the rearrangement unit 16 according to the rearrangement table registered in the rearrangement table unit 18 in descending order of the standard deviation or variance (step 72). In this way, the M feature vectors after the rearrangement of the components are sent to the dictionary creating unit 20,
These average vectors are main-registered in the dictionary 20 as feature vectors of the dictionary pattern of the character value k (step
74).
辞書作成部20により、全部の文字種(K種)について辞
書作成処理が終了したか調べられ(ステップ76)、未処
理の文字種が残っているならば、未処理の文字種につい
てステップ66から同様の処理が行われる。The dictionary creation unit 20 checks whether or not the dictionary creation processing has been completed for all the character types (K types) (step 76), and if there are unprocessed character types, the same processing from step 66 is performed for the unprocessed character types. Is done.
全文字種について処理が完了すると、辞書そのものゝ作
成は終わりであるが、次に閾値決定の処理が行われる。When the processing is completed for all the character types, the dictionary itself is finished, but the threshold value determination processing is performed next.
この処理においては、文字種毎に辞書作成に用いられた
と同様なM個の文字パターンが入力され(ステップ7
8)、前処理(ステップ80)の後、それぞれ多層方向ヒ
ストグラム法による特徴ベクトルを抽出される(ステッ
プ82)。このM個の文字パターンの特徴ベクトルはそれ
ぞれ、並べ替え部16によって並べ替えテーブルに従い成
分が並べ替えられ(ステップ84)、マッチング部24に入
力される。In this process, M character patterns similar to those used to create the dictionary for each character type are input (step 7).
8) After pre-processing (step 80), feature vectors are extracted by the multi-directional histogram method (step 82). The feature vectors of the M character patterns are rearranged by the rearrangement unit 16 according to the rearrangement table (step 84) and input to the matching unit 24.
次にマッチング部24および閾値決定部28の起動により、
閾値決定が行われる。すなわち、マッチング部24によ
り、その各特徴ベクトルと文字種kの辞書パターンの特
徴ベクトルとのマッチング距離が上位N次元まで演算さ
れ、閾値決定部28において、その演算結果から、上位N
次元までのマッチング距離の標準偏差が求められる(ス
テップ86)。そして、その標準偏差が文字種kの閾値と
して閾値テーブル部30に登録される(ステップ88)。Next, by starting the matching unit 24 and the threshold value determining unit 28,
A threshold decision is made. That is, the matching unit 24 calculates the matching distance between each feature vector and the feature vector of the dictionary pattern of the character type k up to the upper N dimensions, and the threshold determination unit 28 calculates the upper N from the calculation result.
The standard deviation of the matching distance to the dimension is determined (step 86). Then, the standard deviation is registered in the threshold value table unit 30 as the threshold value of the character type k (step 88).
同様にして、他の文字種の閾値が決定され、閾値テーブ
ル部30に登録される。Similarly, thresholds for other character types are determined and registered in the threshold table unit 30.
全文字種について閾値の決定登録が完了したと判定され
る(ステップ90)、辞書作成モードの処理全体が終了す
る。When it is determined that the thresholds have been determined and registered for all character types (step 90), the entire processing in the dictionary creation mode ends.
つぎに、パターン認識モードの場合について以下に説明
する。また、このモードにおける処理の概略フローチャ
ートを第3図に示し、以下の説明において対応するステ
ップ番号を( )内に示す。Next, the case of the pattern recognition mode will be described below. Further, a schematic flowchart of the processing in this mode is shown in FIG. 3, and the corresponding step numbers are shown in parentheses in the following description.
認識対象の未知文字パターンは、パターン読み取り部10
より入力され(ステップ100)、前処理部12により前処
理(ステップ102)の後、特徴抽出部14で多層方向ヒス
トグラム法によって特徴ベクトル(たとえば256次元の
ベクトル)を抽出される(ステップ104)。The unknown character pattern to be recognized is the pattern reading unit 10
This is input (step 100), and after the preprocessing (step 102) by the preprocessing unit 12, the feature extraction unit 14 extracts a feature vector (for example, a 256-dimensional vector) by the multi-direction histogram method (step 104).
この特徴ベクトルは、並べ替え部16によって並べ替えテ
ーブルに従い成分が並べ替えられ、その並べ替え後の特
徴ベクトルYnがマッチング部24に入力される(ステップ
106)。The components of this feature vector are rearranged according to the rearrangement table by the rearrangement unit 16, and the rearranged feature vector Yn is input to the matching unit 24 (step
106).
マッチング24において、文字種kの辞書パターンの特徴
ベクトルFknと、未知パターンの特徴ベクトルYnとの上
位N次元までのマッチング距離dが演算される(ステッ
プ108)。そして、そのマッチング距離dと、閾値テー
ブル部30に登録されている対応文字種kの閾値Thkとの
比較判定が行われる(ステップ110)。In the matching 24, the matching distance d between the feature vector Fkn of the dictionary pattern of the character type k and the feature vector Yn of the unknown pattern to the upper N dimensions is calculated (step 108). Then, the matching distance d is compared with the threshold Thk of the corresponding character type k registered in the threshold table unit 30 (step 110).
d>Thkであれば、その未知パターンの文字種と現在の
文字種kである可能性はないので、その辞書パターンと
のマッチング処理を中断し、終了判定を行う(ステップ
116)。If d> Thk, there is no possibility that the character type of the unknown pattern is the current character type k, so the matching process with the dictionary pattern is interrupted and the end determination is performed (step
116).
d≦Thkであれば、現在の文字種は未知文字パターンの
文字種である可能性が高いので、詳細マッチングが行わ
れる。すなわち、全次元についてマッチング距離Dが演
算される(ステップ112)。そして、その距離Dと、そ
れまでの候補の距離とが比較され、距離が小さいほうの
文字種が新しい候補として残され(ステップ114)、終
了判定のステップ116に進む。If d ≦ Thk, there is a high possibility that the current character type is the character type of the unknown character pattern, so detailed matching is performed. That is, the matching distance D is calculated for all dimensions (step 112). Then, the distance D is compared with the distances of the candidates up to that point, the character type with the smaller distance is left as a new candidate (step 114), and the process proceeds to step 116 of the end determination.
ステップ116において、マッチングすべき文字種が残っ
ていると判定されると、次の文字種についてステップ10
8以降のマッチング処理が行われる。When it is determined in step 116 that the character type to be matched remains, the step 10 for the next character type is performed.
Matching processing after 8 is performed.
すべての文字種についてマッチング処理が行われると、
ステップ116で終了と判定され、最終的に残った候補の
文字種の文字コードが認識結果として出力される。これ
で、一つの未知文字パターンの認識処理を完了する。When matching processing is performed for all character types,
In step 116, it is determined that the process has ended, and the character code of the finally remaining candidate character type is output as the recognition result. This completes the recognition process for one unknown character pattern.
さて、手書き漢字などの文字の変形の傾向や程度は、記
入者(認識システムの使用者)によって様々である。こ
れに対処するために、様々な文字変形を考慮した文字パ
ターンを用意し、辞書作成に用いる。Now, the tendency and degree of deformation of characters such as handwritten Chinese characters vary depending on the writer (user of the recognition system). In order to deal with this, character patterns considering various character transformations are prepared and used for dictionary creation.
しかし、そのようにしても、使用者によって、その手書
き文字パターンと辞書パターンのマッチングの良し悪し
がある。また、同一の使用者でも、認識システムに対し
慣れるに従い、辞書とのマッチング性が向上し、認識率
が高く成る傾向が認められる。However, even in such a case, depending on the user, matching between the handwritten character pattern and the dictionary pattern is good or bad. Also, even the same user tends to improve the matching property with the dictionary and increase the recognition rate as the user gets used to the recognition system.
このような点に着目すると、詳細マッチングを行うか否
かの判定のための閾値を変更できると好都合である。す
なわち、辞書とマッチングの良使用者の場合または慣れ
た使用者の場合、判定閾値を下げて詳細マッチングの頻
度を下げることにより、認識率を下げることなく、認識
速度を上げることができる。Focusing on such a point, it is convenient that the threshold for determining whether or not to perform the detailed matching can be changed. That is, in the case of a good user of matching with the dictionary or a user who is accustomed to the matching, the recognition speed can be increased without lowering the recognition rate by lowering the determination threshold and lowering the frequency of detailed matching.
次に、このような閾値の調整を可能とした本発明の第2
実施例について説明する。なお、この実施例の機能的構
成は前記実施例と同様であるので、そのブロック図は省
略し、以下の説明において必要に応じ第1図を参照す
る。Next, the second aspect of the present invention that enables such a threshold adjustment
Examples will be described. Since the functional configuration of this embodiment is the same as that of the above embodiment, its block diagram is omitted, and FIG. 1 is referred to in the following description as necessary.
この実施例においては、辞書作成モードにおいて、前記
実施例と同様に、並べ替えテーブルと辞書が作成され
る。たゞし、詳細マッチングを行うか否かの判定のため
の閾値が、文字種毎に複数種類決定される。In this embodiment, in the dictionary creation mode, the sorting table and the dictionary are created as in the previous embodiments. However, a plurality of thresholds for determining whether or not to perform the detailed matching are determined for each character type.
この点について、前記第1実施例に関連した第2図のフ
ローチャートを参照して説明すれば、ステップ88におい
て決定される閾値をThkとすれば、この実施例にあって
は、Thk/1,Thk/2〜Thk/L(Lは正の整数)の値が、それ
ぞれ文字種kの閾値Thk(1),Thk(2)〜Thk(L)と
して閾値決定部28により決定され、閾値テーブル部30に
登録される。This point will be described with reference to the flowchart of FIG. 2 related to the first embodiment. If the threshold value determined in step 88 is Thk, in this embodiment, Thk / 1, The values of Thk / 2 to Thk / L (L is a positive integer) are determined by the threshold determination unit 28 as the thresholds Thk (1) and Thk (2) to Thk (L) of the character type k, respectively, and the threshold table unit 30. Be registered with.
第4図は、この実施例におけるパターン認識モードの概
略フローチャートである。この図を参照し、この実施例
におけるパターン認識モードについて説明する。FIG. 4 is a schematic flow chart of the pattern recognition mode in this embodiment. The pattern recognition mode in this embodiment will be described with reference to this drawing.
この実施例においては、閾値の選択のためのパラメータ
であるユーザレベルUL(=1,2,3,…,L)が最初のステッ
プ200で設定される。このユーザレベルULは、この実施
例に係るパターン認識システムの使用者側で指定できる
ものである。In this embodiment, the user level UL (= 1, 2, 3, ..., L), which is a parameter for selecting the threshold value, is set in the first step 200. The user level UL can be specified by the user of the pattern recognition system according to this embodiment.
ステップ202からステップ210までは、第3図のステップ
100からステップ108までと同一内容である。ステップ21
4からステップ220までは、第3図のステップ112からス
テップ118までと同一内容である。Steps 202 to 210 are the steps shown in FIG.
The contents are the same as 100 to step 108. Step 21
Steps 4 to 220 have the same contents as steps 112 to 118 in FIG.
ステップ212は、上位N次元までのマッチング距離から
詳細マッチングを行うか否かを判定するためのステップ
であり、第3図のステップ110と対応する。この実施例
の場合、文字種kの複数の閾値Th(1)〜Th(L)の中
から、ユーザレベルULに対応する一つの閾値Th(UL)
が、その判定の閾値として用いられる。Step 212 is a step for determining whether or not to perform detailed matching from the matching distance to the upper N dimensions, and corresponds to step 110 in FIG. In the case of this embodiment, one threshold value Th (UL) corresponding to the user level UL is selected from a plurality of threshold values Th (1) to Th (L) of the character type k.
Is used as a threshold for the determination.
つまり、この実施例に係わるパターン認識システムに慣
れた使用者の場合、ユーザレベルULを高いレベル(最高
はL)に指定すれば、より小さい閾値(最低はTh
(L))が選択されて判定に用いられるから、詳細マッ
チング(ステップ214)に進む頻度が少なくなり、それ
だけマッチング効率が向上して文字認識速度が上がる。That is, in the case of a user who is familiar with the pattern recognition system according to this embodiment, if the user level UL is designated as a high level (the highest is L), a smaller threshold value (the lowest is Th.
(L)) is selected and used for the determination, the frequency of proceeding to the detailed matching (step 214) is reduced, the matching efficiency is improved and the character recognition speed is increased accordingly.
逆に、慣れていない使用者または辞書とのマッチングの
良くない使用者の場合、低いユーザレベルUL(最低は
1)を指定すれば、大きい閾値(最高はThk(1))が
選択されて判定に用いられ、詳細マッチングの頻度が上
がるから、認識速度は落ちるが認識率を上げることがで
きる。On the other hand, if the user is unfamiliar or has poor matching with the dictionary, if a low user level UL (lowest is 1) is specified, a large threshold value (highest is Thk (1)) is selected and judged. Since the frequency of detailed matching increases, the recognition speed decreases but the recognition rate can be increased.
さて、前述のように、認識率は使用者によって変動する
が、さらに文字種によっても変動する。これは、辞書作
成用のパターンとして、ある癖を持ったパターンが用い
られた場合などに顕著であるが、このような点は漢字の
ように文字種が多い場合、辞書作成段階ではチェックが
困難である。As described above, the recognition rate varies depending on the user, but also varies depending on the character type. This is remarkable when a pattern with a certain habit is used as a pattern for dictionary creation, but such a point is difficult to check at the dictionary creation stage when there are many character types such as Kanji. is there.
そのような文字種ごとの認識率の変動を吸収することが
できる。本発明の第3実施例について以下に説明する。
なお、この実施例に係るパターン認識システムの機能的
構成は前記第1実施例と同様である。また、辞書作成モ
ードの処理は前記第2実施例と同様であり、文字種毎に
複数種類の判定用閾値Th(1)〜Th(L)が決定され
る。It is possible to absorb such a variation in the recognition rate for each character type. The third embodiment of the present invention will be described below.
The functional configuration of the pattern recognition system according to this embodiment is the same as that of the first embodiment. The processing in the dictionary creation mode is similar to that in the second embodiment, and a plurality of types of determination thresholds Th (1) to Th (L) are determined for each character type.
第5図は、この実施例におけるパターン認識モードの処
理の概略フローチャートである。この図において、ステ
ップ300〜308は第4図のステップ202〜210と同一内容で
あり、ステップ314〜320も第4図のステップ214〜220と
同一内容である。FIG. 5 is a schematic flowchart of the processing in the pattern recognition mode in this embodiment. In this figure, steps 300 to 308 have the same contents as steps 202 to 210 in FIG. 4, and steps 314 to 320 have the same contents as steps 214 to 220 in FIG.
ステップ310では、文字種毎のレベルLV(k)が、閾値
選択用のパラメータVとして設定される。このレベルLV
(k)は、例えばパターン認識システムの運用中に文字
種kのリジェクト・認識率Rkを蓄えておき、そのPk値を
ある定数で割り算した値として与えられる。In step 310, the level LV (k) for each character type is set as the threshold selection parameter V. This level LV
(K) is given as a value obtained by storing the reject / recognition rate Rk of the character type k during operation of the pattern recognition system and dividing the Pk value by a certain constant.
そして、ステップ312は第4図のステップ212に対応する
ステップであり、文字種kの複数の閾値Thk(1)〜Th
(L)の中から、パラメータVに対応する一つの閾値Th
k(V)を選択し、距離dと比較することにより詳細マ
ッチング(ステップ314)に進むか否かを判定する。Then, step 312 is a step corresponding to step 212 in FIG. 4, and is a plurality of thresholds Thk (1) to Thk of the character type k.
One threshold Th corresponding to the parameter V from (L)
It is determined whether or not to proceed to the detailed matching (step 314) by selecting k (V) and comparing it with the distance d.
なお、この実施例と、前記第2実施例とを組み合わせた
第4の実施例について、便宜上、第5図のフローチャー
トを参照して説明する。A fourth embodiment, which is a combination of this embodiment and the second embodiment, will be described with reference to the flowchart of FIG. 5 for convenience.
この実施例にあっては、ステップ300の前にユーザレベ
ルULの設定ステップ(第4図のステップ200に相当)が
追加される。また、ステップ310において、文字種kの
レベルLV(k)とユーザレベルULとの和がパラメータV
として設定される。そして、ステップ312において、パ
ラメータVに対応する閾値Thk(V)が判定に用いられ
る。In this embodiment, a user level UL setting step (corresponding to step 200 in FIG. 4) is added before step 300. In step 310, the sum of the level LV (k) of the character type k and the user level UL is the parameter V.
Is set as. Then, in step 312, the threshold Thk (V) corresponding to the parameter V is used for the determination.
これ以外は、前記各実施例と同様である。Other than this, it is the same as each of the above-mentioned embodiments.
この実施例によれば、使用者および文字種による変動要
因を吸収し、最適な閾値を用いて詳細マッチングを行う
か否かの判定を行うことができるので、前記第2実施例
と第3実施例の両方の利点が得られる。According to this embodiment, since it is possible to absorb the variation factors depending on the user and the character type and determine whether or not to perform the detailed matching using the optimum threshold value, the second and third embodiments described above. Both advantages are obtained.
以上、本発明の実施例について説明したが、本発明はそ
れだけに限定されるものではなく、その要旨を逸脱しな
い範囲内で種々変形して実施し得るものである。Although the embodiments of the present invention have been described above, the present invention is not limited thereto and can be variously modified and implemented without departing from the scope of the invention.
また、前記各実施例は、文字パターンを認識対象とした
が、本発明は文字パターンに限らず、音声などパターン
全般の認識に同様に適用できることは、以上の説明から
明らかである。Further, in each of the above embodiments, the character pattern is recognized, but it is apparent from the above description that the present invention is not limited to the character pattern and can be similarly applied to the recognition of all patterns such as voice.
以上の説明から明らかなように、本発明によれば、多層
方向ヒストグラム法によるマッチング効率を大幅に向上
し、パターン認識時間を短縮できるなどの効果が得られ
る。As is clear from the above description, according to the present invention, it is possible to obtain the effects that the matching efficiency by the multi-direction histogram method is significantly improved and the pattern recognition time can be shortened.
第1図は本発明の一実施例の機能的構成を簡略化して示
す簡略ブロック図、第2図は同実施例における辞書作成
処理の概略フローチャート、第3図は同実施例における
パターン認識処理の概略フローチャート、第4図は本発
明の他の実施例におけるパターン認識処理の概略フロー
チャート、第5図は本発明のさらに他の実施例における
パターン認識処理の概略フローチャート、第6図は多層
方向ヒストグラム法における特徴ベクトルの性質を説明
するためのベクトル図である。 10……パターン読み取り部、12……前処理部、 14……特徴抽出部、16……並べ替え部、 18……並べ替えテーブル部、20……辞書作成部、22……
辞書、24……マッチング部、 26……並べ替えテーブル作成部、 38……閾値決定部、30……閾値テーブル部。FIG. 1 is a simplified block diagram showing a simplified functional configuration of an embodiment of the present invention, FIG. 2 is a schematic flowchart of a dictionary creating process in the same embodiment, and FIG. 3 is a pattern recognition process in the same embodiment. 4 is a schematic flowchart of pattern recognition processing in another embodiment of the present invention, FIG. 5 is a schematic flowchart of pattern recognition processing in yet another embodiment of the present invention, and FIG. 6 is a multi-direction histogram method. 3 is a vector diagram for explaining the property of a feature vector in FIG. 10 …… Pattern reading section, 12 …… Preprocessing section, 14 …… Feature extraction section, 16 …… Sorting section, 18 …… Sorting table section, 20 …… Dictionary creating section, 22 ……
Dictionary, 24 ... matching section, 26 ... rearrangement table creating section, 38 ... threshold value determining section, 30 ... threshold value table section.
Claims (5)
ン種の仮辞書パターンの特徴ベクトルを得て、その仮辞
書パターンの特徴ベクトルの成分を標準偏差または分散
の大きい順に並べ替えたベクトルを辞書パターンの特徴
ベクトルとし、 パターン種毎に複数のパターンから多層方向ヒストグラ
ム法によって特徴ベクトルをそれぞれ抽出して、その成
分を前記標準偏差または分散の大きい順に並べかえたベ
クトルと、同一パターン種の前記辞書パターンの特徴ベ
クトルとの上位N次元までのマッチング距離の標準偏差
または分散に基づいてパターン種毎の閾値を決定し、 未知パターンから多層方向ヒストグラム法によって抽出
した特徴ベクトルの成分を前記標準偏差または分散の大
きい順に並べ替えたベクトルと、各パターン種の前記辞
書パターンの特徴ベクトルとのマッチングを上位N次元
まで行い、そのマッチング距離と当該パターン種の前記
閾値とを比較し、その比較結果によって当該パターン種
に関してさらに下位次元までの詳細マッチングを行うか
否かを判定することを特徴とするパターン認識方法。1. A method in which feature vectors of temporary dictionary patterns of all pattern types are obtained by the multi-directional histogram method, and the vector of the feature vector components of the temporary dictionary pattern is rearranged in descending order of standard deviation or variance. As a vector, a feature vector is extracted from a plurality of patterns for each pattern type by the multi-direction histogram method, and the components are arranged in descending order of standard deviation or variance, and a feature vector of the dictionary pattern of the same pattern type. The threshold value for each pattern type is determined based on the standard deviation or variance of the matching distances to the upper N dimensions of and, and the components of the feature vector extracted from the unknown pattern by the multi-direction histogram method are arranged in descending order of the standard deviation or variance. Replaced vector and the dictionary for each pattern type Matching with the characteristic vector of the turn is performed up to the upper N dimensions, the matching distance is compared with the threshold value of the pattern type, and whether the detailed matching is performed for the pattern type to the lower dimension is determined based on the comparison result. A pattern recognition method characterized by judging.
の中の一つの閾値が選択されて、詳細マッチングを行う
か否かの判定に用いられることを特徴とする特許請求の
範囲第1項に記載のパターン認識方法。2. A plurality of threshold values for each pattern type are determined, and one of the threshold values is selected and used for determining whether or not to perform detailed matching. The pattern recognition method described in the item.
ン種に共通のパラメータに従って行われることを特徴と
する特許請求の範囲第2項に記載のパターン認識方法。3. The pattern recognition method according to claim 2, wherein the selection of the threshold value used for the determination is performed according to a parameter common to all pattern types.
種毎のパラメータに従って行われることを特徴とする特
許請求の範囲第2項に記載のパターン認識方法。4. The pattern recognition method according to claim 2, wherein the threshold value used for the determination is selected according to a parameter for each pattern type.
ン種に共通のパラメータおよびパターン種毎のパラメー
タに従って行われることを特徴とする特許請求の範囲第
2項に記載のパターン認識方法。5. The pattern recognition method according to claim 2, wherein the selection of the threshold value used for the determination is performed according to a parameter common to all pattern types and a parameter for each pattern type.
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP61144486A JPH0711819B2 (en) | 1986-06-20 | 1986-06-20 | Pattern recognition method |
| KR1019870006252A KR910000786B1 (en) | 1986-06-20 | 1987-06-19 | Pattern recognition system |
| CN87104862A CN1010513B (en) | 1986-06-20 | 1987-06-20 | pattern recognition system |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP61144486A JPH0711819B2 (en) | 1986-06-20 | 1986-06-20 | Pattern recognition method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS63778A JPS63778A (en) | 1988-01-05 |
| JPH0711819B2 true JPH0711819B2 (en) | 1995-02-08 |
Family
ID=15363441
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP61144486A Expired - Fee Related JPH0711819B2 (en) | 1986-06-20 | 1986-06-20 | Pattern recognition method |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0711819B2 (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4623920B2 (en) * | 2002-07-09 | 2011-02-02 | ソニー株式会社 | Similarity calculation method and apparatus, program, and recording medium |
-
1986
- 1986-06-20 JP JP61144486A patent/JPH0711819B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JPS63778A (en) | 1988-01-05 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7519226B2 (en) | Form search apparatus and method | |
| US5633954A (en) | System and method for character recognition with normalization | |
| JP2002024836A (en) | How to extract titles from digital images | |
| JP2002207964A (en) | Image processing apparatus and method for generating binary image from multi-valued image | |
| JP3099797B2 (en) | Character recognition device | |
| JPH0711819B2 (en) | Pattern recognition method | |
| JPH0795336B2 (en) | Character recognition method | |
| JPH064704A (en) | Ruled line discriminating method and area discriminating method | |
| JPH07129713A (en) | Character recognition device | |
| JPH09138837A (en) | Form recognition device | |
| JPH0740288B2 (en) | Pattern recognition method | |
| JP2832928B2 (en) | Character recognition method | |
| JPH0740287B2 (en) | Pattern recognition method | |
| JP3868637B2 (en) | Character recognition device, dictionary creation method, and recording medium | |
| KR970002424B1 (en) | Candidate Character Classification | |
| JP2902097B2 (en) | Information processing device and character recognition device | |
| JP2827227B2 (en) | Character recognition method | |
| JPS63131287A (en) | Character recognition method | |
| JP2974396B2 (en) | Image processing method and apparatus | |
| JPH08167005A (en) | Character recognition device | |
| JP2000207491A (en) | Character string reading method and apparatus | |
| JPH0436885A (en) | Optical character reader | |
| JPH08272904A (en) | Pattern recognition device | |
| JPH0528322A (en) | Character recognition device | |
| JPH0793544A (en) | Dimension line recognizing method for automatic drawing recognizing device |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |