JP3017325B2 - How to create a dictionary for pattern recognition - Google Patents
How to create a dictionary for pattern recognitionInfo
- Publication number
- JP3017325B2 JP3017325B2 JP3161394A JP16139491A JP3017325B2 JP 3017325 B2 JP3017325 B2 JP 3017325B2 JP 3161394 A JP3161394 A JP 3161394A JP 16139491 A JP16139491 A JP 16139491A JP 3017325 B2 JP3017325 B2 JP 3017325B2
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- dictionary
- recognition
- recognition dictionary
- category
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Discrimination (AREA)
- Image Analysis (AREA)
Description
【0001】[0001]
【産業上の利用分野】本発明は、文字や音声などのパタ
ーン認識用の辞書作成方法に関し、特に、認識精度が高
い認識辞書を効率良く作成することが可能な技術に関す
るものである。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method for creating a dictionary for pattern recognition of characters and voices, and more particularly to a technique capable of efficiently creating a recognition dictionary with high recognition accuracy.
【0002】[0002]
【従来の技術】従来の文字や音声のパターン認識方法に
おいては、あらかじめ各カテゴリの標準的なパターンで
ある参照パターンを認識辞書として用意しておき、認識
させたいパターンと各カテゴリの参照パターンとの類似
性をユークリッド距離,重み付きユークリッド距離等の
評価関数を用いて計算した上で、最も類似性の高いカテ
ゴリを認識結果として出力する。2. Description of the Related Art In a conventional character or voice pattern recognition method, a reference pattern, which is a standard pattern of each category, is prepared in advance as a recognition dictionary, and a pattern to be recognized is compared with a reference pattern of each category. After calculating the similarity using an evaluation function such as a Euclidean distance or a weighted Euclidean distance, a category having the highest similarity is output as a recognition result.
【0003】あらかじめ用意しておく認識辞書として
は、参照パターンの数がカテゴリごとに一つであるシン
グルテンプレート辞書と、カテゴリごとの参照パターン
の数が複数であるマルチテンプレート辞書の2種類があ
り、それぞれの認識辞書に対して以下に挙げるような作
成方法が提案されている。There are two types of recognition dictionaries prepared in advance: a single template dictionary in which the number of reference patterns is one for each category, and a multi-template dictionary in which the number of reference patterns is plural for each category. The following creation methods have been proposed for each recognition dictionary.
【0004】1.シングルテンプレート辞書作成方法 1−.カテゴリごとにいくつかのパターンの相加平均
を求め、それを参照パターンとする方法がある。この方
法は、パターン認識技術の初期に使用されたごく単純な
方法である。[0004] 1. Single template dictionary creation method 1-. There is a method of calculating an arithmetic mean of several patterns for each category and using the arithmetic mean as a reference pattern. This is a very simple method used in the early days of pattern recognition technology.
【0005】1−.前記1−の方法で認識辞書を求
めた後に、この認識辞書で学習パターンを認識させ、誤
認識が最少になるように参照パターンの位置を最適化す
るという処理を繰り返し行う方法である。最適化の方法
として、LSI(大規模半導体集積回路)のレイアウト
設計などで適用されているシミュレーティドアニーリン
グ法を採用したものが提案されている〔松永,阿部,木
田:“シミュレーテッドアニーリング法を用いた文字認
識辞書の最適化”,信学技法,PRU90-39(1990)〕。1-. After the recognition dictionary is obtained by the above method 1, a process of recognizing a learning pattern with the recognition dictionary and optimizing the position of the reference pattern so as to minimize erroneous recognition is repeatedly performed. As an optimization method, a method employing a simulated annealing method applied to layout design of LSI (large-scale semiconductor integrated circuit) has been proposed [Matsunaga, Abe, Kida: "Simulated annealing method Optimization of the character recognition dictionary used ”, IEICE, PRU90-39 (1990)].
【0006】2.マルチテンプレート辞書作成方法 2−.前記1−の方法で、認識辞書を求めた後に、
この認識辞書で学習パターンを認識させ、正しく読めな
かったパターンをそのまま認識辞書に新規追加すること
によって辞書を作成する方法である。類似した方法で、
辞書サイズをできる限り小さくするために、誤読パター
ン1つに対して1つの参照パターンを設けるのではな
く、複数の誤読パターンの平均を追加する方法も提案さ
れている〔井出,若原:“文字認識におけるサブカテゴ
リ生成法の一検討”,1990年電子情報通信学会秋季全国
大会論文集,D-348, p.6-350(1990)〕。[0006] 2. Multi-template dictionary creation method 2-. After obtaining the recognition dictionary by the method 1-,
In this method, a dictionary is created by recognizing a learning pattern with the recognition dictionary and newly adding a pattern that cannot be read correctly to the recognition dictionary. In a similar way,
In order to make the dictionary size as small as possible, instead of providing one reference pattern for each misread pattern, a method of adding an average of a plurality of misread patterns has also been proposed [Ide, Wakahara: "Character Recognition" Study of Sub-Category Generation Method in IEICE ", Proc. Of the IEICE Autumn National Convention 1990, D-348, p.6-350 (1990)].
【0007】2−.各カテゴリのパターン分布を忠実
に表現するために、カテゴリごとに学習パターンのクラ
スタリングを行って、各グループでパターンの相加平均
をとってそれを参照パターンとして認識辞書を作成する
方法である。クラスタリング手法としてWard法など
を使った辞書作成方法が提案されている〔大倉,塩野:
“カテゴリー内クラスタリング多重辞書類似度法の辞書
パターン作成の一検討”,信学論D−II,Vol.J72-D-I
I, No.4, pp.499-506(1989)〕。2-. In order to faithfully represent the pattern distribution of each category, this is a method of clustering learning patterns for each category, taking an arithmetic mean of patterns in each group, and creating a recognition dictionary using the patterns as a reference pattern. A dictionary creation method using the Ward method or the like has been proposed as a clustering method [Okura, Shiono:
"Study on Dictionary Pattern Creation by Clustering Multiple Dictionaries Similarity Method in Category", IEICE D-II, Vol.J72-DI
I, No. 4, pp. 499-506 (1989)].
【0008】2−.前記2−の方法で認識辞書を作
成した後に、誤認識が最少となるように参照パターンの
移動による認識辞書の最適化を行う方法である。代表的
な最適化の方法としてこの認識辞書で学習パターンを認
識させて正しく読めなかった場合には、正しく読まれる
べきカテゴリで最も距離の近い参照パターンをその学習
パターンに近づけ、誤って読まれたカテゴリの参照パタ
ーンを遠ざける処理を繰り返し行うことによって誤読が
最少になるように認識辞書を作成するLVQ法(学習ベ
クトル量子化法)が提案されている〔T. Kohonen, G. B
arna and R. Chrisley : “Statistical pattern recog
nition with newral networks”, benchmarking studie
s, IEEE, Proc. of ICNN, Vol.1, pp.61-68(1988)〕。2-. This is a method of optimizing the recognition dictionary by moving the reference pattern so as to minimize erroneous recognition after creating the recognition dictionary by the method 2-. As a typical optimization method, if a recognition pattern is recognized by this recognition dictionary and it cannot be read correctly, the closest reference pattern in the category that should be read correctly is brought close to the learning pattern and read incorrectly. An LVQ method (learning vector quantization method) has been proposed which creates a recognition dictionary so as to minimize misreading by repeatedly performing a process of keeping a category reference pattern away [T. Kohonen, GB
arna and R. Chrisley: “Statistical pattern recog
nition with newral networks ”, benchmarking studie
s, IEEE, Proc. of ICNN, Vol. 1, pp. 61-68 (1988)].
【0009】[0009]
【発明が解決しようとする課題】前記1−のように単
に平均パターンを参照パターンにする従来方法では、辞
書サイズは、コンパクトであるという利点があるもの
の、カテゴリ間のパターン分布が異なる場合には認識精
度が著しく低下するという問題がある。その点、1−
の方法では、辞書サイズが小さいという利点を維持しつ
つ、カテゴリ間のパターン分布の違いを考慮して認識精
度が高くなるように辞書を最適化しているという点です
ぐれている。しかしながら、パターン分布が複雑でカテ
ゴリ間で入り組み合っている場合や、連続でなく分離し
ているような場合は、1つの参照パターンでは対処でき
ず、やはり認識精度の低下を招いてしまうという問題が
ある。In the conventional method of simply using an average pattern as a reference pattern as described in 1 above, there is an advantage that the dictionary size is compact, but when the pattern distribution between categories is different, the dictionary size is small. There is a problem that recognition accuracy is significantly reduced. That point, 1-
The method of (1) is excellent in that the dictionary is optimized so as to increase recognition accuracy in consideration of the difference in pattern distribution between categories while maintaining the advantage that the dictionary size is small. However, when the pattern distribution is complicated and intermingled between categories, or when the pattern distribution is not continuous but separated, there is a problem that a single reference pattern cannot cope with the pattern distribution, which also lowers the recognition accuracy. is there.
【0010】一方、前記2の方法は、カテゴリごとに複
数の参照パターンを持つことができるので、前記1の方
法のような問題点を解決することが可能である。しか
し、前記2−の方法については、基本的に各誤読パタ
ーンごとに参照パターンを追加しなければならず、十分
な認識精度を得るためには非常に多くの参照パターンが
必要である。また、同様の理由で作成された認識辞書の
サイズは非常に大きくなってしまうという問題がある。
前記2−の方法では、クラスタリング手法を用いて複
数の参照パターンによって、複雑なパターン分布を表現
することを可能にしているものの、カテゴリ間のパター
ン分布は考慮していないために必ずしも認識精度の向上
につながらない。また、参照パターンの数は、カテゴリ
内及びカテゴリ間のパターン分布を考慮して決定すべき
ものであるにもかかわらず、カテゴリごとであらかじめ
設定しておかなければならないために、適度な参照パタ
ーン数を得るには、試行錯誤的に決定するしかないの
で、辞書作成に膨大な時間を要するという問題がある。
また、前記2−の方法では、誤読パターンを正しく認
識できるように参照パターンの位置の最適化を行ってお
り、カテゴリ間のパターン分布を意識した方法となって
いるものの、この方法は、初期辞書を前記2−の方法
で求め、かつ参照パターンの数はアルゴリズム中で不変
であるので、前記2−の方法と同様に参照パターン数
の設定において問題がある。On the other hand, the second method can have a plurality of reference patterns for each category, and thus can solve the problems as in the first method. However, in the method (2), basically, a reference pattern must be added for each misreading pattern, and a very large number of reference patterns are required to obtain sufficient recognition accuracy. In addition, there is a problem that the size of the recognition dictionary created for the same reason becomes very large.
In the method (2), although a complex pattern distribution can be expressed by a plurality of reference patterns using a clustering method, the recognition accuracy is not necessarily improved because the pattern distribution between categories is not considered. Does not lead to In addition, although the number of reference patterns should be determined in consideration of the pattern distribution within and between categories, an appropriate number of reference patterns must be set in advance for each category. The only way to obtain it is to determine it by trial and error, so that there is a problem that it takes an enormous amount of time to create a dictionary.
In the method (2), the position of the reference pattern is optimized so that the misread pattern can be correctly recognized, and the method is conscious of the pattern distribution between the categories. Is obtained by the method 2-, and the number of reference patterns is invariant in the algorithm. Therefore, there is a problem in setting the number of reference patterns as in the method 2-.
【0011】本発明は、前記問題点を解決するためにな
されたものであり、本発明の目的は、認識精度の高い認
識辞書を効率よく作成することが可能な技術を提供する
ことにある。SUMMARY OF THE INVENTION The present invention has been made to solve the above problems, and an object of the present invention is to provide a technique capable of efficiently creating a recognition dictionary with high recognition accuracy.
【0012】本発明の他の目的は、カテゴリ内だけでな
くカテゴリ間のパターン分布をも考慮しながら、参照パ
ターンの位置の最適化とカテゴリごとの参照パターン数
の設定を自動で行うことが可能な技術を提供することに
ある。Another object of the present invention is to automatically optimize the position of the reference pattern and set the number of reference patterns for each category while taking into account not only the pattern distribution within the category but also the pattern distribution between the categories. It is to provide various technologies.
【0013】本発明の前記ならびにその他の目的と新規
な特徴は、本明細書の記述及び添付図面によって明らか
にする。The above and other objects and novel features of the present invention will become apparent from the description of the present specification and the accompanying drawings.
【0014】[0014]
【課題を解決するための手段】前記目的を達成するため
に、本発明の(1)の手段は、文字や音声などのパター
ンを認識する際に用いる、各カテゴリの参照パターンの
集合である認識用辞書作成方法であって、あらかじめカ
テゴリごとに1個の参照パターンを有する初期の認識辞
書を作成する第1段階と、参照パターンの移動を行うこ
とによって認識辞書の更新を行う第2段階と、参照パタ
ーンの不足を表す関数が規定値以上になった場合に、移
動を行った参照パターンを認識辞書に新たに追加する第
3段階とを有し、前記第2段階と第3段階を学習パター
ンの誤読がなくなるか、あるいは設定した学習回数に達
するまで繰り返すことを最も主要な特徴とする。In order to achieve the above object, the means (1) of the present invention is a recognition method which is a set of reference patterns of each category used when recognizing patterns such as characters and voices. a use dictionary creation method, a first step of creating an initial recognition dictionary having one of the reference pattern in advance for each category, a second step of updating the recognition dictionary by performing the movement of references pattern When the function indicating the shortage of reference patterns exceeds the specified value,
And a third step of newly adding the moved reference pattern to the recognition dictionary, and repeating the second step and the third step until erroneous reading of the learning pattern is eliminated or the set number of times of learning is reached. The most important feature.
【0015】前述の手段(2)は、前記パターン認識用
辞書作成方法において、参照パターンの不足を表す関数
として参照パターンの移動回数を用い、移動回数があら
かじめ決められている所定の回数に達したならば所定の
回数分移動を繰り返した参照パターンを認識辞書に新た
に追加することを特徴とする。The above means (2) uses the number of movements of the reference pattern as a function indicating the shortage of the reference pattern in the method of creating a dictionary for pattern recognition, and the number of movements reaches a predetermined number of times . Then given
It is characterized in that a reference pattern that has been moved a number of times is newly added to the recognition dictionary.
【0016】[0016]
【作用】前述の(1)の手段によれば、カテゴリごとに
1個の参照パターンをもつ認識辞書を初期辞書として学
習を行い、参照パターンが不足している部分(カテゴ
リ)にのみ参照パターンを追加していくことによって、
カテゴリ内及びカテゴリ間のパターン分布を考慮した上
でカテゴリごとの適度な参照パターン数を自動で設定で
きる。このことは認識辞書の作成を効率よく行うことが
可能であることを意味するとともに、カテゴリ内のパタ
ーンが分離しているような複雑な分布も表現できること
を意味している。また、参照パターンの位置は、誤認識
ができる限り少なくなるような位置に最適化するので、
認識精度の大幅な向上も期待できる。According to the above-mentioned means (1), learning is performed by using a recognition dictionary having one reference pattern for each category as an initial dictionary, and reference patterns are assigned only to portions (categories) where reference patterns are insufficient. By adding
An appropriate number of reference patterns for each category can be automatically set in consideration of the pattern distribution within and between categories. This means that it is possible to efficiently create a recognition dictionary, and it is also possible to express a complicated distribution in which patterns in a category are separated. In addition, the position of the reference pattern is optimized to a position where misrecognition is minimized as much as possible.
Significant improvement in recognition accuracy can also be expected.
【0017】(2)の手段によれば、前記記載の作用に
加えて、参照パターンの不足しているカテゴリは、その
カテゴリの参照パターンの移動回数が多いと考えられて
いるので、移動回数の多さを評価関数にすることによっ
て、参照パターンが不足している部分(カテゴリ)を的
確にかつ自動で設定することができる。また、参照パタ
ーンの移動回数は、移動するごとにその回数だけでよい
ので手間はかからず、更に参照パターン数が不足してい
るかどうかも、移動回数≧k(kはあらかじめ決められ
ている、参照パターン数が不足していると判断される基
準値)を評価するだけでよいので、辞書作成時間を短縮
することができる。According to the means (2), in addition to the above-described operation, a category having a shortage of reference patterns is considered to have a large number of movements of the reference pattern of the category. By using the number as the evaluation function, a portion (category) where the reference pattern is insufficient can be set accurately and automatically. In addition, the number of movements of the reference pattern need only be the number of movements each time the movement is performed. Therefore, no trouble is required. Furthermore, whether or not the number of reference patterns is insufficient is determined by the number of movements ≧ k (k is predetermined. It is only necessary to evaluate a reference value (a reference value determined to be insufficient for the number of reference patterns), so that it is possible to shorten the dictionary creation time.
【0018】[0018]
【実施例】以下、図面を参照して、本発明の実施例を詳
細に説明する。Embodiments of the present invention will be described below in detail with reference to the drawings.
【0019】図1は、本発明のパターン認識用辞書作成
方法の実施例の機能構成を示すブロック図、図2は、本
実施例のパターン認識用辞書作成方法の処理手順を示す
フローチャート、図3Aは、本実施例のパターン認識用
辞書作成方法が適用されるパターン情報処理装置の概略
ハード構成を示すブロック図、図3Bは、本実施例のパ
ターン認識用辞書作成方法を用いたパターン認識処理の
機能構成を示すブロック図である。FIG. 1 is a block diagram showing a functional configuration of an embodiment of a pattern recognition dictionary creation method according to the present invention. FIG. 2 is a flowchart showing a processing procedure of the pattern recognition dictionary creation method of the embodiment. FIG. 3B is a block diagram illustrating a schematic hardware configuration of a pattern information processing apparatus to which the pattern recognition dictionary creation method according to the present embodiment is applied. FIG. 3B is a diagram illustrating a pattern recognition process using the pattern recognition dictionary creation method according to the embodiment. FIG. 3 is a block diagram illustrating a functional configuration.
【0020】本実施例のパターン認識用辞書作成方法が
適用されるパターン情報処理装置は、図3Aに示すよう
に、パターン入力装置10、情報処理・制御装置20、
ファイル用記憶装置30、ディスプレイ装置,プリン
タ,ディスク等の出力装置40で構成されている。そし
て、前記情報処理・制御装置20としては、例えば、コ
ンピュータが使用され、中央処理装置(CPU)20
1、主メモリ202で構成されている。この情報処理・
制御装置20を使用してパターン認識処理を行う場合の
機能構成は、図3Bに示すように、前処理部203、特
徴抽出部204、辞書作成部205、認識部206で構
成される。As shown in FIG. 3A, the pattern information processing apparatus to which the pattern recognition dictionary creating method of the present embodiment is applied includes a pattern input apparatus 10, an information processing / control apparatus 20,
It comprises a file storage device 30 and an output device 40 such as a display device, a printer, and a disk. For example, a computer is used as the information processing / control device 20, and a central processing unit (CPU) 20
1. It is composed of a main memory 202. This information processing
As shown in FIG. 3B, the functional configuration in the case of performing the pattern recognition process using the control device 20 includes a preprocessing unit 203, a feature extraction unit 204, a dictionary creation unit 205, and a recognition unit 206.
【0021】本実施例である前記の辞書作成部205の
機能構成は、図1に示すように、初期辞書作成部1、学
習パターン選択部2、パターン認識部3、参照パターン
移動判定部4、参照パターン移動実行部5、参照パター
ン追加判定部6、参照パターン追加実行部7、制御部8
で構成されている。制御部8は、各部を制御するととも
に、処理終了判定及びデータ出力を行う。As shown in FIG. 1, the functional configuration of the dictionary creating unit 205 of the present embodiment is as follows: an initial dictionary creating unit 1, a learning pattern selecting unit 2, a pattern recognizing unit 3, a reference pattern movement determining unit 4, Reference pattern movement execution unit 5, reference pattern addition determination unit 6, reference pattern addition execution unit 7, control unit 8
It is composed of The control unit 8 controls each unit, and performs processing end determination and data output.
【0022】次に、本実施例のパターン認識用辞書作成
方法を、図1及び図2を参照して説明する。Next, a method for creating a dictionary for pattern recognition according to the present embodiment will be described with reference to FIGS.
【0023】認識辞書の最適化の方法としてはいくつか
考えられるが、ここではLVQ法で行われている方法を
用いることとする。LVQ法はパターン認識におけるマ
ルチテンプレート辞書を作成するのに用いられる方法
で、クラスタリング手法で初期辞書を作成した後に、学
習パターンを認識させ、正しく認識できず、かつその学
習パターンが正読側参照パターンと誤読側参照パターン
との識別境界付近に存在する場合に、正しく認識される
べきカテゴリの参照パターンの中で最も距離が近い参照
パターンを近づけ、誤って認識されたカテゴリの参照パ
ターンを遠ざけるという手段を繰り返し行うことによっ
て認識辞書の位置の最適化を行う方法である。参照パタ
ーンの具体的な移動は、以下の及び式によって行わ
れる。なお、この式はパターンを表現している特徴ベク
トルの1次元での移動式であるから、各特徴軸ごとでこ
の移動式を実行する必要がある。 〔正読側〕m(t)=m(t−1)+α(t)*(x−m(t−1)) ・・・ 〔誤読側〕m(t)=m(t−1)−α(t)*(x−m(t−1)) ・・・ m(t) :時刻tの参照パターン m(t−1):時刻t−1の参照パターン x :学習パターン α(t) :減少関数〔0<α(t)<1〕 上記条件の下における本実施例の処理フローを図2に示
し、そのアルゴリズムを以下に説明する。There are several possible methods for optimizing the recognition dictionary. Here, the method used in the LVQ method is used. The LVQ method is a method used to create a multi-template dictionary in pattern recognition. After an initial dictionary is created by a clustering method, a learning pattern is recognized and cannot be correctly recognized. Means that the closest reference pattern among the reference patterns of the category to be correctly recognized is brought closer and the reference pattern of the erroneously recognized category is moved away when the reference pattern exists near the discrimination boundary between the reference pattern and the misreading side reference pattern. Is performed repeatedly to optimize the position of the recognition dictionary. The specific movement of the reference pattern is performed by the following equation. Since this equation is a one-dimensional moving equation of the feature vector expressing the pattern, it is necessary to execute this moving equation for each feature axis. [Regular reading side] m (t) = m (t-1) + α (t) * (x−m (t−1)) ··· [Incorrect reading side] m (t) = m (t−1) − α (t) * (x−m (t−1)) m (t): Reference pattern at time t m (t−1): Reference pattern at time t−1 x: Learning pattern α (t) : Decreasing function [0 <α (t) <1] FIG. 2 shows a processing flow of the present embodiment under the above conditions, and the algorithm thereof will be described below.
【0024】初期辞書作成部1では、カテゴリごとに1
個の参照パターンを作成し(101)、これが初期の認
識辞書M0となる(102)。学習パターン選択部2で
は、認識辞書Mを学習するための学習パターンxを1個
選択し(103)、パターン認識部3において選択した
学習パターンxの認識を行う(104)。この学習パタ
ーンxの認識を正しく認識したか否かをチェックし(1
05)、正しく認識されていれば(YES)、処理終了
かをチェックし(112)、処理終了であれば、認識辞
書Mを登録して終了する。前記ステップ105におい
て、正しく認識されていなければ(NO)、移動の対象
となる参照パターンm1,m2・・・mi・・・mnの各々
に対して以下の処理を行う。すなわち、参照パターン移
動判定部4は、選択した学習パターンxの認識結果及び
パターンとの位置関係により、参照パターンを移動する
条件が満たされているか否かの判定を行い(106)、
条件を満たしたものについては、参照パターン移動実行
部5において当該参照パターンの移動を実行する。ま
た、参照パターン移動実行部5においては、各参照パタ
ーンの移動回数を記憶しておく。参照パターン追加判定
部6では、参照パターン移動実行部5において移動が行
われた参照パターンmiに対してそれまでの移動回数が
k回に達したかどうかを判定し(107)、条件を満た
したものについては、参照パターン追加実行部7におい
て参照パターンの追加を行う(108)。条件を満たし
ていないものについては、前記参照パターン移動実行部
5により参照パターンmiの移動のみを行い(10
9)、参照パターンmiの移動回数をインクリメントす
る(110)。次に、移動対象の参照パターンmiが存
在しないか否かをチェックし(111)、存在しなけれ
ば(YES)、処理終了かをチェックし(112)、処
理終了であれば、認識辞書Mを登録して終了する。存在
すれば(NO)、ステップ106に戻して学習パターン
の誤読がなくなるか、あるいは設定した学習回数k(k
はあらかじめ決められている、参照パターン数が不足し
ていると判断される基準値)に達するまで繰り返す。In the initial dictionary creating section 1, 1 for each category
Create a number of reference patterns (101), which is the initial recognition dictionary M 0 (102). The learning pattern selection unit 2 selects one learning pattern x for learning the recognition dictionary M (103), and recognizes the selected learning pattern x in the pattern recognition unit 3 (104). It is checked whether or not the recognition of the learning pattern x has been correctly recognized (1).
05) If it is correctly recognized (YES), it is checked whether the processing is completed (112). If the processing is completed, the recognition dictionary M is registered and the processing is ended. If it is not correctly recognized in the step 105 (NO), the following processing is performed for each of the reference patterns m 1 , m 2 ... Mi. That is, the reference pattern movement determination unit 4 determines whether the condition for moving the reference pattern is satisfied based on the recognition result of the selected learning pattern x and the positional relationship with the pattern (106).
If the condition is satisfied, the reference pattern movement execution unit 5 executes the movement of the reference pattern. Further, the reference pattern movement execution unit 5 stores the number of times of movement of each reference pattern. The reference pattern addition determining unit 6 determines whether the number of movements of the reference pattern mi moved by the reference pattern movement executing unit 5 has reached k times (107), and the condition is satisfied. The reference pattern is added by the reference pattern addition execution unit 7 (108). For those which do not satisfy the conditions, the reference pattern mi is only moved by the reference pattern movement executing unit 5 (10).
9), the number of movements of the reference pattern mi is incremented (110). Next, it is checked whether or not the reference pattern mi to be moved does not exist (111). If it does not exist (YES), it is checked whether or not the processing is completed (112). Register and exit. If there is (NO), the flow returns to step 106 to eliminate the erroneous reading of the learning pattern or to set the learning number k (k
Is repeated until a predetermined reference value (a reference value for determining that the number of reference patterns is insufficient) is reached.
【0025】制御部8では、学習回数がk回に達した
か、もしくは学習パターンの誤読がなくなったかの認識
辞書の学習を終了し、その時点での認識辞書を登録す
る。The control unit 8 terminates learning of the recognition dictionary as to whether the number of times of learning has reached k or whether there has been no misreading of the learning pattern, and registers the recognition dictionary at that time.
【0026】次に、本実施例による手書き文字認識にお
ける具体例を示す。Next, a specific example of handwritten character recognition according to this embodiment will be described.
【0027】カテゴリは「因国困固回図囲囚団田」の1
0種類で、文字特徴についてはストローク構造集積法
〔赤松,川谷,塩,飯田:“手書き漢字用文字読み取り
装置”,研究実用化報告,Vol.36, No.4(1987).〕を用
いた。図4は認識辞書の学習につれて変化した学習パタ
ーンの認識精度を表しており、学習が進むにつれて誤読
数が少なくなっており、最終的にはすべての学習パター
ンを正しく認識していることがわかる。図5は、学習終
了時の認識辞書における各カテゴリの参照パターン数を
表しており、カテゴリごとに適度な参照パターン数が自
動設定されていることがわかる。The category is “1
There are 0 types, and the stroke feature integration method [Akamatsu, Kawatani, Shio, Iida: "Hand-reading kanji character reader", Research and practical report, Vol.36, No.4 (1987). . FIG. 4 shows the recognition accuracy of the learning pattern changed as the learning of the recognition dictionary is performed. As the learning progresses, the number of misreads decreases, and it can be seen that all the learning patterns are finally correctly recognized. FIG. 5 shows the number of reference patterns in each category in the recognition dictionary at the end of learning, and it can be seen that an appropriate number of reference patterns is automatically set for each category.
【0028】以上、本発明を実施例にもとづき具体的に
説明したが、本発明は、前記実施例に限定されるもので
はなく、その要旨を逸脱しない範囲において種々変更可
能であることは言うまでもない。Although the present invention has been described in detail with reference to the embodiments, it is needless to say that the present invention is not limited to the above-described embodiments and can be variously modified without departing from the scope of the invention. .
【0029】[0029]
【発明の効果】以上、説明したように、本発明によれ
ば、入力したパターンがパターン空間上でどの参照パタ
ーンと近いかによってカテゴリを認識するパターン認識
方式において、参照パターンの位置の最適化を行いつ
つ、カテゴリによっては参照パターンの追加を行うの
で、認識精度の高い認識辞書を作成することができる。
また、参照パターンの追加は、参照パターンの不足を表
す関数を評価することにより自動で行うので、従来のマ
ルチテンプレート辞書作成方式のように参照パターン数
を試行錯誤的に決定する必要はなく、辞書作成の時間を
大幅に削減することができる。As described above, according to the present invention, in a pattern recognition method for recognizing a category based on which reference pattern the input pattern is close to in the pattern space, the position of the reference pattern is optimized. In addition, since reference patterns are added depending on the category, a recognition dictionary with high recognition accuracy can be created.
In addition, since the reference pattern is added automatically by evaluating a function indicating the lack of the reference pattern, it is not necessary to determine the number of reference patterns by trial and error unlike the conventional multi-template dictionary creation method. Creation time can be greatly reduced.
【0030】また、参照パターンの不足を表す関数とし
てそれまでの各参照パターンの移動回数を用いることに
より、参照パターンが不足した部分(カテゴリ)を的確
にかつ自動で高速に見つけることができる。Further, by using the number of movements of each reference pattern up to that point as a function representing the lack of the reference pattern, a portion (category) where the reference pattern is lacking can be accurately and automatically found at a high speed.
【図1】 本発明のパターン認識用辞書作成方法の実施
例の機能構成を示すブロック図、FIG. 1 is a block diagram showing a functional configuration of an embodiment of a pattern recognition dictionary creation method according to the present invention;
【図2】 本実施例のパターン認識用辞書作成方法の処
理手順を示すフローチャート、FIG. 2 is a flowchart showing a processing procedure of a pattern recognition dictionary creation method according to the embodiment;
【図3A】 本実施例のパターン認識用辞書作成方法が
適用されるパターン情報処理装置の概略構成を示すブロ
ック図、FIG. 3A is a block diagram showing a schematic configuration of a pattern information processing apparatus to which the pattern recognition dictionary creation method of the present embodiment is applied;
【図3B】 本実施例のパターン認識用辞書作成方法を
用いたパターン認識処理の機能構成を示すブロック図、FIG. 3B is a block diagram illustrating a functional configuration of a pattern recognition process using the pattern recognition dictionary creation method according to the embodiment;
【図4】 本実施例による学習パターン認識精度を示す
グラフ、FIG. 4 is a graph showing learning pattern recognition accuracy according to the embodiment;
【図5】 本実施例によるカテゴリごとのテンプレート
数を示すグラフ。FIG. 5 is a graph showing the number of templates for each category according to the embodiment.
1…初期辞書作成部、2…学習パターン選択部、3…パ
ターン認識部、4…参照パターン移動判定部、5…参照
パターン移動実行部、6…参照パターン追加判定部、7
…参照パターン追加実行部、8…制御部、10…パター
ン入力装置、20…情報処理・制御装置、30…ファイ
ル用記憶装置、40…出力装置、201…中央処理装置
(CPU)、202…主メモリ、203…前処理部、2
04…特徴抽出部、205…辞書作成部、206…認識
部。DESCRIPTION OF SYMBOLS 1 ... Initial dictionary preparation part, 2 ... Learning pattern selection part, 3 ... Pattern recognition part, 4 ... Reference pattern movement determination part, 5 ... Reference pattern movement execution part, 6 ... Reference pattern addition determination part, 7
... Reference pattern addition execution unit, 8 control unit, 10 pattern input device, 20 information processing / control device, 30 file storage device, 40 output device, 201 central processing unit (CPU), 202 main Memory, 203: pre-processing unit, 2
04: feature extraction unit, 205: dictionary creation unit, 206: recognition unit.
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平4−205389(JP,A) 特開 平3−42767(JP,A) 特開 平3−18983(JP,A) 電子情報通信学会技術研究報告 Vo l.91 No.156 pp63−68「LV Qを用いた手書き漢字認識辞書作成方式 の検討」出本他 電子情報通信学会論文誌D−▲II▼ Vol.73 No.8 pp.1186− 1191「環境の激しい変化に適応する神経 回路網モデル」岡本 (58)調査した分野(Int.Cl.7,DB名) G06T 7/00 G06K 9/68 JICSTファイル(JOIS)────────────────────────────────────────────────── ─── Continuation of the front page (56) References JP-A-4-205389 (JP, A) JP-A-3-42767 (JP, A) JP-A-3-18983 (JP, A) IEICE Technology Research Report Vol. 91 No. 156 pp.63-68 “Study of a method for creating a handwritten kanji recognition dictionary using LV Q”, et al., IEICE Transactions on Electronics, Information and Communication Engineers D- ▲ II ▼ Vol. 73 No. 8 pp. 1186-1191 “Neural Network Model Adapting to Severe Environmental Changes” Okamoto (58) Fields investigated (Int. Cl. 7 , DB name) G06T 7/00 G06K 9/68 JICST file (JOIS)
Claims (2)
に用いる、各カテゴリの参照パターンの集合である認識
用辞書作成方法であって、あらかじめカテゴリごとに1
個の参照パターンを有する初期の認識辞書を作成する第
1段階と、参照パターンの移動を行うことによって認識
辞書の更新を行う第2段階と、参照パターンの不足を表
す関数が規定値以上になった場合に、移動を行った参照
パターンを認識辞書に新たに追加する第3段階とを有
し、前記第2段階と第3段階を学習パターンの誤読がな
くなるか、あるいは設定した学習回数に達するまで繰り
返すことを特徴とするパターン認識用辞書作成方法。1. A method for creating a recognition dictionary, which is a set of reference patterns for each category, used for recognizing patterns such as characters and voices.
A first step of creating an initial recognition dictionary having reference patterns, a second step of updating the recognition dictionary by moving the reference patterns, and a function representing a shortage of reference patterns being equal to or greater than a prescribed value. References made when moved
A third step of newly adding a pattern to the recognition dictionary, wherein the second step and the third step are repeated until erroneous reading of the learning pattern is eliminated or the set number of times of learning is reached. Dictionary creation method.
書作成方法において、参照パターンの不足を表す関数と
して参照パターンの移動回数を用い、移動回数があらか
じめ決められている所定の回数に達したならば所定の回
数分移動を繰り返した参照パターンを認識辞書に新たに
追加することを特徴とするパターン認識用辞書作成方
法。2. The pattern recognition dictionary creating method according to claim 1, wherein the number of movements of the reference pattern is used as a function indicating the shortage of the reference pattern, and the number of movements reaches a predetermined number . If the predetermined times
A method for creating a pattern recognition dictionary, characterized by newly adding a reference pattern that has been moved several minutes to a recognition dictionary.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3161394A JP3017325B2 (en) | 1991-07-02 | 1991-07-02 | How to create a dictionary for pattern recognition |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3161394A JP3017325B2 (en) | 1991-07-02 | 1991-07-02 | How to create a dictionary for pattern recognition |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH0512449A JPH0512449A (en) | 1993-01-22 |
| JP3017325B2 true JP3017325B2 (en) | 2000-03-06 |
Family
ID=15734261
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP3161394A Expired - Lifetime JP3017325B2 (en) | 1991-07-02 | 1991-07-02 | How to create a dictionary for pattern recognition |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3017325B2 (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3421469B2 (en) * | 1995-03-09 | 2003-06-30 | Kddi株式会社 | Apparatus and method for searching for similar images |
-
1991
- 1991-07-02 JP JP3161394A patent/JP3017325B2/en not_active Expired - Lifetime
Non-Patent Citations (2)
| Title |
|---|
| 電子情報通信学会技術研究報告 Vol.91 No.156 pp63−68「LVQを用いた手書き漢字認識辞書作成方式の検討」出本他 |
| 電子情報通信学会論文誌D−▲II▼ Vol.73 No.8 pp.1186−1191「環境の激しい変化に適応する神経回路網モデル」岡本 |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0512449A (en) | 1993-01-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7336827B2 (en) | System, process and software arrangement for recognizing handwritten characters | |
| US6956969B2 (en) | Methods and apparatuses for handwriting recognition | |
| US7174043B2 (en) | On-line handwriting recognizer | |
| US5796867A (en) | Stroke-number-free and stroke-order-free on-line Chinese character recognition method | |
| Huo et al. | High performance Chinese OCR based on Gabor features, discriminative feature extraction and model training | |
| EP0784285B1 (en) | Method, apparatus and computer program product for generating a classification tree | |
| WO1997044758A9 (en) | Methods and apparatuses for handwriting recognition | |
| CN113361666B (en) | Handwritten character recognition method, system and medium | |
| KR19990010210A (en) | Mass Pattern Matching Device and Method | |
| Filipski et al. | Automated conversion of engineering drawings to CAD form | |
| JP3017325B2 (en) | How to create a dictionary for pattern recognition | |
| Loy et al. | An on-line procedure for recognition of handprinted alphanumeric characters | |
| CN113536786B (en) | Method for generating confusing Chinese characters, terminal equipment and computer readable storage medium | |
| JP3180792B2 (en) | Character recognition device, character learning device, and computer-readable recording medium | |
| Chou et al. | Knowledge model based approach in recognition of on-line Chinese characters | |
| JPH08287188A (en) | Character string recognition device | |
| JP3419251B2 (en) | Character recognition device and character recognition method | |
| Garain et al. | On machine understanding of online handwritten mathematical expressions | |
| Ishii et al. | An automatic recognition system for piping and instrument diagrams | |
| JPS6315383A (en) | Pattern collating device | |
| AU764561B2 (en) | Method and apparatuses for handwriting recognition | |
| JP3454721B2 (en) | Method and apparatus for optimizing pattern recognition dictionary, and recording medium | |
| JP2728117B2 (en) | Character recognition device | |
| JPH0776986B2 (en) | Clustering processing method | |
| JP3466903B2 (en) | How to create a multi-template dictionary for character recognition |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071224 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081224 Year of fee payment: 9 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081224 Year of fee payment: 9 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091224 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091224 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101224 Year of fee payment: 11 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101224 Year of fee payment: 11 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111224 Year of fee payment: 12 |
|
| EXPY | Cancellation because of completion of term | ||
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111224 Year of fee payment: 12 |