JPH0474755B2 - - Google Patents
Info
- Publication number
- JPH0474755B2 JPH0474755B2 JP58034482A JP3448283A JPH0474755B2 JP H0474755 B2 JPH0474755 B2 JP H0474755B2 JP 58034482 A JP58034482 A JP 58034482A JP 3448283 A JP3448283 A JP 3448283A JP H0474755 B2 JPH0474755 B2 JP H0474755B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- data
- characters
- strokes
- tablet
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Landscapes
- Character Discrimination (AREA)
Description
【発明の詳細な説明】
(技術分野)
本発明は文字認識に関し、更に具体的にはアル
フアベツト、数字、カタカナ等に関するオンライ
ン文字認識に関するものである。TECHNICAL FIELD The present invention relates to character recognition, and more particularly to online character recognition for alphabets, numbers, katakana, and the like.
(背景技術)
従来のオンライン文字認識装置は、オンライン
であるが故の情報を用いて構成されてきた。即
ち、ストロークそのものの情報とストロークの順
を示す情報である。これら2つの情報を用いて、
各ストロークの特徴をこと細かに辞書に持ち、入
力されたストロークの特徴より辞書を参照して認
識するという、いわゆるストロークアナリシス法
であつた。(Background Art) Conventional online character recognition devices have been constructed using information that is available online. That is, the information includes information about the stroke itself and information indicating the order of the strokes. Using these two pieces of information,
It was a so-called stroke analysis method in which the characteristics of each stroke were stored in a dictionary in detail, and the characteristics of the input strokes were recognized by referring to the dictionary.
ストロークアナリシス法の場合、アルフアベツ
ト、数字、カタカナ等(以下ANK等という)
100文字程度の場合でも、それらの文字の特徴を
各ストローク毎に各文字の変形まで含めて辞書に
記述するため辞書が膨大となり、従つて処理時間
が大となり、処理時間を短かくしようとするとハ
ードウエア規模が大となるという欠点があつた。
また、これらの欠点を補うためにはストローク数
や筆順に制約をつけざるを得ず、これら字体や画
数や筆順に対する制約がまた大きな欠点として筆
記者に不便を強いてきたものである。 In the case of the stroke analysis method, alphabets, numbers, katakana, etc. (hereinafter referred to as ANK, etc.)
Even in the case of around 100 characters, the dictionary becomes enormous because the characteristics of those characters are described in the dictionary for each stroke, including the transformation of each character, and therefore the processing time becomes large.If you try to shorten the processing time, The drawback was that the hardware scale was large.
In addition, in order to compensate for these drawbacks, it is necessary to impose restrictions on the number of strokes and the order of strokes, and these restrictions on the font, number of strokes, and order of strokes are also major drawbacks that have forced scribes to inconvenience.
(発明の課題)
本発明の目的はこれらの欠点を除去するため、
ストロークアナリシス法に依らず、文字全体を図
形としてとらえ、筆記された文字内にストローク
線分がどのように分布しているかを識別すること
により、筆記された文字を認識するオンライン文
字認識における大分類法を提供しようとするもの
で、以下詳細に説明する。(Problem to be solved by the invention) The purpose of the present invention is to eliminate these drawbacks.
A major classification of online character recognition that recognizes written characters by considering the entire character as a figure and identifying how stroke line segments are distributed within the written character, without relying on the stroke analysis method. It is intended to provide a legal framework and will be explained in detail below.
(発明の構成および作用)
第1図は本発明の一実施例を示すブロツク図で
あつて、1はタブレツト、2はアナログ・デイジ
タル変換器(以下A/Dという)、3は入力レジ
スタ(以下IRという)、4は演算用レジスタを含
んだ演算器(以下ALUという)、5は部分値レジ
スタ(以下PRという)、6は置数レジスタ(以下
ARという)、7はリフアレンスレジスタ(以下
RRという)、8は比較器(以下COMPという)、
9は候補レジスタ(以下SRという)より構成さ
れ、筆記者がタブレツト1に記載した文字はA/
D2によりデイジタル化され、このデータはIR
3に順次格納される。IR3には、タブレツト1
のサンプルレートに応じてデータが格納される
が、格納されたデータはタブレツト1の絶対座標
を示すデータである。A/D2よりIR3へのデ
ータの格納と同時に時分割的にIR3のデータは
ALU4へ送られ、一字枠内の文字として最初に
記載されたストローク始点を中心とする相対的な
座標系に変換され、更に同一点は削除される。こ
れは、筆記者が筆記具をタブレツト1の同一位置
に置いていた場合、同一点が入力され後の処理を
複雑にするのを避けるためである。(Structure and operation of the invention) FIG. 1 is a block diagram showing an embodiment of the present invention, in which 1 is a tablet, 2 is an analog-to-digital converter (hereinafter referred to as A/D), and 3 is an input register (hereinafter referred to as A/D). 4 is an arithmetic unit containing arithmetic registers (hereinafter referred to as ALU), 5 is a partial value register (hereinafter referred to as PR), and 6 is a position register (hereinafter referred to as PR).
7 is a reference register (hereinafter referred to as AR), 7 is a reference register (hereinafter referred to as
8 is a comparator (hereinafter referred to as COMP),
9 consists of candidate registers (hereinafter referred to as SR), and the characters written by the scribe on tablet 1 are A/
digitized by D2 and this data is IR
3 are sequentially stored. IR3 has tablet 1
The data is stored according to the sampling rate of the tablet 1, and the stored data is data indicating the absolute coordinates of the tablet 1. At the same time as data is stored from A/D2 to IR3, IR3 data is stored in a time-sharing manner.
It is sent to the ALU 4 and converted into a relative coordinate system centered on the stroke start point first written as a character within a character frame, and the same points are deleted. This is to avoid complicating subsequent processing due to input of the same point if the scribe places the writing instrument at the same position on the tablet 1.
なお、ストロークの始点及び終点は、IR3,
PR5の内部において、それぞれどのデータが各
ストロークの始点なのか、または終点なのかが判
断できるようにマーキングされているものとす
る。このようにして、PR5に格納されたデータ
はALU4を用いて前処理が施される。前処理は
ノイズ除去と平滑化よりなるが、本発明の主題で
はない。 Note that the start and end points of the stroke are IR3,
It is assumed that markings are made inside PR5 so that it can be determined which data is the start point or end point of each stroke. In this way, the data stored in PR5 is preprocessed using ALU4. Preprocessing consists of denoising and smoothing, but is not the subject of this invention.
以上説明したようにタブレツト1より入力され
たデータ群は、同一点除去、ノイズ除去、平滑化
が施され、PR5に格納される。数字「6」をタ
ブレツト1に記載し、PR5に格納されたデータ
群を各データの生起順に直線で結んだものが第2
図である。 As explained above, the data group input from the tablet 1 is subjected to identical point removal, noise removal, and smoothing, and is stored in the PR5. The number "6" is written on tablet 1, and the data group stored in PR5 is connected with a straight line in the order of occurrence of each data.
It is a diagram.
第2図の図形より(1)始点、(2)終点、(3)x,yの
ストローク方向の変る点(以下極点という)、(4)
第2図の図形を45゜回転させた時のx,yの極点
を代表点としてとりあげ、これら代表点間の距離
が近い場合には、近い代表点を無視することで第
3図の図形を得る。第3図は、前記PR5に格納
されたデータより前述の処理を施した結果のデー
タ群を各データの生起順に直線で結んだものであ
り、結果のデータ群はPR5に置かれる。 From the figure in Figure 2, (1) the starting point, (2) the ending point, (3) the point where the x and y stroke direction changes (hereinafter referred to as the extreme point), (4)
When the figure in Figure 2 is rotated 45 degrees, the x and y poles are taken as representative points, and if the distances between these representative points are close, the figure in Figure 3 can be created by ignoring the nearby representative points. obtain. FIG. 3 shows a data group resulting from the above-described processing performed on the data stored in the PR5, which is connected by a straight line in the order of occurrence of each data, and the resulting data group is placed in the PR5.
さて、ANKに相当する文字はこれらを図形と
してみた場合、比較的ストロークの存在する位置
が特徴的であり、各ストローク個々の特徴を見る
よりも文字全体を図形としてとらえ、ストローク
が存在する位置がどこであるかという観点より見
ることを提案するものであり、以下詳細に説明す
る。なお、第3図の代表点間を結ぶ直線を以下セ
グメントと呼ぶ。また、説明文はすべてx,y方
向ともに正規化されたデータに関して説明してい
るものとする。 Now, when characters corresponding to ANK are viewed as figures, the position of the strokes is relatively characteristic. This is a proposal to look at it from the perspective of where it is, and will be explained in detail below. Note that the straight line connecting the representative points in FIG. 3 is hereinafter referred to as a segment. Furthermore, it is assumed that all the explanatory texts describe data that has been normalized in both the x and y directions.
先ず第1の特徴として、記載された全ストロー
クの線長を用いる。Hx,Hyを第3図に示すよう
に、x,y方向の代表点の内で最大の座標値とす
ると、
Q1=1/Hxo
〓i=1
|xi−xi+1|
Q2=1/Hyo
〓i=1
|yi−yi+1|
により表わされる値を用いる。すなわち、Q1は
代表点を結んで得られる線分のx成分の総和を正
規化したものであり、Q2は同じ線分のy成分の
総和を正規化したものである。これらQ1及びQ2
は、筆記具がx方向、y方向に動いた距離を、字
の大きさに対する割合で示したものである。 First, the line length of the entire stroke described is used as the first feature. As shown in Figure 3, if Hx and Hy are the maximum coordinate values among the representative points in the x and y directions, then Q 1 = 1/Hx o 〓 i=1 |x i −x i+1 | Q The value expressed by 2 = 1/Hy o 〓 i=1 |y i −y i+1 | is used. That is, Q 1 is the normalized sum of the x components of the line segments obtained by connecting the representative points, and Q 2 is the normalized sum of the y components of the same line segments. These Q 1 and Q 2
represents the distance that the writing instrument has moved in the x and y directions as a ratio to the size of the character.
第2の特徴として、各セグメントが存在する位
置を用いる。ここでいうセグメントとは、代表点
どうしを字に沿つた所定の順序で結んで得られる
線分を指すものである。存在する位置として、あ
るセグメントがx,y方向のどの場所に存在する
かをx,y成分別に数値化し、その平均的な値を
算出する。x成分のx軸上の位置については、
Q3=o
〓
〓i=1
{|xi−xi+1|/Hx×1/Hx・xi+xi+1|/2}=
1/2Hx2 o
〓i=1
|xi 2−xi+1|
y成分のy軸上の位置についても同様に、
Q4=1/2Hy2 o
〓i=1
|yi 2−yi+1|
により表わされる。x成分のy軸上の位置につい
ては、
Q5=1/2Hx・Hyo
〓i=1
{|xi−xi+1|・(yi+yi+1)}
で、またy成分のx軸上の位置については、
Q6=1/2Hx・Hyo
〓i=1
{|yi−yi+1|・(xi+xi+1)}
で表わされる。すなわち、Q3は字における横画
が右寄りに分布するか、左寄りに分布するかを示
し、Q4は縦画が上寄りに分布するか、下寄りに
分布するかを示す。同様に、Q5は横画が上寄り
に分布するか下寄りに分布するかを示し、Q6は
縦画が左寄りに分布するか右寄りに分布するかを
示す。 The second feature is the position where each segment exists. The term "segment" here refers to a line segment obtained by connecting representative points in a predetermined order along the character. The position where a certain segment exists in the x and y directions is digitized for each x and y component, and the average value thereof is calculated. Regarding the position of the x component on the x-axis, Q 3 = o 〓 〓 i=1 {|x i −x i+1 |/Hx×1/Hx・x i +x i+1 |/2}=
1/2Hx 2 o 〓 i=1 |x i 2 −x i+1 | Similarly for the position of the y component on the y axis, Q 4 = 1/2Hy 2 o 〓 i=1 |y i 2 −y It is represented by i+1 | Regarding the position of the x component on the y axis, Q 5 = 1/2Hx・Hy o 〓 i=1 {|x i −x i+1 |・(y i +y i+1 )}, and the position of the y component The position on the x-axis is expressed as Q 6 =1/2Hx·Hy o 〓 i=1 {|y i −y i+1 |·(x i +x i+1 )}. That is, Q 3 indicates whether the horizontal strokes in a character are distributed toward the right or left, and Q 4 indicates whether the vertical strokes are distributed toward the top or bottom. Similarly, Q 5 indicates whether horizontal strokes are distributed toward the top or bottom, and Q 6 indicates whether vertical strokes are distributed toward the left or right.
具体例をあげるなら、「理」という字に関して
は、横画が多いためにQ1の値が大きくなり、ま
た、横画が文字の右寄りに分布しているため、
Q3の値が大きくなる。これに対し、「川」という
字に関しては、x成分が第1画のわずかな湾曲の
みのため、Q1は非常に小さな値をとる。更に、
画数そのものが少ないため、Q2も比較的小さな
値をとる。また、「優」という字に関しては、字
の右側が複雑であるため、Q3及びQ5が大きな値
をとる。特に、右側に横画が多いため、Q3が大
きな値をとる。 To give a specific example, for the character ``Ri'', the value of Q1 is large because there are many horizontal strokes, and because the horizontal strokes are distributed towards the right side of the character,
The value of Q 3 increases. On the other hand, for the character "river", the x component is only a slight curvature of the first stroke, so Q 1 takes a very small value. Furthermore,
Since the number of strokes itself is small, Q 2 also takes a relatively small value. In addition, regarding the character "Yu", Q 3 and Q 5 take large values because the right side of the character is complex. In particular, Q3 takes a large value because there are many horizontal strokes on the right side.
上記の例はすべて漢字で、縦画と横画について
のみ例示したが、上記の処理は代表的な座標値か
らセグメントのx成分、y成分を求めて行なうも
のであるため、「ひらがな」や「カタカナ」に多
くみられる曲線や斜めの画も処理の対象となる。 All of the above examples are kanji, and only vertical strokes and horizontal strokes are illustrated, but since the above processing is performed by finding the x and y components of the segment from representative coordinate values, it can be used for ``hiragana'' or ``hiragana''. Curved lines and diagonal strokes, which are often found in Katakana, are also subject to processing.
上記Q3〜Q6は第3図でも明らかなごとく、記
載された文字に外接する長方形の左下を原点とす
る座標系により演算を行なう。従つて、各セグメ
ントのx,y成分の存在する位置は、y軸上の位
置については下にくるほど、x軸上の位置につい
ては左にくるほどその特徴量は小さくなり、本発
明の方法では全セグメントの位置に関わる重みを
すべて加算するため、原点に近い部分でのセグメ
ントの変化は小さな差となつて現われ、文字に外
接する長方形上での右上の部分でのセグメントの
変化により左右されることとなる。従つて第4図
に示すごとく、文字に外接する長方形の右上を原
点とする座標系での前記Q3〜Q6に関する演算を
行ない、その結果をQ7〜Q10とする。 As is clear from FIG. 3, the above Q 3 to Q 6 are calculated using a coordinate system whose origin is the lower left of a rectangle circumscribing the written character. Therefore, the position where the x and y components of each segment are located becomes smaller as the position on the y-axis is lower, and as the position on the x-axis is further left, the feature amount becomes smaller. Since all the weights related to the positions of all segments are added, changes in segments near the origin appear as small differences, and are influenced by changes in segments in the upper right part of the rectangle circumscribing the character. The Rukoto. Therefore, as shown in FIG. 4, calculations regarding the above-mentioned Q 3 to Q 6 are performed in a coordinate system whose origin is the upper right corner of a rectangle circumscribing the character, and the results are set as Q 7 to Q 10 .
具体的には、
Pi=xi−Hx,qi=yi−Hyなる座標変換について、
Q7=1/2Hx2 o
〓i=1
|pi 2−pi+1 2|
Q8=1/2Hy2 o
〓i=1
|qi 2−qi+1 2|
Q9=1/2Hx・Hyo
〓i=1
{|pi−pi+1|・(qi+qi+1)}
Q10=1/2Hx・Hyo
〓i=1
{|qi−qi+1|・(pi+pi+1)}
となる。これらQ7〜Q10は、Q3〜Q6に座標変換を
行なつただけであるので、各々の図形的意味は、
Q3〜Q6と同じである。ただし、Q7〜Q10の演算に
おいては、前記の如く右上が原点になるため、字
の右上の部分でのセグメント変化の影響が小さく
なる。従つて、Q3〜Q6とQ7〜Q10を比較すること
で、字の左下の部分でのセグメントの比較的大き
な変化と、右上の部分での比較的小さな変化を区
別することができる。従つて、Q7〜Q10を用いな
い場合に比べて、より詳細な分類が可能になる。
なお、上記の演算は、複数ストロークの文字に対
してはその全ストロークの全セグメントに関して
演算を行なう。 Specifically, for the coordinate transformation P i = x i −Hx, q i = y i −Hy, Q 7 = 1/2Hx 2 o 〓 i=1 | p i 2 −p i+1 2 | Q 8 =1/2Hy 2 o 〓 i=1 |q i 2 −q i+1 2 | Q 9 =1/2Hx・Hy o 〓 i=1 {|p i −p i+1 |・(q i +q i +1 )} Q 10 = 1/2Hx・Hy o 〓 i=1 {|q i −q i+1 |・(p i +p i+1 )}. Since these Q 7 to Q 10 are simply coordinate transformed to Q 3 to Q 6 , their graphical meaning is
Same as Q 3 to Q 6 . However, in the calculations of Q 7 to Q 10 , the upper right is the origin as described above, so the influence of segment changes in the upper right portion of the character is reduced. Therefore, by comparing Q 3 to Q 6 and Q 7 to Q 10 , we can distinguish between a relatively large change in the segment in the lower left part of the character and a relatively small change in the upper right part of the character. . Therefore, more detailed classification is possible than when Q7 to Q10 are not used.
Note that the above calculation is performed on all segments of all strokes for a character with multiple strokes.
以上説明したQ1〜Q10の式を用いて、PR5の
データはALU4により演算され、AR6に格納さ
れる。RR7には、各種の変形をも含めた各文字
毎のQ1〜Q10の最大値、最小値が格納されてい
る。AR6に格納された入力文字の特徴Q1〜Q10
は、RR7の各文字の特徴とCOMP8で比較され
る。RR7には最小値と最大値が格納されている
ため、COMP8ではAR6の内容がRR7に格納
されている最小値から最大値の範囲内に入つてい
るか否かがQ1〜Q10すべてに渡つて比較され、
RR7で示される範囲内にAR6のQ1〜Q10の全て
が含まれている場合、その時のRR7の数値を与
えた文字はSR9へ送られ、格納される。この結
果、候補文字の1ケがSR9に格納されたことと
なる。このようにして、ANK等約100文字に対
してすべての文字が範囲内に入つているかどうか
をCOMP8により検証し終つた時、SR9に格納
されている文字が大分類された文字群となる。 Using the formulas Q 1 to Q 10 explained above, the data of PR5 is calculated by ALU4 and stored in AR6. The maximum and minimum values of Q 1 to Q 10 for each character, including various transformations, are stored in RR7. Characteristics of input characters stored in AR6 Q 1 ~ Q 10
is compared with the characteristics of each character in RR7 in COMP8. Since the minimum and maximum values are stored in RR7, COMP8 checks whether the contents of AR6 are within the range from the minimum value to the maximum value stored in RR7 . compared with
If all of Q 1 to Q 10 of AR6 are included in the range indicated by RR7, the character giving the value of RR7 at that time is sent to SR9 and stored. As a result, one candidate character is stored in SR9. In this way, when COMP8 finishes verifying whether all characters are within the range for about 100 characters such as ANK, the characters stored in SR9 become a group of roughly classified characters.
この後は、公知の方法、例えばストロークアナ
リシス法により各文字を認識することができる。 After this, each character can be recognized by a known method, such as a stroke analysis method.
文字数が増加すると、このようにしても明白に
区別できない文字がある。また、筆記される文字
は筆記者により、また時々に応じて標準的な字形
と異なるので、比較すべき座標の特徴量に幅を持
たせており、このため、さらに区別できない文字
が増す。しかしながら、前述のような単純な演算
により候補文字を大幅に減少することができるの
で、すべての文字を従来の方法で認識していた時
に比べて、認識の処理時間が格段に少なくなる。
これによりードウエアに依存する部分が少なくな
り、あるいはストローク数や筆順に制約をつけな
くてもよくなる。 As the number of characters increases, some characters cannot be clearly distinguished even in this way. Furthermore, since the characters that are written differ from the standard character shape depending on the scribe and from time to time, the feature values of the coordinates to be compared have a wide range, which increases the number of characters that cannot be distinguished. However, since the number of candidate characters can be significantly reduced by simple calculations as described above, the recognition processing time is significantly reduced compared to when all characters were recognized using the conventional method.
This reduces the dependence on hardware, and eliminates the need to impose restrictions on the number of strokes or the order of strokes.
この卑近な例として、数字に8を示すとよく理
解できると思う。数字の8は矢印を筆順の方向と
すると、〓〓〓〓〓等各種の書き方をするが、図
形としてみると類似しており、ストローク線分の
分布を示すQ1〜Q10の値としてはある範囲に入る
ため、ストロークアナリシス法では別々の見方を
しなければならないが、本発明の方法によれば、
1種類の見方だけでどの文字が書かれたとしても
数字8であると識別できる。 I think this can be better understood by showing the number 8 as a familiar example. The number 8 can be written in various ways, such as 〓〓〓〓〓, if the arrow is the direction of the stroke order, but when viewed as a figure, it is similar, and the values of Q 1 to Q 10 , which indicate the distribution of stroke line segments, are In order to fall within a certain range, stroke analysis methods must take different views, but according to the method of the present invention,
No matter which letter is written, it can be identified as the number 8 by just one way of looking at it.
以上詳細に説明したように、本発明は、文字を
図形としてとらえ筆記された文字内にストローク
線分がどのように分布しているかを識別すること
により、筆記された文字を認識する大分類法であ
るため、ストロークアナリシス法と比較してハー
ドウエア、処理時間等の計算コストが小さくてす
み、更に例えば「7」を1ストロークで記載して
も、また2ストロークで記載してもストローク数
に関係なく、また複数ストロークの文字の場合で
も、全ストロークの全セグメントに対する値によ
りQ1〜Q10の値を求めて比較するため、ストロー
ク順に規制されることがない。即ち、画数、筆順
に左右されないオンライン文字認識における大分
類法を提供することができる。 As explained in detail above, the present invention provides a general classification method for recognizing written characters by considering characters as figures and identifying how stroke line segments are distributed within the written characters. Therefore, compared to the stroke analysis method, the calculation costs such as hardware and processing time are lower, and even if "7" is written as one stroke or two strokes, the number of strokes will be reduced. Regardless, even in the case of a character with multiple strokes, the values of Q 1 to Q 10 are determined and compared based on the values for all segments of all strokes, so the order of strokes is not restricted. That is, it is possible to provide a general classification method for online character recognition that is not affected by the number of strokes or the order of strokes.
前記実施例では、COMP8によりAR6のデー
タがRR7のデータ範囲内に入る文字を候補とし
てSR9に送ると説明したが、前記説明では、Q1
〜Q10の内1ケでもAR6のデータがRR7に示さ
れる最小値より最大値までの範囲から逸脱すると
候補文字から除外される。これを防ぐために、別
にフリツプフロツプ回路(以下FFという)を設
け、Q1〜Q10の内初めてRR7の範囲を逸脱した
時はそのFFをセツトし、その後範囲を逸脱しな
い時はそのFFの情報と候補文字コードをSR9へ
格納するようにすると、大分類における候補とし
て、候補なしという状態を少なくすることができ
る。大分類における候補なしという状態は、余程
特殊な文字の書き方をしない限り表われない現象
であるが、そのような場合においても、大分類時
点でリジエクトされるということはない。 In the above embodiment, it was explained that COMP8 sends characters whose data in AR6 falls within the data range of RR7 to SR9 as candidates .
~Q If even one of the 10 data in AR6 deviates from the range from the minimum value to the maximum value shown in RR7, it is excluded from the candidate characters. In order to prevent this, a separate flip-flop circuit (hereinafter referred to as FF) is provided, and when Q1 to Q10 deviate from the range of RR7 for the first time, that FF is set, and when the range is not deviated from then on, the information of that FF is set. By storing candidate character codes in SR9, it is possible to reduce the number of candidates in the major classification. The state that there are no candidates in the major classification is a phenomenon that does not appear unless the characters are written in a very special way, but even in such a case, the character will not be rejected at the time of the major classification.
次に、前記と同等大分類におけるリジエクトを
少なくする方法であるが、AR6に入力された入
力文字データに対し、RR7のデータを用いて
COMP8で検証しても候補文字がない場合、RR
7の内容を1/8〜1/4程度の大きさで範囲を増大さ
せて再度検証するという方法も有効である。 Next, there is a method to reduce rejects in the same major classification as above, but by using the data of RR7 for the input character data input to AR6.
If there are no candidate characters even after verifying with COMP8, RR
It is also effective to increase the range of the contents of 7 by about 1/8 to 1/4 and re-verify it.
(発明の効果)
以上の説明で明らかなごとく、本発明は文字を
図形としてとらえストローク線分の分布状態を特
徴として用いて文字を認識するものであり、非常
に簡単なハードウエアによりオンライン文字認識
の大分類ができるものである。また、本発明は
ANK等100文字程度に限られるものでなく、ひ
らがなや漢字の部分パターンの認識にも応用でき
るものであることは、当業者であれば容易に理解
できるものであると考える。(Effects of the Invention) As is clear from the above explanation, the present invention recognizes characters by recognizing characters as figures and using the distribution state of stroke line segments as a feature. It is possible to broadly classify the following. Moreover, the present invention
Those skilled in the art will easily understand that the present invention is not limited to recognition of about 100 characters such as ANK, but can also be applied to recognition of partial patterns of hiragana and kanji.
第1図は本発明の一実施例を示すブロツク図、
第2図は平滑化後のデータの一例、第3図は第2
図より代表点を抽出したデータの一例、第4図は
文字に外接する長方形の右上に原点をとつたもの
である。
1…タブレツト、2…アナログ・デイジタル変
換器、3…入力レジスタ、4…演算用レジスタを
含んだ演算器、5…部分値レジスタ、6…置数レ
ジスタ、7…リフアレンスレジスタ、8…比較
器、9…候補レジスタ。
FIG. 1 is a block diagram showing one embodiment of the present invention;
Figure 2 is an example of data after smoothing, Figure 3 is an example of the data after smoothing.
FIG. 4, an example of data from which representative points are extracted from the figure, has its origin set at the upper right of a rectangle circumscribing a character. DESCRIPTION OF SYMBOLS 1...Tablet, 2...Analog-digital converter, 3...Input register, 4...Arithmetic unit including arithmetic registers, 5...Partial value register, 6...Arrangement register, 7...Reference register, 8...Comparator , 9... Candidate register.
Claims (1)
タを発生するタブレツトと、前記タブレツトより
発生するデータに基づき筆記された文字を認識す
るオンライン文字認識装置において、タブレツト
よりのアナログデータをデイジタルデータに変換
する手段と、該デイジタルデータを一時格納し、
代表点を決定する前処理を行なつた後、前記代表
点を前記文字に沿う所定の順序で結んで得られる
線分の長さの総和と、前記線分上の各点と座標軸
との距離の平均値を求め、前記線分の長さの総和
及び該距離の平均値を各々正規化した値を求める
手段と、該正規化した値と所定の値と比較する手
段とを有し、前記線分の長さと分布状態に応じ
て、筆記文字を分類することを特徴とする文字認
識大分類方法。1. A tablet that generates data indicating the coordinates of a writing instrument when writing a character, and an online character recognition device that recognizes written characters based on the data generated by the tablet, converting analog data from the tablet into digital data. means for temporarily storing the digital data;
After performing preprocessing to determine representative points, calculate the sum of the lengths of line segments obtained by connecting the representative points in a predetermined order along the characters, and the distance between each point on the line segment and the coordinate axis. means for determining the average value of and normalizing the sum of the lengths of the line segments and the average value of the distances, and means for comparing the normalized value with a predetermined value, A character recognition general classification method characterized by classifying written characters according to the length and distribution state of line segments.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58034482A JPS59161784A (en) | 1983-03-04 | 1983-03-04 | On-line character recognizing and rough classifying method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58034482A JPS59161784A (en) | 1983-03-04 | 1983-03-04 | On-line character recognizing and rough classifying method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS59161784A JPS59161784A (en) | 1984-09-12 |
| JPH0474755B2 true JPH0474755B2 (en) | 1992-11-27 |
Family
ID=12415463
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP58034482A Granted JPS59161784A (en) | 1983-03-04 | 1983-03-04 | On-line character recognizing and rough classifying method |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS59161784A (en) |
-
1983
- 1983-03-04 JP JP58034482A patent/JPS59161784A/en active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS59161784A (en) | 1984-09-12 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR880002662B1 (en) | Character recognition device | |
| CN110050277A (en) | For handwritten text to be converted into the method and system of digital ink | |
| CN107729954A (en) | A kind of character recognition method, device, Text region equipment and storage medium | |
| Bahashwan et al. | Efficient segmentation of arabic handwritten characters using structural features. | |
| JPH0474755B2 (en) | ||
| Tou et al. | Automatic recognition of handwritten characters via feature extraction and multi-level decision | |
| JP2658136B2 (en) | Character recognition method | |
| Babczyński et al. | Direct Tensor Voting in line segmentation of handwritten documents | |
| JP2635582B2 (en) | Pattern recognition method | |
| JPS6172374A (en) | Character recognizer | |
| Parker et al. | Vector templates for symbol recognition | |
| JP2930996B2 (en) | Image recognition method and image recognition device | |
| JP3221488B2 (en) | Online character recognition device with verification function | |
| JP2658137B2 (en) | Character recognition method | |
| JPH0351029B2 (en) | ||
| JPH0776980B2 (en) | Character recognition method | |
| JPH05298487A (en) | Alphabet recognizing device | |
| JP2792063B2 (en) | Character recognition dictionary creation method | |
| JPS60107190A (en) | Graphic recognizing system | |
| JPH01171080A (en) | Recognizing device for error automatically correcting character | |
| Dehkordi et al. | Classification of off-line hand-written words into upper and lower cases | |
| JPH034953B2 (en) | ||
| JPH0580711B2 (en) | ||
| JPS5922178A (en) | Pattern recognition device | |
| JPH08137994A (en) | Character recognition device |