JPH0474755B2

JPH0474755B2 -

Info

Publication number: JPH0474755B2
Application number: JP58034482A
Authority: JP
Priority date: 1983-03-04
Filing date: 1983-03-04
Publication date: 1992-11-27
Also published as: JPS59161784A

Description

【発明の詳細な説明】（技術分野）本発明は文字認識に関し、更に具体的にはアル
フアベツト、数字、カタカナ等に関するオンライ
ン文字認識に関するものである。

（背景技術）従来のオンライン文字認識装置は、オンライン
であるが故の情報を用いて構成されてきた。即
ち、ストロークそのものの情報とストロークの順
を示す情報である。これら２つの情報を用いて、
各ストロークの特徴をこと細かに辞書に持ち、入
力されたストロークの特徴より辞書を参照して認
識するという、いわゆるストロークアナリシス法
であつた。

ストロークアナリシス法の場合、アルフアベツ
ト、数字、カタカナ等（以下ANK等という）
100文字程度の場合でも、それらの文字の特徴を
各ストローク毎に各文字の変形まで含めて辞書に
記述するため辞書が膨大となり、従つて処理時間
が大となり、処理時間を短かくしようとするとハ
ードウエア規模が大となるという欠点があつた。
また、これらの欠点を補うためにはストローク数
や筆順に制約をつけざるを得ず、これら字体や画
数や筆順に対する制約がまた大きな欠点として筆
記者に不便を強いてきたものである。

（発明の課題）本発明の目的はこれらの欠点を除去するため、
ストロークアナリシス法に依らず、文字全体を図
形としてとらえ、筆記された文字内にストローク
線分がどのように分布しているかを識別すること
により、筆記された文字を認識するオンライン文
字認識における大分類法を提供しようとするもの
で、以下詳細に説明する。

（発明の構成および作用）第１図は本発明の一実施例を示すブロツク図で
あつて、１はタブレツト、２はアナログ・デイジ
タル変換器（以下Ａ／Ｄという）、３は入力レジ
スタ（以下IRという）、４は演算用レジスタを含
んだ演算器（以下ALUという）、５は部分値レジ
スタ（以下PRという）、６は置数レジスタ（以下
ARという）、７はリフアレンスレジスタ（以下
RRという）、８は比較器（以下COMPという）、
９は候補レジスタ（以下SRという）より構成さ
れ、筆記者がタブレツト１に記載した文字はＡ／
Ｄ２によりデイジタル化され、このデータはIR
３に順次格納される。IR３には、タブレツト１
のサンプルレートに応じてデータが格納される
が、格納されたデータはタブレツト１の絶対座標
を示すデータである。Ａ／Ｄ２よりIR３へのデ
ータの格納と同時に時分割的にIR３のデータは
ALU４へ送られ、一字枠内の文字として最初に
記載されたストローク始点を中心とする相対的な
座標系に変換され、更に同一点は削除される。こ
れは、筆記者が筆記具をタブレツト１の同一位置
に置いていた場合、同一点が入力され後の処理を
複雑にするのを避けるためである。

なお、ストロークの始点及び終点は、IR３，
PR５の内部において、それぞれどのデータが各
ストロークの始点なのか、または終点なのかが判
断できるようにマーキングされているものとす
る。このようにして、PR５に格納されたデータ
はALU４を用いて前処理が施される。前処理は
ノイズ除去と平滑化よりなるが、本発明の主題で
はない。

以上説明したようにタブレツト１より入力され
たデータ群は、同一点除去、ノイズ除去、平滑化
が施され、PR５に格納される。数字「６」をタ
ブレツト１に記載し、PR５に格納されたデータ
群を各データの生起順に直線で結んだものが第２
図である。

第２図の図形より(1)始点、(2)終点、(3)ｘ，ｙの
ストローク方向の変る点（以下極点という）、(4)
第２図の図形を45゜回転させた時のｘ，ｙの極点
を代表点としてとりあげ、これら代表点間の距離
が近い場合には、近い代表点を無視することで第
３図の図形を得る。第３図は、前記PR５に格納
されたデータより前述の処理を施した結果のデー
タ群を各データの生起順に直線で結んだものであ
り、結果のデータ群はPR５に置かれる。

さて、ANKに相当する文字はこれらを図形と
してみた場合、比較的ストロークの存在する位置
が特徴的であり、各ストローク個々の特徴を見る
よりも文字全体を図形としてとらえ、ストローク
が存在する位置がどこであるかという観点より見
ることを提案するものであり、以下詳細に説明す
る。なお、第３図の代表点間を結ぶ直線を以下セ
グメントと呼ぶ。また、説明文はすべてｘ，ｙ方
向ともに正規化されたデータに関して説明してい
るものとする。

先ず第１の特徴として、記載された全ストロー
クの線長を用いる。Hx，Hyを第３図に示すよう
に、ｘ，ｙ方向の代表点の内で最大の座標値とす
ると、 Q₁＝１／Hx_o 〓ⁱ⁼¹ ｜x_i−x_i+1｜ Q₂＝１／Hy_o 〓ⁱ⁼¹ ｜y_i−y_i+1｜により表わされる値を用いる。すなわち、Q₁は
代表点を結んで得られる線分のｘ成分の総和を正
規化したものであり、Q₂は同じ線分のｙ成分の
総和を正規化したものである。これらQ₁及びQ₂
は、筆記具がｘ方向、ｙ方向に動いた距離を、字
の大きさに対する割合で示したものである。

第２の特徴として、各セグメントが存在する位
置を用いる。ここでいうセグメントとは、代表点
どうしを字に沿つた所定の順序で結んで得られる
線分を指すものである。存在する位置として、あ
るセグメントがｘ，ｙ方向のどの場所に存在する
かをｘ，ｙ成分別に数値化し、その平均的な値を
算出する。ｘ成分のｘ軸上の位置については、 Q₃＝_o 〓〓ⁱ⁼¹ ｛｜x_i−x_i+1｜／Hx×１／Hx・x_i＋x_i+1｜／２｝＝
１／2Hx² _o 〓ⁱ⁼¹ ｜x_i ²−x_i+1｜ｙ成分のｙ軸上の位置についても同様に、 Q₄＝１／2Hy² _o 〓ⁱ⁼¹ ｜y_i ²−y_i+1｜により表わされる。ｘ成分のｙ軸上の位置につい
ては、 Q₅＝１／2Hx・Hy_o 〓ⁱ⁼¹ ｛｜x_i−x_i+1｜・（y_i＋y_i+1）｝で、またｙ成分のｘ軸上の位置については、 Q₆＝１／2Hx・Hy_o 〓ⁱ⁼¹ ｛｜y_i−y_i+1｜・（x_i＋x_i+1）｝で表わされる。すなわち、Q₃は字における横画
が右寄りに分布するか、左寄りに分布するかを示
し、Q₄は縦画が上寄りに分布するか、下寄りに
分布するかを示す。同様に、Q₅は横画が上寄り
に分布するか下寄りに分布するかを示し、Q₆は
縦画が左寄りに分布するか右寄りに分布するかを
示す。

具体例をあげるなら、「理」という字に関して
は、横画が多いためにQ₁の値が大きくなり、ま
た、横画が文字の右寄りに分布しているため、
Q₃の値が大きくなる。これに対し、「川」という
字に関しては、ｘ成分が第１画のわずかな湾曲の
みのため、Q₁は非常に小さな値をとる。更に、
画数そのものが少ないため、Q₂も比較的小さな
値をとる。また、「優」という字に関しては、字
の右側が複雑であるため、Q₃及びQ₅が大きな値
をとる。特に、右側に横画が多いため、Q₃が大
きな値をとる。

上記の例はすべて漢字で、縦画と横画について
のみ例示したが、上記の処理は代表的な座標値か
らセグメントのｘ成分、ｙ成分を求めて行なうも
のであるため、「ひらがな」や「カタカナ」に多
くみられる曲線や斜めの画も処理の対象となる。

上記Q₃〜Q₆は第３図でも明らかなごとく、記
載された文字に外接する長方形の左下を原点とす
る座標系により演算を行なう。従つて、各セグメ
ントのｘ，ｙ成分の存在する位置は、ｙ軸上の位
置については下にくるほど、ｘ軸上の位置につい
ては左にくるほどその特徴量は小さくなり、本発
明の方法では全セグメントの位置に関わる重みを
すべて加算するため、原点に近い部分でのセグメ
ントの変化は小さな差となつて現われ、文字に外
接する長方形上での右上の部分でのセグメントの
変化により左右されることとなる。従つて第４図
に示すごとく、文字に外接する長方形の右上を原
点とする座標系での前記Q₃〜Q₆に関する演算を
行ない、その結果をQ₇〜Q₁₀とする。

具体的には、 P_i＝x_i−Hx，q_i＝y_i−Hyなる座標変換について、 Q₇＝１／2Hx² _o 〓ⁱ⁼¹ ｜p_i ²−p_i+1 ²｜ Q₈＝１／2Hy² _o 〓ⁱ⁼¹ ｜q_i ²−q_i+1 ²｜ Q₉＝１／2Hx・Hy_o 〓ⁱ⁼¹ ｛｜p_i−p_i+1｜・（q_i＋q_i+1）｝ Q₁₀＝１／2Hx・Hy_o 〓ⁱ⁼¹ ｛｜q_i−q_i+1｜・（p_i＋p_i+1）｝となる。これらQ₇〜Q₁₀は、Q₃〜Q₆に座標変換を
行なつただけであるので、各々の図形的意味は、
Q₃〜Q₆と同じである。ただし、Q₇〜Q₁₀の演算に
おいては、前記の如く右上が原点になるため、字
の右上の部分でのセグメント変化の影響が小さく
なる。従つて、Q₃〜Q₆とQ₇〜Q₁₀を比較すること
で、字の左下の部分でのセグメントの比較的大き
な変化と、右上の部分での比較的小さな変化を区
別することができる。従つて、Q₇〜Q₁₀を用いな
い場合に比べて、より詳細な分類が可能になる。
なお、上記の演算は、複数ストロークの文字に対
してはその全ストロークの全セグメントに関して
演算を行なう。

以上説明したQ₁〜Q₁₀の式を用いて、PR５の
データはALU４により演算され、AR６に格納さ
れる。RR７には、各種の変形をも含めた各文字
毎のQ₁〜Q₁₀の最大値、最小値が格納されてい
る。AR６に格納された入力文字の特徴Q₁〜Q₁₀
は、RR７の各文字の特徴とCOMP８で比較され
る。RR７には最小値と最大値が格納されている
ため、COMP８ではAR６の内容がRR７に格納
されている最小値から最大値の範囲内に入つてい
るか否かがQ₁〜Q₁₀すべてに渡つて比較され、
RR７で示される範囲内にAR６のQ₁〜Q₁₀の全て
が含まれている場合、その時のRR７の数値を与
えた文字はSR９へ送られ、格納される。この結
果、候補文字の１ケがSR９に格納されたことと
なる。このようにして、ANK等約100文字に対
してすべての文字が範囲内に入つているかどうか
をCOMP８により検証し終つた時、SR９に格納
されている文字が大分類された文字群となる。

この後は、公知の方法、例えばストロークアナ
リシス法により各文字を認識することができる。

文字数が増加すると、このようにしても明白に
区別できない文字がある。また、筆記される文字
は筆記者により、また時々に応じて標準的な字形
と異なるので、比較すべき座標の特徴量に幅を持
たせており、このため、さらに区別できない文字
が増す。しかしながら、前述のような単純な演算
により候補文字を大幅に減少することができるの
で、すべての文字を従来の方法で認識していた時
に比べて、認識の処理時間が格段に少なくなる。
これによりードウエアに依存する部分が少なくな
り、あるいはストローク数や筆順に制約をつけな
くてもよくなる。

この卑近な例として、数字に８を示すとよく理
解できると思う。数字の８は矢印を筆順の方向と
すると、〓〓〓〓〓等各種の書き方をするが、図
形としてみると類似しており、ストローク線分の
分布を示すQ₁〜Q₁₀の値としてはある範囲に入る
ため、ストロークアナリシス法では別々の見方を
しなければならないが、本発明の方法によれば、
１種類の見方だけでどの文字が書かれたとしても
数字８であると識別できる。

以上詳細に説明したように、本発明は、文字を
図形としてとらえ筆記された文字内にストローク
線分がどのように分布しているかを識別すること
により、筆記された文字を認識する大分類法であ
るため、ストロークアナリシス法と比較してハー
ドウエア、処理時間等の計算コストが小さくてす
み、更に例えば「７」を１ストロークで記載して
も、また２ストロークで記載してもストローク数
に関係なく、また複数ストロークの文字の場合で
も、全ストロークの全セグメントに対する値によ
りQ₁〜Q₁₀の値を求めて比較するため、ストロー
ク順に規制されることがない。即ち、画数、筆順
に左右されないオンライン文字認識における大分
類法を提供することができる。

前記実施例では、COMP８によりAR６のデー
タがRR７のデータ範囲内に入る文字を候補とし
てSR９に送ると説明したが、前記説明では、Q₁
〜Q₁₀の内１ケでもAR６のデータがRR７に示さ
れる最小値より最大値までの範囲から逸脱すると
候補文字から除外される。これを防ぐために、別
にフリツプフロツプ回路（以下FFという）を設
け、Q₁〜Q₁₀の内初めてRR７の範囲を逸脱した
時はそのFFをセツトし、その後範囲を逸脱しな
い時はそのFFの情報と候補文字コードをSR９へ
格納するようにすると、大分類における候補とし
て、候補なしという状態を少なくすることができ
る。大分類における候補なしという状態は、余程
特殊な文字の書き方をしない限り表われない現象
であるが、そのような場合においても、大分類時
点でリジエクトされるということはない。

次に、前記と同等大分類におけるリジエクトを
少なくする方法であるが、AR６に入力された入
力文字データに対し、RR７のデータを用いて
COMP８で検証しても候補文字がない場合、RR
７の内容を1/8〜1/4程度の大きさで範囲を増大さ
せて再度検証するという方法も有効である。

（発明の効果）以上の説明で明らかなごとく、本発明は文字を
図形としてとらえストローク線分の分布状態を特
徴として用いて文字を認識するものであり、非常
に簡単なハードウエアによりオンライン文字認識
の大分類ができるものである。また、本発明は
ANK等100文字程度に限られるものでなく、ひ
らがなや漢字の部分パターンの認識にも応用でき
るものであることは、当業者であれば容易に理解
できるものであると考える。

【図面の簡単な説明】

第１図は本発明の一実施例を示すブロツク図、
第２図は平滑化後のデータの一例、第３図は第２
図より代表点を抽出したデータの一例、第４図は
文字に外接する長方形の右上に原点をとつたもの
である。１…タブレツト、２…アナログ・デイジタル変
換器、３…入力レジスタ、４…演算用レジスタを
含んだ演算器、５…部分値レジスタ、６…置数レ
ジスタ、７…リフアレンスレジスタ、８…比較
器、９…候補レジスタ。

Claims

【特許請求の範囲】

１文字を記載する時の筆記具の座標を示すデー
タを発生するタブレツトと、前記タブレツトより
発生するデータに基づき筆記された文字を認識す
るオンライン文字認識装置において、タブレツト
よりのアナログデータをデイジタルデータに変換
する手段と、該デイジタルデータを一時格納し、
代表点を決定する前処理を行なつた後、前記代表
点を前記文字に沿う所定の順序で結んで得られる
線分の長さの総和と、前記線分上の各点と座標軸
との距離の平均値を求め、前記線分の長さの総和
及び該距離の平均値を各々正規化した値を求める
手段と、該正規化した値と所定の値と比較する手
段とを有し、前記線分の長さと分布状態に応じ
て、筆記文字を分類することを特徴とする文字認
識大分類方法。