Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JPH0474755B2 - - Google Patents
[go: Go Back, main page]

JPH0474755B2 - - Google Patents

Info

Publication number
JPH0474755B2
JPH0474755B2 JP58034482A JP3448283A JPH0474755B2 JP H0474755 B2 JPH0474755 B2 JP H0474755B2 JP 58034482 A JP58034482 A JP 58034482A JP 3448283 A JP3448283 A JP 3448283A JP H0474755 B2 JPH0474755 B2 JP H0474755B2
Authority
JP
Japan
Prior art keywords
character
data
characters
strokes
tablet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP58034482A
Other languages
English (en)
Other versions
JPS59161784A (ja
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed filed Critical
Priority to JP58034482A priority Critical patent/JPS59161784A/ja
Publication of JPS59161784A publication Critical patent/JPS59161784A/ja
Publication of JPH0474755B2 publication Critical patent/JPH0474755B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 (技術分野) 本発明は文字認識に関し、更に具体的にはアル
フアベツト、数字、カタカナ等に関するオンライ
ン文字認識に関するものである。
(背景技術) 従来のオンライン文字認識装置は、オンライン
であるが故の情報を用いて構成されてきた。即
ち、ストロークそのものの情報とストロークの順
を示す情報である。これら2つの情報を用いて、
各ストロークの特徴をこと細かに辞書に持ち、入
力されたストロークの特徴より辞書を参照して認
識するという、いわゆるストロークアナリシス法
であつた。
ストロークアナリシス法の場合、アルフアベツ
ト、数字、カタカナ等(以下ANK等という)
100文字程度の場合でも、それらの文字の特徴を
各ストローク毎に各文字の変形まで含めて辞書に
記述するため辞書が膨大となり、従つて処理時間
が大となり、処理時間を短かくしようとするとハ
ードウエア規模が大となるという欠点があつた。
また、これらの欠点を補うためにはストローク数
や筆順に制約をつけざるを得ず、これら字体や画
数や筆順に対する制約がまた大きな欠点として筆
記者に不便を強いてきたものである。
(発明の課題) 本発明の目的はこれらの欠点を除去するため、
ストロークアナリシス法に依らず、文字全体を図
形としてとらえ、筆記された文字内にストローク
線分がどのように分布しているかを識別すること
により、筆記された文字を認識するオンライン文
字認識における大分類法を提供しようとするもの
で、以下詳細に説明する。
(発明の構成および作用) 第1図は本発明の一実施例を示すブロツク図で
あつて、1はタブレツト、2はアナログ・デイジ
タル変換器(以下A/Dという)、3は入力レジ
スタ(以下IRという)、4は演算用レジスタを含
んだ演算器(以下ALUという)、5は部分値レジ
スタ(以下PRという)、6は置数レジスタ(以下
ARという)、7はリフアレンスレジスタ(以下
RRという)、8は比較器(以下COMPという)、
9は候補レジスタ(以下SRという)より構成さ
れ、筆記者がタブレツト1に記載した文字はA/
D2によりデイジタル化され、このデータはIR
3に順次格納される。IR3には、タブレツト1
のサンプルレートに応じてデータが格納される
が、格納されたデータはタブレツト1の絶対座標
を示すデータである。A/D2よりIR3へのデ
ータの格納と同時に時分割的にIR3のデータは
ALU4へ送られ、一字枠内の文字として最初に
記載されたストローク始点を中心とする相対的な
座標系に変換され、更に同一点は削除される。こ
れは、筆記者が筆記具をタブレツト1の同一位置
に置いていた場合、同一点が入力され後の処理を
複雑にするのを避けるためである。
なお、ストロークの始点及び終点は、IR3,
PR5の内部において、それぞれどのデータが各
ストロークの始点なのか、または終点なのかが判
断できるようにマーキングされているものとす
る。このようにして、PR5に格納されたデータ
はALU4を用いて前処理が施される。前処理は
ノイズ除去と平滑化よりなるが、本発明の主題で
はない。
以上説明したようにタブレツト1より入力され
たデータ群は、同一点除去、ノイズ除去、平滑化
が施され、PR5に格納される。数字「6」をタ
ブレツト1に記載し、PR5に格納されたデータ
群を各データの生起順に直線で結んだものが第2
図である。
第2図の図形より(1)始点、(2)終点、(3)x,yの
ストローク方向の変る点(以下極点という)、(4)
第2図の図形を45゜回転させた時のx,yの極点
を代表点としてとりあげ、これら代表点間の距離
が近い場合には、近い代表点を無視することで第
3図の図形を得る。第3図は、前記PR5に格納
されたデータより前述の処理を施した結果のデー
タ群を各データの生起順に直線で結んだものであ
り、結果のデータ群はPR5に置かれる。
さて、ANKに相当する文字はこれらを図形と
してみた場合、比較的ストロークの存在する位置
が特徴的であり、各ストローク個々の特徴を見る
よりも文字全体を図形としてとらえ、ストローク
が存在する位置がどこであるかという観点より見
ることを提案するものであり、以下詳細に説明す
る。なお、第3図の代表点間を結ぶ直線を以下セ
グメントと呼ぶ。また、説明文はすべてx,y方
向ともに正規化されたデータに関して説明してい
るものとする。
先ず第1の特徴として、記載された全ストロー
クの線長を用いる。Hx,Hyを第3図に示すよう
に、x,y方向の代表点の内で最大の座標値とす
ると、 Q1=1/Hxoi=1 |xi−xi+1| Q2=1/Hyoi=1 |yi−yi+1| により表わされる値を用いる。すなわち、Q1
代表点を結んで得られる線分のx成分の総和を正
規化したものであり、Q2は同じ線分のy成分の
総和を正規化したものである。これらQ1及びQ2
は、筆記具がx方向、y方向に動いた距離を、字
の大きさに対する割合で示したものである。
第2の特徴として、各セグメントが存在する位
置を用いる。ここでいうセグメントとは、代表点
どうしを字に沿つた所定の順序で結んで得られる
線分を指すものである。存在する位置として、あ
るセグメントがx,y方向のどの場所に存在する
かをx,y成分別に数値化し、その平均的な値を
算出する。x成分のx軸上の位置については、 Q3o 〓 〓i=1 {|xi−xi+1|/Hx×1/Hx・xi+xi+1|/2}=
1/2Hx2 oi=1 |xi 2−xi+1| y成分のy軸上の位置についても同様に、 Q4=1/2Hy2 oi=1 |yi 2−yi+1| により表わされる。x成分のy軸上の位置につい
ては、 Q5=1/2Hx・Hyoi=1 {|xi−xi+1|・(yi+yi+1)} で、またy成分のx軸上の位置については、 Q6=1/2Hx・Hyoi=1 {|yi−yi+1|・(xi+xi+1)} で表わされる。すなわち、Q3は字における横画
が右寄りに分布するか、左寄りに分布するかを示
し、Q4は縦画が上寄りに分布するか、下寄りに
分布するかを示す。同様に、Q5は横画が上寄り
に分布するか下寄りに分布するかを示し、Q6
縦画が左寄りに分布するか右寄りに分布するかを
示す。
具体例をあげるなら、「理」という字に関して
は、横画が多いためにQ1の値が大きくなり、ま
た、横画が文字の右寄りに分布しているため、
Q3の値が大きくなる。これに対し、「川」という
字に関しては、x成分が第1画のわずかな湾曲の
みのため、Q1は非常に小さな値をとる。更に、
画数そのものが少ないため、Q2も比較的小さな
値をとる。また、「優」という字に関しては、字
の右側が複雑であるため、Q3及びQ5が大きな値
をとる。特に、右側に横画が多いため、Q3が大
きな値をとる。
上記の例はすべて漢字で、縦画と横画について
のみ例示したが、上記の処理は代表的な座標値か
らセグメントのx成分、y成分を求めて行なうも
のであるため、「ひらがな」や「カタカナ」に多
くみられる曲線や斜めの画も処理の対象となる。
上記Q3〜Q6は第3図でも明らかなごとく、記
載された文字に外接する長方形の左下を原点とす
る座標系により演算を行なう。従つて、各セグメ
ントのx,y成分の存在する位置は、y軸上の位
置については下にくるほど、x軸上の位置につい
ては左にくるほどその特徴量は小さくなり、本発
明の方法では全セグメントの位置に関わる重みを
すべて加算するため、原点に近い部分でのセグメ
ントの変化は小さな差となつて現われ、文字に外
接する長方形上での右上の部分でのセグメントの
変化により左右されることとなる。従つて第4図
に示すごとく、文字に外接する長方形の右上を原
点とする座標系での前記Q3〜Q6に関する演算を
行ない、その結果をQ7〜Q10とする。
具体的には、 Pi=xi−Hx,qi=yi−Hyなる座標変換について、 Q7=1/2Hx2 oi=1 |pi 2−pi+1 2| Q8=1/2Hy2 oi=1 |qi 2−qi+1 2| Q9=1/2Hx・Hyoi=1 {|pi−pi+1|・(qi+qi+1)} Q10=1/2Hx・Hyoi=1 {|qi−qi+1|・(pi+pi+1)} となる。これらQ7〜Q10は、Q3〜Q6に座標変換を
行なつただけであるので、各々の図形的意味は、
Q3〜Q6と同じである。ただし、Q7〜Q10の演算に
おいては、前記の如く右上が原点になるため、字
の右上の部分でのセグメント変化の影響が小さく
なる。従つて、Q3〜Q6とQ7〜Q10を比較すること
で、字の左下の部分でのセグメントの比較的大き
な変化と、右上の部分での比較的小さな変化を区
別することができる。従つて、Q7〜Q10を用いな
い場合に比べて、より詳細な分類が可能になる。
なお、上記の演算は、複数ストロークの文字に対
してはその全ストロークの全セグメントに関して
演算を行なう。
以上説明したQ1〜Q10の式を用いて、PR5の
データはALU4により演算され、AR6に格納さ
れる。RR7には、各種の変形をも含めた各文字
毎のQ1〜Q10の最大値、最小値が格納されてい
る。AR6に格納された入力文字の特徴Q1〜Q10
は、RR7の各文字の特徴とCOMP8で比較され
る。RR7には最小値と最大値が格納されている
ため、COMP8ではAR6の内容がRR7に格納
されている最小値から最大値の範囲内に入つてい
るか否かがQ1〜Q10すべてに渡つて比較され、
RR7で示される範囲内にAR6のQ1〜Q10の全て
が含まれている場合、その時のRR7の数値を与
えた文字はSR9へ送られ、格納される。この結
果、候補文字の1ケがSR9に格納されたことと
なる。このようにして、ANK等約100文字に対
してすべての文字が範囲内に入つているかどうか
をCOMP8により検証し終つた時、SR9に格納
されている文字が大分類された文字群となる。
この後は、公知の方法、例えばストロークアナ
リシス法により各文字を認識することができる。
文字数が増加すると、このようにしても明白に
区別できない文字がある。また、筆記される文字
は筆記者により、また時々に応じて標準的な字形
と異なるので、比較すべき座標の特徴量に幅を持
たせており、このため、さらに区別できない文字
が増す。しかしながら、前述のような単純な演算
により候補文字を大幅に減少することができるの
で、すべての文字を従来の方法で認識していた時
に比べて、認識の処理時間が格段に少なくなる。
これによりードウエアに依存する部分が少なくな
り、あるいはストローク数や筆順に制約をつけな
くてもよくなる。
この卑近な例として、数字に8を示すとよく理
解できると思う。数字の8は矢印を筆順の方向と
すると、〓〓〓〓〓等各種の書き方をするが、図
形としてみると類似しており、ストローク線分の
分布を示すQ1〜Q10の値としてはある範囲に入る
ため、ストロークアナリシス法では別々の見方を
しなければならないが、本発明の方法によれば、
1種類の見方だけでどの文字が書かれたとしても
数字8であると識別できる。
以上詳細に説明したように、本発明は、文字を
図形としてとらえ筆記された文字内にストローク
線分がどのように分布しているかを識別すること
により、筆記された文字を認識する大分類法であ
るため、ストロークアナリシス法と比較してハー
ドウエア、処理時間等の計算コストが小さくてす
み、更に例えば「7」を1ストロークで記載して
も、また2ストロークで記載してもストローク数
に関係なく、また複数ストロークの文字の場合で
も、全ストロークの全セグメントに対する値によ
りQ1〜Q10の値を求めて比較するため、ストロー
ク順に規制されることがない。即ち、画数、筆順
に左右されないオンライン文字認識における大分
類法を提供することができる。
前記実施例では、COMP8によりAR6のデー
タがRR7のデータ範囲内に入る文字を候補とし
てSR9に送ると説明したが、前記説明では、Q1
〜Q10の内1ケでもAR6のデータがRR7に示さ
れる最小値より最大値までの範囲から逸脱すると
候補文字から除外される。これを防ぐために、別
にフリツプフロツプ回路(以下FFという)を設
け、Q1〜Q10の内初めてRR7の範囲を逸脱した
時はそのFFをセツトし、その後範囲を逸脱しな
い時はそのFFの情報と候補文字コードをSR9へ
格納するようにすると、大分類における候補とし
て、候補なしという状態を少なくすることができ
る。大分類における候補なしという状態は、余程
特殊な文字の書き方をしない限り表われない現象
であるが、そのような場合においても、大分類時
点でリジエクトされるということはない。
次に、前記と同等大分類におけるリジエクトを
少なくする方法であるが、AR6に入力された入
力文字データに対し、RR7のデータを用いて
COMP8で検証しても候補文字がない場合、RR
7の内容を1/8〜1/4程度の大きさで範囲を増大さ
せて再度検証するという方法も有効である。
(発明の効果) 以上の説明で明らかなごとく、本発明は文字を
図形としてとらえストローク線分の分布状態を特
徴として用いて文字を認識するものであり、非常
に簡単なハードウエアによりオンライン文字認識
の大分類ができるものである。また、本発明は
ANK等100文字程度に限られるものでなく、ひ
らがなや漢字の部分パターンの認識にも応用でき
るものであることは、当業者であれば容易に理解
できるものであると考える。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロツク図、
第2図は平滑化後のデータの一例、第3図は第2
図より代表点を抽出したデータの一例、第4図は
文字に外接する長方形の右上に原点をとつたもの
である。 1…タブレツト、2…アナログ・デイジタル変
換器、3…入力レジスタ、4…演算用レジスタを
含んだ演算器、5…部分値レジスタ、6…置数レ
ジスタ、7…リフアレンスレジスタ、8…比較
器、9…候補レジスタ。

Claims (1)

    【特許請求の範囲】
  1. 1 文字を記載する時の筆記具の座標を示すデー
    タを発生するタブレツトと、前記タブレツトより
    発生するデータに基づき筆記された文字を認識す
    るオンライン文字認識装置において、タブレツト
    よりのアナログデータをデイジタルデータに変換
    する手段と、該デイジタルデータを一時格納し、
    代表点を決定する前処理を行なつた後、前記代表
    点を前記文字に沿う所定の順序で結んで得られる
    線分の長さの総和と、前記線分上の各点と座標軸
    との距離の平均値を求め、前記線分の長さの総和
    及び該距離の平均値を各々正規化した値を求める
    手段と、該正規化した値と所定の値と比較する手
    段とを有し、前記線分の長さと分布状態に応じ
    て、筆記文字を分類することを特徴とする文字認
    識大分類方法。
JP58034482A 1983-03-04 1983-03-04 文字認識大分類方法 Granted JPS59161784A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58034482A JPS59161784A (ja) 1983-03-04 1983-03-04 文字認識大分類方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58034482A JPS59161784A (ja) 1983-03-04 1983-03-04 文字認識大分類方法

Publications (2)

Publication Number Publication Date
JPS59161784A JPS59161784A (ja) 1984-09-12
JPH0474755B2 true JPH0474755B2 (ja) 1992-11-27

Family

ID=12415463

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58034482A Granted JPS59161784A (ja) 1983-03-04 1983-03-04 文字認識大分類方法

Country Status (1)

Country Link
JP (1) JPS59161784A (ja)

Also Published As

Publication number Publication date
JPS59161784A (ja) 1984-09-12

Similar Documents

Publication Publication Date Title
KR880002662B1 (ko) 문자 인식장치
CN110050277A (zh) 用于将手写文本转换成数字墨水的方法和系统
CN107729954A (zh) 一种文字识别方法、装置、文字识别设备及存储介质
Bahashwan et al. Efficient segmentation of arabic handwritten characters using structural features.
JPH0474755B2 (ja)
Tou et al. Automatic recognition of handwritten characters via feature extraction and multi-level decision
JP2658136B2 (ja) 文字認識方式
Babczyński et al. Direct Tensor Voting in line segmentation of handwritten documents
JP2635582B2 (ja) パターン認識方式
JPS6172374A (ja) 文字認識装置
Parker et al. Vector templates for symbol recognition
JP2930996B2 (ja) 画像認識方法および画像認識装置
JP3221488B2 (ja) 検証機能付きオンライン文字認識装置
JP2658137B2 (ja) 文字認識方式
JPH0351029B2 (ja)
JPH0776980B2 (ja) 文字認識方法
JPH05298487A (ja) 英文字認識装置
JP2792063B2 (ja) 文字認識辞書作成方式
JPS60107190A (ja) 図形認識方式
JPH01171080A (ja) 誤り自動訂正文字認識装置
Dehkordi et al. Classification of off-line hand-written words into upper and lower cases
JPH034953B2 (ja)
JPH0580711B2 (ja)
JPS5922178A (ja) 図形認識装置
JPH08137994A (ja) 文字認識装置