Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JPH0338631B2 - - Google Patents
[go: Go Back, main page]

JPH0338631B2 - - Google Patents

Info

Publication number
JPH0338631B2
JPH0338631B2 JP59194128A JP19412884A JPH0338631B2 JP H0338631 B2 JPH0338631 B2 JP H0338631B2 JP 59194128 A JP59194128 A JP 59194128A JP 19412884 A JP19412884 A JP 19412884A JP H0338631 B2 JPH0338631 B2 JP H0338631B2
Authority
JP
Japan
Prior art keywords
priority
character type
recognition
difference
categories
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP59194128A
Other languages
English (en)
Other versions
JPS6172376A (ja
Inventor
Hiroshi Matsumura
Tatsunosuke Iwahara
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP59194128A priority Critical patent/JPS6172376A/ja
Publication of JPS6172376A publication Critical patent/JPS6172376A/ja
Publication of JPH0338631B2 publication Critical patent/JPH0338631B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/287Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 (イ) 産業上の利用分野 本発は、手書き漢字を認識する文字認識システ
ムに係り、候補字種カテゴリーの認識順位決定方
式に関する。
(ロ) 従来の技術 一搬に、文字認識システムでは、入力文字パタ
ーンから抽出した特徴パターンと、予め辞書部に
登録された字種カテゴリー毎の標準特徴パターン
との類似度を計算し、類似度の大きいn個の候補
字種カテゴリーを選択する。そして、類似度の最
も大きい候補字種カテゴリーを認識結果として出
力すると共に、誤認識の訂正のために、選択した
n個の候補字種カテゴリーには、類似度の大きい
順に第1位から第n位までの認識順位を決定して
おく。
ところが、上述の如く、認識順位の決定に類似
度のみを用いていたのでは誤認識が多く、そこ
で、類似度による複数の候補字種カテゴリーの選
択後に、何らかの後処理を施して認識順位を決定
する方式が考えられるようになつた。
そして、従来、後処理としては、特開昭59−
32082号公報に開示されているように、文法的処
理を行なうものや、特開昭59−27381号公報のよ
うに、被認識文字の前後の文字が、漢字か、カタ
カナか或いはひらがなかを判定するものが提案さ
れていた。
(ハ) 発明が解決しようとする問題点 従来の技術においては、文法的処理を後処理と
して行なうので、文法的な辞書等の知識部が莫大
となり、更には、その処理内容が非常に複雑にな
るという問題があり、又、前後の文字が、漢字か
カタカナか等を判定する方式では、選択した候補
字種カテゴリーが漢字やひらがなばかりである場
合には、認識率の向上は期待できなかつた。
そこで、本願出願人は、莫大な知識部を必要と
せず、短かい処理時間で認識率を向上させるた
め、学校教育の学習段階あるいは頻度等に応じ
て、字種カデゴリーの各々に優先度を定めてお
き、この優先度と類似度とを用いて複数の候補字
種カテゴリーの認識順位を決定しようとしたが、
類似度と優先度の兼ね合いにより認識率が変わる
ので、この兼ね合いをいかにうまく設定するかと
いうことが問題となつてきた。
(ニ) 問題点を解決するための手段 本発明は、候補字種カテゴリー同志の類似度の
差及び優先度の差を計算し、類似度の差が所定値
より大きい場合は、優先度の差が所定値より大き
いときのみ優先度による認識順位の入れ換えを行
ない、優先度の差が所定値より小さいときは優先
度による認識順位の入れ換えを行なわないように
して、候補字種カテゴリーの認識順位を決定する
ようにしたものである。
(ホ) 作用 本発明では、類似度がある程度離れた候補字種
カテゴリー同志においては、それらの優先度が接
近しているときには優先度が無視され類似度のみ
により認識順位が決定され、それらの優先度が大
きく異なるときのみに優先度に基づく認識順位が
決定されることとなり、従つて、類似度及び優先
度を共に有効に活用した認識順位の決定が為さ
れ、認識率が向上する。
(ヘ) 実施例 第1図は、本発明を適用した文字認識システム
のブロツク図であり、1は入力用原稿に書かれた
文字を読取り、読取り結果を2値の文字パターン
として出力する文字観測部、2は入力文字パター
ンから特徴パターンを抽出する特徴抽出部、3は
字種カテゴリー毎の標準特徴パターンを記憶した
辞書部、4は抽出した特徴パターンと標準特徴パ
ターンとのマツチングを行ない、両パターンの類
似度を計算するパターンマツチング部である。
辞書部3の字種カテゴリーは、頻度あるいは学
校教育の学習段階に応じたカテゴリー分けが為さ
れており、各カテゴリーセツトに優先度が定めら
れている。例えば、第2図に示すように、小学校
1〜3年で学習する字種カテゴリーをカテゴリー
セツト1,3a、小学校4〜6年で学習する字種
カテゴリーをカテゴリーセツト2,3b、中学校
以上で学習する字種カテゴリーをカテゴリーセツ
ト3,3c、というように全ての字種カテゴリー
を3つのカテゴリーセツトに分け、カテゴリーセ
ツト1〜3に順に優先度0〜2を定めている。
パターンマツチング部4は、カテゴリーセツト
1〜3に各々対応する3つの演算部4a〜4cを
備えており、各演算部に各カテゴリーセツトの中
から類似度の大きい順にn個の候補字種カテゴリ
ーを選択し、その字種コード及び計算結果として
の類似度を、候補メモリ5に格納する。この際、
演算部では対応するカテゴリーセツトの優先度を
字種コード及び類似度に付加し、これら3つの情
報が各々の候補字種カテゴリーの情報として候補
メモリ5に記憶される。このようにして、候補メ
モリ5には、各カテゴリーセツトの中からn個づ
つ、合計3n個の候補字種カテゴリーが記憶され
る。
更に、第1図において、6は類似度と優先度と
の関係を記憶した知識部、7はこの知識部6の内
容を参照して、候補メモリ5に記憶された3n個
の候補字種カテゴリーのうち上位n個の認識順位
を決定し、その字種コードを認識順位順に結果メ
モリ8に格納するクラスタリング制御処理部であ
つて、答出力制御部9は、認識順位が第1位の字
種コードを認識結果としてワープロあるいはパソ
コン等の文字表示装置に出力し、その字種の表示
を行なわせる。そして、答出力制御部9はオペレ
ータから誤認識の指示があれば、第2位以下の字
種コードを順次出力し、正しい認識結果が表示さ
れるように出力の制御を行なう。
次に、クラスタリング制御処理部7の処理及び
知識部6の内容について、更に詳しく説明する。
本実施例では、類似度としてシテイブロツク距
離dを用い、この距離が小さいほど類似度が大き
いとしており、知識部6には、各候補字種カテゴ
リーのシテイブロツク距離dを比較するための複
数の閾値D〓,D〓,D〓(D〓<D〓<D〓)が記憶されて
いる。クラスタリング制御処理部7は、第3図の
フローチヤートに示すように、先ず、候補メモリ
5に記憶された3n個の候補字種カテゴリーの中
から、距離が小さい順にn個の候補字種カテゴリ
ーG1,G2…Goを選択し、これらを順に作業メモ
リ7aに記憶する。そして、これらn個の候補字
種カテゴリーの各々の距離d1,d2…doを複数の閾
値D〓,D〓,D〓と比較することにより、候補字種
カテゴリーG1〜Goを第4図に示すようなA、B、
C、Dの4つのクラスにクラス分けを行なう。即
ち、クラスタリング制御処理部7には、各クラス
毎に、そのクラスに属する候補字種カテゴリーが
作業メモリ7aのどのアドレスまで入つているか
を示すクラスポインタ10a〜10dを備えてお
り、第3図のフローチヤートに示すように、各ポ
インタ10a,10b,10c,10dの内容
TA、TB、TC、TDが、距離の比較の際インク
リメントされて行く。例えば、作業メモリ7aの
アドレス0〜1にAクラス、アドレス2〜4にB
クラス、アドレス5〜6にCクラス、アドレス7
にDクラスの候補字種カテゴリーが記憶されてい
れば、クラス分けにより、各ボインタの内容は、
TA=2、TB=5、TC=7、TD=8となる。
ところで、知識部6には、第4図に示すよう
に、各クラスにおける優先度による順位入れ換え
の可否及び条件が予め記憶されており、クラスタ
リング制御処理部7は、この知識部6の内容を参
照して、候補メモリ5に記憶された複数の候補字
種カテゴリーの認識順位の決定を行なう。
ここで、字種コードがMI,シテイブロツク距
離がdI,優先度がP〓(I=A,B,…H,K,L,
…R,S,T,…Z,PI=0,1,2)の候補字
種カテゴリーGIを(MI,dI,PI)と表わすこと
とし、今、仮に、第5図イに示すように、カテゴ
リーセツト1〜3の各々から、類似度が大きい上
位8個づつの候補字種カテゴリーが候補メモリ5
に選択され、各シテイブロツク距離dIの関係が、
dS<dK<dL<dT<dA<dU<dM<dB<…であつたと
すると、クラスタリング制御処理部7の作業メモ
リ7aには、第5図ロに示すように、距離dIが小
さい順に8個の候補字種カテゴリーGS〜GBが選
択記憶される。
そこで、候補字種カテゴリーの各シテイブロツ
ク距離dIと閾値D〓,D〓,D〓との関係が、例えば、
dK<D〓<dL,dA<D〓<dU,dB<D〓であつたとす
ると、クラスタリング処理部7によつてクラス分
けが行なわれ、各クラスポインタ10a〜10d
の内容は、TA=2,TB=5,TC8,TD=0と
なる。即ち、候補字種カテゴリーGS,GKがAク
ラスに、候補字種カテゴリーGL,GT,GAがBク
ラスに、そして、候補字種カテゴリーGU,GM
GBがCクラスにクラス分けされる。次に、クラ
スタリング制御処理部7は知識部6を参照して各
クラスにおける候補字種カテゴリーの順位入れ換
えを行なう。このとき作業メモリ7aのアドレス
0〜7までの候補字種カテゴリーG1〜G8の字種
コードをM(1)〜M(8),シテイブロツク距離
をd(1)〜d(8),優先度をP(1)〜P(8)、
最終認識順位がi位の字種カテゴリーの字種コー
ドをm(i)と定める。
すると、先ずAクラスの字種カテゴリーについ
ては優先度による入れ換えを行なわないので、字
種コードMS及びMKを第1位m(1)及び第2位
m(2)と決定し、その順位で結果メモリ8に書
込む。次のBクラスの3つの字種コードML
MT,MAについては第6図のフローチヤートに示
す処理を行なう。即ち、Bクラスの場合は、初期
値としてm(i)=M(TA+1),i=TA+1,
l=TB,τo=aと設定する。
上述の例においては、TA=2、TB=5なの
で、先ずm(3)の字種コードの決定が行なわれ
る。ここで、dT−dL>a,dA−dT>aであり、従
つて、dA−dl>aとする。
先ず、GLとGTの距離の差τ=dT−dLが計算さ
れ、所定値aと比較される。この場合τ>aなの
で、次に優先度の差t=PL−PTが計算され所定
値1と比較される。この場合PLはPTより優先度
が高いので−1となり、m(3)即ちMLとMT
入れ換えは行なわれない。次にGLとGAの距離の
差γ=dA−dLが計算され、所定値aと比較され、
τ>aなので、優先度の差t=PL−PAが計算さ
れてτが所定値1より大きいかどうかが比較され
る。この場合PAはPLより優先度が高いがt=1
なので、MLとMAとの優先度による入れ換えは行
なわれない。依つて、この時点で第3位の認識順
位m(3)がMLと決定され、M(3)〜M(5)は
ML,MT,MAのままである。そして、次にm
(4)の字種コードの決定を行なう。この場合も、
GTとGAの距離の差τ=dA−dTが計算され、所定
値aと比較される。τ>aなので優先度の差t=
PT−PAが計算され所定値1より大きいかどうか
が比較される。この場合、優先度の差は、t=2
となるので、MTとMAとの優先度による順位入れ
換えが行なわれ依つて認識順位第4位の字種コー
ドm(4)がMAと決定される。m(4)について
の処理が終了すると、i=5となりl=TB=5
と等しくなるので、Bクラスにおける優先度によ
る順位入れ換え処理が終了し、第3位〜第5位の
認識順位は、ML,MA,MTと決定される。尚、
Bクラス内で単純に優先度により順位を決定すれ
ば、MA,ML,MTとなる。
ところが、例えば、dT−dL≦a,dA−dT≦a,
dA−dL≦aと上述の例に比べて、各候補字種カテ
ゴリーの距離が接近していたとすると、優先度の
差に関係なく優先度による順位入れ換えが行なわ
れるので、この場合の認識順位は、MA,ML
MTと決定される。
このようにして、決定された字種コードML
MA,MTは結果メモリ8に送出され、MS,MK
続いてこの順に記憶される。
次に、クラスタリング制御処理部7は、Cクラ
スの処理に移る。
Cクラスの場合、初期値として、m(i)=M
(TB+1),i=TB+1,l=TC,τp=bと設
定され、Bクラスの場合と同様、第6図のフロー
チヤートに示す処理が行なわれる。例えば、dM
−dU>b,dB−dM>bであるとし、従つて、dB
dU>bであつたならば、τ=dM−dU>bであり、
MMの優先度はMUの優先度より高いが、優先度の
差t=PU−PM=1≦1であるので、MUとMM
は優先度による順位入れ換えが行なわれない。次
に、τ=dB−dUが計算されτ>bであつて、且つ
PU−PB=2>1なのでMUとMBが優先度により入
れ換えられ、MB,MM,MUとなつて、第6位の
字種コードm(6)がMBに決定される。そして、
MMとMUとは優先度がMMの方が高いので、これ
らの順位はそのままとなる。従つて、第6位〜第
8位の字種コードがMB,MM,MUと決定され、
結果メモリ(8)にこの順に記憶される。
以上のようにして順位が決定されると、結果メ
モリ8には、第5図ハに示すような順位で8個の
字種コードが記憶されることになる。
このように、本発明では2つの候補字種カテゴ
リーにおいて、その距離の差が所定値より大きい
とき、優先度が接近している場合は、優先度によ
る順位入れ換えが行なわれず、優先度が離れてい
るときのみに優先度による順位入れ換えが行なわ
れる。
本実施例においては、優先度を0,1,2の3
段階としたが、その段階を増やしても本発明は適
用可能である。又、本実施例では、辞書部3を優
先度に応じたカテゴリーセツトに分割したが、各
字種カテゴリーに優先度情報を付加しておけば、
必ずしも辞書部3を分割する必要はない。更に具
体的処理においては第6図のフローチヤートとは
逆に、優先度の差をチエツクした後に距離の差を
チエツクしてもよい。
尚、作業メモリ7aに選択記憶される候補字種
カテゴリーは、各クラスのもの全てを必ずしも含
むわけではなく、全候補字種カテゴリーがBクラ
スあるいはCクラスだけの場合もあり、この場合
はこれらの同一クラス内だけで全ての認識順位が
決定される。
実験によれば、同一クラスの候補字種カテゴリ
ー全てを優先度により順位の決定を行なつた場合
は、第1位の認識率が約90.0%であつたが、本発
明を適用すると認識率が約92.5%と向上した。
(ト) 発明の効果 本発明に依れば、類似度と優先度を共に有効に
活用して、候補字種カテゴリーの認識順位を決定
することができ、従つて、認識率が向上する。
又、知識部としては莫大な容量を必要とせず、更
には短かい処理時間で順位の決定が行なえるよう
になる。
【図面の簡単な説明】
第1図は本発明を適用した文字認識システムの
ブロツク図、第2図はカテゴリーセツトの内容を
示す説明図、第3図はクラスタリング制御処理部
のクラス分け処理の内容を示すフローチヤート、
第4図は知識部の内容を示す説明図、第5図は認
識順位決定の具体例を示す説明図、第6図はクラ
スタリング制御処理部の順位入れ換え処理の内容
を示すフローチヤートである。 主な図番の説明、3…辞書部、4…パターンマ
ツチング部、5…候補メモリ、6…知識部、7…
クラスタリング制御処理部、8…結果メモリ、9
…答出力制御部。

Claims (1)

    【特許請求の範囲】
  1. 1 入力文字パターンから抽出した特徴パターン
    と、予め辞書部に登録された字種カデコリー毎の
    標準特徴パターンとの類似度を計算して、複数の
    候補字種カテゴリーを選択すると共に、前記字種
    カテゴリーの各々に優先度を定めておき、前記類
    似度と優先度に基づいて認識順位を決定する方式
    において、前記候補字種カテゴリー同志の類似度
    の差及び優先度の差を計算し、前記類似度の差が
    所定値より大きい場合は、前記優先度の差が所定
    値より大きいときのみ優先度による認識順位の入
    れ変えを行ない、前記優先度の差が所定値より小
    さいときは優先度による認識順位の入れ換えを行
    なわないようにしたことを特徴とする認識順位決
    定方法。
JP59194128A 1984-09-17 1984-09-17 認識順位決定方式 Granted JPS6172376A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59194128A JPS6172376A (ja) 1984-09-17 1984-09-17 認識順位決定方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59194128A JPS6172376A (ja) 1984-09-17 1984-09-17 認識順位決定方式

Publications (2)

Publication Number Publication Date
JPS6172376A JPS6172376A (ja) 1986-04-14
JPH0338631B2 true JPH0338631B2 (ja) 1991-06-11

Family

ID=16319370

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59194128A Granted JPS6172376A (ja) 1984-09-17 1984-09-17 認識順位決定方式

Country Status (1)

Country Link
JP (1) JPS6172376A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2795719B2 (ja) * 1990-03-07 1998-09-10 富士通株式会社 認識距離の差に基づく最良優先探索処理方法
JP2674542B2 (ja) * 1995-01-30 1997-11-12 株式会社日立製作所 手書き文字認識装置

Also Published As

Publication number Publication date
JPS6172376A (ja) 1986-04-14

Similar Documents

Publication Publication Date Title
JPH0634185B2 (ja) 入力語認識装置
JPH0981730A (ja) パターン認識方法及び装置及びコンピュータ制御装置
WO1995017734A1 (en) Method and apparatus for pattern recognition, and method of compiling dictionary for pattern recognition
JPH0338631B2 (ja)
JP2000348141A (ja) 入力情報の予測方法と装置、ならびにプログラム記憶媒体
JPS6126192A (ja) ハングル字母列からのハングル文字認識方法
JP2718391B2 (ja) 線対称図形整形装置
JPH0338630B2 (ja)
KR101987227B1 (ko) 시선 추적 기반의 사용자 입력 데이터 분석 장치 및 방법
JP7771935B2 (ja) 文字抽出方法
JPH0337231B2 (ja)
JPH0935006A (ja) 文字認識装置
JPH05298489A (ja) 文字認識方式
JP2894305B2 (ja) 認識装置の候補修正方式
JP3367973B2 (ja) 文字処理方法及び装置
JPS6186883A (ja) オンライン手書き文字認識方式
JPH08190603A (ja) 文字認識装置及びその候補文字表示方法
JP2842271B2 (ja) 手書き文字列入力装置
JPS6162986A (ja) 認識順位決定方式
JPS61163479A (ja) 分類処理回路
JP2765617B2 (ja) 文字認識装置
JPH05233711A (ja) 検索子学習付情報検索方式
JP2637762B2 (ja) パターン詳細同定方式
JP2639314B2 (ja) 文字認識方式
JPH06131503A (ja) 文字認識処理装置