Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JPH0632085B2 - パターン認識用辞書の作成方法 - Google Patents
[go: Go Back, main page]

JPH0632085B2 - パターン認識用辞書の作成方法 - Google Patents

パターン認識用辞書の作成方法

Info

Publication number
JPH0632085B2
JPH0632085B2 JP60054573A JP5457385A JPH0632085B2 JP H0632085 B2 JPH0632085 B2 JP H0632085B2 JP 60054573 A JP60054573 A JP 60054573A JP 5457385 A JP5457385 A JP 5457385A JP H0632085 B2 JPH0632085 B2 JP H0632085B2
Authority
JP
Japan
Prior art keywords
pattern
dictionary
learning
input
pattern recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60054573A
Other languages
English (en)
Other versions
JPS61214083A (ja
Inventor
斎司 蔭山
修 国崎
俊従 尾崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP60054573A priority Critical patent/JPH0632085B2/ja
Publication of JPS61214083A publication Critical patent/JPS61214083A/ja
Publication of JPH0632085B2 publication Critical patent/JPH0632085B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明はパターン認識用辞書の作成方法に関する。
〔発明の背景〕
パターン認識では入力パターンと複数個の各カテゴリを
代表する標準パターンの間で比較を行うことにより、一
つの答カテゴリを決定したり、一個以上の候補カテゴリ
を選択する。
具体的には例えば次の様にして、候補カテゴリの選択と
答カテゴリの決定を行う。第1図を参照されたい。
入力パターンuと複数個のカテゴリC……C
(ここでk1)の代表である標準パターンf
(C),…,f(C)との間の距離d(u,f(C
)),…,d(u,f(C))を計算する。
各標準パターンf(C)毎に予め定めてある閾値
θ〔f(C)〕に対し、 d(u,f(C))θ〔f(C)〕を満足するカ
テゴリを集める。
集めたカテゴリが一つならばそれを答カテゴリとし
て出力する。集めたカテゴリが二つ以上ならばそれらを
答の候補カテゴリとする。〜の手順では各カテゴリ
についてのパターン情報が標準パターンf(C
と閾値θ〔f(C)〕の組として記述されている。全
カテゴリについてこれらの組を集めたものを辞書と呼
ぶ。
ところで従来、学習サンプルが増すにつれて逐次的に辞
書を作成するには、各カテゴリC毎に次の(1)〜(2)の手
順の処理を行っていた。
(1)第1ステップ(初期作成) 学習サンプルu,…,u(ここでm1)に対し、
標準パターンfと閾値θ〔f〕を次の二つの式に従
って計算する。
(2)第2ステップ(追加作成) 学習サンプルum+1,…,u(n>m)が追加された
とき、標準パターンfと閾値θ〔f〕を追加前と追
加後の全学習サンプルu,…,uを参照して次式に
従って作成する。
本辞書作成方法には次の長所と欠点がある。
(a)長所 第2図に示すように、閾値として標準パターンfと全
学習サンプルu,…,uとの間の最大距離をセット
している。このため、学習サンプルを上記答カテゴリの
選択と答カテゴリの決定の手順に従って認識する場合、
すべての学習サンプルに対して正解カテゴリを侯補カテ
ゴリの一つとして選択することができる。
(b)欠点 第2ステップ閾値θ〔f〕を計算するためには、追加
学習サンプルum+1,…,uだけでなく、追加前の学
習サンプルu,…,uも保存しておくことが必要で
あり、メモリ容量が莫大になる。例えば文字認識では一
学習サンプルの記憶にパック形式で30〜300Byte必要で
あるから、学習サンプルが増大しn=2×10(=20
00カテゴリ×100サンプル/カテゴリ)になるとメ
モリ容量として6〜60MByte必要になり、実用的でな
い。
また閾値計算時間も(2−3)式における距離計算回数
nが2×10であるため、1回の距離計算時間が0.1〜
1sec/回(マイクロプロセッサ8086を使用)として
も、合計2×10〜2×10secかかり実用的でない。
特にオンサイトで逐次的に辞書を更新する場合、以上の
メモリ容量と閾値計算時間についての欠点は許しがたい
ものである。
なお従来の辞書作成方法については次の2つの文献で論
じられている。
電子通信学会技術研究報告、PRL80−16、内藤誠
一郎、手書き漢字データの総計的分析 電子通信学会技術研究報告、PRL80−25、赤松
茂、構造集積特徴による手書き漢字の類別実験 〔発明の目的〕 本発明の目的は、上記従来発明の欠点を解消したパター
ン認識用辞書の作成方法を提供することである。
〔発明の概要〕
本発明では上記目的を達成するために、辞書の追加作成
において、追加前の辞書と追加学習サンプルのみを参照
するだけで、追加前と追加後の全学習サンプルを参照し
て作ったのと同等の性能の辞書を作成できるようにする
ものである。
以下、本発明の原理を説明する。各カテゴリC毎に次の
(1)〜(2)の手順を行うことにより、逐次的に辞書を作成
する。
なお本発明では辞書が漂準パターン、閾値、及び
学習サンプル数からなるものとする。
(1)第1ステップ(初期作成) 学習サンプルu,…,u(ここでm1)に対し、
標準パターンfと閾値θ〔f〕を次の二式に従って
計算する。
初期作成された辞書は標準パターンf,閾値θ
〔f〕,学習サンプル数mである。
(2)第2ステップ(追加作成) 学習サンプルum+1,…,u(n>m)が追加された
とき、標準パターンfと閾値θ〔f〕を、追加前の
辞書f,θ〔f〕および追加学習サンプルum+1
…,uを参照して次式に従って作成する。
追加作成された辞書は標準パターンf,閾値θ
〔f〕,学習サンプル数nである。
本発明では、第2ステップの追加作成において、追加前
の学習済みサンプルu,…,uのメモリへの保存
と閾値計算における参照を省くことができるので、従
来発明の欠点を解消することができる。
さらに本発明で作成した辞書を用いた場合も、従来発明
の場合と同様に、十分小さな閾値θ〔f〕を設定する
だけで、すべての学習サンプルに対して正解カテゴリを
候補カテゴリの一つとして選択することができる。その
証明を以下に示す。距離についての三角形不等式を利用
したところがポイントである(第3図参照)。
〔全学習サンプルに対して正解カテゴリを候補カテゴリ
に上げられることの証明〕 追加前学習サンプルu,i=1,…,mについて (5-1)式では距離について三角形不等式が適用されてい
る。
追加後学習サンプルu,i=m+1,…,nについ
全学習サンプルu,i=1,…,nについて(5-
2),(5-3)式より d(f,uつまり(5-4)式は、追加前と追加後の全学習サンプルu
(ここでi=1,…,n)が標準パターンfから距
離θ〔f〕以内にあることを示している。(証明終
り) また辞書に蓄える標準パターンとして、平均標準パター
ンf,fの代りに累積標準パターンu,u、こ
こでu=m・f=n・f を用いる場合についても、同様にして辞書を作成するこ
とができる。
〔発明の実施例〕
次に本発明の一番目の実施例を第4図の構成例を用いて
上記原理の説明と対応させながら説明する。構成例はパ
ターン観測部11、特徴抽出部12、学習サンプルメモリ
部13、辞書計算部14、辞書メモリ部15及び制御部16から
なる。パターン観測部11は文字パターンや音声パターン
などの入力パターン10aを電気信号11aに変換する部分で
あり、スキャナ,マイクロホンなどからなる。特徴抽出
部12は入力された電気信号11aに対し前処理、正規化、
特徴抽出などを行い特徴パターン12aを出力する。学習
サンプルメモリ部13は12が出力した特徴パターンを学習
サンプルとして格納する。初期作成の場合は学習サンプ
ルu,…,uを格納し、追加作成の場合はサンプル
m+1,…,uを格納する。辞書計算部14は辞書を計
算する部分である。初期作成では式(3-1),(3-2)を用い
て計算する。この場合14へは13aの学習サンプルu
…,uが入力され14aの辞書f,θ〔f〕,mが
出力される。追加作成では式(4-1),(4-2)を用いて計算
する。この場合14へは13aの追加学習サンプルum+1
…,u及び15aに対応班する追加学習前の辞書f
θ〔f〕,mが入力される。14aに対応する辞書
,θ〔f〕,nが出力される。辞書メモリ部15は
14で作成した辞書14aを記憶する部分である。制御部16
は10a,11a,…などの信号の制御を行う。第4図におい
ては、図のはん雑化をさけるため制御信号線を省略し
た。
なお文字認識で用いる特徴パターン12aの例としては
周辺分布特徴、ストローク密度関数特徴、ペリフェ
ラル特徴、方向性パターン特徴、その他がある。
の例を第5図の(a)に、の例を第5図の(b)に示す。
の例を第5図の(c)と(d)に示し、の例を第6図の
(b),(c),(d),(e)に示す。
次に本発明の二番目の実施例を第7図の構成例を用いて
説明する。第7図の構成は第4図の構成に整合部17、判
定部18、修正部19を付加したものである。これらを付加
したため、入力パターンのカテゴリが予め分っていない
場合にも辞書が作成できるようになった。(一番目の実
施例では予め入力パターンのカテゴリが分っていること
が必要だった。)というのは17部,18部,19部によるパ
ターン認識処理と修正処理で、各入力パターンの正しい
カテゴリを得ることができるからである。
以下詳しく説明する。文字パターンや音声パターンなど
の入力パターン10aの例をパターン観測部11に入力する
と電気信号11aが出力される。特徴抽出部12は入力され
た電気信号11aに対し、前処理、正規化、特徴抽出など
を行い特徴パターン12aの列um+1,…,uを出力す
る。各特徴パターンu(ここでi=m+1,…,n)は
整合部17において、上記入力パターン列を入力する前の
辞書15aに属するすべての標準パターンとの間で距離が
評価される。続いて上記距離データに基づいて判定部18
が答カテゴリや候補カテゴリを計算し、ディスプレイに
表示する。修正部19では本装置のユーザが、入力パター
ンと答カテゴリ、候補カテゴリなどを参照しながら、答
カテゴリを修正する。以上の処理により、修正した答カ
テゴリを付加した学習サンプルum+1,…,uが得ら
れた。これらを学習サンプルメモリ部13へ格納する。以
下辞書計算部14では入力である13aの追加学習サンプル
m+1,…,u及び追加学習前の辞書15aを用いて、辞
書の追加作成を行う。出力として追加作成後の辞書14a
が得られる。
本実施例では、以上のように入力パターンのカテゴリが
分っていない場合にも、ユーザが本装置でパターン認識
(文字認識や音声認識)を行いながら辞書を逐次的に作
成することができる。
なお本実施例では入力パターン列から得られたすべての
特徴パターンを学習サンプルとした。学習サンプルとし
ての次の〜を用いても同様にして辞書を作ることが
できる。
上記すべての特徴パターンからユーザが学習すべき
でないと判断した特跳徴パターンを除いたものを学習サ
ンプルとする。
入力パターンをパターン認識してエラー又はリジェ
クトになった特徴パターンを学習サンプルとする。
エラー又はリジェクトになった特徴パターンからユ
ーザが学習すべきでないと判断した特徴パターンを除い
たものを学習サンプルとする。
なお、以上の学習サンプル選択、判断処理は第7図の修
正部19で行うことができる。
以上の実施例は、マイクロプロセッサ、メモリ、スキャ
ナ、マイクロホン、ディスプレイなどを用いて実現する
ことができる。
以上の実施例は辞書がカテゴリ当り一組の標準パターン
と閾値から成る場合についてのものであった。カテゴリ
当り複数組の標準パターンと閾値を用いると認識性能を
さらに向上することができる。この場合についても、本
発明は適用することができる。
〔発明の効果〕
本発明により得られた効果をまとめると以下のようにな
る 辞書の追加作成において、追加学習前に使用した学
習済みサンプルを参照する必要がなくなる。そのため、
i学習済みサンプル保存用メモリが不要になり、メモリ
容量を削減することができる。またii閾値計算で学習済
みサンプルと追加学習後の新標準パターンとの間の距離
計算も不要になるため、計算時間も大幅に短縮すること
ができる。
学習サンプルを認識する場合、すべての学習サンプ
ルに対して正解カテゴリを侯補カテゴリの一つに上げる
ことができる。しかも侯補カテゴリ数は認識対象全カテ
ゴリ数に比べ十分小さくすることができる。
【図面の簡単な説明】
第1図は侯補カテゴリの選択と答カテゴリの決定手順を
説明するための図、第2図は辞書の作成手順を説明する
ための図、第3図は本発明の原理を説明するための図、
第4図は本発明の一番目の実施例の構成を示す図、第5
図と第6図は文字認識で用いる特徴パターンの例を示す
図、第7図は本発明の二番目の実施例の構成を示す図で
ある。 11……パターン観測部 12……特徴抽出部 13……学習サンプルメモリ部 14……辞書計算部 15……辞書メモリ部 16……制御部 17……整合部 18……判定部 19……修正部 10a……入力パターン 11a……電気信号 12a……特徴パターン 13a……学習サンプル 14a……辞書計算部からの出力である更新後の辞書 15a……辞書計算部への入力である更新前の辞書

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】学習サンプルと呼ぶ特徴パターンの同じカ
    テゴリについての平均値である標準パターン、上記平均
    値を構成するすべての学習サンプルと上記平均値の間の
    最大距離をもって定義した閾値、及び各平均値を求める
    際に用いるサンプル数である学習サンプル数とからなる
    パターン認識用辞書を作成するパターン認識用辞書の作
    成方法において、学習サンプルが逐次的に追加された場
    合、追加後の辞書となる標準パターン(f)と閾値
    (θ〔f〕)と学習サンプル数nを、追加学習サンプ
    ル(um+1…u)と、追加前の辞書である標準パター
    ンf、閾値θ〔f〕及び学習サンプル数mとを用い
    て、 により算出して求めることを特徴とするパターン認識用
    辞書の作成方法。
  2. 【請求項2】入力パターンに対し、入力パターン入力前
    の辞書による上記入力パターンのパターン認識及びパタ
    ーン認識後の答カテゴリの修正を施して得られる特徴パ
    ターンを、追加学習サンプルとしたことを特徴とする特
    許請求の範囲第1項記載のパターン認識用辞書の作成方
    法。
  3. 【請求項3】入力パターンに対し、入力パターン入力前
    の辞書による上記入力パターンのパターン認識及びパタ
    ーン認識後の答カテゴリの修正を施して得られる特徴パ
    ターンを、追加学習サンプル敏たことを特徴とする特許
    請求の範囲第1項記載のパターン認識用辞書の作成方
    法。
JP60054573A 1985-03-20 1985-03-20 パターン認識用辞書の作成方法 Expired - Lifetime JPH0632085B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60054573A JPH0632085B2 (ja) 1985-03-20 1985-03-20 パターン認識用辞書の作成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60054573A JPH0632085B2 (ja) 1985-03-20 1985-03-20 パターン認識用辞書の作成方法

Publications (2)

Publication Number Publication Date
JPS61214083A JPS61214083A (ja) 1986-09-22
JPH0632085B2 true JPH0632085B2 (ja) 1994-04-27

Family

ID=12974432

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60054573A Expired - Lifetime JPH0632085B2 (ja) 1985-03-20 1985-03-20 パターン認識用辞書の作成方法

Country Status (1)

Country Link
JP (1) JPH0632085B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2859619B2 (ja) * 1988-11-18 1999-02-17 富士通株式会社 色識別回路
US5121441A (en) * 1990-09-21 1992-06-09 International Business Machines Corporation Robust prototype establishment in an on-line handwriting recognition system

Also Published As

Publication number Publication date
JPS61214083A (ja) 1986-09-22

Similar Documents

Publication Publication Date Title
CN111046133B (zh) 基于图谱化知识库的问答方法、设备、存储介质及装置
EP0319140B1 (en) Speech recognition
EP0355748A2 (en) A pattern recognition apparatus and method for doing the same
CN114220179A (zh) 一种基于faiss的在线手写签名笔迹检索方法和系统
CN112507881A (zh) 一种基于时间卷积神经网络的sEMG信号分类方法及系统
CN109800309A (zh) 课堂话语类型分类方法及装置
CN109933202B (zh) 一种基于骨传导的智能输入方法和系统
CN114357166A (zh) 一种基于深度学习的文本分类方法
CN111242131B (zh) 一种智能阅卷中图像识别的方法、存储介质及装置
CN117912457A (zh) 一种针对语音互动装置的训练和测试方法及系统
JPH0632085B2 (ja) パターン認識用辞書の作成方法
CN117235137B (zh) 一种基于向量数据库的职业信息查询方法及装置
CN118981529A (zh) 一种基于多层语义特征提取结构的问答文本匹配方法
CN118446221A (zh) 一种基于深度学习的智能写作辅助系统及方法
CN118861733A (zh) 两阶段负荷辨识方法及系统、电子设备、存储介质
CN115240258B (zh) 基于深度联合模型的面部表情识别方法及系统
CN115187836B (zh) 一种基于协同训练的半监督图文关系抽取系统及其方法
CN118051832A (zh) 一种知识与数据联合驱动的智能辐射源个体识别方法
CN116682421A (zh) 一种汉语智慧教学方法
CN113961674A (zh) 一种关键信息与上市公司公告文本语义匹配方法及装置
JP2701311B2 (ja) 認識辞書作成機能を備えた文字認識装置
JP3925011B2 (ja) パターン認識装置及び認識方法
CN116597860B (zh) 基于注意力机制声学词嵌入特征的语音样例检测方法及系统
CN119785822B (zh) 音乐结构分析方法、终端设备及计算机可读存储介质
JP3135594B2 (ja) パターン認識装置およびパターン認識方法