Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP3288066B2 - ネットワーク構成データ処理装置の学習処理方法およびシステム - Google Patents
[go: Go Back, main page]

JP3288066B2 - ネットワーク構成データ処理装置の学習処理方法およびシステム - Google Patents

ネットワーク構成データ処理装置の学習処理方法およびシステム

Info

Publication number
JP3288066B2
JP3288066B2 JP05104292A JP5104292A JP3288066B2 JP 3288066 B2 JP3288066 B2 JP 3288066B2 JP 05104292 A JP05104292 A JP 05104292A JP 5104292 A JP5104292 A JP 5104292A JP 3288066 B2 JP3288066 B2 JP 3288066B2
Authority
JP
Japan
Prior art keywords
learning
pattern group
teacher
pattern
data processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP05104292A
Other languages
English (en)
Other versions
JPH05250347A (ja
Inventor
茂美 長田
一繁 佐賀
正雄 比屋根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP05104292A priority Critical patent/JP3288066B2/ja
Publication of JPH05250347A publication Critical patent/JPH05250347A/ja
Application granted granted Critical
Publication of JP3288066B2 publication Critical patent/JP3288066B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Computer And Data Communications (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は,ネットワーク構成のデ
ータ変換機能に従って所望の情報処理装置を学習により
構成するための,ニューロ・コンピュータと呼ばれるよ
うなネットワーク構成データ処理装置の学習処理方法お
よびシステムに関し,特に,正しい事例からだけではな
く,そうであってはならないことを示す反例からでも,
ネットワーク構成データ処理装置を所望の情報処理装置
として構成できるようにしたネットワーク構成データ処
理装置の学習処理方法およびシステムに関する。
【0002】近年,人工知能(AI),ファクトリオー
トメーション(FA),オフィスオートメーション(O
A)の進展に伴い,人間にとって使い易く,人間と共存
できる知的な“柔らかい”システムへの要求が高まって
いる。この期待に応えるため,従来のノイマン型コンピ
ュータと異なるタイプのネットワーク構成の並列分散処
理方式の適応的なデータ処理装置が提案されている。
【0003】階層ネットワーク構造をとるデータ処理装
置の内部状態値の学習処理方式の中では,特に,誤差逆
伝播法と呼ばれる学習方式( D.E.Rumelhart, G.E.Hint
on,and R.J.Williams,"Learning Internal Representat
ions by Error Propagation." PARALLEL DISTRIBUTED
PROCESSING, Vol.1, pp.318-364, The MIT Press,198
6)が,その実用性の高さから注目されている。
【0004】この階層ネットワーク構造をとるデータ処
理装置では,基本ユニットと呼ぶ一種の演算要素のノー
ドと内部状態値に相当する重み値をもつ内部結合とから
階層ネットワークを構成している。
【0005】図8に,基本ユニット1の構成を示す。こ
の基本ユニット1は,多入力1出力系となっており,複
数の入力に対し,それぞれの内部結合の重み値を乗算す
る乗算処理部2と,それらの全乗算結果を加算する累算
処理部3と,この累算値に非線形の閾値処理を施して1
つの最終出力を出力する閾値処理部4とを備える。
【0006】そして,このような構成の多数の基本ユニ
ット1が,図9に示すように,入力信号値をそのまま分
配して動作する入力ユニット1−hを入力層として,階
層的に接続されることにより階層ネットワークが構成さ
れ,これによって,入力パターン(入力信号)を,対応
する出力パターン(出力信号)に変換するというデータ
処理機能を発揮する。
【0007】この階層ネットワークに対し,誤差逆伝播
法では,学習用に用意された入力パターンに対して出力
される階層ネットワークからの出力パターンが教師パタ
ーン(教師信号)となるべく,所定の学習アルゴリズム
に従って,階層ネットワークの内部結合の重み値を決定
していく。そして,この処理により重み値が決定される
と,想定していなかった入力信号が入力されたとして
も,この階層ネットワークから,もっともらしい適切な
出力信号を出力するという“柔らかい”データ処理機能
が実現されることになる。
【0008】このような階層ネットワーク構造のデータ
処理装置に代表されるネットワーク構成のデータ処理装
置を使用して,所望の情報処理装置を構築していくため
には,データ処理機能を規定するネットワーク構造の内
部状態値を所望の情報処理機能が実現されるべく学習処
理により求めていく必要がある。
【0009】
【従来の技術】階層ネットワーク構造をとるデータ処理
装置では,h層を前段層とし,i層を後段層とすると,
基本ユニットの累算処理部では下記の式(1) の演算を実
行し,閾値処理部では下記の式(2) の演算を実行する。
【0010】 xpi=Σyphih (Σはhの総和) (1) ypi=1/(1+exp(−xpi+θi ) ) (2) 但し, h :h層のユニット番号 i :i層のユニット番号 p :入力信号のパターン番号 θi :i層のi番ユニットの閾値 wih:h−i層の内部結合の重み xpi:h層の各ユニットからi層のi番ユニットへの入
力の積和 yph:p番目パターンの入力信号に対するh層のh番ユ
ニットからの出力 ypi:p番目パターンの入力信号に対するi層のi番ユ
ニットからの出力 誤差逆伝播法では,この重み値wihと閾値θi とを誤差
のフィードバックにより適応的に自動調節して学習する
ことになる。この式(1) ,(2) から明らかなように,重
み値wihと閾値θi との調節は同時に実行される必要が
あるが,この作業は,相互に干渉する難しい作業とな
る。そこで,本出願人は,先に出願の「特願昭 62-3334
84号(昭和62年12月28日出願,“ネットワーク構成デー
タ処理装置”)」で開示したように,入力側のh層に常
に“1”を出力するとともにその出力に対して閾値θi
を重み値として割りつける基本ユニット1を設けること
で,閾値θi を重み値wihの中に組み込んで,閾値θi
を重み値として扱うようにすることを提案した。こうす
ることによって,上述の式(1) および式(2) は, xpi=Σyphih (Σはhの総和) (3) ypi=1/(1+exp(−xpi) ) (4) 但し, h :h層のユニット番号 i :i層のユニット番号 p :入力信号のパターン番号 wih:h−i層の内部結合の重み xpi:h層の各ユニットからi層のi番ユニットへの入
力の積和 yph:p番目パターンの入力信号に対するh層のh番ユ
ニットからの出力 ypi:p番目パターンの入力信号に対するi層のi番ユ
ニットからの出力 と表されることになる。
【0011】誤差逆伝播法では,重み値の学習処理のた
めに,最初に,次式に従い,出力層(j層とする)から
の出力パターンと該出力パターンのとるべき信号となる
教師パターンとの誤差の二乗和である誤差ベクトルEp
を求めて,その誤差ベクトルEp の総和Eを階層ネット
ワークのデータ処理機能の誤差として算出する。
【0012】 E=ΣEp =ΣΣ(ypj−dpj2 /2 (5) 但し,Ep のΣはpの総和,右辺のΣΣはそれぞれp,
jの総和 Ep :p番目パターンの入力信号に対しての誤差ベクト
ル ypj:p番目パターンの入力信号に対するj層のj番ユ
ニットからの出力 dpj:p番目パターンの入力信号に対するj層のj番ユ
ニットへの教師信号 次に,階層ネットワークがh層−i層−j層の3層構造
をとる例で説明するならば,次式に従い,誤差ベクトル
の総和Eを漸近的に0とすべく重み値の1回当たりの更
新量ΔwjiとΔwihを算出する。
【0013】 Δwji(t) =−ε∂E(t) /∂wji(t) +ζwji(t−1) (6) Δwih(t) =−ε∂E(t) /∂wih(t) +ζwih(t−1) (7) 但し, ε :学習定数 ζ :モーメンタム t :更新回数 この重み値の更新を反復することにより,誤差ベクトル
の総和Eを極小値に収束させ,そのときの重み値wji
ih(閾値θi ,θj も含まれる)を学習するようにし
ている。
【0014】この誤差逆伝播法による重み値の学習処理
では,用意された学習用の学習信号(入力パターンと教
師パターンとの対)のグループに対して誤差逆伝播法を
適用していけば,誤差ベクトルの総和Eを極小値に収束
できることが証明されている。すなわち,教師パターン
に相当する出力パターンを出力できるようになる。
【0015】このように,誤差逆伝播法に代表されるよ
うなネットワーク構成のデータ処理装置におけるネット
ワーク構造の重み値の学習処理方式にあっては,学習用
の学習信号を予め用意して重み値の学習を実行するよう
に処理することになる。
【0016】したがって,ネットワーク構成のデータ処
理装置で所望の情報処理装置を構築する場合,従来で
は,予め充分な数の学習信号,すなわち,入力パターン
と“望ましい”出力パターンを意味する教師パターンを
用意し,重み値の学習を実行するように処理していた。
【0017】
【発明が解決しようとする課題】しかしながら,学習信
号として入力パターンとそれに対する“望ましい”出力
パターン,すなわち正しい事例のみを扱うこのような従
来技術では,ある入力パターンに対して,こうであって
はならないといった否定の形で与えられる“望ましくな
い”出力パターン,すなわち,いわゆる反例を学習でき
ないという問題点があった。
【0018】実際に現実世界における情報処理を考えて
みた場合,ある入力パターンに対して,必ずしも“望ま
しい”出力パターンが定義できるとは限らず,ある入力
パターンに対しては,むしろ“望ましくない”出力パタ
ーンを定義する方がはるかに簡単であることがある。
【0019】本発明はかかる事情に鑑みてなされたもの
であって,学習信号として正しい事例のみならず反例も
使用することによって,所望の高機能な情報処理装置を
構築できるようにする新たなネットワーク構成データ処
理装置の学習処理方式を提供することを目的とする。
【0020】
【課題を解決するための手段】図1は,本発明の原理説
明図である。図中,10はネットワーク構成データ処理
装置であって,所望の情報処理装置を構築するもの,1
1はネットワーク構成データ処理装置10が備えるパタ
ーン変換部であって,ネットワーク構造を備えて該ネッ
トワーク構造とその構造のもつ内部状態値とにより規定
されるデータ変換機能に従って,入力パターンに対応す
る出力パターンを算出し出力するもの,12はネットワ
ーク構成データ処理装置10が備える内部状態値格納部
であって,パターン変換部11がデータ変換処理の実行
時に必要とする内部状態値を管理するものである。
【0021】このパターン変換部11が階層ネットワー
ク構造をとるときには,複数の入力とこれらの入力に対
して乗算されるべき内部状態値(重み値)とを受け取っ
て積和を得るとともに,この得られた積和値を閾値関数
によって変換して最終出力を得るよう処理する基本ユニ
ット1を基本単位として,次のように構成される。
【0022】入力パターンを受け取って出力する複数個
の入力ユニット1−hにより入力層が構成され,複数個
の基本ユニット1−iにより1つまたは複数段設けられ
る中間層が構成され,複数個の基本ユニット1−jによ
り出力層が構成されるとともに,入力ユニット1−hと
基本ユニット1−iとの間,基本ユニット1−iの相互
間,基本ユニット1−iと基本ユニット1−jとの間で
接続がなされ,かつ,この各接続に対応して設定される
内部状態値に従って,階層ネットワーク構造が実現され
る。
【0023】20は学習パターン提示装置であって,学
習対象の入力パターン群をパターン変換部11に提示す
るとともに,各入力パターンに対してとるべき“望まし
い”パターン(これを実教師パターンという),とって
はならない“望ましくない”パターン(これを反面教師
パターンという)等を示す複数種類からなる教師パター
ン群を次に示す内部状態値学習装置30に提示するも
の,30は例えば誤差逆伝播法を実装する内部状態値学
習装置であって,学習パターン提示装置20による入力
パターンの提示に従って出力されるパターン変換部11
からの出力パターン群と,学習パターン提示装置20か
ら提示される実教師パターン群や反面教師パターン群等
の複数種類からなる教師パターン群との間に誤差を定義
するとともに,それらの教師パターン群の種類に応じて
誤差値を算出し,その誤差値に基づいて内部状態値を順
次更新していくものである。
【0024】この内部状態値学習装置30により,例え
ばパターン変換部11からの出力パターン群と反面教師
パターン群との誤差はできるだけ大きく保ちながら,パ
ターン変換部11からの出力パターン群と実教師パター
ン群との誤差値が許容範囲となる内部状態値を学習して
いくことにより,正しい事例(実教師パターン群)のみ
ならず,反例(反面教師パターン群)からもネットワー
ク構成データ処理装置10を所望の高機能な情報処理装
置として構築できるようになる。
【0025】
【作用】本発明では,学習パターン提示装置20が,実
教師パターン,反面教師パターン等の複数種類の教師パ
ターン群をパターン変換部11に提示し,内部状態値学
習装置30が教師パターン群の種類に応じて,きめ細か
な内部状態値の更新,学習を実行する。
【0026】このように,本発明によれば,学習パター
ンとして,学習対象の入力パターンとそれに対する“望
ましい”出力パターンの組からなる正しい事例群からだ
けではなく,学習対象の入力パターンとそれに対する
“望ましくない”出力パターンの組からなる反例群等の
複数種類の事例群からも,ネットワーク構成データ処理
装置10を所望の情報処理装置として構築できる。
【0027】また,学習パターン提示装置20がパター
ン変換部11に提示する教師パターン群の提示方法(学
習カリキュラム)を,例えばまず最初に,実教師パター
ン群を提示し,パターン変換部11からの出力パターン
群と実教師パターン群との誤差がある許容範囲となる内
部状態値を内部状態値学習装置30で学習した後,反面
教師パターン群を提示し,パターン変換部11からの出
力パターン群と反面教師パターン群との誤差を大きく保
ちながら,実教師パターン群との誤差をさらに厳しい許
容範囲内のものとするように内部状態値学習装置30で
学習するように,段階的に提示していくことによって,
ネットワーク構成データ処理装置10の内部状態値の更
新回数,すなわち,学習量を低減できるので,学習効率
を向上させることができる。
【0028】
【実施例】以下,階層ネットワーク構成をとるデータ処
理装置により構築される情報処理装置の例に従って,本
発明の実施例を詳細に説明する。
【0029】図2に,本発明の一実施例のシステム構成
図を示す。図中,60は学習機能を備える階層ネットワ
ーク構成のデータ処理装置であって,ある入力パターン
が入力されたときに出力パターンを算出して出力するも
の,70は学習信号管理提示装置であって,階層ネット
ワーク構成データ処理装置60を所望の情報処理装置と
して構成するために必要となる学習信号(入力パターン
と実教師パターン,反面教師パターン等からなる教師パ
ターンとの対で構成される)を管理するとともに,その
学習信号を階層ネットワーク構成データ処理装置60の
学習機能に対して提示するものである。
【0030】図3に階層ネットワーク構成データ処理装
置60の詳細な一構成例を示す。図中,61は図1で説
明したような階層ネットワーク構造をとる階層ネットワ
ーク部であって,重み値により規定されるデータ変換機
能に従って入力パターンに対応する出力パターンを算出
して出力するもの,62はパターン入力部であって,学
習信号管理提示装置70から提示される学習信号の内の
入力パターンを階層ネットワーク部61に入力するとと
もに教師パターン(ここでは実教師パターン,反面教師
パターンの2種類を例にとる)を後述する重み値変更部
66に入力するもの,63はパターン出力部であって,
階層ネットワーク部61からの出力パターンを重み値変
更部66に出力するもの,64は学習パラメータ格納部
であって,誤差逆伝播法の学習パラメータε,ζ等を格
納するもの,65は重み値格納部であって,階層ネット
ワーク部61の内部結合の重み値を管理するもの,66
は重み値変更部であって,パターン入力部62からの教
師パターン(実教師パターン,反面教師パターン)とパ
ターン出力部63からの出力パターンとを受けて,階層
ネットワーク部61の内部結合の重み値を,目的とする
収束値に近づくように更新,学習するとともに,学習中
の重み値に基づく実教師パターン群および反面教師パタ
ーン群に対する誤差値を学習信号管理提示装置70に出
力するものである。
【0031】図4に,学習信号管理提示装置70の詳細
な一構成例を示す。図中,72は学習信号格納部であっ
て,学習信号(入力パターンと実教師パターンの対,あ
るいは入力パターンと反面教師パターンの対で構成され
る)を実教師パターンと反面教師パターンとを区別でき
る形で格納するもの,73は学習信号提示部であって,
学習信号格納部72から学習信号を読み出して階層ネッ
トワーク構成データ処理装置60に提示するもの,74
は学習パラメータ設定部であって,階層ネットワーク構
成データ処理装置60に対して学習パラメータε,ζを
設定するもの,75は学習収束判定部であって,階層ネ
ットワーク構成データ処理装置60からの学習中の重み
値に基づく実教師パターン群および反面教師パターン群
に対する誤差値を受けて,その誤差値が許容範囲内に入
ったか否かを判定してその判定結果を学習信号提示部7
3に通知するものである。
【0032】次に,このように構成される本発明の実施
例が実行する,階層ネットワーク構成データ処理装置6
0を所望の情報処理装置として構築するための処理内容
について詳細に説明する。
【0033】階層ネットワーク構成データ処理装置60
の入力パターンがl個の要素からなるベクトルIp
(ip1,ip2,…,ipl)で,出力パターンがm個の要
素からなるベクトルOp =(op1,op2,…,opm)で
ある場合を想定する。
【0034】この階層ネットワーク構成データ処理装置
60を所望の情報処理装置として構築しようとする設計
者は,まず最初に,所望の情報処理装置の入出力関係を
規定するための教師パターン群を作成する。入力パター
ンIyp=(iyp1 ,iyp2 ,…,iypl )に対する実教
師パターン群として,Typ=(typ1 ,typ2 ,…,t
ypm )を,入力パターンInp=(inp1 ,inp2 ,…,
npl )に対する反面教師パターン群として,Tnp
(tnp1 ,tnp2 ,…,tnpm )を用意する。
【0035】この階層ネットワーク構成データ処理装置
60の入出力パターンの要素数に従って,階層ネットワ
ーク構成データ処理装置60の階層ネットワーク部61
として,入力パターンの要素数と一致する入力ユニット
数からなる入力層と,出力パターンの要素数と一致する
基本ユニット数からなる出力層と,実用的な段数と基本
ユニット数をもつ中間層から構成されるものを用意す
る。以下では,中間層は1段のものを想定する。
【0036】このようにして,階層ネットワーク部61
の準備を完了すると,続いて,設計者は,作成した教師
パターン群を学習信号管理提示装置70の学習信号格納
部72に格納する。
【0037】学習信号管理提示装置70に教師パターン
群が格納されると,階層ネットワーク構成データ処理装
置60を所望の情報処理装置として機能させようとする
設計者は,次に,学習信号管理提示装置70に対し,格
納された教師パターン群を学習信号として,階層ネット
ワーク部61の重み値の学習に入るように指示する。
【0038】この指示を受け取ると,学習信号管理提示
装置70の学習信号提示部73は,学習信号格納部72
から実教師パターン群および反面教師パターン群を1つ
ずつ読み出して,学習信号として階層ネットワーク構成
データ処理装置60に提示していくように処理する。
【0039】この学習信号の提示を受け取ると,階層ネ
ットワーク構成データ処理装置60のパターン入力部6
2は,提示される学習信号の入力パターンを階層ネット
ワーク部61に対して入力していくとともに,実教師パ
ターンあるいは反面教師パターンを重み値変更部66に
対して入力する。そして,階層ネットワーク部61は,
この入力される入力パターンを重み値格納部65の重み
値を用いてデータ変換していくことにより,対応する出
力パターンを算出してパターン出力部63に出力するよ
う処理するとともに,パターン出力部63は,この出力
パターンを重み値変更部66に対して出力するよう処理
する。
【0040】このようにして,パターン入力部62から
実教師パターンあるいは反面教師パターンを受け取ると
ともに,パターン出力部63から学習用の入力パターン
対応の出力パターンを受け取ると,重み値変更部66
は,実教師パターンに対しては,次式に従って実教師パ
ターンと学習用の入力パターン対応の出力パターンとの
間の誤差ベクトルEypを算出するとともに,提示される
実教師パターン毎に算出されるこの誤差ベクトルEy
総和を算出する。
【0041】 Ey =ΣEyp=ΣΣ(oypj −typj 2 /2 (8) 但し,EypのΣはpの総和,右辺のΣΣはそれぞれp,
jの総和 Eyp :p番目の実教師パターンの入力信号に対しての
誤差ベクトル oypj :p番目の実教師パターンの入力信号に対するj
層のj番ユニットからの出力 typj :p番目の実教師パターンの入力信号に対するj
層のj番ユニットへの実教師信号 同時に,反面教師パターンに対しては,次式に従って反
面教師パターンと学習用の入力パターン対応の出力パタ
ーンとの間の誤差ベクトルEnpを算出するとともに,提
示される反面教師パターン毎に算出されるこの誤差ベク
トルEn の総和を算出する。
【0042】 En =ΣEnp=ΣΣ{1−(onpj −tnpj )}2 /2 (9) 但し,EnpのΣはpの総和,右辺のΣΣはそれぞれp,
jの総和 Enp :p番目の反面教師パターンの入力信号に対して
の誤差ベクトル onpj :p番目の反面教師パターンの入力信号に対する
j層のj番ユニットからの出力 tnpj :p番目の反面教師パターンの入力信号に対する
j層のj番ユニットへの反面教師信号 (9) 式は,反面教師パターンと学習用の入力パターン対
応の出力パターンとの距離の逆数を誤差ベクトルとした
もので,例えば,(10)式のように,誤差ベクトルを定義
することもできる。
【0043】 En =ΣEnp=ΣΣ1/〔1+ exp{(onpj −tnpj 2 +α}〕 (10) 但し,α:定数 そして,重み値変更部66は,この誤差Ey ,En を用
い,次式に従って重み値の更新量Δwji(t) ,wih(t)
を算出する。
【0044】 Δwji(t) =k1 Δwyji (t) +k2 Δwnji (t) (11) Δwih(t) =k1 Δwyih (t) +k2 Δwnih (t) (12) Δwyji (t) =−ε∂E(t) /∂wji(t) +ζwji(t−1) (13) Δwyih (t) =−ε∂E(t) /∂wih(t) +ζwih(t−1) (14) Δwnji (t) =−{−ε' ∂E(t) /∂wji(t) +ζ' wji(t−1)} (15) Δwnih (t) =−{−ε' ∂E(t) /∂wih(t) +ζ' wih(t−1)} (16) 但し, Δwyji (t) ,Δwyih (t) :実教師パターン群に基づ
く重み値の更新量 Δwnji (t) ,Δwnih (t) :反面教師パターン群に基
づく重み値の更新量 k1 ,k2 :定数 ε,ε' :学習定数 ζ,ζ' :モーメンタム t :更新回数 この算出した更新量に従って,次の更新サイクルのため
の重み値である, wji(t) =wji(t−1)+Δwji(t) (17) wih(t) =wih(t−1)+Δwih(t) (18) を求めて重み値格納部65に格納する。
【0045】一方,学習信号管理提示装置70の学習収
束判定部75は,重み値変更部66から学習用の入力パ
ターン対応の出力パターン群の実教師パターン群および
反面教師パターン群に対する誤差Ey ,En を受け取る
と,この誤差Ey ,En が許容できるものになったか否
かを判定することにより,学習が収束したのか否かを判
定して,その判定結果を学習信号提示部73に通知す
る。
【0046】学習収束判定部75から非収束の通知を受
け取ると,学習信号提示部73は,再度同じ実教師パタ
ーン群および反面教師パターン群を学習信号として提示
していく処理を実行することにより,学習の収束を実現
するよう処理していくことになる。
【0047】このように,本発明では,ネットワーク構
成データ処理装置に対する実教師パターン群および反面
教師パターン群の学習信号に基づいて,内部状態値を決
定することにより,ネットワーク構成データ処理装置を
所望の情報処理装置として機能させることができる。
【0048】また,最初に,学習信号管理提示装置70
の学習信号提示部73が,学習信号格納部72に格納さ
れた教師パターン群の提示法として,実教師パターン群
のみを学習信号として提示するフェーズ,反面教師パタ
ーン群のみを学習信号として提示するフェーズ,両者を
学習信号として提示するフェーズとを随時必要に応じて
切り替えて提示する方法をとることによって,学習を進
めれば,ネットワーク構成データ処理装置60の学習の
効率を上げることができる。このフェーズの切り替え
は,所定の設定値に基づいて自動で行ってもよく,また
学習者が学習状況のモニタ機能を有するシミュレータ等
による表示を観測し,適宜行うことができるようにして
もよい。
【0049】例えば,最初に,実教師パターン群のみを
使用し,学習収束判定部75の誤差の許容範囲は緩やか
なものに設定して学習を進め,学習が収束した後に,学
習信号として実教師パターン群と反面教師パターン群を
使用し,学習収束判定部75の誤差の許容範囲を厳しく
して,学習をさらに進めるという方法をとることによっ
て,ネットワーク構成データ処理装置60の学習の効率
を上げることができる。
【0050】図5は,本発明による実験結果を示す。本
実験では,階層ネットワーク部61として,1入力ユニ
ットからなる入力層,3基本ユニットからなる中間層,
1基本ユニットからなる出力層の3層の階層ネットワー
クを準備した。
【0051】この階層ネットワーク構成データ処理装置
に対して使用した学習信号を,図中,白丸○(実教師パ
ターン群)および黒丸●(反面教師パターン群)で示
す。例えば,図5(イ)の左端の○は,“0.0という
入力信号に対して0.25という出力信号を出力せよ”
という実教師信号を意味し,図5(ロ)の左側の●は,
“0.375という入力信号に対して0.2という出力
信号を出力してはならない”という反面教師信号を意味
している。
【0052】図中の実線は,このような学習信号を上述
した方法で階層ネットワーク構成データ処理装置60に
学習させた後,すべての入力に対する階層ネットワーク
構成データ処理装置60の出力結果を図示したものであ
る。図中のLoopは,学習の繰り返し回数を表してい
る。
【0053】例えば,図5の(イ)に示すように,従来
と同様な実教師パターン群のみを用いて学習を行った結
果では,0.5の入力信号の前後に,いわゆるアンダー
シュート,オーバーシュートに相当するような歪みが現
れた。そこで,この部分を効率よく修正するために,図
5の(ロ)に黒丸●で示す反面教師パターン群を加え
て,学習を行った。その結果,図5の(ロ)に実線で示
すような望ましい出力が得られるようになった。
【0054】図6は,他の学習パターンについて,従来
技術により学習したようすを示している。図に示すよう
に,6つの入力パターンに対する実教師パターン群を用
いて,4533回学習を繰り返した結果,各入力に対し
て実線で示すような出力が得られるようになった。
【0055】図7は,図6と同じケースについて,本発
明を適用して学習を行った実験結果を示している。最初
に実教師パターン群のみを用いて,1000回学習を繰
り返した。その結果,図7の(イ)に示すような入出力
特性が得られた。そこで,図7の(イ)に示す×印の位
置の入力信号に対する出力信号を,反面教師パターンと
して追加しさらに学習を続けると,1954回の学習で
結果は図7の(ロ)に示すようになった。図6に示す結
果と,図7の(ロ)に示す結果とを比較すると明らかな
ように,反面教師パターン群の利用により,内部状態値
を望ましい値に高速に収束できることがわかる。
【0056】この実施例の説明では,実教師パターン群
と反面教師パターン群の2種類の教師パターン群により
学習を行う場合を例に説明したが,実教師パターン群以
外の教師パターン群を,例えば出力パターン群が絶対に
とってはならない値のもの,出力パターン群ができるだ
けとるべきではない値ものというように,望ましくない
程度に応じて,さらに複数種類に分け,その望ましくな
いレベルに応じて,内部状態値の更新量を調節するよう
にしてもよい。
【0057】本発明は,階層ネットワーク構造のデータ
処理装置に限らず,他のネットワーク構造を持つデータ
処理装置の学習処理にも,同様に適用することができ
る。また,ネットワークの内部状態値の学習方法も誤差
逆伝播法に限らず適用できることは明らかである。さら
に,教師パターン群とネットワーク構成データ処理装置
60からの出力パターン群との誤差の定義法,該誤差に
基づく内部状態値の更新量の決定法,教師パターン群の
提示の方法等も,上述した実施例の方法に限らず,本発
明を実施することが可能である。
【0058】
【発明の効果】以上説明したように,本発明によれば,
学習パターンとして,学習対象の入力パターンとそれに
対する“望ましい”出力パターンの組からなる正しい事
例群からだけではなく,学習対象の入力パターンとそれ
に対する“望ましくない”出力パターンの組からなる反
例群等の複数種類の事例群からも,ネットワーク構成デ
ータ処理装置を所望の高機能な情報処理装置として構築
できるようになる。また,事例群の提示方法として正し
い事例群のみを使用するフェーズ,反例群のみを使用す
るフェーズ,両者を使用するフェーズ等というように随
時切り替えて提示する方法をとることにより,さらに学
習の効率を向上させることができるようになる。
【図面の簡単な説明】
【図1】本発明の原理説明図である。
【図2】本発明の一実施例のシステム構成図である。
【図3】図2に示す階層ネットワーク構成データ処理装
置の一構成例を示す図である。
【図4】図2に示す学習信号管理提示装置の一構成例を
示す図である。
【図5】本発明による実験結果の説明図である。
【図6】従来技術による実験結果の説明図である。
【図7】本発明による実験結果の説明図である。
【図8】基本ユニットの基本構成図である。
【図9】階層ネットワークの基本構成図である。
【符号の説明】
10 ネットワーク構成データ処理装置 11 パターン変換部 12 内部状態値格納部 20 学習パターン提示装置 30 内部状態値学習装置 60 階層ネットワーク構成データ処理装置 70 学習信号管理提示装置
フロントページの続き (56)参考文献 特開 平5−334276(JP,A) 特開 平5−20291(JP,A) 特開 平5−165801(JP,A) 特開 平2−170265(JP,A) 山田貢己・他「教師信号と出力との差 が増大する学習方式」,1991年電子情報 通信学会秋季大会講演論文集(分冊 6),日本,社団法人電子情報通信学 会・発行,特許庁情報館受入日:1991年 11月13日,pp.12 (58)調査した分野(Int.Cl.7,DB名) G06N 1/00 - 7/00 G06G 7/60 G05B 13/00 - 13/04 G10L 3/00 - 9/20 G06K 9/00 - 9/82 G06T 7/00 - 7/60 CSDB(日本国特許庁) JICSTファイル(JOIS)

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力に対して内部状態値により規定され
    るデータ変換を行う演算要素が複数接続されたネットワ
    ーク構造を持ち,入力パターンに対応して出力パターン
    を算出し出力するネットワーク構成データ処理装置の
    部状態値を学習によって決定する学習処理方法であり, 前記ネットワーク構成データ処理装置に提示する学習対
    象の入力パターン群に対応して,出力パターン群がとる
    べきパターンを指示する実教師パターン群と,出力パタ
    ーン群がとってはならないパターンを指示する反面教師
    パターン群とを含む複数種類の教師パターン群を学習情
    報として与え, 学習対象の入力パターン群による前記ネットワーク構成
    データ処理装置からの出力パターン群と前記教師パター
    ン群との誤差値を,教師パターン群の種類毎に算出し, その教師パターン群の種類に応じて得られた複数個の誤
    差値に基づいて内部状態値の更新量を決定し, その更新量を用いて内部状態値を順次更新しながら,前
    記誤差値に関する値が所定の許容範囲となるように,内
    部状態値を学習によって決定するネットワーク構成デー
    タ処理装置の学習処理方法であって, 前記ネットワーク構成データ処理装置の学習に用いる複
    数種類の教師パターン群を,ネットワーク構成データ処
    理装置からの出力パターン群と前記実教師パターン群と
    の誤差値に応じて,前記実教師パターン群,次にその他
    の反面教師パターン群を含む教師パターン群の順番で提
    示し,内部状態値を順次更新して学習を進める ことを特
    徴とするネットワーク構成データ処理装置の学習処理方
    法。
  2. 【請求項2】 請求項1記載のネットワーク構成データ
    処理装置の学習処理方法において,前記ネットワーク構成データ処理装置に提示する前記教
    師パターン群の提示法として,前記実教師パターン群の
    みを使用するフェーズ,前記実教師パターン群以外の教
    師パターン群のみを使用するフェーズ,両者を使用する
    フェーズを有し, これらのフェーズを随時切り替えながら学習する ことを
    特徴とするネットワーク構成データ処理装置の学習処理
    方法。
  3. 【請求項3】 請求項1または請求項2記載のネットワ
    ーク構成データ処理装置の学習処理方法において,学習対象の入力パターン群による前記ネットワーク構成
    データ処理装置からの出力パターン群と前記教師パター
    ン群との誤差値として,出力パターン群と前記複数種類
    の各教師パターン群との間に距離を定義し, 少なくとも,出力パターン群と前記実教師パターン群と
    の間の距離は減少させるように,かつ,出力パターン群
    と前記反面教師パターン群との間の距離は増大させるよ
    うに,前記ネットワーク構成データ処理装置の内部状態
    値を順次更新していき, 出力パターン群と前記実教師パターン群との誤差値が許
    容範囲となるように学習する ことを特徴とするネットワ
    ーク構成データ処理装置の学習処理方法。
  4. 【請求項4】 請求項1または請求項2記載のネットワ
    ーク構成データ処理装置の学習処理方法において,学習対象の入力パターン群による前記ネットワーク構成
    データ処理装置からの出力パターン群と前記教師パター
    ン群との誤差値として,出力パターン群と前記実教師パ
    ターン群および前記反面教師パターン群との間に距離を
    定義し, 少なくとも,出力パターン群と前記実教師パターン群と
    の間の距離は減少させるように,かつ,出力パターン群
    と前記反面教師パターン群との間の距離は増大させるよ
    うに,前記ネットワーク構成データ処理装置の内部状態
    値を順次更新していき, 出力パターン群と前記実教師パターン群との間の距離お
    よび出力パターン群と前記反面パターン群との間の距離
    が,許容範囲となるように学習する ことを特徴とするネ
    ットワーク構成データ処理装置の学習処理方法。
  5. 【請求項5】 入力に対して内部状態値により規定され
    るデータ変換を行う演算要素が複数接続されたネットワ
    ーク構造を持ち,入力パターンに対応して出力パターン
    を算出し出力するネットワーク構成データ処理装置を
    え,その内部状態値を,学習対象の入力パターン群とあ
    らかじめ入力パターン群に対して定められた教師パター
    ン群とに基づいて学習するネットワーク構成データ処理
    装置の学習処理システムであり, 前記ネットワーク構成データ処理装置に入力する学習対
    象の入力パターン群を提示するとともに,それらの入力
    パターン群に応じて,ネットワーク構成データ処理装
    らの出力パターン群を指示する教師パターン群とし
    て,出力パターン群がとるべきパターンを指示する実教
    師パターン群と,出力パターン群がとってはならないパ
    ターンを指示する反面教師パターン群とを含む複数種類
    の教師パターン群を学習情報として提示する学習パター
    ン提示手段と, その学習パターン提示手段によって与えられた学習対象
    の入力パターン群による前記ネットワーク構成データ処
    理装置からの出力パターン群と前記教師パターン群との
    誤差値を,教師パターン群の種類毎に算出し,その教師
    パターン群の種類に応じて得られた複数個の誤差値に基
    づいて,前記ネットワーク構成データ処理装置の内部状
    態値の更新量を決定し,その更新量を用いて内部状態値
    を順次更新しながら,少なくとも出力パターン群と前記
    実教師パターン群との誤差値が許容範囲となるような学
    習制御を行う内部状態値学習手段とを備えたネットワー
    ク構成データ処理装置の学習処理システムであって, 前記学習パターン提示手段は,前記ネットワーク構成デ
    ータ処理装置の学習に用いる複数種類の教師パターン群
    を,ネットワーク構成データ処理装置からの出力パター
    ン群と前記実教師パターン群との誤差値に応じて,前記
    実教師パターン群,次にその他の反面教師パターン群を
    含む教師パターン群の順番で提示する手段を備え, 前記内部状態値学習手段は,前記学習パターン提示手段
    から提示された情報に基づき,内部状態値を順次更新し
    て学習を進める ことを特徴とするネットワーク構成デー
    タ処理装置の学習処理システム。
JP05104292A 1992-03-10 1992-03-10 ネットワーク構成データ処理装置の学習処理方法およびシステム Expired - Fee Related JP3288066B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP05104292A JP3288066B2 (ja) 1992-03-10 1992-03-10 ネットワーク構成データ処理装置の学習処理方法およびシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP05104292A JP3288066B2 (ja) 1992-03-10 1992-03-10 ネットワーク構成データ処理装置の学習処理方法およびシステム

Publications (2)

Publication Number Publication Date
JPH05250347A JPH05250347A (ja) 1993-09-28
JP3288066B2 true JP3288066B2 (ja) 2002-06-04

Family

ID=12875748

Family Applications (1)

Application Number Title Priority Date Filing Date
JP05104292A Expired - Fee Related JP3288066B2 (ja) 1992-03-10 1992-03-10 ネットワーク構成データ処理装置の学習処理方法およびシステム

Country Status (1)

Country Link
JP (1) JP3288066B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3398123B1 (en) * 2015-12-31 2025-03-12 KLA - Tencor Corporation Accelerated training of a machine learning based model for semiconductor applications
JP6931624B2 (ja) * 2018-05-22 2021-09-08 株式会社日立製作所 学習支援装置および学習支援方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
山田貢己・他「教師信号と出力との差が増大する学習方式」,1991年電子情報通信学会秋季大会講演論文集(分冊6),日本,社団法人電子情報通信学会・発行,特許庁情報館受入日:1991年11月13日,pp.12

Also Published As

Publication number Publication date
JPH05250347A (ja) 1993-09-28

Similar Documents

Publication Publication Date Title
Uykan et al. Analysis of input-output clustering for determining centers of RBFN
Chow et al. A recurrent neural-network-based real-time learning control strategy applying to nonlinear systems with unknown dynamics
Liu et al. Adaptive containment control of heterogeneous high‐order fully actuated multi‐agent systems
Santini et al. Block-structured recurrent neural networks
Nechyba et al. Neural network approach to control system identification with variable activation functions
Wang et al. Game-based distributed decision optimization for heterogeneous multiagent systems with unknown nonlinear dynamics
JP3288066B2 (ja) ネットワーク構成データ処理装置の学習処理方法およびシステム
JPH07121498A (ja) ニューラルネットワーク構築方法
JP3168204B2 (ja) ネットワーク構成データ処理装置
Sosa et al. Synaptic learning of long-term cognitive networks with inputs
JPH0635510A (ja) ニューラルネットワークを用いたモデル規範型適応制御装置
Chen et al. Analysis of decision boundaries generated by constructive neural network learning algorithms
JP2877413B2 (ja) 余剰ニューロン決定処理方式
Jula et al. Application of artificial neural networks in interactive simulation
JP3396489B2 (ja) ネットワーク型情報処理システム
Tang et al. A model of neurons with unidirectional linear response
Zhou et al. An adaptive feedforward artificial neural network with the applications to multiple criteria decision making
Sabeti et al. Hybrid evolutionary algorithms based on PSO-GA for training ANFIS structure
Warwich The control of dynamical systems by neural networks
Vega et al. Trajectory tracking on complex networks via neural sliding-mode pinning control
Kasabov Evolving fuzzy neural networks for adaptive, on-line intelligent agents and systems
Zhang et al. An improved algorithm for eleman neural network by adding a modified error function
Loh et al. Backpropagation using generalized least squares
JPH04323763A (ja) ニューラルネットワーク学習方法
Prat Baucells LTI ODE-valued neural networks adaptation of the back propagation algorithm

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020226

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080315

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090315

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100315

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees