JP3288066B2

JP3288066B2 - ネットワーク構成データ処理装置の学習処理方法およびシステム

Info

Publication number: JP3288066B2
Application number: JP05104292A
Authority: JP
Inventors: 茂美長田; 一繁佐賀; 正雄比屋根
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1992-03-10
Filing date: 1992-03-10
Publication date: 2002-06-04
Anticipated expiration: 2017-06-04
Also published as: JPH05250347A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は，ネットワーク構成のデ
ータ変換機能に従って所望の情報処理装置を学習により
構成するための，ニューロ・コンピュータと呼ばれるよ
うなネットワーク構成データ処理装置の学習処理方法お
よびシステムに関し，特に，正しい事例からだけではな
く，そうであってはならないことを示す反例からでも，
ネットワーク構成データ処理装置を所望の情報処理装置
として構成できるようにしたネットワーク構成データ処
理装置の学習処理方法およびシステムに関する。

【０００２】近年，人工知能（ＡＩ），ファクトリオー
トメーション（ＦＡ），オフィスオートメーション（Ｏ
Ａ）の進展に伴い，人間にとって使い易く，人間と共存
できる知的な“柔らかい”システムへの要求が高まって
いる。この期待に応えるため，従来のノイマン型コンピ
ュータと異なるタイプのネットワーク構成の並列分散処
理方式の適応的なデータ処理装置が提案されている。

【０００３】階層ネットワーク構造をとるデータ処理装
置の内部状態値の学習処理方式の中では，特に，誤差逆
伝播法と呼ばれる学習方式（ D.E.Rumelhart, G.E.Hint
on,and R.J.Williams,"Learning Internal Representat
ions by Error Propagation." PARALLEL DISTRIBUTED
PROCESSING, Vol.1, pp.318-364, The MIT Press,198
6）が，その実用性の高さから注目されている。

【０００４】この階層ネットワーク構造をとるデータ処
理装置では，基本ユニットと呼ぶ一種の演算要素のノー
ドと内部状態値に相当する重み値をもつ内部結合とから
階層ネットワークを構成している。

【０００５】図８に，基本ユニット１の構成を示す。こ
の基本ユニット１は，多入力１出力系となっており，複
数の入力に対し，それぞれの内部結合の重み値を乗算す
る乗算処理部２と，それらの全乗算結果を加算する累算
処理部３と，この累算値に非線形の閾値処理を施して１
つの最終出力を出力する閾値処理部４とを備える。

【０００６】そして，このような構成の多数の基本ユニ
ット１が，図９に示すように，入力信号値をそのまま分
配して動作する入力ユニット１−ｈを入力層として，階
層的に接続されることにより階層ネットワークが構成さ
れ，これによって，入力パターン（入力信号）を，対応
する出力パターン（出力信号）に変換するというデータ
処理機能を発揮する。

【０００７】この階層ネットワークに対し，誤差逆伝播
法では，学習用に用意された入力パターンに対して出力
される階層ネットワークからの出力パターンが教師パタ
ーン（教師信号）となるべく，所定の学習アルゴリズム
に従って，階層ネットワークの内部結合の重み値を決定
していく。そして，この処理により重み値が決定される
と，想定していなかった入力信号が入力されたとして
も，この階層ネットワークから，もっともらしい適切な
出力信号を出力するという“柔らかい”データ処理機能
が実現されることになる。

【０００８】このような階層ネットワーク構造のデータ
処理装置に代表されるネットワーク構成のデータ処理装
置を使用して，所望の情報処理装置を構築していくため
には，データ処理機能を規定するネットワーク構造の内
部状態値を所望の情報処理機能が実現されるべく学習処
理により求めていく必要がある。

【０００９】

【従来の技術】階層ネットワーク構造をとるデータ処理
装置では，ｈ層を前段層とし，ｉ層を後段層とすると，
基本ユニットの累算処理部では下記の式(1) の演算を実
行し，閾値処理部では下記の式(2) の演算を実行する。

【００１０】ｘ_pi＝Σｙ_phｗ_ih （Σはｈの総和） (1) ｙ_pi＝１／（１＋exp(−ｘ_pi＋θ_i) ） (2) 但し，ｈ：ｈ層のユニット番号ｉ：ｉ層のユニット番号ｐ：入力信号のパターン番号 θ_i：ｉ層のｉ番ユニットの閾値ｗ_ih：ｈ−ｉ層の内部結合の重みｘ_pi：ｈ層の各ユニットからｉ層のｉ番ユニットへの入
力の積和ｙ_ph：ｐ番目パターンの入力信号に対するｈ層のｈ番ユ
ニットからの出力ｙ_pi：ｐ番目パターンの入力信号に対するｉ層のｉ番ユ
ニットからの出力誤差逆伝播法では，この重み値ｗ_ihと閾値θ_iとを誤差
のフィードバックにより適応的に自動調節して学習する
ことになる。この式(1) ，(2) から明らかなように，重
み値ｗ_ihと閾値θ_iとの調節は同時に実行される必要が
あるが，この作業は，相互に干渉する難しい作業とな
る。そこで，本出願人は，先に出願の「特願昭 62-3334
84号（昭和62年12月28日出願，“ネットワーク構成デー
タ処理装置”）」で開示したように，入力側のｈ層に常
に“１”を出力するとともにその出力に対して閾値θ_i
を重み値として割りつける基本ユニット１を設けること
で，閾値θ_iを重み値ｗ_ihの中に組み込んで，閾値θ_i
を重み値として扱うようにすることを提案した。こうす
ることによって，上述の式(1) および式(2) は，ｘ_pi＝Σｙ_phｗ_ih （Σはｈの総和） (3) ｙ_pi＝１／（１＋exp(−ｘ_pi) ） (4) 但し，ｈ：ｈ層のユニット番号ｉ：ｉ層のユニット番号ｐ：入力信号のパターン番号ｗ_ih：ｈ−ｉ層の内部結合の重みｘ_pi：ｈ層の各ユニットからｉ層のｉ番ユニットへの入
力の積和ｙ_ph：ｐ番目パターンの入力信号に対するｈ層のｈ番ユ
ニットからの出力ｙ_pi：ｐ番目パターンの入力信号に対するｉ層のｉ番ユ
ニットからの出力と表されることになる。

【００１１】誤差逆伝播法では，重み値の学習処理のた
めに，最初に，次式に従い，出力層（ｊ層とする）から
の出力パターンと該出力パターンのとるべき信号となる
教師パターンとの誤差の二乗和である誤差ベクトルＥ_p
を求めて，その誤差ベクトルＥ_pの総和Ｅを階層ネット
ワークのデータ処理機能の誤差として算出する。

【００１２】Ｅ＝ΣＥ_p＝ΣΣ（ｙ_pj−ｄ_pj）²／２ (5) 但し，Ｅ_pのΣはｐの総和，右辺のΣΣはそれぞれｐ，
ｊの総和Ｅ_p：ｐ番目パターンの入力信号に対しての誤差ベクト
ルｙ_pj：ｐ番目パターンの入力信号に対するｊ層のｊ番ユ
ニットからの出力ｄ_pj：ｐ番目パターンの入力信号に対するｊ層のｊ番ユ
ニットへの教師信号次に，階層ネットワークがｈ層−ｉ層−ｊ層の３層構造
をとる例で説明するならば，次式に従い，誤差ベクトル
の総和Ｅを漸近的に０とすべく重み値の１回当たりの更
新量Δｗ_jiとΔｗ_ihを算出する。

【００１３】 Δｗ_ji(t) ＝−ε∂Ｅ(t) ／∂ｗ_ji(t) ＋ζｗ_ji(t−1) (6) Δｗ_ih(t) ＝−ε∂Ｅ(t) ／∂ｗ_ih(t) ＋ζｗ_ih(t−1) (7) 但し， ε ：学習定数 ζ ：モーメンタムｔ：更新回数この重み値の更新を反復することにより，誤差ベクトル
の総和Ｅを極小値に収束させ，そのときの重み値ｗ_ji，
ｗ_ih（閾値θ_i，θ_jも含まれる）を学習するようにし
ている。

【００１４】この誤差逆伝播法による重み値の学習処理
では，用意された学習用の学習信号（入力パターンと教
師パターンとの対）のグループに対して誤差逆伝播法を
適用していけば，誤差ベクトルの総和Ｅを極小値に収束
できることが証明されている。すなわち，教師パターン
に相当する出力パターンを出力できるようになる。

【００１５】このように，誤差逆伝播法に代表されるよ
うなネットワーク構成のデータ処理装置におけるネット
ワーク構造の重み値の学習処理方式にあっては，学習用
の学習信号を予め用意して重み値の学習を実行するよう
に処理することになる。

【００１６】したがって，ネットワーク構成のデータ処
理装置で所望の情報処理装置を構築する場合，従来で
は，予め充分な数の学習信号，すなわち，入力パターン
と“望ましい”出力パターンを意味する教師パターンを
用意し，重み値の学習を実行するように処理していた。

【００１７】

【発明が解決しようとする課題】しかしながら，学習信
号として入力パターンとそれに対する“望ましい”出力
パターン，すなわち正しい事例のみを扱うこのような従
来技術では，ある入力パターンに対して，こうであって
はならないといった否定の形で与えられる“望ましくな
い”出力パターン，すなわち，いわゆる反例を学習でき
ないという問題点があった。

【００１８】実際に現実世界における情報処理を考えて
みた場合，ある入力パターンに対して，必ずしも“望ま
しい”出力パターンが定義できるとは限らず，ある入力
パターンに対しては，むしろ“望ましくない”出力パタ
ーンを定義する方がはるかに簡単であることがある。

【００１９】本発明はかかる事情に鑑みてなされたもの
であって，学習信号として正しい事例のみならず反例も
使用することによって，所望の高機能な情報処理装置を
構築できるようにする新たなネットワーク構成データ処
理装置の学習処理方式を提供することを目的とする。

【００２０】

【課題を解決するための手段】図１は，本発明の原理説
明図である。図中，１０はネットワーク構成データ処理
装置であって，所望の情報処理装置を構築するもの，１
１はネットワーク構成データ処理装置１０が備えるパタ
ーン変換部であって，ネットワーク構造を備えて該ネッ
トワーク構造とその構造のもつ内部状態値とにより規定
されるデータ変換機能に従って，入力パターンに対応す
る出力パターンを算出し出力するもの，１２はネットワ
ーク構成データ処理装置１０が備える内部状態値格納部
であって，パターン変換部１１がデータ変換処理の実行
時に必要とする内部状態値を管理するものである。

【００２１】このパターン変換部１１が階層ネットワー
ク構造をとるときには，複数の入力とこれらの入力に対
して乗算されるべき内部状態値（重み値）とを受け取っ
て積和を得るとともに，この得られた積和値を閾値関数
によって変換して最終出力を得るよう処理する基本ユニ
ット１を基本単位として，次のように構成される。

【００２２】入力パターンを受け取って出力する複数個
の入力ユニット１−ｈにより入力層が構成され，複数個
の基本ユニット１−ｉにより１つまたは複数段設けられ
る中間層が構成され，複数個の基本ユニット１−ｊによ
り出力層が構成されるとともに，入力ユニット１−ｈと
基本ユニット１−ｉとの間，基本ユニット１−ｉの相互
間，基本ユニット１−ｉと基本ユニット１−ｊとの間で
接続がなされ，かつ，この各接続に対応して設定される
内部状態値に従って，階層ネットワーク構造が実現され
る。

【００２３】２０は学習パターン提示装置であって，学
習対象の入力パターン群をパターン変換部１１に提示す
るとともに，各入力パターンに対してとるべき“望まし
い”パターン（これを実教師パターンという），とって
はならない“望ましくない”パターン（これを反面教師
パターンという）等を示す複数種類からなる教師パター
ン群を次に示す内部状態値学習装置３０に提示するも
の，３０は例えば誤差逆伝播法を実装する内部状態値学
習装置であって，学習パターン提示装置２０による入力
パターンの提示に従って出力されるパターン変換部１１
からの出力パターン群と，学習パターン提示装置２０か
ら提示される実教師パターン群や反面教師パターン群等
の複数種類からなる教師パターン群との間に誤差を定義
するとともに，それらの教師パターン群の種類に応じて
誤差値を算出し，その誤差値に基づいて内部状態値を順
次更新していくものである。

【００２４】この内部状態値学習装置３０により，例え
ばパターン変換部１１からの出力パターン群と反面教師
パターン群との誤差はできるだけ大きく保ちながら，パ
ターン変換部１１からの出力パターン群と実教師パター
ン群との誤差値が許容範囲となる内部状態値を学習して
いくことにより，正しい事例（実教師パターン群）のみ
ならず，反例（反面教師パターン群）からもネットワー
ク構成データ処理装置１０を所望の高機能な情報処理装
置として構築できるようになる。

【００２５】

【作用】本発明では，学習パターン提示装置２０が，実
教師パターン，反面教師パターン等の複数種類の教師パ
ターン群をパターン変換部１１に提示し，内部状態値学
習装置３０が教師パターン群の種類に応じて，きめ細か
な内部状態値の更新，学習を実行する。

【００２６】このように，本発明によれば，学習パター
ンとして，学習対象の入力パターンとそれに対する“望
ましい”出力パターンの組からなる正しい事例群からだ
けではなく，学習対象の入力パターンとそれに対する
“望ましくない”出力パターンの組からなる反例群等の
複数種類の事例群からも，ネットワーク構成データ処理
装置１０を所望の情報処理装置として構築できる。

【００２７】また，学習パターン提示装置２０がパター
ン変換部１１に提示する教師パターン群の提示方法（学
習カリキュラム）を，例えばまず最初に，実教師パター
ン群を提示し，パターン変換部１１からの出力パターン
群と実教師パターン群との誤差がある許容範囲となる内
部状態値を内部状態値学習装置３０で学習した後，反面
教師パターン群を提示し，パターン変換部１１からの出
力パターン群と反面教師パターン群との誤差を大きく保
ちながら，実教師パターン群との誤差をさらに厳しい許
容範囲内のものとするように内部状態値学習装置３０で
学習するように，段階的に提示していくことによって，
ネットワーク構成データ処理装置１０の内部状態値の更
新回数，すなわち，学習量を低減できるので，学習効率
を向上させることができる。

【００２８】

【実施例】以下，階層ネットワーク構成をとるデータ処
理装置により構築される情報処理装置の例に従って，本
発明の実施例を詳細に説明する。

【００２９】図２に，本発明の一実施例のシステム構成
図を示す。図中，６０は学習機能を備える階層ネットワ
ーク構成のデータ処理装置であって，ある入力パターン
が入力されたときに出力パターンを算出して出力するも
の，７０は学習信号管理提示装置であって，階層ネット
ワーク構成データ処理装置６０を所望の情報処理装置と
して構成するために必要となる学習信号（入力パターン
と実教師パターン，反面教師パターン等からなる教師パ
ターンとの対で構成される）を管理するとともに，その
学習信号を階層ネットワーク構成データ処理装置６０の
学習機能に対して提示するものである。

【００３０】図３に階層ネットワーク構成データ処理装
置６０の詳細な一構成例を示す。図中，６１は図１で説
明したような階層ネットワーク構造をとる階層ネットワ
ーク部であって，重み値により規定されるデータ変換機
能に従って入力パターンに対応する出力パターンを算出
して出力するもの，６２はパターン入力部であって，学
習信号管理提示装置７０から提示される学習信号の内の
入力パターンを階層ネットワーク部６１に入力するとと
もに教師パターン（ここでは実教師パターン，反面教師
パターンの２種類を例にとる）を後述する重み値変更部
６６に入力するもの，６３はパターン出力部であって，
階層ネットワーク部６１からの出力パターンを重み値変
更部６６に出力するもの，６４は学習パラメータ格納部
であって，誤差逆伝播法の学習パラメータε，ζ等を格
納するもの，６５は重み値格納部であって，階層ネット
ワーク部６１の内部結合の重み値を管理するもの，６６
は重み値変更部であって，パターン入力部６２からの教
師パターン（実教師パターン，反面教師パターン）とパ
ターン出力部６３からの出力パターンとを受けて，階層
ネットワーク部６１の内部結合の重み値を，目的とする
収束値に近づくように更新，学習するとともに，学習中
の重み値に基づく実教師パターン群および反面教師パタ
ーン群に対する誤差値を学習信号管理提示装置７０に出
力するものである。

【００３１】図４に，学習信号管理提示装置７０の詳細
な一構成例を示す。図中，７２は学習信号格納部であっ
て，学習信号（入力パターンと実教師パターンの対，あ
るいは入力パターンと反面教師パターンの対で構成され
る）を実教師パターンと反面教師パターンとを区別でき
る形で格納するもの，７３は学習信号提示部であって，
学習信号格納部７２から学習信号を読み出して階層ネッ
トワーク構成データ処理装置６０に提示するもの，７４
は学習パラメータ設定部であって，階層ネットワーク構
成データ処理装置６０に対して学習パラメータε，ζを
設定するもの，７５は学習収束判定部であって，階層ネ
ットワーク構成データ処理装置６０からの学習中の重み
値に基づく実教師パターン群および反面教師パターン群
に対する誤差値を受けて，その誤差値が許容範囲内に入
ったか否かを判定してその判定結果を学習信号提示部７
３に通知するものである。

【００３２】次に，このように構成される本発明の実施
例が実行する，階層ネットワーク構成データ処理装置６
０を所望の情報処理装置として構築するための処理内容
について詳細に説明する。

【００３３】階層ネットワーク構成データ処理装置６０
の入力パターンがｌ個の要素からなるベクトルＩ_p＝
（ｉ_p1，ｉ_p2，…，ｉ_pl）で，出力パターンがｍ個の要
素からなるベクトルＯ_p＝（ｏ_p1，ｏ_p2，…，ｏ_pm）で
ある場合を想定する。

【００３４】この階層ネットワーク構成データ処理装置
６０を所望の情報処理装置として構築しようとする設計
者は，まず最初に，所望の情報処理装置の入出力関係を
規定するための教師パターン群を作成する。入力パター
ンＩ_yp＝（ｉ_yp1，ｉ_yp2，…，ｉ_ypl）に対する実教
師パターン群として，Ｔ_yp＝（ｔ_yp1，ｔ_yp2，…，ｔ
_ypm）を，入力パターンＩ_np＝（ｉ_np1，ｉ_np2，…，
ｉ_npl）に対する反面教師パターン群として，Ｔ_np＝
（ｔ_np1，ｔ_np2，…，ｔ_npm）を用意する。

【００３５】この階層ネットワーク構成データ処理装置
６０の入出力パターンの要素数に従って，階層ネットワ
ーク構成データ処理装置６０の階層ネットワーク部６１
として，入力パターンの要素数と一致する入力ユニット
数からなる入力層と，出力パターンの要素数と一致する
基本ユニット数からなる出力層と，実用的な段数と基本
ユニット数をもつ中間層から構成されるものを用意す
る。以下では，中間層は１段のものを想定する。

【００３６】このようにして，階層ネットワーク部６１
の準備を完了すると，続いて，設計者は，作成した教師
パターン群を学習信号管理提示装置７０の学習信号格納
部７２に格納する。

【００３７】学習信号管理提示装置７０に教師パターン
群が格納されると，階層ネットワーク構成データ処理装
置６０を所望の情報処理装置として機能させようとする
設計者は，次に，学習信号管理提示装置７０に対し，格
納された教師パターン群を学習信号として，階層ネット
ワーク部６１の重み値の学習に入るように指示する。

【００３８】この指示を受け取ると，学習信号管理提示
装置７０の学習信号提示部７３は，学習信号格納部７２
から実教師パターン群および反面教師パターン群を１つ
ずつ読み出して，学習信号として階層ネットワーク構成
データ処理装置６０に提示していくように処理する。

【００３９】この学習信号の提示を受け取ると，階層ネ
ットワーク構成データ処理装置６０のパターン入力部６
２は，提示される学習信号の入力パターンを階層ネット
ワーク部６１に対して入力していくとともに，実教師パ
ターンあるいは反面教師パターンを重み値変更部６６に
対して入力する。そして，階層ネットワーク部６１は，
この入力される入力パターンを重み値格納部６５の重み
値を用いてデータ変換していくことにより，対応する出
力パターンを算出してパターン出力部６３に出力するよ
う処理するとともに，パターン出力部６３は，この出力
パターンを重み値変更部６６に対して出力するよう処理
する。

【００４０】このようにして，パターン入力部６２から
実教師パターンあるいは反面教師パターンを受け取ると
ともに，パターン出力部６３から学習用の入力パターン
対応の出力パターンを受け取ると，重み値変更部６６
は，実教師パターンに対しては，次式に従って実教師パ
ターンと学習用の入力パターン対応の出力パターンとの
間の誤差ベクトルＥ_ypを算出するとともに，提示される
実教師パターン毎に算出されるこの誤差ベクトルＥ_yの
総和を算出する。

【００４１】Ｅ_y＝ΣＥ_yp＝ΣΣ（ｏ_ypj−ｔ_ypj）²／２ (8) 但し，Ｅ_ypのΣはｐの総和，右辺のΣΣはそれぞれｐ，
ｊの総和Ｅ_yp ：ｐ番目の実教師パターンの入力信号に対しての
誤差ベクトルｏ_ypj：ｐ番目の実教師パターンの入力信号に対するｊ
層のｊ番ユニットからの出力ｔ_ypj：ｐ番目の実教師パターンの入力信号に対するｊ
層のｊ番ユニットへの実教師信号同時に，反面教師パターンに対しては，次式に従って反
面教師パターンと学習用の入力パターン対応の出力パタ
ーンとの間の誤差ベクトルＥ_npを算出するとともに，提
示される反面教師パターン毎に算出されるこの誤差ベク
トルＥ_nの総和を算出する。

【００４２】Ｅ_n＝ΣＥ_np＝ΣΣ｛１−（ｏ_npj−ｔ_npj）｝²／２ (9) 但し，Ｅ_npのΣはｐの総和，右辺のΣΣはそれぞれｐ，
ｊの総和Ｅ_np ：ｐ番目の反面教師パターンの入力信号に対して
の誤差ベクトルｏ_npj：ｐ番目の反面教師パターンの入力信号に対する
ｊ層のｊ番ユニットからの出力ｔ_npj：ｐ番目の反面教師パターンの入力信号に対する
ｊ層のｊ番ユニットへの反面教師信号 (9) 式は，反面教師パターンと学習用の入力パターン対
応の出力パターンとの距離の逆数を誤差ベクトルとした
もので，例えば，(10)式のように，誤差ベクトルを定義
することもできる。

【００４３】Ｅ_n＝ΣＥ_np＝ΣΣ１／〔１＋ exp｛（ｏ_npj−ｔ_npj）²＋α｝〕 (10) 但し，α：定数そして，重み値変更部６６は，この誤差Ｅ_y，Ｅ_nを用
い，次式に従って重み値の更新量Δｗ_ji(t) ，ｗ_ih(t)
を算出する。

【００４４】 Δｗ_ji(t) ＝ｋ₁Δｗ_yji(t) ＋ｋ₂Δｗ_nji(t) (11) Δｗ_ih(t) ＝ｋ₁Δｗ_yih(t) ＋ｋ₂Δｗ_nih(t) (12) Δｗ_yji(t) ＝−ε∂Ｅ(t) ／∂ｗ_ji(t) ＋ζｗ_ji(t−1) (13) Δｗ_yih(t) ＝−ε∂Ｅ(t) ／∂ｗ_ih(t) ＋ζｗ_ih(t−1) (14) Δｗ_nji(t) ＝−｛−ε' ∂Ｅ(t) ／∂ｗ_ji(t) ＋ζ' ｗ_ji(t−1)｝ (15) Δｗ_nih(t) ＝−｛−ε' ∂Ｅ(t) ／∂ｗ_ih(t) ＋ζ' ｗ_ih(t−1)｝ (16) 但し， Δｗ_yji(t) ，Δｗ_yih(t) ：実教師パターン群に基づ
く重み値の更新量 Δｗ_nji(t) ，Δｗ_nih(t) ：反面教師パターン群に基
づく重み値の更新量ｋ₁，ｋ₂ ：定数 ε，ε' ：学習定数 ζ，ζ' ：モーメンタムｔ：更新回数この算出した更新量に従って，次の更新サイクルのため
の重み値である，ｗ_ji(t) ＝ｗ_ji(t−1)＋Δｗ_ji(t) (17) ｗ_ih(t) ＝ｗ_ih(t−1)＋Δｗ_ih(t) (18) を求めて重み値格納部６５に格納する。

【００４５】一方，学習信号管理提示装置７０の学習収
束判定部７５は，重み値変更部６６から学習用の入力パ
ターン対応の出力パターン群の実教師パターン群および
反面教師パターン群に対する誤差Ｅ_y，Ｅ_nを受け取る
と，この誤差Ｅ_y，Ｅ_nが許容できるものになったか否
かを判定することにより，学習が収束したのか否かを判
定して，その判定結果を学習信号提示部７３に通知す
る。

【００４６】学習収束判定部７５から非収束の通知を受
け取ると，学習信号提示部７３は，再度同じ実教師パタ
ーン群および反面教師パターン群を学習信号として提示
していく処理を実行することにより，学習の収束を実現
するよう処理していくことになる。

【００４７】このように，本発明では，ネットワーク構
成データ処理装置に対する実教師パターン群および反面
教師パターン群の学習信号に基づいて，内部状態値を決
定することにより，ネットワーク構成データ処理装置を
所望の情報処理装置として機能させることができる。

【００４８】また，最初に，学習信号管理提示装置７０
の学習信号提示部７３が，学習信号格納部７２に格納さ
れた教師パターン群の提示法として，実教師パターン群
のみを学習信号として提示するフェーズ，反面教師パタ
ーン群のみを学習信号として提示するフェーズ，両者を
学習信号として提示するフェーズとを随時必要に応じて
切り替えて提示する方法をとることによって，学習を進
めれば，ネットワーク構成データ処理装置６０の学習の
効率を上げることができる。このフェーズの切り替え
は，所定の設定値に基づいて自動で行ってもよく，また
学習者が学習状況のモニタ機能を有するシミュレータ等
による表示を観測し，適宜行うことができるようにして
もよい。

【００４９】例えば，最初に，実教師パターン群のみを
使用し，学習収束判定部７５の誤差の許容範囲は緩やか
なものに設定して学習を進め，学習が収束した後に，学
習信号として実教師パターン群と反面教師パターン群を
使用し，学習収束判定部７５の誤差の許容範囲を厳しく
して，学習をさらに進めるという方法をとることによっ
て，ネットワーク構成データ処理装置６０の学習の効率
を上げることができる。

【００５０】図５は，本発明による実験結果を示す。本
実験では，階層ネットワーク部６１として，１入力ユニ
ットからなる入力層，３基本ユニットからなる中間層，
１基本ユニットからなる出力層の３層の階層ネットワー
クを準備した。

【００５１】この階層ネットワーク構成データ処理装置
に対して使用した学習信号を，図中，白丸○（実教師パ
ターン群）および黒丸●（反面教師パターン群）で示
す。例えば，図５（イ）の左端の○は，“０．０という
入力信号に対して０．２５という出力信号を出力せよ”
という実教師信号を意味し，図５（ロ）の左側の●は，
“０．３７５という入力信号に対して０．２という出力
信号を出力してはならない”という反面教師信号を意味
している。

【００５２】図中の実線は，このような学習信号を上述
した方法で階層ネットワーク構成データ処理装置６０に
学習させた後，すべての入力に対する階層ネットワーク
構成データ処理装置６０の出力結果を図示したものであ
る。図中のＬｏｏｐは，学習の繰り返し回数を表してい
る。

【００５３】例えば，図５の（イ）に示すように，従来
と同様な実教師パターン群のみを用いて学習を行った結
果では，０．５の入力信号の前後に，いわゆるアンダー
シュート，オーバーシュートに相当するような歪みが現
れた。そこで，この部分を効率よく修正するために，図
５の（ロ）に黒丸●で示す反面教師パターン群を加え
て，学習を行った。その結果，図５の（ロ）に実線で示
すような望ましい出力が得られるようになった。

【００５４】図６は，他の学習パターンについて，従来
技術により学習したようすを示している。図に示すよう
に，６つの入力パターンに対する実教師パターン群を用
いて，４５３３回学習を繰り返した結果，各入力に対し
て実線で示すような出力が得られるようになった。

【００５５】図７は，図６と同じケースについて，本発
明を適用して学習を行った実験結果を示している。最初
に実教師パターン群のみを用いて，１０００回学習を繰
り返した。その結果，図７の（イ）に示すような入出力
特性が得られた。そこで，図７の（イ）に示す×印の位
置の入力信号に対する出力信号を，反面教師パターンと
して追加しさらに学習を続けると，１９５４回の学習で
結果は図７の（ロ）に示すようになった。図６に示す結
果と，図７の（ロ）に示す結果とを比較すると明らかな
ように，反面教師パターン群の利用により，内部状態値
を望ましい値に高速に収束できることがわかる。

【００５６】この実施例の説明では，実教師パターン群
と反面教師パターン群の２種類の教師パターン群により
学習を行う場合を例に説明したが，実教師パターン群以
外の教師パターン群を，例えば出力パターン群が絶対に
とってはならない値のもの，出力パターン群ができるだ
けとるべきではない値ものというように，望ましくない
程度に応じて，さらに複数種類に分け，その望ましくな
いレベルに応じて，内部状態値の更新量を調節するよう
にしてもよい。

【００５７】本発明は，階層ネットワーク構造のデータ
処理装置に限らず，他のネットワーク構造を持つデータ
処理装置の学習処理にも，同様に適用することができ
る。また，ネットワークの内部状態値の学習方法も誤差
逆伝播法に限らず適用できることは明らかである。さら
に，教師パターン群とネットワーク構成データ処理装置
６０からの出力パターン群との誤差の定義法，該誤差に
基づく内部状態値の更新量の決定法，教師パターン群の
提示の方法等も，上述した実施例の方法に限らず，本発
明を実施することが可能である。

【００５８】

【発明の効果】以上説明したように，本発明によれば，
学習パターンとして，学習対象の入力パターンとそれに
対する“望ましい”出力パターンの組からなる正しい事
例群からだけではなく，学習対象の入力パターンとそれ
に対する“望ましくない”出力パターンの組からなる反
例群等の複数種類の事例群からも，ネットワーク構成デ
ータ処理装置を所望の高機能な情報処理装置として構築
できるようになる。また，事例群の提示方法として正し
い事例群のみを使用するフェーズ，反例群のみを使用す
るフェーズ，両者を使用するフェーズ等というように随
時切り替えて提示する方法をとることにより，さらに学
習の効率を向上させることができるようになる。

【図面の簡単な説明】

【図１】本発明の原理説明図である。

【図２】本発明の一実施例のシステム構成図である。

【図３】図２に示す階層ネットワーク構成データ処理装
置の一構成例を示す図である。

【図４】図２に示す学習信号管理提示装置の一構成例を
示す図である。

【図５】本発明による実験結果の説明図である。

【図６】従来技術による実験結果の説明図である。

【図７】本発明による実験結果の説明図である。

【図８】基本ユニットの基本構成図である。

【図９】階層ネットワークの基本構成図である。

【符号の説明】

１０ネットワーク構成データ処理装置１１パターン変換部１２内部状態値格納部２０学習パターン提示装置３０内部状態値学習装置６０階層ネットワーク構成データ処理装置７０学習信号管理提示装置

フロントページの続き (56)参考文献特開平５−334276（ＪＰ，Ａ) 特開平５−20291（ＪＰ，Ａ) 特開平５−165801（ＪＰ，Ａ) 特開平２−170265（ＪＰ，Ａ) 山田貢己・他「教師信号と出力との差が増大する学習方式」，1991年電子情報通信学会秋季大会講演論文集（分冊６），日本，社団法人電子情報通信学会・発行，特許庁情報館受入日：1991年 11月13日，ｐｐ．12 (58)調査した分野(Int.Cl.⁷，ＤＢ名) G06N 1/00 - 7/00 G06G 7/60 G05B 13/00 - 13/04 G10L 3/00 - 9/20 G06K 9/00 - 9/82 G06T 7/00 - 7/60 ＣＳＤＢ（日本国特許庁) ＪＩＣＳＴファイル（ＪＯＩＳ)

Claims

(57)【特許請求の範囲】

【請求項１】入力に対して内部状態値により規定され
るデータ変換を行う演算要素が複数接続されたネットワ
ーク構造を持ち，入力パターンに対応して出力パターン
を算出し出力するネットワーク構成データ処理装置の内
部状態値を学習によって決定する学習処理方法であり，前記ネットワーク構成データ処理装置に提示する学習対
象の入力パターン群に対応して，出力パターン群がとる
べきパターンを指示する実教師パターン群と，出力パタ
ーン群がとってはならないパターンを指示する反面教師
パターン群とを含む複数種類の教師パターン群を学習情
報として与え，学習対象の入力パターン群による前記ネットワーク構成
データ処理装置からの出力パターン群と前記教師パター
ン群との誤差値を，教師パターン群の種類毎に算出し，その教師パターン群の種類に応じて得られた複数個の誤
差値に基づいて内部状態値の更新量を決定し，その更新量を用いて内部状態値を順次更新しながら，前
記誤差値に関する値が所定の許容範囲となるように，内
部状態値を学習によって決定するネットワーク構成デー
タ処理装置の学習処理方法であって，前記ネットワーク構成データ処理装置の学習に用いる複
数種類の教師パターン群を，ネットワーク構成データ処
理装置からの出力パターン群と前記実教師パターン群と
の誤差値に応じて，前記実教師パターン群，次にその他
の反面教師パターン群を含む教師パターン群の順番で提
示し，内部状態値を順次更新して学習を進めることを特
徴とするネットワーク構成データ処理装置の学習処理方
法。
【請求項２】請求項１記載のネットワーク構成データ
処理装置の学習処理方法において，前記ネットワーク構成データ処理装置に提示する前記教
師パターン群の提示法として，前記実教師パターン群の
みを使用するフェーズ，前記実教師パターン群以外の教
師パターン群のみを使用するフェーズ，両者を使用する
フェーズを有し，これらのフェーズを随時切り替えながら学習することを
特徴とするネットワーク構成データ処理装置の学習処理
方法。
【請求項３】請求項１または請求項２記載のネットワ
ーク構成データ処理装置の学習処理方法において，学習対象の入力パターン群による前記ネットワーク構成
データ処理装置からの出力パターン群と前記教師パター
ン群との誤差値として，出力パターン群と前記複数種類
の各教師パターン群との間に距離を定義し，少なくとも，出力パターン群と前記実教師パターン群と
の間の距離は減少させるように，かつ，出力パターン群
と前記反面教師パターン群との間の距離は増大させるよ
うに，前記ネットワーク構成データ処理装置の内部状態
値を順次更新していき，出力パターン群と前記実教師パターン群との誤差値が許
容範囲となるように学習することを特徴とするネットワ
ーク構成データ処理装置の学習処理方法。
【請求項４】請求項１または請求項２記載のネットワ
ーク構成データ処理装置の学習処理方法において，学習対象の入力パターン群による前記ネットワーク構成
データ処理装置からの出力パターン群と前記教師パター
ン群との誤差値として，出力パターン群と前記実教師パ
ターン群および前記反面教師パターン群との間に距離を
定義し，少なくとも，出力パターン群と前記実教師パターン群と
の間の距離は減少させるように，かつ，出力パターン群
と前記反面教師パターン群との間の距離は増大させるよ
うに，前記ネットワーク構成データ処理装置の内部状態
値を順次更新していき，出力パターン群と前記実教師パターン群との間の距離お
よび出力パターン群と前記反面パターン群との間の距離
が，許容範囲となるように学習することを特徴とするネ
ットワーク構成データ処理装置の学習処理方法。
【請求項５】入力に対して内部状態値により規定され
るデータ変換を行う演算要素が複数接続されたネットワ
ーク構造を持ち，入力パターンに対応して出力パターン
を算出し出力するネットワーク構成データ処理装置を備
え，その内部状態値を，学習対象の入力パターン群とあ
らかじめ入力パターン群に対して定められた教師パター
ン群とに基づいて学習するネットワーク構成データ処理
装置の学習処理システムであり，前記ネットワーク構成データ処理装置に入力する学習対
象の入力パターン群を提示するとともに，それらの入力
パターン群に応じて，ネットワーク構成データ処理装置
からの出力パターン群を指示する教師パターン群とし
て，出力パターン群がとるべきパターンを指示する実教
師パターン群と，出力パターン群がとってはならないパ
ターンを指示する反面教師パターン群とを含む複数種類
の教師パターン群を学習情報として提示する学習パター
ン提示手段と，その学習パターン提示手段によって与えられた学習対象
の入力パターン群による前記ネットワーク構成データ処
理装置からの出力パターン群と前記教師パターン群との
誤差値を，教師パターン群の種類毎に算出し，その教師
パターン群の種類に応じて得られた複数個の誤差値に基
づいて，前記ネットワーク構成データ処理装置の内部状
態値の更新量を決定し，その更新量を用いて内部状態値
を順次更新しながら，少なくとも出力パターン群と前記
実教師パターン群との誤差値が許容範囲となるような学
習制御を行う内部状態値学習手段とを備えたネットワー
ク構成データ処理装置の学習処理システムであって，前記学習パターン提示手段は，前記ネットワーク構成デ
ータ処理装置の学習に用いる複数種類の教師パターン群
を，ネットワーク構成データ処理装置からの出力パター
ン群と前記実教師パターン群との誤差値に応じて，前記
実教師パターン群，次にその他の反面教師パターン群を
含む教師パターン群の順番で提示する手段を備え，前記内部状態値学習手段は，前記学習パターン提示手段
から提示された情報に基づき，内部状態値を順次更新し
て学習を進めることを特徴とするネットワーク構成デー
タ処理装置の学習処理システム。