JPH07101412B2

JPH07101412B2 - データ事前取出し方法およびマルチプロセッサ・システム

Info

Publication number: JPH07101412B2
Application number: JP2110655A
Authority: JP
Inventors: リシング・リウ
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1989-04-28
Filing date: 1990-04-27
Publication date: 1995-11-01
Anticipated expiration: 2010-11-01
Also published as: EP0394642A3; JPH02300960A; EP0394642A2

Description

【発明の詳細な説明】 A.産業上の利用分野本発明は、一般にマルチプロセッサ（MP）データ処理シ
ステムにおける大型キャッシュ・メモリ内のデータ・ミ
スを減らすための技術に関し、さらに具体的には記憶情
報に基づくマルチプロセッサ・キャッシュ内のデータ事
前取出し機構に関する。

B.従来の技術別々のプロセッサで同時に走行することができる動作を
並列に実行することにより、スループットを高める、高
性能MPコンピュータ・システムが開発されている。この
ような高性能MPコンピュータ・システムは、複数の中央
プロセッサ（CP）が、独立して並列に動作するが、デー
タ交換が必要なとき、相互にあるいは主記憶装置との間
で時々通信することを特徴とする。CPとMSは、入出力
（I/O）ポートを有し、データを交換する際にはそれら
を接続しなければならない。

各CPがそれ自体のキャッシュを有する緊密結合マルチプ
ロセッサ・システムと呼ばれるタイプのMPシステムで
は、システムの様々なレベルと、整合性の問題が存在す
る。特にメモリ階層の隣接したレベル間で不整合が発生
する。多重キャッシュは、たとえばCPの１つがそのコピ
ーを修正したために、同じデータの異なるバージョンを
もつことがあり得る。それゆえ、各プロセッサのキャッ
シュが、同時にいくつかのキャッシュ内にある行（ライ
ン、以下では単に行という）に何が起こったのかを知る
必要がある。多数のCPが同じ主記憶装置を共用するMPシ
ステムでは、各CPは、アクセスが発行された時、アーキ
テクチャ仕様に従って、データの最も最近に更新された
バージョンを得ることが必要である。この要件により、
キャッシュ間のデータの整合性を常に監視することが必
要となる。

キャッシュの整合性の問題に対する多数の解決策が提案
されてきた。初期の解決策は、C.K.タング（Tang）の論
文「緊密結合マルチプロセッサ・システムにおけるキャ
ッシュ・システムの設計（Cache System Design in the
Tightly Coupled Multiprocessor System）」、Procee
dings of the AFIPS（1976）と、L.M.センシエ（Censie
r）とP.フォトリエ（Feautrier）の論文「多重キャッシ
ュ・システムでの整合性の問題に対する新しい解決策
（A New Solution to Coherence Problems in Multicac
he System）」、IEEE Transactionson Computers、1978
年12月、pp.1112−1118に記載されている。センシエ等
は、集中大域アクセス許可テーブルを用いた、共用書き
込み可能データが複数のキャッシュ内に存在できる方式
を記載している。しかし、センシエ等は結論の節で認め
ているように、２年早くタングが同様の手法を記述して
いることを知らなかった。タングは、状況を維持するた
めにキャッシュのコピー登録簿（ディレクトリ）を用い
ることを提案したが、センシエ等は、類似の状況ビット
で各メモリ・ブロックをタグ付けすることを提案した。

マルチ・プロセッサ（MP）キャッシュの整合性に対する
代表的な手法は次の通りである。プロセッサは、キャッ
シュ行を修正する（その中に記憶する）ことを必要とす
る時、まず遠隔キャッシュ内のその行のコピーを無効に
する。これは、記憶信号を（たとえば、全プロセッサを
接続する共通バスを介して）遠隔プロセッサに同報通信
することにより、あるいは集中記憶機能（たとえば、IB
M3081システム内の記憶制御エレメント（SCE））からの
許可を要求することにより実現される。遠隔プロセッサ
・キャッシュ内にあろうとなかろうと、キャッシュ行を
無効にするプロセスは、相互問合せ無効化（XI無効化）
と呼ばれる。そのようなXI無効化信号を減らすための様
々な設計技術が提案されている。たとえば、IBM3081シ
ステムでは、プロセッサ・キャッシュでの排他的（EX）
状況を使って、関連する行が遠隔キャッシュ内に存在し
ないという情報を記録するが、排他的状況のため、キャ
ッシュ中に記憶される時に、XI無効化活動を必要としな
い。

従来のMPXI無効化設計に固有の１つのオーバーヘッド
は、XI無効化による余分のミスがあることである。すな
わち、そのキャッシュへのプロセッサ・アクセスで、行
が見つからないことがあるが、アクセス前に遠隔プロセ
ッサによってXI無効化されない場合には、そのことは起
こらないはずである。この問題は、より多くの中央プロ
セッサ（CP）で大型キャッシュが使われるようになっ
て、より深刻になってきている。シミュレーションの結
果、そのような余分のミスは、ほとんどが命令行（Ｉ
行）ではなく、データ行（Ｄ行）で起こることを示して
いる。大型キャッシュを用いる場合、ミス率は、ユニプ
ロセッサ（UP）環境中ではかなり満足できるものであ
る。遠隔記憶による余分のミスを減らすための１つの手
法は、遠隔CPによって無効にされる可能性のあるデータ
行を事前に取り出すことである。

C.発明が解決しようとする課題本発明の１つの目的は、記憶情報に基づくMPキャッシュ
内のデータ事前取出し機構を提供し、それによって大型
キャッシュを有するMP内のデータ・ミスを大幅に減らす
ことができる。

D.課題を解決するための手段本発明によれば、活動記録情報を用いる機構を使って、
データ事前取出し（Ｄ事前取出し）の判断を行なう。こ
の情報は、活動記録テーブルＨ内に記憶され、そのよう
なテーブルが各CPごとに１つ、たとえばバッファ制御エ
レメント（BCE）にある。それぞれの行Ｌについて、Ｈ
［Ｌ］は、Ｈ内のＬに関する情報を示す。異なる２つの
タイプの活動記録がＨに保持できる。

（１）XI無効化−各Ｈ［Ｌ］に、Ｌが再取出しなしにXI
無効化されたかどうかが記録される。

（２）CH_LOC−各Ｈ［Ｌ］に、また局所変更活動記録、
すなわち最後の取出し以降にＬが記憶されたかどうかが
記録される。

また、記憶制御エレメント（SCE）に大域Ｈを保持する
ことも可能である。この場合、SCEは、各行ごとにテー
ブルＩ記録、すなわちCPによる最後のアクセス中に、Ｌ
がXI無効化を必要としたかどうかを記録する情報Ｉ
［Ｌ］を保持する。プロセッサCPからのＬに対するキャ
ッシュ・ミスが起こった時、SCEは、キャッシュCi内に
ない場合、XI無効化を必要とした（Ｉで示される）行の
いくつかをキャッシュCi中に事前に取り出す。テーブル
の管理は簡単である。記憶またはEX取出し時にたとえば
Ｌ上でXI無効化が起こった時、対応するエントリがセッ
トされる。たとえばＤ取出しミスの時にＬにアクセスし
た時は、XI無効化なしにＩ内のエントリがリセットされ
る。エントリをオフにするための他の基準は、その行が
いつ取り出されるか、たとえば要求時かそれとも事前取
出し時かである。

E.実施例ここで図面、特に第１図を参照すると、本発明が適用で
きるタイプのマルチプロセッサ（MP）システムがブロッ
ク・ダイヤグラムの形で示されている。MPシステムは４
つの中央処理装置（CP₀、CP₁、CP₂、CP₃）を含み、各CP
が、それぞれ命令実行（IE）ユニット14、15、16、17、
およびバッファ制御エレメント（BCE）20、21、22、23
を含む。各IEユニットは、主記憶装置（MS）50内のオペ
ランドの取出しと記憶を要求する命令を発行する、ハー
ドウェアとマイクロコードを含んでいる。

IEユニット14〜17は、当該のキャッシュ制御機構BCE20
〜23に取出し命令または記憶命令を発行することによ
り、取出し動作または記憶動作を開始し、プロセッサ・
ストアスルー（ST）キャッシュとそれに関連するプロセ
ッサ・キャッシュ登録簿（PD）、および関連するCP10〜
L13が独占的に使用するすべてのプロセッサ・キャッシ
ュ制御機構を含んでいる。CPは、一般に、オペランドが
必要とする各ダブルワード（DW）単位ごとに取出し命令
または記憶命令を発行する。そのDWを含むキャッシュ行
がPD内にあって、キャッシュ・ヒットである場合は、命
令の種類に応じて、そのDWがキャッシュから取り出さ
れ、またはキャッシュに記憶される。キャッシュ内オペ
ランド取出しヒットの場合は、記憶装置アクセスは、BC
Eの外に行く必要なく完了する。時々、要求されたDWが
キャッシュ内になく、キャッシュ・ミスになることがあ
る。IE取出し命令または記憶命令が完了する前に、DWを
主記憶装置から取り出さなければならない。そうするた
めに、BCEは、IEユニットが要求するDWを有するデータ
行単位を主記憶装置50から得ることを記憶制御エレメン
ト（SCE）に要求する、対応する取出しミス命令または
記憶ミス命令を生成する。その行単位は、主記憶装置50
内の行の境界上にあるが、要求されたDWは、ミスとなっ
た行転送が完了するまでIE要求を生かし続けるために、
要求するBCEに戻される、取り出された行内の最初のDW
となる。

SCE30は、CP10〜13と主記憶装置50に接続されている。
主記憶装置50は、複数の基本記憶モジュール（BSM）制
御装置BSC₀、BSC₁、BSC₂、BSC₃（それぞれ51、52、53、
54）から構成され、各基本記憶制御装置が２つのBSM0
（60、62、64、66）と１（61、63、65、67）に接続され
ている。４つのBSC₁51〜54は、それぞれSCE30に接続さ
れている。従来のシステムでは、SCE30は、４つのコピ
ー登録簿（CD）31、32、33、34を含み、そのそれぞれ
が、米国特許第4394731号明細書に述べられたのと同様
の方式で、BCFの１つに、対応するプロセッサ・キャッ
シュ登録簿の内容のイメージを含んでいる。

ダブルワード広域両方向データ・バスが、主記憶装置内
の各BSM60〜67と、対応するSCEポートとの間、およびSC
Eポートから入出力チャネル・プロセッサ40および対応
するCP10〜13への間に設けられている。データ・バスと
共に、制御信号およびアドレス信号用の別になった数組
のコマンド・バスもある。CPがDWアクセス要求に対する
キャッシュ・ミスに出会った時、そのBCEは、ミス・コ
マンドをSCE30に送ることにより、主記憶装置に対する
行アクセス要求を開始する。次いでSCE30は、主記憶装
置内の要求されたBSMに命令する再発行する。BSM使用中
状態の場合には、SCE30は、その要求をコマンド待ち行
列にセーブし、後で要求されるBSM60〜67が有効になっ
た時に再発行する。SCE30はまた、キャッシュの衝突が
そのXI論理回路によって発見された時の除いて、特定の
BSMに対するすべてのコマンドが先入れ先出し（FIFO）
の順序で発行されるように、規則正しく主記憶装置コマ
ンドを順序づける。主記憶装置要求を取り扱う通常のシ
ーケンス中、SCE30は、たえず主記憶装置の状況を監視
し、保護キーとすべてのキャッシュ登録簿の問合せ結果
を分析し、現在SCE30中に保持されているすべての未処
理コマンドの更新済み状況を検査し、またSCE30が受け
取るのをBCE20ないし23内で待っている新しいBCEコマン
ドを探す。

SCE30は、複数の記憶スタック（SS₀、SS₁、SS₂、SS₃）3
5、36、37、38を保持し、各スタックは対応するCPに対
する最高16DWまでの主記憶装置記憶要求を保持する。SC
E30は、記憶スタックに対する、主記憶装置アドレスと
有効性を示す十分な登録簿情報を保持する。記憶スタッ
クがオーバフローの危険がある時、SCE30は、BCEがSCE3
0から記憶スタック満杯状態をクリアする信号を後で受
け取るまで、それ以上の記憶要求の送信を保留にするた
め、関連するBCE20〜23に優先順位要求を送る。記憶ス
タック内のデータは、それぞの記憶スタック内で着順を
維持する適当なスケジューリングで、主記憶装置に対し
て更新される。CPからの行取出し要求は、記憶スタック
内のその行に対する既存のすべての記憶が関連するBSM6
0〜67に送られたことをSCEが確かめるまで、SCE30によ
って保持される。

従来のMPキャッシュ設計に固有の１つのオーバヘッド
は、XI無効化による余分のミスが起こることである。あ
る行が１つのプロセッサによって記憶される時、その行
のコピーを、適切な時点で、遠隔キャッシュから無効に
する必要がある。キャッシュ設計および作業負荷が与え
られている場合、参照によってｋ重MP構成中の局所キャ
ッシュ中にその行が見つからないことの発生１件当りの
命令の数をm_kとする。すなわち、ｍは、MP効果のないユ
ニプロセッサ（UP）ミス挙動と考えることができる。

をXI無効化によるｋ重MPシステム内での（UPと比較し
た）余分のミス１件当りの命令の数とする。以後の議論
では、特定の参照のタイプに対する挙動を表すために肩
文字を使用する。たとえば、m_k ^DFは、Ｋ重MPシステム中
のＤ取出しキャッシュ・ミス１件当りの命令の数を表
す。実験から、そのような余分のミスは主にＤ行で起こ
ることがわかった。キャッシュ・サイズが大きくなった
時、あるいはさらにプロセッサを追加した時、そのよう
な余分のミスはMIPSでより高い割合になる。たとえば、
ある環境では、余分のミスの率だけで、システム性能の
４％を超えることがある。また、実験データから、プロ
セッサは命令行にはめったき記憶しないので、そのよう
な余分のキャッシュ・ミスのほとんどがデータ行による
ものであることがわかっている。

余分のミスによるそのようなオーバヘッドを減らすため
の１つの方法は、データの事前取出しである。この余分
のミスは、XI無効化のみによって生じるものであること
が明らかである。したがって、事前取出しを、XI無効化
活動記録に対して実行できる。この手法は、より一般的
なデータ事前取出し方式と比較すると、次のような利点
を有する。

（１）一般にデータ事前取出し命令事前取出し（Ｉ事前
取出し）ほどの効果がない。より一般的なＤ事前取出し
は、制御機能と記憶トラフィックに過度の負担を生ずる
恐れがある。XI無効化に関連する活動に対してのみＤ事
前取出しを実行すると、事前取出しの頻度が減って、事
前取出し挙動が改善される。

（２）有効なＤ事前取出しには、活動記録が必要であ
る。XIに関連する活動記録はMPシステム設計に有用であ
り、したがって、XI活動記録はＤ事前取出しに限らず利
益を与える。

まず、Ｄ事前取出し判断用に設けた活動記録テーブルＨ
について考える。各CPに対してそのようなテーブルが
（たとえば、BCEに）１つずつある。以下で説明するよ
うに、大域活動記録テーブルＨはSCEに保持することが
できる。各行ＬごとにＨ［Ｌ］を設いてテーブルＨ内の
行に関する情報を示す。各CPに対するテーブルがある時
は、Hiを用いてプロセッサCPiに対する活動記録テーブ
ルを表す。２つのタイプの活動記録がＨに保持できる。

（ｉ）XI無効化−各Ｈ［Ｌ］で、Ｌが事前取出しなしで
XI無効化されたかどうかに関する記録を保持する。

（ii）CH_LOC−局所変更活動記録、すなわちＬが最後の
取出し以降に記憶されたかどうかの記録を保持する。

次に、様々なアルゴリズムに関する評価結果を示す。２
重MP（2WMP）メモリ基準トレースを用いてシミュレーシ
ョンを行なった。４重セット連想式および64バイトをも
つ512Kプロセッサ・キャッシュ・メモリ行のみについて
考えた。シミュレートされた基本MPアルゴリズムは、読
取り専用（RO）アグレッシブであったが、条件付きの排
他的（EX）Ｄ取出し（すなわち、行がどのキャッシュに
もない時の、Ｄ取出しEX）を含むものであった。UPおよ
び2WMP構成の場合、キャッシュ・ミスに関して、第２図
に示した結果が得られた（XI活動をカウントしない）。
ここで、肩文字IFは命令取出しを表し、肩文字DFはデー
タ（オペランド）取出しを示し、肩文字DSはデータ（オ
ペランド）記憶を表す。2^(m)（＝131.7）の3/4近くはＤ
取出しによるものであり、1/4はＤ記憶によるものであ
った。

第３図は、各CP、10_iのBCE20_iが、データ事前取出しの
ために局所活動記録テーブルH_iを維持している構成を示
している。主記憶装置（MS）内のすべての行は、それぞ
れ連続するＴ行を含む固定サイズのブロックにまとめら
れる。各行ＬについてB_Lは行Ｌを含むブロックを表す。
本発明を例示するため、まず各H_iを活動記録無効化テー
ブルと見なす。各H_iは固定サイズのビット・ベクトルで
ある。各記憶装置行Ｌについて、ビット・エントリH
_i［Ｌ］が、行アドレスを介してセットされる。最初にH
_iの全ビットがゼロにリセットされる。

（ａ）ビットH_i［Ｌ］は、BCEが遠隔要求によってその
キャッシュからＬを無効にする時、セットされる（オン
になる）。

H_iの各ビットは、次の状況でオフになる。

（ｂ）ビットH_i［Ｌ］は、行ＬがＤ行としてCP_iのキャ
ッシュ中に取り出される時、リセットされる。

CP_iのキャッシュ内でＤ行ミスが起こった時、BCEは、次
のように事前取出しの判断を行なう。

（ｃ）ブロックB1内の（Ｌ自体を含む）各行Ｌ′は、行
Ｌ′がキャッシュ内にない時、ビットH_i［Ｌ′］がセッ
トされている場合、行Ｌから順に、キャッシュ中に取り
出される。好ましい実施例では、ブロックB_Lは、行Ｌの
直前の１行と、行Ｌの直後の２行から成る。

主に、活動記録無効化テーブルH_iは、局所キャッシュか
ら無効にされたＤ行を監視し、Ｄミスが起こった時、事
前取出し動作をトリガする。

実験では、32Kのエントリを有する各H_i用のハッシュ・
テーブルを使用した。ハッシュ・テーブル内の各エント
リは、１ビットであった。連続する行の数がＴ＝４の場
合、第４図に示した結果が得られる。これらの結果は、
データの事前取出しなしの標準のMPに比べて、Δ
_２（ｍ）が47.3％減少することを示している。さらに、
Ｄミス（58.7個の命令毎に１回）のうち21.4％（274.2
個の命令毎に１回）だけで、有効なデータ取出し（すな
わち、少なくとも１つの非要求行が事前に取り出された
もの）が行なわれた。有効なデータ事前取出しのうち7
2.6％（または93.2％）で、１行だけ（または最高２
行）事前に取り出され、平均して毎回1.14行が事前に取
り出された。

上記の実験で、各CP用のハッシュ・テーブルの代りにた
とえばSCEにある１つのハッシュ・テーブルＨを使用す
る場合、局所XI無効化テーブルで認められる結果に非常
に近い結果が得られる。第５図は、そのような設計の構
成を示している。大域活動記録無効化テーブルＨ、71を
用いたＤ事前取出しの操作は、局所テーブルを用いた操
作に非常に似ている。

（ｄ）SCEが（それ自体が取出しミスを起こすことがあ
る）CPからの要求によりいずれかのCPにＬのXI無効化を
発行する時、ビットＨ［Ｌ］がセットされる。

（ｅ）行ＬがＤ行としてCPキャッシュ中に取り出される
時、ビットＨ［Ｌ］がリセットされる。これには、上記
ステップ（ｄ）に述べた取出しミスの状態は含まれな
い。

（ｆ）CPからのＤ行取出しミスの時、ビットＨ［Ｌ′］
がセットされ、Ｌ′がそこにない場合、ブロックB_L内の
それぞれの行Ｌ′（Ｌ自体を含む）は、Ｌから順に要求
キャッシュ中に取り出される。

上記ステップ（ｆ）で、SCEは対応するコピー登録簿を
調べることにより（ターゲットCPキャッシュ内に既にあ
る行の）不必要な事前取出しを除去することができる。
SCEが局所キャッシュのために常駐の情報を維持しない
ある種の設計では、BCEは、関連するブロックB_L内のこ
れらの行がキャッシュ内に常駐することを示すタグを単
にＤミス要求と共にSCEに送る。

MPキャッシュ設計では、XI無効化動作は、先取りして活
動化される。たとえば、IBM3081および3090システムで
は、CPからのＤ取出しミスは、現Ｄ取出し動作後にその
行への記憶が行なわれることを予測して、遠隔キャッシ
ュ内の行のXI無効化をトリガすることができる。活動記
録テーブルＨが、（XI無効化活動ではなく）Ｄ記憶活動
のみを監視することが可能である。たとえば、上記大域
活動記録テーブルＨでは、ステップ（ｄ）の代りに、次
のステップ（ｄ′）を用いることができる。

（ｄ′）SCEが（それ自体取出しミスを起こすことがあ
る）いずれかのCPからＬのＤ記憶を受け取る時、ビット
Ｈ［Ｌ］がセットされる。

この場合、Ｈは単に現在修正されている行を監視する大
域的局所変更活動記録である。

局所変更活動記録テーブルＨでのＤ事前取り出しのシミ
ュレーション結果を、第６図に要約して示す。CPの数が
大きくなるにつれて、SCEがCPからの各Ｄ記憶について
大域局所変更活動記録テーブルＨを検査することが、厄
介になることがある。この負担は、様々な設計技術によ
り軽減することができる。たとえば、米国特許第439173
1号明細書に記載されているように、排他的（EX）ロッ
キングを、最新のMPキャッシュ整合性制御のために用い
ることができる。それぞれのＤ記憶は、まずその行に関
するEX状況を得るために必要であり、それによってその
行が遠隔キャッシュからXI無効化されることが保証され
る。したがって、ステップ（ｄ′）を、要求するCPが行
Ｌに対するEX状況を得た後の行Ｌに対する最初のＤ記憶
時にのみＨ［Ｌ］がセットされるように実施することが
できる。エントリＨ［Ｌ］は通常の条件で以前のＤ記憶
により既にセットされているので、SCEが次のＤ記憶時
にエントリＨ［Ｌ］をセットする必要はない。またＨは
事前取出しの判断を援助するための装置としてのみ使用
されるので、設計を複雑にする恐れのある状況で厳密な
ルールに従ってＨを正確に維持する必要がないことにも
留意されたい。連続する行の数Ｔ＝３（またはＴ＝４）
の場合、Δ_２（ｍ）は51.9％（または61.4％）減少し
て、有効な事前取出し１件当り207.58（または201.46）
命令、また有効な事前取出し１件当り事前に取り出され
る行数の平均が1.4（または1.7）行になった。これらの
結果を局所活動記録テーブルに関する結果を比較する
と、大域活動記録テーブル法は、一般により優れた結果
が得られることがわかる。これは、一部には、大域登録
簿は一般に、行が動的に再利用される傾向をより良く把
握できるためである。

2WMPシステムに関する結果から、XI無効化による余分の
キャッシュ・ミスは、大幅に減少した。MPシステム内の
プロセッサが多いほど、より大きな性能の利点を得るこ
とができる。これらの結果の１つの重要なファクタは、
有効取出しの頻度が比較的低い（発生１件当り200以上
の命令）ことである。その結果、毎回複数の行を取り出
すことが可能となる。そのような複数データ事前取出し
は、行取出し帯域幅が非常に広い（たとえば１サイクル
当り１行）環境により適している。事前に取り出された
行は、ステージ・バッファに移して、キャッシュへの入
力（および、恐らくはキャッシュ登録簿のルックアッ
プ）を待つ。事前取出しはキャッシュ・ミスに対しての
み行なわれるので、より多くのCPが含まれる時でも、非
常に高いデータ取出し率は予想されない。

Ｄ事前取出しのための活動記録を維持する２つの機構に
ついて説明した。１つは局所XI無効化を用いるものであ
り、もう１つは、大域局所変更活動記録を用いるもので
ある。実施態様に応じて、これらの活動記録または他の
同様の活動記録を、様々に組み合わせて使用することが
できる。そのような活動記録は、それ自体他の種類のキ
ャッシュ最適化の目的に役立つことに留意されたい。た
とえば、（局所または大域の）局所変更活動記録は、MP
キャッシュ設計において、キャッシュ状況の割当てを最
適化するための情報を提供することができる。

MP内でのデータ取出しは、通常、XI活動の増加に関連し
ている。しかし、本発明は、適切な整合性機構によりXI
の問題を大幅に改善する。

【図面の簡単な説明】

第１図は、本発明が適用できるマルチプロセッサ・シス
テムのブロック・ダイヤグラムである。第２図は、UPと2WMPからなる構成でのレベル１のミスの
結果を示すテーブルである。第３図は、局所活動記録テーブルがその中で維持される
MPシステムの構成を示すブロック・ダイヤグラムであ
る。第４図は、各活動記録テーブルHIに対して局所ハッシュ
テーブルを用いた結果を示すテーブルである。第５図は、大域活動記録テーブルがその中で維持される
MPシステムの構成を示すブロック・ダイヤグラムであ
る。第６図は、大域テーブルＨを用いた結果を示すテーブル
である。 10、11、12、13……中央処理装置（CP）、14、15、16、
17……命令実行（IE）ユニット、20、21、22、23……バ
ッファ制御エレメント（BCE）、30……記憶制御エレメ
ント（SCE）、31、32、33、34……コピー登録簿（C
D）、35、36、37、38……記憶スタック（SS）、40……
入出力チャネル・プロセッサ、50……主記憶装置、51、
52、53、54……基本記憶モジュール制御装置（BSC）、6
0、61、62、63、64、65、66、67……基本記憶モジュー
ル（BSM）。

Claims

【特許請求の範囲】

【請求項１】局部キャッシュ・メモリおよびバッファ制
御エレメントをそれぞれ有する複数のプロセッサ、１つ
の共用主記憶装置ならびに記憶制御エレメントを含むマ
ルチプロセッサ・システムにおいて、前記局部キャッシュ・メモリ内の各データ行毎に該デー
タ行が前記共用主記憶装置からの再取出しなしに相互問
い合せ無効化されたか否かの記録および該データ行が該
データ行の前回の取出し以来対応するプロセッサにより
記憶されたか否かの記録のいずれかを持つ局所活動記録
テーブルを前記プロセッサの各々に設けるステップと、前記データ行がいずれかのプロセッサにより相互問い合
せ無効化されたか、又は前記バッファ制御エレメントが
前記局部活動記録テーブル内の前記記録に対応するデー
タ行に対するデータ記憶を受けたとき、前記局部活動記
録テーブル内にエントリをセットし、前記プロセッサが
前記データ行を前記共用主記憶装置から関連する局部キ
ャッシュメモリに取出したとき、前記局部活動記録テー
ブル内の前記記録に対応する前記エントリをリセットす
るステップと、前記局部活動記録テーブルに対応するプロセッサにより
アクセスされるべき特定のデータ行に対して所定の関係
を持つアドレスを有する選択されたデータ行があるか前
記局部活動記録テーブル内のエントリを調べるステップ
と、前記特定のデータ行が関連する局部キャッシュ・メモリ
内に存在せず、且つ前記局部活動記録テーブルが前記特
定のデータ行に対して前記所定の関係を有する少なくと
も１つの選択されたデータ行のそれぞれに対応する少な
くとも１つのセットされたエントリを含むとき、前記特
定のデータ行を取出し、且つ前記選択されたデータ行の
内、前記特定のデータ行に対して前記所定の関係を有し
しかも前記局部活動記録テーブル内のセットされた前記
エントリに対応するもののみを事前取出しするステップ
と、よりなるデータ事前取出し方法。
【請求項２】局部キャッシュ・メモリおよびバッファ制
御エレメントをそれぞれ有する複数のプロセッサ、１つ
の共用主記憶装置ならびに記憶制御エレメントを含むマ
ルチプロセッサ・システムにおいて、前記局部キャッシュ・メモリ内の各データ行毎に該デー
タ行が前記共用主記憶装置からの再取出しなしに相互問
い合せ無効化されたか否かの記録および該データ行が該
データ行の前回の取出し以来ある特定のプロセッサによ
り記憶されたか否かの記録のいずれかを持つ局所活動記
録テーブルを前記記憶制御エレメントに設けるステップ
と、前記データ行がいずれかのプロセッサにより相互問い合
せ無効化されたか、又は前記特定のプロセッサの前記バ
ッファ制御エレメントが前記局部活動記録テーブル内の
前記記録に対応するデータ行に対するデータ記憶を受け
たとき、前記局部活動記録テーブル内にエントリをセッ
トし、前記特定のプロセッサが前記データ行を前記共用
主記憶装置から関連する局部キャッシュメモリに取出し
たとき、前記エントリをリセットするステップと、前記局部活動記録テーブルに対応するプロセッサにより
アクセスされるべき特定のデータ行に対して所定の関係
を持つアドレスを有する選択されたデータ行があるか前
記局部活動記録テーブル内のエントリを調べるステップ
と、前記特定のデータ行が前記特定のプロセッサの局部キャ
ッシュ・メモリ内に存在せず、且つ前記局部活動記録テ
ーブルが前記特定のデータ行に対して前記所定の関係を
有する少なくとも１つの選択されたデータ行のそれぞれ
に対応する少なくとも１つのセットされたエントリを含
むとき、前記特定のデータ行を取出し、且つ前記選択さ
れたデータ行の内、前記特定のデータ行に対して前記所
定の関係を有ししかも前記局部活動記録テーブル内のセ
ットされた前記エントリに対応するもののみを事前取出
しするステップと、よりなるデータ事前取出し方法。
【請求項３】局部キャッシュ・メモリおよびバッファ制
御エレメントをそれぞれ有する複数のプロセッサ、１つ
の共用主記憶装置ならびに記憶制御エレメントを含むマ
ルチプロセッサ・システムにおいて、少なくとも１つの前記局部キャッシュ・メモリの各デー
タ行毎に１つのエントリを含む活動記録テーブルと、前記少なくとも１つの局部キャッシュ・メモリ内の前記
エントリに対応するデータ行の相互問い合せ無効化およ
び前記少なくとも１つの局部キャッシュ・メモリ内の前
記エントリに対応するデータ行に対するデータ記憶の少
なくとも１つの生起に応答して前記活動記録テーブル内
にエントリをセットする手段と、前記少なくとも１つの局部キャッシュ・メモリに関連す
るプロセッサが前記データ行を前記共用主記憶装置から
関連する局所キャッシュ・メモリに取出したとき前記エ
ントリをリセットする手段と、特定のデータ行があるプロセッサにより関連する局所キ
ャッシュ・メモリから利用不可であることを検出する手
段と、前記特定のデータ行を取出し、前記活動記録テーブル内
のセットされたエントリに対応し且つ前記特定のデータ
行に対して所定の関係を有する選択されたデータ行のみ
を事前取出しする手段と、よりなるマルチプロセッサ・システム。