Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JPH0799515B2 - 命令フロ−コンピュ−タ - Google Patents
[go: Go Back, main page]

JPH0799515B2 - 命令フロ−コンピュ−タ - Google Patents

命令フロ−コンピュ−タ

Info

Publication number
JPH0799515B2
JPH0799515B2 JP60504595A JP50459585A JPH0799515B2 JP H0799515 B2 JPH0799515 B2 JP H0799515B2 JP 60504595 A JP60504595 A JP 60504595A JP 50459585 A JP50459585 A JP 50459585A JP H0799515 B2 JPH0799515 B2 JP H0799515B2
Authority
JP
Japan
Prior art keywords
instruction
group
unit
control unit
process control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60504595A
Other languages
English (en)
Other versions
JPS62500750A (ja
Inventor
ロスマン,アンドリユウ
Original Assignee
ヒユ−ズ・エアクラフト・カンパニ−
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ヒユ−ズ・エアクラフト・カンパニ− filed Critical ヒユ−ズ・エアクラフト・カンパニ−
Publication of JPS62500750A publication Critical patent/JPS62500750A/ja
Publication of JPH0799515B2 publication Critical patent/JPH0799515B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/80Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
    • G06F15/8007Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors single instruction multiple data [SIMD] multiprocessors

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multi Processors (AREA)
  • Advance Control (AREA)

Description

【発明の詳細な説明】 発明の背景技術 1.発明の分野 この発明はデータ処理に関し、特に、高度なユーザープ
ログラム又は複数のユーザープログラムを直接的および
効果的に実行する多重命令ストリーム、多重データスト
リームコンピュータのアーキテクチャの改良に関する。
2.関連技術の背景 現在の技術における高性能処理は一般に、単一命令多重
データストリームベクトルプログラムを実行するのに最
適化したスーパコンピュータやアレイプロセッサに限ら
れる。これらのコンピュータは、更に特定の長さにベク
トル化したコードを実行するように最適化され、多重命
令ストリーム、多重データストリーム(MIMD)プログラ
ムを実行するようには設計されていない。
多重命令ストリーム、多重データストリームコンピュー
タについては、今迄に提案されており、いくつかのケー
スでは実現されている。米国特許第4,153,932号および
第4,145,733号はデータフローコンピュータについて記
載している。しかしながら、データフローコンピュータ
を実用化することは、1には、データフロー言語を効率
良く実行するコンピュータ組織を設計することが困難で
あるということもあって、難かしい。
多重命令ストリーム、多重データストリームコンピュー
タが実現化されている。一例としてはデネルコア(Dene
lcor)の異種エレメントプロセッサが挙げられ、この一
実施例が、ジリアンド他(Gilliand et al.)に付与さ
れた米国特許第4,229,790号に記載されている。異種エ
レメントプロセッサは相互接続された多重プロセッサコ
ンピュータである。各プロセッサはパイプライン制御お
よび機能ユニットを利用している。先行制約による不利
益は並列処理における命令文脈をパイプラインサイクル
レートで切換えることにより減少される。この異種エレ
メントプロセッサアーキテクチャは、コスト有効性が十
分で無く、又多くのアプリケーションに適用するには不
十分である。これは、主に、プロセッサの組織が複雑で
あることと、機能ユニットの利用化が低いことによる。
ジリアンド他により提案されたように、タスクスナップ
ショットレジスタを介してプロセッサパイプラインに接
続された多重データストリームを用いても、処理速度
が、単一プロセッサのリソースの有用性により限定され
てしまう。
他の初期のマルチプロセッサコンピュータとしては、2
種類、実現されている。第1の種類は、各データストリ
ームに対して1つのプロセッシングユニットを対応させ
た、独立したプロセッシングユニット群を用いている。
第2の種類は、いくつかのデータストリームにおいて、
有効に多重化される1つの中央処理装置を用いている。
独立したプロセッシングユニット群を用いた場合はコス
トが高くなり、先行の問題を受けやすい単一命令ストリ
ーム、単一データストリームアーキテクチャになる。第
2の種類の実現化を計った場合、先行の制約を減少する
ように、いくつかのデータストリームにおいて中央処理
装置を多重化することができる。
処理速度を改善し、競合の問題を最小にするその他の試
みとしては、1969年6月25日乃至27日の“並列プロセッ
サシステム、テクノロジー、およびアプリケーション”
のシンポジウムにおいて、13章の、エム・ジェー・フリ
ン(M.J.Flynn),エー・ポドヴィン(A.Podvin)およ
びケー・シミズ(K.Shimizu)著の“共有リソースを用
いた多重命令ストリームプロセッサ”に記載がある。こ
こには、個々のコンピュータが独自のデータと制御レジ
スタを有した並列コンピュータシステム組織が記述され
ているが、より実体的な実行機構群が欠けており、この
ためすべてのマシンにより、これらの実行機構群が共有
されている。この共有は、短かい時間間隔で同期がとら
れた時間フェーズ切換えにより行われる。実行リソース
を強力にパイプライン化して最大の動作帯域幅を得る努
力が成されている。実行リソースの各実行機能のパイプ
ラインファクタは、各コンピュータの同期ファクタに緊
密に関連付ける必要がある。この組織概念に基づいたシ
ステムは、共有リソースシステムに相関する多くの競合
の問題を避けることが要求される。
フリン他の文献によれば、各コンピュータは、それぞれ
独自のオペランドをフェッチし、それぞれ独自の命令を
作る機能を果すプロセッサとして記載されている。この
プロセッサは、命令は実行せず、命令を実行するように
実行リソース又は実行ユニットに要求する。この実行ユ
ニットは4つの時間フェーズアレイ又は各リングが8つ
のプロセッサから成るリングプロセッサにより共有され
る。この構成では、プロセッサ間の緊密な時間同期が必
要とされ、リング内の2つのプロセッサは、命令フェー
ズ、作成フェーズ、および実行フェーズが同じでない。
リングが異る各プロセッサは、特定のタイムスロットの
実行リソースに対して競合することができるので、競合
がオペランドフェッチ等と時間的にオーバラップさせる
必要がある。2つ以上のプロセッサが1つのオペレーシ
ョンしか受付けることのできないリソースを要求したと
き、プライオリティシステムを用いてこの衝突を回避す
る。
発明の開示 この発明は、データフロー概念と区別される命令フロー
概念を具現化した新しいコンピュータに関する。このコ
ンピュータは、高速並列計算が行え、高度の並列アルゴ
リズムを実現でき、独特のシステム構成により拡張的に
積重ねられる超大規模集積回路チップが2,3枚の設計
で、アーキテクチャが構成し得るという点で、超大規模
集積回路を用いて構成するのに便利な、独特のコンピュ
ータアーキテクチャを具現化する。
この命令フローコンピュータは、上述したように、プロ
セスコントロールユニット、関数実行ユニット、ローカ
ルメモリユニットおよびバス構造等のプロセッサコンポ
ーネント又はプロセッサユニットをプロセッサ内に伝統
的に取込み、各々が自己内蔵型ユニットである相互接続
ネットワークにより接続し、望しくは、アーキテクチャ
の構成において、論理的に等価に接続し、それによりユ
ニットがコンピュータのいずれかおよびすべてのリソー
スにより共有されることにより、マルチプロセッサアー
キテクチャと異る。
プロセスコントロールおよびファンクションユニットは
相互接続ネットワークのポートに接続された簡単なユニ
ットであり、大規模で複雑なプロセッサをネットワーク
ポートのユニットに置換えることができる。汎用プロセ
ッサ内部のバス構造は、通常のかつ大規模の相互接続ネ
ットワークにより置換えられる。相互接続ネットワーク
に結合される1つ以上のグローバルメモリは個々のプロ
セッサのメモリ機能を置換える。ユニット間のコミュニ
ケーションは、そのコンピュータのパイプライン構成の
相互接続ネットワークに生じる。従って、そのネットワ
ークに接続されたすべてのユニットは、クロック又はク
ロックに近い速度でパイプライン化できる。
プロセスコントロールを行うプロセスコントロールユニ
ットは、一連のプロセスが割当てられ、各プロセスは独
立したブロック又はパケットのシーケンシャルな命令群
を有している。各プロセスコントロールユニットは、割
当てられたプロセスを順次初期化し、相互接続ネットワ
ークを介して第1のプロセスのシーケンシャル命令パケ
ットの第1命令パケットを、前記命令によりアドレスさ
れたネットワーク内の他のユニットに送る。
第1のプロセスは、第1命令パケットの初期化された命
令群が実行され、そのプロセスに再リンクされる迄、即
保留される。
命令フローコンピュータは完全にパイプライン化されて
いるので、第2のプロセスの第1命令パケットが次のマ
シンサイクルで送られ、全プロセスが初期化される迄同
様に行われる。この実行シーケンスにより多重命令スト
リームにより単一パイプラインのタイムシェアリングが
得られる。
この命令フローコンピュータは、高度に競合したプログ
ラムを直接かつ効率良く実行するという点で、現在の並
列処理アーキテクチャよりも多くの利点を有している。
すなわち、実現技術によってのみ制限を受ける並列性と
拡張性を有している。モジュール化により設計および実
現コストを減少し、置換コストおよびプログラミングコ
ストを下げる効果がある。
この発明の他の利点は、添附図面並びに下記明細書の記
述から明らかである。
図面の簡単な説明 第1図は従来技術を代表するマルチプロセッサタイプの
コンピュータを示す図面; 第2図は多段相互接続ネットワークを採用した、この発
明による命令フローコンピュータを示す図面; 第3図は、第2図の命令フローコンピュータにおける代
表的な命令フローを示す図面; 第4図は命令パケットの1つの代表的なフォーマットを
示す図面; 第5図は命令フローコンピュータにおける並列命令スト
リームの命令群の1つの代表的なシーケンスを示す図
面; 第6図は、チェーニングを有した代表的な命令パケット
フォーマットおよびその実行を示す図面; 第7図は命令フローコンピュータに採用される代表的な
プロセスコントロールユニットのブロック図; 第8図は、この命令フローコンピュータにおけるグロー
バルメモリユニットにおけるフェッチ動作を視覚化した
図面; 第9図はこの命令フローコンピュータにおける代表的な
パイプラインプログラマブル関数ユニットにおける情報
のフローおよび作用を示す図面; 第10図はプログラムメモリおよび定数メモリを有したプ
ログラマブル関数ユニットのブロック図; 第11図は4×4スイッチノードで構成される16×16多段
相互接続ネットワークのブロック図; 第12図は4×4マルチポートメモリスイッチノードのブ
ロック図。
好適実施例の詳細な説明 従来のコンピュータ 第1図は、双方向相互接続ネットワークICNに並列に接
続されたプロセッサ1乃至プロセッサNを使用する際の
従来技術の特徴を具現化する1種の並列処理コンピュー
タを示す。グローバルメモリユニット(GMU)はプロセ
ッサ外部の各メモリとして双方向ネットワークを介して
プロセッサと接続される。従って、プロセッサとグロー
バルメモリユニット間のデータは双方向相互接続ネット
ワークICNを両方向に移動する。プロセッサは、一般的
に、プロセッサ1に関連して示すように、プログラムメ
モリ(PGM)、命令デコードユニット(IDU)、ローカル
データメモリ(LDM)、コントロールユニット(CU)、
および関数ユニット(FU)で有している。
これらの機能ユニット、並びにレジスタ群および入出力
装置は、複雑なマルチバス構造を介して相互接続されて
いる。この構造は複雑な制御システムを必要とする。一
般には、このような制御システムを実行させるには高価
なランダムロジックおよび/又は低速の制御メモリが必
要になる。中間プログラミング;アセンブリプログラミ
ング、マイクロプログラミングおよびナノプログラミン
グがこの制御レベルを補助するために含まれる。
さらに、プロセッサの効率は、より高度なレベルの命令
に対して多くのクロックサイクルが必要になるので、制
限される。
一般には、プロセッサとグローバルメモリユニットは、
図示するように双方向型のネットワークにより接続され
るか、又は2つの単方向ネットワークにより接続され
る。
命令フローコンピュータ 第2図の独特な命令フローコンピュータにおいて、相互
接続されたプロセスコントロールユニット(PCU)、グ
ローバルメモリユニット(GMU)、およびプログラマブ
ル関数ユニット(PFU)のネットワークが示されてい
る。又命令フローコンピュータの一部に、オプションと
して命令デコードユニット(IDU)を含めることもでき
る。メモリマネージメントユニットおよび入出力ユニッ
トも又、スタンドアローンモードで動作する命令フロー
コンピュータに含めることができる。これらのユニット
はネットワークにより完全に相互接続され、ネットワー
クをはさんで互いに論理的に等距離にあり、命令ストリ
ーム群において共有できることが望ましい。命令ストリ
ーム群は、リアルタイムに各プロセスがそれぞれ割当て
られたプロセスコントロールユニット群により初期化さ
れる。各命令セットの命令群のブロック又はパケットは
相互接続ネットワークを介して径路が設定される。
第2図において実現される、完全に相互接続されたアー
キテクチャではユニット間に高コミュニケーション帯域
幅が必要になる。ユニットの数およびその動作レートが
帯域幅を決定する。例えば、ユニットが1命令あたり1M
Hzで動作するとすれば、16ユニット命令フローコンピュ
ータであればバスアーキテクチャにより得られるレート
として少くとも16MHzの相互接続帯域幅を要する。
さらに高速のユニットを用いたより大型の命令フローコ
ンピュータに要求されるより高い帯域幅では、多段相互
接続ネットワークアプローチを採用する必要がある。ク
ロスバーネットワーク、リングネットワークおよび多段
ネットワークは、それぞれ小型、中間、および大型の相
互接続のコストパーフォマンスが得られる。
第2図は、この発明の命令フローコンピュータの好適な
実現態様を示す。描かれた構成は、特にパイプライン組
織に適した第11図に示すタイプの多段ネットワークアー
キテクチャを表わしている。すべてのユニットを相互接
続すると共にパイプライン化することにより、非常に高
性能が得られる。理想的には、クロックレート命令が実
行できることが望しい。これによりファンクションユニ
ットの数およびベーシッククロックレートに直接比例し
た性能が得られる。主題が、参照符号(PD−84073)に
より、この明細書中に含まれる、この発明の譲受人に譲
渡された、 にファイルされたシリアル番号
のアール・ジェー・マクミラン(R.
J.McMillen)およびエー・ロスマン(A.Rosman)の共願
に記載されたN×Mパケット交換ノードにより構成され
る第11図のタイプの多段相互接続ネットワークは、全ユ
ニットの高帯域コミュニケーションを提供することがで
きる。このような相互接続ネットワークの性能は90%を
超える負荷条件の下で80%以上の効率を得ることができ
る。従って、命令フローコンピュータの性能は相互接続
ネットワークE(N)、ファンクションユニットの数N
(FU)、およびマシンサイクルレートFの性能効率の積
になる。
性能=E(N)×N(FU)×F 十分に区分けされた問題に対して得られるピークレート
は1.0に近い効率を生じる。
第2図の汎用コンピュータアーキテクチャを第1図のそ
れと比較するとわかるように、命令フローコンピュータ
は相互接続されたプロセッサネットワークではないとい
う点で、代表的な並列プロセッサコンピュータアーキテ
クチャと異る。この発明では、コンポーネントやユニッ
トをプロセッサ内に伝統的に取込み、制御、実行および
メモリ機能を提供すると共に、相互接続ネットワークに
より自己内蔵型簡素化ユニットとして論理的にコンポー
ネントやユニットを結合し、全リソースにより共有され
る。各プロセスコントロールユニット(PCU)のプロセ
スから発生した命令ストリームは実行が完了する迄ネッ
トワークを介してコンピュータの回りを連続的に移動す
る。ある時点をとらえると、それと同じだけの独立した
処理群に属する多くの命令群が各種の実行段階に存在す
る。
この構成では、プロセス群はサブルーチンのような独立
したブロック又はパケットのシーケンシャル命令群から
成る。プロセスのセットは、静的又は動的に各プロセス
コントロールユニットに割当てられる。従って、各プロ
セスは、識別番号又はアドレス、ステータス情報および
プログラムカウンタの等価物により表わされる。スター
ト時には、各プロセスコントロールユニットは第1プロ
セスからの第1命令をイニシャライズする。各プロセス
がプロセスコントロールユニットによりイニシャライズ
された後、第1のすなわち現在の命令パケットが、コン
パイル時に決められたアドレスに従って、所定のシーケ
ンスで他のユニットに送られる。この結果、第1のプロ
セスが保留になる。命令フローは例えば、コンピュータ
を介して、データをフェッチするためのメモリユニット
から、ファンクションユニット、メモリユニットへ進
み、プロセスコントロールユニットに戻る。同一プロセ
スの次の命令は、先行する命令の到着すなわち戻りによ
ってのみ開始されるので、シーケンシャル処理において
生じる先行の制約を避けることができる。
命令群は情報のパケットのフォーマットを取る。この命
令フローコンピュータは完全にパイプライン化されてい
るので、1つの命令パケットがコンピュータを介して移
動している間、プロセスコントロールユニットは他のプ
ロセスを開始し、そのプロセスの第1命令パケットはコ
ンピュータを介して、全プロセスが開始される迄、別の
プロセスの第1命令パケットが続くように経路が決めら
れる。この実行シーケンスは多重命令ストリームによる
単一パイプラインのタイムシェアリングと同等である。
コンピュータを介して流れる命令パケットは“空き”フ
ァンクションユニットに経路が設定され、非常に効率的
なハードウエアの利用が得られる。
この点に関する説明は後述する。
命令フロー この命令フローは、一般的な命令フローおよび対応する
命令フォーマットを示す第3図および第4図を参照する
ことによりさらに良く理解できる。第4図に示すよう
に、命令はプロセスコントロールユニット(PCU)にお
いて、始まりタグ(TAG)すなわちアドレスおよびリン
ク(LINK)が付けられ、この命令がプロセスコントロー
ルユニットに戻ってきたとき、この命令を特定のプロセ
スに再リンクさせるために用いられる。続いて特定の命
令がピックアップされるグローバルメモリユニットを識
別する命令アドレスおよびオペランド番号1とデータが
ピックアップされるグローバルメモリユニットアドレス
が続く。この後に、オペランド番号2のデータがピック
アップされるグローバルメモリユニットのアドレスが続
く。命令フォーマットの次段において使用されるプログ
ラマブルファンクションユニットのアドレス(TAG)が
識別され、実行されるファンクションを識別するオペレ
ーションコード(OP CODE)が識別される。命令フォー
マットの最後のブロックでは、この演算結果が格納され
るアドレスが識別される。すなわち、結果が格納される
グローバルメモリユニットが識別される。
命令フローを示した第3図において、この命令の実行は
明白である。プロセスはプロセスコントロールユニット
(PCU)において初期化され、第1の命令パケットが相
互接続ネットワークセクション(ICN)によりアドレッ
シングされた第1グローバルメモリユニット(GMU)に
渡される。ここで命令がピックアップされる。次に、命
令は第2グローバルメモリユニットに行き、オペランド
番号1がピックアップされ、もはや不要となったアドレ
スを置換える。そこから、命令は、相互接続ネットワー
クを介して次のアドレッシングされたグローバルメモリ
ユニット(GMU)に行き、そこでオペランド番号2がピ
ックアップされる。命令フローは、相互接続ネットワー
クを介して、アドレッシングされたプログラマブルファ
ンクションユニット(PFU)に進み、そこで命令フォー
マットのオペレーションコード(OP CODE)により識別
される処理機能が行われる。適切なファンクションユニ
ットに行くために、相互接続ネットワークは、以下述べ
るように、タグ(TAG)を用いて、命令を最もアクセス
可能なプログラマブルファンクションユニットに経路を
選定する。このファンクションユニットは浮動小数点演
算、固定小数点演算および超越関数発生のような特殊演
算機能を有している。ファンクションユニットとその数
の組合わせによりアプリケーションが依存する構成が決
まる。処理機能を完了すると、その結果が、相互接続ネ
ットワークを介してアドレッシングされたグローバルメ
モリユニット(GMU)に渡され、そこで処理機能の結果
が命令フォーマット(第4図)の最終ブロックにより識
別され格納される。命令フローは引き続きプロセスコン
トロールユニットに戻り、そこで第4図に示すフォーマ
ットで“結合(LINK)”により識別される初期化プロセ
スと再リンクする。
プロセスコントロールユニットのプログラムカウンタ
は、インクリメントされ、そのプロセスの次の命令がパ
イプラインすなわち相互接続ネットワークに入る準備が
される。特定のプロセスの最後の命令が、初期化するプ
ロセスコントロールユニットに戻ってくると、そのプロ
セスコントロールユニットにそのプロセスを終了するよ
うに知らせる。その最後の命令の状態が設定され、その
プロセスの完了が表示される。
以下の記述により、プロセスコントロールユニット(PC
U)は全プロセスを初期化し、終了させることがわか
る。ここでは、プロセスはそれぞれ命令パケットとして
配列されたシーケンシャルなリスト又は命令ブロック群
により定義される。各プロセスは一般に互いに独立して
いる。一般には、それらは大きなプログラムのサブルー
チンである。
命令のシーケンス 第5図は、多くの並列プロセッサに属する命令のシーケ
ンスを示す。プロセス1の命令1はI1(P1)として識別
され、プロセス1の命令9はI9(P1)として識別され
る。ここでは、複数のプロセスコントロールユニットが
相互接続ネットワークを介して結合された命令フローを
提供する。命令フローの方向は第5図の右側の破線によ
り示される。命令フローは、第3図に示すようにプロセ
スコントロールユニットから相互接続ネットワークを介
して1つ以上のグローバルメモリユニットに進み、さら
にプログラマブルファンクションユニットに進み、初期
化するプロセスコントロールユニットに戻る。第7図で
述べるように各プロセスコントロールユニットは、異る
プロセスを追跡する一連のプログラムカウンタを有して
いる。
チェーニングを有した命令フォーマット チェーニングを有した命令フォーマットを第6図に示
す。チェーニングを有した命令フォーマットは次の式の
処理で説明される。
Q<=〔(A×B)/C+D〕/E Cは定数 IF(Q GT 1)THEN… ELSE… チェーニングは、コミュニケーションを最小化し、ファ
ンクションユニットの利用を最大にして性能効率を高め
る。チェーニングは、プロセスフローにメモリを通過さ
せて新オペランドをピックアップし、ファンクションユ
ニットを通って要求された演算を行うように指示する命
令フォーマットを提供することにより得られる。プログ
ラムメモリおよび定数メモリはファンクションユニット
に設けられ、共有機構および共有動作を支持および強化
する。
第6図(a)図はQを得るために上記式を処理するチェ
ーニングされた命令を示す。このチェーニングされた命
令は第6(J)図でプロセスコントロールユニット(PC
U)により初期化される。(TAG)のラベルが付されたブ
ロックは相互接続ネットワークにより現在使用されてい
る相手先アドレスを示す。(ECC)のラベルが付された
ブロックはエラーチェックおよび訂正を示す。(SEQ)
のラベルが付されたブロックはシーケンスコードを示
す。オペランド1およびそのアドレス(OP1 ADR)はア
ドレスおよびデータ、および結果として生じるアドレス
およびデータにより識別される。オペランド2およびそ
のアドレス(OP2 ADR)は同様に識別される。プログラ
マブルファンクションユニット(PFU)はユニットおよ
びタイプにより識別される。プロセスコントロールユニ
ットの番号とリンクはブロック(PCU)で識別される。
第6(a)図の(PC)のラベルが付されたブロックはプ
ログラムカウンタを表わす。使用時には、チェーニング
された命令は右から左に読まれる。命令フローは第3図
および第4図の記述および下記記述から理解される。
プロセスコントロールユニットにより命令が初期化され
ると、命令は相互接続ネットワークを介して第1のアド
レッシングされたメモリ(MEM)に流れ、第6(b)図
に示すタームAがピックアップされる。命令フローは引
き続き、相互接続ネットワークを介して第2のアドレッ
シングされたメモリ(MEM)に流れ、第6(c)図のタ
ームBがピックアップされる。命令フローは相互接続ネ
ットワークを介して第1のアドレッシングされたプログ
ラマブルファンクションユニット(PFU)に流れ、ター
ムAとタームBが乗算される。ここで割算命令とオペラ
ンドCが第6(d)図に示すようにプログラムメモリお
よび定数メモリCから抽出される。第2のプログラマブ
ルファンクションユニットにおいて、除算が行われ、第
6(e)図に示す加算命令がピックアップされる。次に
アドレッシングされたメモリにおいて、第6(f)図に
示すタームDがピックアップされ、今迄展開されてきた
ように第6(g)に示す次にアドレスされたプログラマ
ブルファンクションユニット(PFU)において算術式に
加算される。次にアドレッシングされたメモリ(MEM)
において、最後のタームが第6(h)図に示すようにピ
ックアップされ、第6(g)図に示す次の命令“除算”
が、最後にアドレッシングされたプログラマブルファン
クションユニット(PFU)におけるタームEの値により
この時点で作られた式を割算し、第6(i)図に示すQ
を算出する。割算命令のステータスQGt1がセットされ、
命令がプロセスコントロールユニットと再リンクされこ
の式の一部であった処理の次の命令群が、条件分岐命令
から生じると初期化される。
プロセスコントロールユニット 代表的なプロセスコントロールユニットの詳細を第7図
に示す。ここでは、異るプロセスがプロセスキューに格
納される。このプロセスはプロセス番号により識別さ
れ、各命令はアドレスにより識別される。プログラムメ
モリは1つ以上のユーザプログラムを格納する。プロセ
スキュー1とプログラムメモリ2はダイレクトメモリア
クセスチャンネルを介してホストコンピュータにより制
御される。ホストコンピュータとダイレクトメモリアク
セスチャンネルは公知のアイテムであり、どちらもこの
発明を理解する上で必須のものではないので詳細に図示
しない。プロセスキュー1およびプログラムメモリ2
は、ホストコンピュータのダイレクトメモリアクセスチ
ャンネルと各制御ユニット3,4との間に接続されたバス
インタフェース5を介して制御ユニット3,4により制御
される。ホストコンピュータからプログラムメモリ2へ
の入力はレジスタ2aを介して接続され、プロセスキュー
1からプログラムメモリ2へのアドレスはコントロール
ユニット4により制御されるマルチプレクサ4aにより多
重化される。ランダムアクセスメモリ(RAM)6は保留
になっている処理を記憶している。プロセスが初期化さ
れると、プロセス番号がレジスタ7を介してランダムア
クセスメモリ6に接続される。各プロセス番号がランダ
ムアクセスメモリに格納されると、ランダムアクセスメ
モリの出力が回路8およびマルチプレクサ9,10を通って
プロセスキュー1を制御し、これらのプロセスからの以
後の命令を保留する。プロセスキューによる各プロセス
を初期化した後、その特定のプロセスに対する命令フロ
ーパケットが、プログラムメモリ2からレジスタ11を介
して出力フォーマットユニット12に結合され、出力フォ
ーマットユニット12はレジスタ13により相互接続ネット
ワーク(ICN)に接続される。従って、第4図又は第6
図に示すような一般的な命令フォーマットを有する命令
パケットは相互接続ネットワークに接続される。
第3図に示すように、前記特定命令パケットの処理機能
が完了し、その結果がグローバルメモリユニットに格納
されると、命令は、この命令を初期化したプロセスコン
トロールユニットに戻る。プロセスコントロールユニッ
トにこの命令が到達すると、レジスタ14およびコントロ
ールユニット15を介して前記命令が保留プロセスカウン
タ16に接続される。この結果、保留プロセスカウンタが
インクリメントされ、その出力がマルチプレクサ17によ
り、ランダムアクセスメモリのアドレスとなり、ランダ
ムアクセスメモリは初期化されたプロセスの番号を格納
する。現在出力されているランダムアクセスメモリ出力
は再び回路8およびマルチプレクサ9および10を介して
プロセスキューに接続され、実際には、相互接続ネット
ワーク(ICN)から戻ってきた命令に相関するプロセス
を再起動し、その結果そのプロセスにおける次の命令が
初期化され処理される。回路8は、プログラマブルファ
ンクションユニット(PFU)から戻った状態に応じて条
件付分岐を実行する。特定プロセスのエンド命令がプロ
セスコントロールユニットに戻ると、そのエンド命令
は、もちろんプロセスコントロールユニットに対して、
その処理を終了するように知らせる。
フェッチ動作 第8図は、グローバルメモリの命令パケットのアドレス
におけるデータを交換し、そのパケットステータスをリ
セットするフェッチ動作を示す。命令フローは相互接続
ネットワークを介して特定のグローバルメモリユニット
に接続される。この命令フォーマット(第4図参照)は
そのグローバルメモリユニットのロケーションアドレス
を有し、そのアドレスにおいて交換すべきデータを識別
する。その後、グローバルメモリユニットからの信号に
よりパケットステータスをリセットし、情報交換が行わ
れたことを表示する。この結果グローバルメモリユニッ
トの出力は相互接続ネットワークを介して次のアドレッ
シングされたコンピュータのユニットに接続される。
プログラマブルファンクションユニット プログラマブルファンクションユニットの代表的なパイ
プラインを第9図に示す。ここでは、入力データがオペ
レーションコードと共に、グローバルメモリユニットか
ら、相互接続ネットワークを介して、アドレスされたプ
ログラマブルファンクションユニットの入力に接続され
る。プログラマブルファンクションユニットのパイプラ
インは入力フォーマットセクション20および1乃至nの
番号が付された各プロセッシングステージから成る。各
デコードおよび格納ステージ(DC,SR)はオペレーショ
ンコード(OP CODE)を受取り、それぞれ受取ったオペ
レーションコードに応じてプロセッシングセグメント1
乃至nの1つを制御する。プロセスデータ又は出力デー
タは出力フォーマットセクション21を介して相互接続ネ
ットワークに接続される。クロック動作に応じてパイプ
ライン制御されるハードウエアにおいて浮動小数点“加
算”および浮動小数点“乗算”のような複雑な動作を行
うプログラマブル関数ユニットは単一のVLSIチップが市
販されている。
浮動小数点加算器を表わすプログラマブルファンクショ
ンユニットの例を第10図のブロック図に示す。相互接続
ネットワークからこのファンクションユニットへの入力
データはレジスタステージ23に受取られ、ステージ1ロ
ジック回路24に送られ、命令入力のフォーマット化が行
われる。ここでは、命令およびアドレスと共にオペラン
ド1,2が作られ、プログラムカウンタ(PC)が作られ、
さらにオペレーションコードが作られる。レジスタ25お
よび26はオペランド、それらのオペランドの命令および
アドレスを受取る。レジスタ27はプログラムカウンタを
受取り、レジスタ28はオペレーションコードを受取る。
ステージ2ロジックの一部を形成する比較および選択制
御回路29はオペランドデータを受取り、命令に定義され
た算術式に従って処理のためのアレンジを行い、その後
ファンクションユニットを介して、そのアドレスに応じ
たレジスタおよびロジック回路に供給される。レジスタ
30,31,32および33は比較選択ユニット29の出力を格納
し、必要に応じてシフトコードを含む指数値によりソー
トされる。
これらのレジスタの出力は、ステージ3ロジック回路の
一部を形成するシフト回路34を介して処理されバッファ
レジスタ35,36および37に格納される。
ステージ4ロジックの一部を形成する算術論理ユニット
は初期算術演算を行い、レジスタ39を含む算術チェーン
におけるレジスタ群の次段のレジスタ40に格納される。
次にステージ5ロジックプロセスにおいてプライオリテ
イエンコーダ41によるプライオリテイエンコーディング
が行われ、介在レジスタを介してステージ6ロジック回
路に送られ、算術ロジック回路45において算術処理が行
われ、指数が作られ、左シフト回路46の処理が実行さ
れ、正規化関数が作られ、算術処理を完了する。この処
理されたデータは出力フォーマットに接続される。
プログラムカウントPCはロジック2のプログラムカウン
トインクリメンタ50、プログラムメモリ51、レジスタ52
を介して増分から特定プログラムのアドレスを受取るロ
ジックステージ3を含むロジックステージを介して処理
される。
ロジックステージ4のデコーダ54はレジスタ53を介して
受取ったプログラムメモリデータをデコードし、プログ
ラムカウント値およびプログラムメモリアドレスを供給
する。
プログラムカウント値およびメモリアドレスはロジック
5において、それぞれカウント処理回路56およびコンス
タントメモリ57に接続される。ファンクションユニット
の最終レジスタステージのレジスタ群は現在プログラム
カウント値およびデータアドレスを出力フォーマッタ47
に接続する。
出力レジスタセクション60はフォーマット化されたデー
タを相互接続ネットワークに接続し、プログラムカウン
トおよびアドレスに従って他のメモリユニット又はファ
ンクションユニットに供給する。
オペレーションコード(OP CODE)に応答したレジスタ
ステージ61乃至65のファンクションは同一レジスタステ
ージの他のレジスタと連絡するデータをデコードし、ス
タートさせると共に他のレジスタファンクションの制御
を行う。
多段相互接続ネットワーク 第2図に示すような命令フローコンピュータの多段相互
接続ネットワークの一部から成る多段相互接続ネットワ
ークの一部の例を第11図に示す。
これは2段の4×4スイッチノードから構成される、16
×16多段相互接続ネットワークである。出力ポート14に
対する入力ポート1の接続が示される。この配列では情
報パケット交換が用いられている。パケット交換は、比
較的小さな固定サイズの“パケット”と呼ばれる情報単
位が、ノード間路が利用できる状態になると、交換ノー
ドから交換ノードへ移動する通信モードである。ネット
ワークの入力前に全通信路を確立する必要がない。パケ
ットは、第4図および第6図に示すように、径路指示情
報、および多少のデータ又はコマンドを含むヘッダから
成る。応用例によっては、パケットは全径路の命令を含
むことができる。その他の場合には、ポインタのみが必
要になる。パケット交換は、伝送される基本情報単位が
小さく、プロセッサの通信パターンが、計算の過程にお
いて急速に変化するアプリケーションに適用される。パ
ケット交換はさらに、適切に設計されたシステムは非常
な高性能を得るのに役立つ。
この多段相互接続ネットワークは4×4交換ノードで構
成される。B×B交換ノードで構成されたN×N多段相
互接続(Nは入力ポート数)は各々(Cla)C(N/B)交
換ノードのC(LOGBN)ステージ、すなわち許容最高機
能を有し、最小整数(aより大きい)に等しい。Bが増
大すると、ステージの数とステージあたりの交換ノード
の数が減少する。従って、出力遅延回路および潜在的に
はコンポーネントカウントへの入力を減少させるため
に、Bをできるだけ大きくすることが望しい。Bのサイ
ズの制限要因は交換ノードの複雑さである。パケット交
換クロスバーであるので、その複雑さはBの関数として
指数的に増大する。
ネットワークの重要な特性は、径路指示タグ(第4図参
照)を用いて行われる分散態様で制御可能なことであ
る。各交換ノードは、各パケットの径路指示タグの一部
を調べて受取ったパケットをどのように径路指示するか
を決定する。タグのフォーマットは、各交換ノードのサ
イズおよびネットワークのステージの数により決定され
る。B×B交換ノードが用いられる場合、タグはベース
Bデジットで所望の相手先アドレスを表わすことにより
作られる。
4×4交換エレメントから構成される第11図に示す16×
16ネットワークにおいて、1ステージあたり16/4=4交
換ノードがありLOG416=2ステージある。このネットワ
ークの径路指示タグは所望の相手先をベース4に表わす
ことにより作られる。第11図に示す例はソースアドレス
ポート1から相手先ポート14=324への径路である。0
乃至3の番号が付された4つの出力の1つを選択する各
ステージに相関するデジットがある。第11図において、
最上位桁はステージ1の交換ノードにより調べ、最下位
桁はステージ0において調べる。
ベースB=4は2のべき乗であるので、各ベース4デジ
ットは2ビットのバイナリで表現できる。従って、従前
の例では径路指示タグ324は112,102のバイナリで表わせ
る。これらのビットが縦続接続されて1110が形成され、
14のバイナリ表示が得られる。それゆえ、4×4交換ノ
ードから構成されたネットワークに対する径路指示タグ
を得るための計算は必要無い。各交換ノードは、単にタ
グの2ビットを調べ、相関するパケットをどのように径
路指示するかを決める。
多重ポートメモリ交換ノード 4×4多重ポートメモリ交換ノードが第12図に示され
る。この交換ノードは8ポート,12ワードメモリとコン
トロールロジックセクション21とで構成される。4入力
(書込み)ポートの各々はメモリの3ワードに排他的に
アクセスし、同様に出力(読出し)ポートの各々は全ワ
ードに独立してアクセスする。
コントロールロジックは、自身と接続されている他の交
換ノードとハンドシェーキングを行い、多重ポートメモ
リにアドレスを発生し、情報パケット間の調停を行う。
交換ノードに入力される全リクエスト(R1,R2…)は、
ノードが調べる必要のあるタグビットを付加している。
4×4の設計の場合、2ビット必要である。これらのビ
ットは満杯/空ステータスビットと共に12セルを有した
ステータスレジスタ22に格納される。各セルはメモリロ
ケーションに対応し、タグとステータスビットを格納す
ることができる。プライオリテイエンコーダロジック
は、リクエストライン(R)上にリクエスト信号を受取
ると3つのセル(与えられた入力ポートに対して)のう
ち第1の利用可能なセルを選択する。3ビットのステー
タスビットがすべて“満杯”でない限り許可出力信号が
許可ライン(G1,G2…)の1つに出力される。この結果
リクエストしている情報パケットが8ポートメモリ20の
相関ロケーションに書込まれる。タグビットはステータ
スレジスタ22に書込まれ、対応する満杯/空ビットは
“満杯”にセットされる。
パケット間の調停は2ステップで行われる。第1に、所
望の出力ポートに従い、満杯セル内の全タグビットがデ
コードされグループ化される。この結果バッファ調停ユ
ニット23は、同一入力ポートに入力し、かつ同一出力ポ
ートを要求しているパケット間のいずれかのパケットを
選択する。第2ステップにおいて、ポート調停ユニット
24はランダムに、同一出力ポートを要求しているパケッ
ト間のいずれかのパケットを選ぶ。同一入力ポートに入
力されたパケットが異る出力ポートを要求する限り、全
パケットは調停の第2ステップに関与する。従って、メ
モリの位置によりパケットが阻止されることはない。パ
ケットは同一出力ポートを要求する他のパケットと競合
した場合にのみ阻止される。
ラッチ回路25は調停プロセスの結果をラッチし、リクエ
スト信号はパケットにより要求された出力ポートに対し
て発生される。適切な読出しアドレスが、使用される各
出力ポートに対して、アドレス発生セクション26により
発生される。許可されたリクエストに対して、適切な満
杯/空白ステータスビットが“空白”にリセットされ
る。リクエストが許可されなかった場合、パケットはメ
モリに残り、次のサイクルの期間調停処理を繰返す。こ
のアプローチは情報パケット当り1つ以上のワードによ
り使用することができる。この交換ノードの設計は各情
報パケットあたり4ワードとみなす。
ここに一般的に記述された交換ノードは立方体型の交換
ノードとして記述することもできるし、ネットワークも
立方体のネットワークとして記述することもできる。汎
用型のネットワークは、ロバート・ジエー・マクミラン
(Robert J.McMillen)およびハワードジエイ・シーゲ
ル(Howord Jay Siegel)著“ハイブリットキューブネ
ットワーク(The Hybrid Cube Network)"CH1571−9/80
/0000−0011,1980,IEEEの論文およびロバート・ジェー
・マクミラン(Robert J.McMillen),ジョージ・ビー
・アダムスIII(George B.Adams,III),およびハワー
ド・ジェイ・シーゲル(Howard Jay Siegel)著「PASM
用相互接続ネットワークにおける4×4交換ノードの性
能と実施(Performance and Implementation of 4 by 4
Switching Nodes in an Intercounection Network for
PASM",0190−3918/01/0000/0229,1981,IEEE,の論文に
記載されている。
このネットワークは、ロバート・ジェイ・マクミラン
(Robert J.McMillen)およびアンドリュー・ロスマン
(Andrew Rosman)の出願番号 出願日
であり、上記したこの発明(PD−84073)の譲受
人に譲渡された共願に詳細に記載されている。
この命令フローコンピュータは並列ソフトウエアを実行
するのに適している。理想的には、このアーキテクチャ
は、常にアイドル状態にあるアドレスされないメモリを
除いて、いかなる部品も用いずにフルクロックレートで
ハードウエアを走らせることができる。このスピード
は、命令実行(命令フェッチ、デコード、オペランドア
ドレス発生、オペランドフェッチ、実行、結果書込み、
および再結合)の全フェーズが独立した共有リソース内
でオーバラップしているために得ることができる。これ
らのリソース(例えばPFU)はパイプラインハードウエ
アにより基本クロックレートですべて実行することがで
きる。1クロックの同一のスループットレートでパイプ
ラインセグメントを設計することにより、コンピュータ
内の各リソースはフォールスルーファーストインファー
ストアウト(fall−through first in/first out)とし
て生じる。従って全コンピュータは、流れが全体に一定
に維持されたパイプの迷路を通して流れる流体のモデル
として見える。パイプラインの実行を先行の制限、分
岐、あるいはキャッシュミスのように、散らせる通常起
こる問題は避けられる。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 米国特許4365292(US,A) AFIPS Joint Comput er Conference 1976, (1976年6月),AFIPS Montv ale,G.J.Nutt,“A par allel processor for evaluation studie s”,P.769−775

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】各プロセスがシーケンシャル命令群からな
    るプロセス群を各々が有する複数のプロセスコントロー
    ルユニット群と; ファンクションユニット群と; メモリユニット群と; 前記プロセスコントロールユニット群、前記ファンクシ
    ョンユニット群、および前記メモリユニット群間で相互
    にデータをやりとりするように並列路で相互接続する相
    互接続ネットワークと; 前記少なくとも1つプロセスコントロールユニットの一
    部を形成し、前記シーケンシャル命令群を有するプロセ
    ス群のうちの第1プロセスを開始する手段と; 前記少なくとも1つのプロセスコントロールユニットの
    一部を形成し、前記第1プロセスの開始に応答して前記
    第1プロセスのシーケンシャル命令群の第1命令を前記
    相互接続ネットワークを介して前記他のユニット群へ伝
    送する手段とで構成され、前記伝送手段は、前記第1プ
    ロセスのシーケンシャル命令群の第1命令を前記プロセ
    スコントロールユニットからデータフェッチのためにメ
    モリユニットに伝送し、処理のためにファンクションユ
    ニットに伝送し、前記プロセスコントロールユニットへ
    戻すことを特徴とする命令フローコンピュータ。
  2. 【請求項2】前記ユニット群間のすべての通信が前記相
    互接続ネットワーク上で行われるように、前記相互接続
    ネットワークは前記プロセスコントロールユニット群、
    前記ファンクションユニット群、および前記メモリユニ
    ット群を相互接続することを特徴とする請求の範囲1に
    記載の命令フローコンピュータ。
  3. 【請求項3】前記伝送手段は、前記少なくとも1つのプ
    ロセスコントロールユニットにより第2プロセスを開始
    し、前記第1プロセスの第1命令が前記相互接続ネット
    ワークを介して移動している間に前記第2プロセスの第
    1命令を前記相互接続ネットワーク上に伝送する手段を
    さらに有することを特徴とする請求の範囲1に記載の命
    令フローコンピュータ。
  4. 【請求項4】前記第1命令を伝送する手段は、先行する
    命令がプロセスコントロールユニットに戻されたときに
    のみ、そのプロセスコントロールユニットにおける前記
    第1プロセスの命令群の次の命令を開始する手段を有す
    ることを特徴とする請求の範囲1に記載の命令フローコ
    ンピュータ。
  5. 【請求項5】前記相互接続ネットワークはN×Mパケッ
    トスイッチノードからなる多段相互接続ネットワークで
    構成され、前記ユニット群が各々接続される入力ポート
    および出力ポートを有することを特徴とする請求の範囲
    1に記載の命令フローコンピュータ。
  6. 【請求項6】前記ファンクションユニット群はプログラ
    マブルファンクションユニット群であり、前記ファンク
    ションユニット群のいくつかはプログラムメモリを有す
    ることを特徴とする請求の範囲1に記載の命令フローコ
    ンピュータ。
  7. 【請求項7】前記プログラマブルファンクションユニッ
    ト群は各々コンスタントメモリを有していることを特徴
    とする請求の範囲6に記載の命令フローコンピュータ。
  8. 【請求項8】前記すべてのプロセス群が開始されるまで
    前記プロセス群の各プロセスの第1命令を連続的に開始
    する手段を各プロセスコントロールユニットに設けたこ
    とを特徴とする請求の範囲1に記載の命令フローコンピ
    ュータ。
  9. 【請求項9】前記相互接続ネットワークは並列データ処
    理路を有し、各処理路はプロセスコントロールユニット
    と;少なくとも1つのメモリユニットと;および少なく
    とも1つのファンクションユニットを有し、各プロセス
    コントロールユニットは独立したシーケンシャル命令群
    を有する少なくとも1つのプロセスを開始し、前記各並
    列デー処理路における各命令が完了し、各プロセスコン
    トロールユニットに戻された後に、そのプロセスの次の
    命令が開始されることを特徴とする請求の範囲1に記載
    の命令フローコンピュータ。
JP60504595A 1984-11-05 1985-09-26 命令フロ−コンピュ−タ Expired - Lifetime JPH0799515B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US66859084A 1984-11-05 1984-11-05
PCT/US1985/001836 WO1986003038A1 (en) 1984-11-05 1985-09-26 Instruction flow computer
US668590 1996-06-19

Publications (2)

Publication Number Publication Date
JPS62500750A JPS62500750A (ja) 1987-03-26
JPH0799515B2 true JPH0799515B2 (ja) 1995-10-25

Family

ID=24682961

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60504595A Expired - Lifetime JPH0799515B2 (ja) 1984-11-05 1985-09-26 命令フロ−コンピュ−タ

Country Status (4)

Country Link
EP (1) EP0199757B1 (ja)
JP (1) JPH0799515B2 (ja)
DE (1) DE3576229D1 (ja)
WO (1) WO1986003038A1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE68926783T2 (de) * 1988-10-07 1996-11-28 Martin Marietta Corp Paralleler datenprozessor
RO105026B1 (en) * 1991-10-10 1993-09-01 Ion Minca Network structure for parallel processing of calcullation programs
US6073185A (en) * 1993-08-27 2000-06-06 Teranex, Inc. Parallel data processor
DE69430018T2 (de) 1993-11-05 2002-11-21 Intergraph Corp., Huntsville Befehlscachespeicher mit assoziativem Kreuzschienenschalter
US6067609A (en) * 1998-04-09 2000-05-23 Teranex, Inc. Pattern generation and shift plane operations for a mesh connected computer
US6185667B1 (en) 1998-04-09 2001-02-06 Teranex, Inc. Input/output support for processing in a mesh connected computer
US6212628B1 (en) 1998-04-09 2001-04-03 Teranex, Inc. Mesh connected computer
US6173388B1 (en) 1998-04-09 2001-01-09 Teranex Inc. Directly accessing local memories of array processors for improved real-time corner turning processing
JP5590032B2 (ja) * 2009-06-30 2014-09-17 富士通株式会社 計算装置および並列計算機システム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4365292A (en) * 1979-11-26 1982-12-21 Burroughs Corporation Array processor architecture connection network

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4229790A (en) * 1978-10-16 1980-10-21 Denelcor, Inc. Concurrent task and instruction processor and method

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4365292A (en) * 1979-11-26 1982-12-21 Burroughs Corporation Array processor architecture connection network

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
AFIPSJointComputerConference1976,(1976年6月),AFIPSMontvale,G.J.Nutt,"Aparallelprocessorforevaluationstudies",P.769−775

Also Published As

Publication number Publication date
EP0199757A1 (en) 1986-11-05
JPS62500750A (ja) 1987-03-26
DE3576229D1 (de) 1990-04-05
EP0199757B1 (en) 1990-02-28
WO1986003038A1 (en) 1986-05-22

Similar Documents

Publication Publication Date Title
US4837676A (en) MIMD instruction flow computer architecture
JP2642039B2 (ja) アレイ・プロセッサ
US5815723A (en) Picket autonomy on a SIMD machine
US5828894A (en) Array processor having grouping of SIMD pickets
EP0553158B1 (en) A scalable parallel vector computer system
US5809292A (en) Floating point for simid array machine
US3978452A (en) System and method for concurrent and pipeline processing employing a data driven network
US5617577A (en) Advanced parallel array processor I/O connection
US5675757A (en) Direct match data flow memory for data driven computing
JP3599197B2 (ja) 待ち時間が可変の、プロセッサをメモリに接続する相互接続ネットワーク
US4873626A (en) Parallel processing system with processor array having memory system included in system memory
US5594918A (en) Parallel computer system providing multi-ported intelligent memory
Dobkin et al. QNoC asynchronous router
JPS63147258A (ja) マルチノード再構成可能パイプラインコンピュータ
CA2071481A1 (en) Cluster architecture for a highly parallel scalar/vector multiprocessor system
JPH05233569A (ja) 動的に複数モードで動作するコンピュータ・システム
RU2042193C1 (ru) Вычислительная система
US5586289A (en) Method and apparatus for accessing local storage within a parallel processing computer
EP0199757B1 (en) Instruction flow computer
US7673118B2 (en) System and method for vector-parallel multiprocessor communication
US20070136560A1 (en) Method and apparatus for a shift register based interconnection for a massively parallel processor array
US20030172248A1 (en) Synergetic computing system
Cappello et al. PTAH Introduction to a new parallel architecture for highly numeric processing
JP2765882B2 (ja) 並列計算機,ベクトルレジスタ間データフロー同期装置およびネットワークプリセット装置
JP2625628B2 (ja) 浮動小数点コンピュータ・システム