Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JPH0414371B2 - - Google Patents
[go: Go Back, main page]

JPH0414371B2 - - Google Patents

Info

Publication number
JPH0414371B2
JPH0414371B2 JP60047816A JP4781685A JPH0414371B2 JP H0414371 B2 JPH0414371 B2 JP H0414371B2 JP 60047816 A JP60047816 A JP 60047816A JP 4781685 A JP4781685 A JP 4781685A JP H0414371 B2 JPH0414371 B2 JP H0414371B2
Authority
JP
Japan
Prior art keywords
access
address
throughput
register
source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60047816A
Other languages
Japanese (ja)
Other versions
JPS61206054A (en
Inventor
Nobuhiko Kuribayashi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP4781685A priority Critical patent/JPS61206054A/en
Publication of JPS61206054A publication Critical patent/JPS61206054A/en
Publication of JPH0414371B2 publication Critical patent/JPH0414371B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)
  • Complex Calculations (AREA)

Description

【発明の詳細な説明】[Detailed description of the invention]

〔概要〕 複数のアクセス元が、主記憶を連続アドレスで
それぞれアクセスする場合、アクセススループツ
トの大きいアクセス元がアクセススループツトの
小さいアクセス元のアドレスに追い付いたときア
クセス競合となり、アクセススループツトが低下
した。そこで、アクセススループツトの小さいア
クセス元のアドレスをとびとびに発生し、アクセ
ススループツトの大きいアクセス元と主記憶領域
の走査速度を見かけ上同等にして、アクセス競合
の機会を小さくしている。 〔産業上の利用分野〕 本発明は、情報処理装置における主記憶制御方
式に関するものであり、特に複数のアクセス元に
より主記憶の連続領域をアクセスする際の効率的
なアクセス制御方式に関する。 〔従来の技術〕 第2図は、本発明が適用される情報処理装置の
1例を締したものである。 図において、1は主記憶装置MSU、2は主記
憶制御ユニツトMCU、3はチヤネルプロセツサ
CHP、4はスカラユニツトSU、5はベクトルユ
ニツトVU、6は拡張メモリ制御ユニツトEMU、
7は拡張メモリ、8−0は上記1〜5よりなるプ
ロセツサエレメントPE、8−1ないし8−nは、
他のプロセツサエレメントPEを表す。 チヤネルプロセツサCHP、スカラユニツト
SU、ベクトルユニツトVU、拡張メモリ制御ユ
ニツトEMUは、それぞれ主記憶制御ユニツト
MCUを介して、主記憶装置MSUをアクセスする
ことができる。 主記憶装置MSUは、アドレスを複数のバンク
にインタリーブした構成をとつており、同時的な
複数バンクに対する並行したアクセスが可能にさ
れている。 また拡張メモリ制御ユニツトEMUは、プロセ
ツサエレメント8−0の主記憶装置MSUと拡張
メモリESUとの間のデータ転送を制御するとと
もに、拡張メモリESUと各プロセツサエレメン
トPEのMCUとの間のデータ転送も制御してい
る。 このため、拡張メモリ制御ユニツトEMU(した
がつて拡張メモリESUでもある)が1つの主記
憶制御ユニツトMCUに対してもつアクセスポー
ト数は、プロセツサエレメントが0〜n個あるの
でベクトルユニツトVUなどにくらべてかなり少
なく、又データBus幅も同様に細くなり、アクセ
ススループツトが小さくなつているのが普通であ
る。 たとえばあるシステム例では、VUとMCUと
の間には1本が4エレメント/1Tのスループツ
トをもつ複数本のロード/ストアパイプラインが
設けられているが、EMUとMCUとの間には1エ
レメント/1Tのスループツトをもつ1本のロー
ド/ストアパイプラインしか設けられていない
(1エレメント=8Byte)。 このような、主記憶装置MSUに対するアクセ
ススループツトの異なる複数のアクセス元が、そ
れぞれ主記憶装置の所定の領域を連続アドレス
(デイスタンスd=1)で昇順にアクセスした場
合、条件により両者の間にバンク競合あるいは
LS(LOGICAL STORAGE)BUSYが生じる。 これを、第3図および第4図の具体例を用いて
説明する。 図示の例は、VUが1マシーンサイクル(1T)
に4LS(LOGICAL STORAGE)つまり4エレメ
ントをアクセスできるが、EMUは、4マシーン
サイクル(4T)ごとに4LSつまり4エレメント
をアクセスできる場合のものである。すなわち両
者のアクセススループツトの比は4対1となつて
いる。 第3図および第4図において、縦軸は時間、横
軸にLS(LOGICAL STORAGE)NOを示してい
る。 1回のアクセス単位は4LSであり、アクセスさ
れると縦方向に線がのびるのは、LS Busy時間
のためであり、この時間中は、他のアクセスが禁
止される。 第3図の例は、9がアクセススループツトの小
さいEMUアクセス、10がアクセススループツ
トの大きいVUアクセス、11も同様にVUアク
セスで10とは別のアクセスパイプラインが同時
に動作している場合を示している。図示の時間領
域では、各アクセス間にLSのアクセス競合が起
らないため、VUアクセスのアクセススループツ
トは低下しない。 しかし、第4図の例では、10のVUアクセス
が19のEMLアクセスLS=iで追い付き、アクセ
ス待ちとなつて、以後10′で示すように、VU
アクセスは各LSごとに先行のEMUアクセス待ち
となり、そのアクセススループツトはEMUアク
セスと同じレベルに低下してしまう。 〔発明が解決しようとする問題点〕 従来の情報処理装置では、アクセススループツ
トの異なる複数のアクセス元が連続アドレスで主
記憶にアクセスした場合、連続したLSで次々と
アクセス競合を生じる可能性があり、アクセスス
ループツトの大きいアクセス元のアクセス効率が
低下して、処理速度が遅くるという問題があつ
た。 〔問題点を解決するための手段〕 本発明は、アクセススループツトの異なる複数
のアクセス元がそれぞれ連続アドレスで主記憶に
アクセスする際、アクセス元同士のアクセスアド
レスが連続してアクセス競合しないよう、すなわ
ちアクセススループツトの小さいアクセス元のア
クセスアドレスが、アクセススループツトの大き
いアクセス元のアクセスアドレスによつて追い付
かれないよう、アクセスススループツトの小さい
アドレス元のアドレス数列から、アクセス元間の
アクセススループツトの比に基づいた間隔でとび
とびにアクセスアドレスを発生し、主記憶のアク
セスを行なうように制御するものである。 そのため、アクセススループツトの小さいアク
セス基の連続するアドレス数列を、アクセススル
ープツトの比nに(nは整数)で区分してグルー
プ化する。次に、各グループからたとえばグルー
プ内最下位のアドレスを順に取り出し、1巡した
ら次に各グループ内で次の順位のアドレスを順に
取り出す。以下、この操作をn巡繰り返せば、元
のアドレス数列全体のアドレスが発生できる。 〔実施例〕 以下に、本発明を第2図に示した情報処理装置
に適用した場合の実施例について説明する。した
がつて、第2図の構成がそのまま援用される。 ベクトルユニツトVUは、複数本のロード/ス
トアパイプラインを持つ。1本のロードストアパ
イプラインは、4エレメント(1エレメント=8
バイト)/1Tのスループツトを持つ。 拡張メモリ制御ユニツトEMUは、1本のロー
ド/ストアパイプラインを持ち、そのスループツ
トは、1エレメント/1Tである。 したがつて、VUはEMUに比べてN=4倍の
スループツトがある。 EMUが、MSUに対して10000番地(HEX)か
ら2KB(2048バイト)のデータを転送する場合に
ついて説明する。 EMUのスループツトは、1エレメント/1Tで
あるが、アクセス効率を向上させるため、4エレ
メント/4Tでアクセスする。2KBのデータは、
32バイトアクセスの64回分に相当する。 表1に、このEMUアクセス例を示す。 10000番地から昇べき順に32バイト(DEC)=
20バイト(HEX)単位で2KB分のアドレス列を
つくる。N=4なので、4アドレスごとにグルー
プをつくり、グループ内NOをつける。 まずグループ内NOのについて、昇べき順で
主記憶に対してアクセスを出す。次に、、
と順に同様にアクセスを発信する。 第5図に、本発明方式を用いた場合のLS
Busyと時間の関係を図示する。これは、第4図
の従来例に対応するものである。 本発明方式により、LS時間グラフ上の傾きが、
VUアクセスとEMUアクセスとで等しくなる。
また、一時的にVUアクセスとEMUアクセスと
がLS Busyコンフリクシヨンを起こしたとして
も、LS Busy時間以内のものであり、スループ
ツトは保証される。 実施例回路 第1図は、本発明方式によるリクエストアドレ
ス発生回路の1実施例構成を示したもである。こ
の回路は、EMU内に設けられてEMUアクセスの
ために使用される。 図において、11はOP CODEレジスタ、12
はSAレジスタ、13はELレジスタ、14は加算
器、15はRAレジスタ、16はコントロールカ
ウンタ、17はEL−UPレジスタ、18はEL−
LWレジスタ、19はREQコントロール回路、2
0はシフトコントロール回路を表わしている。 OP CODEレジスタ11は、ロードあるいはス
トアのオペコードを保持するレジスタである。 SAレジスタ12は、アクセスをスタートする
アドレス(SA)を保持するレジスタである。 ELレジスタ13は、ロードあるいはストアす
るエレメント数(EL)を保持するレジスタであ
る。 加算器14は、現アドレスにデイスタンスを加
算して次のリクエストアドレスを生成する回路で
ある。加算される定数としては、 0 1d=20(HEX) 2d=40(HEX) 3d=60(HEX) Nd=80(HEX) の中の1つが選択される。 RAレジスタ15は現在のリクエストアドレス
を保持するレジスタであり、その出力はMCUへ
転送されると同様に加算器14へ帰還される。 コントロールカウンタ16は4Bitのシフトレジ
スタで構成され、グループの走査シーケンスを制
御する回路である。制御ステージ数は4である。 EL−UPレジスタ17には、EMUアクセスに
設定されているアクセススループツト倍数N=4
でエレメント数(EL)を区分した結果得られる
グループ数がセツトされる。アドレス発生ごとに
1ずつ減算され、0となつたとき再セツトされ
て、4巡で終了する。 EL−LWレジスタ18には、エレメント数
(EL)をN=4で区分した端数がセツトされ、0
でない限りEL−UPレジスタ17の1巡の終りに
1を減算される。 REQコントロール回路19は、MCUに対して
リクエストアドレスが有効であることを知らせる
REQUEST VALIDを出力する。 シフトコントロール回路20は各グループに対
する走査が一巡するごとにコントロールカウンタ
16を1段シフトする。 EMUからMSUへのアクセス発信を行なうとき
は、スカラユニツトSUより、ロード、ストアを
示すオペコード(OP CODE)スタートアドレス
(SA)、エレメント数(EL)等のパラメータが与
えられる。 EMUからMCUに対してアクセスリクエストを
出す場合、上記それぞれのパラメータが、
OPCODEレジスタ11、SAレジスタ12、EL
レジスタ13に、EMU−REQというEMU内部
のコントロール信号によつてセツトされ、オペレ
ーシヨンの終了まで保持される。 SAレジスタ12とRAレジスタ15のアドレ
スに対して加算器14が加算する定数は、SAレ
ジスタ12からRAレジスタヘアアドレスがセツ
トされるときに選択される。これらの値はコント
ロールカウンタ16により指定される。 Nd=80(H)の定数は、RAレジスタ→RAレ
ジスタのパスが選択されたときには必ず選択され
る。 ELレジスタ13よりEL−UPレジスタ17に
は、エレメント数の0〜27BITのみがセツトされ
る。これは、エレメント数が4エレメントバウン
ダリになつているときは“グループNO”を示
し、4エレメントバウンダリとなつていないとき
は、“グループNO−1”を示す。グループNOと
は、エレメント数を4で区切つたグループ数のこ
とである。 EL−UPレジスタ17は、コントロールカウン
タ16の段0、1、2、3にセツトされるタイミ
ングで値をセツトされ、REQコントロール回路
19により1ずつ減算される。 EL−LWレジスタ18は、コントロールカウ
ンタ16の0BIT段がONになつたときに、エレ
メント数の28BITおよび29BITのみをセツトさ
れ、保持する。 EL−UPレジスタ17が0になり、かつEL−
LWレジスタ18が0でないとき、REQコントロ
ール回路19へリクエストを発生し、その後1を
減算する。 シフトコントロール回路20は、コントロール
カウンタ16のシフトを制御する。すなわち
(EL−LWレジスタ=0)・(EL−UPレジスタ=
0)+(EL−LWレジスタ減算)の論理でコント
ロールカンウタ16の減算を行なう。 次に動作例を示す。 EMUスタートアドレス(SA) 1000番地 エレメント数(EL) 256エレメント オペコード STORE として、以下のないしの手順で動作が行なわ
れる。 OP CODEレジスタ=STORE CODE SAレジスタ=10000(HEX) ELレジスタ=100(HEX) がセツトされる。 EMU−REQ信号で、コントロールカウンタ
の0がONとなる。加算器の定数としては、0
が選択され、 RAレジスタ10000がセツトされる。 EL−UP=16(DEC) EL−LW=0がセツトされる。 RAレジスタ→レジスタのパスの選択と定数
=80(HEX)の選択がなされる。 REQ−VALを出したなら、EL−UPの値は、
1ずつ減算する。 RAレジスタには、80(HEX)を加算してい
く。 以上をEL−UPが0になるまでくりかえす。 EL−UPが0になつたらEL−LOWが0なの
で、コントロールカウンタは、0→1へシフト
され、加算器の定数として、1d=20(HEX)を
選択し、SAレジスタ→RAレジスタのパスを
選択し、RAレジスタ=10020をセツトする。
EL−UPには、16(DEC)をセツトする。 RAレジスタ−RAレジスタをパスを選択し、
加算器の定数としては80(HEX)を選択する。
REQ−VALを出したのち、EL−UPは、1ず
つ減算するRAレジスタには、80(HEX)を加
算していき、EL−UPが0になるまでくりかえ
す。 EL−UPが0になつたなら、EL−LOWが0
なので、コントロールカウタは、1→2へシフ
トされ、加算器の定数としては、2d=40
(HEX)を選択する。RAレジスタ=10040をセ
ツトする。EL−UPに16をセツトする。 と同様に行なう。 EL−UPが0になつたなら、EL−LOWが0
なので、コントロールカウタを2→3へシフト
し、加算器の定数としては、3d=60(HEX)を
選択する、RAレジスタに10060をセツトし、
EL−UPに16をセツトする。 と同様に行なう。 〔発明の効果〕 本発明によれば、アクセススループツトの大き
いアクセス元が連続アドレスでアクセスした場
合、アクセススループツトの小さいアクセス元の
アクセスによつては、ほとんど影響されなくなる
ので、システム全体として高いアクセス効率を保
つことができる。
[Overview] When multiple access sources access the main memory using consecutive addresses, access contention occurs when the access source with a large access throughput catches up with the address of the access source with a small access throughput, and the access throughput decreases. did. Therefore, addresses of access sources with a small access throughput are generated at intervals, and the scanning speed of the main storage area is apparently made equal to that of an access source with a large access throughput, thereby reducing the chance of access contention. [Industrial Application Field] The present invention relates to a main memory control method in an information processing device, and particularly to an efficient access control method when a continuous area of the main memory is accessed by a plurality of access sources. [Prior Art] FIG. 2 shows an example of an information processing device to which the present invention is applied. In the figure, 1 is the main storage unit MSU, 2 is the main memory control unit MCU, and 3 is the channel processor.
CHP, 4 is a scalar unit SU, 5 is a vector unit VU, 6 is an extended memory control unit EMU,
7 is an expanded memory, 8-0 is a processor element PE consisting of the above 1 to 5, and 8-1 to 8-n are:
Represents another processor element PE. Channel processor CHP, scalar unit
SU, vector unit VU, and extended memory control unit EMU are main memory control units.
The main storage device MSU can be accessed via the MCU. The main memory unit MSU has a configuration in which addresses are interleaved into multiple banks, and parallel access to multiple banks is possible at the same time. The extended memory control unit EMU also controls data transfer between the main storage device MSU of the processor element 8-0 and the extended memory ESU, and also controls data transfer between the extended memory ESU and the MCU of each processor element PE. It also controls transfer. For this reason, the number of access ports that the extended memory control unit EMU (therefore also the extended memory ESU) has for one main memory control unit MCU is limited to the vector unit VU, etc., since there are 0 to n processor elements. The data bus width is also narrower, and the access throughput is usually smaller. For example, in an example system, there are multiple load/store pipelines between the VU and the MCU, each with a throughput of 4 elements/1T, but between the EMU and the MCU there are 1 element throughput. Only one load/store pipeline with a throughput of /1T is provided (1 element = 8 Bytes). When multiple access sources with different access throughputs to the main memory MSU each access a predetermined area of the main memory in ascending order using consecutive addresses (distance d = 1), depending on the condition, bank conflict or
LS (LOGICAL STORAGE) BUSY occurs. This will be explained using specific examples shown in FIGS. 3 and 4. In the example shown, VU is 1 machine cycle (1T)
4LS (LOGICAL STORAGE) or 4 elements can be accessed every 4 machine cycles (4T), but EMU is for the case where 4LS (LOGICAL STORAGE) or 4 elements can be accessed every 4 machine cycles (4T). That is, the ratio of access throughput between the two is 4:1. In FIGS. 3 and 4, the vertical axis shows time, and the horizontal axis shows LS (LOGICAL STORAGE) NO. The unit of one access is 4LS, and the reason why a line extends vertically when accessed is due to the LS Busy time, during which other accesses are prohibited. In the example shown in Figure 3, 9 is an EMU access with a small access throughput, 10 is a VU access with a large access throughput, 11 is a VU access as well, and another access pipeline other than 10 is operating at the same time. It shows. In the illustrated time domain, LS access contention does not occur between accesses, so the access throughput of VU access does not decrease. However, in the example shown in Fig. 4, the VU access of 10 catches up with the EML access LS=i of 19 and waits for access, and henceforth, as shown by 10', the VU access
Access waits for the preceding EMU access for each LS, and the access throughput drops to the same level as EMU access. [Problem to be solved by the invention] In conventional information processing devices, when multiple access sources with different access throughputs access the main memory using consecutive addresses, there is a possibility that access conflicts will occur one after another in consecutive LSs. However, there was a problem in that the access efficiency of access sources with large access throughput decreased, resulting in slow processing speed. [Means for Solving the Problems] The present invention provides a method to prevent consecutive access conflicts between the access addresses of the access sources when a plurality of access sources with different access throughputs access the main memory using consecutive addresses. In other words, in order to prevent the access address of an access source with a small access throughput from being overtaken by the access address of an access source with a large access throughput, the access throughput between the access sources is calculated from the address sequence of the address source with a small access throughput. Access addresses are generated intermittently at intervals based on the ratio of access points, and control is performed to access the main memory. Therefore, consecutive address sequences of access groups with small access throughputs are divided and grouped by the access throughput ratio n (n is an integer). Next, from each group, for example, the lowest address in the group is taken out in order, and after one cycle, the next address in each group is taken out in order. Thereafter, by repeating this operation n times, addresses for the entire original address sequence can be generated. [Embodiment] An embodiment in which the present invention is applied to the information processing apparatus shown in FIG. 2 will be described below. Therefore, the configuration shown in FIG. 2 can be used as is. Vector unit VU has multiple load/store pipelines. One load store pipeline has 4 elements (1 element = 8
Byte)/1T throughput. The extended memory control unit EMU has one load/store pipeline, and its throughput is 1 element/1T. Therefore, VU has N=4 times the throughput compared to EMU. A case will be explained in which the EMU transfers 2KB (2048 bytes) of data from address 10000 (HEX) to the MSU. EMU's throughput is 1 element/1T, but to improve access efficiency, access is performed at 4 elements/4T. 2KB of data is
Equivalent to 64 32-byte accesses. Table 1 shows an example of this EMU access. 32 bytes (DEC) in ascending order from address 10000 =
Create a 2KB address string in units of 20 bytes (HEX). Since N=4, create a group for every 4 addresses and add a NO within the group. First, accesses are made to the main memory in ascending order for the NO within the group. next,,
and send access in the same way. Figure 5 shows the LS when using the method of the present invention.
The relationship between Busy and time is illustrated. This corresponds to the conventional example shown in FIG. By the method of the present invention, the slope on the LS time graph is
VU access and EMU access are equal.
Furthermore, even if a temporary LS Busy conflict occurs between VU access and EMU access, it is within the LS Busy time and throughput is guaranteed. Embodiment Circuit FIG. 1 shows the configuration of an embodiment of a request address generation circuit according to the present invention. This circuit is provided within the EMU and used for EMU access. In the figure, 11 is the OP CODE register, 12
is SA register, 13 is EL register, 14 is adder, 15 is RA register, 16 is control counter, 17 is EL-UP register, 18 is EL-
LW register, 19 is REQ control circuit, 2
0 represents a shift control circuit. The OP CODE register 11 is a register that holds a load or store operation code. The SA register 12 is a register that holds an address (SA) for starting access. The EL register 13 is a register that holds the number of elements (EL) to be loaded or stored. The adder 14 is a circuit that adds distance to the current address to generate the next request address. As the constant to be added, one of the following is selected: 0 1d=20 (HEX) 2d=40 (HEX) 3d=60 (HEX) Nd=80 (HEX). The RA register 15 is a register that holds the current request address, and its output is fed back to the adder 14 in the same way as it is transferred to the MCU. The control counter 16 is composed of a 4-bit shift register, and is a circuit that controls the group scanning sequence. The number of control stages is four. The EL-UP register 17 contains the access throughput multiple N = 4 set for EMU access.
The number of groups obtained as a result of dividing the number of elements (EL) by is set. It is decremented by 1 each time an address is generated, and when it reaches 0, it is reset, and the process ends in 4 rounds. In the EL-LW register 18, a fraction obtained by dividing the number of elements (EL) by N=4 is set, and 0 is set.
Unless otherwise, 1 is subtracted at the end of one cycle of the EL-UP register 17. The REQ control circuit 19 notifies the MCU that the request address is valid.
Output REQUEST VALID. The shift control circuit 20 shifts the control counter 16 by one stage each time the scanning for each group completes one cycle. When an access is issued from the EMU to the MSU, parameters such as an operation code (OP CODE) indicating a load or store, a start address (SA), and the number of elements (EL) are given from the scalar unit SU. When issuing an access request from EMU to MCU, each of the above parameters is
OPCODE register 11, SA register 12, EL
It is set in the register 13 by a control signal inside the EMU called EMU-REQ, and is held until the end of the operation. The constant added by adder 14 to the addresses of SA register 12 and RA register 15 is selected when the RA register hair address is set from SA register 12. These values are designated by control counter 16. The constant Nd=80 (H) is always selected when the path from RA register to RA register is selected. Only 0 to 27 bits of the number of elements are set from the EL register 13 to the EL-UP register 17. This indicates "group NO" when the number of elements is at a 4-element boundary, and indicates "group NO-1" when the number of elements is not at a 4-element boundary. The group number is the number of groups obtained by dividing the number of elements by four. The value of the EL-UP register 17 is set at the timing when stages 0, 1, 2, and 3 of the control counter 16 are set, and the value is subtracted by 1 by the REQ control circuit 19. The EL-LW register 18 is set and holds only 28 BIT and 29 BIT, which are the number of elements, when the 0BIT stage of the control counter 16 turns ON. EL-UP register 17 becomes 0 and EL-UP register 17 becomes 0.
When the LW register 18 is not 0, a request is generated to the REQ control circuit 19, and then 1 is subtracted. The shift control circuit 20 controls the shift of the control counter 16. That is, (EL-LW register = 0)・(EL-UP register =
The control counter 16 performs subtraction using the logic 0)+(EL-LW register subtraction). An example of operation is shown next. EMU start address (SA) Address 1000 Number of elements (EL) 256 elements Operation code As STORE, the following steps are performed. OP CODE register = STORE CODE SA register = 10000 (HEX) EL register = 100 (HEX) are set. The EMU-REQ signal turns on the control counter 0. The constant of the adder is 0
is selected and RA register 10000 is set. EL-UP=16 (DEC) EL-LW=0 is set. The path from RA register to register is selected and the constant = 80 (HEX) is selected. If REQ-VAL is issued, the value of EL-UP is
Subtract by 1. Add 80 (HEX) to the RA register. Repeat the above steps until EL-UP becomes 0. When EL-UP becomes 0, EL-LOW becomes 0, so the control counter is shifted from 0 to 1, selects 1d=20 (HEX) as the adder constant, and changes the path from SA register to RA register. Select and set RA register = 10020.
Set 16 (DEC) to EL-UP. RA register − Select RA register as path,
Select 80 (HEX) as the adder constant.
After issuing REQ-VAL, EL-UP adds 80 (HEX) to the RA register, which is subtracted by 1, and repeats this until EL-UP becomes 0. If EL-UP becomes 0, EL-LOW becomes 0
Therefore, the control counter is shifted from 1 to 2, and the adder constant is 2d=40.
Select (HEX). Set RA register = 10040. Set EL-UP to 16. Do the same thing. If EL-UP becomes 0, EL-LOW becomes 0
Therefore, shift the control counter from 2 to 3, select 3d=60 (HEX) as the adder constant, set 10060 in the RA register,
Set EL-UP to 16. Do the same thing. [Effects of the Invention] According to the present invention, when an access source with a large access throughput accesses with consecutive addresses, it is hardly affected by the access by an access source with a small access throughput. Access efficiency can be maintained.

【表】【table】

【表】【table】 【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明方式の1実施例におけるリクエ
ストアドレス発生回路の実施例構成図、第2図は
本発明方式が適用可能な情報処理装置のシステム
構成図、第3図は従来方式によるアクセス例のグ
ラフ、第4図は従来方式による他のアクセス例の
グラフ、第5図は第1図に示す本発明方式の1実
施例によるアクセス例のグラフである。 第1図において、11はOP CODEレジスタ、
12はSAレジスタ、13はELレジスタ、14は
加算器、15はRAレジスタ、16はコントロー
ルカウンタ、17はEL−UPレジスタ、18は
EL−LWレジスタ、19はREQコントロール回
路、20はシフトコントロール回路を示す。
FIG. 1 is an example configuration diagram of a request address generation circuit in one embodiment of the method of the present invention, FIG. 2 is a system configuration diagram of an information processing device to which the method of the present invention can be applied, and FIG. 3 is an example of access using the conventional method. FIG. 4 is a graph of another access example using the conventional method, and FIG. 5 is a graph of an access example according to an embodiment of the present invention method shown in FIG. In Figure 1, 11 is the OP CODE register;
12 is SA register, 13 is EL register, 14 is adder, 15 is RA register, 16 is control counter, 17 is EL-UP register, 18 is
EL-LW register, 19 is a REQ control circuit, and 20 is a shift control circuit.

Claims (1)

【特許請求の範囲】 1 メモリアクセススループツトが相違するアク
セス元を含む複数のアクセス元が主記憶のアドレ
スに対して連続するアクセスを主として行うシス
テムにおいて、 ある第1のアクセススループツトを有する第1
のアクセス元と、 前記第1のアクセス元と比較して、前記第1ア
クセススループツトよりもアクセススループツト
が小さく、前記第1アクセススループツトの1/
nの比(nは整数)のアクセススループツトであ
る第2アクセススループツトを有する第2のアク
セス元を有し、 前記第2のアクセス元は、 前記主記憶装置に連続したアドレスのアクセス
をする際に、アクセス単位のn倍のアドレス間隔
で、前記第1のアクセス元のアクセス方向と同じ
方向でアドレスを更新していくアドレス更新制御
手段と、 アクセスのスタートアドレスにアクセス単位の
アドレスを順次加算して、前記アドレス更新制御
手段に与えるアドレス加算手段とを有し、 前記第2のアクセス元は、前記アドレス更新制
御手段とアドレス加算手段とにより自身のアクセ
スアドレスを更新し、その際アクセスアドレスを
アクセス単位ごとに一定の方向に並べ、そのアド
レス数列をnグループに区切り、各グループごと
に同一の番号付けを行い、上記nで区切つた各グ
ループごとに順次の番号のアドレスを選択し、か
つ各番号ごとに各グループ内の同一番号のアドレ
スを横断してアクセスするように、アドレス列を
変更してアクセスアドレスを更新することを特徴
とする主記憶制御方式。
[Scope of Claims] 1. In a system in which a plurality of access sources, including access sources with different memory access throughputs, mainly perform continuous access to addresses in main memory, a first access source having a certain first access throughput,
compared to the first access source, the access throughput is smaller than the first access throughput, and the access throughput is 1/1/1 of the first access throughput.
a second access source having a second access throughput that is an access throughput in the ratio of n (n is an integer), and the second access source accesses consecutive addresses to the main storage device. an address update control means that updates the address in the same direction as the access direction of the first access source at an address interval n times the access unit; and an address update control means that sequentially adds the address of the access unit to the start address of the access. and address addition means for supplying the address update control means to the address update control means, the second access source updates its own access address by the address update control means and the address addition means, and at this time updates the access address. Arrange the address sequence in a fixed direction for each access unit, divide the address sequence into n groups, assign the same number to each group, select sequentially numbered addresses for each group divided by n, and A main memory control method characterized by updating an access address by changing an address string so that addresses of the same number in each group are accessed for each number.
JP4781685A 1985-03-11 1985-03-11 Main memory control system Granted JPS61206054A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4781685A JPS61206054A (en) 1985-03-11 1985-03-11 Main memory control system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4781685A JPS61206054A (en) 1985-03-11 1985-03-11 Main memory control system

Publications (2)

Publication Number Publication Date
JPS61206054A JPS61206054A (en) 1986-09-12
JPH0414371B2 true JPH0414371B2 (en) 1992-03-12

Family

ID=12785878

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4781685A Granted JPS61206054A (en) 1985-03-11 1985-03-11 Main memory control system

Country Status (1)

Country Link
JP (1) JPS61206054A (en)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59119996A (en) * 1982-12-25 1984-07-11 Fujitsu Ltd Time switch system using multi-port memory

Also Published As

Publication number Publication date
JPS61206054A (en) 1986-09-12

Similar Documents

Publication Publication Date Title
US5134695A (en) Method and apparatus for constant stride accessing to memories in vector processor
US4827403A (en) Virtual processor techniques in a SIMD multiprocessor array
US5155823A (en) Address generating unit
US6954812B2 (en) Two-stage round robin arbitration system
KR950012256A (en) Computer system for processing vector data and method thereof
US4757444A (en) Vector processor capable of performing iterative processing
KR960042420A (en) Parametric Curve Generator
Seznec et al. Interleaved parallel schemes: Improving memory throughput on supercomputers
JP4240610B2 (en) Computer system
JPH0414371B2 (en)
CN110119375A (en) A kind of control method that multiple scalar cores are linked as to monokaryon Vector Processing array
Honda et al. A warp-synchronous implementation for multiple-length multiplication on the GPU
JPS6347866A (en) signal control circuit
JPS61282954A (en) Access control system
JPS61262971A (en) Constituting system for vector register
JPS62174873A (en) Memory access control system
KR930003410B1 (en) Data processing apparatus having high-sped reference of stack data
JPS58158755A (en) Memory controlling device
del Corral et al. Reducing inter-vector-conflicts in complex memory systems
JP2828972B2 (en) Parallel processor
JP2000259493A (en) Memory access system
CN121311873A (en) Execution unit, processing device and method for generating random samples
JPH04227589A (en) Device and method for allocating data flow program
JPS62138940A (en) Register access control system
Souravlas et al. A message passing strategy for array redistributions in a torus network