Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP2636076B2 - Vector processing equipment - Google Patents
[go: Go Back, main page]

JP2636076B2 - Vector processing equipment - Google Patents

Vector processing equipment

Info

Publication number
JP2636076B2
JP2636076B2 JP31187690A JP31187690A JP2636076B2 JP 2636076 B2 JP2636076 B2 JP 2636076B2 JP 31187690 A JP31187690 A JP 31187690A JP 31187690 A JP31187690 A JP 31187690A JP 2636076 B2 JP2636076 B2 JP 2636076B2
Authority
JP
Japan
Prior art keywords
instruction
vector
store
load
bit position
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP31187690A
Other languages
Japanese (ja)
Other versions
JPH04182778A (en
Inventor
克巳 依田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Computertechno Ltd
Original Assignee
NEC Computertechno Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Computertechno Ltd filed Critical NEC Computertechno Ltd
Priority to JP31187690A priority Critical patent/JP2636076B2/en
Publication of JPH04182778A publication Critical patent/JPH04182778A/en
Application granted granted Critical
Publication of JP2636076B2 publication Critical patent/JP2636076B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Complex Calculations (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、ベクトルを単位とするロード/ストアを主
記憶装置とベクトルレジスタとの間で行なうベクトル処
理装置に関する。
Description: BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a vector processing apparatus that performs load / store in units of vectors between a main memory and a vector register.

〔従来の技術〕[Conventional technology]

従来より命令処理の高速化を目的とした、命令処理順
序を動的に決定しプログラムで指定された順序によらず
演算部、主記憶処理部(主記憶装置を含み、データの読
出し、書込みを行なう)に命令投入を行う方式がスカラ
処理を行なう計算機で用いられている。この様な計算機
では、命令の入出力オペランドであるレジスタやメモリ
アドレスの衝突の検出および演算器や主記憶処理部の使
用状況を判定しプログラムで指定された順序によらず演
算部や主記憶処理部への命令投入を決定する手段を有し
ている。
Conventionally, the order of instruction processing has been dynamically determined for the purpose of speeding up instruction processing, and an arithmetic unit, a main storage processing unit (including a main storage device, and capable of reading and writing data regardless of the order specified by a program). The method of executing an instruction is performed by a computer that performs scalar processing. In such a computer, a collision of a register or a memory address, which is an input / output operand of an instruction, is detected, and a use state of a computing unit and a main memory processing unit is determined. It has means for deciding the instruction input to the section.

上記の命令の入出力オペランドであるレジスタやメモ
リアドレスの衝突の検出および主記憶装置の使用状況を
判定しプログラムで指定された順序によらず主記憶処理
部への命令投入を決定する方式は、スカラ計算機のみな
らずベクトル計算機においても適応可能であるが、ベク
トル計算機では複数のメモリ参照ベクトル命令を、プロ
グラムで指定された順序と逆順にして主記憶処理部に投
入してもよいかの判定が困難である。即ち、プログラム
で実行することが指定されているベクトルストア命令の
ストア開始起点アドレスをbase1、該ベクトルストア命
令がストアするベクトルの要素間距離をdist1、該ベク
トルストア命令がストアするベクトル要素数をlen1(le
n1≧1)とし、該ベクトルストア命令より後で実行する
ことがプログラムで指定されているベクトルロード命令
のロード開始起点アドレスをbase2、該ベクトルロード
命令がロードするベクトルの要素間距離をdist2、該ベ
クトルロード命令がロードするベクトル要素数をlen2
(len2≧1)とすると、該ベクトルストア命令によって
ストアされるアドレスの集合である(base1,base1+dis
t1×1,base1+dist1×2,……,base1+dist1×(len1−
1)}と該ベクトルロード命令によってロードされるア
ドレスの集合である{base2,base2+dist2×1,base2+d
ist2×2,…,base2+dist×(len2−1)}との交わりの
集合が空である場合のみ、該ベクトルロード命令は該ベ
クトルストア命令に先行して主記憶参照をおこなっても
よいと判定されるが、任意のbase1,dist1,len1(1en1≧
1),base2,dist2,len2(len2≧1)の組合せに対して
判定を短時間で下すのは困難である。
The method of detecting a collision of a register or a memory address, which is an input / output operand of the above-described instruction, and determining the use state of the main storage device, and deciding whether to input an instruction to the main storage processing unit regardless of the order specified by the program, Although it is applicable not only to a scalar computer but also to a vector computer, the vector computer determines whether or not multiple memory reference vector instructions may be input to the main storage processing unit in the reverse order to the order specified by the program. Have difficulty. That is, the store start address of the vector store instruction specified to be executed by the program is base1, the distance between the elements of the vector stored by the vector store instruction is dist1, and the number of vector elements stored by the vector store instruction is len1. (Le
n1 ≧ 1), the load start point address of the vector load instruction specified by the program to be executed after the vector store instruction is base2, the distance between the elements of the vector loaded by the vector load instruction is dist2, Len2 is the number of vector elements loaded by the vector load instruction
If (len2 ≧ 1), it is a set of addresses stored by the vector store instruction (base1, base1 + dis
t1 × 1, base1 + dist1 × 2, ..., base1 + dist1 × (len1−
1) A set of {} and addresses loaded by the vector load instruction {base2, base2 + dist2 × 1, base2 + d
Only when the set of intersections with ist2 × 2,..., base2 + dist × (len2-1)} is empty, it is determined that the vector load instruction may perform main memory reference prior to the vector store instruction. But any base1, dist1, len1 (1en1 ≧
1) It is difficult to make a determination in a short time for the combination of, base2, dist2, len2 (len2 ≧ 1).

そこで、単純に判定可能な場合として、先行するベク
トルストア命令で指定されたストア開始起点アドレスba
se1から該ベクトルストア命令の最終ストアアドレスで
あるbase1+dist1×(len1−1)までの間をアドレス集
合要素とする{add 1:base1≧add 1≧(base1+dist1×
(len1−1))}と、後続するベクトルロード命令で指
定されたロード開始起点アドレスbase2から該ベクトル
ロード命令の最終ストアアドレスであるbase2+(len2
−1)×dist2までの間をアドレス集合要素とする{add
2:base2≦add 2≧(base 2+dist2×(len2−1))}
との交わりの集合が空であるならば主記憶参照に関して
追い越しても構わないとする、アドレス範囲の重複を判
定する方法が考案されている。
Therefore, as a case that can be simply determined, the store start origin address ba specified by the preceding vector store instruction
An address set element from se1 to base1 + dist1 × (len1-1), which is the final store address of the vector store instruction, is set as {add 1: base1 ≧ add 1 ≧ (base1 + dist1 ×
(Len1-1))} and the final store address of the vector load instruction, base2 + (len2), from the load start address base2 specified by the subsequent vector load instruction.
-1) {add is an address set element up to × dist2
2: base2 ≦ add 2 ≧ (base 2 + dist2 × (len2-1))}
A method has been devised for judging duplication of address ranges, in which if the set of intersections with is empty, it is okay to overtake main memory references.

〔発明が解決しようとする課題〕[Problems to be solved by the invention]

上述したアドレス範囲の重複を判定する方法は比較的
簡単に実現できる反面、追越し可能かどうかを正しく判
定できる組合せも限定される。即ち、プログラムで実行
することが指定されているベクトルストア命令のストア
開始起点アドレスをbase1,該ベクトルストア命令でスト
アされる最終ベクトル要素のアドレスをlast1とし、該
ベクトルストア命令より後で実行することがプログラム
で指定されているベクトルロード命令のロード開始起点
アドレスをbase2,該ベクトルロード命令でロードされる
最終ベクトル要素のアドレスをlast2とした場合、前述
したアドレス範囲の重複を判定する方法では、base1,la
st1,base2,last2のアドレスの順序関係24通りのなか
で、高々8通り (base1≦last1≦base2≦last2) (base1≦last1≦last2≦base2) (last1≦base1≦base2≦last2) (last1≦base1≦last2≦base2) (base2≦last2≦base1≦last1) (base2≦last2≦last1≦base1) (last2≦base2≦base1≦last1) (last2≦base2≦last1≦base1) の場合しか追い越しできないという欠点を有しており、
またベクトルストア命令によるベクトルストア領域とベ
クトルロード命令によるベクトルロード領域とが重なっ
ているが、データは重なっていないことをチェックする
ためのチェック回路は、その搭載ハードウェア量および
追い越し可/不可チェック時間が無視できない。
Although the above-described method of determining the overlap of the address ranges can be realized relatively easily, the combination that can correctly determine whether or not passing is possible is also limited. That is, the store start point address of the vector store instruction specified to be executed by the program is set to base1, the address of the last vector element stored by the vector store instruction is set to last1, and execution is performed after the vector store instruction. If the load start point address of the vector load instruction specified by the program is base2, and the address of the last vector element loaded by the vector load instruction is last2, the above-described method of determining the overlap of the address range includes base1 , la
At most 8 of the 24 order relations of st1, base2, last2 (base1 ≦ last1 ≦ base2 ≦ last2) (base1 ≦ last1 ≦ last2 ≦ base2) (last1 ≦ base1 ≦ base2 ≦ last2) (last1 ≦ base1 ≤last2≤base2) (base2≤last2≤base1≤last1) (base2≤last2≤last1≤base1) (last2≤base2≤base1≤last1) (last2≤base2≤last1≤base1) And
A check circuit for checking that the vector store area by the vector store instruction and the vector load area by the vector load instruction overlap but the data does not overlap is provided by the amount of hardware mounted and the overtaking possible / impossible check time. Cannot be ignored.

本発明の目的は、ベクトルストア命令によるベクトル
ストア領域とベクトルロード命令によるベクトルロード
領域とが重なっていないが、データは重なっていること
を比較的ハードウェアが少なく短時間でチェックできる
ベクトル処理装置を提供することである。
An object of the present invention is to provide a vector processing apparatus which can check in a short time with relatively little hardware that the vector store area by the vector store instruction and the vector load area by the vector load instruction do not overlap, but the data is overlapped. To provide.

〔課題を解決するための手段〕[Means for solving the problem]

本発明のベクトル処理装置は 命令群を保持する命令保持回路と、 ベクトルストア命令のストア開始起点アドレスが命令
保持回路より格納されるストア開始起点アドレス格納レ
ジスタと、 ベクトルロード命令のロード開始起点アドレスが命令
保持回路より格納されるロード開始起点アドレス格納レ
ジスタと、 ベクトルストア命令のストア要素間距離が命令保持回
路より格納されるストア要素間距離格納レジスタと、 ベクトルロード命令のロード要素間距離が命令保持回
路より格納されるロード要素間距離格納レジスタと、 前記ストア開始起点アドレスと前記ロード開始起点ア
ドレスの差を取る減算器と、 減算器の減算結果の下位側より始めて1がでてくる第
1のビット位置を検出する下位1検出回路と、 ストア要素間距離の下位側より始めて1がでてくる第
2のビット位置を検出する下位1検出回路と、 ロード要素間距離の下位側より始めて1がでてくる第
3のビット位置を検出する下位1検出回路と、 前記3つの下位1検出回路の検出出力を入力し、第2
のビット位置および第3のビット位置がいずれも第1の
ビット位置よりも上位側のとき、命令保持回路により保
持されている命令群中のベクトルストア命令と、前記ベ
クトルストア命令よりも後から命令投入することをプロ
グラムで指定される命令保持回路により保持されている
命令群中のベクトルロード命令に関し、前記ベクトルロ
ード命令を前記ベクトルストア命令に先行して主記憶装
置に投入する比較回路を有する。
The vector processing apparatus according to the present invention includes an instruction holding circuit for holding an instruction group, a store start address storage register for storing a store start address of a vector store instruction from the instruction hold circuit, and a load start address for a vector load instruction. The load start address storage register stored by the instruction holding circuit, the distance between storage elements of the vector store instruction stored by the instruction storage circuit, and the distance between load elements of the vector load instruction are stored by the instruction A load element distance storage register stored by a circuit; a subtractor for obtaining a difference between the store start origin address and the load start origin address; a first value which is 1 starting from the lower side of the subtraction result of the subtractor; A lower 1 detection circuit for detecting a bit position; A lower 1 detection circuit that detects a second bit position where a 1 appears, a lower 1 detection circuit that detects a third bit position where a 1 starts from the lower side of the distance between load elements, and Input the detection outputs of the two lower one detection circuits, and
When both the bit position and the third bit position are higher than the first bit position, a vector store instruction in the instruction group held by the instruction holding circuit and an instruction after the vector store instruction For a vector load instruction in an instruction group held by an instruction holding circuit designated to be input by a program, a comparison circuit is provided for inputting the vector load instruction to a main storage device prior to the vector store instruction.

〔作用〕[Action]

したがって、ベクトルストア命令によるベクトルスト
ア領域とベクトルロード命令によりベクトルロード領域
とが重なっているが、データは重なっていないことをを
比較的な少ないハードウェア量で短時間でチェックでき
る。
Therefore, it can be checked in a short time with a comparatively small amount of hardware that the vector store area by the vector store instruction and the vector load area by the vector load instruction overlap but the data do not overlap.

〔実施例〕〔Example〕

次に、本発明の実施例について図面を参照して説明す
る。
Next, embodiments of the present invention will be described with reference to the drawings.

第1図は本発明の一実施例を示すベクトル処理装置の
ブロック図、第2図はベクトルストア領域とベクトルロ
ード領域とが重なっているが、データは重なっていない
ことを表わす図、第3図はストア開始起点アドレスとロ
ード開始起点アドレスの差(base1−base2)と要素間距
離(dist1またはdist2)について下位1検出を表わす図
である。
FIG. 1 is a block diagram of a vector processing apparatus showing an embodiment of the present invention, FIG. 2 is a diagram showing that a vector store area and a vector load area overlap but data do not overlap, FIG. FIG. 8 is a diagram showing the lower 1 detection for the difference (base1−base2) between the store start start address and the load start start address and the inter-element distance (dist1 or dist2).

本ベクトル処理装置は、命令群を保持する命令保持回
路1と、ベクトルストア命令のストア開始起点アドレス
base1が命令保持回路1より格納されるレジスタ2と、
ベクトルロード命令のロード開始起点アドレスbase2が
命令保持回路1より格納されるレジスタ3と、ストア開
始起点アドレスbase1とロード開始起点アドレスbase2と
の差を取る減算器6と、減算結果の下位側より始めて1
がでてくる第1のビット位置を検出する下位1検出回路
7と、ベクトルストア命令がストアするベクトルの要素
間距離dist1が命令保持回路1より格納されるレジスタ
4と、ベクトルロード命令がロードするベクトルの要素
間距離dist2が命令保持回路1より格納されるレジスタ
5と、ベクトルストア命令の要素間距離dist1の下位側
より始めて1がでてくる第2のビット位置を検出する下
位1検出回路8と、ベクトルロード命令の要素間距離di
st2の下位側より始めて1がでてくる第3のビット位置
を検出する下位1検出回路9と、前記3つの下位1検出
回路7〜9の検出出力を入力し、第2のビット位置およ
び第3のビット位置がいずれも第1のビット位置よりも
上位側のとき、命令保持回路1により保持されている命
令群中のベクトルストア命令と、前記ベクトルストア命
令よりも後から命令段入することをプログラムで指定さ
れ命令保持回路1により保持されている命令群中のベク
トルロード命令に関し、前記ベクトルロード命令を前記
ベクトルストア命令に先行して主記憶装置に投入させる
比較回路10とから構成される。
The vector processing apparatus includes an instruction holding circuit 1 for holding an instruction group, and a store start point address of a vector store instruction.
a register 2 in which base1 is stored from the instruction holding circuit 1;
A register 3 in which the load start point address base2 of the vector load instruction is stored from the instruction holding circuit 1, a subtracter 6 for taking a difference between the store start point address base1 and the load start point address base2, and a subtraction result starting from the lower side. 1
, A lower-order 1 detection circuit 7 for detecting a first bit position, a register 4 in which an inter-element distance dist1 of a vector stored by a vector store instruction is stored from an instruction holding circuit 1, and a vector load instruction to load. A register 5 in which the distance dist2 between elements of the vector is stored from the instruction holding circuit 1, and a lower one detecting circuit 8 which detects a second bit position where 1 appears from the lower side of the distance dist1 between elements of the vector store instruction. And the distance between elements of the vector load instruction di
The lower 1 detection circuit 9 for detecting the third bit position where 1 appears from the lower side of st2 and the detection outputs of the three lower 1 detection circuits 7 to 9 are input, and the second bit position and the second bit position are detected. When any of the bit positions 3 is higher than the first bit position, a vector store instruction in the instruction group held by the instruction holding circuit 1 and an instruction entering after the vector store instruction And a comparison circuit 10 for inputting the vector load instruction to the main storage device prior to the vector store instruction with respect to the vector load instruction in the instruction group specified by the program and held by the instruction holding circuit 1. .

ここで、第2図はベクトルストア領域とベクトルロー
ド領域とが重なっているがデータは重なっていないこと
を表わす図であり、ベクトルストア領域およびベクトル
ロード領域といっても実際には部分的にしかデータは存
在していない場合もある。なお、ベクトルストア領域お
よびベクトルロード領域共に主記憶装置に含まれ、ベク
トルストア領域はストア開始起点アドレスbase1より始
まり、ベクトルストア命令がストアするベクトルの要素
間距離dist1とベクトルストア領域内に含まれるベクト
ルストアデータの数であるベクトル要素数len1によって
確定し、ベクトルロード領域はロード開始起点アドレス
base2より始まり、ベクトルロード命令がロードするベ
クトルの要素間距離dist2とベクトル領域内に含まれる
ベクトルロードデータの数であるベクトル要素数len2に
よって確定するものである。
Here, FIG. 2 is a diagram showing that the vector store area and the vector load area are overlapped but the data are not overlapped. Data may not be present. Note that both the vector store area and the vector load area are included in the main storage device. The vector store area starts from the store start point address base1, and the distance between the elements dist1 of the vector stored by the vector store instruction and the vector included in the vector store area. Determined by the number of vector elements len1, which is the number of store data, and the vector load area is the load start address
Starting from base2, it is determined by the inter-element distance dist2 of the vector loaded by the vector load instruction and the number of vector elements len2 which is the number of vector load data included in the vector area.

第2図の一例としてベクトルストア領域内にベクトル
要素を4つ(len=14)含み、またベクトルロード領域
内にベクトル要素を4つ(len2=4)含んでおり、それ
ぞれのベクトルデータはある幅を持っているが、4つの
データは連続していないため、ベクトルストア領域とベ
クトルロード領域が重なっていてもデータは重なってい
ない場合もある。
As an example of FIG. 2, the vector store area contains four vector elements (len = 14), and the vector load area contains four vector elements (len2 = 4), and each vector data has a certain width. However, since the four data are not continuous, the data may not overlap even if the vector store area and the vector load area overlap.

以上第1図は、第2図のケース検出するための回路で
ある。
FIG. 1 shows a circuit for detecting the case shown in FIG.

ここで、第1図の回路の動作例として、第3図(a)
〜(d)のようにストア開始起点アドレスbase1とロー
ド開始起点アドレスbase2の差(base1−base2)と要素
間距離dist1およびdist2について下位1[L1:Lower1]
検出を行なう。第3図の結果より表1のような場合[L1
(base1−base2)<L1dist2<L1dist1]および表2のよ
うな場合[L1(base1−base2)<L1dist1<L1dist2]デ
ータは重ならないため追越可と判断され、表3のような
場合[L1(base1−base2)=L1dist2<L1dist1],表4
のような場合[L1dist2<L1(base1−base2)<L1dist
1],表5のような場合[L1dist1<L1(base1−base
2),<L1dist2]および表6のような場合[L1dist1<L
1dist2<L1(base1−base2)]データが重なる恐れがあ
るため追越不可と判断される。また、下位ビット側が表
1,表2の様なケースであれば上位ビットがいかなる値で
あっても追い越し可能,すなわちベクトルストア命令の
ストア開始起点アドレスbase1とベクトルロード命令の
ロード開始起点アドレスbase2の差がベクトルストア命
令の要素間距離dist1およびベクトルロード命令の要素
間距離dist2以上に離れていても追越可と判断される。
Here, as an operation example of the circuit of FIG. 1, FIG.
As shown in (d), the difference between the store start point address base1 and the load start point address base2 (base1−base2) and the inter-element distances dist1 and dist2 are lower 1 [L1: Lower1].
Perform detection. From the results in FIG. 3, the case shown in Table 1 [L1
(Base1−base2) <L1dist2 <L1dist1] and in the case of Table 2 [L1 (base1−base2) <L1dist1 <L1dist2] Since the data do not overlap, it is determined that passing is possible, and in the case of Table 3, [L1 ( base1-base2) = L1dist2 <L1dist1], Table 4
[L1dist2 <L1 (base1-base2) <L1dist
1], as shown in Table 5 [L1dist1 <L1 (base1-base
2), <L1dist2] and the case shown in Table 6 [L1dist1 <L
1dist2 <L1 (base1−base2)] Since data may overlap, it is determined that passing is impossible. Also, the lower bit side is displayed.
1, In the case shown in Table 2, any value of the upper bit can be overtaken, that is, the difference between the store start address base1 of the vector store instruction and the load start address base2 of the vector load instruction is equal to the vector store instruction. It is determined that overtaking is possible even if the distance is longer than the inter-element distance dist1 and the inter-element distance dist2 of the vector load instruction.

〔発明の効果〕 以上説明したように本発明は、ベクトルストア命令の
ストア開始起点アドレスとベクトルロード命令のロード
開始起点アドレスの差をとり、減算結果の下位1検出結
果(ビット位置),ベクトルストア命令の要素間距離の
下位1検出結果(ビット位置)およびベクトルロード命
令の要素間距離の下位1検出結果(ビット位置)を比較
して追い越しの可否を判定することにより、ベクトルス
トア命令によるベクトルストア領域とベクトルロード命
令によるベクトルロード領域とが重なっていて、かつベ
クトルストア命令のストア開始起点アドレスとベクトル
ロード命令のロード開始起点アドレスの差がベクトルス
トア命令の要素間距離およびベクトルロード命令の要素
間距離以上に離れていてかつベクトルストア命令の要素
間距離とベクトルロード命令の要素間距離とが等しくな
くて第2図のようなデータが重なっていないケースにお
いても比較的ハードウェア量が少なく短時間で追い越し
チェックを行なうことができ、追い越しが可能となって
ベクトル処理を高速化できる効果がある。
[Effect of the Invention] As described above, according to the present invention, the difference between the store start point address of the vector store instruction and the load start point address of the vector load instruction is obtained, and the lower one detection result (bit position) of the subtraction result, the vector store By comparing the lower 1 detection result (bit position) of the instruction inter-element distance with the lower 1 detection result (bit position) of the vector load instruction, it is determined whether or not overtaking is possible. The area overlaps with the vector load area by the vector load instruction, and the difference between the store start address of the vector store instruction and the load start address of the vector load instruction is the distance between the elements of the vector store instruction and between the elements of the vector load instruction. Distance greater than the distance and the distance between elements of the vector store instruction In the case where the separation and the distance between the elements of the vector load instruction are not equal and the data does not overlap as shown in FIG. 2, the amount of hardware is relatively small and the overtaking check can be performed in a short time. This has the effect of speeding up vector processing.

【図面の簡単な説明】[Brief description of the drawings]

第1図は本発明の一実施例を示すベクトル処理装置のブ
ロック図、第2図はベクトルストア領域とベクトルロー
ド領域とが重なっているが、データは重なっていないこ
とを表わす図、第3図はストア開始起点アドレスとロー
ド開始起点アドレスの差(base1−base2)と要素間距離
(dist1またはdist2)について下位1検出を表わす図で
ある。 1……命令保持回路、 2……ストア開始起点アドレス格納レジスタ、 3……ロード開始起点アドレス格納レジスタ、 4……ストア要素間距離格納レジスタ、 5……ロード要素間距離格納レジスタ、 6……減算器、 7〜9……下位1検出回路、 10……比較回路。
FIG. 1 is a block diagram of a vector processing apparatus showing an embodiment of the present invention, FIG. 2 is a diagram showing that a vector store area and a vector load area overlap but data do not overlap, FIG. FIG. 8 is a diagram showing the lower 1 detection for the difference (base1−base2) between the store start start address and the load start start address and the inter-element distance (dist1 or dist2). 1 ... Instruction holding circuit 2 ... Store start start address storage register 3 ... Load start start address storage register 4 ... Store element distance storage register 5 ... Load element distance storage register 6 ... Subtractor, 7-9: Lower 1 detection circuit, 10: Comparison circuit.

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】ベクトルを単位とするロード/ストアを、
主記憶装置とベクトルレジスタとの間で行なうベクトル
処理装置であって、 命令群を保持する命令保持回路と、 ベクトルストア命令のストア開始起点アドレスが命令保
持回路より格納されるストア開始起点アドレス格納レジ
スタと、 ベクトルロード命令のロード開始起点アドレスが命令保
持回路より格納されるロード開始起点アドレス格納レジ
スタと、 ベクトルストア命令のストア要素間距離が命令保持回路
より格納されるストア要素間距離格納レジスタと、 ベクトルロード命令のロード要素間距離が命令保持回路
より格納されるロード要素間距離格納レジスタと、 前記ストア開始起点アドレスと前記ロード開始起点アド
レスの差を取る減算器と、 減算器の減算結果の下位側より始めて1がでてくる第1
のビット位置を検出する下位1検出回路と、 ストア要素間距離の下位側より始めて1がでてくる第2
のビット位置を検出する下位1検出回路と、 ロード要素間距離の下位側より始めて1がでてくる第3
のビット位置を検出する下位1検出回路と、 前記3つの下位1検出回路の検出出力を入力し、第2の
ビット位置および第3のビット位置がいずれも第1のビ
ット位置よりも上位側のとき、命令保持回路により保持
されている命令群中のベクトルストア命令と、前記ベク
トルストア命令よりも後から命令投入することをプログ
ラムで指定され命令保持回路により保持されている命令
群中のベクトルロード命令に関し、前記ベクトルロード
命令を前記ベクトルストア命令に先行して主記憶装置に
投入させる比較回路を有することを特徴とするベクトル
処理装置。
1. A load / store in units of a vector,
A vector processing device between a main storage device and a vector register, comprising: an instruction holding circuit for holding an instruction group; and a store start start address storage register for storing a store start start address of a vector store instruction from the instruction holding circuit. A load start address storage register in which the load start address of the vector load instruction is stored from the instruction holding circuit; a store element distance storage register in which the distance between store elements of the vector store instruction is stored from the instruction holding circuit; A load element distance storage register in which a distance between load elements of a vector load instruction is stored by an instruction holding circuit; a subtractor that calculates a difference between the store start point address and the load start point address; The first one comes out from the side
A lower 1 detection circuit for detecting the bit position of
A lower 1 detection circuit for detecting the bit position of
A lower one detection circuit for detecting the bit position of the first bit position, and a detection output of the three lower one detection circuits, wherein both the second bit position and the third bit position are higher than the first bit position. At this time, the vector store instruction in the instruction group held by the instruction holding circuit and the instruction to input an instruction after the vector store instruction are specified by a program, and the vector load in the instruction group held by the instruction hold circuit is performed. A vector processing device, comprising: a comparison circuit for inputting the vector load instruction to the main storage device prior to the vector store instruction.
JP31187690A 1990-11-16 1990-11-16 Vector processing equipment Expired - Fee Related JP2636076B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP31187690A JP2636076B2 (en) 1990-11-16 1990-11-16 Vector processing equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP31187690A JP2636076B2 (en) 1990-11-16 1990-11-16 Vector processing equipment

Publications (2)

Publication Number Publication Date
JPH04182778A JPH04182778A (en) 1992-06-30
JP2636076B2 true JP2636076B2 (en) 1997-07-30

Family

ID=18022477

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31187690A Expired - Fee Related JP2636076B2 (en) 1990-11-16 1990-11-16 Vector processing equipment

Country Status (1)

Country Link
JP (1) JP2636076B2 (en)

Also Published As

Publication number Publication date
JPH04182778A (en) 1992-06-30

Similar Documents

Publication Publication Date Title
JP5573134B2 (en) Vector computer and instruction control method for vector computer
JP6879072B2 (en) Processing methods, programs, information processing equipment, and image processing equipment
JPH0752390B2 (en) Instruction processor
CN114913593B (en) Gesture tracking method, gesture tracking device, terminal equipment and computer readable storage medium
US9589176B1 (en) Analyzing integral images with respect to HAAR features
JP2636076B2 (en) Vector processing equipment
JP2636075B2 (en) Vector processing equipment
US5457645A (en) Pattern recognition system including a circuit for detecting maximum or minimum data elements which determines the standard pattern closest to the input pattern
CN118521772A (en) Three-dimensional detection frame processing method, system, device and medium for target detection
JP2920968B2 (en) Instruction processing order control method
JP2558952B2 (en) Fixed-point digital signal processor
CN111783584B (en) Image target detection method, device, electronic equipment and readable storage medium
JPS635795B2 (en)
JP3310316B2 (en) Arithmetic unit
JPS62100878A (en) Hidden surface processing device
JPS6270971A (en) Histogram calculator
JPH01271876A (en) Comparison arithmetic processor
JP3009152B2 (en) Image processing device
JPH06139071A (en) Parallel computer
CN120822502A (en) Method, device, equipment and storage medium for editing table of electronic whiteboard
JPS61184684A (en) Information processor
JPH0546385A (en) Register interference control circuit
JPH0812662B2 (en) Instruction processing order control method
JPH04316127A (en) Information processor
JPS62145469A (en) Vector instruction processor

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees