Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JPH07117915B2 - Cache memory system - Google Patents
[go: Go Back, main page]

JPH07117915B2 - Cache memory system - Google Patents

Cache memory system

Info

Publication number
JPH07117915B2
JPH07117915B2 JP5051757A JP5175793A JPH07117915B2 JP H07117915 B2 JPH07117915 B2 JP H07117915B2 JP 5051757 A JP5051757 A JP 5051757A JP 5175793 A JP5175793 A JP 5175793A JP H07117915 B2 JPH07117915 B2 JP H07117915B2
Authority
JP
Japan
Prior art keywords
memory
cache memory
data
register
tag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP5051757A
Other languages
Japanese (ja)
Other versions
JPH0675856A (en
Inventor
徹 佐々木
清隆 笹井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP5051757A priority Critical patent/JPH07117915B2/en
Publication of JPH0675856A publication Critical patent/JPH0675856A/en
Publication of JPH07117915B2 publication Critical patent/JPH07117915B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Static Random-Access Memory (AREA)
  • Memory System Of A Hierarchy Structure (AREA)
  • Dram (AREA)

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】この発明は、主記憶とプロセッサ
との間に位置して主記憶のアクセス時間とプロセッサの
サイクルタイムとの時間差を調整するキャッシュメモリ
システムに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a cache memory system which is located between a main memory and a processor and adjusts the time difference between the access time of the main memory and the cycle time of the processor.

【0002】[0002]

【従来の技術】近年、マイクロプロセッサ(MPU)搭
載のシステムにおいて、キャッシュメモリシステムが導
入されはじめている。キャッシュメモリを内蔵したMP
Uは、そのキャッシュメモリがスタティック型のRAM
(以下「SRAM」と呼ぶ)で構成されたものと、ダイ
ナミック型のRAM(以下「DRAM」と呼ぶ)で構成
されたものとがある。
2. Description of the Related Art In recent years, cache memory systems have begun to be introduced in systems equipped with a microprocessor (MPU). MP with built-in cache memory
U is a static RAM whose cache memory is
Some of them are composed of (hereinafter referred to as “SRAM”) and some are composed of dynamic RAM (hereinafter referred to as “DRAM”).

【0003】SRAMは、その代表的なセルとして、図
14に示すようなCMOS6Tr (トランジスタ)型
と、図15に示すようなE/R型のものがあげられる。
Typical examples of the SRAM are a CMOS 6Tr (transistor) type as shown in FIG. 14 and an E / R type as shown in FIG.

【0004】CMOS6Tr 型セルは、(MOSからな
る2個のインバ―タ回路1をたすき掛け接続したフリッ
プフロップ回路と、このフリップフロップ回路とデ―タ
線(ビット線)との接続/分離をワ―ド線の電位に応じ
て行なう2個のトランスファゲ―ト3から構成されてい
る。
The CMOS 6Tr type cell is a flip-flop circuit in which two inverter circuits 1 each composed of a MOS are stacked and connected, and a connection / separation between this flip-flop circuit and a data line (bit line) is performed. -It is composed of two transfer gates 3 that operate according to the potential of the ground line.

【0005】E/R型セルは、エンハンスメント型の2
個のNチャンネルMOS型FET(以下「NMOS」と
呼ぶ)5とこのNMOS5の負荷となる抵抗7とからな
るフリップフロップ回路と、2個のトランスファゲ―ト
3から構成されている。このE/R型セルは、抵抗7を
比抵抗の高いポリシリコンで形成して、抵抗7の占有面
積を小さくしているため、スタティック型のセルの中に
あっては高集積化、高速化に適している。
The E / R type cell is an enhancement type cell 2.
It is composed of a flip-flop circuit composed of N-channel MOS type FETs (hereinafter referred to as "NMOS") 5 and a resistor 7 serving as a load of the NMOS 5, and two transfer gates 3. In this E / R type cell, the resistor 7 is formed of polysilicon having a high specific resistance and the area occupied by the resistor 7 is made small. Therefore, the static type cell has high integration and high speed. Suitable for

【0006】一方、DRAMは、その代表的なセルとし
て、図16に示す4Tr (トランジスタ)型と、図17
に示す1Tr (トランジスタ)キャパシタンス型のもの
があげられる。
On the other hand, the DRAM has a typical 4Tr (transistor) type shown in FIG.
The 1Tr (transistor) capacitance type shown in FIG.

【0007】4Tr 型セルは、図15に示したE/R型
セルのそれぞれの抵抗7を削除した形のものである。こ
のような構成では、2本のデ―タ線を相補的に用いるた
め、比較的高速に動作させることが可能となる。
The 4Tr type cell has a configuration in which the resistors 7 of the E / R type cell shown in FIG. 15 are removed. In such a configuration, since the two data lines are used complementarily, it is possible to operate at a relatively high speed.

【0008】1Tr キャパシタンス型セルは、蓄積容量
9とトランスファゲ―ト3を直列に接続して構成され
て、1本のデ―タ線に接続されている。したがって、こ
の1Tr キャパシタンス型セルは、必要最小限の素子と
信号線で構成され、高集積化に最も適している。
The 1Tr capacitance type cell is constructed by connecting a storage capacitor 9 and a transfer gate 3 in series, and is connected to one data line. Therefore, this 1Tr capacitance type cell is composed of minimum necessary elements and signal lines, and is most suitable for high integration.

【0009】このようなセルが、それぞれ対応してSR
AM、DRAMに用いらており、それぞれのセルの特性
を比較すると、図18に示すようになる。
Such cells correspond to SRs, respectively.
It is used in AM and DRAM, and the characteristics of the respective cells are compared as shown in FIG.

【0010】図18を参照して、6Tr 型のSRAM
は、E/R型SRAMに比べて、専有面積が著しく大き
くなる。このため、大容量のメモリには不向きである。
したがって、以下、SRAMはE/R型のSRAMを指
すものとする。
Referring to FIG. 18, a 6Tr type SRAM
Has a significantly larger occupied area than the E / R type SRAM. Therefore, it is not suitable for a large capacity memory.
Therefore, hereinafter, the SRAM refers to an E / R type SRAM.

【0011】4Tr DRAMは、製造プロセスが単純で
アクセス時間も小さく専有面積はE/R型のSRAMと
ほぼ同等である。しかしながら、ダイナミック型である
ためにリフレッシュ動作が必要となる。このため、シス
テム構成が複雑となり、E/R型SRAMに比べて使い
難い。また、専有面積では、同様にリフレッシュ動作を
必要とする1Tr DRAMに比べて大きくなり、高集積
化にとって不利となる。したがって、以下、DRAMは
1Tr 型DRAMを指すものとする。
The 4Tr DRAM has a simple manufacturing process and a small access time, and its occupied area is almost the same as that of the E / R type SRAM. However, the dynamic type requires a refresh operation. For this reason, the system configuration becomes complicated and is difficult to use as compared with the E / R type SRAM. Further, the occupied area is larger than that of the 1Tr DRAM which similarly requires the refresh operation, which is disadvantageous for high integration. Therefore, the DRAM is hereinafter referred to as a 1Tr type DRAM.

【0012】一方、SRAMとDRAMのそれぞれのセ
ルを比較してみると、図19に示すように、SRAM
は、アクセス時間がDRAMに比べて2〜3倍程度高速
となるが、専有面積はDRAMに比べて5〜10倍程度
大きくなる。
On the other hand, comparing the cells of the SRAM and the DRAM, as shown in FIG.
The access time is about 2 to 3 times faster than that of DRAM, but the occupied area is about 5 to 10 times larger than that of DRAM.

【0013】[0013]

【発明が解決しようとする課題】このように、キャシュ
メモリを内蔵したMPUは、キャッシュメモリのセルが
前述したSRAMあるいはDRAMの一方でのみ構成さ
れていた。
As described above, in the MPU having the built-in cache memory, the cells of the cache memory are constituted by only one of the SRAM or DRAM described above.

【0014】例えば、キャッシュメモリをSRAMでの
み構成した場合には、高速なアクセス時間によりデ―タ
処理を高速に行なうことが可能となる。その反面、同一
の専有面積ではDRAMに比べて容量が少なくなる。こ
れにより、キャッシュメモリのヒット率が低下して、主
記憶へのアクセス頻度が増加する。したがって、処理効
率を低下させるという問題が生じていた。
For example, when the cache memory is composed only of SRAM, the data processing can be performed at high speed due to the fast access time. On the other hand, in the same area, the capacity is smaller than that of DRAM. This reduces the hit rate of the cache memory and increases the frequency of access to the main memory. Therefore, there is a problem that the processing efficiency is lowered.

【0015】一方、キャッシュメモリをDRAMでのみ
構成した場合には、大容量化が可能となり、ヒット率を
高めることができるようになる。その反面、アクセス時
間がSRAMに比べて長くなる。このため、キャッシュ
メモリに格納されている命令やオペランドデ―タの読出
しに時間がかかり、それぞれの命令の処理時間が長くな
るという問題があった。
On the other hand, when the cache memory is composed only of DRAM, the capacity can be increased and the hit rate can be increased. On the other hand, the access time becomes longer than that of SRAM. Therefore, there is a problem in that it takes time to read the instructions and operand data stored in the cache memory, and the processing time of each instruction becomes long.

【0016】そこで、この発明は、上記に鑑みてなされ
たものであり、その目的とするところは、SRAMとD
RAMを混用して、構成の大型化を招くことなく、大容
量化ならびに高速化を達成し、プロセッサの大型化を招
くことなく、プロセッサの処理効率及び処理時間の向上
に寄与することができるキャッシュメモリシステムを提
供することにある。
Therefore, the present invention has been made in view of the above, and an object of the present invention is to provide an SRAM and a D.
A cache that mixes RAM and achieves large capacity and high speed without increasing the size of the configuration, and contributes to improvement in processing efficiency and processing time of the processor without increasing size of the processor. To provide a memory system.

【0017】[0017]

【課題を解決するための手段】上記目的を達成するため
に、請求項1記載の発明は、主記憶に格納されている情
報の部分集合及びこれに対応するタグアドレスを保持す
るDRAM(ダイナミック型のランダム・アクセス・メ
モリ)からなる第1のキャッシュメモリと、SRAM
(スタティック型のランダム・アクセス・メモリ)から
なり前記第1のキャッシュメモリに保持された情報の部
分集合を保持するデータメモリ部及びSRAMからなり
前記データメモリ部に保持された情報に対応したタグア
ドレスを保持するタグメモリ部を備えてなるメモリステ
ージと、前記データメモリ部に保持された情報をアクセ
スするアクセスアドレスを保持する第1のレジスタと、
前記タグメモリ部から読み出されたタグメモリを保持す
る第2のレジスタと、前記データメモリ部から読み出さ
れた情報を保持する第3のレジスタと、前記第1のレジ
スタに保持されたアクセスアドレスの一部と前記第2の
レジスタに保持されたタグアドレスとを比較して、両者
が一致した時にヒット信号を出力し不一致の時にミス信
号を出力する比較器、及び前記第1のレジスタに保持さ
れたアクセスアドレスの一部にしたがって第3のレジス
タに保持された情報の一部を選択し、選択した情報を前
記第1のキャッシメモリに与えるセレクタ、及び前記比
較器の比較結果を受けて、比較結果に応じて前記主記憶
にデータをアクセス制御する制御ロジックを備えてなる
ロードステージとからなり、前記メモリステージ及び前
記ロードステージと前記第1、第2及び第3のレジスタ
がパイプライン方式により動作してなる第2のキャッシ
ュメモリとから構成される。
In order to achieve the above object, the invention according to claim 1 is a DRAM (dynamic type) which holds a subset of information stored in a main memory and a tag address corresponding to the subset. Random access memory), a first cache memory, and an SRAM
A tag address corresponding to the information held in the data memory unit, which is made up of a static memory type random access memory and holds a subset of the information held in the first cache memory and an SRAM A memory stage that includes a tag memory unit that holds, a first register that holds an access address for accessing the information held in the data memory unit,
A second register holding the tag memory read from the tag memory unit, a third register holding the information read from the data memory unit, and an access address held in the first register And a tag address held in the second register, and outputs a hit signal when the two match and a miss signal when the two do not match, and held in the first register A part of the information held in the third register according to a part of the access address that has been selected, and a selector that gives the selected information to the first cache memory; and a comparison result of the comparator, A load stage having a control logic for controlling data access to the main memory according to a comparison result, the memory stage and the load stage The first, constituted by a second cache memory in which the second and third registers are operated by pipelining.

【0018】[0018]

【作用】上記構成において、この発明は、キャッシュメ
モリシステムにおける階層化を図り、構成の大型化を招
くことなく、第1のキャッシュメモリの大容量化ならび
に第2のキャッシュメモリをパイプライン構造として高
速化を達成するようにしている。
In the above structure, according to the present invention, the cache memory system is hierarchized, and the first cache memory has a large capacity and the second cache memory has a pipeline structure at a high speed without increasing the size of the structure. I try to achieve this.

【0019】[0019]

【実施例】以下、図面を用いてこの発明の実施例を説明
する。
Embodiments of the present invention will be described below with reference to the drawings.

【0020】まず、この発明の実施例を説明する前に、
この発明に関連した参考例のキャッシュメモリシステム
の構成を図1〜図7を用いて説明する。
First, before explaining an embodiment of the present invention,
The configuration of a cache memory system of a reference example related to the present invention will be described with reference to FIGS.

【0021】この参考例に示すキャッシュメモリシステ
ム11は、図2に示すように、MPU(マイクロプロセ
ッサ)13とともに1チップ化されたものである。
As shown in FIG. 2, the cache memory system 11 shown in this reference example is integrated with an MPU (microprocessor) 13 into one chip.

【0022】この参考例を説明する前に、キャッシュメ
モリについて簡単に説明する。
Before describing this reference example, the cache memory will be briefly described.

【0023】キャッシュメモリは、プロセッサと主記憶
との間に置かれた高速なメモリであり、主記憶の情報の
部分集合が格納されてアクセスされるものである。した
がって、アクセス頻度の高い情報がキャッシュメモリに
格納されてヒット率が高くなると、キャッシュメモリの
効果が発揮される。
The cache memory is a high-speed memory placed between the processor and the main memory, and a subset of the information in the main memory is stored and accessed. Therefore, when the frequently accessed information is stored in the cache memory and the hit rate becomes high, the effect of the cache memory is exerted.

【0024】このようなキャッシュメモリシステムは、
図1に示すように、主記憶(図示せず)に格納されてい
る情報の部分集合を格納保持するデ―タメモリ部15
と、部分集合の各情報に対応したタグアドレスを格納保
持するタグメモリ部17とのそれぞれ機能が異なる2つ
のモジュ―ルを備えている。
Such a cache memory system is
As shown in FIG. 1, a data memory unit 15 that stores and holds a subset of information stored in a main memory (not shown).
And a tag memory unit 17 that stores and holds a tag address corresponding to each piece of information of the subset, and two modules having different functions.

【0025】この参考例のキャッシュメモリシステは、
タグメモリ部17がSRAMで構成され、デ―タメモリ
部15がDRAMで構成されている。これらのタグメモ
リ部17及びデ―タメモリ部15は、32ビットのアド
レス空間(a0〜a31)に対応したものであり、16バイト
のブロック長で256エントリ―のダイレクトマッピン
グ方式で構成されている。
The cache memory system of this reference example is
The tag memory unit 17 is composed of SRAM, and the data memory unit 15 is composed of DRAM. The tag memory unit 17 and the data memory unit 15 correspond to a 32-bit address space (a0 to a31), and have a block length of 16 bytes and a direct mapping method of 256 entries.

【0026】このようなキャッシュメモリシステムは、
タグメモリ部17とデ―タメモリ部15がキャッシュメ
モリシステムに与えられる32ビットのアドレス(a0〜
a31)の内8ビットのアドレス(a20 〜a27)によりアクセ
スされる。このアドレスによりタグメモリ部17から読
出された20ビットのアドレスは、比較器19により3
2ビットのアドレスの内20ビットのアドレス(a0〜a1
9)と比較される。
Such a cache memory system is
The tag memory unit 17 and the data memory unit 15 are provided with 32-bit addresses (a0 ...
It is accessed by an 8-bit address (a20 to a27) of a31). The 20-bit address read from the tag memory unit 17 by this address is 3 by the comparator 19.
20-bit address (a0-a1) of 2-bit address
Compared with 9).

【0027】比較結果において、両アドレスが一致した
ならば、タグメモリ部17から読出されたアドレス(図
1中に斜線で示す)に対応してデ―タメモリ部15から
読出された16バイトのデ―タ(図1中に斜線で示す)
が、所望のデ―タであることが確認されて、ヒット信号
が比較器19から制御ロジック21に与えられる。これ
により、ヒットしたことを示す状態信号が制御ロジック
21からMPUに与えられる。デ―タメモリ部15から
読出された16バイトのデ―タは、32ビットのアドレ
スのうち4ビットのアドレス(a28 〜a31)にしたがって
セレクタ23により1バイトのデ―タに選択されて、M
PUに与えられる。このような、読出し動作のタイミン
グを図3に示す。
If both addresses match in the comparison result, the 16-byte data read from the data memory unit 15 corresponding to the address read from the tag memory unit 17 (shown by hatching in FIG. 1). -Ta (shown with diagonal lines in Figure 1)
Is confirmed to be the desired data, the hit signal is given from the comparator 19 to the control logic 21. As a result, a status signal indicating a hit is given from the control logic 21 to the MPU. The 16-byte data read from the data memory unit 15 is selected as 1-byte data by the selector 23 according to the 4-bit address (a28 to a31) of the 32-bit address, and M
Given to PU. The timing of such a read operation is shown in FIG.

【0028】一方、両アドレスが一致していない場合に
は、デ―タメモリ部15から読出されたデ―タが所望の
デ―タでないことを示すミス信号が比較器19から制御
ロジック21に出力される。これにより、制御ロジック
21は主記憶に対してデ―タメモリ部15に格納されて
いない所望のデ―タをアクセスする。
On the other hand, if the two addresses do not match, the comparator 19 outputs to the control logic 21 a miss signal indicating that the data read from the data memory section 15 is not the desired data. To be done. As a result, the control logic 21 accesses the main memory for desired data that is not stored in the data memory unit 15.

【0029】このように、ヒット信号及びミス信号は、
読出そうとする所望のデ―タがデ―タメモリ部15に格
納されているか否かを示す信号となる。ゆえに、ヒット
信号が出力されるか、あるいはミス信号が出力されるか
で、デ―タメモリ部15からのデ―タの読出し動作以降
の動作が異なる。このため、ヒット信号及びミス信号
は、高速化が要求される。ヒット信号及びミス信号の出
力を高速にするためには、タグメモリ部17のアドレス
出力を高速にする必要がある。したがって、タグメモリ
部17の高速化が要求される。
As described above, the hit signal and the miss signal are
It serves as a signal indicating whether or not the desired data to be read is stored in the data memory section 15. Therefore, the operation after the data read operation from the data memory unit 15 is different depending on whether the hit signal or the miss signal is output. Therefore, the hit signal and the miss signal are required to be speeded up. In order to output the hit signal and the miss signal at high speed, it is necessary to speed up the address output of the tag memory unit 17. Therefore, speeding up of the tag memory unit 17 is required.

【0030】一方、デ―タメモリ部15とタグメモリ部
17の容量は以下に示すようになる。デ―タメモリ部
128ビット/エントリ×256エントリ=32780
ビット タグメモリ部 20ビット/エントリ×256エント
リ=5120ビット このように、デ―タメモリ部15はタグメモリ部17の
6倍以上の容量が必要となる。しかしながら、デ―タメ
モリ部15はタグメモリ部17に比べて高速性は要求さ
れない。
On the other hand, the capacities of the data memory unit 15 and the tag memory unit 17 are as follows. Data memory section
128 bits / entry × 256 entries = 32780
Bit tag memory unit 20 bits / entry × 256 entries = 5120 bits As described above, the data memory unit 15 needs to have a capacity six times or more that of the tag memory unit 17. However, the data memory unit 15 is not required to have high speed as compared with the tag memory unit 17.

【0031】したがって、この参考例は、デ―タメモリ
部15をDRAMで構成し、タグメモリ部17をSRA
Mで構成しているので、専有面積の大型化を招くことな
く、上述したデ―タメモリ部15の大容量化と、タグメ
モリ部17の高速化を達成することが可能となる。この
結果、デ―タ処理を効率良くかつ高速に行なうことがで
きるようになる。
Therefore, in this reference example, the data memory unit 15 is composed of DRAM and the tag memory unit 17 is SRA.
Since it is composed of M, it is possible to achieve the above-mentioned increase in capacity of the data memory unit 15 and increase in speed of the tag memory unit 17 without increasing the occupied area. As a result, data processing can be performed efficiently and at high speed.

【0032】図4に示す参考例は、セパレ―トキャッシ
ュメモリシステムの最適化を図ったものである。セパレ
―トキャッシュメモリシステムは、キャッシュメモリを
命令キャッシュとデ―タキャッシュの2つの部分に分割
して、それぞれ命令用として機械語命令を保持し、デ―
タ用としてメモリオペランドを保持するようにした方式
である。
The reference example shown in FIG. 4 is for optimizing a separate cache memory system. The separate cache memory system divides the cache memory into two parts, an instruction cache and a data cache, and holds a machine language instruction for each instruction and
It is a system that holds memory operands for data.

【0033】このセパレ―トキャッシュメモリシステム
の利点は、MPUの命令フェッチとオペランドアクセス
が1つのデ―タバス上で競合することがないので、MP
Uを円滑に動作させることができることにある。さら
に、MPUの命令キャッシュメモリへのアクセスとデ―
タキャッシュメモリへのアクセスとの特徴の違いによ
り、それぞれの最適化が可能となる。
The advantage of this separate cache memory system is that the MPU instruction fetch and operand access do not conflict on one data bus.
It is to be able to operate U smoothly. In addition, access to the instruction cache memory of the MPU and data
Each of them can be optimized due to the difference in characteristics from the access to the cache memory.

【0034】ここで、ノイマン型のコンピュ―タにあっ
ては、命令を1ステップずつ処理してプログラムを実行
するようにしているので、命令は連続したアドレスで順
次フェッチされる頻度が高い。一方、メモリオペランド
は、予め決められた順序でアクセスされる頻度が低い。
このことに着目して、この参考例では、図4に示すよう
に、セパレ―ト化されたキャッシュメモリシステムにあ
って、その命令キャッシュメモリ31をDRAMで構成
し、デ―タキャッシュメモリ33をSRAMで構成し
て、MPU35とともに1チップ化するようにした。
Here, in the Neumann type computer, since the instruction is processed step by step to execute the program, the instruction is frequently fetched sequentially at consecutive addresses. On the other hand, the memory operands are rarely accessed in a predetermined order.
With this in mind, in this reference example, as shown in FIG. 4, in a separate cache memory system, the instruction cache memory 31 is composed of DRAM, and the data cache memory 33 is It is composed of SRAM so that it can be integrated into one chip together with the MPU 35.

【0035】命令キャッシュメモリ31は、図5に示す
ように構成されている。図5において、タグメモリ部3
7から読出されるアドレスA,Bは、どちらか一方がセ
レクタ39により選択されて、MPUから与えられるア
ドレスと比較器41で比較され、比較結果に応じてヒッ
ト信号あるいはミス信号が出力される。
The instruction cache memory 31 is constructed as shown in FIG. In FIG. 5, the tag memory unit 3
Either one of the addresses A and B read from 7 is selected by the selector 39 and compared with the address given by the MPU by the comparator 41, and a hit signal or a miss signal is output according to the comparison result.

【0036】一方、デ―タメモリ部43は、連続したア
ドレスがシ―ケンシャルにアクセスされることが多いの
で、ブロックサイズを大きくして、格納された命令をス
タティックカラムモ―ドのアクセス方式により読出すよ
うにしている。
On the other hand, since the data memory unit 43 is often accessed sequentially at consecutive addresses, the block size is increased and the stored instruction is read by the static column mode access method. I'm trying to put it out.

【0037】このスタティックカラムモ―ドは、セルの
デ―タ線(ビット線)の電位を任意のクロック期間だけ
一定にする方式である。このモ―ドでは、はじめに読出
し動作が行なわれると、列(ロウ)アドレスをアクセス
している間は、読出し動作を行なうことなく行(カラ
ム)アドレスを変化させるだけで、デ―タが読出され
る。
This static column mode is a system in which the potential of the data line (bit line) of the cell is kept constant for an arbitrary clock period. In this mode, when a read operation is first performed, while the column (row) address is being accessed, the data is read only by changing the row (column) address without performing the read operation. It

【0038】デ―タメモリ部43から読出された4組の
命令a0、a1,b0,b1は、その1つがセレクタ45によっ
て選択されて、命令デコ―ダ47に与えられデコ―ドさ
れる。図6は、タグメモリ部37とデ―タメモリ部43
の読出しタイミングを示している。
Of the four sets of instructions a0, a1, b0, b1 read from the data memory unit 43, one of them is selected by the selector 45 and given to the instruction decoder 47 to be decoded. FIG. 6 shows a tag memory unit 37 and a data memory unit 43.
The read timing of is shown.

【0039】このように、命令をデ―タメモリ部43か
らスタティックカラムモ―ドによりアクセスすること
で、DRAMでありながらアクセス時間を高速にするこ
とが可能となる。さらに、DRAMで構成されているた
めに大容量化が可能となる。
As described above, by accessing the instruction from the data memory unit 43 by the static column mode, the access time can be shortened even though it is a DRAM. Further, since it is composed of DRAM, it is possible to increase the capacity.

【0040】一方、デ―タキャッシュメモリ33は、図
7に示すように構成されている。図7において、デ―タ
メモリ部49から読出されたオペランドデ―タは、デ―
タの右シフト等の位置調整や符号拡張がデ―タ位置調整
回路51及び符号拡張回路53によって行なわれて、演
算ユニット55に与えられる。
On the other hand, the data cache memory 33 is constructed as shown in FIG. In FIG. 7, the operand data read from the data memory section 49 is the data.
Position adjustment such as right shift of data and code extension are performed by the data position adjustment circuit 51 and the code extension circuit 53, and given to the arithmetic unit 55.

【0041】このような動作をパイプライン処理で行な
う場合には、パイプラインの段数を少なくするために、
デ―タの位置調整や符号拡張等の処理を含めて1サイク
ルで高速に実行しなければならない。また、オペランド
デ―タの読出し動作は、MPUのクロックサイクルに同
期させなければならないので、高速性が要求される。そ
こで、デ―タキャッシュメモリをSRAMで構成するこ
とにより、オペランドデ―タの高速アクセスが可能にな
る。このように、この参考例では、命令キャッシュメモ
リとデ―タキャッシュメモリの最適化を図っているの
で、専有面積の大型化を招くことなく、大容量化とデ―
タ処理の高速化が可能となる。
When such an operation is performed by pipeline processing, in order to reduce the number of stages of the pipeline,
It must be executed at high speed in one cycle including processing such as data position adjustment and code extension. Further, since the read operation of the operand data must be synchronized with the clock cycle of the MPU, high speed is required. Therefore, by configuring the data cache memory with SRAM, high-speed access of operand data becomes possible. As described above, in this reference example, since the instruction cache memory and the data cache memory are optimized, the capacity and the data are increased without increasing the occupied area.
The processing speed can be increased.

【0042】次に、請求項1記載の発明の一実施例を図
8を参照して説明する。
Next, an embodiment of the invention described in claim 1 will be described with reference to FIG.

【0043】この実施例は、階層化されたキャッシュメ
モリシステムにおける構成を最適化したものである。
This embodiment is an optimization of the structure in a hierarchical cache memory system.

【0044】キャッシュメモリシステムにおいて、MP
Uと主記憶との間のアクセスギャップが大きい場合に
は、キャッシュメモリ自体を階層に分けることが考えら
れる。そこで、この実施例に示すキャッシュメモリシス
テムは、図8に示すように、第1キャッシュメモリ61
と第2キャッシュメモリ63とに分割して、1チップ化
したものである。
In the cache memory system, MP
When the access gap between U and the main memory is large, it is possible to divide the cache memory itself into hierarchies. Therefore, as shown in FIG. 8, the cache memory system shown in this embodiment has the first cache memory 61.
And the second cache memory 63 are divided into one chip.

【0045】第2キャッシュメモリ63は、MPUが直
接アクセスするキャッシュメモリであり、MPUのクロ
ックサイクルに同期してアクセスできるように、高速性
が要求される。このため、第2キャッシュメモリ63
は、図9に示すように構成されており、タグメモリ部6
5とデ―タメモリ部67とがSRAMで構成されてい
る。さらに、タグメモリ部65とデ―タメモリ部67を
メモリステ―ジとし、比較器69と制御ロシック71及
びセレクタ73をロ―ドステ―ジとし、これらのステ―
ジ間に両ステ―ジ間を入出力する情報を一時的に保持す
るレジスタ75,77,79を設けて、パイプライン構
造としている。なお、第2キャッシュメモリ63は、3
2ビットのアドレス空間に対応したものであり、4バイ
トのブロックサイズで64エントリ―のダイレクトマッ
ピング方式である。
The second cache memory 63 is a cache memory directly accessed by the MPU and is required to have high speed so that it can be accessed in synchronization with the clock cycle of the MPU. Therefore, the second cache memory 63
Is configured as shown in FIG. 9, and the tag memory unit 6
5 and the data memory unit 67 are composed of SRAM. Further, the tag memory unit 65 and the data memory unit 67 are used as memory stages, and the comparator 69, the control Rossic 71 and the selector 73 are used as load stages.
Registers 75, 77 and 79 for temporarily holding information input / output between both stages are provided between the stages to form a pipeline structure. The second cache memory 63 has 3
This is a direct mapping method corresponding to a 2-bit address space and having a block size of 4 bytes and 64 entries.

【0046】このような構造にあって、読出し動作は図
10に示すようにパイプライン処理によって行なわれ
る。したがって、第2キャッシュメモリ63は、そのタ
グメモリ部65とデ―タメモリ部67をSRAMで構成
して、パイプライン構造をとることによって、高速アク
セスが可能となる。
In such a structure, the read operation is performed by pipeline processing as shown in FIG. Therefore, in the second cache memory 63, the tag memory unit 65 and the data memory unit 67 are composed of SRAM, and the pipeline structure is adopted, so that high-speed access is possible.

【0047】一方、第1キャッシュメモリ61は、第2
キャッシュメモリ63のエントリ―に所望のデ―タが格
納されていない場合にアクセスされる。このアクセスに
おいても所望のデ―タが第1キャッシュメモリ61に格
納されていない場合には、第1キャッシュメモリ61は
主記憶に対してアクセスを行なう。このため、第1キャ
ッシュメモリ61には、ヒット率を高めて、主記憶への
アクセス頻度を小さくすることが要求される。
On the other hand, the first cache memory 61 is
It is accessed when desired data is not stored in the entry of the cache memory 63. Even in this access, if the desired data is not stored in the first cache memory 61, the first cache memory 61 accesses the main memory. Therefore, the first cache memory 61 is required to have a high hit rate and a low access frequency to the main memory.

【0048】そこで、この実施例は、32ビットのアド
レス空間に対応して、64バイトのブロックサイズで1
28エントリ―のダイレクトマッピング方式で、第11
図に示すように構成された第1キャッシュメモリにおい
て、タグメモリ部81とデ―タメモリ部83をDRAM
で構成するようにしている。これにより、タグメモリ部
81とデ―タメモリ部83を大容量化して、ヒット率を
高めることが可能となる。
Therefore, according to this embodiment, a block size of 64 bytes corresponds to 1 in a 32-bit address space.
The 28-entry direct mapping method, the 11th
In the first cache memory configured as shown in the figure, the tag memory unit 81 and the data memory unit 83 are DRAM.
I am trying to configure it. As a result, it is possible to increase the capacity of the tag memory unit 81 and the data memory unit 83 and increase the hit rate.

【0049】さらに、第1キャッシュメモリ61は、パ
イプライン構造をとらず、主記憶の比較的低速なメモリ
サイクルと同期して、図12に示すようなタイミングで
エントリ―の更新を行なうようにしている。これによ
り、構成を簡単にすることができる。
Further, the first cache memory 61 does not have a pipeline structure and is adapted to update the entry at the timing shown in FIG. 12 in synchronization with the relatively slow memory cycle of the main memory. There is. This can simplify the configuration.

【0050】また、第1キャッシュメモリ61から第2
キャッシュメモリ63へのデ―タの転送は、前述したス
タティックカラムモ―ド等のDRAMの高速アクセスモ
―ドを用いることにより、高速に転送を行なうことが可
能となる。
The first cache memory 61 to the second cache memory 61
The data can be transferred to the cache memory 63 at high speed by using the high-speed access mode of the DRAM such as the static column mode described above.

【0051】したがって、第1キャッシュメモリ61を
DRAMで構成し、第2キャッシュメモリ63をSRA
Mで構成し、かつパイプライン構造にすることによっ
て、高速にデ―タ処理が可能な階層化されたキャッシュ
メモリシステムを実現することができる。
Therefore, the first cache memory 61 is composed of DRAM, and the second cache memory 63 is SRA.
By using M and a pipeline structure, a hierarchical cache memory system capable of high-speed data processing can be realized.

【0052】なお、このような階層化されたキャッシュ
メモリシステムは、図13に示すようにMPU85と一
体化して1チップ化するようにしてもよい。
Note that such a hierarchical cache memory system may be integrated with the MPU 85 into one chip as shown in FIG.

【0053】[0053]

【発明の効果】以上説明したように、この発明によれ
ば、キャッシュメモリシステムを階層化して、第1のキ
ャッシュメモリをDRAMで構成し、第2のキャッシュ
メモリをSRAMで構成し、かつパイプライン構造とし
たので、構成の大型化を招くことなく、アクセス速度を
高速化することが可能となる。これにより、プロセッサ
における処理効率及び処理速度の向上に寄与するキャッ
シュメモリシステムを提供することができる。
As described above, according to the present invention, the cache memory system is hierarchized, the first cache memory is composed of DRAM, the second cache memory is composed of SRAM, and the pipeline is used. Since the structure is adopted, the access speed can be increased without increasing the size of the structure. As a result, it is possible to provide a cache memory system that contributes to improvement in processing efficiency and processing speed in the processor.

【図面の簡単な説明】[Brief description of drawings]

【図1】この発明に関連した参考例に係るキャッシュメ
モリシステムの構成を示す図である。
FIG. 1 is a diagram showing a configuration of a cache memory system according to a reference example related to the present invention.

【図2】この発明に関連した参考例に係るキャッシュメ
モリシステムの構成を示す図である。
FIG. 2 is a diagram showing a configuration of a cache memory system according to a reference example related to the present invention.

【図3】図1に示すシステムの動作タイミングを示す図
である。
FIG. 3 is a diagram showing an operation timing of the system shown in FIG.

【図4】この発明に関連した参考例に係るキャッシュメ
モリシステムの構成を示す図である。
FIG. 4 is a diagram showing a configuration of a cache memory system according to a reference example related to the present invention.

【図5】この発明に関連した参考例に係るキャッシュメ
モリシステムの構成を示す図である。
FIG. 5 is a diagram showing a configuration of a cache memory system according to a reference example related to the present invention.

【図6】図4に示すシステムの動作例を示す図である。FIG. 6 is a diagram showing an operation example of the system shown in FIG.

【図7】この発明に関連した参考例に係るキャッシュメ
モリシステムの構成を示す図である。
FIG. 7 is a diagram showing a configuration of a cache memory system according to a reference example related to the present invention.

【図8】この発明の一実施例に係るキャッシュメモリシ
ステムの構成を示す図である。
FIG. 8 is a diagram showing a configuration of a cache memory system according to an embodiment of the present invention.

【図9】この発明の一実施例に係るキャッシュメモリシ
ステムの構成を示す図である。
FIG. 9 is a diagram showing a configuration of a cache memory system according to an embodiment of the present invention.

【図10】図9に示すシステムのパイプライン動作のタ
イミングを示す図である。
10 is a diagram showing a timing of pipeline operation of the system shown in FIG.

【図11】この発明の一実施例に係るキャッシュメモリ
システムの構成を示す図である。
FIG. 11 is a diagram showing a configuration of a cache memory system according to an embodiment of the present invention.

【図12】図11に示すシステムの更新のタイミングを
示す図である。
FIG. 12 is a diagram showing a timing of updating the system shown in FIG. 11.

【図13】図8に示すシステムの1チップ化を示す図で
ある。
FIG. 13 is a diagram showing one system of the system shown in FIG.

【図14】従来のメモリセルの構成を示す図である。FIG. 14 is a diagram showing a configuration of a conventional memory cell.

【図15】従来のメモリセルの構成を示す図である。FIG. 15 is a diagram showing a configuration of a conventional memory cell.

【図16】従来のメモリセルの構成を示す図である。FIG. 16 is a diagram showing a configuration of a conventional memory cell.

【図17】従来のメモリセルの構成を示す図である。FIG. 17 is a diagram showing a configuration of a conventional memory cell.

【図18】図14〜図17に示すメモリセルの特性比較
を示す図である。
FIG. 18 is a diagram showing a characteristic comparison of the memory cells shown in FIGS. 14 to 17;

【図19】図14〜図17に示すメモリセルの特性比較
を示す図である。
FIG. 19 is a diagram showing a characteristic comparison of the memory cells shown in FIGS.

【符号の説明】[Explanation of symbols]

11 キャッシュメモリシステム 13 MPU(マイクロプロセッサ) 15 デ―タメモリ部 17 タグメモリ部 31 命令キャッシュメモリ 33 デ―タキャッシュメモリ 61 第1キャッシュメモリ 63 第2キャッシュメモリ 11 cache memory system 13 MPU (microprocessor) 15 data memory unit 17 tag memory unit 31 instruction cache memory 33 data cache memory 61 first cache memory 63 second cache memory

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 主記憶に格納されている情報の部分集合
及びこれに対応するタグアドレスを保持するDRAM
(ダイナミック型のランダム・アクセス・メモリ)から
なる第1のキャッシュメモリと、 SRAM(スタティック型のランダム・アクセス・メモ
リ)からなり前記第1のキャッシュメモリに保持された
情報の部分集合を保持するデータメモリ部及びSRAM
からなり前記データメモリ部に保持された情報に対応し
たタグアドレスを保持するタグメモリ部を備えてなるメ
モリステージと、前記データメモリ部に保持された情報
をアクセスするアクセスアドレスを保持する第1のレジ
スタと、前記タグメモリ部から読み出されたタグメモリ
を保持する第2のレジスタと、前記データメモリ部から
読み出された情報を保持する第3のレジスタと、前記第
1のレジスタに保持されたアクセスアドレスの一部と前
記第2のレジスタに保持されたタグアドレスとを比較し
て、両者が一致した時にヒット信号を出力し不一致の時
にミス信号を出力する比較器、及び前記第1のレジスタ
に保持されたアクセスアドレスの一部にしたがって第3
のレジスタに保持された情報の一部を選択し、選択した
情報を前記第1のキャッシメモリに与えるセレクタ、及
び前記比較器の比較結果を受けて、比較結果に応じて前
記主記憶にデータをアクセス制御する制御ロジックを備
えてなるロードステージとからなり、前記メモリステー
ジ及び前記ロードステージと前記第1、第2及び第3の
レジスタがパイプライン方式により動作してなる第2の
キャッシュメモリとを有することを特徴とするキャッシ
ュメモリシステム。
1. A DRAM holding a subset of information stored in a main memory and a tag address corresponding to the subset.
A first cache memory composed of (dynamic random access memory), and data containing SRAM (static random access memory) holding a subset of information held in the first cache memory Memory part and SRAM
A memory stage having a tag memory unit for holding a tag address corresponding to the information held in the data memory unit; and a first memory stage holding an access address for accessing the information held in the data memory unit. A register, a second register that holds the tag memory read from the tag memory unit, a third register that holds the information read from the data memory unit, and a first register that holds the information. A part of the access address stored in the second register is compared with the tag address held in the second register, and a hit signal is output when the two match, and a miss signal is output when the two do not match; and the first comparator. According to a part of the access address held in the register, the third
Selecting a part of the information held in the register, and receiving the comparison result of the selector and the comparator which gives the selected information to the first cache memory, and stores the data in the main memory according to the comparison result. A load stage having a control logic for access control, the memory stage and the load stage, and a second cache memory in which the first, second and third registers operate in a pipeline manner. A cache memory system having.
JP5051757A 1993-03-12 1993-03-12 Cache memory system Expired - Fee Related JPH07117915B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5051757A JPH07117915B2 (en) 1993-03-12 1993-03-12 Cache memory system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5051757A JPH07117915B2 (en) 1993-03-12 1993-03-12 Cache memory system

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP63156796A Division JPH027141A (en) 1988-06-27 1988-06-27 Cache memory system

Publications (2)

Publication Number Publication Date
JPH0675856A JPH0675856A (en) 1994-03-18
JPH07117915B2 true JPH07117915B2 (en) 1995-12-18

Family

ID=12895821

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5051757A Expired - Fee Related JPH07117915B2 (en) 1993-03-12 1993-03-12 Cache memory system

Country Status (1)

Country Link
JP (1) JPH07117915B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3173728B2 (en) * 1998-12-07 2001-06-04 日本電気株式会社 Semiconductor device
KR100596821B1 (en) 2003-12-22 2006-07-03 주식회사 하이닉스반도체 Memory devices that support multiprocessor functionality

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0156307A3 (en) * 1984-03-30 1988-04-20 Four-Phase Systems Inc. Pipelined processor having dual cache memories
US4755930A (en) * 1985-06-27 1988-07-05 Encore Computer Corporation Hierarchical cache memory system and method
JPS6398749A (en) * 1986-10-16 1988-04-30 Mitsubishi Electric Corp Data processor

Also Published As

Publication number Publication date
JPH0675856A (en) 1994-03-18

Similar Documents

Publication Publication Date Title
US6125433A (en) Method of accomplishing a least-recently-used replacement scheme using ripple counters
US5319763A (en) Data processor with concurrent static and dynamic masking of operand information and method therefor
US5953738A (en) DRAM with integral SRAM and arithmetic-logic units
JP3715714B2 (en) Low power memory system
JP2003501747A (en) Programmable SRAM and DRAM cache interface
US3768080A (en) Device for address translation
JPH03147152A (en) Memory system and data storage accessing
US7483283B2 (en) Apparatus for efficient streaming data access on reconfigurable hardware and method for automatic generation thereof
EP1269323A2 (en) Multi-tiered memory bank having different data buffer sizes with a programmable bank select
US5130692A (en) Improved data comparator for comparing plural-bit data at higher speed
US6834024B2 (en) Reduced size multi-port register cell
JP2559382B2 (en) Information processing device
EP0327950B1 (en) Address modification circuit
JPH07117915B2 (en) Cache memory system
JPH0362243A (en) Device that speeds up memory access in information processing systems
JPH0855471A (en) Synchronous semiconductor memory device
JPH027141A (en) Cache memory system
KR0184633B1 (en) Cfiucore
US5606709A (en) Register group circuit for data processing system
KR100517765B1 (en) Cache memory and control method thereof
US6862242B2 (en) SRAM control circuit with a power saving function
US4628450A (en) Data processing system having a local memory which does not use a directory device with distributed resident programs and a method therefor
JP2517154B2 (en) Data processing device
JP3930195B2 (en) Data processing system
JP2003015952A (en) Data write circuit

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees