JP7489249B2 - DATABASE SYSTEM, DATA DISTRIBUTION MANAGEMENT DEVICE, AND DATA DISTRIBUTION MANAGEMENT METHOD - Google Patents
DATABASE SYSTEM, DATA DISTRIBUTION MANAGEMENT DEVICE, AND DATA DISTRIBUTION MANAGEMENT METHOD Download PDFInfo
- Publication number
- JP7489249B2 JP7489249B2 JP2020121596A JP2020121596A JP7489249B2 JP 7489249 B2 JP7489249 B2 JP 7489249B2 JP 2020121596 A JP2020121596 A JP 2020121596A JP 2020121596 A JP2020121596 A JP 2020121596A JP 7489249 B2 JP7489249 B2 JP 7489249B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- deployment
- deployed
- node
- catalog
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、データベースシステム、データ配備管理装置およびデータ配備管理方法に関する。 The present invention relates to a database system, a data deployment management device, and a data deployment management method.
従来、データベースにおけるデータの配置に関し、特願2019-511705号(特許文献1)に記載の技術がある。この公報には、「コンピュータデータベースが実装された方法であって、前記方法は、テーブルのためのテーブルデータを複数のパーティションに記憶することであって、各パーティションが前記テーブルのための前記テーブルデータの一部を含み、前記パーティションは前記テーブル内の1つ以上の属性に基づいて少なくとも部分的にクラスタリングされることと、前記テーブルへの変更に基づいて1つ以上の新規パーティションを作成することであって、前記1つ以上の新規パーティションの少なくとも1つが互いに又は先のパーティションと重複して前記テーブルのクラスタリングの度合いの低下を招くことと、前記テーブルデータのクラスタリングの度合いがクラスタリング閾値を下回っていることを判別することと、クラスタリングの前記度合いが前記クラスタリング閾値を下回ったことを判別すること、ユーザからの明示的なユーザコマンド、及び/又はDMLコマンドの一部の1つ以上に応答して、前記テーブルの1つ以上のパーティションを再クラスタリングして前記テーブルのクラスタリングの前記度合いを改善することと、ことを備える」という記載がある。 ...
特許文献1によれば、クラスタリングの度合いがクラスタリング閾値を下回ったことを判別し、ユーザからの明示的なユーザコマンド、及び/又はDMLコマンドの一部の1つ以上に応答して、上記テーブルの1つ以上のパーティションを再クラスタリングして上記テーブルのクラスタリングの度合いを改善することができる。しかし、適切なクラスタリングを行うためにはユーザがキーを指定する必要があり、性能を出すためには専門的なスキルが必要となる。
According to
そこで、本発明では、ユーザのスキルに依存することなく、良好な性能を実現するデータベースの物理設計を行うことを目的とする。 The present invention aims to provide a physical design for a database that achieves good performance without relying on the user's skills.
上記目的を達成するために、代表的な本発明のデータベースシステムの一つは、データの所在を示すデータカタログを管理するカタログ管理サーバと、ストレージノードと、分散データベースを形成する1つ以上の計算ノードと、前記ストレージノードに格納されたデータの一部を前記計算ノードに保持させるデータ配備を管理する管理ノードと備え、前記管理ノードは、前記データ配備を求める配備要求を受け付けた場合に、前記データカタログから情報を取得し、取得した情報に基づいて配備すべきデータである配備対象データをいずれの計算ノードに保持させるかを決定することで、前記分散データベースの物理設計を行う。
また、代表的な本発明のデータ配備管理装置の一つは、ストレージノードに格納されたデータの一部を複製し、分散データベースを形成する1つ以上の計算ノードに保持させるデータ配備を管理するデータ配備管理装置であって、前記データ配備を求める配備要求を受け付ける配備要求受付部と、前記配備要求を受け付けた場合に、データの所在を示すデータカタログから情報を取得するカタログ情報取得部と、前記データカタログから取得した情報に基づいて、配備すべきデータである配備対象データをいずれの計算ノードに保持させるかを決定することで、前記分散データベースの物理設計を行う物理設計処理部とを備える。
また、代表的な本発明のデータ配備管理方法の一つは、ストレージノードに格納されたデータの一部を複製し、分散データベースを形成する1つ以上の計算ノードに保持させるデータ配備を管理するデータ配備管理方法であって、プロセッサが、前記データ配備を求める配備要求を受け付ける配備要求受付ステップと、前記配備要求を受け付けた場合に、データの所在を示すデータカタログから情報を取得するカタログ情報取得ステップと、前記データカタログから取得した情報に基づいて、配備すべきデータである配備対象データをいずれの計算ノードに保持させるかを決定することで、前記分散データベースの物理設計を行う物理設計処理ステップとを行う。
In order to achieve the above-mentioned objective, one representative database system of the present invention comprises a catalog management server that manages a data catalog indicating the location of data, a storage node, one or more computing nodes that form a distributed database, and a management node that manages data deployment by causing the computing nodes to retain a portion of the data stored in the storage nodes, and when the management node receives a deployment request for the data deployment, it retrieves information from the data catalog and determines, based on the retrieved information, which computing node should retain the deployment target data, which is the data to be deployed, thereby performing a physical design of the distributed database.
Furthermore, one representative data deployment management device of the present invention is a data deployment management device that manages data deployment by replicating a portion of data stored in a storage node and storing it on one or more computing nodes that form a distributed database, and includes a deployment request receiving unit that receives a deployment request for the data deployment, a catalog information acquisition unit that, when the deployment request is received, acquires information from a data catalog that indicates the location of the data, and a physical design processing unit that performs physical design of the distributed database by determining, based on the information acquired from the data catalog, which computing node should store deployment target data, which is the data to be deployed.
Furthermore, one representative data deployment management method of the present invention is a data deployment management method that manages data deployment by replicating a portion of data stored in a storage node and storing the replicated data in one or more computing nodes that form a distributed database, and includes a deployment request receiving step in which a processor receives a deployment request for the data deployment, a catalog information acquisition step in which, upon receiving the deployment request, information is acquired from a data catalog indicating the location of the data, and a physical design processing step in which a physical design of the distributed database is performed by determining, based on the information acquired from the data catalog, in which computing node the deployment target data, which is the data to be deployed, should be stored.
本発明によれば、良好な性能を実現するデータベースの物理設計を行うことができる。上記した以外の課題、構成及び効果は以下の実施の形態の説明により明らかにされる。 The present invention makes it possible to carry out a physical design of a database that achieves good performance. Problems, configurations, and advantages other than those mentioned above will become clear from the description of the embodiment below.
以下、本発明の実施形態について、図面を参照して説明する。なお、以下に説明する実施形態は特許請求の範囲に係る発明を限定するものではなく、また実施形態の中で説明されている諸要素及びその組み合わせの全てが発明の解決手段に必須であるとは限らない。 The following describes an embodiment of the present invention with reference to the drawings. Note that the embodiment described below does not limit the invention as claimed, and not all of the elements and combinations thereof described in the embodiment are necessarily essential to the solution of the invention.
以下の説明において、「xxxテーブル」といった表現により、入力に対して出力が得られる情報を説明することがあるが、この情報は、どのような構造のデータでもよい。従って、「xxxテーブル」を「xxx情報」と言うことができる。 In the following explanation, information that produces an output for an input may be described using expressions such as "xxx table," but this information may be data of any structure. Therefore, a "xxx table" can also be called "xxx information."
また、以下の説明において、各テーブルの構成は一例であり、1つのテーブルは、2以上のテーブルに分割されてもよいし、2以上のテーブルの全部又は一部が1つのテーブルであってもよい。 In addition, in the following description, the configuration of each table is an example, and one table may be divided into two or more tables, or all or part of two or more tables may be one table.
また、以下の説明において、「プログラム」を主語として処理を説明する場合があるが、プログラムは、プロセッサ部によって実行されることで、定められた処理を、適宜に記憶部及び/又はインターフェイス部などを用いながら行うため、処理の主語が、プロセッサ部(或いは、そのプロセッサ部を有するコントローラのようなデバイス)とされてもよい。 In the following explanation, the processing may be described with the "program" as the subject, but since the program is executed by the processor unit to perform the specified processing while appropriately using the memory unit and/or interface unit, the subject of the processing may be the processor unit (or a device such as a controller that has the processor unit).
プログラムは、計算機のような装置にインストールされてもよいし、例えば、プログラム配布サーバ又は計算機が読み取り可能な(例えば非一時的な)記録媒体にあってもよい。また、以下の説明において、2以上のプログラムが1つのプログラムとして実現されてもよいし、1つのプログラムが2以上のプログラムとして実現されてもよい。 The program may be installed on a device such as a computer, or may be, for example, on a program distribution server or a computer-readable (e.g., non-transitory) recording medium. In addition, in the following description, two or more programs may be realized as one program, and one program may be realized as two or more programs.
また、「プロセッサ部」は、1又は複数のプロセッサである。プロセッサは、典型的には、CPU(Central Processing Unit)のようなマイクロプロセッサであるが、GPU(Graphics Processing Unit)のような他種のプロセッサでもよい。また、プロセッサは、シングルコアでもよいしマルチコアでもよい。また、プロセッサは、処理の一部又は全部を行うハードウェア回路(例えばFPGA(Field-Programmable Gate Array)又はASIC(Application Specific Integrated Circuit))といった広義のプロセッサでもよい。 The "processor unit" is one or more processors. The processor is typically a microprocessor such as a CPU (Central Processing Unit), but may be other types of processors such as a GPU (Graphics Processing Unit). The processor may be a single-core or multi-core processor. The processor may also be a processor in the broader sense, such as a hardware circuit that performs part or all of the processing (for example, an FPGA (Field-Programmable Gate Array) or an ASIC (Application Specific Integrated Circuit)).
また、以下の説明において、種々の対象の識別情報として、識別番号が使用されるが、識別番号以外の種類の識別情報(例えば、英字や符号を含んだ識別子)が採用されてもよい。 In addition, in the following description, identification numbers are used as identification information for various objects, but other types of identification information (e.g., identifiers including letters or codes) may also be used.
また、以下の説明において、同種の要素を区別しないで説明する場合には、参照符号(又は、参照符号のうちの共通符号)を使用し、同種の要素を区別して説明する場合は、要素の識別番号(又は参照符号)を使用することがある。 In the following description, when elements of the same type are described without distinction, reference signs (or common signs among reference signs) are used, and when elements of the same type are described with distinction, the identification numbers (or reference signs) of the elements are used.
図1は、実施例に係るデータベースシステムについての説明図である。図1に示すデータベースシステムは、管理ノード10、カタログ管理サーバ20、ストレージノード31および分散データベース40を有する。
Figure 1 is an explanatory diagram of a database system according to an embodiment. The database system shown in Figure 1 has a
分散データベース40は、DBMS(database management system)管理ノード41と1つ以上の計算ノード42を含んで形成される。計算ノード42は、データベースを備えたキャッシュ付き計算ノードであり、ストレージノード31に格納されたデータの一部を保持することができる。
The
カタログ管理サーバ20は、データカタログ21の保持と管理を行うサーバである。データカタログ21は、ストレージノード31と計算ノード42が保持するデータに関するメタデータである。詳細については後述するが、データカタログ21は、少なくともデータの所在を示す。
The
管理ノード10は、ストレージノード31に格納されたデータの一部を計算ノード42に保持させるデータ配備を管理する。具体的には、管理ノード10は、データ配備を求める配備要求を受け付けると(1)、データカタログ21の情報を取得する(2)。管理ノード10は、取得した情報に基づいて配備すべきデータである配備対象データをいずれの計算ノード42に保持させるかを決定することで、分散データベース40の物理設計を行う(3)。すなわち、管理ノード10は、既存のデータの所在に基づいて、分散データベース40が良好な性能を実現するよう配備要求によって示された配備対象データの配備先を決定する。
The
図2は、管理ノード10の構成を示す構成図である。図2に示すように管理ノード10は、CPU(Central Processing Unit)11、メモリ12、記憶部13、入出力部14、通信部15を有する。
Figure 2 is a configuration diagram showing the configuration of the
入出力部14は、ディスプレイやキーボードなどのユーザインターフェイスである。通信部15は、カタログ管理サーバ20や分散データベース40と通信する通信インターフェイスである。
The input/
記憶部13は、ハードディスクドライブやフラッシュメモリなどで構成される補助記憶装置である。CPU11は、配備要求受付部12a、カタログ情報取得部12bおよび物理設計処理部12cとして機能するプログラムを記憶部13から読み出し、主記憶装置としてのメモリ12に展開して実行する。
The
配備要求受付部12aは、入出力部14や通信部15を介して配備要求を受け付ける処理部である。カタログ情報取得部12bは、通信部15を介してデータカタログ21の情報を取得する処理部である。物理設計処理部12cは、取得した情報に基づいて配備対象データをいずれの計算ノード42に保持させるかを決定することで、分散データベース40の物理設計を行う処理部である。
The deployment
図3および図4は、データベースシステムの構成例である。図3では、管理ノード10、カタログ管理サーバ20、ストレージノード31および分散データベース40が所定のネットワークを介して接続されている。また、分散データベース40の内部では、DBMS41と複数の計算ノード42がネットワークによって接続されている。
Figures 3 and 4 show examples of database system configurations. In Figure 3, a
分散データベース40のユーザは、例えば医療研究者である。医療研究者は、カタログ管理サーバ20のデータカタログ21を参照して、使用したいデータを運用管理者に伝える。運用管理者は、医療研究者の要望に基づいて配備要求を生成し、管理ノード10に入力することで、医療研究者の要望を満たすデータを配備した分散データベースを構築する。このとき、分散データベースの性能を向上するためのデータの分散方式は、管理ノード10が決定するため、運用管理者がデータの配置を指定する必要はない。
A user of the distributed
図4では、管理ノード10、カタログ管理サーバ20、ストレージネットワーク30、複数の分散データベース40が所定のネットワークを介して接続されている。ストレージネットワーク30は、複数のストレージノード31をネットワークで接続して形成され、仮想的な1のストレージとして機能する。
In FIG. 4, a
複数の分散データベース40は、それぞれDBMS41と複数の計算ノード42を含んで形成される。複数の分散データベース40は、異なるユーザに対して個別に構築されたものであり、独立に使用される。このように、本実施例のデータベースシステムは、複数の分散データベースを含んだシステムとして実施可能である。
The multiple distributed
図4においても、図3と同様に、分散データベース40のユーザは、例えば医療研究者である。医療研究者は、カタログ管理サーバ20のデータカタログ21を参照して、使用したいデータを運用管理者に伝える。運用管理者は、医療研究者の要望に基づいて配備要求を生成し、管理ノード10に入力することで、医療研究者の要望を満たすデータを配備した分散データベースを構築する。運用管理者がデータの配置を指定する必要はない点も図3と同様である。
In FIG. 4, as in FIG. 3, the user of the distributed
次に、管理ノード10による物理設計について説明する。管理ノード10は、分散データベースにおいて生ずる各種のボトルネックを回避するようにデータを配置する。分散データベースに生ずるボトルネックには、計算ノードの入出力処理量、計算ノード間のデータ転送量、計算ノード間の処理量の偏り、データの重複などがある。
Next, the physical design by the
図5は、計算ノードの入出力処理量についての説明図である。図5に示すように、データがソートされずに記憶領域に格納されると、データを検索する範囲が広がり、入出力処理量が増加する。図5では、計算ノードC1が保持する診療表(SI)からid値が「1」のデータを検索する場合を示しているが、どのブロックにもid値が「1」のデータが存在する可能性があるため、全てのブロックをリードする必要がある。 Figure 5 is an explanatory diagram of the input/output processing volume of a computation node. As shown in Figure 5, when data is stored in a memory area without being sorted, the range of data searched for becomes wider, and the input/output processing volume increases. Figure 5 shows a case where data with an id value of "1" is searched for from the medical record (SI) held by computation node C1, but since data with an id value of "1" may exist in any block, it is necessary to read all blocks.
図6は、計算ノードの入出力処理量を削減するデータ配置の説明図である。図6では、検索キーとなる項目でクラスタリングした状態でデータが格納されている。このため、例えば、診療表(SI)からid値が「1」のデータを検索する場合には、ブロック1のみをリードすればよい。このように、列値のクラスタリングを指定することにより計算ノードの入出力処理量を削減可能である。 Figure 6 is an explanatory diagram of a data arrangement that reduces the amount of input/output processing on a computing node. In Figure 6, data is stored in a clustered state based on the search key item. For this reason, for example, when searching for data with an id value of "1" from the medical record (SI), only block 1 needs to be read. In this way, by specifying clustering of column values, it is possible to reduce the amount of input/output processing on a computing node.
図7は、計算ノード間のデータ転送量についての説明図である。計算ノード42は、複数のデータを結合して使用する場合がある。このとき、結合されるデータが異なる計算ノード42に記憶されていると、結合時に他の計算ノード42にデータを転送する必要が生じ、性能低下の原因となる。図7では、傷病表(SY)と医薬品表(IY)をid列で結合して用いているが、計算ノードC1~C3は自身が結合して用いるデータを揃えておらず、他の計算ノードから転送を受けており、データ転送によって性能が低下する。
Figure 7 is an explanatory diagram of the amount of data transferred between calculation nodes. A
図8は、計算ノード間のデータ転送量を削減するデータ配置の説明図である。図8では、結合されるデータを同じノードに配置するように指定することにより、計算ノード間のデータ転送量を削減している。具体的には、図7と同様に、傷病表(SY)と医薬品表(IY)をid列で結合して用いるが、計算ノードC1~C3は自身が結合して用いるデータを揃えているため、他の計算ノードから転送を受ける必要がない。このように、結合されるデータを同じノードに配置するデータの分散方式を、便宜上、「結合列によるクラスタリング」という。 Figure 8 is an explanatory diagram of data placement that reduces the amount of data transferred between computation nodes. In Figure 8, the amount of data transferred between computation nodes is reduced by specifying that the data to be joined be placed on the same node. Specifically, as in Figure 7, the injury table (SY) and medicine table (IY) are used by joining them using the ID column, but since computation nodes C1 to C3 themselves have the data they will use for joining, they do not need to receive data transferred from other computation nodes. For convenience, this data distribution method in which joined data is placed on the same node is called "clustering by join column".
図9は、計算ノード間の処理量の偏りについての説明図である。まず、計算ノード間でデータ量が偏っていると、性能低下の原因となる。また、全計算ノードから参照されるマスタ表が一つの計算ノードにしか格納されていないと、計算ノード間で通信が生じ性能低下の原因となる。 Figure 9 is an explanatory diagram of the imbalance in processing volume between computing nodes. First, if the amount of data is uneven between computing nodes, it will cause a decrease in performance. Also, if the master table referenced by all computing nodes is stored only in one computing node, communication will occur between the computing nodes, causing a decrease in performance.
図9では、診療表(SI)と診療マスタ(M)とを結合して用いる場合を示している。ここで、計算ノードC1が計算ノードC2~C3よりも多くの診療表(SI)を保持していると、データ量が多い計算ノードC1の処理に時間がかかる。また、計算ノードC3が診療マスタ(M)を保持しており、全ての計算ノードC1~C3がマスタのある計算ノードC3にアクセスするため、マスタがある計算ノードC3の負荷が高まるとともに、通信の発生により処理の遅延を招く。 Figure 9 shows a case where the medical records (SI) and the medical master (M) are used in combination. Here, if the computing node C1 holds more medical records (SI) than the computing nodes C2 to C3, it will take a long time to process the computing node C1, which has a large amount of data. In addition, since the computing node C3 holds the medical master (M) and all the computing nodes C1 to C3 access the computing node C3 where the master is located, the load on the computing node C3 where the master is located increases and communication occurs, resulting in processing delays.
図10は、計算ノード間の処理量の偏りを低減するデータ配置の説明図である。図10では、マスタを全ての計算ノードC1~C3に配置し、また履歴表をラウンドロビン等を用いて計算ノード間でできるだけ均等になるような配置を指定することにより、計算ノード間の処理量の偏りを低減している。 Figure 10 is an explanatory diagram of data placement that reduces the bias in the amount of processing between the computing nodes. In Figure 10, the master is placed on all computing nodes C1 to C3, and the history table is placed as evenly as possible between the computing nodes using a round robin method or the like, thereby reducing the bias in the amount of processing between the computing nodes.
マスタを全ての計算ノードに配置するデータの分散方式を、便宜上、「全ノードに複製」という。また、ラウンドロビンを用いて計算ノード間でできるだけ均等になるよう配置データの分散方式を、便宜上、「ラウンドロビン」という。 For convenience, the data distribution method in which the master is placed on all computing nodes is called "replicate to all nodes." Also, for convenience, the data distribution method in which the data is placed as evenly as possible among computing nodes using round robin is called "round robin."
図11は、データの重複についての説明図である。既に計算ノードに配置されているデータの一部を含むデータの配備要求時に、配備要求があった全データを再度配備すると無駄なデータ転送および容量の重複が生じる。 Figure 11 is an explanatory diagram of data duplication. When a deployment request is made for data that includes some data that has already been deployed to a computing node, deploying all of the requested data again would result in unnecessary data transfer and capacity duplication.
図11では、医療研修者U1用に、診療表(SI)のid=1~20が既に配備されている。このうち、診療表(SI)のid=1~10は計算ノードC1に保持され、診療表(SI)のid=11~20は計算ノードC2に保持されている。 In FIG. 11, medical chart (SI) ids = 1 to 20 have already been deployed for medical trainee U1. Of these, medical chart (SI) ids = 1 to 10 are stored in computing node C1, and medical chart (SI) ids = 11 to 20 are stored in computing node C2.
この状態で、医療研究者U2が診療表(SI)のid=11~30の配備を要求した場合に、その全てを配備すると、診療表(SI)のid=11~20が重複し、そのデータ転送を容量は無駄となる。 In this state, if medical researcher U2 requests deployment of SI ids = 11 to 30, deploying all of them will result in duplicate SI ids = 11 to 20, and the capacity will be wasted by transferring that data.
図12は、データの重複を避けるデータ配置の説明図である。データの重複を避けるため、管理ノード10は、適切な分散方法で計算ノードにデータが配備されているかどうかを確認する。そして、適切な分散方法でデータが配備されている場合は不足部分のみを配備する。データは配備されているが分散方法が異なる場合は要求されたデータを全て配備する。
Figure 12 is an explanatory diagram of data placement that avoids data duplication. To avoid data duplication, the
図12では、医療研究者U1用に配備済みのデータのうち、診療表(SI)のid=11~20を医療研究者U2にも使用可能とし、不足分である診療表(SI)のid=21~30を計算ノードC1と計算ノードC2に振り分けて配置している。
In Figure 12, of the data already deployed for medical researcher U1,
図13は、データの具体例についての説明図である。図13に示した入力情報は、配備要求として入力された情報の一例である。配備要求の入力情報としては、データ名やデータ使用方法が用いられる。 Figure 13 is an explanatory diagram of a specific example of data. The input information shown in Figure 13 is an example of information input as a deployment request. The input information for a deployment request may include the data name and the data usage method.
データ名は、ストレージノード31や計算ノード42に格納されたデータを名称で指定するものである。計算ノード42に格納されたデータを指定する場合には、結合によって生成された結合データや抽出によって生成された抽出データを指定することも可能である。
The data name is used to specify the name of the data stored in the
データ使用方法は、データの結合や抽出を求めるものである。データの結合を求める場合には、生成する結合データの名称、結合に用いるデータであるソースデータ、結合条件、配備先、ユーザなどを指定する。データの抽出を求める場合には、抽出結果である抽出データの名称、抽出元であるソースデータ、抽出条件、配備先、ユーザなどを指定する。 A data usage method requests data merging or extraction. When requesting data merging, you specify the name of the merged data to be generated, the source data to be used in the merge, the merge conditions, the deployment destination, the user, etc. When requesting data extraction, you specify the name of the extracted data that is the extraction result, the source data from which it was extracted, the extraction conditions, the deployment destination, the user, etc.
図13では、「使用方法:傷病_医薬品(SY_IY)= 結合(傷病レセ(SY),医薬品レセ(IY),結合条件:SY.id=IY.id),配備先=C3,4,user=U1」と「使用方法:診療レセ(SI)(id=11‐30)=抽出(診療レセ(SI),抽出条件:11<=id<=30), 配備先=C1,2,user=U3」を入力情報として示している。 In Figure 13, the input information is shown as "Usage: Injury/Illness_Medicine (SY_IY) = Combine (Injury/Illness claim (SY), Medicine claim (IY), Combine condition: SY.id = IY.id), Destination = C3, 4, User = U1" and "Usage: Medical claim (SI) (id = 11-30) = Extract (Medical claim (SI), Extract condition: 11 <= id <= 30), Destination = C1, 2, User = U3".
また、図13に示すように、データカタログには、データ一覧@ストレージノード、配備済みデータ@計算ノード、リネージ情報、データのアクセス権などが含まれる。データ一覧@ストレージノードは、ストレージノード31に格納されたデータの名称と種別を示す。種別は、基礎情報である「マスタ」やトランザクションデータに対応する「履歴」などである。配備済みデータ@計算ノードは、計算ノード42に格納されたデータの名称、配置先、分散方法を示す。
As shown in FIG. 13, the data catalog includes data list@storage node, deployed data@computation node, lineage information, data access rights, etc. The data list@storage node indicates the name and type of data stored in the
リネージ情報は、結合データや抽出データの由来を示すデータであり、データ名、ソースデータ、結合列、抽出条件などの項目を有する。データのアクセス権は、データの名称にアクセス権のあるユーザを対応付けたデータである。このアクセス権に関する情報は、アクセス権を管理するサーバを別途設けて管理してもよい。 Lineage information is data that indicates the origin of joined data and extracted data, and includes items such as data name, source data, joined columns, and extraction conditions. Data access rights are data that associates the name of data with users who have access rights. Information regarding this access right may be managed by a separate server that manages access rights.
図14は、管理ノード10の処理手順を示すフローチャートである。まず、配備要求受付部12aは、入出力部14や通信部15を介して配備要求を受け付ける(ステップS101)。物理設計処理部12cは、配備要求に示された配備対象データの分散方式を決定する(ステップS102)。その後、物理設計処理部12cは、配備対象データが配備済みであるか、すなわち、既存のデータと重複部分があるか否かを判定する(ステップS103)。
Figure 14 is a flowchart showing the processing procedure of the
配備対象データが配備済みであれば(ステップS103;Yes)、物理設計処理部12cは、配備対象データと配備済みデータの分散方式が同一であるか否かを判定する(ステップS104)。そして、分散方式が同一であれば(ステップS104;Yes)、物理設計処理部12cは、未配備のデータのみ、決定した分散方式に従って計算ノードに配備する(ステップS105)。
If the data to be deployed has already been deployed (step S103; Yes), the physical
配備対象データが全て未配備である場合(ステップS103;No)、もしくは分散方式が異なる場合(ステップS104;No)、物理設計処理部12cは、配備対象全体を、決定した分散方式に従って計算ノードに配備する(ステップS106)。
If all of the deployment target data has not been deployed (step S103; No), or if the distribution method is different (step S104; No), the physical
ステップS105またはステップS106の後、物理設計処理部12cは、データカタログを更新し、アクセス権を設定して(ステップS107)、処理を終了する。
After step S105 or step S106, the physical
図15は、図14に示した分散方式の決定の詳細を示すフローチャートである。このフローチャートでは、以下のステップが実行される。
ステップS201
処理が開始すると、物理設計処理部12cは、配備要求の入力情報を識別し、ステップS102に移行する。
ステップS202
物理設計処理部12cは、入力情報がデータ名であるか、使用方法であるかを判定する。データ名であればステップS203に移行し、使用方法であればステップS206に移行する。
Fig. 15 is a flow chart showing the details of the distribution method decision shown in Fig. 14. In this flow chart, the following steps are performed:
Step S201
When the process starts, the physical
Step S202
The physical
ステップS203
カタログ情報取得部12bは、データカタログ21のデータ一覧より、入力情報に関する情報を取得し、ステップS204に移行する。
ステップS204
物理設計処理部12cは、データ名の格納場所を判定する。格納場所がデータ一覧@ストレージであれば、ステップS207に移行し、格納場所がリネージであればステップS205に移行する。
ステップS205
カタログ情報取得部12bは、データカタログ21からリネージ情報を取得し、ステップS206に移行する。
ステップS206
物理設計処理部12cは、リネージ情報からソースデータと結合キーを求め、ステップS207に移行する。
Step S203
The catalog
Step S204
The physical
Step S205
The catalog
Step S206
The physical
ステップS207
物理設計処理部12cは、各ソースデータについて、ステップS208~ステップS212の処理を実行する。その後、ステップS213でループの終了を判定する。
Step S207
The physical
ステップS208
物理設計処理部12cは、データの種別を判定する。結合データであれば、ステップS205に移行する。履歴であれば、ステップS210に移行する。マスタであれば、ステップS209に移行する。
ステップS209
物理設計処理部12cは、分散方式を「全ノードに複製」に設定し、ステップS213に移行する。
ステップS210
物理設計処理部12cは、履歴同士の結合があるか否かを判定する。結合があればステップS211に移行し、結合が無ければステップS212に移行する。
ステップS211
物理設計処理部12cは、分散方式を「結合列によるクラスタリング」に設定し、ステップS213に移行する。
ステップS212
物理設計処理部12cは、分散方式を「ラウンドロビン」に設定し、ステップS213に移行する。
Step S208
The physical
Step S209
The physical
Step S210
The physical
Step S211
The physical
Step S212
The physical
ステップS213
物理設計処理部12cは、全てのソースデータについて処理を行ったかを判定する。未処理のソースデータが残っていれば、ステップS207に移行する。そして、全てのソースデータが処理済みとなれば、分散方式の決定を終了し、元の処理に戻る。
Step S213
The physical
次に、データ配備によるデータカタログの変化について説明する。図16は、結合データの配備の具体例である。図16では、図13に示したデータカタログに、入力情報「使用方法:傷病_医薬品(SY_IY)= 結合(傷病レセ(SY),医薬品レセ(IY),結合条件:SY.id=IY.id),配備先=C3,4,user=U1」に基づくデータ配備を実行した状態を示している。 Next, we will explain the changes to the data catalog due to data deployment. Figure 16 is a specific example of the deployment of combined data. Figure 16 shows the state after data deployment has been performed on the data catalog shown in Figure 13 based on the input information "Usage: Injury/Illness_Medicine (SY_IY) = Join (Injury/Illness Claim (SY), Medicine Claim (IY), Join Condition: SY.id = IY.id), Deployment Destination = C3, 4, User = U1."
この結合データの配備により、データカタログの配備済みデータ@計算ノードには、傷病レセ(SY)と医薬品レセ(IY)が追加される。これらの配備先はC3とC4であり、分散方式は結合列クラスタリングである。また、リネージ情報には、傷病_医薬品(SY_IY)が追加される。傷病_医薬品(SY_IY)のソースデータは傷病レセ(SY)と医薬品レセ(IY)であり、結合列はidである。さらに、計算ノードデータのアクセス権には、傷病レセ(SY)と医薬品レセ(IY)が追加され、ユーザU1が対応付けられる。 By deploying this combined data, injury/illness claim (SY) and pharmaceutical claim (IY) are added to the deployed data @ computation node in the data catalog. The deployment destinations for these are C3 and C4, and the distribution method is combined column clustering. In addition, injury/illness_medicine (SY_IY) is added to the lineage information. The source data for injury/illness_medicine (SY_IY) is injury/illness claim (SY) and pharmaceutical claim (IY), and the combined column is id. Furthermore, injury/illness claim (SY) and pharmaceutical claim (IY) are added to the access rights of the computation node data, and user U1 is associated with them.
図17は、既存データを利用したデータの配備の具体例である。図17では、図13に示したデータカタログに、入力情報「使用方法:診療レセ(SI)(id=11‐30)=抽出(診療レセ(SI),抽出条件:11<=id<=30), 配備先=C1,2,user=U3」に基づくデータ配備を実行した状態を示している。 Figure 17 is a specific example of data deployment using existing data. Figure 17 shows the state after data deployment has been performed on the data catalog shown in Figure 13 based on the input information "Usage: Medical Receipt (SI) (id = 11-30) = Extract (Medical Receipt (SI), Extraction Condition: 11 <= id <= 30), Deployment Destination = C1, 2, User = U3."
このデータの配備では、配備済みデータ@計算ノードに示すように、診療レセ(SI)(id=1‐20)が配備済みであるため、診療レセ(SI)(id=21‐30)が新たに配備される。この配備先はC1とC2であり、分散方式はラウンドロビンである。また、リネージ情報には、診療レセ(SI)(id=11‐30)が追加される。診療レセ(SI)(id=11‐30)のソースデータは診療レセ(SI)であり、抽出条件は11<=id<=30である。計算ノードデータのアクセス権は、既存の診療レセ(SI)(id=1‐20)のユーザにU3を追加するとともに、新規に診療レセ(SI)(id=11‐30)を加えてユーザU3を対応付けた状態となる。 When deploying this data, as shown in Deployed Data @ Computation Node, since medical receipt (SI) (id = 1-20) has already been deployed, medical receipt (SI) (id = 21-30) is newly deployed. This deployment destination is C1 and C2, and the distribution method is round robin. In addition, medical receipt (SI) (id = 11-30) is added to the lineage information. The source data of medical receipt (SI) (id = 11-30) is medical receipt (SI), and the extraction condition is 11 <= id <= 30. The access rights of the computation node data are such that U3 is added to the existing user of medical receipt (SI) (id = 1-20), and new medical receipt (SI) (id = 11-30) is added and associated with user U3.
次に、データベースシステムの動作シーケンスを説明する。図18は、分散データベースを新規に構築する場合の動作シーケンスである。図18に示すように、まず、医療研究者がカタログ管理サーバ20にカタログ検索を要求する。カタログ管理サーバ20はカタログ検索を実行し、データ定義などを医療研究者に返す。
Next, the operational sequence of the database system will be explained. Figure 18 shows the operational sequence when constructing a new distributed database. As shown in Figure 18, first, the medical researcher requests a catalog search from the
その後、医療研究者は、運用管理者にデータの配備要求を行う。運用管理者は、医療研究者からの要求に基づいて、管理ノード10にDBMSの配備要求を入力する。管理ノード10は、配備要求を受け付けてカタログ管理サーバ20にカタログ情報を要求し、リネージ情報やデータ種別を取得する。
The medical researcher then makes a data deployment request to the operations manager. Based on the request from the medical researcher, the operations manager inputs a DBMS deployment request to the
管理ノード10は、カタログ管理サーバ20から取得したリネージ情報やデータ種別を用いて、DBMSデプロイと表定義作成を行い、DBMS管理ノード41に表作成を要求する。DBMS管理ノード41が表作成を行ったならば、管理ノード10はDBMS管理ノード41にデータロードを要求する。DBMS管理ノード41がデータロードを実行したならば、管理ノード10は、運用管理者に配備完了を通知する。
The
このように、管理ノード10は、DBMS配備処理において、カタログ管理サーバ20にカタログ情報を要求し、リネージ情報やデータ種別を取得し、表定義を作成することができる。
In this way, during the DBMS deployment process, the
図19は、分散データベースにデータを追加配備する場合の動作シーケンスである。図19に示す動作シーケンスは、図18の動作シーケンスと比較すると、運用管理者がDBMSの配備要求ではなくデータの配備要求を入力する点と、管理ノード10によるDBMSデプロイが無い点で異なり、その他の動作は同一である。すなわち、管理ノード10は、データ配備処理においても、カタログ管理サーバ20にカタログ情報を要求し、リネージ情報やデータ種別を取得し、表定義を作成することができる。
Figure 19 shows the operation sequence when additional data is deployed to a distributed database. The operation sequence shown in Figure 19 differs from the operation sequence in Figure 18 in that the operations manager inputs a data deployment request instead of a DBMS deployment request, and there is no DBMS deployment by the
図20は、データの追加配備の変形例である。図20では、医療研究者は、カタログ管理サーバ20にカタログ検索を要求してデータ定義などを取得した後、カタログ管理サーバ20にデータの配備要求を行う。カタログ管理サーバ20は、医療研究者から受け付けた配備要求に基づいて、リネージ情報やデータ種別を管理ノード10に提供する。その後の動作は、図19と同様であるので、説明を省略する。このように、カタログ管理サーバ20が配備要求の受付を担う構成とすることもできる。
Figure 20 shows a modified example of additional deployment of data. In Figure 20, a medical researcher requests a catalog search from the
上述してきたように、実施例として開示したデータベースシステムは、データの所在を示すデータカタログ21を管理するカタログ管理サーバ20と、ストレージノード31と、分散データベース40を形成する1つ以上の計算ノード42と、ストレージノード31に格納されたデータの一部を計算ノード42に保持させるデータ配備を管理する管理ノード10とを備える。そして、管理ノード10は、データ配備を求める配備要求を受け付けた場合に、データカタログ21から情報を取得し、取得した情報に基づいて配備すべきデータである配備対象データをいずれの計算ノード42に保持させるかを決定することで、分散データベース40の物理設計を行う。このため、ユーザのスキルに依存することなく、良好な性能を実現するデータベースの物理設計を行うことができる。
As described above, the database system disclosed as an embodiment includes a
また、上記実施例によれば、管理ノード10は、配備要求に示されたデータ名および/またはデータ使用方法に基づいて、配備対象データの分散方式を決定する。具体的には、管理ノード10は、配備対象データがマスタデータである場合には、同一の分散データベースに含まれる全ての計算ノードに配備対象データを保持させる分散方式を採用する。また、管理ノード10は、配備対象データが履歴データであり、かつ、複数のデータを結合したデータである場合には、該結合に係る複数のデータを同一の計算ノードに保持させる分散方式を採用する。また、管理ノード10は、配備対象データが履歴データであり、かつ、複数のデータを結合したデータでない場合には、配備対象データを複数の計算ノードに振り分けて保持させる分散方式を採用する。
このように、配備要求に示されたデータ名および/またはデータ使用方法に応じた分散方式を採用することで、適切なデータ配置を自動的に決定することができる。
Furthermore, according to the above embodiment, the
In this way, by adopting a distribution method according to the data name and/or data usage method indicated in the deployment request, an appropriate data deployment can be automatically determined.
また、管理ノード10は、配備対象データが配備済みのデータと重複し、配備対象データの分散方式と配備済みのデータの分散方式とが同一であるならば、非重複部分を選択的に配備する。また、管理ノード10は、配備対象データを計算ノードに配備する際に、配備対象データを検索キーとなる項目でクラスタリングして格納する。このため、処理を効率化し、性能の向上を図ることができる。
In addition, if the data to be deployed overlaps with data that has already been deployed and the distribution method of the data to be deployed is the same as that of the data that has already been deployed, the
なお、データカタログは、ストレージノードに格納されたデータの一覧と、ストレージノードに格納されたデータから生成されて計算ノードに格納されたデータの一覧と、計算ノードに格納されたデータをどのように生成したかを示すリネージ情報とを含む。実施例に開示したデータベースシステムは、かかるメタデータを参照して利用することで、分散データベースの物理設計を実現する。 The data catalog includes a list of data stored in the storage nodes, a list of data generated from the data stored in the storage nodes and stored in the computation nodes, and lineage information indicating how the data stored in the computation nodes was generated. The database system disclosed in the embodiment realizes the physical design of a distributed database by referring to and using such metadata.
なお、本発明は上述の実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、かかる構成の削除に限らず、構成の置き換えや追加も可能である。 The present invention is not limited to the above-described embodiment, but includes various modified examples. For example, the above-described embodiment has been described in detail to clearly explain the present invention, and is not necessarily limited to having all of the configurations described. Furthermore, the configurations may be replaced or added, rather than being deleted.
例えば、例示したデータベースに限らず、任意のデータベースでの検索に適用可能である。また、管理ノード10の機能を他の装置に持たせて実施してもよい。
For example, the present invention is applicable to searches in any database, not just the databases shown as examples. In addition, the functions of the
10:管理ノード、12a:配備要求受付部、12b:カタログ情報取得部、12c:物理設計処理部、20:カタログ管理ノード、21:データカタログ、30:ストレージネットワーク、31:ストレージノード、40:分散データベース、41:DBMS管理ノード、42:計算ノード 10: Management node, 12a: Deployment request reception unit, 12b: Catalog information acquisition unit, 12c: Physical design processing unit, 20: Catalog management node, 21: Data catalog, 30: Storage network, 31: Storage node, 40: Distributed database, 41: DBMS management node, 42: Computation node
Claims (8)
ストレージノードと、
分散データベースを形成する1つ以上の計算ノードと、
前記ストレージノードに格納されたデータの一部を前記計算ノードに保持させるデータ配備を管理する管理ノードと
を備え、
前記管理ノードは、
前記データ配備を求める配備要求を受け付けた場合に、前記データカタログから情報を取得し、取得した情報に基づいて配備すべきデータである配備対象データをいずれの計算ノードに保持させるかを決定することで、前記分散データベースの物理設計を行うものであり、
前記管理ノードは、前記配備要求に示されたデータ名および/またはデータ使用方法に基づいて、前記配備対象データの分散方式を決定し、前記配備対象データがマスタデータである場合には、同一の分散データベースに含まれる全ての計算ノードに前記配備対象データを保持させる分散方式を採用する
ことを特徴とするデータベースシステム。 A catalog management server that manages a data catalog indicating the location of data;
A storage node;
one or more computing nodes forming a distributed database;
a management node that manages data allocation for causing the computing node to hold a portion of the data stored in the storage node,
The management node,
When a deployment request for the data deployment is received, information is acquired from the data catalog, and a physical design of the distributed database is performed by determining which computing node should hold the deployment target data, which is the data to be deployed, based on the acquired information;
The management node determines a distribution method for the data to be deployed based on the data name and/or data usage method indicated in the deployment request, and when the data to be deployed is master data, adopts a distribution method in which the data to be deployed is held in all computing nodes included in the same distributed database.
A database system comprising:
前記データ配備を求める配備要求を受け付ける配備要求受付部と、
前記配備要求を受け付けた場合に、データの所在を示すデータカタログから情報を取得するカタログ情報取得部と、
前記データカタログから取得した情報に基づいて、配備すべきデータである配備対象データをいずれの計算ノードに保持させるかを決定することで、前記分散データベースの物理設計を行う物理設計処理部と
を備え、
前記物理設計処理部は、前記配備要求に示されたデータ名および/またはデータ使用方法に基づいて、前記配備対象データの分散方式を決定し、前記配備対象データがマスタデータである場合には、同一の分散データベースに含まれる全ての計算ノードに前記配備対象データを保持させる分散方式を採用する
ことを特徴とするデータ配備管理装置。 A data allocation management device that manages data allocation by replicating a portion of data stored in a storage node and storing the replicated data in one or more computing nodes that form a distributed database, comprising:
a deployment request receiving unit that receives a deployment request for the data deployment;
a catalog information acquisition unit that acquires information from a data catalog indicating a location of the data when the deployment request is received;
a physical design processing unit that performs a physical design of the distributed database by determining which computing node should hold deployment target data, which is data to be deployed, based on information acquired from the data catalog ;
The physical design processing unit determines a distribution method for the data to be deployed based on the data name and/or data usage method indicated in the deployment request, and when the data to be deployed is master data, adopts a distribution method in which the data to be deployed is held in all computing nodes included in the same distributed database.
A data deployment management device comprising:
プロセッサが、
前記データ配備を求める配備要求を受け付ける配備要求受付ステップと、
前記配備要求を受け付けた場合に、データの所在を示すデータカタログから情報を取得するカタログ情報取得ステップと、
前記データカタログから取得した情報に基づいて、配備すべきデータである配備対象データをいずれの計算ノードに保持させるかを決定することで、前記分散データベースの物理設計を行う物理設計処理ステップと
を行い、
前記物理設計処理ステップは、前記配備要求に示されたデータ名および/またはデータ使用方法に基づいて、前記配備対象データの分散方式を決定し、前記配備対象データがマスタデータである場合には、同一の分散データベースに含まれる全ての計算ノードに前記配備対象データを保持させる分散方式を採用する
ことを特徴とするデータ配備管理方法。 A data allocation management method for managing data allocation in which a part of data stored in a storage node is replicated and stored in one or more computing nodes forming a distributed database, the method comprising:
The processor:
a deployment request receiving step of receiving a deployment request for the data deployment;
a catalog information acquisition step of acquiring information from a data catalog indicating a location of the data when the deployment request is received;
a physical design processing step of performing a physical design of the distributed database by determining which computing node should hold the deployment target data, which is the data to be deployed, based on the information acquired from the data catalog ;
The physical design processing step determines a distribution method for the data to be deployed based on the data name and/or data usage method indicated in the deployment request, and adopts a distribution method in which the data to be deployed is held in all computing nodes included in the same distributed database when the data to be deployed is master data.
A data deployment management method comprising:
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020121596A JP7489249B2 (en) | 2020-07-15 | 2020-07-15 | DATABASE SYSTEM, DATA DISTRIBUTION MANAGEMENT DEVICE, AND DATA DISTRIBUTION MANAGEMENT METHOD |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020121596A JP7489249B2 (en) | 2020-07-15 | 2020-07-15 | DATABASE SYSTEM, DATA DISTRIBUTION MANAGEMENT DEVICE, AND DATA DISTRIBUTION MANAGEMENT METHOD |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2022018476A JP2022018476A (en) | 2022-01-27 |
| JP7489249B2 true JP7489249B2 (en) | 2024-05-23 |
Family
ID=80203287
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020121596A Active JP7489249B2 (en) | 2020-07-15 | 2020-07-15 | DATABASE SYSTEM, DATA DISTRIBUTION MANAGEMENT DEVICE, AND DATA DISTRIBUTION MANAGEMENT METHOD |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7489249B2 (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN116627965B (en) * | 2023-04-25 | 2025-03-18 | 腾讯科技(深圳)有限公司 | Distributed database data table processing method, device, equipment and storage medium |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2005309684A (en) | 2004-04-20 | 2005-11-04 | Ntt Data Corp | Database system and program |
| WO2012121316A1 (en) | 2011-03-08 | 2012-09-13 | 日本電気株式会社 | Distributed storage system and method therefor |
| JP2013065113A (en) | 2011-09-15 | 2013-04-11 | Toshiba Corp | Load distribution system, data access device, and load distribution method |
| WO2013073020A1 (en) | 2011-11-16 | 2013-05-23 | 株式会社日立製作所 | Computer system, data management method, and program |
| WO2013172405A1 (en) | 2012-05-17 | 2013-11-21 | 日本電気株式会社 | Storage system and data access method |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH08190502A (en) * | 1995-01-12 | 1996-07-23 | Hitachi Ltd | Distributed database layout design method |
-
2020
- 2020-07-15 JP JP2020121596A patent/JP7489249B2/en active Active
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2005309684A (en) | 2004-04-20 | 2005-11-04 | Ntt Data Corp | Database system and program |
| WO2012121316A1 (en) | 2011-03-08 | 2012-09-13 | 日本電気株式会社 | Distributed storage system and method therefor |
| JP2013065113A (en) | 2011-09-15 | 2013-04-11 | Toshiba Corp | Load distribution system, data access device, and load distribution method |
| WO2013073020A1 (en) | 2011-11-16 | 2013-05-23 | 株式会社日立製作所 | Computer system, data management method, and program |
| WO2013172405A1 (en) | 2012-05-17 | 2013-11-21 | 日本電気株式会社 | Storage system and data access method |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2022018476A (en) | 2022-01-27 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7263297B2 (en) | Real-time cross-system database replication for hybrid cloud elastic scaling and high-performance data virtualization | |
| US6523036B1 (en) | Internet database system | |
| US6405198B1 (en) | Complex data query support in a partitioned database system | |
| US20100235390A1 (en) | Search device, search method, and computer-readable recording medium storing search program | |
| CN111797121A (en) | Strong consistency query method, device and system for read-write separation architecture service system | |
| US11030196B2 (en) | Method and apparatus for processing join query | |
| JP5437557B2 (en) | Search processing method and search system | |
| US9020916B2 (en) | Database server apparatus, method for updating database, and recording medium for database update program | |
| CN115185966B (en) | A method and apparatus for handling data consistency in a distributed cluster. | |
| WO2008049353A1 (en) | Network data storing system and data accessing method thereof | |
| CN104603780A (en) | Computer system, metadata management method, and recording medium | |
| CN108959538B (en) | Full text retrieval system and method | |
| CN112969997A (en) | Tracking changes to database data | |
| CN111651424B (en) | Data processing method, device, data node and storage medium | |
| CN116635846A (en) | Schema and data modification concurrency in query processing pushdown | |
| US20170270149A1 (en) | Database systems with re-ordered replicas and methods of accessing and backing up databases | |
| JP7038864B2 (en) | Search server centralized storage | |
| CN107870954A (en) | A distributed database extension method and device | |
| US20230244647A1 (en) | Unique Identification Management | |
| KR101872414B1 (en) | Dynamic partitioning method for supporting load balancing of distributed RDF graph | |
| JP7489249B2 (en) | DATABASE SYSTEM, DATA DISTRIBUTION MANAGEMENT DEVICE, AND DATA DISTRIBUTION MANAGEMENT METHOD | |
| CN116975053A (en) | A data processing method, device, equipment, media and program product | |
| CN119106035A (en) | A block storage method and related equipment | |
| CN118113774A (en) | A method, system, device cluster and storage medium for database redistribution | |
| US20230094789A1 (en) | Data distribution in target database systems |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230210 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231114 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231226 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240201 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240423 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240513 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7489249 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |