JP7563451B2 - Information processing device, program, and information processing method - Google Patents
Information processing device, program, and information processing method Download PDFInfo
- Publication number
- JP7563451B2 JP7563451B2 JP2022522566A JP2022522566A JP7563451B2 JP 7563451 B2 JP7563451 B2 JP 7563451B2 JP 2022522566 A JP2022522566 A JP 2022522566A JP 2022522566 A JP2022522566 A JP 2022522566A JP 7563451 B2 JP7563451 B2 JP 7563451B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- encrypted
- function
- structure data
- encryption algorithm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09C—CIPHERING OR DECIPHERING APPARATUS FOR CRYPTOGRAPHIC OR OTHER PURPOSES INVOLVING THE NEED FOR SECRECY
- G09C1/00—Apparatus or methods whereby a given sequence of signs, e.g. an intelligible text, is transformed into an unintelligible sequence of signs by transposing the signs or groups of signs or by replacing them by others according to a predetermined system
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、情報処理装置、プログラム及び情報処理方法に関する。 The present invention relates to an information processing device, a program, and an information processing method.
従来、化合物の機能の予測に、演繹的予測モデルや、帰納的アプローチで機械学習により生成された学習モデルといった予測モデルが用いられている。このうち演繹的予測モデルは、化合物についての既知の原理や規則性から化合物の機能を予測する予測モデルである。また、学習モデルは、例えば化合物の構造に係る記述子を説明変数とし、当該化合物が呈する機能を目的変数として帰納的に学習した結果得られる、説明変数と目的変数との相関を表す予測モデルである(例えば、特許文献1)。機械学習を含む情報処理を用いて材料開発を行う方法は、マテリアルインフォマティクス(以下「MI」と記す)と呼ばれている。Conventionally, prediction models such as deductive prediction models and learning models generated by machine learning with an inductive approach have been used to predict the functions of compounds. Among these, deductive prediction models are prediction models that predict the functions of compounds from known principles and regularities of compounds. Moreover, learning models are prediction models that express the correlation between explanatory variables and objective variables, obtained as a result of inductive learning using, for example, descriptors related to the structure of a compound as explanatory variables and the function exhibited by the compound as the objective variable (for example, Patent Document 1). A method of developing materials using information processing including machine learning is called materials informatics (hereinafter referred to as "MI").
このような予測モデルを用いて機能を予測する対象の化合物の情報や、学習モデルの生成に用いる化合物の情報は、例えば公開されているデータベースから取得することができる。 Information on compounds whose functions are predicted using such predictive models, and information on compounds used to generate learning models, can be obtained, for example, from publicly available databases.
しかしながら、公開されているデータベースから必要な情報を取得可能な化合物は限られており、機能予測対象の化合物の候補を増やしたり、学習モデルの生成に用いる化合物を増やして予測精度をさらに向上させたりするためには、非公開のデータベースからも化合物の情報を取得する必要がある。ここで、非公開のデータベースから化合物の構造の情報を取得すると、化合物の構造に係る機密情報の漏洩に繋がる可能性があるという課題がある。However, the number of compounds for which necessary information can be obtained from public databases is limited, and in order to increase the number of candidate compounds for function prediction or to increase the number of compounds used to generate learning models and further improve prediction accuracy, it is necessary to obtain compound information from private databases as well. However, obtaining compound structure information from private databases poses the problem that it may lead to the leakage of confidential information related to compound structures.
この発明の目的は、化合物の構造に係る機密情報の安全性を高めることができる情報処理装置、プログラム及び情報処理方法を提供することにある。 The object of the present invention is to provide an information processing device, program, and information processing method that can increase the security of confidential information related to the structure of compounds.
上記目的を達成するため、請求項1に記載の情報処理装置の発明は、
第1の外部装置に対して、所定の暗号化アルゴリズムに従った暗号化を実行するための暗号化アルゴリズム情報を提供する情報提供部と、
前記第1の外部装置から、前記暗号化アルゴリズムに従って暗号化された機能予測対象の暗号化構造データを取得する第1のデータ取得部と、
前記機能予測対象の暗号化構造データに対応する化合物の機能を所定の予測モデルに基づいて予測する予測部と、
を備え、
前記予測モデルは、化合物の構造に係る構造データを前記暗号化アルゴリズムに従って暗号化して得られた暗号化構造データと、前記化合物の機能に係る機能データとの相関関係を表す。
In order to achieve the above object, the present invention provides an information processing device comprising:
an information providing unit that provides the first external device with encryption algorithm information for performing encryption according to a predetermined encryption algorithm;
a first data acquisition unit that acquires encrypted structure data of a function prediction target encrypted according to the encryption algorithm from the first external device;
a prediction unit that predicts a function of a compound corresponding to the encrypted structure data of the function prediction target based on a predetermined prediction model;
Equipped with
The prediction model represents the correlation between encrypted structural data obtained by encrypting structural data relating to the structure of a compound according to the encryption algorithm, and functional data relating to the function of the compound.
請求項2に記載の発明は、請求項1に記載の情報処理装置において、
化合物の構造に係る構造データを前記暗号化アルゴリズムに従って暗号化して暗号化構造データを生成する暗号化部と、
前記暗号化構造データ、及び前記化合物の機能に係る機能データに基づいて、前記予測モデルとしての学習モデルを生成する学習モデル生成部と、
を備える。
The present invention as set forth in
an encryption unit that encrypts structure data relating to a compound structure according to the encryption algorithm to generate encrypted structure data;
a learning model generation unit that generates a learning model as the prediction model based on the encrypted structure data and function data related to the function of the compound;
Equipped with.
請求項3に記載の発明は、請求項2に記載の情報処理装置において、
前記第1のデータ取得部は、前記第1の外部装置から、前記暗号化アルゴリズムに従って暗号化された学習対象の暗号化構造データ、及び当該学習対象の暗号化構造データに対応する化合物の機能に係る学習対象の機能データを取得し、
前記学習モデル生成部は、前記第1のデータ取得部が取得した前記学習対象の暗号化構造データ及び前記学習対象の機能データを少なくとも用いて前記学習モデルを生成する。
The present invention provides an information processing device according to
the first data acquisition unit acquires, from the first external device, encrypted structural data of a learning object encrypted according to the encryption algorithm, and functional data of a learning object related to a function of a compound corresponding to the encrypted structural data of the learning object;
The learning model generation unit generates the learning model using at least the encrypted structure data of the learning object and the functional data of the learning object acquired by the first data acquisition unit.
上記目的を達成するため、請求項4に記載の情報処理装置の発明は、
化合物の構造に係る構造データを所定の暗号化アルゴリズムに従って暗号化して暗号化構造データを生成する暗号化部と、
前記暗号化構造データ、及び前記化合物の機能に係る機能データに基づいて、前記暗号化構造データと前記機能データとの相関関係を表す学習モデルを生成する学習モデル生成部と、
第1の外部装置に対して、前記暗号化アルゴリズムに従った暗号化を実行するための暗号化アルゴリズム情報を提供する情報提供部と、
前記第1の外部装置から、前記暗号化アルゴリズムに従って暗号化された学習対象の暗号化構造データ、及び当該暗号化構造データに対応する化合物の機能に係る学習対象の機能データを取得する第1のデータ取得部と、
を備え、
前記学習モデル生成部は、前記第1のデータ取得部が取得した前記学習対象の暗号化構造データ及び前記学習対象の機能データを少なくとも用いて前記学習モデルを生成する。
In order to achieve the above object, the invention of an information processing device according to
an encryption unit that encrypts structure data relating to a compound structure according to a predetermined encryption algorithm to generate encrypted structure data;
a learning model generating unit that generates a learning model that represents a correlation between the encrypted structure data and the functional data, based on the encrypted structure data and functional data related to a function of the compound;
an information providing unit that provides a first external device with encryption algorithm information for performing encryption according to the encryption algorithm;
a first data acquisition unit that acquires, from the first external device, encrypted structure data of a learning object encrypted according to the encryption algorithm, and function data of a learning object related to a function of a compound corresponding to the encrypted structure data;
Equipped with
The learning model generation unit generates the learning model using at least the encrypted structure data of the learning object and the functional data of the learning object acquired by the first data acquisition unit.
請求項5に記載の発明は、請求項4に記載の情報処理装置において、
前記第1のデータ取得部は、前記第1の外部装置から、前記暗号化アルゴリズムに従って暗号化された機能予測対象の暗号化構造データを取得し、
当該情報処理装置は、前記第1のデータ取得部が取得した前記機能予測対象の暗号化構造データに対応する化合物の機能を前記学習モデルに基づいて予測する予測部を備える。
The invention described in claim 5 is the information processing device described in
The first data acquisition unit acquires encrypted structure data of a function prediction target encrypted according to the encryption algorithm from the first external device,
The information processing device includes a prediction unit that predicts, based on the learning model, a function of a compound corresponding to the encrypted structure data of the function prediction target acquired by the first data acquisition unit.
請求項6に記載の発明は、請求項2、3、5のいずれか一項に記載の情報処理装置において、
前記構造データを生成する構造データ生成部を備え、
前記暗号化部は、前記構造データ生成部が生成した前記構造データを暗号化して機能予測対象の前記暗号化構造データを生成し、
前記予測部は、前記暗号化部が生成した前記機能予測対象の暗号化構造データに対応する化合物の機能を前記学習モデルに基づいて予測する。
The present invention as set forth in claim 6 provides an information processing device as set forth in any one of
a structure data generating unit that generates the structure data,
The encryption unit encrypts the structure data generated by the structure data generation unit to generate the encrypted structure data of a function prediction target;
The prediction unit predicts, based on the learning model, a function of a compound corresponding to the encrypted structure data of the function prediction target generated by the encryption unit.
請求項7に記載の発明は、請求項2、3、5のいずれか一項に記載の情報処理装置において、
化合物の構造を公開する第2の外部装置から当該化合物の構造に係る構造データを取得する第2のデータ取得部を備え、
前記暗号化部は、前記第2のデータ取得部が取得した前記構造データを暗号化して機能予測対象の前記暗号化構造データを生成し、
前記予測部は、前記暗号化部が生成した前記機能予測対象の暗号化構造データに対応する化合物の機能を前記学習モデルに基づいて予測する。
The present invention as set forth in claim 7 provides an information processing device as set forth in any one of
a second data acquisition unit that acquires structural data relating to a structure of the compound from a second external device that publishes the structure of the compound;
The encryption unit encrypts the structure data acquired by the second data acquisition unit to generate the encrypted structure data of a function prediction target;
The prediction unit predicts, based on the learning model, a function of a compound corresponding to the encrypted structure data of the function prediction target generated by the encryption unit.
請求項8に記載の発明は、請求項2~7のいずれか一項に記載の情報処理装置において、
外部の所定のデータベースから前記構造データ及び前記機能データを取得する第3のデータ取得部を備え、
前記暗号化部は、前記第3のデータ取得部が取得した前記構造データに基づいて前記暗号化構造データを生成し、
前記学習モデル生成部は、当該暗号化構造データ、及び前記第3のデータ取得部が取得した前記機能データを少なくとも用いて前記学習モデルを生成する。
The invention described in claim 8 is the information processing device according to any one of
a third data acquisition unit that acquires the structure data and the function data from an external predetermined database;
The encryption unit generates the encrypted structure data based on the structure data acquired by the third data acquisition unit,
The learning model generation unit generates the learning model using at least the encrypted structure data and the functional data acquired by the third data acquisition unit.
請求項9に記載の発明は、請求項1~8のいずれか一項に記載の情報処理装置において、
前記暗号化アルゴリズムは、暗号化前の前記構造データへの逆変換が不可能である。
The invention described in claim 9 provides an information processing device according to any one of
The encryption algorithm is incapable of reversing the conversion to the structure data before encryption.
また、上記目的を達成するため、請求項10に記載のプログラムの発明は、
情報処理装置に設けられたコンピューターを、
第1の外部装置に対して、所定の暗号化アルゴリズムに従った暗号化を実行するための暗号化アルゴリズム情報を提供する情報提供手段、
前記第1の外部装置から、前記暗号化アルゴリズムに従って暗号化された機能予測対象の暗号化構造データを取得するデータ取得手段、
前記機能予測対象の暗号化構造データに対応する化合物の機能を所定の予測モデルに基づいて予測する予測手段、
として機能させ、
前記予測モデルは、化合物の構造に係る構造データを前記暗号化アルゴリズムに従って暗号化して得られた暗号化構造データと、前記化合物の機能に係る機能データとの相関関係を表す。
In order to achieve the above object, the present invention provides a program as set forth in claim 10,
A computer installed in the information processing device,
an information providing means for providing the first external device with encryption algorithm information for performing encryption according to a predetermined encryption algorithm;
a data acquisition means for acquiring encrypted structure data of a function prediction target encrypted according to the encryption algorithm from the first external device;
a prediction means for predicting a function of a compound corresponding to the encrypted structure data of the function prediction target based on a predetermined prediction model;
Function as a
The prediction model represents the correlation between encrypted structural data obtained by encrypting structural data relating to the structure of a compound according to the encryption algorithm, and functional data relating to the function of the compound.
また、上記目的を達成するため、請求項11に記載のプログラムの発明は、
情報処理装置に設けられたコンピューターを、
化合物の構造に係る構造データを所定の暗号化アルゴリズムに従って暗号化して暗号化構造データを生成する暗号化手段、
前記暗号化構造データ、及び前記化合物の機能に係る機能データに基づいて、前記暗号化構造データと前記機能データとの相関関係を表す学習モデルを生成する学習モデル生成手段、
第1の外部装置に対して、前記暗号化アルゴリズムに従った暗号化を実行するための暗号化アルゴリズム情報を提供する情報提供手段、
前記第1の外部装置から、前記暗号化アルゴリズムに従って暗号化された学習対象の暗号化構造データ、及び当該暗号化構造データに対応する化合物の機能に係る学習対象の機能データを取得するデータ取得手段、
として機能させ、
前記学習モデル生成手段は、前記データ取得手段が取得した前記学習対象の暗号化構造データ及び前記学習対象の機能データを少なくとも用いて前記学習モデルを生成する。
In order to achieve the above object, the present invention provides a program as set forth in
A computer installed in the information processing device,
an encryption means for encrypting structural data relating to a compound structure according to a predetermined encryption algorithm to generate encrypted structural data;
a learning model generating means for generating a learning model representing a correlation between the encrypted structure data and functional data relating to a function of the compound, based on the encrypted structure data and the functional data;
an information providing means for providing a first external device with encryption algorithm information for performing encryption according to the encryption algorithm;
a data acquisition means for acquiring, from the first external device, encrypted structure data of a learning subject encrypted according to the encryption algorithm, and function data of a learning subject relating to a function of a compound corresponding to the encrypted structure data;
Function as a
The learning model generating means generates the learning model using at least the encrypted structure data of the learning subject and the functional data of the learning subject acquired by the data acquiring means.
また、上記目的を達成するため、請求項12に記載の情報処理方法の発明は、
情報処理装置が実行する情報処理方法であって、
第1の外部装置に対して、所定の暗号化アルゴリズムに従った暗号化を実行するための暗号化アルゴリズム情報を提供する情報提供ステップと、
前記第1の外部装置から、前記暗号化アルゴリズムに従って暗号化された機能予測対象の暗号化構造データを取得するデータ取得ステップと、
前記機能予測対象の暗号化構造データに対応する化合物の機能を所定の予測モデルに基づいて予測する予測ステップと、
を含み、
前記予測モデルは、化合物の構造に係る構造データを前記暗号化アルゴリズムに従って暗号化して得られた暗号化構造データと、前記化合物の機能に係る機能データとの相関関係を表す。
In order to achieve the above object, the invention of an information processing method according to
An information processing method executed by an information processing device,
an information providing step of providing encryption algorithm information for performing encryption according to a predetermined encryption algorithm to a first external device;
a data acquisition step of acquiring encrypted structure data of a function prediction target encrypted according to the encryption algorithm from the first external device;
a prediction step of predicting a function of a compound corresponding to the encrypted structure data of the function prediction target based on a predetermined prediction model;
Including,
The prediction model represents the correlation between encrypted structural data obtained by encrypting structural data relating to the structure of a compound according to the encryption algorithm, and functional data relating to the function of the compound.
また、上記目的を達成するため、請求項13に記載の情報処理方法の発明は、
情報処理装置が実行する情報処理方法であって、
化合物の構造に係る構造データを所定の暗号化アルゴリズムに従って暗号化して暗号化構造データを生成する暗号化ステップと、
前記暗号化構造データ、及び前記化合物の機能に係る機能データに基づいて、前記暗号化構造データと前記機能データとの相関関係を表す学習モデルを生成する学習モデル生成ステップと、
第1の外部装置に対して、前記暗号化アルゴリズムに従った暗号化を実行するための暗号化アルゴリズム情報を提供する情報提供ステップと、
前記第1の外部装置から、前記暗号化アルゴリズムに従って暗号化された学習対象の暗号化構造データ、及び当該暗号化構造データに対応する化合物の機能に係る学習対象の機能データを取得するデータ取得ステップと、
を含み、
前記学習モデル生成ステップでは、前記データ取得ステップにおいて取得した前記学習対象の暗号化構造データ及び前記学習対象の機能データを少なくとも用いて前記学習モデルを生成する。
In order to achieve the above object, the invention of an information processing method according to
An information processing method executed by an information processing device,
an encryption step of encrypting structural data relating to the structure of the compound according to a predetermined encryption algorithm to generate encrypted structural data;
a learning model generating step of generating a learning model representing a correlation between the encrypted structure data and the functional data, based on the encrypted structure data and functional data relating to a function of the compound;
an information providing step of providing encryption algorithm information for performing encryption according to the encryption algorithm to a first external device;
a data acquisition step of acquiring, from the first external device, encrypted structure data of a learning subject encrypted according to the encryption algorithm, and function data of a learning subject relating to a function of a compound corresponding to the encrypted structure data;
Including,
In the learning model generating step, the learning model is generated using at least the encrypted structure data of the learning subject and the functional data of the learning subject acquired in the data acquiring step.
本発明に従うと、化合物の構造に係る機密情報の安全性を高めることができるという効果がある。 The present invention has the effect of increasing the security of confidential information relating to the structure of compounds.
以下、本発明の情報処理装置、プログラム及び情報処理方法に係る実施の形態を図面に基づいて説明する。 Below, embodiments of the information processing device, program, and information processing method of the present invention are described with reference to the drawings.
図1は、化合物情報処理システム100の概略構成を示す図である。
化合物情報処理システム100は、MIサーバー1(情報処理装置)、公的データベースサーバー2(以下、「公的DBサーバー2」と記す)(所定のデータベース)、試薬データベースサーバー3(以下、「試薬DBサーバー3」と記す)(第2の外部装置)、及びクライアントサーバー4(第1の外部装置)を備える。MIサーバー1、公的DBサーバー2、試薬DBサーバー3及びクライアントサーバー4は、通信ネットワークNを介して相互に通信可能に接続されている。通信ネットワークNは、例えばインターネットであるが、これに限られない。
FIG. 1 is a diagram showing a schematic configuration of a compound
The compound
MIサーバー1は、マテリアルインフォマティクス(MI)に係る情報提供サービスの提供者が保有する機器であり、MIに係る各種情報処理を行う。すなわち、MIサーバー1は、化合物に係る情報に基づいて、化合物の機能を予測する学習モデル(「学習済みモデル」とも呼ばれる)を機械学習により生成し、当該学習モデルを用いて、MIによる材料開発に有用な情報を取得又は生成してクライアントサーバー4に送信する。より具体的には、MIサーバー1は、クライアントサーバー4から化合物の機能の目標値を取得し、当該目標値の機能を呈する化合物を探索して、特定された化合物の構造に係る情報をクライアントサーバー4に送信する。The
詳しくは、MIサーバー1は、化合物の構造に係る暗号化分子構造データ(暗号化構造データ)、及び当該化合物の機能に係る機能データの組み合わせを多数用いて、暗号化分子構造データと機能データとの相関を表す学習モデルを機械学習により帰納的アプローチで生成する。暗号化分子構造データが機械学習の説明変数に相当し、機能データが機械学習の目的変数に相当する。このうち暗号化分子構造データは、化合物の構造に係る分子構造データ(構造データ)を所定の暗号化アルゴリズムに従って暗号化したデータである。学習モデルの生成に用いられる暗号化分子構造データ及び機能データからなるデータセットの数は、例えば数万セット以上とされる。学習モデルによる予測精度を向上させる方法の1つは、このデータセットの数を増大させることである。
以下では、学習モデルの生成に用いられる暗号化分子構造データ及び機能データを、それぞれ「学習対象の暗号化分子構造データ」、及び「学習対象の機能データ」とも記す。MIサーバー1で生成される学習モデルは、化合物の機能予測のための予測モデルの1つである。
In detail, the
Hereinafter, the encrypted molecular structure data and the functional data used to generate the learning model are also referred to as “encrypted molecular structure data to be learned” and “functional data to be learned”, respectively. The learning model generated by the
暗号化分子構造データの元となる分子構造データは、分子の構成、すなわち分子を構成する元素とその結合態様を特定可能なものであれば、特には限られない。The molecular structure data that is the source of the encrypted molecular structure data is not particularly limited as long as it is capable of identifying the molecular structure, i.e., the elements that make up the molecule and their bonding patterns.
分子構造データから暗号化構造データを生成する暗号化アルゴリズムとしては、例えば、化合物の分子構造の特徴を所定の規則で抽出して数値化するものを用いることができる。 As an encryption algorithm for generating encrypted structure data from molecular structure data, for example, one can use one that extracts characteristics of the molecular structure of a compound according to predetermined rules and quantifies them.
図2は、暗号化分子構造データを生成する暗号化アルゴリズムの例を説明する図である。
図2の暗号化アルゴリズムでは、図中上方に示した構造式を、その特徴に応じて、図中下方に示す符号に変換している。符号の各桁は、0又は1とされる。図2の暗号化アルゴリズムによる変換ルールは、例えば以下のものとすることができる。
すなわち、まずMorgan法によって、分子を構成する各原子に番号を付す。
次に、Daylight ruleによって原子情報を付与し、分子に含まれるフラグメント情報を追加する。
次に、重複しているフラグメントを削除する。
最後に、得られたフラグメントをハッシュ関数によって所定の桁に割り当てる。例えば、分子にある特定のフラグメントが含まれる場合には、符号の所定の桁が1とされる。
このような暗号化アルゴリズムで生成された暗号化分子構造データは、分子構造の特徴を表す記述子の一種であるということもできる。すなわち、暗号化分子構造データからは、値が1となっている桁の位置から、分子構造の特徴を多面的に特定することができる。他方で、ハッシュ関数は一方向関数であるため、暗号化分子構造データから分子構造データへの逆変換は不可能となっている。すなわち、本実施形態では、不可逆の暗号化アルゴリズムが用いられている。
FIG. 2 is a diagram for explaining an example of an encryption algorithm for generating encrypted molecular structure data.
In the encryption algorithm of Fig. 2, the structural formula shown in the upper part of the figure is converted into the code shown in the lower part of the figure according to its characteristics. Each digit of the code is set to 0 or 1. The conversion rule by the encryption algorithm of Fig. 2 can be, for example, as follows.
That is, first, each atom constituting a molecule is numbered according to the Morgan method.
Next, atomic information is given according to the Daylight rule, and fragment information contained in the molecule is added.
Next, the duplicate fragments are removed.
Finally, the resulting fragment is assigned to a predetermined digit by a hash function. For example, if a particular fragment is included in the molecule, a predetermined digit of the code is set to 1.
The encrypted molecular structure data generated by such an encryption algorithm can be said to be a kind of descriptor representing the characteristics of the molecular structure. That is, from the encrypted molecular structure data, the characteristics of the molecular structure can be specified from various aspects based on the position of the digits whose value is 1. On the other hand, since the hash function is a one-way function, it is impossible to reversely convert the encrypted molecular structure data back to molecular structure data. That is, in this embodiment, an irreversible encryption algorithm is used.
MIサーバー1で生成される学習モデルの種別は、暗号化分子構造データと機能データとの相関関係を表すものであれば、特には限られない。学習モデルとしては、例えば、線形回帰、主成分分析、決定木、ランダムフォレスト、サポートベクターマシン、又はランダムフォレスト等の各種公知のものを用いることができる。The type of learning model generated by the
また、MIサーバー1は、機能を予測したい化合物に係る暗号化分子構造データ(以下では「機能予測対象の暗号化分子構造データ」とも記す)に対して、生成された学習モデルを適用することで、当該暗号化分子構造データに対応する化合物の機能を予測する。MIサーバー1は、多数の暗号化分子構造データについての機能予測を行い、クライアントサーバー4から受信した機能の目標値に一致する予測結果が得られた暗号化分子構造データを特定する。そして、MIサーバー1は、特定した暗号化分子構造データに係る情報をクライアントサーバー4に送信する。
In addition, the
公的DBサーバー2は、多数の化合物の分子構造に係る分子構造データと、当該化合物が呈する機能に係る機能データとを記憶している。公的DBサーバー2は、他の装置(本実施形態では、MIサーバー1)からの要求に応じてこれらの分子構造データ及び機能データを提供する。公的DBサーバー2からMIサーバー1に提供された分子構造データは、MIサーバー1において暗号化されて暗号化分子構造データに変換される。この暗号化分子構造データは、機能データとともに学習モデルの生成のための機械学習に用いられるほか、機能予測対象の暗号化分子構造データとしても用いられ得る。The
試薬DBサーバー3は、販売対象とされている多数の化合物の分子構造に係る分子構造データを記憶している。試薬DBサーバー3は、購入可能な試薬(化合物)のカタログを提供するものであるということもできる。試薬DBサーバー3は、他の装置(本実施形態では、MIサーバー1)からの要求に応じて分子構造データを提供する。本実施形態では、試薬DBサーバー3からは化合物の機能に係る機能データは提供されないものとする。試薬DBサーバー3からMIサーバー1に提供された分子構造データは、MIサーバー1において暗号化されて暗号化分子構造データに変換される。この暗号化分子構造データは、機能予測対象の暗号化分子構造データとして用いられる。The
クライアントサーバー4は、MIサーバー1によるMIに係る情報提供サービスを受けるクライアントが保有する機器である。クライアントサーバー4は、MIサーバー1に対し、クライアントが所望する化合物の機能の目標値を指定するデータ等を送信し、MIサーバー1から、当該機能を呈する化合物の構造に係る情報を受信する。また、クライアントサーバー4は、MIに係る必要な情報提供サービスを受けるために、MIサーバー1に対し、機能予測対象の暗号化分子構造データを送信したり、学習対象の暗号化分子構造データ及び学習対象の機能データを送信したりする。
The
本明細書では、クライアントサーバー4に記憶されている化合物の構造に係る分子構造データは、機密情報であるものとする。本実施形態では、クライアントサーバー4において当該分子構造データを暗号化して得られた暗号化分子構造データをMIサーバー1に送信することで、機密情報である分子構造データをMIサーバー1に開示することなく、必要な情報提供サービスを受けることができるようになっている。このようにクライアントサーバー4内の機密情報を保護するための仕組みについては、後に詳述する。In this specification, the molecular structure data relating to the structure of a compound stored in the
次に、MIサーバー1及びクライアントサーバー4の詳細な構成について説明する。
図3は、MIサーバー1の主要な機能構成を示すブロック図である。
MIサーバー1は、制御部11と、操作部12と、表示部13と、通信部14などを備え、これらの各部はバス15により接続されている。
Next, the detailed configuration of the
FIG. 3 is a block diagram showing the main functional configuration of the
The
制御部11は、MIサーバー1の動作を統括制御するプロセッサー(コンピューター)である。制御部11は、CPU111(Central Processing Unit)、RAM112(Random Access Memory)及び記憶部113を有する。The
CPU111は、記憶部113に記憶された各種制御用のプログラム113cや設定データを読み出してRAM112に記憶させ、当該プログラム113cを実行して各種演算処理を行う。
RAM112は、CPU111に作業用のメモリー空間を提供し、一時データを記憶する。RAM112は、不揮発性メモリーを含んでいてもよい。
The
The
記憶部113には、上記のプログラム113cの他、MIに係る情報処理を行うための各種データが記憶されている。記憶部113としては、例えばHDD(Hard Disk Drive)が用いられ、また、DRAM(Dynamic Random Access Memory)などが併用されてもよい。
記憶部113に記憶されるデータには、一般データ113a、クライアント由来データ113b、暗号化アルゴリズム情報D1、及び学習モデルデータD2などがある。
In addition to the above-mentioned
The data stored in the
一般データ113aは、化合物の構造及び機能に係るデータのうち、クライアントサーバー4を介さずに取得されたもの、すなわち、公的DBサーバー2や試薬DBサーバー3から取得したデータ、又はMIサーバー1内で生成したデータ等である。
具体的には、一般データ113aは、学習対象の分子構造データA1、その暗号化分子構造データA2、及び機能データA3を含む。また、一般データ113aは、機能予測対象の分子構造データB1及びその暗号化分子構造データB2を含む。これらのうち分子構造データA1及び機能データA3は、公的DBサーバー2から取得される。また、分子構造データB1は、公的DBサーバー2又は試薬DBサーバー3から取得される。また、後述するように、分子構造データB1は、MIサーバー1内で生成される場合もある。
Specifically, the
クライアント由来データ113bは、化合物の構造及び機能に係るデータのうち、クライアントサーバー4から取得したデータである。クライアント由来データ113bは、機能予測対象のラベル付き暗号化分子構造データC2L、学習対象の暗号化分子構造データC2、及び学習対象の機能データC3を含む。The client-derived
図4は、ラベル付き暗号化分子構造データC2Lの内容例を示す図である。
ラベル付き暗号化分子構造データC2Lは、機能予測対象の複数の暗号化分子構造データの各々に対して、固有のラベル(ここでは自然数)が対応付けられたデータである。
FIG. 4 is a diagram showing an example of the contents of the labeled encrypted molecular structure data C2L.
The labeled encrypted molecular structure data C2L is data in which a unique label (here, a natural number) is associated with each of a plurality of encrypted molecular structure data that are targets of function prediction.
図3に示す暗号化アルゴリズム情報D1は、分子構造データから暗号化分子構造データを生成するための暗号化アルゴリズムに係る情報である。暗号化分子構造データを生成するための所定の暗号化プログラムの実行の際に、暗号化アルゴリズム情報D1が参照されることで、特定の暗号化アルゴリズムに従った暗号化を行うことができる。あるいは、暗号化アルゴリズム情報D1は、暗号化プログラムそのものであってもよい。
暗号化アルゴリズム情報D1は、MIサーバー1の制御部11が分子構造データA1、B1を暗号化して分子構造データA1、B2を生成する際に用いられる。また、暗号化アルゴリズム情報D1は、クライアントサーバー4における暗号化処理のためにクライアントサーバー4に送信される。
The encryption algorithm information D1 shown in Fig. 3 is information related to an encryption algorithm for generating encrypted molecular structure data from molecular structure data. When a specific encryption program for generating encrypted molecular structure data is executed, the encryption algorithm information D1 is referenced, so that encryption can be performed according to a specific encryption algorithm. Alternatively, the encryption algorithm information D1 may be the encryption program itself.
The encryption algorithm information D1 is used when the
学習モデルデータD2は、学習対象の暗号化分子構造データA2、機能データA3、及び/又は学習対象の暗号化分子構造データC2、及び機能データC3に基づいて機械学習により生成された学習モデルに係るデータである。機能予測対象の暗号化分子構造データに対し、学習モデルデータD2により表される学習モデルを適用することで、当該暗号化分子構造データに対応する化合物の機能を予測することができる。本明細書では、学習モデルデータD2を生成することを「学習モデルを生成する」とも記す。The learning model data D2 is data relating to a learning model generated by machine learning based on the encrypted molecular structure data A2, functional data A3, and/or the encrypted molecular structure data C2, and functional data C3 of the learning target. By applying the learning model represented by the learning model data D2 to the encrypted molecular structure data of the function prediction target, it is possible to predict the function of the compound corresponding to the encrypted molecular structure data. In this specification, generating the learning model data D2 is also referred to as "generating a learning model."
これらの構成を有する制御部11は、CPU111がプログラム113cを実行することで、暗号化部(暗号化手段)、学習モデル生成部(学習モデル生成手段)、情報提供部(情報提供手段)、第1のデータ取得部(第1のデータ取得手段)、第2のデータ取得部(第2のデータ取得手段)、第3のデータ取得部(第3のデータ取得手段)、予測部(予測手段)、及び構造データ生成部(構造データ生成手段)として機能する。
暗号化部は、化合物の構造に係る分子構造データA1、B1を、暗号化アルゴリズム情報D1により示される暗号化アルゴリズムに従って暗号化して暗号化分子構造データA2、B2を生成する。
学習モデル生成部は、学習対象の暗号化分子構造データA2、機能データA3、及び/又は学習対象の暗号化分子構造データC2、及び機能データC3に基づいて機械学習を行って学習モデルデータD2を生成する。
情報提供部は、クライアントサーバー4に対して、上記暗号化アルゴリズムに従った暗号化を実行するための暗号化アルゴリズム情報D1を提供する(通信部14により送信させる)。
第1のデータ取得部は、クライアントサーバー4から、通信部14を介して、機能予測対象のラベル付き暗号化分子構造データC2L、学習対象の暗号化分子構造データC2、及び学習対象の機能データC3を取得する。
第2のデータ取得部は、試薬DBサーバー3から、通信部14を介して分子構造データB1を取得する。
第3のデータ取得部は、公的DBサーバー2から、通信部14を介して分子構造データA1及び機能データA3を取得する。
予測部は、機能予測対象の暗号化分子構造データA2、B2、及びラベル付き暗号化分子構造データC2Lに対応する化合物の機能を、学習モデルデータD2により表される学習モデルに基づいて予測する。
構造データ生成部は、遺伝的アルゴリズムなどを用いて機械的に分子構造データB1を生成し、記憶部113に記憶させる。
The
The encryption unit encrypts molecular structure data A1, B1 relating to the structure of a compound in accordance with an encryption algorithm indicated by encryption algorithm information D1 to generate encrypted molecular structure data A2, B2.
The learning model generation unit performs machine learning based on the encrypted molecular structure data A2 and functional data A3 of the learning target, and/or the encrypted molecular structure data C2 and functional data C3 of the learning target, to generate learning model data D2.
The information providing unit provides the
The first data acquisition unit acquires, from the
The second data acquisition unit acquires molecular structure data B1 from the
The third data acquisition unit acquires the molecular structure data A1 and the function data A3 from the
The prediction unit predicts the function of a compound corresponding to the encrypted molecular structure data A2, B2, and the labeled encrypted molecular structure data C2L, the functions of which are to be predicted, based on a learning model represented by learning model data D2.
The structure data generation unit mechanically generates molecular structure data B1 using a genetic algorithm or the like, and stores the data in the
操作部12は、キーボード及びマウスといった入力デバイスや、表示部13と一体的に設けられたタッチパネル等により実現される。操作部12は、これらの入力デバイスやタッチパネルからの操作入力を受け付けて、操作入力に応じた操作信号を制御部11に出力する。The
表示部13は、液晶表示装置や有機EL表示装置などにより実現され、制御部11による制御下で各種情報を表示する。The
通信部14は、制御部11による制御下で、公的DBサーバー2、試薬DBサーバー3及びクライアントサーバー4との間で通信ネットワークNを介したデータの送受信を行う。
Under the control of the
図5は、クライアントサーバー4の主要な機能構成を示すブロック図である。
クライアントサーバー4は、制御部41と、操作部42と、表示部43と、通信部
などを備え、これらの各部はバス45により接続されている。
FIG. 5 is a block diagram showing the main functional configuration of the
The
制御部41は、クライアントサーバー4の動作を統括制御するプロセッサーである。制御部41は、CPU411、RAM412及び記憶部413を有する。The
CPU411は、記憶部413に記憶された各種制御用のプログラム413aや設定データを読み出してRAM412に記憶させ、当該プログラム413aを実行して各種演算処理を行う。
RAM412は、CPU411に作業用のメモリー空間を提供し、一時データを記憶する。RAM412は、不揮発性メモリーを含んでいてもよい。
The
The
記憶部413には、上記のプログラム413aの他、分子構造データC1、ラベル付き暗号化分子構造データC2L、暗号化分子構造データC2、機能データC3及び暗号化アルゴリズム情報D1などが記憶されている。記憶部413としては、例えばHDDが用いられ、また、DRAMなどが併用されてもよい。In addition to the
記憶部413に記憶されている暗号化アルゴリズム情報D1は、MIサーバー1から送信されたものであり、MIサーバー1の記憶部113に記憶されている暗号化アルゴリズム情報D1と同一である。クライアントサーバー4の制御部41は、暗号化アルゴリズム情報D1を用いることで、MIサーバー1と同一の暗号化アルゴリズムに従って分子構造データC1を暗号化し、暗号化分子構造データC2を生成することができる。The encryption algorithm information D1 stored in the
分子構造データC1は、クライアントが保有する化合物の分子構造に係るデータである。また、分子構造データC1は、クライアントにより機密情報として管理されている。
ラベル付き暗号化分子構造データC2Lは、上述のとおり、複数の暗号化分子構造データに固有のラベルが対応付けられたデータである(図4参照)。ラベル付き暗号化分子構造データC2Lに含まれる暗号化分子構造データは、暗号化アルゴリズム情報D1により示される暗号化アルゴリズムに従って制御部41が分子構造データC1を暗号化することにより生成されたものである。
暗号化分子構造データC2は、暗号化アルゴリズム情報D1により示される暗号化アルゴリズムに従って制御部41が分子構造データC1を暗号化することにより生成されたデータである。暗号化分子構造データC2は、ラベル付き暗号化分子構造データC2Lに含まれる暗号化分子構造データと同一のものを含んでいてもよいし、互いに異なっていてもよい。
機能データC3は、分子構造データC1(及び暗号化分子構造データC2)に対応する化合物の機能に係るデータである。機能データC3は、機密情報とはされていないものとする。
The molecular structure data C1 is data relating to the molecular structure of a compound held by a client, and is managed by the client as confidential information.
As described above, the labeled encrypted molecular structure data C2L is data in which unique labels are associated with multiple pieces of encrypted molecular structure data (see FIG. 4). The encrypted molecular structure data included in the labeled encrypted molecular structure data C2L is generated by the
The encrypted molecular structure data C2 is data generated by the
The function data C3 is data related to the function of the compound corresponding to the molecular structure data C1 (and the encrypted molecular structure data C2). The function data C3 is not considered to be confidential information.
操作部42、表示部43及び通信部44の構成は、MIサーバー1の操作部12、表示部13及び通信部14の構成と同様であるので説明は省略する。
The configurations of the
次に、化合物情報処理システム100において化合物の機能予測を行う方法について説明する。化合物の機能予測を行う方法には、学習対象及び機能予測対象の暗号化分子構造データとしてそれぞれ何を用いるかに応じて、複数の方法がある。Next, we will explain how to predict the function of a compound in the compound
MIサーバー1における学習モデルデータD2の生成には、以下の2つの学習対象の暗号化構造データのうち少なくとも一方が用いられる。
(a1)一般データ113aに含まれる暗号化分子構造データA2。
(a2)クライアント由来データ113bに含まれる暗号化分子構造データC2。
To generate the learning model data D2 in the
(a1) Encrypted molecular structure data A2 included in
(a2) Encrypted molecular structure data C2 contained in the client-derived
また、MIサーバー1において機能予測対象とされる暗号化分子構造データには、以下の3つがある。
(b1)クライアント由来データ113bに含まれるラベル付き暗号化分子構造データC2L。
(b2)一般データ113aに含まれる暗号化分子構造データB2のうち、外部(例えば試薬DBサーバー3)から取得した分子構造データB1を暗号化して得られた暗号化分子構造データB2。
(b3)一般データ113aに含まれる暗号化分子構造データB2のうち、MIサーバー1の内部で生成された分子構造データB1を暗号化して得られた暗号化分子構造データB2。
The encrypted molecular structure data that is the subject of function prediction in the
(b1) Labeled encrypted molecular structure data C2L included in the client-derived
(b2) Among the encrypted molecular structure data B2 included in the
(b3) Encrypted molecular structure data B2 included in
以下では、学習対象の暗号化分子構造データ、及び機能予測対象の暗号化分子構造データの組み合わせが異なる以下の<第1の方法>~<第4の方法>を例に挙げて説明する。第1~第4の方法では、いずれも、クライアントサーバー4から外部に機密情報である分子構造データC1を開示(送信)することなく、MIによる化合物の機能の予測結果をクライアントサーバー4で受信することができる。
<第1の方法>
学習対象の暗号化分子構造データ:(a1)
機能予測対象の暗号化分子構造データ:(b1)
<第2の方法>
学習対象の暗号化分子構造データ:(a1)+(a2)
機能予測対象の暗号化分子構造データ:(b2)
<第3の方法>
学習対象の暗号化分子構造データ:(a1)+(a2)
機能予測対象の暗号化分子構造データ:(b3)
<第4の方法>
学習対象の暗号化分子構造データ:(a1)+(a2)
機能予測対象の暗号化分子構造データ:(b1)
The following describes, as examples, the following <First Method> to <Fourth Method>, which have different combinations of encrypted molecular structure data to be learned and encrypted molecular structure data to be predicted for function. In all of the first to fourth methods, the
<First Method>
Encrypted molecular structure data to be learned: (a1)
Encrypted molecular structure data of a function prediction target: (b1)
<Second Method>
Encrypted molecular structure data to be learned: (a1)+(a2)
Encrypted molecular structure data of a function prediction target: (b2)
<Third Method>
Encrypted molecular structure data to be learned: (a1)+(a2)
Encrypted molecular structure data of a function prediction target: (b3)
<Fourth Method>
Encrypted molecular structure data to be learned: (a1)+(a2)
Encrypted molecular structure data of a function prediction target: (b1)
<第1の方法>
図6は、化合物の機能予測に係る第1の方法を説明する図である。
図6では、MIサーバー1、公的DBサーバー2及びクライアントサーバー4により実行される各種データ処理の流れ、及び各サーバー間におけるデータの送受信の流れを示している。以下では簡便のため、制御部11(41)が通信部14(44)を制御して通信部14(44)によりデータを送信させる動作を、単に「制御部11(41)がデータを送信する」と記す。
第1の方法では、学習対象の暗号化分子構造データとして、「(a1)一般データ113aに含まれる暗号化分子構造データA2」が用いられ、機能予測対象の暗号化分子構造データとして、「(b1)クライアント由来データ113bに含まれるラベル付き暗号化分子構造データC2L」が用いられる。
<First Method>
FIG. 6 is a diagram illustrating a first method for predicting the function of a compound.
6 shows the flow of various data processing executed by the
In the first method, “(a1) encrypted molecular structure data A2 included in
第1の方法では、まずMIサーバー1の制御部11は、公的DBサーバー2から、学習対象の分子構造データA1及び対応する機能データA3を取得する(ステップS101:第3のデータ取得ステップ)。In the first method, the
MIサーバー1の制御部11は、取得した分子構造データA1と、記憶部113に予め記憶されている分子構造データA1とを、暗号化アルゴリズム情報D1により示される暗号化アルゴリズムに従って暗号化して暗号化分子構造データA2を生成する(ステップS102:暗号化ステップ)。The
MIサーバー1の制御部11は、生成した暗号化分子構造データA2と、ステップS101で取得した機能データA3及び記憶部113に予め記憶されている機能データA3と、に基づいて、機械学習により学習モデルデータD2を生成する(ステップS103:学習モデル生成ステップ)。既に学習モデルデータD2が記憶部113に記憶されている場合には、制御部11は、学習モデルデータD2を、新たに生成した内容に更新する。
なお、機械学習には、公的DBサーバー2から取得した分子構造データA1の暗号化分子構造データA2、及び記憶部113に予め記憶されていた分子構造データA1の暗号化分子構造データA2のうち一方のみを用いてもよい。
The
In addition, for machine learning, only one of the encrypted molecular structure data A2 of the molecular structure data A1 obtained from the
一方、MIサーバー1の制御部11は、クライアントサーバー4に対して暗号化アルゴリズム情報D1を送信する(ステップS104:情報提供ステップ)。Meanwhile, the
暗号化アルゴリズム情報D1を受信したクライアントサーバー4の制御部41は、機能予測対象の分子構造データC1を、暗号化アルゴリズム情報D1により示される暗号化アルゴリズムに従って暗号化するとともに、ラベルを付与して、機能予測対象のラベル付き暗号化分子構造データC2Lを生成する(ステップS105)。また、制御部41は、MIサーバー1に対してラベル付き暗号化分子構造データC2Lを送信する。これに応じて、MIサーバー1の制御部11は、ラベル付き暗号化分子構造データC2Lを受信する(ステップS106:第1のデータ取得ステップ)。The
MIサーバー1の制御部11は、取得したラベル付き暗号化分子構造データC2Lに含まれる各暗号化分子構造データに対して、学習モデルデータD2により表される学習モデルを適用することで、各暗号化分子構造データに対応する化合物の機能を予測する(ステップS107:予測ステップ)。The
制御部11は、機能の予測結果と、クライアントサーバー4から受信した機能の目標値とを比較し、機能の予測結果が目標値と一致した暗号化分子構造データを特定する(ステップS108)。ここで、機能の予測結果が目標値に一致するとは、機能を呈することを表す指標の値が目標値に一致する場合のほか、当該指標が所定範囲内であること、又は当該指標が所定値以上であること、等としてもよい。The
制御部11は、ステップS108で特定された暗号化分子構造データに対応付けられているラベルを、クライアントサーバー4に送信する(ステップS109)。これに応じて、クライアントサーバー4の制御部41は、ラベル付き暗号化分子構造データC2Lにおいて、受信したラベルに対応する暗号化分子構造データを特定し、当該暗号化分子構造データに対応する化合物を、所望の機能を呈する化合物として特定する。The
以上のように、本実施形態に係るMIサーバー1は、制御部11を備え、当該制御部11は、上述の第1の方法においては、クライアントサーバー4に対して、所定の暗号化アルゴリズムに従った暗号化を実行するための学習モデルデータD2を提供し(情報提供部)、クライアントサーバー4から、上記暗号化アルゴリズムに従って暗号化された機能予測対象のラベル付き暗号化分子構造データC2Lを取得し(第1のデータ取得部)、機能予測対象のラベル付き暗号化分子構造データC2Lに対応する化合物の機能を予測モデルとしての学習モデルに基づいて予測し(予測部)、予測モデルは、化合物の構造に係る構造データを上記暗号化アルゴリズムに従って暗号化して得られた暗号化構造データと、上記化合物の機能に係る機能データとの相関関係を表す。
このように、暗号化後のラベル付き暗号化分子構造データC2Lを受信して機能予測を行うことで、クライアントサーバー4から、機密情報である分子構造データC1を受信せずに必要な処理を行うことができる。よって、MIサーバー1の内部には、クライアントの機密情報が記憶されないため、当該機密情報の安全性を高めることができる。
また、暗号化分子構造データと機能データとの相関関係を表す予測モデル(ここでは、学習モデル)を用いているため、機能予測のためには、機能予測対象の暗号化分子構造データがあれば足り、暗号化分子構造データを復号して分子構造データを生成する必要がない。よって、簡易な処理で化合物の機能予測を行うことができる。
As described above, the
In this way, by receiving the labeled encrypted molecular structure data C2L after encryption and performing function prediction, necessary processing can be performed without receiving the molecular structure data C1, which is confidential information, from the
In addition, since a prediction model (here, a learning model) that expresses the correlation between the encrypted molecular structure data and the function data is used, it is sufficient to have the encrypted molecular structure data of the target function prediction in order to predict the function, and there is no need to decrypt the encrypted molecular structure data to generate molecular structure data. Therefore, the function of a compound can be predicted by a simple process.
また、制御部11は、化合物の構造に係る分子構造データA1を所定の暗号化アルゴリズムに従って暗号化して暗号化分子構造データA2を生成し(暗号化部)、暗号化分子構造データA2、及び化合物の機能に係る機能データA3に基づいて、予測モデルとしての学習モデルを生成する(学習モデル生成部)。これによれば、MIサーバー1において学習モデルを生成することができる。また、暗号化分子構造データを用いて学習モデルを生成しているため、学習モデルを用いた機能予測のためには、機能予測対象の暗号化分子構造データがあれば足り、暗号化分子構造データを復号して分子構造データを生成する必要がない。よって、簡易な処理で化合物の機能予測を行うことができる。
The
また、制御部11は、公的DBサーバー2から分子構造データA1及び機能データA3を取得し(第3のデータ取得部)、取得した分子構造データA1に基づいて暗号化分子構造データA2を生成し(暗号化部)、当該暗号化分子構造データA2、及び公的DBサーバー2から取得した機能データA3を少なくとも用いて学習モデルデータD2を生成する(学習モデル生成部)。これにより、公的DBサーバー2が開示している多数の化合物の情報を用いて学習モデルを生成することができる。よって、学習モデルによる化合物の機能の予測精度を高めることができる。
Furthermore, the
また、暗号化アルゴリズムは、暗号化前の構造データへの逆変換が不可能である。これによれば、MIサーバー1において、クライアントサーバー4から受信したラベル付き暗号化分子構造データC2Lを復号して分子構造データC1を特定することができない。よって、クライアントは、MIサーバー1の管理者を含む任意の部外者に対して機密情報である分子構造データC1を開示することなく、MIによる情報提供サービスを受けることができる。
Furthermore, the encryption algorithm does not allow reverse conversion back to the structure data before encryption. This means that the
また、第1の方法では、プログラム113cは、MIサーバー1に設けられたコンピューターとしての制御部11を、クライアントサーバー4に対して、所定の暗号化アルゴリズムに従った暗号化を実行するための暗号化アルゴリズム情報D1を提供する情報提供手段、クライアントサーバー4から、上記暗号化アルゴリズムに従って暗号化された機能予測対象のラベル付き暗号化分子構造データC2Lを取得する第1のデータ取得手段(データ取得手段)、機能予測対象のラベル付き暗号化分子構造データC2Lに対応する化合物の機能を予測モデルとしての学習モデルに基づいて予測する予測手段、として機能させ、予測モデルは、化合物の構造に係る構造データを上記暗号化アルゴリズムに従って暗号化して得られた暗号化構造データと、上記化合物の機能に係る機能データとの相関関係を表す。
このようなプログラムによりMIサーバー1を動作させることで、クライアントサーバー4から、機密情報である分子構造データC1を受信せずに必要な処理を行うことができる。よって、MIサーバー1の内部には、クライアントの機密情報が記憶されないため、当該機密情報の安全性を高めることができる。また、学習モデルを用いた機能予測のためには、機能予測対象の暗号化分子構造データがあれば足り、暗号化分子構造データを復号して分子構造データを生成する必要がないため、簡易な処理で化合物の機能予測を行うことができる。
In addition, in the first method, the
By operating the
また、情報処理方法としての第1の方法は、クライアントサーバー4に対して、所定の暗号化アルゴリズムに従った暗号化を実行するための暗号化アルゴリズム情報D1を提供する情報提供ステップと、クライアントサーバー4から、上記暗号化アルゴリズムに従って暗号化された機能予測対象のラベル付き暗号化分子構造データC2Lを取得する第1のデータ取得ステップ(データ取得ステップ)と、機能予測対象のラベル付き暗号化分子構造データC2Lに対応する化合物の機能を予測モデルとしての学習モデルに基づいて予測する予測ステップと、を含み、予測モデルは、化合物の構造に係る構造データを上記暗号化アルゴリズムに従って暗号化して得られた暗号化構造データと、上記化合物の機能に係る機能データとの相関関係を表す。
このような方法によれば、クライアントサーバー4から、機密情報である分子構造データC1を受信せずに必要な処理を行うことができる。よって、MIサーバー1の内部には、クライアントの機密情報が記憶されないため、当該機密情報の安全性を高めることができる。また、学習モデルを用いた機能予測のためには、機能予測対象の暗号化分子構造データがあれば足り、暗号化分子構造データを復号して分子構造データを生成する必要がないため、簡易な処理で化合物の機能予測を行うことができる。
また、このような方法の一部は人の手により行うこともでき、これによれば、装置を作りこまなくても多様な化合物の機能予測に効率よく対応することができる。
Further, the first method as an information processing method includes an information providing step of providing a
According to this method, necessary processing can be performed without receiving the molecular structure data C1, which is confidential information, from the
Furthermore, some of these methods can be performed manually, which makes it possible to efficiently predict the functions of a variety of compounds without the need for elaborate equipment.
<第2の方法>
図7は、化合物の機能予測に係る第2の方法を説明する図である。
図7では、MIサーバー1、公的DBサーバー2、試薬DBサーバー3及びクライアントサーバー4により行われる各種データ処理の流れ、及び各サーバー間におけるデータの送受信の流れを示している。
第2の方法では、学習対象の暗号化分子構造データとして、「(a1)一般データ113aに含まれる暗号化分子構造データA2」及び「(a2)クライアント由来データ113bに含まれる暗号化分子構造データC2」が用いられ、機能予測対象の暗号化分子構造データとして、「(b2)一般データ113aに含まれる暗号化分子構造データB2のうち、外部(例えば試薬DBサーバー3)から取得した分子構造データB1を暗号化して得られた暗号化分子構造データB2」が用いられる。
<Second Method>
FIG. 7 is a diagram illustrating a second method for predicting the function of a compound.
FIG. 7 shows the flow of various data processes performed by the
In the second method, "(a1) encrypted molecular structure data A2 included in the
第2の方法では、まずMIサーバー1の制御部11は、公的DBサーバー2から、学習対象の分子構造データA1及び対応する機能データA3を取得する(ステップS201:第3のデータ取得ステップ)。In the second method, first, the
MIサーバー1の制御部11は、取得した分子構造データA1と、記憶部113に予め記憶されている分子構造データA1とを、暗号化アルゴリズム情報D1により示される暗号化アルゴリズムに従って暗号化して暗号化分子構造データA2を生成する(ステップS202:暗号化ステップ)。The
MIサーバー1の制御部11は、クライアントサーバー4に対して暗号化アルゴリズム情報D1を送信する(ステップS203:情報提供ステップ)。The
暗号化アルゴリズム情報D1を受信したクライアントサーバー4の制御部41は、学習対象の分子構造データC1を、暗号化アルゴリズム情報D1により示される暗号化アルゴリズムに従って暗号化して暗号化分子構造データC2を生成する(ステップS204)。また、制御部41は、MIサーバー1に対して、学習対象の暗号化分子構造データC2及び対応する学習対象の機能データC3を送信する。これに応じて、MIサーバー1の制御部11は、学習対象の暗号化分子構造データC2及び機能データC3を受信する(ステップS205:第1のデータ取得ステップ)。The
MIサーバー1の制御部11は、ステップS202で生成した暗号化分子構造データA2、ステップS201で公的DBサーバー2から取得した機能データA3、記憶部113に予め記憶されている機能データA3、ステップS205でクライアントサーバー4から取得した暗号化分子構造データC2及び機能データC3に基づいて、機械学習により学習モデルデータD2を生成する(ステップS206:学習モデル生成ステップ)。既に学習モデルデータD2が記憶部113に記憶されている場合には、制御部11は、学習モデルデータD2を、新たに生成した内容に更新する。
なお、機械学習には、公的DBサーバー2から取得した分子構造データA1の暗号化分子構造データA2、記憶部113に予め記憶されていた分子構造データA1の暗号化分子構造データA2、及びクライアントサーバー4から取得した暗号化分子構造データC2のうち一部のみを用いてもよい。
The
In addition, for machine learning, only a portion of the encrypted molecular structure data A2 of the molecular structure data A1 obtained from the
一方、MIサーバー1の制御部11は、試薬DBサーバー3から機能予測対象の分子構造データB1を取得し(ステップS207:第2のデータ取得ステップ)、暗号化アルゴリズム情報D1により示される暗号化アルゴリズムに従って暗号化して暗号化分子構造データB2を生成する(ステップS208)。Meanwhile, the
MIサーバー1の制御部11は、ステップS208で生成した暗号化分子構造データB2に対して、学習モデルデータD2により表される学習モデルを適用することで、各暗号化分子構造データに対応する化合物の機能を予測する(ステップS209:予測ステップ)。The
制御部11は、機能の予測結果と、クライアントサーバー4から受信した機能の目標値とを比較し、機能の予測結果画像目標値と一致する暗号化分子構造データB2を特定する(ステップS210)。The
制御部11は、ステップS210で特定された暗号化分子構造データB2に対応する分子構造データB1を、クライアントサーバー4に送信する(ステップS211)。これに応じて、クライアントサーバー4の制御部41は、受信した分子構造データB1に係る化合物を、所望の機能を呈する化合物として特定する。The
以上のように、第2の方法においては、MIサーバー1の制御部11は、化合物の構造に係る構造データを所定の暗号化アルゴリズムに従って暗号化して暗号化構造データを生成し(暗号化部)、暗号化構造データ、及び化合物の機能に係る機能データに基づいて、暗号化構造データと機能データとの相関関係を表す学習モデルデータD2を生成し(学習モデル生成部)、クライアントサーバー4に対して、暗号化アルゴリズムに従った暗号化を実行するための暗号化アルゴリズム情報D1を提供し(情報提供部)、クライアントサーバー4から、上記暗号化アルゴリズムに従って暗号化された学習対象の暗号化分子構造データC2、及び当該暗号化分子構造データC2に対応する化合物の機能に係る学習対象の機能データC3を取得し(第1のデータ取得部)、取得した学習対象の暗号化分子構造データC2及び学習対象の機能データC3を少なくとも用いて学習モデルデータD2を生成する(学習モデル生成部)。
このように、暗号化後の暗号化分子構造データC2を受信して機能予測を行うことで、クライアントサーバー4から、機密情報である分子構造データC1を受信せずに必要な処理を行うことができる。よって、MIサーバー1の内部には、クライアントの機密情報が記憶されないため、当該機密情報の安全性を高めることができる。
また、このように化合物の構造に係る機密情報の安全性を高められることによって、非公開の化合物の構造に係る情報(学習対象の暗号化分子構造データ及び機能データ)を収集しやすくなるため、より多数の化合物の情報を用いて学習モデルの予測精度を高めることができる。
また、クライアントが所望する機能を呈する化合物は、クライアントが管理、所有している既存の化合物と構造が類似している化合物から特定される場合が多い。よって、第2の方法のように、クライアントサーバー4から受信した暗号化分子構造データC2及び機能データC3を用いて学習モデルを生成することにより、クライアントが所望する機能を呈するか否かをより高精度に予測可能な学習モデルが得られる。
また、暗号化分子構造データを用いて学習モデルを生成しているため、学習モデルを用いた機能予測のためには、機能予測対象の暗号化分子構造データがあれば足り、暗号化分子構造データを復号して分子構造データを生成する必要がない。よって、簡易な処理で化合物の機能予測を行うことができる。
これにより、
As described above, in the second method, the
In this way, by receiving the encrypted molecular structure data C2 after encryption and performing function prediction, necessary processing can be performed without receiving the molecular structure data C1, which is confidential information, from the
In addition, by increasing the security of confidential information related to compound structures in this manner, it becomes easier to collect information related to non-public compound structures (encrypted molecular structure data and functional data of the learning target), making it possible to improve the predictive accuracy of the learning model using information on a larger number of compounds.
Furthermore, a compound exhibiting a function desired by a client is often identified from compounds having a structure similar to that of an existing compound managed and owned by the client. Therefore, as in the second method, a learning model is generated using the encrypted molecular structure data C2 and the function data C3 received from the
In addition, since the learning model is generated using the encrypted molecular structure data, the encrypted molecular structure data of the function prediction target is sufficient for function prediction using the learning model, and there is no need to decrypt the encrypted molecular structure data to generate molecular structure data. Therefore, the function of a compound can be predicted by a simple process.
This means:
また、制御部11は、化合物の構造を公開する試薬DBサーバー3から当該化合物の構造に係る分子構造データB1を取得し(第2のデータ取得部)、取得した分子構造データB1を暗号化して機能予測対象の暗号化分子構造データB2を生成し(暗号化部)、生成した機能予測対象の暗号化分子構造データB2に対応する化合物の機能を学習モデルデータD2に基づいて予測する(予測部)。これにより、試薬DBサーバー3が公開している多数の化合物の中から、クライアントが所望する機能を呈する化合物を特定することができる。
The
また、第2の方法では、プログラム113cは、MIサーバー1に設けられたコンピューターとしての制御部11を、化合物の構造に係る構造データを所定の暗号化アルゴリズムに従って暗号化して暗号化構造データを生成する暗号化手段、暗号化構造データ、及び化合物の機能に係る機能データに基づいて、暗号化構造データと機能データとの相関関係を表す学習モデルデータD2を生成する学習モデル生成手段、クライアントサーバー4に対して、暗号化アルゴリズムに従った暗号化を実行するための暗号化アルゴリズム情報D1を提供する情報提供手段、クライアントサーバー4から、上記暗号化アルゴリズムに従って暗号化された学習対象の暗号化分子構造データC2、及び当該暗号化分子構造データC2に対応する化合物の機能に係る学習対象の機能データC3を取得する第1のデータ取得手段(データ取得手段)、として機能させ、学習モデル生成手段は、第1のデータ取得手段が取得した学習対象の暗号化分子構造データC2及び学習対象の機能データC3を少なくとも用いて学習モデルデータD2を生成する。
このようなプログラムによりMIサーバー1を動作させることで、クライアントサーバー4から、機密情報である分子構造データC1を受信せずに必要な処理を行うことができる。よって、MIサーバー1の内部には、クライアントの機密情報が記憶されないため、当該機密情報の安全性を高めることができる。また、機密情報の安全性を高められることによって、非公開の化合物の構造に係る情報を収集しやすくなるため、より多数の化合物の情報を用いて学習モデルの予測精度を高めることができる。また、クライアントサーバー4から受信した暗号化分子構造データC2及び機能データC3を用いて学習モデルを生成することにより、クライアントが所望する機能を呈するか否かをより高精度に予測可能な学習モデルが得られる。また、学習モデルを用いた機能予測のためには、機能予測対象の暗号化分子構造データがあれば足り、暗号化分子構造データを復号して分子構造データを生成する必要がないため、簡易な処理で化合物の機能予測を行うことができる。
In addition, in the second method, the
By operating the
また、情報処理方法としての第2の方法は、化合物の構造に係る構造データを所定の暗号化アルゴリズムに従って暗号化して暗号化構造データを生成する暗号化ステップと、暗号化構造データ、及び化合物の機能に係る機能データに基づいて、暗号化構造データと機能データとの相関関係を表す学習モデルデータD2を生成する学習モデル生成ステップと、クライアントサーバー4に対して、暗号化アルゴリズムに従った暗号化を実行するための暗号化アルゴリズム情報D1を提供する情報提供ステップと、クライアントサーバー4から、上記暗号化アルゴリズムに従って暗号化された学習対象の暗号化分子構造データC2、及び当該暗号化分子構造データC2に対応する化合物の機能に係る学習対象の機能データC3を取得する第1のデータ取得ステップ(データ取得ステップ)と、を含み、学習モデル生成ステップでは、第1のデータ取得ステップにおいて取得した学習対象の暗号化分子構造データC2及び学習対象の機能データC3を少なくとも用いて学習モデルデータD2を生成する。
このような方法によれば、クライアントサーバー4から、機密情報である分子構造データC1を受信せずに必要な処理を行うことができる。よって、MIサーバー1の内部には、クライアントの機密情報が記憶されないため、当該機密情報の安全性を高めることができる。また、機密情報の安全性を高められることによって、非公開の化合物の構造に係る情報を収集しやすくなるため、より多数の化合物の情報を用いて学習モデルの予測精度を高めることができる。また、クライアントサーバー4から受信した暗号化分子構造データC2及び機能データC3を用いて学習モデルを生成することにより、クライアントが所望する機能を呈するか否かをより高精度に予測可能な学習モデルが得られる。また、学習モデルを用いた機能予測のためには、機能予測対象の暗号化分子構造データがあれば足り、暗号化分子構造データを復号して分子構造データを生成する必要がないため、簡易な処理で化合物の機能予測を行うことができる。
また、このような方法の一部は人の手により行うこともでき、これによれば、装置を作りこまなくても多様な化合物の機能予測に効率よく対応することができる。
In addition, the second method as an information processing method includes an encryption step of encrypting structural data relating to the structure of the compound according to a predetermined encryption algorithm to generate encrypted structural data, a learning model generation step of generating learning model data D2 representing the correlation between the encrypted structural data and functional data based on the encrypted structural data and functional data relating to the function of the compound, an information provision step of providing a
According to this method, necessary processing can be performed without receiving the molecular structure data C1, which is confidential information, from the
Furthermore, some of these methods can be performed manually, which makes it possible to efficiently predict the functions of a variety of compounds without the need for elaborate equipment.
<第3の方法>
図8は、化合物の機能予測に係る第3の方法を説明する図である。
第3の方法では、学習対象の暗号化分子構造データとして、「(a1)一般データ113aに含まれる暗号化分子構造データA2」及び「(a2)クライアント由来データ113bに含まれる暗号化分子構造データC2」が用いられ、機能予測対象の暗号化分子構造データとして、「(b3)一般データ113aに含まれる暗号化分子構造データB2のうち、MIサーバー1の内部で生成された分子構造データB1を暗号化して得られた暗号化分子構造データB2」が用いられる。
<Third Method>
FIG. 8 is a diagram illustrating a third method for predicting the function of a compound.
In the third method, "(a1) encrypted molecular structure data A2 included in
第3の方法におけるステップS301~S306は、第2の方法のステップS201~S206と同様であるので説明は省略する。 Steps S301 to S306 in the third method are similar to steps S201 to S206 in the second method, so explanation is omitted.
MIサーバー1の制御部11は、遺伝的アルゴリズムなどを用いて機械的かつランダムに複数の分子構造データB1を生成し(ステップS307)、暗号化アルゴリズム情報D1により示される暗号化アルゴリズムに従って暗号化して複数の暗号化分子構造データB2を生成する(ステップS308)。ステップS309(予測ステップ)では、ステップS308で生成した暗号化分子構造データB2を機能予測対象の暗号化分子構造データとして用いて、機能予測を行う。
ステップS310、S311は、第2の方法のステップS210、S211と同様であるので説明は省略する。
The
Steps S310 and S311 are similar to steps S210 and S211 in the second method, and therefore a description thereof will be omitted.
以上のように、第3の方法においては、MIサーバー1の制御部11は、分子構造データB1を生成し(構造データ生成部)、生成した分子構造データB1を暗号化して機能予測対象の暗号化分子構造データB2を生成し(暗号化部)、生成した機能予測対象の暗号化分子構造データB2に対応する化合物の機能を学習モデルデータD2に基づいて予測する(予測部)。これにより、MIサーバー1の外部から十分な機能予測対象の化合物のデータを取得できない場合などにおいても、クライアントが所望する機能を呈する化合物を特定できる可能性を高めることができる。As described above, in the third method, the
<第4の方法>
図9は、化合物の機能予測に係る第4の方法を説明する図である。
第4の方法では、学習対象の暗号化分子構造データとして、「(a1)一般データ113aに含まれる暗号化分子構造データA2」及び「(a2)クライアント由来データ113bに含まれる暗号化分子構造データC2」が用いられ、機能予測対象の暗号化分子構造データとして、「(b1)クライアント由来データ113bに含まれるラベル付き暗号化分子構造データC2L。」が用いられる。
<Fourth Method>
FIG. 9 is a diagram illustrating a fourth method for predicting the function of a compound.
In the fourth method, “(a1) encrypted molecular structure data A2 included in
第4の方法のステップS401~S403、S406は、第3の方法のステップS301~S303、S306と同様であるので説明は省略する。 Steps S401 to S403 and S406 of the fourth method are similar to steps S301 to S303 and S306 of the third method, so explanation is omitted.
ステップS403で暗号化アルゴリズム情報D1を受信したクライアントサーバー4の制御部41は、分子構造データC1を暗号化アルゴリズム情報D1により示される暗号化アルゴリズムに従って暗号化して、学習対象の暗号化分子構造データC2と、機能予測対象のラベル付き暗号化分子構造データC2Lとを生成する(ステップS404)。また、制御部41は、MIサーバー1に対して、学習対象の暗号化分子構造データC2及び対応する学習対象の機能データC3を送信し、MIサーバー1の制御部11は、当該学習対象の暗号化分子構造データC2及び機能データC3を受信する(ステップS405:第1のデータ取得ステップ)。また、制御部41は、MIサーバー1に対して、機能予測対象のラベル付き暗号化分子構造データC2Lを送信し、MIサーバー1の制御部11は、当該ラベル付き暗号化分子構造データC2Lを受信する(ステップS407:第1のデータ取得ステップ)。The
MIサーバー1の制御部11は、ステップS407で取得したラベル付き暗号化分子構造データC2Lに含まれる各暗号化分子構造データに対して、学習モデルデータD2により表される学習モデルを適用することで、各暗号化分子構造データに対応する化合物の機能を予測する(ステップS408:予測ステップ)。
以降のステップS409、S410は、第1の方法のステップS108、S109と同様であるので説明は省略する。
The
The subsequent steps S409 and S410 are similar to steps S108 and S109 in the first method, and therefore a description thereof will be omitted.
以上のように、第4の方法においては、MIサーバー1の制御部11は、クライアントサーバー4から、暗号化された学習対象の暗号化分子構造データC2、及び機能データC3を取得し(第1のデータ取得部)、取得した暗号化分子構造データC2及び機能データC3を少なくとも用いて学習モデルデータD2を生成し(学習モデル生成部)、クライアントサーバー4から、暗号化アルゴリズムに従って暗号化された機能予測対象のラベル付き暗号化分子構造データC2Lを取得し(第1のデータ取得部)、取得した機能予測対象のラベル付き暗号化分子構造データC2Lに対応する化合物の機能を学習モデルデータD2に基づいて予測する(予測部)。これにより、クライアントが所望する機能を呈するか否かをより高精度に予測可能な学習モデルを生成できるとともに、クライアントから提供された暗号化分子構造データC2の中から、クライアントが所望する機能を呈する化合物を特定することできる。As described above, in the fourth method, the
なお、本発明は、上記実施形態及び各変形例に限られるものではなく、様々な変更が可能である。
例えば、上記実施形態では、機能予測対象の暗号化分子構造データとして、クライアントサーバー4から取得した暗号化分子構造データC2(第1の方法)、試薬DBサーバー3から取得した分子構造データB1の暗号化分子構造データB2(第2の方法)、MIサーバー1の内部で生成した分子構造データB1の暗号化分子構造データB2(第3の方法)を例示したが、これに限定する趣旨ではない。機能予測対象の暗号化分子構造データとしては、化合物の分子構造データを暗号化した任意の暗号化分子構造データを用いることができ、その取得経路は本実施形態に例示したものに限られない。
一例を挙げると、第2の方法又は第3の方法において、クライアントサーバー4から機能予測対象の暗号化分子構造データC2を取得してもよい。
The present invention is not limited to the above-described embodiment and each of the modified examples, and various modifications are possible.
For example, in the above embodiment, examples of encrypted molecular structure data for which function prediction is to be performed include encrypted molecular structure data C2 (first method) obtained from the
As one example, in the second or third method, the encrypted molecular structure data C2 of the function prediction target may be acquired from the
また、上記実施形態では、不可逆の暗号化アルゴリズムを用いる例を挙げて説明したが、これに限られず、可逆の暗号化アルゴリズムを用いてもよい。この場合においても、例えばMIサーバー1内の暗号化分子構造データC2に外部から不正にアクセスされたとしても、不正にアクセスした第三者は、暗号化アルゴリズムを特定できないため暗号化分子構造データC2を復号して分子構造データC1を得ることはできない。よって、可逆の暗号化アルゴリズムを用いた場合であっても、クライアントの機密情報(分子構造データC1)の安全性を高める効果が得られる。
また、暗号化アルゴリズムは、ハッシュ関数を用いるものに限られない。
In the above embodiment, an example of using an irreversible encryption algorithm has been described, but the present invention is not limited to this, and a reversible encryption algorithm may be used. Even in this case, even if the encrypted molecular structure data C2 in the
Furthermore, the encryption algorithm is not limited to one that uses a hash function.
また、上記実施形態では、MIサーバー1において学習モデルを生成したが、これに限られず、既存の学習モデル(例えば外部装置において生成された学習モデル)をそのまま用いてもよい。この場合には、MIサーバー1は学習モデルの生成機能(学習モデル生成部)を有していなくてもよい。また、この態様において、機能予測対象の暗号化分子構造データをMIサーバー1の外部から取得する場合には、MIサーバー1は、分子構造データを暗号化する機能(暗号化部)を有していなくてもよい。
In addition, in the above embodiment, the learning model was generated in
また、上記実施形態では、帰納的アプローチで機械学習により生成された学習モデルを用いる例を挙げて説明したが、化合物の機能予測に用いる予測モデルは、この学習モデルに限られない。予測モデルとしては、例えば、化合物についての既知の原理や規則性から化合物の機能を予測する演繹的予測モデルを用いてもよい。演繹的予測モデルを用いる場合にも、MIサーバー1は、学習モデルの生成機能(学習モデル生成部)を有していなくてもよい。また、機能予測対象の暗号化分子構造データをMIサーバー1の外部から取得する場合には、MIサーバー1は、分子構造データを暗号化する機能(暗号化部)を有していなくてもよい。In addition, in the above embodiment, an example of using a learning model generated by machine learning using an inductive approach has been described, but the prediction model used to predict the function of a compound is not limited to this learning model. As a prediction model, for example, a deductive prediction model that predicts the function of a compound from known principles and regularities about the compound may be used. Even when a deductive prediction model is used, the
また、上記実施形態では、MIサーバー1、公的DBサーバー2、試薬DBサーバー3及びクライアントサーバー4の各々が、それぞれ単一のサーバー装置からなる例を用いて説明したが、これに限られず、これらのうち任意のサーバー装置を複数の装置からなるシステムに置き換えてもよい。例えば、MIサーバー1の記憶部113に記憶されているプログラム及びデータの少なくとも一部を、MIサーバー1の外部の記憶装置に記憶させてもよい。In addition, in the above embodiment, the
本発明のいくつかの実施形態を説明したが、本発明の範囲は、上述の実施の形態に限定されるものではなく、特許請求の範囲に記載された発明の範囲とその均等の範囲を含む。 Although several embodiments of the present invention have been described, the scope of the present invention is not limited to the above-described embodiments, but includes the scope of the invention described in the claims and their equivalents.
本発明は、情報処理装置、プログラム及び情報処理方法に利用することができる。 The present invention can be used in information processing devices, programs and information processing methods.
1 MIサーバー(情報処理装置)
11 制御部(暗号化部、学習モデル生成部、情報提供部、第1~第3のデータ取得部、予測部、構造データ生成部)
111 CPU
112 RAM
113 記憶部
113a 一般データ
113b クライアント由来データ
113c プログラム
12 操作部
13 表示部
14 通信部
15 バス
2 公的DBサーバー(データベース)
3 試薬DBサーバー(第2の外部装置)
4 クライアントサーバー(第1の外部装置)
41 制御部
411 CPU
412 RAM
413 記憶部
413a プログラム
42 操作部
43 表示部
44 通信部
45 バス
100 化合物情報処理システム
A1、B1、C1 分子構造データ(構造データ)
A2、B2、C2 暗号化分子構造データ(暗号化構造データ)
C2L ラベル付き暗号化分子構造データ(暗号化構造データ)
C3 機能データ
D1 暗号化アルゴリズム情報
D2 学習モデルデータ
N 通信ネットワーク
1. MI server (information processing device)
11 Control unit (encryption unit, learning model generation unit, information provision unit, first to third data acquisition units, prediction unit, structured data generation unit)
111 CPU
112 RAM
113
3. Reagent DB server (second external device)
4. Client Server (first external device)
41
412 RAM
413
A2, B2, C2 Encrypted molecular structure data (encrypted structure data)
C2L Labeled encrypted molecular structure data (encrypted structure data)
C3 Function data D1 Encryption algorithm information D2 Learning model data N Communication network
Claims (13)
前記第1の外部装置から、前記暗号化アルゴリズムに従って暗号化された機能予測対象の暗号化構造データを取得する第1のデータ取得部と、
前記機能予測対象の暗号化構造データに対応する化合物の機能を所定の予測モデルに基づいて予測する予測部と、
を備え、
前記予測モデルは、化合物の構造に係る構造データを前記暗号化アルゴリズムに従って暗号化して得られた暗号化構造データと、前記化合物の機能に係る機能データとの相関関係を表す、情報処理装置。 an information providing unit that provides the first external device with encryption algorithm information for performing encryption according to a predetermined encryption algorithm;
a first data acquisition unit that acquires encrypted structure data of a function prediction target encrypted according to the encryption algorithm from the first external device;
a prediction unit that predicts a function of a compound corresponding to the encrypted structure data of the function prediction target based on a predetermined prediction model;
Equipped with
The prediction model represents a correlation between encrypted structure data obtained by encrypting structure data relating to a structure of a compound according to the encryption algorithm and function data relating to a function of the compound.
前記暗号化構造データ、及び前記化合物の機能に係る機能データに基づいて、前記予測モデルとしての学習モデルを生成する学習モデル生成部と、
を備える、請求項1に記載の情報処理装置。 an encryption unit that encrypts structure data relating to a compound structure according to the encryption algorithm to generate encrypted structure data;
a learning model generation unit that generates a learning model as the prediction model based on the encrypted structure data and function data related to the function of the compound;
The information processing device according to claim 1 .
前記学習モデル生成部は、前記第1のデータ取得部が取得した前記学習対象の暗号化構造データ及び前記学習対象の機能データを少なくとも用いて前記学習モデルを生成する、請求項2に記載の情報処理装置。 the first data acquisition unit acquires, from the first external device, encrypted structural data of a learning object encrypted according to the encryption algorithm, and functional data of a learning object related to a function of a compound corresponding to the encrypted structural data of the learning object;
The information processing device according to claim 2 , wherein the learning model generation unit generates the learning model using at least the encrypted structure data of the learning object and the functional data of the learning object acquired by the first data acquisition unit.
前記暗号化構造データ、及び前記化合物の機能に係る機能データに基づいて、前記暗号化構造データと前記機能データとの相関関係を表す学習モデルを生成する学習モデル生成部と、
第1の外部装置に対して、前記暗号化アルゴリズムに従った暗号化を実行するための暗号化アルゴリズム情報を提供する情報提供部と、
前記第1の外部装置から、前記暗号化アルゴリズムに従って暗号化された学習対象の暗号化構造データ、及び当該暗号化構造データに対応する化合物の機能に係る学習対象の機能データを取得する第1のデータ取得部と、
を備え、
前記学習モデル生成部は、前記第1のデータ取得部が取得した前記学習対象の暗号化構造データ及び前記学習対象の機能データを少なくとも用いて前記学習モデルを生成する、情報処理装置。 an encryption unit that encrypts structure data relating to a compound structure according to a predetermined encryption algorithm to generate encrypted structure data;
a learning model generating unit that generates a learning model that represents a correlation between the encrypted structure data and the functional data, based on the encrypted structure data and functional data related to a function of the compound;
an information providing unit that provides a first external device with encryption algorithm information for performing encryption according to the encryption algorithm;
a first data acquisition unit that acquires, from the first external device, encrypted structure data of a learning object encrypted according to the encryption algorithm, and function data of a learning object related to a function of a compound corresponding to the encrypted structure data;
Equipped with
An information processing device, wherein the learning model generation unit generates the learning model using at least the encrypted structure data of the learning target and the functional data of the learning target acquired by the first data acquisition unit.
当該情報処理装置は、前記第1のデータ取得部が取得した前記機能予測対象の暗号化構造データに対応する化合物の機能を前記学習モデルに基づいて予測する予測部を備える、請求項4に記載の情報処理装置。 The first data acquisition unit acquires encrypted structure data of a function prediction target encrypted according to the encryption algorithm from the first external device,
The information processing device according to claim 4 , further comprising a prediction unit configured to predict, based on the learning model, a function of a compound corresponding to the encrypted structure data of the function prediction target acquired by the first data acquisition unit.
前記暗号化部は、前記構造データ生成部が生成した前記構造データを暗号化して機能予測対象の前記暗号化構造データを生成し、
前記予測部は、前記暗号化部が生成した前記機能予測対象の暗号化構造データに対応する化合物の機能を前記学習モデルに基づいて予測する、請求項2、3、5のいずれか一項に記載の情報処理装置。 a structure data generating unit that generates the structure data,
The encryption unit encrypts the structure data generated by the structure data generation unit to generate the encrypted structure data of a function prediction target;
The information processing device according to claim 2 , wherein the prediction unit predicts a function of a compound corresponding to the encrypted structure data of the function prediction target generated by the encryption unit based on the learning model.
前記暗号化部は、前記第2のデータ取得部が取得した前記構造データを暗号化して機能予測対象の前記暗号化構造データを生成し、
前記予測部は、前記暗号化部が生成した前記機能予測対象の暗号化構造データに対応する化合物の機能を前記学習モデルに基づいて予測する、請求項2、3、5のいずれか一項に記載の情報処理装置。 a second data acquisition unit that acquires structural data relating to a structure of the compound from a second external device that publishes the structure of the compound;
The encryption unit encrypts the structure data acquired by the second data acquisition unit to generate the encrypted structure data of a function prediction target;
The information processing device according to claim 2 , wherein the prediction unit predicts a function of a compound corresponding to the encrypted structure data of the function prediction target generated by the encryption unit based on the learning model.
前記暗号化部は、前記第3のデータ取得部が取得した前記構造データに基づいて前記暗号化構造データを生成し、
前記学習モデル生成部は、当該暗号化構造データ、及び前記第3のデータ取得部が取得した前記機能データを少なくとも用いて前記学習モデルを生成する、請求項2~7のいずれか一項に記載の情報処理装置。 a third data acquisition unit that acquires the structure data and the function data from an external predetermined database;
The encryption unit generates the encrypted structure data based on the structure data acquired by the third data acquisition unit,
The information processing device according to any one of claims 2 to 7, wherein the learning model generation unit generates the learning model using at least the encrypted structure data and the functional data acquired by the third data acquisition unit.
第1の外部装置に対して、所定の暗号化アルゴリズムに従った暗号化を実行するための暗号化アルゴリズム情報を提供する情報提供手段、
前記第1の外部装置から、前記暗号化アルゴリズムに従って暗号化された機能予測対象の暗号化構造データを取得するデータ取得手段、
前記機能予測対象の暗号化構造データに対応する化合物の機能を所定の予測モデルに基づいて予測する予測手段、
として機能させ、
前記予測モデルは、化合物の構造に係る構造データを前記暗号化アルゴリズムに従って暗号化して得られた暗号化構造データと、前記化合物の機能に係る機能データとの相関関係を表す、プログラム。 A computer installed in the information processing device,
an information providing means for providing the first external device with encryption algorithm information for performing encryption according to a predetermined encryption algorithm;
a data acquisition means for acquiring encrypted structure data of a function prediction target encrypted according to the encryption algorithm from the first external device;
a prediction means for predicting a function of a compound corresponding to the encrypted structure data of the function prediction target based on a predetermined prediction model;
Function as a
The prediction model is a program that represents the correlation between encrypted structural data obtained by encrypting structural data relating to a structure of a compound according to the encryption algorithm, and functional data relating to a function of the compound.
化合物の構造に係る構造データを所定の暗号化アルゴリズムに従って暗号化して暗号化構造データを生成する暗号化手段、
前記暗号化構造データ、及び前記化合物の機能に係る機能データに基づいて、前記暗号化構造データと前記機能データとの相関関係を表す学習モデルを生成する学習モデル生成手段、
第1の外部装置に対して、前記暗号化アルゴリズムに従った暗号化を実行するための暗号化アルゴリズム情報を提供する情報提供手段、
前記第1の外部装置から、前記暗号化アルゴリズムに従って暗号化された学習対象の暗号化構造データ、及び当該暗号化構造データに対応する化合物の機能に係る学習対象の機能データを取得するデータ取得手段、
として機能させ、
前記学習モデル生成手段は、前記データ取得手段が取得した前記学習対象の暗号化構造データ及び前記学習対象の機能データを少なくとも用いて前記学習モデルを生成する、プログラム。 A computer installed in the information processing device,
an encryption means for encrypting structural data relating to a compound structure according to a predetermined encryption algorithm to generate encrypted structural data;
a learning model generating means for generating a learning model representing a correlation between the encrypted structure data and functional data relating to a function of the compound, based on the encrypted structure data and functional data relating to a function of the compound;
an information providing means for providing a first external device with encryption algorithm information for performing encryption according to the encryption algorithm;
a data acquisition means for acquiring, from the first external device, encrypted structure data of a learning subject encrypted according to the encryption algorithm, and function data of a learning subject relating to a function of a compound corresponding to the encrypted structure data;
Function as a
The learning model generation means is a program that generates the learning model using at least the encrypted structure data of the learning subject and the functional data of the learning subject acquired by the data acquisition means.
第1の外部装置に対して、所定の暗号化アルゴリズムに従った暗号化を実行するための暗号化アルゴリズム情報を提供する情報提供ステップと、
前記第1の外部装置から、前記暗号化アルゴリズムに従って暗号化された機能予測対象の暗号化構造データを取得するデータ取得ステップと、
前記機能予測対象の暗号化構造データに対応する化合物の機能を所定の予測モデルに基づいて予測する予測ステップと、
を含み、
前記予測モデルは、化合物の構造に係る構造データを前記暗号化アルゴリズムに従って暗号化して得られた暗号化構造データと、前記化合物の機能に係る機能データとの相関関係を表す、情報処理方法。 An information processing method executed by an information processing device,
an information providing step of providing encryption algorithm information for performing encryption according to a predetermined encryption algorithm to a first external device;
a data acquisition step of acquiring encrypted structure data of a function prediction target encrypted according to the encryption algorithm from the first external device;
a prediction step of predicting a function of a compound corresponding to the encrypted structure data of the function prediction target based on a predetermined prediction model;
Including,
An information processing method, wherein the prediction model represents a correlation between encrypted structural data obtained by encrypting structural data relating to a structure of a compound according to the encryption algorithm, and functional data relating to a function of the compound.
化合物の構造に係る構造データを所定の暗号化アルゴリズムに従って暗号化して暗号化構造データを生成する暗号化ステップと、
前記暗号化構造データ、及び前記化合物の機能に係る機能データに基づいて、前記暗号化構造データと前記機能データとの相関関係を表す学習モデルを生成する学習モデル生成ステップと、
第1の外部装置に対して、前記暗号化アルゴリズムに従った暗号化を実行するための暗号化アルゴリズム情報を提供する情報提供ステップと、
前記第1の外部装置から、前記暗号化アルゴリズムに従って暗号化された学習対象の暗号化構造データ、及び当該暗号化構造データに対応する化合物の機能に係る学習対象の機能データを取得するデータ取得ステップと、
を含み、
前記学習モデル生成ステップでは、前記データ取得ステップにおいて取得した前記学習対象の暗号化構造データ及び前記学習対象の機能データを少なくとも用いて前記学習モデルを生成する、情報処理方法。 An information processing method executed by an information processing device,
an encryption step of encrypting structural data relating to the structure of the compound according to a predetermined encryption algorithm to generate encrypted structural data;
a learning model generating step of generating a learning model representing a correlation between the encrypted structure data and the functional data, based on the encrypted structure data and functional data relating to a function of the compound;
an information providing step of providing encryption algorithm information for performing encryption according to the encryption algorithm to a first external device;
a data acquisition step of acquiring, from the first external device, encrypted structure data of a learning subject encrypted according to the encryption algorithm, and function data of a learning subject relating to a function of a compound corresponding to the encrypted structure data;
Including,
An information processing method, in which the learning model generation step generates the learning model using at least the encrypted structure data of the learning subject and the functional data of the learning subject acquired in the data acquisition step.
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020084839 | 2020-05-14 | ||
| JP2020084839 | 2020-05-14 | ||
| PCT/JP2021/015183 WO2021229973A1 (en) | 2020-05-14 | 2021-04-12 | Information processing device, program, and information processing method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPWO2021229973A1 JPWO2021229973A1 (en) | 2021-11-18 |
| JP7563451B2 true JP7563451B2 (en) | 2024-10-08 |
Family
ID=78525782
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2022522566A Active JP7563451B2 (en) | 2020-05-14 | 2021-04-12 | Information processing device, program, and information processing method |
Country Status (2)
| Country | Link |
|---|---|
| JP (1) | JP7563451B2 (en) |
| WO (1) | WO2021229973A1 (en) |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2013038698A1 (en) | 2011-09-14 | 2013-03-21 | 独立行政法人産業技術総合研究所 | Search system, search method, and program |
| JP2018054765A (en) | 2016-09-27 | 2018-04-05 | 日本電気株式会社 | Data processing device, data processing method, and program |
| WO2019004437A1 (en) | 2017-06-30 | 2019-01-03 | 学校法人 明治薬科大学 | Predicting device, predicting method, predicting program, learning model input data generating device, and learning model input data generating program |
-
2021
- 2021-04-12 JP JP2022522566A patent/JP7563451B2/en active Active
- 2021-04-12 WO PCT/JP2021/015183 patent/WO2021229973A1/en not_active Ceased
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2013038698A1 (en) | 2011-09-14 | 2013-03-21 | 独立行政法人産業技術総合研究所 | Search system, search method, and program |
| JP2018054765A (en) | 2016-09-27 | 2018-04-05 | 日本電気株式会社 | Data processing device, data processing method, and program |
| WO2019004437A1 (en) | 2017-06-30 | 2019-01-03 | 学校法人 明治薬科大学 | Predicting device, predicting method, predicting program, learning model input data generating device, and learning model input data generating program |
Also Published As
| Publication number | Publication date |
|---|---|
| JPWO2021229973A1 (en) | 2021-11-18 |
| WO2021229973A1 (en) | 2021-11-18 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11520912B2 (en) | Methods, media, apparatuses and computing devices of user data authorization based on blockchain | |
| JP6926429B2 (en) | Data processing equipment, data processing methods, and programs | |
| Tanjo et al. | Practical guide for managing large-scale human genome data in research | |
| US11805136B2 (en) | Scanning container images and objects associated with building the container images | |
| Gürsoy et al. | Privacy-preserving genotype imputation with fully homomorphic encryption | |
| US9501661B2 (en) | Systems and methods for implementing an encrypted search index | |
| CN112487460B (en) | Privacy protection-based business prediction model training method and device | |
| US20160292430A1 (en) | Computing on encrypted data using deferred evaluation | |
| Popic et al. | A hybrid cloud read aligner based on MinHash and kmer voting that preserves privacy | |
| Althar et al. | Design and development of artificial intelligence knowledge processing system for optimizing security of software system | |
| CN110419046A (en) | Information provider unit, information providing system, information providing method and program | |
| CN114503101A (en) | Block chain data searching method | |
| Apirajitha et al. | A novel blockchain framework for digital forensics in cloud environment using multi-objective krill Herd Cuckoo search optimization algorithm | |
| JP5307199B2 (en) | Data management system and data management method | |
| WO2020004139A1 (en) | Personal information analysis system and personal information analysis method | |
| JP7563451B2 (en) | Information processing device, program, and information processing method | |
| Alhakami et al. | A Usability Management Framework for Securing Healthcare Information System. | |
| Pol et al. | Quality of service estimation enabled with trust-based resource allocation in collaborative cloud using improved grey wolf optimization | |
| Aziz et al. | ZkVML: Zero-Knowledge Verifiable Machine Learning | |
| Liao et al. | CISOC-PSCT: a predictive system for carcinogenic toxicity | |
| Brindha et al. | A secure transaction of cloud data using conditional source trust attributes encryption mechanism | |
| Xing et al. | Website information retrieval of web database based on symmetric encryption algorithm | |
| Mishra et al. | Exploring Blockchain‐Based Patient‐Centric Healthcare: A Comprehensive Review | |
| Abdullahi et al. | Adaptation of machine learning and blockchain technology in cyber-physical system applications: a concept paper | |
| Wang et al. | Enhancing Virtual Assistant Service in Data Centers with Packaged Business Capability and Post-Quantum Security Measure |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231222 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240716 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240809 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240827 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240909 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7563451 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |