JP7656499B2 - Learning model generation method, program, information processing method, information processing device, and learning model data generation method - Google Patents
Learning model generation method, program, information processing method, information processing device, and learning model data generation method Download PDFInfo
- Publication number
- JP7656499B2 JP7656499B2 JP2021104303A JP2021104303A JP7656499B2 JP 7656499 B2 JP7656499 B2 JP 7656499B2 JP 2021104303 A JP2021104303 A JP 2021104303A JP 2021104303 A JP2021104303 A JP 2021104303A JP 7656499 B2 JP7656499 B2 JP 7656499B2
- Authority
- JP
- Japan
- Prior art keywords
- learning model
- specimen
- data
- sample data
- test
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 112
- 230000010365 information processing Effects 0.000 title claims description 62
- 238000003672 processing method Methods 0.000 title claims description 3
- 238000012360 testing method Methods 0.000 claims description 300
- 230000005856 abnormality Effects 0.000 claims description 106
- 230000002159 abnormal effect Effects 0.000 claims description 96
- 238000012549 training Methods 0.000 claims description 56
- 230000008569 process Effects 0.000 claims description 40
- 238000012795 verification Methods 0.000 claims description 31
- 201000010099 disease Diseases 0.000 claims description 28
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 28
- 238000012545 processing Methods 0.000 claims description 21
- 239000012895 dilution Substances 0.000 claims description 10
- 238000010790 dilution Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 5
- 239000000523 sample Substances 0.000 description 108
- 238000010586 diagram Methods 0.000 description 16
- 230000015654 memory Effects 0.000 description 15
- 238000001514 detection method Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 13
- 238000003066 decision tree Methods 0.000 description 13
- 239000003153 chemical reaction reagent Substances 0.000 description 11
- 239000000284 extract Substances 0.000 description 9
- 238000010801 machine learning Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000004040 coloring Methods 0.000 description 4
- 238000013102 re-test Methods 0.000 description 4
- 238000012937 correction Methods 0.000 description 3
- 208000037919 acquired disease Diseases 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 238000005401 electroluminescence Methods 0.000 description 2
- 238000009432 framing Methods 0.000 description 2
- 230000001575 pathological effect Effects 0.000 description 2
- 230000035790 physiological processes and functions Effects 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 206010020772 Hypertension Diseases 0.000 description 1
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000012098 association analyses Methods 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 238000009534 blood test Methods 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007636 ensemble learning method Methods 0.000 description 1
- 238000013101 initial test Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 239000013074 reference sample Substances 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Landscapes
- Medical Treatment And Welfare Office Work (AREA)
- Automatic Analysis And Handling Materials Therefor (AREA)
Description
本発明は、学習モデルの生成方法、プログラム、情報処理方法、情報処理装置及び学習モデルデータの生成方法に関する。 The present invention relates to a method for generating a learning model, a program, an information processing method, an information processing device, and a method for generating learning model data.
病院の検査室又は検査センター等の検査施設では、常時大量の臨床検査を実施しており、臨床側ではその検査結果に基づいて患者の病態に関する診断・治療の方針決定がおこなわれる。検査結果に基づいて治療方針の決定を行う前段階において、検査結果の妥当性を検証し、異常値であると判定された場合には再検査を実施することで、検査の信頼性を高めることが行われている。 In hospital laboratories, testing centers, and other testing facilities, a large number of clinical tests are constantly being carried out, and clinicians use the test results to make diagnostic and treatment decisions regarding the patient's condition. Before deciding on a treatment plan based on the test results, the validity of the test results is verified, and if any values are determined to be abnormal, retests are conducted to increase the reliability of the test.
検査項目毎に前回値と今回値の差に基準値を設け、患者別の検体の値を前回値と比較するデータ処理により、異常値等を抽出する等して、検査の信頼性を高めるデルタ検証法が開示されている(例えば特許文献1、2参照)。
A delta verification method has been disclosed that increases the reliability of tests by setting a standard value for the difference between the previous value and the current value for each test item, and extracting abnormal values through data processing that compares the values of samples from individual patients with the previous values (see, for example,
しかしながら、特許文献1、2に記載の技術では、単項目の検査結果における検査値の差分に基づき異常か否かが判断されており、関連する他の検査値の変動や検査間隔、検査の時系列順序が考慮されていないため、検出精度が低下することが懸念される。
However, in the technologies described in
本開示の目的は、検査値の異常の検出精度を向上できる学習モデルの生成方法等を提供することである。 The objective of this disclosure is to provide a method for generating a learning model that can improve the accuracy of detecting abnormalities in test values.
本開示の一態様に係る学習モデルの生成方法は、臨床検査における複数の検体データを取得し、取得した複数の前記検体データに基づき、異常検体データを含む第1の検体データ群を生成し、生成した第1の前記検体データ群と、前記異常検体データを含まない第2の前記検体データ群と、前記検体データ群の正常又は異常に関する分類情報とを含む訓練データに基づき、前記検体データ群を入力した場合に前記分類情報を出力する学習モデルを生成する処理をコンピュータに実行させる。 A method for generating a learning model according to one aspect of the present disclosure causes a computer to execute a process of acquiring a plurality of specimen data in a clinical test, generating a first specimen data group including abnormal specimen data based on the acquired plurality of specimen data, and generating a learning model that outputs classification information when the specimen data group is input based on training data including the generated first specimen data group, the second specimen data group not including the abnormal specimen data, and classification information regarding normality or abnormality of the specimen data group.
本開示の一態様に係るプログラムは、時系列順に配列された複数の検体データからなる検体データ群を取得し、時系列順に配列された複数の検体データからなる検体データ群を入力した場合に、前記検体データ群に含まれる時系列で最後の前記検体データの正常又は異常に関する分類情報を出力するよう学習済みの学習モデルに、取得した前記検体データ群を入力して、前記分類情報を出力する処理をコンピュータに実行させる。 A program according to one aspect of the present disclosure acquires a specimen data group consisting of a plurality of specimen data arranged in chronological order, and causes a computer to execute a process of inputting the acquired specimen data group into a learning model that has been trained to output classification information regarding normality or abnormality of the last specimen data in chronological order included in the specimen data group when the specimen data group consisting of a plurality of specimen data arranged in chronological order is input, and outputting the classification information.
本開示の一態様に係る学習モデルデータの生成方法は、臨床検査における複数の検体データを取得し、取得した複数の前記検体データに基づき、異常検体データを含む第1の検体データ群を生成し、生成した第1の前記検体データ群及び異常を示すラベルと、前記異常検体データを含まない第2の前記検体データ群及び正常を示すラベルとを学習モデルに対する訓練データとして対応付けて記憶部に記憶する処理をコンピュータに実行させる。 A method for generating learning model data according to one aspect of the present disclosure includes acquiring multiple pieces of specimen data in a clinical test, generating a first specimen data group including abnormal specimen data based on the acquired multiple pieces of specimen data, and causing a computer to execute a process of associating the generated first specimen data group and a label indicating abnormality with a second specimen data group not including the abnormal specimen data and a label indicating normality as training data for a learning model, and storing the association in a storage unit.
本開示によれば、検査値の異常の検出精度を向上できる。 This disclosure can improve the accuracy of detecting abnormalities in test values.
本開示をその実施の形態を示す図面を参照して具体的に説明する。 This disclosure will be specifically described with reference to drawings showing embodiments thereof.
(第1実施形態)
図1は、情報処理システムの構成例を示すブロック図である。情報処理システムは、情報処理装置1及び検査施設装置2を含む。情報処理装置1及び検査施設装置2は、LAN(Local Area Network)、インターネット等のネットワークNを介して通信接続されている。
First Embodiment
1 is a block diagram showing a configuration example of an information processing system. The information processing system includes an
検査施設装置2は、例えば病院の検査室又は検査センター等の検査施設に設置される。検査施設装置2は、例えばサーバコンピュータ、パーソナルコンピュータ等であり、表示装置3、入力装置4及び検査装置5等が接続されている。表示装置3は、例えば液晶ディスプレイ又は有機EL(Electro Luminescence)ディスプレイ等である。入力装置4は、ユーザの操作を受け付ける操作部であり、例えばキーボード、タッチパネル等のポインティングデバイスである。検査装置5は、検体に対して各種の検査(分析)処理を行い、臨床検査結果(検体データ)を生成する。検査装置5により得られた検体データは、検査施設装置2を介し、情報処理装置1へ送信される。
The
情報処理装置1は、例えばサーバコンピュータ、パーソナルコンピュータ等であり、種々の情報処理、情報の送受信が可能である。情報処理装置1は、検査施設装置2を介し、検査装置5により得られた検体データを取得する。情報処理装置1は、取得した検体データに対する正常又は異常に関する分類情報を取得する。情報処理装置1は、検体データの異常検出装置として機能する。情報処理装置1は、生成した分類情報を表示装置3に表示する。なお、情報処理装置1は検査施設装置2と同じ施設に設置されたローカルサーバであってもよく、インターネット等を介して検査施設装置2に通信接続されたクラウドサーバであってもよい。
The
分類情報とは、臨床検査により得られた検体データの正常又は異常(異常の有無)を示す情報である。検体データは、複数種類の検査項目に対応する複数の検査値を含むものであってよい。分類情報は、正常及び異常を含み、異常は、さらにその原因に応じて、例えば検体取り違えや希釈ミス等の複数種類に分類される。ここで、正常とは、検体データの検査値が検査時に起因する異常値でない、すなわち臨床検査結果が適正であることを意味する。異常とは、検体データの検査値が検査工程に起因する異常値である(検査過誤)、すなわち臨床検査結果が適正でないことを意味する。 Classification information is information that indicates whether the specimen data obtained by a clinical test is normal or abnormal (the presence or absence of abnormality). The specimen data may include multiple test values corresponding to multiple types of test items. Classification information includes normal and abnormal, and abnormalities are further classified into multiple types depending on the cause, such as sample mix-up and dilution error. Here, normal means that the test value of the specimen data is not an abnormal value caused during the test, i.e., the clinical test result is appropriate. Abnormal means that the test value of the specimen data is an abnormal value caused by the testing process (test error), i.e., the clinical test result is not appropriate.
検査施設の担当者は、表示装置3に表示される分類情報に基づき、検体データにおける異常の有無やその原因を把握できる。検体データが正常である場合には正しい検体データとして臨床へ報告し、検体データが異常である場合には異常の原因に応じた態様で再検査を行うことで、効率的に適正な検査を実施することができる。
The person in charge at the testing facility can determine whether there is an abnormality in the sample data and the cause of the abnormality based on the classification information displayed on the
臨床検査における検査結果は、患者の生理状態だけでなく、上述のような検査の実施条件、検査における人為的ミス、検査試薬や検査装置の異常、等の様々な因子の影響を受けて変動する。臨床検査において日常的に取り扱うデータは、同一患者であれば一般に時系列に深く関連した検査値が得られる。また人体に関連する検査値が取りうる範囲は、程度の差はあっても限定的であり、各検査値は互いに関連性が高いと考えられる。よって、同一検査の検査値の差分や、複数の検査項目間には関連性があると考えられている。従来、デルタ検証法等の統計的手法を用いて、検査結果の妥当性が判断されている。 Test results in clinical testing vary due to the influence of various factors, including not only the physiological state of the patient, but also the test conditions mentioned above, human error during the test, and abnormalities in the test reagents and testing equipment. Data handled daily in clinical testing generally yields test values that are closely related over time if they are from the same patient. Furthermore, the range of possible test values related to the human body is limited, although to varying degrees, and each test value is considered to be highly related to each other. Therefore, it is believed that there is a correlation between differences in test values from the same test and between multiple test items. Conventionally, the validity of test results has been determined using statistical methods such as delta validation.
しかしながら、検査値の異常が、パニック値のような患者の病態に由来するものか、検査過誤のような検査工程に由来するものか、を区別するには統計的推論だけでは難しいことから、検査値が異常であると判定された場合には再検査を実施することで、検査工程の異常の有無が判断されている。再検査を高頻度に実施すれば、検査工程の異常の見逃しを抑制できるが、その一方で再検査にかかる費用と時間を余分に消費する問題が生じる。本情報処理システムでは、後述する第1学習モデル113を用いて、異常の原因を示す分類情報を提供することにより、効率的な検査を実現する。
However, because it is difficult to distinguish using statistical inference alone whether an abnormality in a test value is due to the patient's pathology, such as a panic value, or due to the testing process, such as a test error, a retest is conducted when a test value is determined to be abnormal to determine whether there is an abnormality in the testing process. Conducting retests frequently can prevent abnormalities in the testing process from being overlooked, but on the other hand, there is the problem that the retesting requires additional costs and time. This information processing system achieves efficient testing by providing classification information indicating the cause of the abnormality using a
情報処理装置1は、制御部10、記憶部11及び通信部12を備える。情報処理装置1は複数のコンピュータからなるマルチコンピュータであってもよく、ソフトウェアによって仮想的に構築された仮想マシンであってもよい。
The
制御部10は、一又は複数のCPU(Central Processing Unit )、GPU(Graphics Processing Unit)等を用いたプロセッサである。制御部10は、内蔵するROM(Read Only Memory)又はRAM(Random Access Memory)等のメモリを用い、各構成部を制御して処理を実行する。 The control unit 10 is a processor that uses one or more CPUs (Central Processing Units), GPUs (Graphics Processing Units), etc. The control unit 10 uses built-in memory such as ROM (Read Only Memory) or RAM (Random Access Memory) to control each component and execute processing.
記憶部11は、例えばハードディスク又はSSD(Solid State Drive )等の不揮発性記憶装置である。記憶部11には、プログラム(プログラム製品)1Pを含む制御部10が参照するプログラム及びデータが記憶されている。制御部10は、プログラム1Pを読み出して実行することによって、汎用的なサーバコンピュータを本開示特有の情報処理装置として機能させる。記憶部11は、複数の記憶装置により構成されていてもよく、情報処理装置1に接続された外部記憶装置であってもよい。
The
記憶部11に記憶されるプログラム1Pは、記録媒体にコンピュータ読み取り可能に記録されている態様であってもよい。記憶部11は、図示しない読出装置によって記録媒体1Aから読み出されたプログラム1Pを記憶する。また、図示しない通信網に接続されている図示しない外部コンピュータからプログラム1Pをダウンロードし、記憶部11に記憶させたものであってもよい。なお、プログラム1Pは、単一のコンピュータ上で、または1つのサイトにおいて配置されるか、もしくは複数のサイトにわたって分散され、通信ネットワークによって相互接続された複数のコンピュータ上で実行されるように展開することができる。
The
また、記憶部11には、検体DB(Data Base :データベース)111、訓練DB112及び複数の第1学習モデル113が記憶されている。検体DB111は、臨床検査における検体に係る検体データを格納するデータベースである。訓練DB112は、第1学習モデル113の学習に用いる訓練データ(学習データ)を格納するデータベースである。第1学習モデル113は、訓練データを学習済みの機械学習モデルである。第1学習モデル113は、人工知能ソフトウェアを構成するプログラムモジュールとしての利用が想定される。記憶部11にはさらに、第2学習モデル114及び第3学習モデル115が記憶されていてもよい。第2学習モデル114及び第3学習モデル115については他の実施形態で詳述する。
The
通信部12は、通信に関する処理を行うための通信モジュールである。制御部10は、通信部12を介して検査施設装置2との間で情報の送受信が可能である。
The
本実施の形態において情報処理装置1は、上記の構成に限定されず、例えば画像を表示する表示部、操作入力を受け付ける入力部等を含んでもよい。
In this embodiment, the
検査施設装置2は、制御部20、記憶部21、通信部22及び入出力部23を備える。
制御部20は、一又は複数のCPU、GPU等を用いたプロセッサである。制御部20は、内蔵するROM又はRAM等のメモリを用い、各構成部を制御して処理を実行する。
The
The
記憶部21は、例えばハードディスク又はSSD等の不揮発性記憶装置である。記憶部21には、制御部20が参照するプログラム及びデータが記憶されている。通信部22は、通信に関する処理を行うための通信モジュールである。制御部20は、通信部22を介して情報処理装置1との間で情報の送受信が可能である。
The
入出力部23は、外部装置を接続するための入出力I/F(インタフェース)である。入出力部23には、上述の表示装置3、入力装置4及び検査装置5等が接続されている。制御部20は、入出力部23を介し、検体データの正常又は異常に関する分類情報を表示装置3に表示させる。制御部20は、入出力部23を介し、入力装置4に入力された情報を受け付ける。制御部20は、入出力部23を介し、検査装置5から出力される検体データを受け付ける。
The input/
図2は、検体DB111の内容例を示す図である。検体データDB111は、例えば、複数の検体データそれぞれの検体ID、検査施設名、患者属性情報、検査日時及び検査値等を関連付けて格納する。検体IDは、検体を識別するための識別情報である。検査施設名は、検体の検査を実施した検査施設を識別する情報である。患者属性情報は、検体に係る患者(被検体)の属性情報であり、例えば患者ID、患者名、年齢及び性別等を含む。各患者は、例えば患者ID及び患者名等により、一意に特定可能である。検査日時は、検体の検査を実施した日時、又は血液検査の採血日時である。検査値は、検体に係る検査値である。検査値列には、複数の検査項目それぞれに対応付けて各検査値が格納される。検体DB111に記憶される検体データはさらに、検査施設の担当科種類(病院の診療科種類)、検査機器ID、検査試薬のロット番号、検体データの受付日、検査手法、検査担当者名等の情報を含んでもよい。
2 is a diagram showing an example of the contents of the
情報処理装置1は、検査施設装置2から検体データを受信する都度、受信した検体データを検体DB111に記憶する。検体DB111には、患者毎に時系列的に検体データが格納されてもよい。検体DB111の記憶内容は図2に示す例に限定されない。
Each time the
図3は、訓練DB112の内容例を示す図である。訓練DB112は、後述する第1学習モデル113の学習に用いる訓練データを格納する。訓練DB112は、例えば、訓練データを識別する訓練データIDに関連付けて、検体データ群に関する検体データ群情報及び分類情報を格納する。
Figure 3 is a diagram showing an example of the contents of the
検体データ群情報列には、検体DB111に記憶される検体データと同一又はその一部の項目が含まれ、例えば検体データの検査日時及び複数の検査項目に対する検査値が格納される。検体データ群情報は、1つの検体データ群を構成する複数の検体データの情報を含む。検体データ群は、同一患者に由来する時系列順の検体データから構成される。具体的には、検体データ群は、同一患者について取得された検体データのうち、時系列で隣接する所定数の検体データからなる。図3では、4つの検体データにより1つの検体データ群が構成される例を示すが、検体データ群を構成する検体データの数は限定されない。
The specimen data group information string contains items that are the same as or a part of the specimen data stored in
詳しくは後述するが、検体データ群は、検査過誤に由来する異常な検体データ(異常検体データ)を含まない検体データ群と、該異常検体データを含む検体データ群とに分けられる。図3に示す例にて、訓練データID001-1及び訓練データID001-2は、異常検体データを含まない検体データ群であり、訓練データID001-3は異常検体データを含む検体データ群である。訓練データID001-3は、訓練データID001-2の4行目の検体データにおける全ての検査値を、異常値に置き換えたものである。 As will be described in more detail later, the specimen data groups are divided into specimen data groups that do not contain abnormal specimen data resulting from testing errors (abnormal specimen data) and specimen data groups that contain such abnormal specimen data. In the example shown in FIG. 3, training data ID001-1 and training data ID001-2 are specimen data groups that do not contain abnormal specimen data, and training data ID001-3 is a specimen data group that includes abnormal specimen data. Training data ID001-3 is obtained by replacing all test values in the specimen data in the fourth row of training data ID001-2 with abnormal values.
分類情報列は、検体データ群の正常又は異常に関する分類情報を格納する。分類情報は、例えば、正常及び異常を含む。検査過誤に由来する異常は、その原因に応じて取り違え、希釈ミス、単位誤認、試薬間違い及び検査機器内の検体詰まり等複数種類に分類される。 The classification information column stores classification information regarding whether the sample data group is normal or abnormal. Classification information includes, for example, normal and abnormal. Abnormalities resulting from testing errors are classified into multiple types depending on the cause, such as mix-up, dilution error, misidentification of units, reagent error, and sample clogging in the testing equipment.
取り違えとは、同一受付日に検査を実施した異なる患者間における検体の取り違え(検体データに係る全ての検査値の取り違え)に起因する検査値の異常である。取り違えは、同一受付日に検査を実施した異なる患者間における特定の検査項目における検査値の取り違えを含んでもよい。希釈ミスとは、検体を生理食塩水や緩衝液、試薬などで希釈する際の希釈倍率や希釈量の誤りに起因する異常である。単位誤認とは、検査値に係る単位の誤認に起因する異常である。試薬間違いとは、試薬を用いた検査における使用試薬の誤りや試薬不足又は試薬過多に起因する異常である。検体詰まりとは、検査に用いる検査機器内のチューブ等の内部における検体の詰まりに起因する異常である。分類情報列は、異常の種類毎に、正常又は異常(異常の有無)を格納してもよい。訓練DB112の記憶内容は図3に示す例に限定されない。
A mix-up is an abnormality in a test value caused by a mix-up of samples (mix-up of all test values related to sample data) between different patients who underwent testing on the same reception date. Mix-ups may include mix-ups of test values for a specific test item between different patients who underwent testing on the same reception date. A dilution error is an abnormality caused by an error in the dilution ratio or dilution amount when diluting a sample with saline, buffer solution, reagent, etc. A unit misidentification is an abnormality caused by a misidentification of a unit related to a test value. A reagent error is an abnormality caused by an error in the use of a reagent in a test using a reagent, or a shortage or excess of a reagent. A specimen clogging is an abnormality caused by a specimen clogging inside a tube or the like in a testing device used for the test. The classification information column may store normal or abnormal (presence or absence of abnormality) for each type of abnormality. The contents stored in the
図4は、第1学習モデル113の概要を示す説明図である。第1学習モデル113は、時系列順の複数の検体データからなる検体データ群を入力として、当該検体データ群に含まれる時系列で最後(最新すなわち直近)の検体データの正常又は異常に関する分類情報を出力する機械学習モデルである。具体的には、第1学習モデル113は、検体データ群を入力として、正常又は異常(異常の有無)の分類結果を出力する。
Figure 4 is an explanatory diagram showing an overview of the
第1学習モデル113は、異常の種類毎に複数記憶されている。すなわち、検体データ群を入力として、取り違えの有無を出力する第1の第1学習モデル113、希釈ミスの有無を出力する第2の第1学習モデル113、単位誤認の有無を出力する第3の第1学習モデル113、試薬間違いの有無を出力する第4の第1学習モデル113、検体詰まりの有無を出力する第5の第1学習モデル113がそれぞれ記憶されている。各第1学習モデル113は同様の構成であるため、以下では取り違えに起因する異常の有無を出力する第1学習モデル113の構成について説明する。
Multiple
情報処理装置1は、所定の訓練データを学習する機械学習を行って第1学習モデル113を事前に生成しておく。そして情報処理装置1は、検査装置5から取得した検体データ群を第1学習モデル113に入力し、検体データ群に対する分類情報を出力する。
The
第1学習モデル113は、例えばXGBoost(eXtreme Gradient Boosting )により構築される。XGBoostは、勾配ブースティングと、ランダムフォレストとを組み合わせたアンサンブル学習の手法である。第1学習モデル113は、複数の決定木(弱学習器)を構築し、1つ前までの決定木の情報を用いて新たな決定木を構築していくブースティングを行うよう構成されている。具体的には、1つ前の決定木では予測できなかった誤差(損失関数の勾配)を目的変数として新たな決定木が構築される。各決定木において、入力データは根から枝に行く途中で条件により分類され、末端の葉ノードに辿り着くと、当該末端の葉ノードに与えられた値が予測値として出される。
The
第1学習モデル113の入力は、検体データ群である。検体データ群は、例えば同一検査施設における同一患者に係る、今回、前回、前々回及び前々々回の検体データを含む。検体データは、検査日時(前回検査日時との間隔)、及び複数の検査項目に応じた検査値を含む。複数の検体データは、時系列順に配列された検体データ群データとして第1学習モデル113へ入力される。なお、検体データ群に含まれる検体データの数は4つに限定されない。検体データ群は、異常有無の判定対象となる検体データ(時系列で最後の検体データ)と、当該判定対象となる検体データよりも過去に取得した少なくとも1つの検体データとを含むものであってよい。なお一般に、臨床現場において検査過誤や病態異常として最優先で確認が必要なのは、過去のデータではなく、直近のデータが対象になるため、本方法では、過去データは正しいと仮定し、直近(時系列上の最新)のデータが正しいかどうかを検証する。
The input of the
第1学習モデル113の出力は、検体データ群に含まれる時系列で最後の検体データの正常又は異常の分類結果である。第1学習モデル113は、検体データ群を入力した場合に、正常及び異常の各クラスに対する確度を出力する。第1学習モデル113は、確度が閾値以上であるクラスを出力値とすることができる。
The output of the
なお、第1学習モデル113はマルチクラス分類モデルであり、1つの第1学習モデル113により、正常又は複数種類の異常を分類するものであってもよい。この場合、第1学習モデル113は、時系列順の複数の検体データからなる検体データ群を入力として、当該検体データ群に含まれる時系列で最後の検体データの正常又は複数種類の異常を示す分類情報を出力する。
The
上記では、第1学習モデル113がXGBoostである例を説明したが、第1学習モデル113の構成は限定されるものではなく、検体データ群に含まれる時系列で最後の検体データの正常又は異常に関する分類情報を識別可能であればよい。第1学習モデル113は、例えば、Transformer、CNN(Convolution Neural Network)、RNN(Recurrent Neural Network)、LSTM(Long Short Term Memory)等のニューラルネットワークであってもよく、サポートベクタマシン、ロジスティクス回帰、ランダムフォレスト等の他の学習アルゴリズムを用いてもよい。
Although an example in which the
情報処理装置1は、異常検出を行う運用フェーズの前段階である学習フェーズにおいて、訓練データを用いて第1学習モデル113を生成し、生成した第1学習モデル113を記憶部11に記憶する。そして、運用フェーズにおいて、記憶する第1学習モデル113を用いて検体データの異常を検出する。
In the learning phase, which is a stage preceding the operational phase in which anomaly detection is performed, the
図5は、訓練データの生成処理手順の一例を示すフローチャートである。以下の処理は、情報処理装置1の記憶部11に記憶されるプログラム1Pに従って制御部10により実行される。
Figure 5 is a flowchart showing an example of a training data generation process. The following process is executed by the control unit 10 in accordance with the
情報処理装置1の制御部10は、検体DB111に記憶する情報に基づき、同一患者に係る複数の時系列順の検体データを取得する(ステップS11)。制御部10は、例えば検体DB111に記憶する大量の検体データから、同一検査施設名且つ同一患者に係る検体データを抽出し、時系列順に並べる。
The control unit 10 of the
制御部10は、取得した複数の検体データから、共起頻度の高い検査項目の検査値を含む検体データを抽出する(ステップS12)。同じ時期に高頻度で実施されている検査項目、すなわち共起頻度の高い検査項目は、例えばアソシエーション分析やマーケットバスケット分析、共起クラスタマイニング(福井健一ら、人工知能30巻2号、2015年、を参照)を用いることで、抽出することができる。一方で簡易に共起頻度の高い検査項目を抽出する方法が複数あり、例えば次のように抽出できる。まず、ある検査項目と共起する検査項目の頻度表を作成し、それを全検査項目について、2項目間の総当たりの頻度表を作成する。次にその頻度表において、その上位の検査項目に限定した検査項目セットについてセット内の全項目を含む共起頻度を確認し、ある閾値以上の共起頻度を持つ検査項目を絞り込むことで、共起頻度の高い検査項目グループ(複数の検体データ)を抽出できる。これにより、欠損値の少ない検体データ群を生成できる。 The control unit 10 extracts specimen data including test values of test items with high co-occurrence frequencies from the acquired specimen data (step S12). Test items that are frequently performed at the same time, i.e., test items with high co-occurrence frequencies, can be extracted by using, for example, association analysis, market basket analysis, and co-occurrence cluster mining (see Kenichi Fukui et al., Artificial Intelligence, Vol. 30, No. 2, 2015). On the other hand, there are several methods for easily extracting test items with high co-occurrence frequencies, and they can be extracted, for example, as follows. First, a frequency table of test items that co-occur with a certain test item is created, and a brute-force frequency table between the two items is created for all test items. Next, in the frequency table, the co-occurrence frequency including all items in the set is confirmed for a test item set limited to the top test item, and test items with a co-occurrence frequency above a certain threshold are narrowed down to extract a test item group (multiple specimen data) with high co-occurrence frequencies. This makes it possible to generate a specimen data group with few missing values.
制御部10は、取得した複数の時系列順の共起頻度の高い検体データに基づき、異常検体データを含まない検体データ群を生成する(ステップS13)。詳細には、制御部10は、例えば取得した複数の時系列順の検体データに対し、最も新しい検体データを含む4つの検体データからなる第1の検体データ群を生成する。同様に、制御部10は、時系列で2番目に新しい検体データを含む4つの検体データからなる第2の検体データ群、…、のように、基準となる検体データを順にスライドさせ、複数の検体データ群を生成する。このようにして、臨床検査で得られた検査値をそのまま用いた、異常検体データを含まない検体データ群が生成される。なお制御部10は、第1学習モデル113への入力要素に必要な所定の管理項目のみを抽出して検体データを生成してもよい。
The control unit 10 generates a sample data group that does not include abnormal sample data based on the multiple chronologically ordered sample data with high co-occurrence frequency obtained (step S13). In detail, the control unit 10 generates a first sample data group consisting of four sample data including the most recent sample data from the multiple chronologically ordered sample data obtained. Similarly, the control unit 10 slides the reference sample data in order to generate multiple sample data groups, such as a second sample data group consisting of four sample data including the second most recent sample data in chronological order, .... In this way, a sample data group that does not include abnormal sample data is generated using the test values obtained in the clinical test as they are. The control unit 10 may generate sample data by extracting only predetermined management items necessary for input elements to the
制御部10は、取得した検体データの一部を異常値に置き換えることにより、異常検体データを含む検体データ群を生成する(ステップS14)。詳細には、制御部10は、検体データ群に含まれる検体データのうち、時系列で最後の検体データの一部を異常値に置き換えることにより異常検体データを生成する。制御部10は、生成した異常検体データと、臨床検査で得られた検査値をそのまま用いた残り3つの検体データとからなる検体データ群を生成する。 The control unit 10 generates a specimen data group including abnormal specimen data by replacing a portion of the acquired specimen data with an abnormal value (step S14). In detail, the control unit 10 generates abnormal specimen data by replacing a portion of the last specimen data in the chronological order among the specimen data included in the specimen data group with an abnormal value. The control unit 10 generates a specimen data group consisting of the generated abnormal specimen data and the remaining three specimen data that use the test values obtained in the clinical test as is.
異常検体データの生成方法の具体例を以下に示す。制御部10は、第1患者に係る所定検査日時における検体データに含まれる全ての検査値を、当該所定検査日時に検査を行った、第1患者とは異なる第2患者に係る検体データの検査値に入れ替えることで、取り違えに起因する異常検体データを生成する。制御部10は、第1患者に係る所定検査日時における検体データに含まれる特定の検査項目に対する検査値のみを、第2患者に係る検査値に入れ替えてもよい。 A specific example of a method for generating abnormal sample data is shown below. The control unit 10 generates abnormal sample data resulting from a mix-up by replacing all test values included in the sample data for a first patient at a specified test date and time with test values for sample data for a second patient, different from the first patient, who was tested at the specified test date and time. The control unit 10 may replace only test values for a specific test item included in the sample data for the first patient at a specified test date and time with test values for the second patient.
制御部10は、検体データに含まれる一又は複数の検査項目に対する検査値を、規定と異なる希釈倍率による希釈を行ったと仮定し算出される検査値に入れ替えることで、希釈ミス(計算ミス)に起因する異常検体データを生成する。制御部10は、検体データに含まれる一又は複数の検査項目に対する検査値を、単位を誤認したと仮定し算出される検査値に入れ替えることで、単位誤認(計算ミス)に起因する異常検体データを生成する。 The control unit 10 generates abnormal specimen data resulting from a dilution error (calculation error) by replacing the test values for one or more test items included in the specimen data with test values calculated on the assumption that dilution was performed at a dilution ratio different from the specified one. The control unit 10 generates abnormal specimen data resulting from a unit misidentification (calculation error) by replacing the test values for one or more test items included in the specimen data with test values calculated on the assumption that a unit was misidentified.
制御部10は、検体データに含まれる一又は複数の検査項目に対する検査値を、規定と異なる試薬を用いたと仮定し算出される検査値に入れ替えることで、試薬間違いに起因する異常検体データを生成する。制御部10は、検体データに含まれる一又は複数の検査項目に対する検査値を、検体詰まりが発生したと仮定し算出される検査値(例えば、ゼロ、実際の値の数分の一又は特定の最大値等)に入れ替えることで、検体詰まりに起因する異常検体データを生成する。このように、制御部10は、実際に得られた検体データを用い、異常な検体データを生成する。なお、異常検体データの生成方法及び種類は上記の例に限定されるものではない。 The control unit 10 generates abnormal specimen data caused by an incorrect reagent by replacing the test values for one or more test items included in the specimen data with test values calculated under the assumption that a reagent other than the specified one was used. The control unit 10 generates abnormal specimen data caused by specimen clogging by replacing the test values for one or more test items included in the specimen data with test values calculated under the assumption that a specimen clogging has occurred (e.g., zero, a fraction of the actual value, or a specific maximum value, etc.). In this way, the control unit 10 generates abnormal specimen data using actually obtained specimen data. Note that the method and type of abnormal specimen data generation are not limited to the above examples.
制御部10は、生成した異常検体データを含まない検体データ群及び異常検体データを含む検体データ群それぞれに対し、分類情報が正解値としてラベル付けされたデータセットである訓練データを生成する(ステップS15)。具体的には、制御部10は、各検体データ群に対し、異常の種類毎に正常又は異常を示すラベルが付与された訓練データを生成する。訓練データは、各検体データ群に対し、正常又は複数種類の異常を示すラベルが付与されたものであってもよい。 The control unit 10 generates training data, which is a data set in which classification information is labeled as a correct answer value, for each of the generated specimen data groups that do not include abnormal specimen data and the generated specimen data groups that include abnormal specimen data (step S15). Specifically, the control unit 10 generates training data in which a label indicating normality or abnormality is assigned to each specimen data group for each type of abnormality. The training data may be data in which a label indicating normality or multiple types of abnormalities is assigned to each specimen data group.
制御部10は、生成した訓練データを訓練DB112に記憶し(ステップS16)、一連の処理を終了する。制御部10は、検体DB111に収集した大量の検体データに基づき複数の情報群を生成し、生成した情報群を訓練データとして訓練DB112に蓄積する。通常、臨床検査において検体データが異常と判断された場合には、再検査後の正常な検体データのみが最終的にデータベースに記録されることが多く、異常な検体データを収集することが困難である。上述の処理によれば、異常検体データを仮想的に生成することで、効率的に訓練データを蓄積することができる。なお、異常検体データは、実際の臨床検査における異常の発生頻度を考慮して生成されることが異常検知の精度を客観的に評価する上で好ましい。
The control unit 10 stores the generated training data in the training DB 112 (step S16), and ends the series of processes. The control unit 10 generates multiple information groups based on the large amount of specimen data collected in the
上述の処理において、検体データは、例えば検査施設名、患者属性情報、検査装置ID等を含むものであってもよい。すなわち、第1学習モデル113への入力要素に検査施設名、患者属性情報、検査装置ID等を含むものであってもよい。この場合、検体データ群の生成時に、同一検査施設や同一患者毎に検体データを区分する処理を不要とすることができる。
In the above-mentioned processing, the specimen data may include, for example, the name of the testing facility, patient attribute information, a testing device ID, etc. In other words, the input elements to the
図6は、第1学習モデル113の生成処理手順の一例を示すフローチャートである。以下の処理は、例えば図5の処理の終了後に、情報処理装置1の記憶部11に記憶されるプログラム1Pに従って制御部10により実行される。
Figure 6 is a flowchart showing an example of a process for generating the
情報処理装置1の制御部10は、訓練DB112に記憶された情報に基づき、情報群より抽出された1組の訓練データを取得する(ステップS21)。制御部10は、取得した訓練データを用いて、検体データ群を入力した場合に、当該検体データ群に含まれる時系列で最後の検体データの正常又は異常を示す情報を出力する第1学習モデル113を生成する(ステップS22)。
The control unit 10 of the
具体的には、制御部10は、訓練データに含まれる検体データ群を用い、第1の決定木を構築する。制御部10は、入力データを第1の決定木に当てはめ、入力データと葉ノードに含まれる予測値との第1の残差を求める。次いで制御部10は、得られた第1の残差を用い、同様の手順により第2の決定木を構築し、第1の残差と葉ノードに含まれる予測値との第2の残差を求める。第1の決定木と第2の決定木とを合成することでより精度が高くなるよう、第2の決定木が構築される。制御部10は、以下同様の手順により決定木を逐次的に構築する。 Specifically, the control unit 10 uses a group of sample data included in the training data to construct a first decision tree. The control unit 10 fits the input data into the first decision tree and obtains a first residual between the input data and the predicted value included in the leaf node. The control unit 10 then uses the obtained first residual to construct a second decision tree by a similar procedure and obtains a second residual between the first residual and the predicted value included in the leaf node. The second decision tree is constructed by combining the first and second decision trees to achieve higher accuracy. The control unit 10 subsequently constructs decision trees sequentially by a similar procedure.
制御部10は、第1学習モデル113における損失関数を最適化(最小化)するよう、例えば勾配降下法を用いパラメータを調整し、決定木を逐次的に学習・統合する。なお、制御部10は、いわゆるオーバーフィッティング(過学習)を防止するため、損失関数を最適化する際、全ての説明変数を使用するのではなく、ランダムに決定された割合で説明変数の数を選定して用いる。制御部10は、損失関数が所定基準を満たすことにより学習を完了する。
The control unit 10 adjusts parameters using, for example, gradient descent to optimize (minimize) the loss function in the
制御部10は、学習済みの第1学習モデル113として、学習済みの第1学習モデル113に関する定義情報を記憶部11に記憶させ(ステップS23)、一連の処理を終了する。制御部10は、上述の処理により、検体データ群に対し、正常又は異常に関する分類情報を適切に出力可能に学習された第1学習モデル113を構築することができる。制御部10は、各第1学習モデル113について上述の処理を実行する。
The control unit 10 stores definition information related to the trained
上述のように生成された第1学習モデル113を用いて、情報処理装置1は、検体データの異常を検出する。以下、運用フェーズにおいて情報処理装置1が実行する処理手順について説明する。
Using the
図7は、異常検出の処理手順の一例を示すフローチャートである。以下の処理は、情報処理装置1の記憶部11に記憶されるプログラム1Pに従って制御部10によって実行される。制御部10は、例えば検査施設装置2から検体データが送信される都度、リアルタイムで以下の処理を行ってもよく、収集された検体データに基づき、任意のタイミングで処理を行ってもよい。
Figure 7 is a flowchart showing an example of a processing procedure for detecting an anomaly. The following processing is executed by the control unit 10 in accordance with the
情報処理装置1の制御部10は、検査施設装置2から検体データを取得し(ステップS31)、取得した検体データを検体DB111に記憶する。
The control unit 10 of the
制御部10は、検体DB111に記憶する情報に基づき、取得した検体データを含む検体データ群を取得する(ステップS32)。検体データ群は、例えば受信した検体データと同一の患者に係る検体データであって、受信した検体データと時系列で隣接する4つの検体データを、時系列順に配列したものである。なお制御部10は、過去に取得された複数の検体データから、今回(最新)の検体データと共起頻度の高い検査項目の検査値を含む検体データを抽出し、抽出した共起頻度の高い検査項目の検査値を含む検体データを含む検体データ群を取得してもよい。共起頻度の高い検体データの抽出方法は、訓練データの生成時と同様の手法であってよい。
Based on the information stored in the
制御部10は、取得した検体データ群を入力データとして第1学習モデル113に入力する(ステップS33)。制御部10は、第1学習モデル113から出力される分類情報を取得する(ステップS34)。 The control unit 10 inputs the acquired sample data group as input data to the first learning model 113 (step S33). The control unit 10 acquires the classification information output from the first learning model 113 (step S34).
制御部10は、第1学習モデル113に入力される検体データにおける各検査項目に対応する検査値の寄与度を算出することにより、出力される分類情報に寄与した検査値を特定する(ステップS35)。寄与度の算出方法は限定されるものではないが、例えばSHAP(SHapley Additive exPlanation)、LIME(Local Interpretable Model-Agnostic Explanations)等を利用することができる。検査値の寄与度が大きい程、当該検査値の分類に及ぼす影響が大きいことを示す。
The control unit 10 calculates the contribution of the test value corresponding to each test item in the sample data input to the
制御部10は、算出した寄与度に基づき、例えば寄与度が所定値以上である検査値を、分類情報に寄与した検査値と特定する。制御部10は、例えば寄与度が高い順に所定数の検査値を選択することにより、分類情報に寄与した検査値と特定してもよい。なお、第1学習モデル113にAttention機構を用いた場合には、Attentionの値を寄与度としてもよい。制御部10は、複数の第1学習モデル113それぞれに対しステップS33からステップS35の処理を実行する。制御部10は、分類情報に寄与した検査値に係る検査項目を特定してもよい。
Based on the calculated contribution degree, the control unit 10 identifies, for example, test values whose contribution degree is equal to or greater than a predetermined value as test values that contributed to the classification information. The control unit 10 may identify test values that contributed to the classification information by, for example, selecting a predetermined number of test values in order of decreasing contribution degree. Note that, if an Attention mechanism is used for the
制御部10は、他の手法による検体データの適否の検証結果を取得する(ステップS36)。制御部10は、検体データの適否の検証方法として、例えば公知のデルタ検証法及び出現実績ゾーン検証法を用いてよい。 The control unit 10 obtains the results of the verification of the appropriateness of the sample data using other methods (step S36). The control unit 10 may use, for example, the well-known delta verification method and occurrence history zone verification method as a method for verifying the appropriateness of the sample data.
デルタ検証法は、取得した今回の検体データに含まれる所定検査項目の検査値と、同一患者の前回値とを比較し、今回の検査値がリミット上下限値(例えば±2SD)以内か否かを判定するものである。今回の検査値がリミット上下限値の範囲外である場合、今回の検査値は異常と判定される。なおデルタ検証法による検証方法については、例えば特開平5-151282号公報や特開平11-296605号公報を参照されたい。 The delta verification method compares the test values of a specified test item contained in the currently acquired sample data with the previous values for the same patient, and determines whether the current test value is within the upper and lower limits (e.g., ±2SD). If the current test value is outside the upper and lower limits, the current test value is determined to be abnormal. For details on the verification method using the delta verification method, see, for example, JP-A-5-151282 and JP-A-11-296605.
出現実績ゾーン検証法は、検査値の出現実績に基づいてその頻度分布を求め、前回値チェックの許容範囲、すなわち正常ゾーンを非線形に設定し、単項目チェック、項目間チェック、前回値チェックを行うものである。今回の検査値が正常ゾーンの範囲外である場合、今回の検査値は異常と判定される。なお出現実績ゾーン検証法による検証方法については、例えば特許公報第2828609号公報を参照されたい。 The occurrence history zone verification method finds the frequency distribution of test values based on their occurrence history, sets the allowable range for previous value checks, i.e., the normal zone, non-linearly, and performs single-item checks, inter-item checks, and previous value checks. If the current test value is outside the normal zone, the current test value is determined to be abnormal. For details about the verification method using the occurrence history zone verification method, please refer to Patent Publication No. 2828609, for example.
制御部10は、取得した分類情報及び検証結果を含む画面情報を生成する(ステップS37)。制御部10は、生成した画面情報を表示装置3へ表示させ(ステップS38)、一連の処理を終了する。 The control unit 10 generates screen information including the acquired classification information and verification results (step S37). The control unit 10 displays the generated screen information on the display device 3 (step S38), and ends the series of processes.
図8から図10は、表示装置3に表示される画面の一例を示す模式図である。図8は、結果一覧画面31の例を示す。結果一覧画面31は、表示対象となる検体データに対する、第1学習モデル113による分類情報と、デルタ検証法及び出現実績ゾーン検証法による検証結果とを含む検出結果を一覧で表示する。結果一覧は、例えば表形式であり、横軸方向に異常検出の手法名(例えばデルタ検証法を意味するデルタ法、出現実績ゾーン検証法を意味するゾーン法、第1学習モデル113を意味する機械学習法等)、初期検査値、及び再検査した場合の最新の検査値が表示される。また、縦軸方向に検体データの各項目(例えば検体ID、患者ID、検査値、検査項目等)が表示される。さらに機械学習法の下行には、異常の種類を示す複数項目が表示される。異常が検出された手法(異常の種類を示す項目)における一又は複数の検査値又は検査項目の欄は、所定の表示態様により、検体データの異常を認識可能に示す。具体的には、異常の有無を表す記号、機械学習法により予測された異常有無の確度の数値等が表示される。
8 to 10 are schematic diagrams showing an example of a screen displayed on the
結果一覧はさらに、例えばホテリング理論等の他の異常検出の手法による検出結果(異常度)や、異常判定の統合結果(ホテリング理論の異常度や機械学習法による予測の確度に基づく自動推定結果)等が含まれてもよい。なお、ホテリング理論等による推定方法については、他の実施形態で詳述する。 The result list may further include detection results (degree of anomaly) using other anomaly detection methods such as Hotelling's theory, and integrated results of anomaly determination (automatic estimation results based on the degree of anomaly in Hotelling's theory or the accuracy of predictions using machine learning methods). Note that estimation methods using Hotelling's theory, etc. will be described in detail in other embodiments.
情報処理装置1の制御部10は、第1学習モデル113による分類情報と、分類情報に寄与した検査値の特定結果とに基づき、分類情報に対応する異常の種類列の検査値又は検査項目欄に、例えば色付け、枠付け、点灯/点滅、異常の有無を表す記号表示等の処理を施す。この場合において、制御部10は、例えば表示色の濃度を検査値又は検査項目の寄与度に応じて変更する、表示色を分類情報(異常の種類)に応じて変更するなど、異常の表示態様を分類情報や寄与度に応じて異ならせてもよい。同様に、制御部10は、デルタ検証法及び出現実績ゾーン検証法による検証結果に基づき、異常が検出された手法名列の検査値又は検査項目欄に、例えば色付け、枠付け、点灯/点滅、異常の有無を表す記号表示等の処理を施す。デルタ検証法及び出現実績ゾーン検証法については、検証に用いた検査値又は検査項目欄に対し各種処理が施されてもよい。
The control unit 10 of the
結果一覧画面31は、表示対象となる患者IDの検査値の時系列データを表示してもよい。また結果一覧画面31は、検体データ(検体ID)毎に表示されるものに限定されず、同一検査日に取得された複数の検体データに関する検出結果を一覧で表示するものであってもよい。これにより、例えば取り違えが検出された場合、その取り違え対象を推定し易くなる。
The
制御部10は、図8に示す如く結果一覧が表示されている状態で、いずれかの検査値のタップ操作を受け付けた場合、図9に示す第1の詳細画面32を表示装置3へ表示させる。第1の詳細画面32は、選択された検査値の時系列変化を示すグラフを含む。グラフの縦軸は検査値、横軸は検査日である。制御部10は、例えば検体DB111を参照し、同一患者の今回及び過去所定回数分(図9の例では過去4回分)の検体データにおける検査値を取得する。検査値は、タップ操作により選択を受け付けた検査値に係る検査項目に対応するものである。制御部10は、取得した各検査値をグラフ上にプロットする。
When the control unit 10 receives a tap operation on any test value while the list of results is displayed as shown in FIG. 8, it causes the
グラフには、今回の検査値に対する正常変動範囲及び異常候補範囲が表示されている。制御部10は、例えば過去4回分の検査値に基づき、今回の検査値の正常変動範囲を推定する。正常変動範囲の推定方法は限定されるものではないが、制御部10は、例えばガウス過程回帰等の学習アルゴリズムにより学習済みのモデルを用いて、正常変動範囲を推定してもよい。制御部10は、グラフ上の正常変動範囲に対応する領域と、正常範囲外である異常候補範囲に対応する領域とに、異なる色付け等の処理を施す。正常変動範囲及び異常候補範囲が可視化されることで、今回の検査値の状態を視覚的に容易に把握できる。図9では、1つの検査項目に関する情報を含む第1の詳細画面32の例を示したが、第1の詳細画面32は、複数の検査項目に関する情報を同時に(並列に)表示するものであってもよい。
The graph displays the normal variation range and the candidate abnormality range for the current test value. The control unit 10 estimates the normal variation range of the current test value based on, for example, the past four test values. The method of estimating the normal variation range is not limited, but the control unit 10 may estimate the normal variation range using a model that has been trained using a learning algorithm such as Gaussian process regression. The control unit 10 performs processing such as coloring differently on the area on the graph that corresponds to the normal variation range and the area that corresponds to the candidate abnormality range that is outside the normal range. By visualizing the normal variation range and the candidate abnormality range, the state of the current test value can be visually and easily grasped. Although FIG. 9 shows an example of the first
また、制御部10は、図8に示す如く結果一覧が表示されている状態で、「デルタ法」又は「ゾーン法」のタップ操作を受け付けた場合、図10に示す第2の詳細画面32を表示装置3へ表示させる。第2の詳細画面32は、図10Aに示すように、「デルタ法」の選択に応じて表示されるデルタ検証法による検査値の頻度分布マップや、図10Bに示すように、「ゾーン法」の選択に応じて表示される出現実績ゾーン検証法による検査値の頻度分布マップを含む。頻度分布マップはいずれも、デルタ検証法及び出現実績ゾーン検証法により特定される今回の検査値の正常範囲及び異常範囲を、異なる色付けや境界線表示等の表示態様により識別可能に表示する。制御部10は、検証結果に基づき頻度分布マップを生成する。さらに制御部10は、生成した頻度分布マップ上の対応する位置に、今回の検査値をプロットする。
In addition, when the control unit 10 receives a tap operation for the "delta method" or "zone method" while the result list is displayed as shown in FIG. 8, the control unit 10 causes the
本実施形態によれば、情報処理装置1は、第1学習モデル113を用いて検体データの異常を精度よく検出することができる。第1学習モデル113は、共起頻度の高い検査項目に係る時系列の複数の検査値に基づき、検体データの正常又異常を精度よく分類する。各種手法による検出結果が統合して表示されるため、検出結果を容易に比較することができる。情報処理装置1は、複数種類の異常を分類できるため、異常の原因を切り分けることで、その後の再検査等の対応を効率的に行うことができる。
According to this embodiment, the
本実施形態によれば、検査工程における異常、すなわち検査過誤の可能性が高い検査を推定できるため、再検査の頻度を最小限に抑制しつつ、効率的に検査結果の信頼性を高める(検査過誤の見逃しを抑制する)ことができる。また、一般的に再検査の実施要否は、経験豊かな臨床検査技師により判断されることが多いところ、本実施形態によれば、再検査を行う検査対象を自動的に抽出し、再検査の理由を自動的に提示できるため、検査担当者の経験に依存しない形で、再検査を効率よく実施することができる。異常の原因が特定されることにより、異常の原因に応じて再検査の有無が判定でき、再検査の自動化が可能となる。 According to this embodiment, abnormalities in the testing process, i.e. tests with a high probability of testing errors, can be estimated, so that the frequency of retesting can be minimized while efficiently increasing the reliability of test results (reducing oversight of testing errors). Furthermore, while the need for retesting is generally determined by experienced clinical laboratory technicians, this embodiment can automatically extract test subjects for retesting and automatically present the reason for retesting, allowing retesting to be performed efficiently without relying on the experience of the tester. By identifying the cause of the abnormality, it is possible to determine whether or not to retest depending on the cause of the abnormality, making it possible to automate retesting.
上記の各フローチャートでは、一連の処理を情報処理装置1の制御部10が実行する例を説明したが、各処理の処理主体は限定されない。上記の処理は、一部又は全部が検査施設装置2の制御部20で実行されるものであってもよく。検査装置5で実行されるものであってもよい。第1学習モデル113は、情報処理装置1により生成され、検査施設装置2で学習されたものであってもよい。情報処理装置1が生成した第1学習モデル113を検査施設装置2にインストールし、検査施設装置2で異常検出を行ってもよい。また、分類情報は、検査施設装置2を介し表示装置3へ出力されるものに限定されない。制御部10は、表示装置3以外の装置に分類情報を出力し、表示させてもよい。情報処理装置1は、検査施設装置2と別体で構成されるものに限定されず、検査施設装置2に内包されるものであってもよい。
In each of the above flowcharts, an example in which a series of processes is executed by the control unit 10 of the
(第2実施形態)
第2実施形態では、臨床検査により得られる実際の異常検体データを用いて第1学習モデル113を学習する。以下では主に第1実施形態との相違点を説明し、第1実施形態と共通する構成については同一の符号を付してその詳細な説明を省略する。
Second Embodiment
In the second embodiment, actual abnormal specimen data obtained by a clinical test is used to train the
第2実施形態の情報処理装置1は、臨床検査により得られる実際の異常検体データを用いて訓練データを生成する。情報処理装置1は、第1実施形態における第1学習モデル113の学習を事前学習とし、新たに生成した生成した訓練データを用いて、2段階で第1学習モデル113を学習する(ファインチューニング)。
The
図11は、第2実施形態における第1学習モデル113の生成処理手順の一例を示すフローチャートである。以下の処理は、情報処理装置1の記憶部11に記憶されるプログラム1Pに従って制御部10により実行される。
Figure 11 is a flowchart showing an example of a process for generating the
情報処理装置1の制御部10は、検査施設装置2から異常値を含む異常検体データと、異常の種類(異常の原因)とを対応付けて取得する(ステップS41)。得られた異常検体データは、臨床検査において実際に得られた異常値を含む。
The control unit 10 of the
制御部10は、検体DB111を参照して、取得した異常検体データと同一患者に係る過去の1回以上の検体データ、例えば過去3回分の検体データを取得し、実際の異常検体データと過去の検体データとを含む検体データ群を生成する(ステップS42)。
The control unit 10 refers to the
制御部10は、生成した検体データ群に対し、異常の種類を示す分類情報が正解値としてラベル付けされたデータセットである訓練データを生成する(ステップS43)。制御部10は、生成した訓練データを訓練DB112に記憶する(ステップS44)。 The control unit 10 generates training data, which is a data set in which classification information indicating the type of abnormality is labeled as a correct answer value for the generated sample data group (step S43). The control unit 10 stores the generated training data in the training DB 112 (step S44).
制御部10は、新たに取得した訓練データを用いて、検体データ群を入力した場合に、当該検体データ群に含まれる時系列で最後の検体データの正常又は異常を示す情報を出力する第1学習モデル113を生成する(ステップS45)。この場合において、制御部10は、第1実施形態において説明した処理により、臨床検査における実際の異常検体データを含まない訓練データを用いて事前に第1学習モデル113を学習しておく。そして制御部10は、事前学習によるパラメータを初期値とし、新たな訓練データを用いてパラメータを最適化するよう、第1学習モデル113の学習を実行する。
The control unit 10 uses the newly acquired training data to generate a
制御部10は、学習済みの第1学習モデル113に関する定義情報を記憶部11に記憶させ(ステップS46)、一連の処理を終了する。
The control unit 10 stores definition information regarding the trained
本実施形態によれば、2段階で第1学習モデル113の学習を行うことにより、効率的に学習を実行できるとともに、第1学習モデル113の精度を向上できる。例えば、複数の検査施設から取得した検体データ群を用いて第1学習モデル113の事前学習を行い、各検査施設で実際に得られた異常検体データを用いてファインチューニングすることで、各検査施設に十分な数の異常データを準備できなくても、各検査施設に適した第1学習モデル113を効率的且つ効果的に生成することができる。
According to this embodiment, by learning the
(第3実施形態)
第3実施形態では、教師なし学習モデルとの組み合わせにより、第1学習モデル113を学習する。以下では主に第1実施形態との相違点を説明し、第1実施形態と共通する構成については同一の符号を付してその詳細な説明を省略する。
Third Embodiment
In the third embodiment, the
第3実施形態の情報処理装置1は、教師なし学習モデルである第2学習モデル114を記憶部11に記憶している。情報処理装置1は、第2学習モデル114による分類結果を用い、第1学習モデル113を学習する。
The
図12は、第3実施形態における第2学習モデル114の概要を示す説明図である。第2学習モデル114は、検体データ群を入力として、当該検体データ群の異常の有無(異常又は正常)を示す情報を出力するよう構成される機械学習モデルである。第2学習モデル114は、第2学習モデル114は、例えばLOF(Local Outlier Factor)の手法により、検体データ群における異常の有無の分類結果を出力する。第2学習モデル114は、検体データ群の異常度を算出し、ある閾値より異常度が大きい場合を異常と定義することで、異常の有無を分類する。
FIG. 12 is an explanatory diagram showing an overview of the
情報処理装置1は、過去に収集した大量の異常検体データを含まない検体データ群、すなわち正常な検体データ群のみを用いて、教師なし学習を行う。第2学習モデル114は、異常検体データを含まない検体データ群を正常データとし、新たな検体データ群の異常度が正常の範囲内か否かを識別するように訓練される。第2学習モデル114は、異常検体データを含まない検体データ群以外、すなわち異常検体データを含む検体データ群を異常値として識別する。第2学習モデル114は、正常データに対する、入力データである検体データ群の外れ度合いを評価した外れ値スコア(LOF)を用いて、異常の有無を分類する。これにより、検体データ群が入力された場合、異常の有無を示す情報を適切に出力可能に学習された第2学習モデル114が構築される。
The
第2学習モデル114は、検体データ群の特徴量を抽出する特徴量抽出器と、上述の分類モデルとを備え、特徴量抽出器により抽出された特徴量に基づき、検体データ群における異常の有無を分類してもよい。特徴量抽出器は、例えば、検体データ群の特徴を抽出し、抽出された特徴量を出力する畳み込みニューラルネットワークモデルである。CNNは、例えば転移学習により、事前に学習された学習済みモデルを用いてもよい。
The
第2学習モデル114の構成は上記の例に限定されるものではなく、教師なしの学習アルゴリズムにより、検体データ群の異常の有無を識別可能であればよい。第2学習モデル114は、例えばk近傍法、One-class SVM、ホテリング理論のような異常度を定義した異常検知方法等により構成されてもよい。
The configuration of the
なお第2学習モデル114への入力データは、複数の検体データを含む検体データ群に限定されず、少なくとも検体データ群における時系列で最後の検体データ、すなわち最新(直近)の検体データを含むものであればよい。
The input data to the
図13は、第3実施形態における第1学習モデル113の学習処理手順の一例を示すフローチャートである。以下の処理は、情報処理装置1の記憶部11に記憶されるプログラム1Pに従って制御部10により実行される。記憶部11には、予め学習済みの第1学習モデル113が記憶されている。
Figure 13 is a flowchart showing an example of a learning process procedure for the
情報処理装置1の制御部10は、検体データ群を取得する(ステップS51)。取得する検体データ群は、例えば図7のステップS32において取得した検体データ群と同一であってよい。
The control unit 10 of the
制御部10は、取得した検体データ群を入力データとして第2学習モデル114に入力する(ステップS52)。制御部10は、第2学習モデル114から出力される異常の有無の推定結果を取得する(ステップS53)。 The control unit 10 inputs the acquired sample data group as input data to the second learning model 114 (step S52). The control unit 10 acquires the estimation result of the presence or absence of an abnormality output from the second learning model 114 (step S53).
制御部10は、取得した第2学習モデル114による分類結果と、第1学習モデル113による分類情報とを比較する(ステップS54)。制御部10は、比較結果を検査施設装置2へ出力する(ステップS55)。
The control unit 10 compares the classification result obtained by the
制御部10は、第1学習モデル113による分類情報が、第2学習モデル114による分類結果と異なる場合、第2学習モデル114による分類結果を修正情報として取得する(ステップS56)。制御部10は、分類情報に対する修正情報を用いて第1学習モデル113の再学習を行い、第1学習モデル113を更新する(ステップS57)。具体的には、制御部10は、第1学習モデル113に入力した検体データ群と、分類情報に対する修正情報とを訓練データとする再学習を行い、第1学習モデル113を更新する。制御部10は、第1学習モデル113から出力される分類情報が修正後の推定情報に近似するようパラメータを最適化し、第1学習モデル113を再生成する。
When the classification information from the
第2学習モデル114による分類結果と、第1学習モデル113による分類情報との比較結果は、例えば図8に示した結果一覧画面31を用いて表示されてもよい。制御部10は、第2学習モデル114による分類情報に加え、第2学習モデル114における各検査値(検査項目)に対する異常度を取得する。制御部10は、第2学習モデル114の異常検知手法(図8の例ではホテリング理論)の検査値欄に、取得した各異常度を表示するとともに、異常と判定された検査値欄に対して、色付け等の表示態様を施す。また、制御部10は、第2学習モデル114による分類結果と、第1学習モデル113による分類情報とを比較し、例えば第2学習モデル114における異常度と、第1学習モデル113による予測の確度とに基づいて、異常判定の統合結果(正常又は異常)を導出する。制御部10は、導出した総合的な判定結果を異常判定列に表示する。
The comparison result between the classification result by the
なお、情報処理装置1は、第1学習モデル113と第2学習モデル114とを統合した1つの統合モデルを構築し、当該統合モデルを用いて検体データの異常を検出するよう構成されてもよい。
The
本実施形態によれば、第1学習モデル113と第2学習モデル114とを組み合わせることで第1学習モデル113をより最適化することができる。第1学習モデル113は、過去の異常とは異なる多様な異常を好適に検出できる。
According to this embodiment, the
(第4実施形態)
第4実施形態では、被検者の状態に関連した病態や疾患、生理的状態に起因する異常(以下、「疾患に起因する検査値の異常」という)を検出する。以下では主に第1実施形態との相違点を説明し、第1実施形態と共通する構成については同一の符号を付してその詳細な説明を省略する。
Fourth Embodiment
In the fourth embodiment, abnormalities caused by pathological conditions, diseases, and physiological conditions related to the condition of a subject (hereinafter referred to as "abnormal test values caused by diseases") are detected. The following mainly describes the differences from the first embodiment, and the same reference numerals are used to designate the same components as the first embodiment, and detailed descriptions thereof will be omitted.
第4実施形態の情報処理装置1は、疾患に起因する検査値の異常を検出する第3学習モデル115を記憶部11に記憶している。情報処理装置1は、第3学習モデル115を用い、検査過誤による検査時の異常とは異なる、患者の疾患に起因する検体データの異常を検出する。
The
図14は、第4実施形態における第3学習モデル115の概要を示す説明図である。第3学習モデル115は、複数の検査項目に対応する検査値により構成される検体データを入力として、当該検体データの正常又は異常に関する疾患情報を出力する機械学習モデルである。第3学習モデル115は予め、情報処理装置1又は外部装置において、ニューラルネットワークを用いた深層学習によって、生成され、学習される。学習アルゴリズムは、時系列データを取得した場合にはリカレントニューラルネットワーク(RNN:Recurrent Neural Network)でもよい。
Figure 14 is an explanatory diagram showing an overview of the
第3学習モデル115は、検体データを入力する入力層と、疾患情報を出力する出力層と、特徴量を抽出する中間層(隠れ層)とを備える。中間層は、入力データの特徴量を抽出する複数のノードを有し、各種パラメータを用いて抽出された特徴量を出力層に受け渡す。入力層に、検体データが入力された場合、中間層で演算が行なわれ、出力層から、疾患情報が出力される。
The
第3学習モデル115の入力は、複数の検査項目に対応する検査値を含む検体データである。検体データは、患者の年齢、性別等の属性情報をさらに含んでもよい。
The input of the
第3学習モデル115の出力は、患者の疾患に起因する検体データの正常又は異常を示す疾患情報である。異常は、疾患名(例えば糖尿病、高血圧等)に応じて複数種類に分類されてよい。出力層は、設定されている疾患情報(正常又は各疾患名)に各々対応するノードを含み、各疾患情報に対する確度をスコアとして出力する。情報処理装置1は、スコアが最も高い疾患情報、あるいはスコアが閾値以上である疾患情報を出力層の出力値とすることができる。なお出力層は、それぞれの疾患情報の確度を出力する複数の出力ノードを有する代わりに、最も確度の高い疾患リスクを出力する1個の出力ノードを有してもよい。
The output of the
制御部10は、過去に実施した大量の臨床検査から得られる入力情報に、既知の検査結果(正常又は疾患名)が付与された情報群を訓練データとして予め収集して第3学習モデル115を学習する。制御部10は、検体データに応じた疾患情報を出力するよう、例えば誤差逆伝播法を用いて、第3学習モデル115を構成する各種パラメータを学習する。これにより、検体データが入力された場合、疾患情報を適切に出力可能に学習された第3学習モデル115が構築される。
The control unit 10 learns the
図15は、第4実施形態における疾患情報の取得処理手順の一例を示すフローチャートである。以下の処理は、情報処理装置1の記憶部11に記憶されるプログラム1Pに従って制御部10により実行される。
Figure 15 is a flowchart showing an example of a disease information acquisition processing procedure in the fourth embodiment. The following processing is executed by the control unit 10 according to the
情報処理装置1の制御部10は、第1学習モデル113から出力される分類情報に基づき、検体データ群が正常と分類された検体データ群を特定し、特定した検体データ群における最新の(時系列で最後の)検体データを抽出する(ステップS61)。
The control unit 10 of the
制御部10は、取得した検体データを入力データとして第3学習モデル115に入力する(ステップS62)。制御部10は、第3学習モデル115から出力される検体データの正常又は異常を示す疾患情報を取得する(ステップS63)。 The control unit 10 inputs the acquired specimen data as input data to the third learning model 115 (step S62). The control unit 10 acquires disease information indicating whether the specimen data is normal or abnormal, which is output from the third learning model 115 (step S63).
制御部10は、取得した疾患情報を検査施設装置2へ出力し(ステップS64)、一連の処理を終了する。制御部10は、取得した疾患情報を、分類情報等とともに表示する画面情報を生成してもよい。 The control unit 10 outputs the acquired disease information to the testing facility device 2 (step S64), and ends the series of processes. The control unit 10 may generate screen information that displays the acquired disease information together with classification information, etc.
本実施形態によれば、臨床検査時の検査過誤に由来する異常に加え、被検者の生理状態と関連した疾患に関する異常を検出することで、より多くの情報を提供することができる。検体データの異常値に対し、疾患情報を加味することで、より臨床検査結果の妥当性を適正に判断することができる。 According to this embodiment, in addition to abnormalities resulting from testing errors during clinical testing, more information can be provided by detecting abnormalities related to diseases associated with the physiological state of the subject. By adding disease information to abnormal values in the sample data, the validity of the clinical test results can be more appropriately determined.
今回開示した実施の形態は、全ての点で例示であって、制限的なものではないと考えられるべきである。各実施例にて記載されている技術的特徴は互いに組み合わせることができ、本発明の範囲は、特許請求の範囲内での全ての変更及び特許請求の範囲と均等の範囲が含まれることが意図される。 The embodiments disclosed herein are illustrative in all respects and should not be considered limiting. The technical features described in each embodiment can be combined with each other, and the scope of the present invention is intended to include all modifications within the scope of the claims and equivalents to the scope of the claims.
1 情報処理装置
2 検査施設装置
3 表示装置
4 入力装置
5 検査装置
10,20 制御部
11,21 記憶部
12,22 通信部
23 入出力部
111 検体DB
112 訓練DB
113 第1学習モデル
114 第2学習モデル
115 第3学習モデル
1P プログラム
1A 記録媒体
REFERENCE SIGNS
112 Training DB
113
Claims (20)
取得した複数の前記検体データに含まれる少なくとも1つの検査値を異常値に置き換えることにより、異常検体データを含む第1の検体データ群を生成し、
生成した第1の前記検体データ群と、前記異常検体データを含まない第2の前記検体データ群と、前記検体データ群の正常又は異常に関する分類情報とを含む訓練データに基づき、前記検体データ群を入力した場合に前記分類情報を出力する学習モデルを生成する
処理をコンピュータに実行させる学習モデルの生成方法。 Obtaining a plurality of pieces of sample data including test values corresponding to a plurality of test items in a clinical test;
generating a first sample data group including abnormal sample data by replacing at least one test value included in the acquired plurality of sample data with an abnormal value ;
A method for generating a learning model that causes a computer to execute a process of generating a learning model that outputs the classification information when the sample data group is input, based on training data that includes the generated first sample data group, the second sample data group that does not include the abnormal sample data, and classification information regarding whether the sample data group is normal or abnormal.
請求項1に記載の学習モデルの生成方法。 The method for generating a learning model according to claim 1 , further comprising the steps of: replacing a portion of the sample data among a plurality of sample data items at different test dates and times related to a first patient with the sample data item of a second patient, thereby generating the first group of sample data.
請求項1又は請求項2に記載の学習モデルの生成方法。 The method for generating a learning model according to claim 1 or 2, further comprising the step of generating the first group of sample data by modifying the at least one test value in accordance with a predetermined rule.
請求項3に記載の学習モデルの生成方法。 The method for generating a learning model according to claim 3 , wherein the predetermined rule includes changing a dilution ratio.
請求項1から請求項4のいずれか1項に記載の学習モデルの生成方法。 The method for generating a learning model according to claim 1 , wherein the classification information includes normality and a plurality of types of abnormality including an abnormality caused by a mix-up of a sample.
取得した前記臨床検査において得られた異常検体データを含む第3の前記検体データ群と、前記検体データ群の異常を示すラベルとを含む前記訓練データに基づき、前記学習モデルを学習する
請求項1から請求項5のいずれか1項に記載の学習モデルの生成方法。 Obtaining abnormal specimen data obtained in the clinical test,
6. The method for generating a learning model according to claim 1, further comprising: learning the learning model based on the training data including a third sample data group including abnormal sample data obtained in the acquired clinical test, and a label indicating abnormality in the sample data group.
請求項1から請求項6のいずれか1項に記載の学習モデルの生成方法。 7. The method for generating a learning model according to claim 1, further comprising: training the learning model using a result of classification of the sample data group as normal or abnormal by an unsupervised model that has been trained by unsupervised learning to classify the sample data group as normal or abnormal.
抽出した共起頻度の高い前記検体データにより前記検体データ群を生成する
請求項1から請求項7のいずれか1項に記載の学習モデルの生成方法。 Extracting the specimen data having a high co-occurrence frequency from the plurality of specimen data;
The method for generating a learning model according to claim 1 , further comprising generating the sample data group from the extracted sample data with high co-occurrence frequency.
時系列順に配列された複数の検体データからなる検体データ群を入力した場合に、前記検体データ群に含まれる時系列で最後の前記検体データの正常又は異常に関する分類情報を出力するよう学習済みの学習モデルに、取得した前記検体データ群を入力して、前記分類情報を出力し、
前記学習モデルは、臨床検査における複数の検査項目に対応する検査値を含む複数の検体データに含まれる少なくとも1つの検査値を異常値に置き換えることにより生成される異常検体データを含む第1の前記検体データ群と、前記異常検体データを含まない第2の前記検体データ群と、前記検体データ群の正常又は異常に関する分類情報とを含む訓練データを用いて学習済みである
処理をコンピュータに実行させるためのプログラム。 Obtaining a specimen data group consisting of a plurality of specimen data arranged in chronological order;
inputting the acquired specimen data group into a learning model that has been trained to output classification information regarding normality or abnormality of the last specimen data in the time series included in the specimen data group when a specimen data group consisting of a plurality of specimen data arranged in chronological order is input, and outputting the classification information;
The learning model has been trained using training data including a first specimen data group including abnormal specimen data generated by replacing at least one test value included in a plurality of specimen data including test values corresponding to a plurality of test items in a clinical test with an abnormal value, a second specimen data group not including the abnormal specimen data, and classification information regarding normality or abnormality of the specimen data group.
A program that causes a computer to execute a process.
請求項9に記載のプログラム。 The program according to claim 9 , further comprising: acquiring the specimen data group consisting of a plurality of specimen data with high co-occurrence frequencies extracted from the plurality of specimen data.
請求項9又は請求項10に記載のプログラム。 The program according to claim 9 or 10, wherein the classification information includes an abnormality caused by a mix-up of a sample.
請求項9から請求項11のいずれか1項に記載のプログラム。 The program according to claim 9 , wherein the classification information includes an abnormality caused by a calculation error when calculating any one of test values corresponding to a plurality of test items constituting the sample data.
請求項9から請求項12のいずれか1項に記載のプログラム。 13. The program according to claim 9, wherein the learning model outputs the classification information including a plurality of types of abnormalities, including an abnormality caused by a mix-up of samples and an abnormality caused by a calculation error when calculating one of the test values corresponding to a plurality of test items constituting the sample data.
取得した前記検証結果と、前記分類情報とを対応付けて出力する
請求項9から請求項13のいずれか1項に記載のプログラム。 Obtaining a verification result regarding normality or abnormality of the sample data by a delta verification method or an occurrence record zone verification method;
The program according to claim 9 , further comprising: outputting the acquired verification result and the classification information in association with each other.
請求項9から請求項14のいずれか1項に記載のプログラム。 The program according to claim 9 , further comprising: outputting, in an identifiable manner, from among test values corresponding to a plurality of test items constituting the specimen data, the test value or the test item having a high contribution to the classification information.
請求項9から請求項15のいずれか1項に記載のプログラム。 16. The program according to claim 9, further comprising: a graph showing time series changes in the latest sample data and past sample data in a clinical test; and an abnormality range of the latest sample data estimated based on the past sample data, the graph being output in association with the abnormality range of the latest sample data.
複数の検査項目に対応する検査値により構成される検体データを入力した場合に、疾患に起因する検査値の異常に関する疾患情報を出力する第2学習モデルに、抽出した最新の前記検体データを入力して、疾患情報を出力する
請求項9から請求項16のいずれか1項に記載のプログラム。 Extracting the latest sample data determined to be normal by the learning model;
17. The program according to claim 9, further comprising: inputting the extracted latest specimen data into a second learning model that outputs disease information relating to abnormalities in the test values caused by a disease when specimen data consisting of test values corresponding to a plurality of test items is input; and outputting the disease information.
時系列順に配列された複数の検体データからなる検体データ群を入力した場合に、時系列で最後の前記検体データの正常または異常に関する分類情報を出力するよう学習済みの学習モデルに、取得した前記検体データ群を入力して、分類情報を出力し、
前記学習モデルは、臨床検査における複数の検査項目に対応する検査値を含む複数の検体データに含まれる少なくとも1つの検査値を異常値に置き換えることにより生成される異常検体データを含む第1の前記検体データ群と、前記異常検体データを含まない第2の前記検体データ群と、前記検体データ群の正常又は異常に関する分類情報とを含む訓練データを用いて学習済みである
処理をコンピュータに実行させる情報処理方法。 Obtaining a specimen data group consisting of a plurality of specimen data arranged in chronological order;
inputting the acquired specimen data group into a learning model that has been trained to output classification information regarding normality or abnormality of the last specimen data in chronological order when a specimen data group consisting of a plurality of specimen data arranged in chronological order is input, and outputting the classification information;
The learning model has been trained using training data including a first specimen data group including abnormal specimen data generated by replacing at least one test value included in a plurality of specimen data including test values corresponding to a plurality of test items in a clinical test with an abnormal value, a second specimen data group not including the abnormal specimen data, and classification information regarding normality or abnormality of the specimen data group.
An information processing method for causing a computer to execute processing.
時系列順に配列された複数の検体データからなる検体データ群を入力した場合に、時系列で最後の前記検体データの正常または異常に関する分類情報を出力するよう学習済みの学習モデルに、取得した前記検体データ群を入力して、分類情報を出力する出力部と
を備え、
前記学習モデルは、臨床検査における複数の検査項目に対応する検査値を含む複数の検体データに含まれる少なくとも1つの検査値を異常値に置き換えることにより生成される異常検体データを含む第1の前記検体データ群と、前記異常検体データを含まない第2の前記検体データ群と、前記検体データ群の正常又は異常に関する分類情報とを含む訓練データを用いて学習済みである
情報処理装置。 an acquisition unit that acquires a sample data group consisting of a plurality of sample data arranged in chronological order;
and an output unit that inputs the acquired sample data group to a learning model that has been trained to output classification information regarding normality or abnormality of the last sample data in the time series when a sample data group consisting of a plurality of sample data arranged in chronological order is input, and outputs the classification information ;
The learning model has been trained using training data including a first specimen data group including abnormal specimen data generated by replacing at least one test value included in a plurality of specimen data including test values corresponding to a plurality of test items in a clinical test with an abnormal value, a second specimen data group not including the abnormal specimen data, and classification information regarding normality or abnormality of the specimen data group.
Information processing device.
取得した複数の前記検体データに含まれる少なくとも1つの検査値を異常値に置き換えることにより、異常検体データを含む第1の検体データ群を生成し、
生成した第1の前記検体データ群及び異常を示すラベルと、前記異常検体データを含まない第2の前記検体データ群及び正常を示すラベルとを学習モデルに対する訓練データとして対応付けて記憶部に記憶する
処理をコンピュータに実行させる学習モデルデータの生成方法。 Obtaining a plurality of pieces of sample data including test values corresponding to a plurality of test items in a clinical test;
generating a first sample data group including abnormal sample data by replacing at least one test value included in the acquired plurality of sample data with an abnormal value ;
The method for generating learning model data causes a computer to execute a process of correspondingly storing the generated first sample data group and a label indicating abnormality, and the generated second sample data group not including the abnormal sample data and a label indicating normality in a storage unit as training data for a learning model.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021104303A JP7656499B2 (en) | 2021-06-23 | 2021-06-23 | Learning model generation method, program, information processing method, information processing device, and learning model data generation method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021104303A JP7656499B2 (en) | 2021-06-23 | 2021-06-23 | Learning model generation method, program, information processing method, information processing device, and learning model data generation method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2023003235A JP2023003235A (en) | 2023-01-11 |
| JP7656499B2 true JP7656499B2 (en) | 2025-04-03 |
Family
ID=84816992
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021104303A Active JP7656499B2 (en) | 2021-06-23 | 2021-06-23 | Learning model generation method, program, information processing method, information processing device, and learning model data generation method |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7656499B2 (en) |
Families Citing this family (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2025030445A (en) * | 2023-08-23 | 2025-03-07 | 株式会社日立ハイテクソリューションズ | Body fluid analysis method and system |
| WO2025070638A1 (en) * | 2023-09-28 | 2025-04-03 | 公立大学法人大阪 | Clinical test assistance device, clinical test assistance program, clinical test assistance model, and clinical test assistance method |
| WO2025187536A1 (en) * | 2024-03-07 | 2025-09-12 | 株式会社日立ハイテク | Automated analysis device, automated analysis system, and data analysis method |
| CN119885026B (en) * | 2025-01-15 | 2025-10-10 | 济宁众达利电气设备有限公司 | A method and system for processing power equipment fault data based on big data |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002090375A (en) | 2000-09-12 | 2002-03-27 | A & T:Kk | Clinical test system and control method for clinical test system |
| JP2010181276A (en) | 2009-02-05 | 2010-08-19 | Oita Univ | Device, method and program for management of clinical examination value |
| JP2011197826A (en) | 2010-03-17 | 2011-10-06 | Rumiko Matsuoka | Diagnosis/counseling support system |
| JP2018081442A (en) | 2016-11-15 | 2018-05-24 | 株式会社Preferred Networks | Trained model generation method and signal data discrimination device |
| WO2020116351A1 (en) | 2018-12-04 | 2020-06-11 | 株式会社ニデック | Diagnostic assistance device and diagnostic assistance program |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH09251023A (en) * | 1996-03-18 | 1997-09-22 | Hitachi Ltd | Clinical laboratory automation system |
-
2021
- 2021-06-23 JP JP2021104303A patent/JP7656499B2/en active Active
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002090375A (en) | 2000-09-12 | 2002-03-27 | A & T:Kk | Clinical test system and control method for clinical test system |
| JP2010181276A (en) | 2009-02-05 | 2010-08-19 | Oita Univ | Device, method and program for management of clinical examination value |
| JP2011197826A (en) | 2010-03-17 | 2011-10-06 | Rumiko Matsuoka | Diagnosis/counseling support system |
| JP2018081442A (en) | 2016-11-15 | 2018-05-24 | 株式会社Preferred Networks | Trained model generation method and signal data discrimination device |
| WO2020116351A1 (en) | 2018-12-04 | 2020-06-11 | 株式会社ニデック | Diagnostic assistance device and diagnostic assistance program |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2023003235A (en) | 2023-01-11 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7656499B2 (en) | Learning model generation method, program, information processing method, information processing device, and learning model data generation method | |
| US20180150609A1 (en) | Server and method for predicting future health trends through similar case cluster based prediction models | |
| KR101822404B1 (en) | diagnostics system for cell using Deep Neural Network learning | |
| CN118213075A (en) | Multimodal prediction and recognition system for postoperative sub-delirium syndrome in elderly patients under general anesthesia | |
| CN118016279A (en) | An analysis and diagnosis platform based on artificial intelligence multimodal technology in the field of breast cancer | |
| CN118645200A (en) | A method for spinal etiology analysis and risk prediction based on artificial intelligence modeling | |
| US20240331813A1 (en) | Computer-implemented method and device for carrying out a medical laboratory value analysis | |
| Fadillah et al. | Diabetes diagnosis and prediction using data mining and machine learning techniques | |
| Sharma et al. | A multi-level decision-making framework for heart-related disease prediction and recommendation | |
| Burle et al. | Prediction of heart disease using machine learning algorithms | |
| CN116483209A (en) | Cognitive disorder man-machine interaction method and system based on eye movement regulation and control | |
| CN119943352B (en) | Inspection result evaluation system | |
| CN115151182B (en) | Method and system for diagnostic analysis | |
| CN120032793A (en) | A medicine management method and system combining multi-source information | |
| US20250316390A1 (en) | Health data enrichment for improved medical diagnostics | |
| Selvamarilakshmi et al. | Integrating Machine Learning for Early Diagnosis and Prognostic Assessment of Retinopathy of Premature Babies | |
| D’Silva et al. | Prediction of Hypertension using Machine Learning | |
| Prabha et al. | CardioNet: An Integrative AI-Machine Learning Framework for Enhanced Prediction and Management of Cardiovascular Diseases Using Deep Data Analytics and Clinical Insights | |
| Eswari et al. | An optimal diabetic features-based intelligent system to predict diabetic retinal disease | |
| CN120932877B (en) | VTE risk prediction method and system based on gradient increment | |
| Manocha et al. | Heart Disease Prediction Analysis with Machine Learning | |
| SCHREIER | Predictive Modelling and ts Visualization for Telehealth Data–Concept and Implementation of an Interactive Viewer | |
| EP4478370A1 (en) | Generating an american society of anesthesiologists physical status score | |
| KR20260043656A (en) | Ai-based urine and stool analysis to create personalized disease prediction system | |
| Banu et al. | Chronic Disease Diagnosis Using Machine Learning Algorithm |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240315 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20241129 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20241203 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250122 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250318 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250324 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7656499 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |