JP7106741B2 - Learning method, learning device, generative model and program - Google Patents
Learning method, learning device, generative model and program Download PDFInfo
- Publication number
- JP7106741B2 JP7106741B2 JP2021502250A JP2021502250A JP7106741B2 JP 7106741 B2 JP7106741 B2 JP 7106741B2 JP 2021502250 A JP2021502250 A JP 2021502250A JP 2021502250 A JP2021502250 A JP 2021502250A JP 7106741 B2 JP7106741 B2 JP 7106741B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- resolution
- learning
- input
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
- G06F18/2178—Validation; Performance evaluation; Active pattern learning techniques based on feedback of a supervisor
- G06F18/2185—Validation; Performance evaluation; Active pattern learning techniques based on feedback of a supervisor the supervisor being an automated module, e.g. intelligent oracle
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/10—Image acquisition
- G06V10/12—Details of acquisition arrangements; Constructional details thereof
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/10—Image acquisition
- G06V10/16—Image acquisition using multiple overlapping images; Image stitching
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/248—Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
- G06V30/2504—Coarse or fine approaches, e.g. resolution of ambiguities or multiscale approaches
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B6/00—Apparatus or devices for radiation diagnosis; Apparatus or devices for radiation diagnosis combined with radiation therapy equipment
- A61B6/02—Arrangements for diagnosis sequentially in different planes; Stereoscopic radiation diagnosis
- A61B6/03—Computed tomography [CT]
- A61B6/032—Transmission computed tomography [CT]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/03—Recognition of patterns in medical or anatomical images
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Apparatus For Radiation Diagnosis (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Description
本発明は学習方法、学習装置、生成モデル及びプログラムに係り、特に高解像度の画像を生成する技術に関する。 The present invention relates to a learning method, a learning device, a generation model, and a program, and more particularly to technology for generating high-resolution images.
データを作り出す「Generator」(ジェネレータ)と、データを識別する「Discriminator」(ディスクリミネータ)とを交互に学習する敵対的生成ネットワーク(Generative Adversarial Networks:GAN)が知られている。非特許文献1には、GANに関する研究が記載されている。GANによれば、学習データの特徴に沿った精度の高いデータを生成する生成モデルを学習することができる。 Generative Adversarial Networks (GANs) are known that alternately learn a "Generator" that creates data and a "Discriminator" that identifies data. Non-Patent Document 1 describes research on GANs. According to GAN, it is possible to learn a generative model that generates highly accurate data along the characteristics of learning data.
また、GANを応用した技術が研究されている。非特許文献2には、GANを用いて入力画像と出力画像とのペアを学習する手法が記載されている。非特許文献2に記載の手法によれば、パラメータの調整の負担の少ない生成モデルを学習することができる。 In addition, research is being conducted on techniques to which GANs are applied. Non-Patent Literature 2 describes a method of learning a pair of an input image and an output image using a GAN. According to the technique described in Non-Patent Document 2, it is possible to learn a generative model with less burden of parameter adjustment.
GANの画像生成では、入力データに多様性がある場合に学習が困難であるという問題点がある。例えば、医療画像において、入力とする画像の部位及びスライス条件が多岐にわたる場合、生成画像の特徴が平均化されてしまう。非特許文献2における多様な入力データへの対応においても、学習データの特徴が平均化されてしまう。 GAN image generation has a problem that learning is difficult when there is diversity in the input data. For example, in a medical image, if the input image has a wide variety of parts and slice conditions, the features of the generated image are averaged. Even in dealing with various input data in Non-Patent Document 2, the features of learning data are averaged.
これに対し、非特許文献3には、GANの学習にデータのカテゴリ情報を用いる手法が記載されている。非特許文献3に記載の手法によれば、生成モデルをカテゴリ情報に基づいて調整することができる。 On the other hand, Non-Patent Document 3 describes a method of using data category information for GAN learning. According to the method described in Non-Patent Document 3, the generative model can be adjusted based on the category information.
しかしながら、非特許文献3に記載されたGANの構成では、Generatorにカテゴリ情報を入力する必要があるため、ネットワークアーキテクチャの大幅な修正が必要となり、Generatorのインターフェースが複雑化するという問題点があった。 However, in the GAN configuration described in Non-Patent Document 3, it is necessary to input category information to the Generator, so there is a problem that the network architecture needs to be significantly modified and the Generator interface becomes complicated. .
また、GANでは一部の学習データの影響を強く受けて、Mode collapseと呼ばれる、生成する画像が限定的になってしまい多様性に対応できない状態に陥ることがあるという問題点があった。 In addition, GAN is strongly affected by some learning data, and there is a problem that it may fall into a state called Mode collapse, in which images to be generated become limited and cannot cope with diversity.
本発明はこのような事情に鑑みてなされたもので、パラメータの調整及びネットワークアーキテクチャの大幅な修正をすることなく、多様性を持った学習を行い、高解像情報を含む画像を生成する学習方法、学習装置、生成モデル及びプログラムを提供することを目的とする。 The present invention has been devised in view of such circumstances, and is capable of performing diverse learning and generating images containing high-resolution information without adjusting parameters or significantly modifying the network architecture. An object is to provide a method, a learning device, a generative model and a program.
上記目的を達成するための学習方法の一の態様は、解像度が相対的に低い低解像情報を含む第1画像から解像度が相対的に高い高解像情報を含む第2画像を推定する生成モデルの学習方法であって、第1画像を用いて仮想第2画像を生成する生成モデルであるジェネレータと、学習用第2画像と仮想第2画像とを識別するディスクリミネータと、を備える敵対的生成ネットワークのジェネレータに第1画像のみを入力するジェネレータ入力工程と、ディスクリミネータに学習用第2画像と学習用第2画像の部位情報と、を入力する第1ディスクリミネータ入力工程と、ディスクリミネータに仮想第2画像と仮想第2画像の部位情報と、を入力する第2ディスクリミネータ入力工程と、を備えた学習方法である。 One aspect of the learning method for achieving the above object is generation of estimating a second image containing high-resolution information with relatively high resolution from a first image containing low-resolution information with relatively low resolution. A method of training a model, comprising: a generator that is a generative model that uses a first image to generate a virtual second image; and a discriminator that distinguishes between the training second image and the virtual second image. a generator input step of inputting only the first image to the generator of the target generation network; a first discriminator input step of inputting the second learning image and part information of the second learning image to the discriminator; a second discriminator input step of inputting a second virtual image and part information of the second virtual image to a discriminator.
本態様によれば、敵対的生成ネットワークのジェネレータに第1画像のみを入力し、ディスクリミネータに部位情報を入力し、部位情報を入力に加えたことによって条件ごとに学習を行うようにしたので、パラメータの調整及びネットワークアーキテクチャの大幅な修正をすることなく、多様性を持った学習を行い、高解像情報を含む画像を生成することができる。 According to this aspect, only the first image is input to the generator of the hostile generation network, part information is input to the discriminator, and learning is performed for each condition by adding the part information to the input. , it can learn with diversity and generate images containing high-resolution information without parameter tuning and significant modification of the network architecture.
解像度が相対的に低い低解像情報を含む第1画像は、例えば低解像度である。解像度が相対的に高い高解像情報を含む第2画像は、例えば高解像度画像である。また第2画像は、解像度が相対的に高い高解像情報を含む高周波成分画像であってもよい。 The first image containing low-resolution information with relatively low resolution is, for example, low-resolution. The second image containing high-resolution information with relatively high resolution is, for example, a high-resolution image. Also, the second image may be a high-frequency component image containing high-resolution information with relatively high resolution.
部位情報は、人体の頭部、胸部、腹部、及び脚部を含むことが好ましい。これにより、多様な人体の部位の低解像情報を含む画像から高解像情報を含む画像を生成することができる。 The part information preferably includes the head, chest, abdomen, and legs of the human body. As a result, an image containing high-resolution information can be generated from an image containing low-resolution information of various parts of the human body.
第1画像は3次元断層画像であり、解像度はスライス厚方向の解像度であることが好ましい。これにより、スライス厚方向に高解像情報を含む3次元断層画像を生成することができる。 The first image is a three-dimensional tomographic image, and the resolution is preferably the resolution in the slice thickness direction. Thereby, a three-dimensional tomographic image including high-resolution information in the slice thickness direction can be generated.
第1ディスクリミネータ入力工程及び第2ディスクリミネータ入力工程は、第1画像のスライス情報をディスクリミネータに入力することが好ましい。これにより、入力とする画像のスライス情報に多様性がある場合であっても、高解像度の画像を生成することができる。 Preferably, the first discriminator input step and the second discriminator input step input slice information of the first image to the discriminator. As a result, a high-resolution image can be generated even when slice information of an input image is diverse.
スライス情報は、スライス間隔であることが好ましい。これにより、入力とする画像のスライス間隔に多様性がある場合であっても、高解像度の画像を生成することができる。 The slice information is preferably a slice interval. As a result, a high-resolution image can be generated even when the input image has a variety of slice intervals.
スライス情報は、スライス厚であることが好ましい。これにより、入力とする画像のスライス厚に多様性がある場合であっても、高解像度の画像を生成することができる。 The slice information is preferably slice thickness. As a result, a high-resolution image can be generated even when the slice thickness of the input image is diverse.
第1ディスクリミネータ入力工程及び第2ディスクリミネータ入力工程は、第1画像をディスクリミネータに入力することが好ましい。これにより、ディスクリミネータは、学習用第2画像及び仮想第2画像を適切に識別することができる。 Preferably, the first discriminator input step and the second discriminator input step input the first image to the discriminator. Thereby, the discriminator can appropriately identify the second learning image and the virtual second image.
学習用第2画像から第1画像を生成する第1画像生成工程を備え、ジェネレータ入力工程は、ジェネレータに生成した第1画像のみを入力することが好ましい。これにより、ジェネレータに入力するための低解像情報を含む画像を適切に取得することができる。 Preferably, the first image generating step generates the first image from the second learning image, and the generator input step inputs only the generated first image to the generator. Thereby, an image including low-resolution information for inputting to the generator can be properly acquired.
上記目的を達成するためのコンピュータに実行させるためのプログラムの一の態様は、上記に記載の学習方法をコンピュータに実行させるためのプログラムである。 One aspect of a program to be executed by a computer to achieve the above object is a program for causing a computer to execute the learning method described above.
上記目的を達成するための生成モデルの一の態様は、上記に記載の学習方法によって学習された、解像度が相対的に低い低解像情報を含む第1画像から解像度が相対的に高い高解像情報を含む第2画像を推定する生成モデルである。 One aspect of the generative model for achieving the above object is a high-resolution relatively high-resolution first image containing relatively low-resolution low-resolution information learned by the learning method described above. A generative model for estimating a second image containing image information.
上記目的を達成するための学習装置の一の態様は、解像度が相対的に低い低解像情報を含む第1画像から解像度が相対的に高い高解像情報を含む第2画像を推定する生成モデルの学習装置であって、第1画像を用いて仮想第2画像を生成する生成モデルであるジェネレータと、学習用第2画像と仮想第2画像とを識別するディスクリミネータと、を備える敵対的生成ネットワークと、ジェネレータに第1画像のみを入力するジェネレータ入力部と、ディスクリミネータに学習用第2画像と学習用第2画像の部位情報と、を入力する第1ディスクリミネータ入力部と、ディスクリミネータに仮想第2画像と仮想第2画像の部位情報と、を入力する第2ディスクリミネータ入力部と、を備えた学習装置である。 One aspect of the learning device for achieving the above object is generation of estimating a second image containing high-resolution information with relatively high resolution from a first image containing low-resolution information with relatively low resolution. Apparatus for learning a model, comprising: a generator, a generative model that uses a first image to generate a virtual second image; and a discriminator that distinguishes between the training second image and the virtual second image. a generator input unit that inputs only the first image to the generator; and a first discriminator input unit that inputs the second learning image and part information of the second learning image to the discriminator; and a second discriminator input unit for inputting a second virtual image and part information of the second virtual image to the discriminator.
本態様によれば、敵対的生成ネットワークのジェネレータに第1画像のみを入力し、ディスクリミネータに部位情報を入力し、部位情報を入力に加えたことによって条件ごとに学習を行うようにしたので、パラメータの調整及びネットワークアーキテクチャの大幅な修正をすることなく、多様性を持った学習を行い、高解像情報を含む画像を生成することができる。 According to this aspect, only the first image is input to the generator of the hostile generation network, part information is input to the discriminator, and learning is performed for each condition by adding the part information to the input. , it can learn with diversity and generate images containing high-resolution information without parameter tuning and significant modification of the network architecture.
本発明によれば、パラメータの調整及びネットワークアーキテクチャの大幅な修正をすることなく、多様性を持った学習を行い、高解像情報を含む画像を生成することができる。 According to the present invention, it is possible to perform diverse learning and generate images containing high-resolution information without adjusting parameters and modifying network architecture significantly.
以下、添付図面に従って本発明の好ましい実施形態について詳説する。 Preferred embodiments of the present invention will be described in detail below with reference to the accompanying drawings.
<医療画像学習装置のハードウェア構成>
図1は、本発明に係る医療画像学習装置のハードウェア構成の一例を示すブロック図である。医療画像学習装置10は、パーソナルコンピュータ又はワークステーションによって構成される。医療画像学習装置10は、主として通信部12、画像データベース14、操作部16、CPU(Central Processing Unit)18、RAM(Random Access Memory)20、ROM(Read Only Memory)22、及び表示部24から構成される。<Hardware configuration of medical image learning device>
FIG. 1 is a block diagram showing an example of the hardware configuration of a medical image learning device according to the present invention. The medical
通信部12は、有線又は無線により外部装置との通信処理を行い、外部装置との間で情報のやり取りを行うインターフェースである。
The
画像データベース14は、医療用X線CT(Computed Tomography)装置によって撮影されたCT再構成画像(CT画像)を保存する大容量ストレージ装置である。画像データベース14は、医療画像学習装置10の外部に設けてもよい。この場合、医療画像学習装置10は、通信部12を介して画像データベース14からCT画像を取得する。
The
操作部16は、医療画像学習装置10に対する各種の操作入力を受け付ける入力インターフェースである。操作部16は、コンピュータに有線接続又は無線接続される不図示のキーボード又はマウス等が用いられる。
The operation unit 16 is an input interface that receives various operation inputs to the medical
CPU18は、ROM22又は不図示のハードディスク装置等に記憶された各種のプログラムを読み出し、各種の処理を実行する。RAM20は、CPU18の作業領域として使用される。また、RAM20は、読み出されたプログラム及び各種のデータを一時的に記憶する記憶部として用いられる。医療画像学習装置10は、GPU(Graphics Processing Unit)を備えていてもよい。
The
表示部24は、医療画像学習装置10の必要な情報が表示される出力インターフェースである。表示部24は、コンピュータに接続可能な不図示の液晶モニタ等が用いられる。
The
医療画像学習装置10は、操作部16からの指示入力により、CPU18がROM22又はハードディスク装置等に記憶されている医療画像学習プログラムを読み出し、医療画像学習プログラムを実行する。これにより、後述する医療画像学習方法が実施され、CT画像における解像度が相対的に低い低解像情報を含む第1画像から解像度が相対的に高い高解像情報を含む第2画像を推定する生成モデルの学習が行われる。
In the medical
医療画像学習方法をコンピュータに実行させる医療画像学習プログラムは、コンピュータの読取可能な非一時的な記録媒体に記憶させて提供されてもよい。 A medical image learning program that causes a computer to execute the medical image learning method may be stored in a computer-readable non-temporary recording medium and provided.
<CT画像の部位情報及びスライス情報>
画像データベース14に保存されるCT画像は、人体(被検体)を撮影した医療画像であり、複数のスライス画像(アキシャル断面画像)を含む3次元断層画像である。ここでは、各スライス画像は互いに直交するX方向及びY方向に平行な画像である。X方向及びY方向に直交するZ方向は、被検体の体軸方向であり、スライス厚方向ともいう。
<Part information and slice information of CT image>
The CT images stored in the
画像データベース14に保存されるCT画像は、人体の部位毎の画像である。CT画像は、部位毎に撮影された画像であってもよいし、全身を撮影した画像から部位毎に切り出された画像であってもよい。画像データベース14に保存される各CT画像には、それぞれ部位情報とスライス情報とが関連付けて保存されている。
The CT images stored in the
部位情報は、CT画像に写った部位を示す情報である。部位情報は、頭部、胸部、腹部、及び脚部を含む。部位情報は、腰部を含んでもよい。 The part information is information indicating the part shown in the CT image. The part information includes the head, chest, abdomen, and legs. The part information may include the waist.
また、スライス情報は、CT画像のスライス間隔、及びスライス厚の少なくとも一方を含む。スライス間隔とは、互いに隣り合うスライス画像同士のZ方向の位置の差であり、スライススペーシング(Slice Spacing)ともいう。また、スライス厚とは、1つのスライス画像のZ方向の幅(厚み)であり、スライスシックネス(Slice Thickness)ともいう。 Also, the slice information includes at least one of the slice interval and slice thickness of the CT image. The slice interval is the difference in Z-direction position between adjacent slice images, and is also called slice spacing. The slice thickness is the width (thickness) of one slice image in the Z direction, and is also called slice thickness.
図2~図5は、CT画像のスライス間隔、及びスライス厚を説明するための図である。図2に示すCT画像G1は、スライス画像G11、G12、及びG13を含んで構成される。CT画像G1は、スライス間隔Pが4mm、スライス厚Tが4mmである。即ち、スライス画像G11とスライス画像G12とのZ方向の位置の差、及びスライス画像G12とスライス画像G13とのZ方向の位置の差は、それぞれ4mmである。また、スライス画像G11、G12、及びG13のZ方向の厚みは、それぞれ4mmである。CT画像G1は、スライス間隔Pとスライス厚Tとが等しいため、スライス画像G11とスライス画像G12、及びスライス画像G12とスライス画像G13は、Z方向に接する。 2 to 5 are diagrams for explaining the slice interval and slice thickness of CT images. A CT image G1 shown in FIG. 2 includes slice images G11, G12, and G13. The CT image G1 has a slice interval P of 4 mm and a slice thickness T of 4 mm. That is, the difference in Z-direction position between slice image G11 and slice image G12 and the difference in Z-direction position between slice image G12 and slice image G13 are each 4 mm. Also, the thickness in the Z direction of the slice images G11, G12, and G13 is 4 mm. Since the CT image G1 has the same slice interval P and slice thickness T, the slice image G11 and the slice image G12, and the slice image G12 and the slice image G13 are in contact with each other in the Z direction.
図3に示すCT画像G2は、スライス画像G21、G22、及びG23を含んで構成される。CT画像G2は、スライス間隔Pが4mm、スライス厚Tが6mmである。CT画像G2は、スライス間隔Pよりもスライス厚Tの方が大きいため、スライス画像G21とスライス画像G22、及びスライス画像G22とスライス画像G23は、Z方向にオーバーラップする。 A CT image G2 shown in FIG. 3 includes slice images G21, G22, and G23. The CT image G2 has a slice interval P of 4 mm and a slice thickness T of 6 mm. Since the slice thickness T of the CT image G2 is larger than the slice interval P, the slice images G21 and G22, and the slice images G22 and G23 overlap in the Z direction. do.
図4に示すCT画像G3は、スライス画像G31、G32、及びG33を含んで構成される。CT画像G3は、スライス間隔Pが8mm、スライス厚Tが4mmである。CT画像G3は、スライス厚Tよりもスライス間隔Pの方が大きいため、スライス画像G31とスライス画像G32、及びスライス画像G32とスライス画像G33は、Z方向に離間する。 A CT image G3 shown in FIG. 4 includes slice images G31, G32, and G33. The CT image G3 has a slice interval P of 8 mm and a slice thickness T of 4 mm. Since the slice interval P of the CT image G3 is larger than the slice thickness T , the slice images G31 and G32 , and the slice images G32 and G33 are separated in the Z direction. .
図5に示すCT画像G4は、スライス画像G41、G42、及びG43を含んで構成される。CT画像G4は、スライス間隔Pが1mm、スライス厚Tが1mmである。CT画像G4は、CT画像G1、G2、及びG3よりもZ方向の情報量が多い。即ち、CT画像G4は、CT画像G1、G2、及びG3よりもZ方向の解像度が相対的に高い。 A CT image G4 shown in FIG. 5 includes slice images G41, G42, and G43. The CT image G4 has a slice interval P of 1 mm and a slice thickness T of 1 mm. CT image G4 has more information in the Z direction than CT images G1, G2, and G3. That is, the CT image G4 has relatively higher resolution in the Z direction than the CT images G1, G2, and G3.
CT画像のスライス間隔及びスライス厚は、CT装置を使用する施設、医師等の好みに応じて様々な条件で設定される。CT画像は、診断のためには高解像度であることが好ましいが、被検体への被ばく量が増えてしまうという問題点がある。また、CT画像はデータ量が大きいため、容量削減のために低解像度化して保存される場合もある。 The slice intervals and slice thicknesses of CT images are set under various conditions according to the preferences of facilities, doctors, etc., using the CT apparatus. A CT image preferably has a high resolution for diagnosis, but there is a problem that the dose of exposure to the subject increases. In addition, since the CT image has a large amount of data, it may be saved at a low resolution in order to reduce the capacity.
医療画像学習装置10は、図2~図4に示すような様々な条件のスライス間隔及びスライス厚の低解像度のCT画像から、図5に示すスライス間隔が1mm、スライス厚が1mmの高解像度のCT画像を推定する生成モデルの学習を行う。
The medical
<第1の実施形態>
〔医療画像学習装置の機能ブロック〕
図6は、第1の実施形態に係る医療画像学習装置10の学習処理を示す機能ブロック図である。医療画像学習装置10は、入力部30及び学習部40を備えている。入力部30及び学習部40の機能は、図1に示した医療画像学習装置10の各部によって実現される。<First embodiment>
[Functional block of medical image learning device]
FIG. 6 is a functional block diagram showing learning processing of the medical
入力部30は、学習部40が学習するために必要なデータ(学習データ)を生成し、生成した学習データを学習部40に入力する。入力部30は、画像データベース14(図1参照)から不図示のCT装置によって撮影されたオリジナル高解像度画像GR(Real Thin画像)、及びオリジナル高解像度画像GRに関連付けられた部位情報及びスライス情報を取得する。
The
入力部30は、低解像度変換部32を備える。低解像度変換部32は、入力されたオリジナル高解像度画像GRのデータを元に、多様な低解像度画像GL1(Thick画像)を人工的に生成する。低解像度変換部32は、例えば、1mmに等方化されたスライス画像に対して姿勢変換を施し、ランダムに領域を切り出し、スライス間隔及びスライス厚が4mm又は8mm等の低解像度画像GL1を仮想的に生成する。
The
また、低解像度変換部32は、入力されたオリジナル高解像度画像GRを単純に間引いて減らすダウンサンプリング処理によって低解像度画像GL1を生成してもよい。
Alternatively, the low-
入力部30は、オリジナル高解像度画像GR及び低解像度画像GL1を学習部40に入力する。さらに、入力部30は、メタ情報D1(Condition)を学習部40に入力する。
The
メタ情報D1は、部位情報とスライス情報を含む。部位情報は、オリジナル高解像度画像GR、及び低解像度画像GL1に共通の情報である。スライス情報は、低解像度画像GL1のスライス情報を用いる。低解像度画像GL1のスライス情報は、オリジナル高解像度画像GRに関連付けられたスライス情報、及び低解像度変換部32が行った低解像度変換処理の内容から取得することができる。
The meta information D1 includes part information and slice information. The part information is information common to the original high-resolution image GR and the low-resolution image GL1. As the slice information, the slice information of the low-resolution image GL1 is used. The slice information of the low-resolution image GL1 can be obtained from the slice information associated with the original high-resolution image GR and the contents of the low-resolution conversion processing performed by the low-
学習部40は、非特許文献3に記載のアーキテクチャを2次元から3次元データへ拡張した構造をベースとしている。学習部40は、敵対的生成ネットワーク(Generative Adversarial Networks:GAN)を構築する。GANは、データを作り出す「Generator」と、データを識別する「Discriminator」とを備える。学習部40は、「Generator」に相当する生成部42と、「Discriminator」に相当する識別部44と、を備える。学習部40は、入力部30から入力されたデータに基づいて、識別部44を用いた敵対的な学習を繰り返すことで、生成部42を学習する。生成部42は、解像度が相対的に低い低解像情報を含む第1画像から解像度が相対的に高い高解像情報を含む第2画像を推定する生成モデルに相当する。
The
生成部42には、入力部30(ジェネレータ入力部の一例)から低解像度画像GL1(第1画像の一例)のみが入力される。生成部42は、入力された低解像度画像GL1から、オリジナル高解像度画像GRと同様の解像度を有する仮想高解像度画像GVを生成する。
Only the low-resolution image GL1 (an example of the first image) is input to the
識別部44には、入力部30から入力されるオリジナル高解像度画像GR(学習用第2画像の一例)と低解像度画像GL1とのペア、又は生成部42(ディスクリミネータ入力部の一例)から入力される仮想高解像度画像GV(仮想第2画像の一例)と低解像度画像GL1とのペアが入力される。
The identifying
さらに、識別部44には、新しいチャンネルが確保される。識別部44の新しいチャンネルには、メタ情報D1が入力される。識別部44は、低解像度画像GL1及びメタ情報D1を用いて、入力された高解像度画像がオリジナル高解像度画像GR、及び仮想高解像度画像GVのいずれであるかを識別する。識別部44の識別結果は、生成部42に入力される。
Furthermore, a new channel is reserved for the
図7は、学習時の識別部44による識別を説明するための図である。図7に示すF7Aの場合は、識別部44に、低解像度画像GL1、メタ情報D1、及びオリジナル高解像度画像GRが入力されている。したがって、識別部44が入力された高解像度画像をオリジナル高解像度画像GRであると識別した場合は正解であり、仮想高解像度画像GVであると識別した場合は不正解である。
FIG. 7 is a diagram for explaining identification by the
一方、図7に示すF7Bの場合は、識別部44に、低解像度画像GL1、メタ情報D1、及び生成部42によって生成された仮想高解像度画像GVが入力されている。したがって、識別部44が入力された高解像度画像をオリジナル高解像度画像GRであると識別した場合は不正解であり、仮想高解像度画像GVであると識別した場合は正解である。
On the other hand, in the case of F7B shown in FIG. 7, the low-resolution image GL1, the meta information D1, and the virtual high-resolution image GV generated by the
識別部44は、入力された高解像度画像が不図示のCT装置によって撮影された本物のCT画像であるか、又は生成部42によって生成された仮想のCT画像であるか、の識別を正解するように学習される。一方、生成部42は、不図示のCT装置によって撮影されたリアルなCT画像に似せた仮想のCT画像を生成し、識別部44が識別を不正解とするように学習される。
The
学習が進行すると、生成部42と識別部44とが精度を高めあい、生成部42は識別部44に識別されない、より本物のCT画像に近い仮想高解像度画像GVを生成できるようになる。この学習によって獲得された生成部42が生成モデルである。生成部42及び識別部44は、例えば畳み込みニューラルネットワークを用いて学習される。
As the learning progresses, the
〔医療画像学習方法〕
図8は、医療画像学習装置10の医療画像学習方法の一例を示すフローチャートである。図8に示すように、医療画像学習方法は、オリジナル画像取得工程(ステップS1)、低解像度画像生成工程(ステップS2)、低解像度画像入力工程(ステップS3)、仮想高解像度画像生成工程(ステップS4)、メタ情報入力工程(ステップS5)、高解像度画像入力工程(ステップS6)、及び学習工程(ステップS7)を備える。[Medical image learning method]
FIG. 8 is a flow chart showing an example of the medical image learning method of the medical
ステップS1では、入力部30は、画像データベース14からオリジナル高解像度画像GRを取得する。ここでは、スライス間隔が1mm、スライス厚が1mmのオリジナル高解像度画像GRを取得する。
At step S<b>1 , the
ステップS2(第1画像生成工程の一例)では、低解像度変換部32は、入力されたオリジナル高解像度画像GRから低解像度画像GL1を生成する。ここでは、低解像度変換部32は、スライス間隔が5mm、スライス厚が1mmの低解像度画像GL1を生成する。即ち、オリジナル高解像度画像GRと低解像度画像GL1とは、Z方向の解像度が異なり、X方向及びY方向は同じ解像度を有する。
In step S2 (an example of the first image generating step), the low-
ステップS3(ジェネレータ入力工程の一例)では、入力部30は、ステップS2で生成した低解像度画像GL1を学習部40の生成部42に入力する。生成部42には、低解像度画像GL1のみが入力される。
In step S<b>3 (an example of a generator input step), the
ステップS4では、生成部42は、入力された低解像度画像GL1から、仮想高解像度画像GVを生成する。ここでは、生成部42は、スライス間隔が1mm、スライス厚が1mmの仮想高解像度画像GVを生成する。
In step S4, the
ステップS5(第1ディスクリミネータ入力工程の一例、第2ディスクリミネータ入力工程の一例)では、入力部30(第1ディスクリミネータ入力部の一例、第2ディスクリミネータ入力部の一例)は、メタ情報D1を学習部40の識別部44に入力する。メタ情報D1は、ステップS6で識別部44に入力される高解像度画像の部位情報と低解像度画像GL1のスライス情報である。なお、オリジナル高解像度画像GR及び仮想高解像度画像GVの部位情報は、低解像度画像GL1の部位情報と共通である。したがって、入力部30は、メタ情報D1の部位情報として、低解像度画像GL1の部位情報を識別部44に入力してもよい。
In step S5 (an example of a first discriminator input step, an example of a second discriminator input step), the input unit 30 (an example of a first discriminator input unit, an example of a second discriminator input unit) , the meta information D1 is input to the
ステップS6では、入力部30は、高解像度画像を学習部40の識別部44に入力する。高解像度画像は、オリジナル高解像度画像GR又は仮想高解像度画像GVである。即ち、入力部30(第1ディスクリミネータ入力部の一例)は識別部44にオリジナル高解像度画像GRを入力する(第1ディスクリミネータ入力工程の一例)、又は入力部30(第2ディスクリミネータ入力部の一例)は識別部44に仮想高解像度画像GVを入力する(第2ディスクリミネータ入力工程の一例)。さらに、入力部30は、識別部44に低解像度画像GL1を入力する(第1ディスクリミネータ入力部の一例、第2ディスクリミネータ入力部の一例)。
In step S<b>6 , the
ステップS7では、識別部44は、入力された低解像度画像GL1及びメタ情報D1を用いて、入力された高解像度画像がオリジナル高解像度画像GR、及び仮想高解像度画像GVのいずれであるかを識別する。識別部44の識別結果は、生成部42に入力される。これにより、生成部42及び識別部44が学習される。
In step S7, the
以上の学習方法を繰り返すことで、識別部44は、入力された高解像度画像がオリジナル高解像度画像GR、及び仮想高解像度画像GVのいずれであるかをより好適に識別できるように学習する。一方、生成部42は、オリジナル高解像度画像GRに近い仮想高解像度画像GVを生成するように学習する。これにより、生成部42は、解像度が相対的に低い低解像度画像GL1から解像度が相対的に高い仮想高解像度画像GVを推定することができる。
By repeating the learning method described above, the
図9及び図10は、識別部44にメタ情報D1を与えずに全身の画像を学習した生成部42における画像生成を説明するための図である。図9は、頭部のCT画像のサジタル断面画像を示している。図9に示すF9Aは、生成部42に入力された低解像度画像である。図9に示すF9Bは、生成部42から出力された仮想高解像度画像である。また、図9に示すF9Cは、F9Bの正解データ(Ground truth)であり、F9Aの元データとなったオリジナル高解像度画像である。図10は、腰部のCT画像のサジタル断面画像を示している。図10に示すF10A、F10B、及びF10Cは、それぞれ入力された低解像度画像、出力された仮想高解像度画像、及び正解データである。
9 and 10 are diagrams for explaining image generation in the
生成部42は、頭部から脚部まで部位に関係なく、低解像度画像を入力すると正解データに近い高解像度画像を出力することが理想である。しかしながら、図9及び図10に示すように、識別部44にメタ情報D1を与えずに学習した場合、生成部42の生成した仮想高解像度画像は、他部位の学習の影響を受けて特徴が平均化され、不明瞭な画像となった。この原因は、入力データの多様性であると考えられる。
Ideally, the generating
図11は、脚部のCT画像のサジタル断面画像を示している。図11に示すF11Aは、脚部の低解像度画像である。図11に示すF11Bは、脚部の高解像度画像である。図11に示すように、脚部の画像は背景及び垂直方向の情報が多く、低解像度画像と高解像度画像との変化が比較的小さい。このため、生成部42は、脚部の高解像度画像の生成については「ほぼ何もしない」という学習を行う。しかしながら、この学習は、頭部、胸部、及び腹部の高解像度画像の生成の学習に悪影響を与えてしまうという問題点があった。
FIG. 11 shows a sagittal section image of a CT image of the leg. F11A shown in FIG. 11 is a low-resolution image of the leg. F11B shown in FIG. 11 is a high-resolution image of the leg. As shown in FIG. 11, the leg image has a lot of background and vertical information, and the change between the low resolution image and the high resolution image is relatively small. For this reason, the
また、識別部44は、画像の部位の多様性により混乱して精度が向上しないという問題点があった。
In addition, the
このような課題に対し、1つの方法として、部位別に識別(超解像度画像出力モデル)を学習及び作成することも考えられる。しかしながら、この方法では、部位別のモデル作成が必要になる、推論時のデータの部位を判断する部分が必要となる、部位をまたがったデータの場合の処理が必要、等の新たな課題がある。 As one method for solving such a problem, it is conceivable to learn and create a classification (super-resolution image output model) for each part. However, with this method, there are new problems such as the need to create models for each part, the need to determine the part of the data at the time of inference, and the need to process data that spans parts. .
図12~図14は、本実施形態の効果を説明するための図である。図12は、頭部のCT画像のサジタル断面画像を示している。図12に示すF12Aは、学習された生成モデルである生成部42に入力された低解像度画像である。図12に示すF12Bは、生成部42から出力された仮想高解像度画像である。また、図12に示すF12Cは、F12Bの正解データ(Ground truth)であり、F12Aの元データとなったオリジナル高解像度画像である。図13は腹部のCT画像のサジタル断面画像を示している。図13に示すF13A、F13B、及びF13Cは、それぞれ入力された低解像度画像、出力された仮想高解像度画像、及び正解データである。図14は腰部のCT画像のサジタル断面画像を示している。図14に示すF14A、F14B、及びF14Cは腰部の画像であり、それぞれ入力された低解像度画像、出力された仮想高解像度画像、及び正解データである。
12 to 14 are diagrams for explaining the effect of this embodiment. FIG. 12 shows a sagittal cross-sectional image of a CT image of the head. F12A shown in FIG. 12 is a low-resolution image input to the
図12~図14に示すように、本実施形態によって学習された生成部42によれば、識別部44にメタ情報D1を入力して学習したことで、部位やスライス間隔等によらず高精度で画像生成が可能になった。この生成部42は、VTS(Virtual Thin Slice)装置に適用することができる。
As shown in FIGS. 12 to 14, according to the generating
本実施形態によれば、部位別の生成モデルを用意する必要がない。本実施形態では、生成部42には低解像度画像のみが入力されるため、ネットワークアーキテクチャの大幅な修正が不要である。また、識別部44は、特徴量として部位情報を使用して学習することができる。これにより、学習された生成モデルは、入力される低解像度画像がどの部位の画像であるかの情報が不要であり、どの部位の画像が入力されても高解像の画像を生成することができる。したがって、過去のCT画像の資産を有効利用することができる。なお、この生成モデルは、複数の部位にまたがった画像が入力された場合であっても、高解像の画像の生成が可能である。
According to this embodiment, there is no need to prepare a generative model for each part. In this embodiment, since only low-resolution images are input to the
ここでは、入力部30はメタ情報D1として部位情報及びスライス情報を識別部44に入力したが、メタ情報D1は少なくとも部位情報を含めばよい。また、メタ情報D1に、低解像度画像のぼかしの強弱情報を含めてもよい。ぼかしの強弱情報は、「ぼかし強」、「ぼかし弱」等の分類であってもよい。
Here, the
また、本実施形態では、識別部44にオリジナル高解像度画像GRと低解像度画像GL1とのペア、又は生成部42から入力される仮想高解像度画像GVと低解像度画像GL1とのペアが入力されているが、低解像度画像GL1の入力は必須ではない。即ち、識別部44には、オリジナル高解像度画像GR又は仮想高解像度画像GVが入力されればよい。
Further, in this embodiment, a pair of the original high-resolution image GR and the low-resolution image GL1 or a pair of the virtual high-resolution image GV and the low-resolution image GL1 input from the
なお、低解像度画像GL1を識別部44に入力しない場合であっても、識別部44に仮想高解像度画像GVが入力される場合、メタ情報D1のスライス情報は低解像度画像GL1のスライス情報を使用する。これは、識別部44に入力された仮想高解像度画像GVがどのような条件の低解像度画像GL1を元に生成されたのかを考慮するためである。
Even if the low-resolution image GL1 is not input to the
識別部44にオリジナル高解像度画像GRが入力される場合は、スライス情報は意味を持たないため、スライス情報にはランダムな値を与えて学習させる。これにより、識別部44は、「スライス間隔4mmの低解像度画像から生成された偽物の可能性がある高解像度画像の真偽を判別する」、「スライス間隔8mmの低解像度画像から生成された偽物の可能性がある高解像度画像の真偽を判別する」等のような条件別に識別を学習することができる。
When the original high-resolution image GR is input to the
<第2の実施形態>
図15は、第2の実施形態に係る医療画像学習装置10の学習処理を示す機能ブロック図である。なお、図6に示す機能ブロック図と共通する部分には同一の符号を付し、その詳細な説明は省略する。<Second embodiment>
FIG. 15 is a functional block diagram showing learning processing of the medical
医療画像学習装置10は、入力部30に補間部34を備えている。補間部34は、低解像度変換部32が生成した低解像度画像GL1から、低解像度画像GL2を生成する。補間部34は、低解像度画像GL1のZ方向にスプライン補間処理を施す。また、補間部34は、スプライン補間処理が施された低解像度画像GL1にガウシアンフィルタ処理を施す。スプライン補間処理及びガウシアンフィルタ処理により生成された画像が、低解像度画像GL2である。
The medical
例えば、低解像度画像GL1は、スライス間隔が5mm、スライス厚が1mmであり、補間部34が生成する低解像度画像GL2は、スライス間隔が1mm、スライス厚が1mmである。低解像度画像GL2のスライス間隔及びスライス厚はオリジナル高解像度画像GRのスライス間隔及びスライス厚と同様であるが、低解像度画像GL2は、オリジナル高解像度画像GRと比較してZ方向にボケた画像となる。
For example, the low-resolution image GL1 has a slice interval of 5 mm and a slice thickness of 1 mm, and the low-resolution image GL2 generated by the
補間部34が生成した低解像度画像GL2は、学習部40の生成部42に入力される。即ち、本実施形態では、生成部42は低解像度画像GL2から仮想高解像度画像GVを生成する。なお、仮想高解像度画像GVのスライス間隔及びスライス厚は低解像度画像GL2のスライス間隔及びスライス厚と同様であるが、仮想高解像度画像GVは、低解像度画像GL2と比較してZ方向にシャープな画像となる。
The low-resolution image GL2 generated by the interpolating
また、補間部34が生成した低解像度画像GL2は、高解像度画像とペアで識別部44に入力される。識別部44は、低解像度画像GL2及びメタ情報D1を用いて、入力された高解像度画像がオリジナル高解像度画像GR、及び仮想高解像度画像GVのいずれであるかを識別する。なお、識別部44には、低解像度画像GL2は入力されなくてもよい。
Also, the low-resolution image GL2 generated by the
本実施形態によれば、生成部42は、オリジナル高解像度画像GRから低解像度変換され、さらにスプライン補間処理された低解像度画像GL2から高解像度画像を生成する学習をすることができる。したがって、低解像度画像GL1から高解像度画像を生成する学習と合せることで、多様な入力の低解像度画像に適応した生成モデルを得ることができる。
According to the present embodiment, the generating
<第3の実施形態>
図16は、第3の実施形態に係る医療画像学習装置10の学習処理を示す機能ブロック図である。なお、図6に示す機能ブロック図と共通する部分には同一の符号を付し、その詳細な説明は省略する。本実施形態に係る医療画像学習装置10は、高解像度画像に代えて、解像度が相対的に高い高解像情報を含む高周波成分画像を生成し、識別する。<Third Embodiment>
FIG. 16 is a functional block diagram showing learning processing of the medical
医療画像学習装置10は、入力部30に高周波成分抽出部36を備えている。高周波成分抽出部36は、オリジナル高解像度画像GRから高周波成分を抽出し、オリジナル高周波成分画像CR(学習用高周波成分画像の一例)を生成する。高周波成分の抽出は、ハイパスフィルタを用いて行われる。オリジナル高周波成分画像CRは、オリジナル高解像度画像GRと同様に、スライス間隔が1mm、スライス厚が1mmである。
The medical
高周波成分抽出部36が生成したオリジナル高周波成分画像CRは、学習部40の識別部44に入力される。
The original high frequency component image CR generated by the high frequency
また、学習部40の生成部42は、入力部30の低解像度変換部32から入力された低解像度画像GL1から、オリジナル高周波成分画像CRと同様の解像度を有する仮想高周波成分画像CVを生成する。ここでは、生成部42は、スライス間隔が1mm、スライス厚が1mmの仮想高周波成分画像CVを生成する。
Also, the
識別部44には、入力部30から入力されるオリジナル高周波成分画像CR(学習用第2画像の一例)と低解像度画像GL1とのペア、又は生成部42(ディスクリミネータ入力部の一例)から入力される仮想高解像度画像GV(仮想第2画像の一例)と低解像度画像GL1とのペアが入力される。
In the
識別部44は、入力部30から入力された低解像度画像GL1及びメタ情報D1を用いて、入力された高周波成分画像がオリジナル高周波成分画像CR、及び仮想高周波成分画像CVのいずれであるかを識別する。
The
本実施形態によれば、生成部42は、低解像度画像GL1から高周波成分画像を生成する学習をすることができる。生成部42は、生成部42が生成した高周波成分画像と生成部42の入力である低解像度画像GL1とを加算処理することで、高解像度画像を得ることができる。
According to this embodiment, the
<第4の実施形態>
図17は、第4の実施形態に係る医療画像学習装置10の学習処理を示す機能ブロック図である。なお、図15及び図16に示す機能ブロック図と共通する部分には同一の符号を付し、その詳細な説明は省略する。<Fourth Embodiment>
FIG. 17 is a functional block diagram showing learning processing of the medical
入力部30の低解像度変換部32は、オリジナル高解像度画像GRから低解像度画像GL1を生成する。補間部34は、低解像度画像GL1から、低解像度画像GL2を生成する。
A low-
学習部40の生成部42は、入力部30の補間部34から入力された低解像度画像GL2から、オリジナル高解像度画像GRと同様の解像度を有する仮想高周波成分画像CVを生成する。
The
医療画像学習装置10は、学習部40に加算部46を備えている。加算部46は、生成部42が生成した仮想高周波成分画像CVと補間部34が生成した低解像度画像GL2とを加算する。これにより、加算部46は、オリジナル高解像度画像GRと同様の解像度を有する仮想高解像度画像GVを生成する。
The medical
識別部44には、入力部30から入力されるオリジナル高解像度画像GRと低解像度画像GL2ペア、又は加算部46から入力される仮想高解像度画像GVと低解像度画像GL2のペアが入力される。
The identifying
識別部44は、低解像度画像GL1及びメタ情報D1を用いて、入力された高解像度画像がオリジナル高解像度画像GR、及び仮想高解像度画像GVのいずれであるかを識別する。識別部44の識別結果は、生成部42に入力される。これにより、生成部42及び識別部44が学習される。
Using the low-resolution image GL1 and the meta information D1, the
本実施形態によれば、生成部42は、低解像度画像GL1から高周波成分画像を生成する学習をすることができる。また、識別部44は、高解像度画像の識別の学習をすることができる。
According to this embodiment, the
〔その他〕
ここでは、医療画像学習装置10は、1つのパーソナルコンピュータ又はワークステーションによって構成される例を説明したが、複数のパーソナルコンピュータ等で構成してもよい。例えば、入力部30と学習部40とを異なるパーソナルコンピュータ等で構成してもよい。このように構成することで、学習データの生成と生成モデルの学習とを物理的にも時間的にも互いに束縛されることなく実施することができる。〔others〕
Although the medical
ここではCT画像の超解像の生成モデルの学習方法を説明したが、本実施形態に係る生成モデルの学習方法は、部位情報を有する3次元断層画像に適用することができる。例えば、MRI(Magnetic Resonance Imaging)装置により取得されるMR画像、PET(Positron Emission Tomography)装置により取得されるPET画像、OCT(Optical Coherence Tomography)装置により取得されるOCT画像、3次元超音波撮影装置により取得される3次元超音波画像等であってもよい。 Although the method of learning a super-resolution generative model for CT images has been described here, the method of learning a generative model according to this embodiment can be applied to three-dimensional tomographic images having part information. For example, MR images acquired by MRI (Magnetic Resonance Imaging) devices, PET images acquired by PET (Positron Emission Tomography) devices, OCT images acquired by OCT (Optical Coherence Tomography) devices, and three-dimensional ultrasound imaging devices. It may be a three-dimensional ultrasound image or the like acquired by.
また、本実施形態に係る生成モデルの学習方法は、部位情報を有する2次元画像に適用することができる。例えば、X線画像であってもよい。また、医療画像に限定されず、通常のカメラ画像に適用することができる。2次元画像に適用する場合は、スライス情報のスライス間隔に代えて、シャープネス(再構成関数)情報を使用すればよい。また、スライス情報のスライス厚に代えて、ピクセルスペーシング情報、即ち画素の大きさの情報を使用すればよい。 In addition, the generative model learning method according to the present embodiment can be applied to a two-dimensional image having part information. For example, it may be an X-ray image. Moreover, it is not limited to medical images, and can be applied to normal camera images. When applied to a two-dimensional image, sharpness (reconstruction function) information may be used in place of the slice interval of the slice information. Pixel spacing information, that is, pixel size information may be used instead of the slice thickness of the slice information.
ここまで説明した実施形態において、医療画像学習装置10の各種の処理を実行する処理部(processing unit)のハードウェア的な構造は、次に示すような各種のプロセッサ(processor)である。各種のプロセッサには、ソフトウェア(プログラム)を実行して各種の処理部として機能する汎用的なプロセッサであるCPU(Central Processing Unit)、画像処理に特化したプロセッサであるGPU(Graphics Processing Unit)、FPGA(Field Programmable Gate Array)等の製造後に回路構成を変更可能なプロセッサであるプログラマブルロジックデバイス(Programmable Logic Device:PLD)、ASIC(Application Specific Integrated Circuit)等の特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路等が含まれる。
In the embodiments described so far, the hardware structure of the processing unit that executes various processes of the medical
1つの処理部は、これら各種のプロセッサのうちの1つで構成されていてもよいし、同種又は異種の2つ以上のプロセッサ(例えば、複数のFPGA、或いはCPUとFPGAの組み合わせ、又はCPUとGPUの組み合わせ)で構成されてもよい。また、複数の処理部を1つのプロセッサで構成してもよい。複数の処理部を1つのプロセッサで構成する例としては、第1に、サーバ及びクライアント等のコンピュータに代表されるように、1つ以上のCPUとソフトウェアの組合せで1つのプロセッサを構成し、このプロセッサが複数の処理部として機能する形態がある。第2に、システムオンチップ(System On Chip:SoC)等に代表されるように、複数の処理部を含むシステム全体の機能を1つのIC(Integrated Circuit)チップで実現するプロセッサを使用する形態がある。このように、各種の処理部は、ハードウェア的な構造として、各種のプロセッサを1つ以上用いて構成される。 One processing unit may be composed of one of these various processors, or two or more processors of the same or different type (for example, a plurality of FPGAs, a combination of CPU and FPGA, or a combination of CPU and GPU). Also, a plurality of processing units may be configured by one processor. As an example of configuring a plurality of processing units with a single processor, first, as represented by computers such as servers and clients, a single processor is configured with a combination of one or more CPUs and software. There is a form in which a processor functions as multiple processing units. Secondly, as typified by System On Chip (SoC), etc., there is a form of using a processor that realizes the functions of the entire system including a plurality of processing units with a single IC (Integrated Circuit) chip. be. In this way, various processing units are configured using one or more various processors as a hardware structure.
さらに、これらの各種のプロセッサのハードウェア的な構造は、より具体的には、半導体素子等の回路素子を組み合わせた電気回路(circuitry)である。 Further, the hardware structure of these various processors is, more specifically, an electric circuit combining circuit elements such as semiconductor elements.
本発明の技術的範囲は、上記の実施形態に記載の範囲には限定されない。各実施形態における構成等は、本発明の趣旨を逸脱しない範囲で、各実施形態間で適宜組み合わせることができる。 The technical scope of the present invention is not limited to the scope described in the above embodiments. Configurations and the like in each embodiment can be appropriately combined between each embodiment without departing from the gist of the present invention.
10…医療画像学習装置
12…通信部
14…画像データベース
16…操作部
18…CPU
20…RAM
22…ROM
24…表示部
30…入力部
32…低解像度変換部
34…補間部
36…高周波成分抽出部
40…学習部
42…生成部
44…識別部
46…加算部
CR…オリジナル高周波成分画像
CV…仮想高周波成分画像
D1…メタ情報
G1,G2,G3,G4…CT画像
G11,G12,G13…スライス画像
G21,G22,G23…スライス画像
G31,G32,G33…スライス画像
G41,G42,G43…スライス画像
GL1,GL2…低解像度画像
GR…オリジナル高解像度画像
GV…仮想高解像度画像
S1~S7医療画像学習方法の各ステップDESCRIPTION OF
20 RAM
22 ROM
24
Claims (12)
第1画像を用いて仮想第2画像を生成する生成モデルであるジェネレータと、学習用第2画像と前記仮想第2画像とを識別するディスクリミネータと、を備える敵対的生成ネットワークの前記ジェネレータに前記第1画像のみを入力するジェネレータ入力工程と、
前記ディスクリミネータに前記学習用第2画像と前記学習用第2画像の部位情報と、を入力する第1ディスクリミネータ入力工程と、
前記ディスクリミネータに前記仮想第2画像と前記仮想第2画像の部位情報と、を入力する第2ディスクリミネータ入力工程と、
を備えた学習方法。A generative model learning method for estimating a second image containing high-resolution information with relatively high resolution from a first image containing low-resolution information with relatively low resolution, comprising:
to the generator of a generative adversarial network comprising: a generator that is a generative model that generates a virtual second image using a first image; and a discriminator that distinguishes between a training second image and the virtual second image: a generator input step of inputting only the first image;
a first discriminator input step of inputting the second learning image and part information of the second learning image to the discriminator;
a second discriminator input step of inputting the virtual second image and part information of the virtual second image into the discriminator;
A learning method with
前記解像度はスライス厚方向の解像度である請求項1又は2に記載の学習方法。The first image is a three-dimensional tomographic image,
3. The learning method according to claim 1, wherein said resolution is a resolution in a slice thickness direction.
前記ジェネレータ入力工程は、前記ジェネレータに前記生成した第1画像のみを入力する請求項1から6のいずれか1項に記載の学習方法。A first image generating step of generating the first image from the second learning image,
7. The learning method according to any one of claims 1 to 6, wherein the generator input step inputs only the generated first image to the generator.
第1画像を用いて仮想第2画像を生成する生成モデルであるジェネレータと、学習用第2画像と前記仮想第2画像とを識別するディスクリミネータと、を備える敵対的生成ネットワークと、
前記ジェネレータに前記第1画像のみを入力するジェネレータ入力部と、
前記ディスクリミネータに前記学習用第2画像と前記学習用第2画像の部位情報と、を入力する第1ディスクリミネータ入力部と、
前記ディスクリミネータに前記仮想第2画像と前記仮想第2画像の部位情報と、を入力する第2ディスクリミネータ入力部と、
を備えた学習装置。A generative model learning device for estimating a second image containing high-resolution information having a relatively high resolution from a first image containing low-resolution information having a relatively low resolution,
a generative adversarial network comprising: a generator that is a generative model that generates a virtual second image using a first image; and a discriminator that distinguishes between a training second image and the virtual second image;
a generator input unit that inputs only the first image to the generator;
a first discriminator input unit for inputting the second learning image and part information of the second learning image to the discriminator;
a second discriminator input unit for inputting the second virtual image and part information of the second virtual image to the discriminator;
A learning device with
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2019036373 | 2019-02-28 | ||
| JP2019036373 | 2019-02-28 | ||
| PCT/JP2020/007382 WO2020175445A1 (en) | 2019-02-28 | 2020-02-25 | Learning method, learning device, generative model and program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPWO2020175445A1 JPWO2020175445A1 (en) | 2021-12-23 |
| JP7106741B2 true JP7106741B2 (en) | 2022-07-26 |
Family
ID=72240029
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021502250A Active JP7106741B2 (en) | 2019-02-28 | 2020-02-25 | Learning method, learning device, generative model and program |
Country Status (4)
| Country | Link |
|---|---|
| US (1) | US11948349B2 (en) |
| EP (1) | EP3932319A4 (en) |
| JP (1) | JP7106741B2 (en) |
| WO (1) | WO2020175445A1 (en) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7558750B2 (en) * | 2020-10-26 | 2024-10-01 | キヤノン株式会社 | Medical image processing device, medical image processing method and program |
| JP2023004298A (en) * | 2021-06-25 | 2023-01-17 | キヤノンメディカルシステムズ株式会社 | Medical information processing device, medical information processing method, and medical information processing program |
| US11689601B1 (en) * | 2022-06-17 | 2023-06-27 | International Business Machines Corporation | Stream quality enhancement |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008167950A (en) | 2007-01-12 | 2008-07-24 | Fujifilm Corp | Radiation image processing method, apparatus, and program |
| US20180260957A1 (en) | 2017-03-08 | 2018-09-13 | Siemens Healthcare Gmbh | Automatic Liver Segmentation Using Adversarial Image-to-Image Network |
| US20180341836A1 (en) | 2017-05-24 | 2018-11-29 | General Electric Company | Neural network point cloud generation system |
| JP2018192264A (en) | 2017-05-18 | 2018-12-06 | キヤノンメディカルシステムズ株式会社 | Medical image processing apparatus |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2008084880A1 (en) | 2007-01-12 | 2008-07-17 | Fujifilm Corporation | Radiation image processing method, apparatus and program |
| CN107106111A (en) * | 2015-01-23 | 2017-08-29 | 株式会社日立制作所 | X ray CT device and image pickup method |
| EP3447721A1 (en) * | 2017-08-24 | 2019-02-27 | Agfa Nv | A method of generating an enhanced tomographic image of an object |
-
2020
- 2020-02-25 JP JP2021502250A patent/JP7106741B2/en active Active
- 2020-02-25 WO PCT/JP2020/007382 patent/WO2020175445A1/en not_active Ceased
- 2020-02-25 EP EP20763405.6A patent/EP3932319A4/en active Pending
-
2021
- 2021-08-12 US US17/400,150 patent/US11948349B2/en active Active
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008167950A (en) | 2007-01-12 | 2008-07-24 | Fujifilm Corp | Radiation image processing method, apparatus, and program |
| US20180260957A1 (en) | 2017-03-08 | 2018-09-13 | Siemens Healthcare Gmbh | Automatic Liver Segmentation Using Adversarial Image-to-Image Network |
| JP2018192264A (en) | 2017-05-18 | 2018-12-06 | キヤノンメディカルシステムズ株式会社 | Medical image processing apparatus |
| US20180341836A1 (en) | 2017-05-24 | 2018-11-29 | General Electric Company | Neural network point cloud generation system |
Non-Patent Citations (1)
| Title |
|---|
| MARDANI, Morteza et al.,Deep Generative Adversarial Networks for Compressed Sensing (GANCS) Automates MRI,arXiv,2017年,arXiv:1706.00051v1 [cs.CV] |
Also Published As
| Publication number | Publication date |
|---|---|
| WO2020175445A1 (en) | 2020-09-03 |
| EP3932319A1 (en) | 2022-01-05 |
| JPWO2020175445A1 (en) | 2021-12-23 |
| EP3932319A4 (en) | 2022-04-27 |
| US20210374483A1 (en) | 2021-12-02 |
| US11948349B2 (en) | 2024-04-02 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US12217387B2 (en) | Learning method, learning system, learned model, program, and super resolution image generating device | |
| EP3779866B1 (en) | Systems and methods for deblurring medical images using deep neural network | |
| Kudo et al. | Virtual thin slice: 3D conditional GAN-based super-resolution for CT slice interval | |
| Beers et al. | High-resolution medical image synthesis using progressively grown generative adversarial networks | |
| Shi et al. | LRTV: MR image super-resolution with low-rank and total variation regularizations | |
| KR102824526B1 (en) | Systems and methods for processing image slices from three-dimensional images | |
| Zhao et al. | A deep learning based anti-aliasing self super-resolution algorithm for MRI | |
| WO2024066049A1 (en) | Pet image denoising method, terminal device, and readable storage medium | |
| US20220114699A1 (en) | Spatiotemporal resolution enhancement of biomedical images | |
| Manakov et al. | Noise as domain shift: Denoising medical images by unpaired image translation | |
| JP7106741B2 (en) | Learning method, learning device, generative model and program | |
| US11978137B2 (en) | Generating reformatted views of a three-dimensional anatomy scan using deep-learning estimated scan prescription masks | |
| JP7795352B2 (en) | Image processing method, image processing device and program | |
| Thapa et al. | Comparison of super-resolution algorithms applied to retinal images | |
| US10013778B2 (en) | Tomography apparatus and method of reconstructing tomography image by using the tomography apparatus | |
| US20230368442A1 (en) | Method of generating trained model, machine learning system, program, and medical image processing apparatus | |
| US12350032B2 (en) | Medical image processing apparatus, method of medical image processing, and nonvolatile computer readable storage medium storing therein medical image processing program | |
| KR20190114229A (en) | Apparatus and method for processing image | |
| CN115081637B (en) | In-situ training of machine learning algorithms for generating synthetic imaging data | |
| Kumar et al. | Enhancement of Low-Quality Images Using Image Super-Resolution | |
| Revathy et al. | Medical image registration using landmark registration technique and fusion | |
| Na'am et al. | Enlarge medical image using line-column interpolation (LCI) method | |
| JP5989498B2 (en) | Image processing apparatus and program | |
| CN120267403A (en) | Medical image processing system, medical image processing device, surgical planning system, and storage medium | |
| Pascale et al. | CLADE: Cycle Loss Augmented Degradation Enhancement for Unpaired Super-Resolution of Anisotropic Medical Images |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210819 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210819 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220426 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220620 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220630 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220713 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7106741 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |