JP7452149B2 - Learning device and computer program for block noise detection - Google Patents
Learning device and computer program for block noise detection Download PDFInfo
- Publication number
- JP7452149B2 JP7452149B2 JP2020050353A JP2020050353A JP7452149B2 JP 7452149 B2 JP7452149 B2 JP 7452149B2 JP 2020050353 A JP2020050353 A JP 2020050353A JP 2020050353 A JP2020050353 A JP 2020050353A JP 7452149 B2 JP7452149 B2 JP 7452149B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- learning
- block noise
- pseudo
- noise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Image Processing (AREA)
Description
本発明は、画像に対して生じるブロックノイズ検出の為の学習装置及びコンピュータプログラムに関する。 The present invention relates to a learning device and a computer program for detecting block noise occurring in an image.
従来より、ナビゲーション装置、スマートフォン、パーソナルコンピュータ等の画像を表示する為の画像表示装置(液晶ディスプレイ、有機ELディスプレイ等)を備えた各種機器では、CPU等の演算手段によって生成された画像データを一旦メモリに書き込み、その後メモリから読み出した画像データをGPU等の画像処理を行う演算手段(CPUが行っても良い)によって画像表示装置に対して描画することにより画像の表示を行う。しかしながら、このような画像表示装置への画像の表示を行う際に、例えばメモリに対する画像データの書き込みと画像データの読み出しのタイミングが合わない等の理由により、メモリに書き込む画像データの生成に異常が生じる場合があり、その場合に画像表示装置に表示される画像にブロックノイズが生じることが知られている。 Conventionally, in various devices equipped with image display devices (liquid crystal displays, organic EL displays, etc.) for displaying images, such as navigation devices, smartphones, and personal computers, image data generated by a calculation means such as a CPU is temporarily processed. The image is displayed by writing the image data into the memory and then drawing the image data read out from the memory on the image display device by a calculation means (which may be performed by the CPU) that performs image processing such as a GPU. However, when displaying images on such an image display device, an abnormality may occur in the generation of image data to be written to the memory, for example, because the timing of writing the image data to the memory and reading the image data do not match. It is known that block noise may occur in the image displayed on the image display device.
上記ブロックノイズの発生を防止する為には、画像の描画を行う前に生成された画像データに対してブロックノイズを生じさせる異常があることを検出可能とする必要がある。そして、このような画像データの異常を描画前に検出する為には学習モデルの導入が有効である。例えば画像表示装置への画像表示に関する学習モデルとして特開2018-136537号公報には、表示部に実際に表示された映像に対応するデータを学習データ、表示部への表示を意図している理想的な映像に対応するデータを教師データとしてニューラルネットワークを用いた学習を行うことによって画素の階調を補正し、映像の品質を向上させる技術について開示されている。 In order to prevent the occurrence of block noise, it is necessary to be able to detect an abnormality that causes block noise in generated image data before drawing an image. In order to detect such abnormalities in image data before rendering, it is effective to introduce a learning model. For example, as a learning model for displaying images on an image display device, Japanese Patent Application Laid-Open No. 2018-136537 describes data corresponding to images actually displayed on the display as learning data, and data corresponding to the image actually displayed on the display as learning data, and data as learning data for the image that is intended to be displayed on the display. A technique has been disclosed that corrects the gradation of pixels and improves the quality of the video by performing learning using a neural network using data corresponding to a typical video as teacher data.
ここで、上記特許文献1の学習モデルでは教師データとして、表示部への表示を意図している理想的な映像に対応するデータを用いている。しかし、実際に学習モデルを構築するに際して、学習モデルが表示部に実際に表示された映像のデータを取得することは比較的容易な一方で、表示部に表示する前の理想的な映像(即ち表示される予定の映像)のデータを取得することは容易でないことが多い。従って、上記特許文献1の学習モデルは適用できるケースが限られ、実用上問題があった。
Here, in the learning model of
本発明は前記従来における問題点を解消するためになされたものであり、正常画像に対して疑似的にブロックノイズを生じさせた画像を生成して教師データとして用いることによって、教師データの取得が容易となり、広く適用することが可能なブロックノイズ検出の為の学習装置及びコンピュータプログラムを提供することを目的とする。 The present invention has been made to solve the above-mentioned problems in the conventional art, and it is possible to obtain training data by generating an image in which pseudo block noise is generated from a normal image and using it as training data. It is an object of the present invention to provide a learning device and a computer program for block noise detection that can be easily and widely applied.
前記目的を達成するため本発明に係るブロックノイズ検出の為の学習装置は、ブロックノイズの生じていない学習用正常画像を取得する正常画像取得手段と、ブロック形状の所定エリアを疑似的にノイズ領域に設定したブロックノイズの画像である疑似ブロックノイズ画像を生成する疑似ブロックノイズ画像生成手段と、前記学習用正常画像に対して前記疑似ブロックノイズ画像を重畳して合成することによって、前記学習用正常画像に対して擬似的にブロックノイズを生じさせた疑似異常画像を、ブロックノイズを検出する為の学習モデルの学習に用いる教師データとして生成する教師データ生成手段と、を有し、前記疑似ブロックノイズ画像生成手段は、ノイズ領域とするブロック形状のサイズ、位置、ノイズ領域の色及び透過率を夫々設定して前記疑似ブロックノイズ画像を生成する。
In order to achieve the above object, a learning device for detecting block noise according to the present invention includes a normal image acquisition means for acquiring a normal image for learning in which block noise does not occur, and a predetermined area of a block shape as a pseudo noise region. a pseudo block noise image generating means that generates a pseudo block noise image which is an image of block noise set to a teacher data generating means for generating a pseudo abnormal image in which block noise is generated in the image as teacher data used for learning a learning model for detecting block noise; The image generating means generates the pseudo block noise image by setting the size and position of the block shape to be the noise area, the color and transmittance of the noise area, respectively .
また、本発明に係るコンピュータプログラムは、ブロックノイズ検出の為の学習に係るプログラムである。具体的には、コンピュータを、ブロックノイズの生じていない学習用正常画像を取得する正常画像取得手段と、ブロック形状の所定エリアを疑似的にノイズ領域に設定したブロックノイズの画像である疑似ブロックノイズ画像を生成する疑似ブロックノイズ画像生成手段と、前記学習用正常画像に対して前記疑似ブロックノイズ画像を重畳して合成することによって、前記学習用正常画像に対して擬似的にブロックノイズを生じさせた疑似異常画像を、ブロックノイズを検出する為の学習モデルの学習に用いる教師データとして生成する教師データ生成手段と、して機能させる為のコンピュータプログラムであって、前記疑似ブロックノイズ画像生成手段は、ノイズ領域とするブロック形状のサイズ、位置、ノイズ領域の色及び透過率を夫々設定して前記疑似ブロックノイズ画像を生成する。
Further, a computer program according to the present invention is a program related to learning for block noise detection. Specifically, the computer is equipped with a normal image acquisition means that acquires a normal image for learning without block noise, and a pseudo block noise image that is a block noise image in which a predetermined block-shaped area is set as a pseudo noise area. pseudo block noise image generation means for generating an image; and superimposing and compositing the pseudo block noise image on the normal learning image to generate pseudo block noise in the normal learning image. A computer program for operating a computer program as a teacher data generation means for generating pseudo abnormal images as teacher data used for learning a learning model for detecting block noise, the pseudo block noise image generation means comprising: , the size and position of the block shape to be the noise region, the color and transmittance of the noise region are set respectively, and the pseudo block noise image is generated .
前記構成を有する本発明に係るブロックノイズ検出の為の学習装置及びコンピュータプログラムによれば、正常画像に対して疑似的にブロックノイズを生じさせた画像を生成して教師データとして用い、ブロックノイズを検出する為の学習を行うので、従来と比べて教師データの取得が容易となる。その結果、画像表示装置に表示する画像の品質を向上させるという点において広く適用可能な学習モデルを構築することが可能となる。また、擬似的にブロックノイズを生じさせた疑似異常画像を生成する場合であっても、実際にブロックノイズが生じている異常画像を再現して教師データとして用いることが可能となる。 According to the learning device and computer program for block noise detection according to the present invention having the above-described configuration, an image in which block noise is generated in a pseudo normal image is generated and used as training data, and the block noise is detected. Since learning is performed for detection, it is easier to obtain training data than in the past. As a result, it becomes possible to construct a learning model that is widely applicable in terms of improving the quality of images displayed on image display devices. Furthermore, even in the case of generating a pseudo abnormal image in which block noise is generated in a pseudo manner, it is possible to reproduce an abnormal image in which block noise has actually occurred and use it as training data.
以下、本発明に係る学習装置を具体化した一実施形態について図面を参照しつつ詳細に説明する。先ず、本実施形態に係る学習装置1を含む学習システム2の概略構成について図1を用いて説明する。図1は本実施形態に係る学習システム2を示した概略構成図である。
DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of a learning device according to the present invention will be described in detail below with reference to the drawings. First, a schematic configuration of a
図1に示すように、本実施形態に係る学習システム2は、画像に生じるブロックノイズ検出の為の学習モデルの学習を行う学習装置1と、各種の画像を表示する手段を備えるとともに学習システム2によって表示画像のブロックノイズの低減を図る対象となるナビゲーション装置3と、を基本的に有する。尚、本実施形態では特に表示画像のブロックノイズの低減を図る対象として車載器であるナビゲーション装置3を例に挙げて説明しているが、画像を表示する手段を備える装置であればナビゲーション装置以外であっても良い。例えば、スマートフォン、タブレット端末、パーソナルコンピュータ等をナビゲーション装置3の代わりとしても良い。
As shown in FIG. 1, the
また、本実施形態では学習を行う主体である学習装置1は画像の表示を行うナビゲーション装置3と別体に設けているが、学習装置1はナビゲーション装置3の一部(即ち学習機能を有するナビゲーション装置3)としても良い。その場合には、学習機能を有するナビゲーション装置3が本発明に係る学習装置に該当する。
Further, in this embodiment, the
ここで、学習装置1は、ナビゲーション装置3に表示される画像に生じるブロックノイズを検出する為の学習モデルの学習を行う装置である。また、学習装置1は、学習モデルの学習や学習結果を評価する為のテストに用いる各種画像が記憶されたDBを備え、DBに格納された画像を用いて後述のように学習モデルの学習や学習結果の評価を行う。特に本実施形態ではナビゲーション装置3において表示される画像を対象としたブロックノイズ検出の為の学習を行うので、DBにはナビゲーション装置3において表示対象となる画像(例えば地図画像、移動案内画像、施設案内画像等)が格納される。また、最終的に学習装置1において学習した学習モデルをナビゲーション装置3へと組み込むことによって、学習結果をナビゲーション装置3へと反映する。
Here, the
一方、ナビゲーション装置3は、車両4に搭載され、格納する地図データや通信により取得した地図データに基づいて自車位置周辺の地図を表示したり、地図画像上において車両の現在位置を表示したり、設定された案内経路に沿った移動案内を行う車載機である。特に本実施形態では、学習装置1により学習した学習モデルを組み込み、表示する画像のブロックノイズの発生を低減させる処理についても行う。尚、詳細については後述する。
On the other hand, the
続いて、学習システム2に含まれる学習装置1のより具体的な構成について図2を用いて説明する。図2は本実施形態に係る学習装置1を示したブロック図である。
Next, a more specific configuration of the
学習装置1は、図2に示すように制御部11と、制御部11に接続された情報記録手段としての教師画像DB12と、タッチパネルやキーボード等から構成される入力操作部13と、を備える。
As shown in FIG. 2, the
制御部11は、学習装置1の全体の制御を行う制御ユニット(MCU、MPU等)であり、演算装置及び制御装置としてのCPU21、並びにCPU21が各種の演算処理を行うにあたってワーキングメモリとして使用されるRAM22、制御用のプログラムのほか、後述の学習処理プログラム(図4参照)等が記録されたROM23、ROM23から読み出したプログラムを記憶するフラッシュメモリ24等の内部記憶装置を備えている。尚、制御部11は、処理アルゴリズムとしての各種手段を有する。例えば、正常画像取得手段は、ブロックノイズの生じていない学習用正常画像を取得する。疑似ブロックノイズ画像生成手段は、ブロック形状の所定エリアを疑似的にノイズ領域に設定したブロックノイズの画像である疑似ブロックノイズ画像を生成する。教師データ生成手段は、学習用正常画像に対して疑似ブロックノイズ画像を重畳して合成することによって、学習用正常画像に対して擬似的にブロックノイズを生じさせた疑似異常画像を、ブロックノイズを検出する為の学習モデルの学習に用いる教師データとして生成する。
The
また、教師画像DB12は、学習モデルの学習や学習結果を評価する為のテストに用いる各種画像を記憶する為の記憶手段であり、例えば不揮発性のメモリやHDD等によって構成される。ここで、教師画像DB12に格納される画像は大きく分けて3種類あり、学習に用いる学習用画像25、学習結果を評価する為の一次テストに用いる一次テスト用画像26、一次テスト後に行われる二次テストに用いる二次テスト用画像27が存在する。教師画像DB12に格納される画像数は例えば学習用画像25が約9万枚、一次テスト用画像26が約2万枚、二次テストに用いる二次テスト用画像27が約79万枚存在する。尚、学習用画像25、一次テスト用画像26、二次テスト用画像27は一部が重複していても良い。
Further, the
ここで、本実施形態に係る学習装置1は、ナビゲーション装置3において表示される画像を対象としたブロックノイズを検出する為の学習モデルの学習を行うので、学習用画像25、一次テスト用画像26及び二次テスト用画像27はいずれもナビゲーション装置3において表示対象となる画像(例えば地図画像、移動案内画像、施設案内画像等)となる。また、学習用画像25は、過去にナビゲーション装置3において実際に表示された画像でも良いし、学習用に疑似的に生成した画像であっても良い。更に学習用画像25は、基本的にブロックノイズが生じていない正常画像のみを含む。但し、後述のように学習時においては学習用画像25の正常画像からブロックノイズが生じている異常画像が疑似的に生成され、正常画像と疑似的に生成された異常画像を教師画像として学習が行われる。
Here, since the
一方、一次テスト用画像26及び二次テスト用画像27は、疑似的に生成した画像であっても良いが、より現実に近い状況を想定して学習効果を確認するために、過去にナビゲーション装置3において実際に表示された画像を用いるのが望ましい。一次テスト用画像26及び二次テスト用画像27には、ブロックノイズが生じていない正常画像と、ブロックノイズが生じている異常画像を予め含む。例えば正常画像5割、異常画像5割の比率とするがその比率は適宜変更可能とする。
On the other hand, the
また、入力操作部13は、例えばキーボード、マウス、ディスプレイの前面に設けられたタッチパネル等によって構成され、操作者による各種操作を受け付け可能に構成されている。そして、制御部11は、入力操作部13を介して入力された操作に基づき、対応する各種の動作を実行すべく制御を行う。例えば本実施形態では後述のように疑似的に生成するブロックノイズのパラメータの設定を行う際や学習の目標値を設定する際などに操作される。
Further, the
本実施形態に係る学習装置1において学習される学習モデルは、上述したようにナビゲーション装置3において表示される画像を対象としたブロックノイズ検出の為の学習モデルであるが、より具体的にはナビゲーション装置3において生成された画像データを画面上に表示する前に該画像データが異常画像(表示した際にブロックノイズが生じる画像)に該当するかを判定する学習モデルである。詳細については後述するがナビゲーション装置3は、ブロックノイズが生じると予測されるエリアの面積値が閾値以上である場合に異常画像であると判定し、特に学習モデルはその閾値について学習によって最適値を算出する。
The learning model learned by the
続いて、学習システム2に含まれるナビゲーション装置3の概略構成について図3を用いて説明する。図3は本実施形態に係るナビゲーション装置3を示したブロック図である。
Next, a schematic configuration of the
図3に示すように本実施形態に係るナビゲーション装置3は、ナビゲーション装置3が搭載された車両の現在位置を検出する現在位置検出部31と、各種のデータが記録されたデータ記録部32と、入力された情報に基づいて、各種の演算処理を行うナビゲーションECU33と、ユーザからの操作を受け付ける操作部34と、ユーザに対して車両周辺の地図やナビゲーション装置3に設定された案内経路に関する情報等を表示する液晶ディスプレイ35と、経路案内に関する音声ガイダンスや危険因子に対する警告等を出力するスピーカ36と、記憶媒体であるDVDを読み取るDVDドライブ37と、プローブセンタやVICS(登録商標:Vehicle Information and Communication System)センタ等の情報センタとの間で通信を行う通信モジュール38と、を有している。また、ナビゲーション装置3は、CAN等の車載ネットワークを介して、ナビゲーション装置3の搭載された車両に対して設置されたセンサや車両制御用のECU等と接続されている。
As shown in FIG. 3, the
以下に、ナビゲーション装置3が有する各構成要素について順に説明する。
現在位置検出部31は、GPS41、車速センサ42、ステアリングセンサ43、ジャイロセンサ44等からなり、現在の車両の位置、方位、車両の走行速度、現在時刻等を検出することが可能となっている。ここで、特に車速センサ42は、車両の移動距離や車速を検出する為のセンサであり、車両の駆動輪の回転に応じてパルスを発生させ、パルス信号をナビゲーションECU33に出力する。そして、ナビゲーションECU33は発生するパルスを計数することにより駆動輪の回転速度や移動距離を算出する。尚、上記4種類のセンサをナビゲーション装置3が全て備える必要はなく、これらの内の1又は複数種類のセンサのみをナビゲーション装置3が備える構成としても良い。
Below, each component included in the
The current
また、データ記録部32は、外部記憶装置及び記録媒体としてのハードディスク(図示せず)と、ハードディスクに記録された地図情報DB45や学習情報DB46や所定のプログラム等を読み出すとともにハードディスクに所定のデータを書き込む為のドライバである記録ヘッド(図示せず)とを備えている。尚、データ記録部32としてはハードディスクの代わりにメモリーカードやCDやDVD等の光ディスクを有しても良い。また、地図情報DB45は外部のサーバに格納させ、ナビゲーション装置3が通信により取得しても良い。
The
ここで、地図情報DB45は、例えば、道路(リンク)に関するリンクデータ、ノード点に関するノードデータ、施設に関する施設データ、経路探索処理に用いられる探索データ、地図を表示するための地図表示データ、各交差点に関する交差点データ、地点を検索するための検索データ等を含む。
Here, the
また、学習情報DB46は、学習装置1によって学習された学習モデルに関する情報が格納される記憶手段である。本実施形態では後述のようにナビゲーション装置3は、生成され液晶ディスプレイ35に表示する前の画像データについて異常画像(表示した際にブロックノイズが生じる画像)に該当するかを判定し、異常画像に該当すると判定された場合に画像データの再生成を行うが、判定の際に用いる閾値が学習値として上記学習モデルに含まれている。尚、学習情報DB46に格納される学習モデルに関する情報は、学習装置1から通信或いは記憶媒体を介して取得し、更に取得した情報に基づいて適宜更新可能とするのが望ましい。
Further, the learning
一方、ナビゲーションECU(エレクトロニック・コントロール・ユニット)33は、ナビゲーション装置3の全体の制御を行う電子制御ユニットであり、演算装置及び制御装置としてのCPU51、並びにCPU51が各種の演算処理を行うにあたってワーキングメモリとして使用されるとともに、経路が探索されたときの経路データ等が記憶されるRAM52、制御用のプログラムのほか、後述の画像表示処理プログラム(図10参照)等が記録されたROM53、ROM53から読み出したプログラムを記憶するフラッシュメモリ54等の内部記憶装置を備えている。更に、特に画像の描画に関する演算を行うGPU55、画像の描画に関する情報を格納するVRAM(ビデオメモリ)56についても備えている。但し、GPU55やVRAM56は必須ではなく、CPU51やRAM52がそれらの動作を代わりに行っても良い。
On the other hand, the navigation ECU (electronic control unit) 33 is an electronic control unit that controls the
操作部34は、走行開始地点としての出発地及び走行終了地点としての目的地を入力する際等に操作され、各種のキー、ボタン等の複数の操作スイッチ(図示せず)を有する。そして、ナビゲーションECU33は、各スイッチの押下等により出力されるスイッチ信号に基づき、対応する各種の動作を実行すべく制御を行う。尚、操作部34は液晶ディスプレイ35の前面に設けたタッチパネルを有しても良い。また、マイクと音声認識装置を有しても良い。
The
また、液晶ディスプレイ35には、道路を含む地図画像、交通情報、操作案内、操作メニュー、キーの案内、ナビゲーション装置3で設定されている案内経路、案内経路に沿った案内情報、ニュース、天気予報、時刻、メール、テレビ番組等が表示される。尚、液晶ディスプレイ35の代わりに、HUDやHMDを用いても良い。また、本実施形態では特にナビゲーション装置3に組み込まれた学習モデルを用いて、後述のように液晶ディスプレイ35に表示される画像に対してブロックノイズの低減の為の処理が行われる。
The
また、スピーカ36は、ナビゲーションECU33からの指示に基づいて案内経路に沿った走行を案内する音声ガイダンスや、交通情報の案内を出力する。
Further, the
また、DVDドライブ37は、DVDやCD等の記録媒体に記録されたデータを読み取り可能なドライブである。そして、読み取ったデータに基づいて音楽や映像の再生、地図情報DB45や学習情報DB46の更新等が行われる。尚、DVDドライブ37に替えてメモリーカードを読み書きする為のカードスロットを設けても良い。
Further, the
また、通信モジュール38は、交通情報センタ、例えば、VICSセンタやプローブセンタ等から送信された交通情報を受信する為の通信装置であり、例えば携帯電話機やDCMが該当する。また、学習装置1との間の通信について可能にしても良い。
Further, the
続いて、上記構成を有する本実施形態に係る学習装置1においてCPU21が実行する学習処理プログラムについて図4に基づき説明する。図4は本実施形態に係る学習処理プログラムのフローチャートである。ここで、学習処理プログラムは、前回の処理を実行した後から一定期間経過後に実行され、教師画像DB12に格納された画像を用いてナビゲーション装置3に表示される画像に生じるブロックノイズ検出の為の学習モデルの学習を行い、より最適な学習モデルを生成するプログラムである。また、以下の図4にフローチャートで示されるプログラムは、制御部11が備えているRAM22、ROM23等に記憶されており、CPU21により実行される。
Next, a learning processing program executed by the
先ず、学習処理プログラムでは、ステップ(以下、Sと略記する)1において、CPU21は教師画像DB12から学習モデルの学習に用いる学習用画像25を抽出する。尚、学習用画像25は、ナビゲーション装置3において表示対象となる画像(例えば地図画像、移動案内画像、施設案内画像等)であり、過去にナビゲーション装置3において実際に表示された画像でも良いし、学習用に疑似的に生成した画像であっても良い。過去にナビゲーション装置3において実際に表示された画像を収集する手段としては、例えば液晶ディスプレイ35の表示画像を撮像し、撮像画像から正常画像のみを目視で抽出することにより行う。また、学習の過程で後述のように二次テスト用画像27の一部が学習用画像25として追加される場合もある(S13)。前記S1で抽出される学習用画像25は基本的にブロックノイズが生じていない正常画像のみであり、枚数は約9万枚とする。
First, in step (hereinafter abbreviated as S) 1 of the learning processing program, the
尚、前記S1で抽出された約9万枚の学習用画像25の中には、全く同一或いはごく一部のみが異なる実質的に同一な複数の画像(以下、重複画像)が多く含まれる。このような複数の重複画像の全てを対象として学習を行ったとしても、複数の重複画像の内から選択した一の重複画像のみを対象として学習を行った場合であっても学習効果に大きな差はない。従って、処理負担を軽減するために図5に示すように重複画像については一のみを残して他の重複画像は以降の処理対象から除外する(S2)。特にS2においてCPU21は、ハッシュ関数を用いて前記S1で抽出された約9万枚の学習用画像25の内から上記重複画像の探索を行う。尚、ハッシュ関数を用いた探索以外の手段によって重複画像を判定しても良い。前記S2の処理を行った結果、以降の処理で処理対象となる学習用画像25の枚数は約4.5万枚まで削減される。
Note that the approximately 90,000
続いて、S3においてCPU21は、ブロック形状の所定エリアを疑似的にノイズ領域に設定したブロックノイズの画像(以下、疑似ブロックノイズ画像という)を生成する。ここで、図6は前記S3で生成される疑似ブロックノイズ画像61の一例を示した図である。疑似ブロックノイズ画像61のサイズは学習用画像25と同サイズとする。また、ノイズ領域は一又は複数の正方形のブロック形状が連なった領域となるが、画像内においてノイズ領域となるブロック形状のサイズや位置はランダムに設定される。例えば以下の方法により設定する。
(1)周波数をランダムに取得し、sin波とcos波の合成波を生成する。
(2)画像の縦方向に対してブロックサイズ単位のステップで合成波からサンプリング値をサンプリングする。
(3)画像の横方向に対しても上記(1)及び(2)の処理を行う。
(4)縦方向と横方向に夫々サンプリングされたサンプリング値について、閾値を基準に白(255)と黒(0)のいずれかに区分する。黒に設定された領域がノイズ領域となる。
Subsequently, in S3, the
(1) Obtain frequencies at random and generate a composite wave of sine waves and cosine waves.
(2) Sampling values are sampled from the composite wave in steps of block size in the vertical direction of the image.
(3) The above processes (1) and (2) are also performed in the horizontal direction of the image.
(4) The sampling values sampled in the vertical and horizontal directions are classified into either white (255) or black (0) based on the threshold value. The area set to black becomes the noise area.
また、前記S3においてCPU21は、前記S1で教師画像DB12から抽出され、前記S2で重複画像を除外した後の学習用画像25の数に対応する数(例えば約4.5万枚)だけ疑似ブロックノイズ画像61を生成する。生成される複数の疑似ブロックノイズ画像61毎に、ノイズ領域となるブロック形状のサイズや位置は上記(1)~(4)の手段を用いてランダムに設定される。
In addition, in S3, the
その後、S4においてCPU21は、前記S3で生成された疑似ブロックノイズ画像について、複数の疑似ブロックノイズ画像61毎にノイズ領域の色をランダムに設定する。例えば、HSV色空間から色をランダムに選択し、選択した色にノイズ領域の色を変換する。また、ノイズ領域の透過率についても同様にランダムに設定する。尚、ノイズ領域の色や透過率については一の画像内において同一としても良いし、一の画像内でもエリア毎に異なる態様に設定しても良い。
Thereafter, in S4, the
続いて、S5においてCPU21は、前記S1で教師画像DB12から抽出され、前記S2で重複画像を除外した後の学習用画像25に対して、図7に示すように前記S3で生成された疑似ブロックノイズ画像61を重畳して合成する。更に、S6においてCPU21は、重畳した画像をグレースケール変換する。その結果、図7に示すように正常画像である学習用画像25に対して擬似的にブロックノイズを生じさせた疑似異常画像62が生成される。尚、疑似異常画像62に生じているブロックノイズの位置、形状、透過率、色(グレースケールの色)については画像毎に上記S3及びS4の処理によりランダムに設定されることとなる。また、処理対象となる学習用画像25の枚数が約4.5万枚であれば、疑似異常画像62も約4.5万枚生成されることとなる。
Subsequently, in S5, the
その後、S7においてCPU21は、前記S6で生成された疑似ブロックノイズ画像(即ち擬似的にブロックノイズを生じさせた異常画像)と教師画像DB12から抽出した学習用画像25(即ち正常画像)を教師画像として、ランダムに学習モデルに入力して学習を行う。尚、学習モデルに入力する正常画像と異常画像の割合は例えば正常画像:異常画像=4:6とする。尚、割合は適宜変更可能であるが、異常画像の検出を漏れなく行う為に、異常画像の割合を多くするのが望ましい。上記学習モデルによる学習は、前記S6で生成された全ての疑似ブロックノイズ画像61の入力が終了するまで行う。また、学習モデルは例えばU-Netモデルを用いる。
Thereafter, in S7, the
前記S7における学習モデルによる学習としては、例えばランダムに入力された画像が“正常画像”又は“異常画像”のいずれに該当するかの予測を行う。そして、学習モデルが予測した結果と、予め用意している画像が正常画像か異常画像であるかの答えと照合させることで学習モデルの学習を行う。尚、学習モデルの学習としては“正常画像”又は“異常画像”の予測に加えて、画像内のどの領域にブロックノイズが生じているかを予測させ、学習モデルが予測した結果と、予め用意しているブロックノイズが生じている領域の答えと照合させることで学習モデルの学習を行うようにしても良い。 As for the learning using the learning model in S7, for example, it is predicted whether a randomly input image corresponds to a "normal image" or an "abnormal image." Then, the learning model is trained by comparing the results predicted by the learning model with a previously prepared answer as to whether the image is a normal image or an abnormal image. In addition to predicting "normal images" or "abnormal images," the learning model is trained to predict in which areas within the image block noise occurs, and the results predicted by the learning model are combined with the predictions prepared in advance. The learning model may be trained by comparing the answer with the answer of the area where block noise occurs.
その後、S8においてCPU21は、生成された全ての疑似ブロックノイズ画像61を対象として学習モデルの学習を行った後に、学習モデルの学習結果を評価する為に教師画像DB12に格納された一次テスト用画像26を用いて評価値mIoUを算出する。具体的には、学習後の学習モデルに対して一次テスト用画像26を入力し、一次テスト用画像26においてブロックノイズが生じている領域を予測させる。そして、学習モデルが予測した結果と、予め用意しているブロックノイズが生じている領域の答えと照合させ、評価値mIoUを算出する。尚、評価値mIoUは予測結果と正解が完全に一致していれば1.0となり、ずれが大きくなる程0に近い値が算出される。例えばピクセル単位で混同行列を用いることによって評価値mIoUを算出する。
After that, in S8, the
尚、一次テスト用画像26は、過去にナビゲーション装置3において実際に表示された画像を用い、ブロックノイズが生じていない正常画像と、ブロックノイズが生じている異常画像を夫々含むようにする。一次テスト用画像26の枚数は約2万枚とするが、2万枚の一次テスト用画像26に対して夫々算出された評価値mIoUの平均値を、今回の学習モデルの最終的な評価値mIoUとする。但し、平均値ではなく中央値や最頻値としても良い。
The
その後、CPU21は上記S1~S8の処理を所定回数(例えば100回)繰り返し行う。処理を繰り返す度に前記S3で生成される疑似ブロックノイズ画像61のノイズ領域の位置、形状、色、透過率がランダムに変化する、即ち学習モデルで学習対象とする教師画像が変わるので、学習モデルの学習結果を評価する評価値mIoUも繰り返す度に変わることとなる。
Thereafter, the
次に、S9においてCPU21は、所定回数繰り返し行った学習において、前記S8で算出された評価値mIoUが最も高い値となった学習モデル(以下、ベスト学習モデルという)を選択する。そして、選択されたベスト学習モデルの学習結果を改めて評価する為に、ベスト学習モデルに対して教師画像DB12に格納された二次テスト用画像27を入力し、入力された二次テスト用画像27においてブロックノイズが生じていると予測された領域(以下、ブロックノイズ領域という)の面積値を算出する。
Next, in S9, the
尚、二次テスト用画像27は、一次テスト用画像26と同様に過去にナビゲーション装置3において実際に表示された画像を用い、ブロックノイズが生じていない正常画像と、ブロックノイズが生じている異常画像を夫々含むようにする。二次テスト用画像27の枚数は約79万枚とし、79万枚の二次テスト用画像27に対して夫々ブロックノイズ領域の面積値を算出する。
The
続いて、S10においてCPU21は、入力された二次テスト用画像27が正常画像である場合と異常画像である場合とに分けて、前記S9で算出されたブロックノイズ領域の面積値の分布(ヒストグラム)を生成する。例えば図8は前記S10において生成されるブロックノイズ領域の面積値の分布の一例を示した図である。図8に示すように前記S10において生成されるブロックノイズ領域の面積値の分布は、横軸を面積値、縦軸を度数とし、算出された面積値を所定範囲毎に区分してその範囲に含まれる度数を示すヒストグラムとする。
Next, in S10, the
基本的に入力された二次テスト用画像27が正常画像である場合のブロックノイズ領域の面積値の分布は、0付近に度数が集中することとなる。一方、入力された二次テスト用画像27が異常画像である場合のブロックノイズ領域の面積値の分布は、ある程度分散して度数が分布することとなる。
Basically, in the distribution of the area values of the block noise region when the inputted
次に、S11においてCPU21は、異常画像を異常画像と判断する再現率(Recall)が100%となること、即ち異常画像に対する見逃しが無いことを第1の条件とし、且つ適合率(Precision、精度ともいう)が最も高くなることを第2の条件として閾値を算出する。本実施形態において学習モデルが学習するのは、ナビゲーション装置3において生成された画像データを画面上に表示する前に該画像データが異常画像(表示した際にブロックノイズが生じる画像)に該当するかを判定する為の学習である。そして、学習モデルはブロックノイズが生じると予測されるブロックノイズ領域の面積値が閾値以上である場合に異常画像であると判定することとし、S11ではその閾値について学習によって最適値を算出する。
Next, in S11, the
ここで、閾値の算出において重要なのはナビゲーション装置3に反映した際に異常画像の見逃しが無いこと、即ち異常画像を正常画像と判定しないことである。また、適合率、即ちナビゲーション装置3が異常画像と判定した画像が実際に異常画像である割合はできる限り高くするのが望ましい。従って、図8に示すように生成されたブロックノイズ領域の面積値の分布において、入力された二次テスト用画像27が異常画像である場合の度数が存在する最も低い面積値を閾値とする。
Here, what is important in calculating the threshold value is that no abnormal images are overlooked when reflected on the
また、前記S11においてCPU21は、設定された閾値における適合率を算出する。ここで、適合率は上述したようにナビゲーション装置3に反映した際に異常画像と判定した画像が実際に異常画像である割合(正解率)である。前記S10で生成されたブロックノイズ領域の面積値の分布において、閾値以上の面積値において正常画像と異常画像を合わせた度数に対する異常画像の度数の割合が適合率となる。即ち、閾値以上の面積値において正常画像の度数が存在しなければ適合率は理想値である100%となるが、100%の到達は困難である為、後述のように目標値として例えば99%を設定する。
Further, in S11, the
その後、S12においてCPU21は、前記S11で設定された閾値をナビゲーション装置3に反映した際の再現率(Recall)と適合率(Precision)の値が目標値に到達するか否かを判定する。尚、再現率の目標値は100%とし、適合率の目標値は99%とする。但し、目標値は適宜変更可能である。例えば適合率の目標値を98%や97%としても良い。また、本実施形態では上述のように再現率が100%であることを条件に閾値を設定するので、前記S12では再現率については必ず目標値に到達すると判定されることとなるが、例えば適合率が99%であることを条件に閾値を設定し、S12では再現率が目標値に到達するか否かの判定を行っても良い。
After that, in S12, the
そして、前記S11で設定された閾値をナビゲーション装置3に反映した際の再現率(Recall)と適合率(Precision)の値が目標値に到達すると判定された場合(S12:YES)には、S14へと移行する。それに対して、前記S11で設定された閾値をナビゲーション装置3に反映した際の再現率(Recall)と適合率(Precision)の値が目標値に到達しないと判定された場合(S12:NO)には、S13へと移行する。
Then, if it is determined that the recall rate (Recall) and precision rate (Precision) when the threshold value set in S11 is reflected in the
S13においてCPU21は、適合率を向上させる為に、現在の学習モデルではブロックノイズ領域の予測を正しく行うことができなかった正常画像、即ち前記S10で生成されたブロックノイズ領域の面積値の分布において、ブロックノイズ領域の面積値が閾値以上となっている正常画像について学習対象として追加する。具体的には図9に示すようにブロックノイズ領域の面積値の分布において、閾値以上の面積値となる正常画像を学習用画像25に追加する。即ち、二次テスト用画像27の一部が学習用画像25に新たに追加されることとなる。
In S13, in order to improve the precision rate, the
その後、S1へと戻りCPU21は新たに画像の追加された学習用画像25に基づいて学習モデルの学習を行う。ブロックノイズ領域の予測を正しくできなかった正常画像を学習対象として追加することにより、その後に新たな学習を行った学習モデルでは適合率(Precision)の向上が期待できる。
Thereafter, the process returns to S1 and the
一方、S14においてCPU21は、前記S11で設定された閾値を含むベスト学習モデルを学習結果としてナビゲーション装置3へと組み込む。尚、ベスト学習モデルの組み込みは、例えば通信や記憶媒体を介して必要な情報をナビゲーション装置3へと取得させることにより行う。その結果、ナビゲーション装置3は組み込んだベスト学習モデルを用いて後述のように表示する画像のブロックノイズの発生を低減させる処理が可能となる。
On the other hand, in S14, the
続いて、本実施形態に係るナビゲーション装置3においてCPU51やGPU55が実行する画像表示処理プログラムについて図10に基づき説明する。図10は本実施形態に係る画像表示処理プログラムのフローチャートである。ここで、画像表示処理プログラムは、車両のACC電源(accessory power supply)がONされた後に実行され、前述の学習処理プログラム(図4参照)において学習装置1により学習した学習モデルを組み込むことによって、表示する画像のブロックノイズの発生を低減させるプログラムである。また、以下の図10にフローチャートで示されるプログラムは、ナビゲーションECU33が備えているRAM52、ROM53等に記憶されており、CPU51又はGPU55により実行される。
Next, an image display processing program executed by the
先ず、画像表示処理プログラムでは、S21においてCPU51はナビゲーション装置3において表示対象とする画像の画像データを生成する。尚、ナビゲーション装置3において表示対象とする画像は現在のナビゲーション装置3の状況によって異なるが、基本的には車両の現在位置周辺の地図画像を表示する。また、車両の移動案内の実行中であって案内交差点に接近した場合には、交差点拡大図等についても表示する。また、ユーザによって施設検索が行われた場合には検索された施設のリストや施設情報等についても表示する。
First, in the image display processing program, the
続いて、S22においてCPU51は、学習情報DB46に格納された学習モデルを用いて、前記S21で生成された画像データについて液晶ディスプレイ35に表示する前にブロックノイズの検出を行う。具体的には、CPU51は学習モデルを用いてブロックノイズが生じると予測されるエリアの面積値を特定し、面積値が閾値以上の場合に画像データにブロックノイズが生じると判定する。尚、閾値については前述の学習処理プログラム(図4参照)において最適値が算出されている(S11)。
Subsequently, in S22, the
その後、S23においてCPU51は、前記S22の検出結果に基づいて前記S21で生成された画像データにブロックノイズが生じると判定されたか否かを判定し、ブロックノイズが生じると判定された場合(S23:YES)には、S24へと移行する。
Thereafter, in S23, the
S24においてCPU51は、生成された画像データに異常が有ると推定し、画像データを再度生成する処理を行う。その後、S22へと移行し、再生成した画像データについて改めてブロックノイズの検出を行う。
In S24, the
一方、前記S21で生成された画像データにブロックノイズが生じないと判定された場合(S23:NO)には、S25へと移行する。S25では生成された画像データを一旦RAM52やVRAM56等のメモリに格納する。
On the other hand, if it is determined that block noise does not occur in the image data generated in S21 (S23: NO), the process moves to S25. In S25, the generated image data is temporarily stored in a memory such as the
その後、GPU55はメモリに格納された画像データを液晶ディスプレイ35に描画する描画処理を行う。その結果、液晶ディスプレイ35に表示される画像にブロックノイズが生じることを防止することが可能となる。尚、画像の描画処理についてはCPU51が行っても良い。
Thereafter, the GPU 55 performs a drawing process to draw the image data stored in the memory on the
以上詳細に説明した通り、本実施形態に係る学習装置1及び学習装置1で実行されるコンピュータプログラムでは、ブロックノイズの生じていない学習用正常画像を取得するとともに(S1)、ブロック形状の所定エリアを疑似的にノイズ領域に設定したブロックノイズの画像である疑似ブロックノイズ画像を生成し(S3)、学習用正常画像に対して疑似ブロックノイズ画像を重畳して合成することによって、学習用正常画像に対して擬似的にブロックノイズを生じさせた疑似異常画像を、ブロックノイズを検出する為の学習モデルの学習に用いる教師データとして生成し(S6)、生成された教師データを用いて学習モデルの学習を行う(S1~S13)ので、従来と比べて教師データの取得が容易となる。その結果、画像表示装置(例えばナビゲーション装置、スマートフォン、タブレット端末、パーソナルコンピュータ)に表示する画像の品質を向上させるという点において広く適用可能な学習モデルを構築することが可能となる。
As explained in detail above, in the
尚、本発明は前記実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲内で種々の改良、変形が可能であることは勿論である。
例えば、上記実施形態では、学習モデルの学習結果を評価する手段として再現率(Recall)と適合率(Precision)を用いているが、他の評価手段によって学習結果を評価するようにしても良い。
It should be noted that the present invention is not limited to the embodiments described above, and it goes without saying that various improvements and modifications can be made without departing from the gist of the present invention.
For example, in the embodiment described above, recall and precision are used as means for evaluating the learning results of the learning model, but the learning results may be evaluated using other evaluation means.
また、本実施形態ではブロックノイズの画像である疑似ブロックノイズ画像61を生成する際に、ノイズ領域とするブロック形状のサイズ、位置、ノイズ領域の色及び透過率の各パラメータを夫々ランダムに変化させているが、各パラメータの一部(例えばノイズ領域とするブロック形状のサイズと位置)のみをランダムに設定しても良い。また、学習装置1の操作を行う操作者においてパラメータを設定可能にしても良い。
Furthermore, in this embodiment, when generating the pseudo
また、本実施形態では学習用画像25に対して擬似的にブロックノイズを生じさせた疑似異常画像をグレースケール変換しているが、グレースケール変換については行わないようにしても良い。
Further, in this embodiment, the pseudo abnormal image in which block noise is generated in the
また、上記実施形態では学習処理プログラム(図4)は学習装置1が実施しているが、ナビゲーション装置3が実施するようにしても良い。その場合には、学習機能を有するナビゲーション装置3が本発明に係る学習装置に該当する。
Further, in the above embodiment, the learning processing program (FIG. 4) is executed by the
また、上記実施形態では表示画像のブロックノイズの低減を図る対象として車載器であるナビゲーション装置3を例に挙げて説明しているが、画像を表示する手段を備える装置であればナビゲーション装置以外であっても良い。例えば、スマートフォン、タブレット端末、パーソナルコンピュータ等をナビゲーション装置3の代わりとしても良い。
Furthermore, in the above embodiment, the
また、本発明に係るブロックノイズ検出の為の学習装置を具体化した実施例について上記に説明したが、ブロックノイズ検出の為の学習装置は以下の構成を有することも可能であり、その場合には以下の効果を奏する。 Moreover, although the embodiment embodying the learning device for detecting block noise according to the present invention has been described above, the learning device for detecting block noise can also have the following configuration, and in that case, has the following effects.
例えば、第1の構成は以下のとおりである。
ブロックノイズの生じていない学習用正常画像(25)を取得する正常画像取得手段(21)と、ブロック形状の所定エリアを疑似的にノイズ領域に設定したブロックノイズの画像である疑似ブロックノイズ画像(61)を生成する疑似ブロックノイズ画像生成手段(21)と、前記学習用正常画像に対して前記疑似ブロックノイズ画像を重畳して合成することによって、前記学習用正常画像に対して擬似的にブロックノイズを生じさせた疑似異常画像(62)を、ブロックノイズを検出する為の学習モデルの学習に用いる教師データとして生成する教師データ生成手段(21)と、を有する。
上記構成を有するブロックノイズ検出の為の学習装置によれば、正常画像に対して疑似的にブロックノイズを生じさせた画像を生成して教師データとして用い、ブロックノイズを検出する為の学習を行うので、従来と比べて教師データの取得が容易となる。その結果、画像表示装置に表示する画像の品質を向上させるという点において広く適用可能な学習モデルを構築することが可能となる。
For example, the first configuration is as follows.
A normal image acquisition means (21) that acquires a normal image for learning (25) in which block noise does not occur, and a pseudo block noise image (21) that is an image of block noise in which a predetermined block-shaped area is pseudo-set as a noise region. 61), and a pseudo block noise image generating means (21) that generates a pseudo block noise image on the learning normal image by superimposing and composing the pseudo block noise image on the learning normal image. It has a teacher data generating means (21) that generates a pseudo abnormal image (62) in which noise is generated as teacher data used for learning a learning model for detecting block noise.
According to the learning device for block noise detection having the above configuration, an image in which block noise is generated in a pseudo normal image is generated and used as training data, and learning for detecting block noise is performed. Therefore, it is easier to obtain training data than in the past. As a result, it becomes possible to construct a learning model that is widely applicable in terms of improving the quality of images displayed on image display devices.
また、第2の構成は以下のとおりである。
前記疑似ブロックノイズ画像生成手段(21)は、ノイズ領域とするブロック形状のサイズ、位置、ノイズ領域の色及び透過率を夫々設定して前記疑似ブロックノイズ画像(61)を生成する。
上記構成を有するブロックノイズ検出の為の学習装置によれば、擬似的にブロックノイズを生じさせた疑似異常画像を生成する場合であっても、実際にブロックノイズが生じている異常画像を再現して教師データとして用いることが可能となる。
Further, the second configuration is as follows.
The pseudo block noise image generation means (21) generates the pseudo block noise image (61) by setting the size and position of a block shape to be a noise region, the color and transmittance of the noise region, respectively.
According to the learning device for block noise detection having the above configuration, even when generating a pseudo abnormal image in which block noise is generated, it is possible to reproduce an abnormal image in which block noise actually occurs. This makes it possible to use the data as training data.
また、第3の構成は以下のとおりである。
前記疑似ブロックノイズ画像生成手段(21)は、ノイズ領域とするブロック形状のサイズ、位置、ノイズ領域の色及び透過率の少なくとも一をパラメータとしてランダムに変化させて複数の前記疑似ブロックノイズ画像(61)を生成し、前記教師データ生成手段(21)は、複数の前記疑似ブロックノイズ画像(61)を前記学習用正常画像(25)に対して重畳して合成した複数の前記疑似異常画像(62)を生成し、複数の前記疑似異常画像を教師データとして用いて前記学習モデルの学習を行う。
上記構成を有するブロックノイズ検出の為の学習装置によれば、擬似的にブロックノイズを生じさせた疑似異常画像を生成する場合に、パラメータをランダムに変えて様々なブロックノイズのパターンに基づく複数の疑似異常画像を生成し、生成した複数の疑似異常画像を教師データとして用いることによって、実際に生じ得る多様なブロックノイズを想定した高い学習効果について期待できる。
Moreover, the third configuration is as follows.
The pseudo block noise image generation means (21) generates a plurality of pseudo block noise images (61) by randomly changing at least one of the size and position of the block shape to be a noise region, the color and transmittance of the noise region as parameters. ), and the teacher data generation means (21) generates a plurality of pseudo abnormal images (62), which are synthesized by superimposing a plurality of pseudo block noise images (61) on the learning normal image (25). ), and the learning model is trained using the plurality of pseudo abnormal images as training data.
According to the learning device for detecting block noise having the above configuration, when generating a pseudo-abnormal image in which block noise is generated, the learning device randomly changes the parameters and generates a plurality of images based on various block noise patterns. By generating pseudo-abnormal images and using a plurality of generated pseudo-abnormal images as training data, a high learning effect can be expected assuming various block noises that may actually occur.
また、第4の構成は以下のとおりである。
教師データとして用いる前記疑似異常画像(62)を変えて前記学習モデルの学習を複数回行い、複数回の学習毎に前記学習モデルの学習結果を評価する学習結果評価手段(21)と、最も評価の高い学習結果を示した前記学習モデルを採用する学習モデル採用手段(21)と、を有する。
上記構成を有するブロックノイズ検出の為の学習装置によれば、教師データとする疑似異常画像を変化させて複数回の学習を行わせるとともに、最も評価の高い学習後の学習モデルを採用するので、仮に擬似的にブロックノイズを生じさせた疑似異常画像に実際には存在し得ない不自然な異常画像が含まれていたとしても、それらを教師データとして学習した学習モデルについては排除でき、より実際の異常画像に近い疑似異常画像を教師データとして学習した学習モデルを採用することが可能となる。
Further, the fourth configuration is as follows.
a learning result evaluation means (21) that performs learning of the learning model multiple times by changing the pseudo abnormal images (62) used as training data, and evaluates the learning results of the learning model for each of the multiple learnings; learning model employing means (21) for employing the learning model that has shown a high learning result.
According to the learning device for block noise detection having the above configuration, learning is performed multiple times by changing the pseudo abnormal images used as teaching data, and the learning model after learning with the highest evaluation is adopted. Even if a pseudo-abnormal image that artificially generates block noise contains unnatural abnormal images that cannot actually exist, the learning model that learned them as training data can eliminate them, making it more practical. It becomes possible to employ a learning model that is trained using pseudo-abnormal images close to the abnormal images of , as training data.
また、第5の構成は以下のとおりである。
前記学習結果評価手段(21)は、複数回の学習毎に学習された学習モデルを用いて、ブロックノイズが生じているテスト用異常画像を含む第1のテスト用画像(26)に対してブロックノイズが生じているエリアの予測判断を行わせ、ブロックノイズが生じていると予測されたエリアと実際にブロックノイズが生じているエリアとの一致の度合いを評価する。
上記構成を有するブロックノイズ検出の為の学習装置によれば、ブロックノイズが生じているエリアの予測判断によって学習結果の評価を行うので、ブロックノイズを検出する為の学習評価の高い学習モデルを採用することが可能となる。
Further, the fifth configuration is as follows.
The learning result evaluation means (21) uses the learning model learned for each of the plurality of learnings to evaluate the first test image (26) including the abnormal test image in which block noise has occurred. A predictive determination of the area where the noise is occurring is made, and the degree of coincidence between the area where the block noise is predicted to occur and the area where the block noise is actually occurring is evaluated.
According to the learning device for block noise detection having the above configuration, since the learning results are evaluated by predictive judgment of the area where block noise occurs, a learning model with a high learning evaluation for detecting block noise is adopted. It becomes possible to do so.
また、第6の構成は以下のとおりである。
前記学習モデル採用手段(21)により採用された前記学習モデルを用いて、ブロックノイズの生じていないテスト用正常画像とブロックノイズが生じているテスト用異常画像とを含む第2のテスト用画像(27)群に対してブロックノイズが生じているエリアの予測を行わせるエリア予測手段(21)と、前記エリア予測手段によりブロックノイズが生じていると予測されたエリアの面積分布を、前記テスト用正常画像と前記テスト用異常画像とに分けて生成する面積分布生成手段(21)と、前記面積分布に基づいて前記学習モデル採用手段により採用された前記学習モデルを再評価する学習モデル再評価手段(21)と、を有する。
上記構成を有するブロックノイズ検出の為の学習装置によれば、ブロックノイズの生じていないテスト用正常画像とブロックノイズが生じているテスト用異常画像に対して夫々ブロックノイズが生じているエリアの予測判断を行い、ブロックノイズが生じていると予測されたエリアの面積分布に基づいて学習結果の評価を行うので、ブロックノイズの生じていない正常画像を正常画像と検出し、ブロックノイズの生じている異常画像を異常画像と検出することを評価対象とした学習モデルの評価が可能となる。
Further, the sixth configuration is as follows.
Using the learning model adopted by the learning model adoption means (21), a second test image ( 27) Area prediction means (21) that causes the group to predict areas where block noise has occurred; Area distribution generation means (21) that separately generates a normal image and the test abnormal image; and a learning model re-evaluation means that re-evaluates the learning model adopted by the learning model adoption means based on the area distribution. (21).
According to the learning device for block noise detection having the above configuration, the area where block noise occurs is predicted for a normal test image in which block noise does not occur and an abnormal test image in which block noise occurs, respectively. Since the learning result is evaluated based on the area distribution of areas predicted to have block noise, normal images without block noise are detected as normal images, and normal images with block noise are detected as normal images. It becomes possible to evaluate a learning model that targets detection of abnormal images as abnormal images.
また、第7の構成は以下のとおりである。
前記学習モデル再評価手段(21)は、再現率と適合率が予め設定された目標値に到達したか否かによって評価を行い、再現率と適合率が目標値に到達していない場合には、再度、学習モデルの学習を行う再学習手段(21)を有する。
上記構成を有するブロックノイズ検出の為の学習装置によれば、特に再現率と適合率が予め設定された目標値に到達した学習モデルを採用可能となる一方で、再現率と適合率が予め設定された目標値に到達しない学習モデルについては再学習を行うことによって、再現率と適合率を向上させることが可能となる。
Moreover, the seventh configuration is as follows.
The learning model re-evaluation means (21) evaluates whether or not the recall rate and precision rate have reached preset target values, and if the recall rate and precision rate have not reached the target values, , has a relearning means (21) for learning the learning model again.
According to the learning device for detecting block noise having the above configuration, it is possible to adopt a learning model whose recall rate and precision rate have reached preset target values, while the recall rate and precision rate are set in advance. By relearning learning models that do not reach the set target value, it is possible to improve recall and precision.
また、第8の構成は以下のとおりである。
前記再学習手段(21)は、前記第2のテスト用画像(27)群に含まれるテスト用正常画像の内、前記学習モデルによってブロックノイズのエリアの予測が正しくできなかったテスト用正常画像を前記学習用正常画像(25)に追加し、再度、学習モデルの学習を行う。
上記構成を有するブロックノイズ検出の為の学習装置によれば、再現率と適合率が予め設定された目標値に到達しない学習モデルについては、ブロックノイズのエリアの予測が正しくできなかったテスト用正常画像を学習対象に追加して再学習を行うことによって、再現率と適合率を向上させることが可能となる。
Further, the eighth configuration is as follows.
The relearning means (21) selects a normal test image for which block noise areas could not be predicted correctly by the learning model, among the normal test images included in the second test image (27) group. It is added to the normal image for learning (25) and the learning model is trained again.
According to the learning device for block noise detection having the above configuration, for the learning model whose recall rate and precision rate do not reach the preset target values, the test normality that cannot predict the block noise area correctly is determined. By adding images to the learning target and performing relearning, it is possible to improve recall and precision.
また、第9の構成は以下のとおりである。
画像表示装置(35)に表示する為の画像データを生成する画像データ生成手段(51)と、前記画像データ生成手段により生成された前記画像データに基づく画像の表示を行う前に、前記画像データに対して前記教師データに基づいて学習された学習モデルを用いてブロックノイズの検出を行うブロックノイズ検出手段(51)と、前記ブロックノイズ検出手段によって前記ブロックノイズが生じると検出された画像データに対してブロックノイズを低減させるための処理を行うブロックノイズ低減手段(51)と、を有する。
上記構成を有するブロックノイズ検出の為の学習装置によれば、学習された学習モデルを用いることによって、画像表示装置に表示する前の画像データに対して予めブロックノイズを生じさせる画像データか否かを検出することが可能となる。そして、ブロックノイズが生じると検出された画像データに対してブロックノイズを低減させるための処理を行うことによって、ブロックノイズが生じた画像が画像表示装置に表示されることを防止できる。
Further, the ninth configuration is as follows.
An image data generation means (51) that generates image data to be displayed on an image display device (35); and before displaying an image based on the image data generated by the image data generation means, the image data block noise detection means (51) for detecting block noise using a learning model learned based on the teacher data; A block noise reduction means (51) that performs processing for reducing block noise.
According to the learning device for block noise detection having the above configuration, by using the learned learning model, it is possible to determine whether or not block noise is generated in image data before displaying it on the image display device. It becomes possible to detect. Then, by performing processing for reducing block noise on image data in which block noise has been detected, it is possible to prevent images in which block noise has occurred from being displayed on the image display device.
また、第10の構成は以下のとおりである。
前記ブロックノイズ検出手段(51)は、前記画像データにおいてブロックノイズが生じるエリアを予測するとともに、ブロックノイズが生じると予測されたエリアの面積値が閾値以上の場合に、前記画像データに前記ブロックノイズが生じると検出する。
上記構成を有するブロックノイズ検出の為の学習装置によれば、学習された学習モデルを用いて画像表示装置に表示する前の画像データに対してブロックノイズが生じるエリアを予測することによって、画像表示装置に表示する前の画像データがブロックノイズを生じさせる画像データか否かを正確に検出することが可能となる。
Moreover, the tenth configuration is as follows.
The block noise detection means (51) predicts an area where block noise will occur in the image data, and adds the block noise to the image data when the area value of the area where block noise is predicted to occur is greater than or equal to a threshold value. is detected when it occurs.
According to the learning device for detecting block noise having the above configuration, the learned learning model is used to predict areas where block noise will occur in image data before displaying it on an image display device. It becomes possible to accurately detect whether the image data before being displayed on the device is image data that causes block noise.
1 学習装置
2 学習システム
3 ナビゲーション装置
12 教師画像DB
21 CPU
22 RAM
23 ROM
25 学習用画像
26 一次テスト用画像
27 二次テスト用画像
33 ナビゲーションECU
35 液晶ディスプレイ
51 CPU
55 GPU
61 疑似ブロックノイズ画像
62 疑似異常画像
1
21 CPU
22 RAM
23 ROM
25
35
55 GPU
61 Pseudo
Claims (10)
ブロック形状の所定エリアを疑似的にノイズ領域に設定したブロックノイズの画像である疑似ブロックノイズ画像を生成する疑似ブロックノイズ画像生成手段と、
前記学習用正常画像に対して前記疑似ブロックノイズ画像を重畳して合成することによって、前記学習用正常画像に対して擬似的にブロックノイズを生じさせた疑似異常画像を、ブロックノイズを検出する為の学習モデルの学習に用いる教師データとして生成する教師データ生成手段と、を有し、
前記疑似ブロックノイズ画像生成手段は、ノイズ領域とするブロック形状のサイズ、位置、ノイズ領域の色及び透過率を夫々設定して前記疑似ブロックノイズ画像を生成する学習装置。 normal image acquisition means for acquiring a normal image for learning without block noise;
pseudo block noise image generation means for generating a pseudo block noise image that is a block noise image in which a predetermined block-shaped area is pseudo-set as a noise region;
In order to detect block noise, a pseudo-abnormal image is generated in which block noise is pseudo-generated in the normal image for learning by superimposing and composing the pseudo-block noise image on the normal image for learning. a teacher data generation means for generating teacher data used for learning the learning model ;
The pseudo block noise image generation means is a learning device that generates the pseudo block noise image by setting the size and position of a block shape to be a noise region, the color and transmittance of the noise region, respectively .
前記教師データ生成手段は、複数の前記疑似ブロックノイズ画像を前記学習用正常画像に対して重畳して合成した複数の前記疑似異常画像を生成し、
複数の前記疑似異常画像を教師データとして用いて前記学習モデルの学習を行う請求項1に記載の学習装置。 The pseudo block noise image generation means generates a plurality of pseudo block noise images by randomly changing at least one of the size and position of a block shape to be a noise region, the color and transmittance of the noise region as parameters,
The teacher data generating means generates a plurality of pseudo abnormal images obtained by superimposing and synthesizing a plurality of pseudo block noise images on the learning normal image,
The learning device according to claim 1 , wherein the learning model is trained using a plurality of the pseudo abnormal images as training data.
複数回の学習毎に前記学習モデルの学習結果を評価する学習結果評価手段と、
最も評価の高い学習結果を示した前記学習モデルを採用する学習モデル採用手段と、を有する請求項1又は請求項2に記載の学習装置。 Learning the learning model multiple times by changing the pseudo abnormal images used as training data,
learning result evaluation means for evaluating the learning results of the learning model every time the learning is performed a plurality of times;
3. The learning device according to claim 1, further comprising a learning model employing unit that employs the learning model that has shown the highest evaluation learning result.
複数回の学習毎に学習された学習モデルを用いて、ブロックノイズが生じているテ
スト用異常画像を含む第1のテスト用画像に対してブロックノイズが生じているエリアの予測判断を行わせ、
ブロックノイズが生じていると予測されたエリアと実際にブロックノイズが生じているエリアとの一致の度合いを評価する請求項3に記載の学習装置。 The learning result evaluation means includes:
Using a learning model learned each time a plurality of learnings are performed, a predictive judgment of an area where block noise is occurring is performed on a first test image including an abnormal test image where block noise is occurring;
4. The learning device according to claim 3 , wherein the learning device evaluates the degree of coincidence between an area where block noise is predicted to occur and an area where block noise actually occurs.
前記エリア予測手段によりブロックノイズが生じていると予測されたエリアの面積分布を、前記テスト用正常画像と前記テスト用異常画像とに分けて生成する面積分布生成手段と、
前記面積分布に基づいて前記学習モデル採用手段により採用された前記学習モデルを再評価する学習モデル再評価手段と、を有する請求項3又は請求項4に記載の学習装置。 Using the learning model adopted by the learning model adoption means, a second test image group including a normal test image in which no block noise occurs and an abnormal test image in which block noise occurs. Area prediction means for predicting an area where block noise is occurring;
Area distribution generating means for generating an area distribution of an area predicted to have block noise by the area predicting means, dividing it into the normal test image and the abnormal test image;
5. The learning device according to claim 3 , further comprising learning model re-evaluation means for re-evaluating the learning model adopted by the learning model adoption means based on the area distribution.
再現率と適合率が目標値に到達していない場合には、再度、学習モデルの学習を行う再学習手段を有する請求項5に記載の学習装置。 The learning model re-evaluation means evaluates whether the recall rate and the precision rate have reached preset target values,
6. The learning device according to claim 5 , further comprising a relearning means for learning the learning model again when the recall rate and the precision rate have not reached the target values.
前記画像データ生成手段により生成された前記画像データに基づく画像の表示を行う前に、前記画像データに対して前記教師データに基づいて学習された学習モデルを用いてブロックノイズの検出を行うブロックノイズ検出手段と、
前記ブロックノイズ検出手段によって前記ブロックノイズが生じると検出された画像データに対してブロックノイズを低減させるための処理を行うブロックノイズ低減手段と、を有する請求項1乃至請求項7のいずれかに記載の学習装置。 image data generation means for generating image data to be displayed on an image display device;
Before displaying an image based on the image data generated by the image data generation means, block noise is detected using a learning model trained on the image data based on the teacher data. detection means;
8. A block noise reduction unit that performs processing to reduce block noise on image data in which block noise has been detected by the block noise detection unit. learning device.
ブロックノイズの生じていない学習用正常画像を取得する正常画像取得手段と、
ブロック形状の所定エリアを疑似的にノイズ領域に設定したブロックノイズの画像である疑似ブロックノイズ画像を生成する疑似ブロックノイズ画像生成手段と、
前記学習用正常画像に対して前記疑似ブロックノイズ画像を重畳して合成することによって、前記学習用正常画像に対して擬似的にブロックノイズを生じさせた疑似異常画像を、ブロックノイズを検出する為の学習モデルの学習に用いる教師データとして生成する教師データ生成手段と、
して機能させる為のコンピュータプログラムであって、
前記疑似ブロックノイズ画像生成手段は、ノイズ領域とするブロック形状のサイズ、位置、ノイズ領域の色及び透過率を夫々設定して前記疑似ブロックノイズ画像を生成するコンピュータプログラム。 computer,
normal image acquisition means for acquiring a normal image for learning without block noise;
pseudo block noise image generation means for generating a pseudo block noise image that is a block noise image in which a predetermined block-shaped area is pseudo-set as a noise region;
In order to detect block noise, a pseudo-abnormal image is generated in which block noise is pseudo-generated in the normal image for learning by superimposing and composing the pseudo-block noise image on the normal image for learning. a teacher data generation means for generating teacher data to be used for learning the learning model;
A computer program for functioning as
The pseudo block noise image generation means is a computer program that generates the pseudo block noise image by setting the size and position of a block shape to be a noise region, the color and transmittance of the noise region, respectively.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020050353A JP7452149B2 (en) | 2020-03-20 | 2020-03-20 | Learning device and computer program for block noise detection |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020050353A JP7452149B2 (en) | 2020-03-20 | 2020-03-20 | Learning device and computer program for block noise detection |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2021149719A JP2021149719A (en) | 2021-09-27 |
| JP7452149B2 true JP7452149B2 (en) | 2024-03-19 |
Family
ID=77849137
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020050353A Active JP7452149B2 (en) | 2020-03-20 | 2020-03-20 | Learning device and computer program for block noise detection |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7452149B2 (en) |
Families Citing this family (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN118414640A (en) * | 2021-12-23 | 2024-07-30 | 文塔纳医疗系统公司 | Adversarial robustness of deep learning models in digital pathology |
| JP7693574B2 (en) | 2022-02-01 | 2025-06-17 | 株式会社東芝 | Data processing device, data processing system, and data processing method |
| JP7339394B1 (en) | 2022-05-20 | 2023-09-05 | 株式会社日立ハイテクフィールディング | Information processing device, information processing method, and program |
| JP7748503B2 (en) * | 2023-09-27 | 2025-10-02 | キヤノン株式会社 | Image processing device, image processing method, and program |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010009518A (en) | 2008-06-30 | 2010-01-14 | Canon Inc | Learning device, learning method and program for pattern detector |
| JP2010152751A (en) | 2008-12-25 | 2010-07-08 | Nec Corp | Statistic model learning device, statistic model learning method and program |
| JP2011217010A (en) | 2010-03-31 | 2011-10-27 | Sony Corp | Coefficient learning apparatus and method, image processing apparatus and method, program, and recording medium |
| JP2014135014A (en) | 2013-01-11 | 2014-07-24 | Fuji Xerox Co Ltd | Image identification device and program |
| JP2016057918A (en) | 2014-09-10 | 2016-04-21 | キヤノン株式会社 | Image processing device, image processing method, and program |
| WO2018105195A1 (en) | 2016-12-07 | 2018-06-14 | 三菱電機株式会社 | Video failure detection device, video failure detection method, and program |
-
2020
- 2020-03-20 JP JP2020050353A patent/JP7452149B2/en active Active
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010009518A (en) | 2008-06-30 | 2010-01-14 | Canon Inc | Learning device, learning method and program for pattern detector |
| JP2010152751A (en) | 2008-12-25 | 2010-07-08 | Nec Corp | Statistic model learning device, statistic model learning method and program |
| JP2011217010A (en) | 2010-03-31 | 2011-10-27 | Sony Corp | Coefficient learning apparatus and method, image processing apparatus and method, program, and recording medium |
| JP2014135014A (en) | 2013-01-11 | 2014-07-24 | Fuji Xerox Co Ltd | Image identification device and program |
| JP2016057918A (en) | 2014-09-10 | 2016-04-21 | キヤノン株式会社 | Image processing device, image processing method, and program |
| WO2018105195A1 (en) | 2016-12-07 | 2018-06-14 | 三菱電機株式会社 | Video failure detection device, video failure detection method, and program |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2021149719A (en) | 2021-09-27 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7452149B2 (en) | Learning device and computer program for block noise detection | |
| US12005922B2 (en) | Toward simulation of driver behavior in driving automation | |
| Li et al. | Lane changing intention recognition based on speech recognition models | |
| JP5911165B2 (en) | Image recognition device | |
| KR20190128724A (en) | Target recognition methods, devices, storage media and electronic devices | |
| CN115205335A (en) | Pedestrian trajectory prediction method and device and electronic equipment | |
| CN111323033B (en) | Path guidance device and control method thereof, information processing server, and path guidance system | |
| JP2011034273A (en) | Driving support system, driving support device, driving support method, and driving support program | |
| CN112308005A (en) | GAN-based traffic video saliency prediction method | |
| Castorena et al. | A safety-oriented framework for sound event detection in driving scenarios | |
| CN113497926A (en) | Intelligent correction of visual defects | |
| JP2019086475A (en) | Learning program, detection program, learning method, detection method, learning device, and detection device | |
| JP7552727B2 (en) | Driving evaluation system, learning device, evaluation result output device, method and program | |
| Lee et al. | Linking the detection response task and the attend algorithm through assessment of human–machine interface workload | |
| CN110189242B (en) | Image processing method and device | |
| CN114296680B (en) | Virtual test driving device, method and storage medium based on facial image recognition | |
| US20240129211A1 (en) | Apparatus for Predicting Traffic Speed and Method Thereof | |
| US20250108833A1 (en) | Autonomous driving using predictions of trust | |
| CN117593725A (en) | Vehicle collision detection method, electronic device, and computer-readable storage medium | |
| CN118298251A (en) | Image recognition method and device based on multi-data source target detection model | |
| EP3691297A1 (en) | Test arrangement and test method | |
| CN117216717A (en) | Driving scene prediction methods, devices, computer equipment, storage media and products | |
| JP2024122435A (en) | Wave image recognition utilization method, wave image recognition utilization program, wave image recognition utilization system, and wave image recognition ship steering simulator | |
| JP7167850B2 (en) | Apparatus for generating trained model set for person determination, generation method, generation program, person region determination apparatus, determination method, and determination program | |
| CN116259039A (en) | A parameter calibration method for driving risk model of autonomous vehicles |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20210423 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221214 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230907 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231017 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231121 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240206 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240219 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7452149 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |