JP7748503B2 - Image processing device, image processing method, and program - Google Patents
Image processing device, image processing method, and programInfo
- Publication number
- JP7748503B2 JP7748503B2 JP2024090281A JP2024090281A JP7748503B2 JP 7748503 B2 JP7748503 B2 JP 7748503B2 JP 2024090281 A JP2024090281 A JP 2024090281A JP 2024090281 A JP2024090281 A JP 2024090281A JP 7748503 B2 JP7748503 B2 JP 7748503B2
- Authority
- JP
- Japan
- Prior art keywords
- parameter
- image
- image processing
- cpu
- noise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Image Processing (AREA)
Description
本発明は、画像処理装置、画像処理方法、及び、プログラムに関するものである。 The present invention relates to an image processing device, an image processing method, and a program.
監視市場における超低照度環境では、ターゲットとする被写体の視認性の向上が求められており、カメラによる撮影時には非常に高いゲインが適用される。高いゲインを適用すると撮影画像を明るくできる一方でノイズが増えてしまうことにはなるが、鑑賞用途としての画質を犠牲にしてでも、監視用途では被写体の視認性が重視される。 In the surveillance market, where extremely low-light environments require improved visibility of target subjects, very high gain is applied when capturing images with cameras. While applying high gain brightens the captured image, it also increases noise. However, for surveillance applications, subject visibility is important, even at the expense of image quality for viewing purposes.
撮影画像に含まれるノイズを低減するためにノイズリダクション(以下NR)が一般的に用いられてきた。NRはカメラ内部で処理されたり、カメラ外部の画像処理装置でカメラからの画像を入力して処理する実施形態がある。また、近年は深層学習による人工知能技術にもとづくノイズリダクション処理(以下DLNR)が用いられてきた。DLNRは従来のNRと比較して高い効果が確認されている。 Noise reduction (hereinafter referred to as NR) has been commonly used to reduce noise contained in captured images. NR can be performed inside the camera, or in some cases, images from the camera are input and processed by an external image processing device. In recent years, noise reduction processing based on deep learning artificial intelligence technology (hereinafter referred to as DLNR) has also come into use. DLNR has been shown to be more effective than conventional NR.
ところで撮影画像に対する各種画像処理機能は様々な画像処理を複数組み合わせることにより構成されており、各画像処理で使用されるパラメータも様々である。様々なシーンの撮影に対し最適な画像処理効果を得るために画像処理機能、及び、パラメータの組み合わせをシーンごとに保持するなどして対応してきた。 By the way, various image processing functions for captured images are made up of a combination of various image processing methods, and the parameters used for each image processing method vary. In order to obtain the optimal image processing effect for capturing various scenes, we have responded by storing image processing functions and parameter combinations for each scene.
特許文献1では、二つの補間画像から勾配変化によって双方向勾配変化処理を用いて予測画像を生成する。したがって、第一の状態から第二の状態に対して画像が遷移したように視聴者に見せることが可能になる。 In Patent Document 1, a predicted image is generated from two interpolated images using bidirectional gradient change processing based on gradient change. This makes it possible for the viewer to see the image transition from a first state to a second state.
特許文献2の技術は、シーン切替時に急激な画質変動が少なく違和感を感じにくいような画質調整をするために、パラメータ群Aからパラメータ群Bにかけて段階的に変化させる。特許文献2は、画像処理機能、及び、パラメータの例として、明度、シャープネス、色相、彩度などを挙げている。 The technology in Patent Document 2 gradually changes parameters from group A to group B in order to adjust image quality so that there are fewer sudden fluctuations in image quality and less sense of discomfort when switching scenes. Patent Document 2 lists brightness, sharpness, hue, saturation, etc. as examples of image processing functions and parameters.
しかしながら、DLNRにおけるパラメータを切り替える際、画像にショックが発生することがあった。特許文献1においては、二つの画像から補間画像を生成する場合は実際の画像とは異なる画像を予測生成することとなり、予測が実際と異なる場合に画像にショックが生じてしまう。また、特許文献2においては、遷移前Aから遷移後Bにかけて補間して適用するのみでは、画像に違和感のあるパラメータを経由して遷移する場合がある。DLNRで用いられるような学習済モデルのような段階変化が困難なパラメータに関する開示がなかった。 However, when switching parameters in DLNR, shocks can occur in the image. In Patent Document 1, when generating an interpolated image from two images, an image that differs from the actual image is predicted and generated, and shock can occur in the image if the prediction differs from the actual image. Furthermore, in Patent Document 2, simply applying interpolation from pre-transition A to post-transition B can result in the image transitioning via parameters that make the image look unnatural. There was no disclosure of parameters that are difficult to change in stages, such as those in trained models used in DLNR.
そこで本発明は、DLNRなどの学習済みモデルのパラメータまたはノイズを低減するための強度パラメータなどを切り替える際のショックを低減させて、滑らかなNR効果が適用された高品位な画像を提供することを目的とする。 The present invention aims to provide high-quality images with a smooth NR effect by reducing the shock that occurs when switching parameters of a trained model such as DLNR or intensity parameters for noise reduction.
この課題を解決するため、例えば本発明の画像処理装置は以下の構成を備える。すなわち、 画像のノイズ特性を学習することによって得たニューラルネットワークのネットワークパラメータである第一のパラメータを有する学習済みモデルによって、取得した入力画像を画像処理する画像処理手段と、
前記画像処理された入力画像のノイズを強調して低減するための強度パラメータである第二のパラメータによって前記ノイズを低減するノイズ低減手段と、
前記入力画像と前記ノイズが低減された入力画像とを第三のパラメータに基づいて合成する合成手段と、
前記第一のパラメータ、前記第二のパラメータ、及び、前記第三のパラメータのいずれかを変更する場合、順次取得する複数の入力画像にわたって変更対象のパラメータを、ユーザの選択に応じた目標値に近づけるための制御量または予め設定された参照データに基づいて変更して設定する設定手段と、
を備える。
To solve this problem, for example, an image processing device of the present invention comprises the following configuration: image processing means for performing image processing on an acquired input image using a trained model having first parameters, which are network parameters of a neural network obtained by training noise characteristics of the image;
a noise reduction means for reducing the noise in the image-processed input image using a second parameter, which is an intensity parameter for emphasizing and reducing the noise ;
a synthesis means for synthesizing the input image and the noise-reduced input image based on a third parameter;
a setting means for changing and setting the parameter to be changed across a plurality of input images acquired sequentially, when changing any of the first parameter, the second parameter, and the third parameter, based on a control amount for bringing the parameter closer to a target value selected by a user or preset reference data;
Equipped with.
本発明によれば、DLNRなどの画像処理をする学習済みモデルのパラメータまたはノイズを低減するための強度パラメータなどのパラメータを切り替える際の画像のショックを低減し、滑らかなNR効果が適用され高品位な画像を提供することができる。 This invention reduces the shock to the image when switching parameters of a trained model that performs image processing such as DLNR or parameters such as intensity parameters for noise reduction, and applies a smooth NR effect to provide high-quality images.
以下、添付図面を参照して実施形態を詳しく説明する。尚、以下の実施形態は特許請求の範囲に係る発明を限定するものでない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。 The following describes the embodiments in detail with reference to the attached drawings. Note that the following embodiments do not limit the scope of the claimed invention. Although the embodiments describe multiple features, not all of these features are necessarily essential to the invention, and multiple features may be combined in any desired manner. Furthermore, in the attached drawings, the same reference numbers are used to designate identical or similar components, and redundant explanations will be omitted.
以下、本実施形態について説明する。本実施形態では、接続されたカメラからの入力画像からノイズを推定し、ニューラルネットワーク(以下NN)を用いて所望の出力画像を推論し推論された画像を出力する画像処理装置を例に挙げる。画像は、映像、静止画、動画、動画の1フレームの画像などを含む。NNの学習では、複数の生徒画像とそれに対応する複数の教師画像とを用意する。次に、生徒画像の特徴分布を教師画像の特徴分布に近づけるなどの学習が行われて、重みやバイアスなどのネットワークパラメータが最適化される。これにより、学習されていない入力画像に対しても精度よい推論が可能となる。カメラの特性に応じて複数の学習を実施して得られた学習済みパラメータを保持することで、入力画像に対する推論を行ってノイズが低減された推論画像を取得することができる。 This embodiment will be described below. In this embodiment, an image processing device is used as an example, which estimates noise from an input image from a connected camera, infers a desired output image using a neural network (NN), and outputs the inferred image. Images include video, still images, videos, and images of one frame of a video. In NN training, multiple student images and multiple corresponding teacher images are prepared. Next, training is performed to bring the feature distribution of the student images closer to the feature distribution of the teacher images, and network parameters such as weights and biases are optimized. This enables accurate inference even for untrained input images. By retaining trained parameters obtained by performing multiple training sessions according to the camera's characteristics, it is possible to perform inference on the input image and obtain an inferred image with reduced noise.
<第1実施形態>
図1は、画像処理装置100の構成を示すブロック図である。なお、本実施形態では画像処理装置について説明するが、後述する処理はレンズ交換式ビデオカメラや一眼レフカメラ、ミラーレス一眼カメラなどのレンズ交換式のカメラにおいても行うことができる。例えば、後述する処理は、図1のカメラ200内の制御装置においても実施することができる。
First Embodiment
1 is a block diagram showing the configuration of an image processing device 100. Note that, although an image processing device will be described in this embodiment, the processing described below can also be performed in a camera with interchangeable lenses, such as a video camera with interchangeable lenses, a single-lens reflex camera, or a mirrorless single-lens camera. For example, the processing described below can also be performed in a control device within the camera 200 shown in FIG. 1.
図1において、カメラ200は、被写界から入射した光束を撮像して画像を生成する。カメラ200は、不図示のレンズを装着あるいは内蔵し、ズームレンズ群やフォーカスレンズ群、アイリス機構などを備える。カメラ200は、露光する蓄積時間を変更でき、自動露出機能によって暗所撮影においては撮像した画像にゲインを適用することができる。カメラ200は、撮像した画像を画像処理装置100へ送出する。画像処理装置100は、画像入力部110を介して、画像を取得する。 In FIG. 1, camera 200 captures a light beam incident from the subject field to generate an image. Camera 200 is equipped with or has built-in lenses (not shown), and is equipped with a group of zoom lenses, a group of focus lenses, an iris mechanism, etc. Camera 200 can change the exposure accumulation time, and an auto-exposure function can apply gain to the captured image when capturing in a dark place. Camera 200 sends the captured image to image processing device 100. Image processing device 100 acquires the image via image input unit 110.
画像処理装置100は、画像入力部110と、バス120と、CPU130と、メモリ140と、操作入力部150と、画像処理部160と、画像出力部170と、を備える。画像入力部110、CPU130、メモリ140、操作入力部150、画像処理部160、及び、画像出力部170は、バス120を介して、互いにデータを送受信可能に接続されている。CPU130あるいは画像処理部160は、プログラムを実行することによって、画像処理装置100で実行される後述の画像処理などの各種処理を実行し、各種機能を実現する。例えば、CPU130、及び、画像処理部160は、プログラムを実行することによって、学習済みモデル、ノイズ低減手段、合成手段、設定手段、画像合成手段などの機能を実現する。 The image processing device 100 comprises an image input unit 110, a bus 120, a CPU 130, a memory 140, an operation input unit 150, an image processing unit 160, and an image output unit 170. The image input unit 110, the CPU 130, the memory 140, the operation input unit 150, the image processing unit 160, and the image output unit 170 are connected via the bus 120 so that they can send and receive data with each other. The CPU 130 or the image processing unit 160 executes programs to perform various processes, such as the image processing described below, executed by the image processing device 100, and realize various functions. For example, the CPU 130 and the image processing unit 160 execute programs to realize functions such as a trained model, noise reduction means, synthesis means, setting means, and image synthesis means.
画像入力部110は、カメラ200から取得した入力画像を、バス120を介して、メモリ140または記憶部180に保存する。 The image input unit 110 stores the input image acquired from the camera 200 in the memory 140 or the storage unit 180 via the bus 120.
操作入力部150は、画像処理装置100の外部のコントローラ300から入力された操作信号を取得する。コントローラ300は、スイッチ、キーボード、マウス、タッチパネルなどを有する。ユーザは、コントローラ300を介して、画像処理装置100に操作信号を入力する。 The operation input unit 150 acquires operation signals input from a controller 300 external to the image processing device 100. The controller 300 includes switches, a keyboard, a mouse, a touch panel, etc. The user inputs operation signals to the image processing device 100 via the controller 300.
CPU130は、記憶部180に記憶されたプログラム、及び、パラメータに基づいて、画像処理など種々の処理を実行する。CPU130は、操作入力部150が取得した操作信号に基づいて、各種の処理を実行する。例えば、CPU130は、画像処理部160にて実行される画像処理に必要な設定処理を実行する。画像処理装置100は、CPU130に加えて、MPU(Micro Processing Unit)、GPU(Graphics Processing Unit)、QPU(Quantum Processing Unit)などの他のプロセッサーを有してもよい。 The CPU 130 executes various processes, such as image processing, based on the programs and parameters stored in the storage unit 180. The CPU 130 executes various processes based on operation signals acquired by the operation input unit 150. For example, the CPU 130 executes setting processes required for image processing executed by the image processing unit 160. In addition to the CPU 130, the image processing device 100 may have other processors, such as an MPU (Micro Processing Unit), GPU (Graphics Processing Unit), or QPU (Quantum Processing Unit).
メモリ140は、CPU130がプログラムを実行する際にワークエリアとして機能する。また、メモリ140は、CPU130がプログラムを実行する際に必要なパラメータなどを一時的に保持する。メモリ140は、RAM(Random Access Memory)であってよい。 Memory 140 functions as a work area when CPU 130 executes a program. Memory 140 also temporarily stores parameters and other data required when CPU 130 executes a program. Memory 140 may be RAM (Random Access Memory).
画像処理部160は、メモリ140または記憶部180に記憶された画像を読み出して、後述するノイズ推定処理、画像信号合成処理、NR処理及びユーザインタフェース(以下、UI)に表示するためのUI画像生成処理などの画像に関する種々の処理を実行する。画像処理部160は、各種の処理を実行した画像をメモリ140または記憶部180に格納する。画像処理部160は、例えば、GPU(Graphics Processing Unit)などのプロセッサーを有してよい。また、画像処理部160は、プログラムを実行するCPU130の機能の一部として実現されてもよい。 The image processing unit 160 reads images stored in the memory 140 or the storage unit 180 and performs various image-related processes, such as noise estimation processing, image signal synthesis processing, NR processing, and UI image generation processing for display on a user interface (hereinafter referred to as UI), which will be described later. The image processing unit 160 stores the images that have undergone various processes in the memory 140 or the storage unit 180. The image processing unit 160 may include a processor such as a GPU (Graphics Processing Unit). The image processing unit 160 may also be implemented as part of the functions of the CPU 130 that executes programs.
画像出力部170は、画像処理部160によって処理されてメモリ140または記憶部180に保持された画像を画像処理装置100の外部へ出力する。画像出力部170は、画像処理装置100が備えるHDMI(登録商標)(High Definition Multimedia Interface)端子、または、SDI(Serial Digital Interface)端子から出力用の画像信号を出力する。 The image output unit 170 outputs images processed by the image processing unit 160 and stored in the memory 140 or the storage unit 180 to the outside of the image processing device 100. The image output unit 170 outputs an image signal for output from an HDMI (registered trademark) (High Definition Multimedia Interface) terminal or an SDI (Serial Digital Interface) terminal provided on the image processing device 100.
記憶部180は、CPU130が実行するプログラム、及び、プログラムに必要なパラメータなどを記憶する。記憶部180は、カメラ200から取得した画像及び画像処理部160が画像処理した画像などを記憶する。記憶部180は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、及び、ROM(Read Only Memory)などの不揮発性の記憶装置を有する。 The storage unit 180 stores programs executed by the CPU 130, parameters required for the programs, and the like. The storage unit 180 stores images acquired from the camera 200 and images processed by the image processing unit 160. The storage unit 180 has non-volatile storage devices such as an HDD (Hard Disk Drive), an SSD (Solid State Drive), and a ROM (Read Only Memory).
モニタ400は、画像処理装置100が出力した画像を受信して表示する。撮影者、及び、視聴者などのユーザは、カメラ200の撮像画像、及び、画像処理装置100のメニュー画面、及び、画像処理後の画像などを、モニタ400を通じて確認することができる。モニタ400は、例えば、液晶表示装置、有機EL(Electro Luminescence)表示装置などであってよい。 The monitor 400 receives and displays the image output by the image processing device 100. Users such as the photographer and viewers can view the image captured by the camera 200, the menu screen of the image processing device 100, and the image after image processing through the monitor 400. The monitor 400 may be, for example, a liquid crystal display device or an organic EL (Electro Luminescence) display device.
なお、図1では、機能ごとに構成要素として分けて示しているが、これらは1つまたは複数のASIC(Application Specific Integrated Circuit)、プログラマブルロジックアレイ(PLA)、FPGA(Field Programmable Gate Array)等のハードウェアによって実現されてもよい。また、CPU、及び、MPU等のプログラマブルプロセッサがソフトウェアを実行することによって上述の各機能を実現してもよい。 Note that while Figure 1 shows each function as a separate component, these may be implemented using hardware such as one or more ASICs (Application Specific Integrated Circuits), programmable logic arrays (PLAs), or FPGAs (Field Programmable Gate Arrays). Furthermore, each of the above functions may be implemented by a programmable processor such as a CPU or MPU executing software.
次に、画像処理装置100においてCPU130が行う画像処理について、図2を用いて説明する。図2は、画像処理装置100が実行する画像処理のフローチャートである。画像処理装置100に電源が投入されると、CPU130は、記憶部180に格納されたコンピュータプログラムをロードして、図2のS100から順番に処理を実行する。なお、CPU130は、図2のS160まで処理を実行すると再びS110からループ処理することとなる。CPU130及び画像処理部160は、S110からS160までの処理を、カメラ200から順次取得する入力画像の1フレームごとまたは数フレームごとに実行する。なお、CPU130または画像処理部160のいずれかが各処理を実行するが、各処理を実行する主体は適宜変更してもよい。 Next, the image processing performed by the CPU 130 in the image processing device 100 will be described using Figure 2. Figure 2 is a flowchart of the image processing performed by the image processing device 100. When the image processing device 100 is powered on, the CPU 130 loads a computer program stored in the storage unit 180 and executes the processing in order from S100 in Figure 2. Note that once the CPU 130 has executed the processing up to S160 in Figure 2, it will again execute the loop processing from S110. The CPU 130 and image processing unit 160 execute the processing from S110 to S160 for each frame or every few frames of the input image sequentially acquired from the camera 200. Note that either the CPU 130 or the image processing unit 160 executes each process, but the entity that executes each process may be changed as appropriate.
図2のS100ではCPU130が画像処理装置100の初期化処理を行う。図3は、S100の初期化処理のサブルーチンのフローチャートを示す。 In S100 of Figure 2, the CPU 130 performs initialization processing of the image processing device 100. Figure 3 shows a flowchart of the subroutine for the initialization processing of S100.
図3のS101ではCPU130が画像入出力の初期化処理を実行する。CPU130は、画像処理装置100が画像入出力処理を実行できるように、画像入力部110、及び、画像出力部170を初期化する。 In S101 of Figure 3, the CPU 130 executes image input/output initialization processing. The CPU 130 initializes the image input unit 110 and the image output unit 170 so that the image processing device 100 can execute image input/output processing.
S102ではCPU130が画像処理機能の初期化処理を行う。CPU130は、画像処理部160が画像処理を実行できるように、画像処理部160を初期化する。例えば、CPU130は、後述する画像合成処理において、NR処理後の画像と入力画像との輝度信号合成処理や色信号合成処理を行うための初期設定を行う。例えば、CPU130は、画像処理のプログラム起動時においては、入力画像を加算比率100%として初期化処理を実施する。加算比率は、推論画像に輝度信号または色信号を合成する際に使用される比率である。 In S102, the CPU 130 performs initialization processing of the image processing function. The CPU 130 initializes the image processing unit 160 so that the image processing unit 160 can execute image processing. For example, the CPU 130 performs initial settings to perform luminance signal synthesis processing and color signal synthesis processing of the image after NR processing and the input image in the image synthesis processing described below. For example, when the image processing program is started, the CPU 130 performs initialization processing with the input image at an addition ratio of 100%. The addition ratio is the ratio used when synthesizing the luminance signal or color signal with the inference image.
S103ではCPU130がNR初期化処理を行う。CPU130は、画像処理部160で実行されるNR処理のためにあらかじめ事前学習された学習済みNNパラメータをロードして、画像処理部160の学習済みモデルに適用する。本実施形態は、画像処理装置100に接続されるカメラ200の様々な機種及びカメラ200の画質などを含む設定状態を想定している。カメラ200の様々な機種及びカメラ200の画質設定に関する情報は、カメラ200に関する情報の一例である。メモリ140または記憶部180は、カメラ200の機種ごと、及び、画質設定ごとに最適化した学習済みNNパラメータを保持している。 In S103, the CPU 130 performs NR initialization processing. The CPU 130 loads trained NN parameters that have been pre-trained in advance for the NR processing performed by the image processing unit 160, and applies them to the trained model of the image processing unit 160. This embodiment assumes various models of cameras 200 connected to the image processing device 100 and setting states including the image quality of the cameras 200. Information about the various models of cameras 200 and the image quality settings of the cameras 200 is an example of information about the camera 200. The memory 140 or storage unit 180 holds trained NN parameters optimized for each model of camera 200 and each image quality setting.
ここで、図4を用いて画像処理部160にロードされるNNについて説明する。図4は入力画像を処理するNNの説明図である。一例として、畳み込みNN(以降、CNNとする)を例にとるが、実施形態のNNはCNNに限定されるものではない。NNは、例えば、GAN(Generative Adversarial Network)などが用いられてもよいし、スキップコネクションなどを有してもよい。またNNは、RNN(Recurrent Neural Network)などのように再帰型であってもよい。 Here, the neural network (NN) loaded into the image processing unit 160 will be described using Figure 4. Figure 4 is an explanatory diagram of a neural network (NN) that processes an input image. As an example, a convolutional neural network (hereafter referred to as a CNN) is used, but the NN in this embodiment is not limited to a CNN. The NN may be, for example, a generative adversarial network (GAN) or may have skip connections. The NN may also be a recurrent type such as a recurrent neural network (RNN).
図4(a)において、入力画像501はNNに入力する画像または後述の特徴マップを表す。図4(a)の畳み込み行列503は、入力画像501に対して畳み込み演算502を行うフィルタである。バイアス504は、入力画像501と畳み込み行列503との畳み込み演算502によって出力された結果に加算される値である。特徴マップ505は、バイアス504が畳み込み演算502によって出力された結果に加算された後の畳み込み演算結果である。図4では、簡単のために各ニューロンや中間層、チャネル数が少なく描かれているが、ニューロンや層の数、またニューロン間の結合の数や重みなどは、この例に限定されるものではない。また、図4に示したNNがFPGAやASICなどに実装される際には、ニューロン間の結合や重みが削減されてもよい。 In Figure 4(a), input image 501 represents the image input to the NN or the feature map described below. Convolution matrix 503 in Figure 4(a) is a filter that performs convolution operation 502 on input image 501. Bias 504 is a value added to the result output by convolution operation 502 of input image 501 and convolution matrix 503. Feature map 505 is the result of the convolution operation after bias 504 is added to the result output by convolution operation 502. For simplicity, Figure 4 depicts a small number of neurons, hidden layers, and channels, but the number of neurons and layers, as well as the number and weights of connections between neurons, are not limited to this example. Furthermore, when the NN shown in Figure 4 is implemented in an FPGA, ASIC, etc., the connections and weights between neurons may be reduced.
CNNは、入力画像に対し、あるフィルタによって畳み込み演算を実行することで、入力画像の特徴マップを得る。なお、フィルタの大きさは任意である。次の層では、前層の特徴マップに対し、別のフィルタによる畳み込み演算を実行することで、異なる特徴マップが得られる。また各層では、ある入力信号をフィルタと掛け合わせ、バイアスとの和が求められる。そして、その結果に対して活性化関数が適用されることにより、各ニューロンにおける出力信号が得られる。各層における重みとバイアスがNNパラメータと呼ばれ、学習ではNNパラメータを更新する処理が行われる。また活性化関数の例としては、シグモイド関数やReLU関数などが知られており、本実施形態では以下の式(1)に示すLeaky ReLU関数が用いられるが、これに限定されるものではない。なお、式(1)において、maxは、引数のうち最大値を出力する関数を表す。
f(x)=max(x,x×0.2) 式(1)
前述の通り、NNパラメータを得るための事前学習では、カメラ200のノイズ特性をもった画像が生徒画像として用いられ、対応する生徒画像のノイズが無い画像が教師画像として用いられる。生徒画像と教師画像とをペアにした学習が実施されて、NRが実現される。
A CNN obtains a feature map of an input image by performing a convolution operation on the input image using a filter. The size of the filter can be arbitrary. In the next layer, a different feature map is obtained by performing a convolution operation on the feature map of the previous layer using a different filter. In each layer, an input signal is multiplied by a filter and summed with a bias. An activation function is then applied to the result to obtain an output signal for each neuron. The weights and biases in each layer are called NN parameters, and the NN parameters are updated during training. Examples of activation functions include the sigmoid function and the ReLU function. In this embodiment, the Leaky ReLU function shown in the following equation (1) is used, but this is not limited to this. In equation (1), max represents a function that outputs the maximum value among its arguments.
f(x)=max(x, x×0.2) Formula (1)
As described above, in the pre-learning to obtain the NN parameters, an image having the noise characteristics of the camera 200 is used as a student image, and a corresponding noise-free image of the student image is used as a teacher image. Learning is performed using a pair of the student image and the teacher image, thereby realizing NR.
また、前述の特徴マップ505は、入力画像のノイズに着目したものであり、CNNは、特徴マップ505に別のパラメータを適用することで、ノイズ成分を強調した着目領域を学習することができる。図4(b)に示すように、CNNは、入力画像501を例えば色ごとにチャンネルとして分けた入力画像601のチャンネル方向に平均をとった中間層602を生成する。CNNは、中間層602に対し式(1)で複数回の畳み込みを行って中間層603を得る。さらにCNNは、出力チャンネルが1となるように畳み込みを行って、アテンション層604を得る。アテンション層604は被写体の高周波成分を除くノイズ領域に特徴量が出現する中間層である。CNNは、アテンション層604にノイズの強度パラメータ605を乗算することによって、ノイズが強調されたアテンション層606を得る。アテンション層606と上述の入力画像501とが一緒に畳み込まれることで、入力画像501及び入力画像601のうち、入力画像に含まれるノイズ領域の着目度合いが調節すなわち強調されて、NR処理可能なNNとすることができる。 The aforementioned feature map 505 focuses on noise in the input image, and the CNN can learn a region of interest that emphasizes noise components by applying a different parameter to the feature map 505. As shown in Figure 4(b), the CNN generates an intermediate layer 602 by averaging the channel-wise average of input image 601, which is obtained by dividing the input image 501 into channels, for example, by color. The CNN performs multiple convolutions on intermediate layer 602 using equation (1) to obtain intermediate layer 603. The CNN further performs convolutions so that the output channel is 1 to obtain attention layer 604. Attention layer 604 is an intermediate layer in which features appear in noise regions excluding high-frequency components of the subject. The CNN multiplies attention layer 604 by a noise intensity parameter 605 to obtain attention layer 606, in which noise is emphasized. By convolving the attention layer 606 with the above-mentioned input image 501 together, the degree of attention paid to noise regions contained in the input images 501 and 601 is adjusted, i.e., emphasized, resulting in a neural network capable of noise reduction processing.
図3の説明に戻る。S104ではCPU130が操作入力初期化を行う。CPU130は、画像処理装置100の外部のコントローラ300からの操作信号を入力するための初期化処理を実行する。また、画像処理装置100は、NR機能のメニューを表示可能な機能を備えている。CPU130は、ユーザによるコントローラ300からの入力によって、NR機能の有効・無効を切り替えることができる。また、CPU130は、NRモード設定としてオートモードまたはマニュアルモードを切り替えることができ、マニュアルモードの場合は、NRの強度を設定するためのNR強度メニュー設定画面を表示させることが可能である。CPU130は、本初期化処理の例として、NR有効・無効を有効に設定し、NRモード設定としてオートモードを設定する。CPU130がS104を実行したあとはサブルーチンS100を終了し、図2のS110へ進む。 Returning to the explanation of FIG. 3, in S104, the CPU 130 performs operation input initialization. The CPU 130 executes initialization processing to input operation signals from the controller 300 external to the image processing device 100. The image processing device 100 also has a function capable of displaying a menu for the NR function. The CPU 130 can switch the NR function between enabled and disabled based on user input from the controller 300. The CPU 130 can also switch the NR mode setting between auto mode and manual mode, and in manual mode, can display an NR intensity menu setting screen for setting the NR intensity. As an example of this initialization processing, the CPU 130 sets NR enabled/disabled to enabled and sets the NR mode setting to auto mode. After the CPU 130 executes S104, it ends the subroutine S100 and proceeds to S110 in FIG. 2.
図2のS110ではCPU130は、画像入力部110がカメラ200から受信した入力画像を、メモリ140に記憶する。 In S110 of Figure 2, the CPU 130 stores the input image received by the image input unit 110 from the camera 200 in the memory 140.
S120ではCPU130が画像処理設定を行う。図5は、S120の画像処理設定のサブルーチンのフローチャートを示す。 In S120, the CPU 130 performs image processing settings. Figure 5 shows a flowchart of the image processing setting subroutine in S120.
S121では、コントローラ300、及び、操作入力部150を通じて入力した情報に基づいて、CPU130は、画像処理装置100に接続されたカメラ200の機種を選択し設定する。なお、CPU130は、画像処理装置100の設定メニューなどからユーザが選択した情報に基づいてカメラ200の機種を選択してもよく、画像入力部110が画像信号に埋め込まれた情報から自動で検出した情報に基づいてカメラ200の機種を選択してもよい。 In S121, the CPU 130 selects and sets the model of the camera 200 connected to the image processing device 100 based on information input via the controller 300 and the operation input unit 150. Note that the CPU 130 may select the model of the camera 200 based on information selected by the user from a setting menu of the image processing device 100, or may select the model of the camera 200 based on information automatically detected by the image input unit 110 from information embedded in the image signal.
S122ではS121と同様に、CPU130が画像処理装置100に接続されたカメラ200で適用されているガンマを選択する。なお、CPU130は、画像処理装置100の設定メニューなどからユーザが選択した情報に基づいてガンマを選択してもよく、画像入力部110が画像信号に埋め込まれた情報から自動で検出した情報に基づいてガンマを選択してもよい。 In S122, similar to S121, the CPU 130 selects the gamma applied by the camera 200 connected to the image processing device 100. Note that the CPU 130 may select the gamma based on information selected by the user from a setting menu of the image processing device 100, or may select the gamma based on information automatically detected by the image input unit 110 from information embedded in the image signal.
S123ではCPU130が、S121においてカメラの機種が変更されたか、あるいは、S122においてガンマの選択が変更されたかを判定する。CPU130は、変更された場合はS124へと進み、変更されていない場合はS125へと進む。 In S123, the CPU 130 determines whether the camera model was changed in S121 or whether the gamma selection was changed in S122. If the gamma selection was changed, the CPU 130 proceeds to S124; if the gamma selection was not changed, the CPU 130 proceeds to S125.
S124ではCPU130がS121及びS122で選択されたカメラ200の機種、及び、ガンマに応じた学習済みNNパラメータを画像処理部160にロードして設定する。これにより、画像処理部160にロードされた前述のNNが、接続されたカメラ200、及び、そのガンマ設定に応じて学習された適切なNNパラメータをもつNNとなる。S124ではNNで推論、すなわち画像処理部160がNR処理するための画像をメモリ140からロードして処理できる状態となる。 In S124, the CPU 130 loads and sets the trained NN parameters corresponding to the model and gamma of the camera 200 selected in S121 and S122 into the image processing unit 160. As a result, the NN loaded into the image processing unit 160 becomes an NN with appropriate NN parameters trained according to the connected camera 200 and its gamma setting. In S124, the NN performs inference, i.e., the image processing unit 160 loads the image for NR processing from memory 140 and is ready for processing.
図5のS125ではCPU130がNRモードの選択を行う。CPU130は、コントローラ300から操作入力部150を通じてユーザなどによって選択メニューなどを介して入力された操作信号によってNRモードを選択する。例えば、CPU130は、ユーザが入力した操作信号に基づいて、NRモードとして、オートモードまたはマニュアルモードのいずれかを選択して設定する。NRモードの処理の詳細はS140及びS150にて後述する。CPU130は、S125を実行すると、サブルーチンのS120を終了し、図2のステップS130へと進む。 In S125 of FIG. 5, the CPU 130 selects the NR mode. The CPU 130 selects the NR mode based on an operation signal input from the controller 300 via the operation input unit 150 by the user via a selection menu or the like. For example, the CPU 130 selects and sets either the auto mode or the manual mode as the NR mode based on the operation signal input by the user. Details of the NR mode processing will be described later in S140 and S150. After executing S125, the CPU 130 ends the subroutine S120 and proceeds to step S130 of FIG. 2.
図2のS130では画像処理部160がS110で取得した入力画像に対してノイズ推定処理を行う。図6は、S130のノイズ推定処理のサブルーチンのフローチャートを示す。 In S130 of Figure 2, the image processing unit 160 performs noise estimation processing on the input image acquired in S110. Figure 6 shows a flowchart of the noise estimation processing subroutine of S130.
図6のS131ではCPU130が、入力画像をノイズ検出対象領域とし、ノイズ検出対象領域をブロックで分割する。なお、本実施形態では入力画像の全体をノイズ検出対象領域として説明するが、CPU130は、入力画像のうち一部の領域をノイズ検出対象領域としてもよい。例えば、CPU130は、入力画像のうち、3×3画素を1つのブロックとしてもよい。 In S131 of FIG. 6, the CPU 130 sets the input image as a noise detection target region and divides the noise detection target region into blocks. Note that in this embodiment, the entire input image is described as the noise detection target region, but the CPU 130 may set a partial region of the input image as the noise detection target region. For example, the CPU 130 may set 3 x 3 pixels of the input image as one block.
次にS132ではCPU130が、各分割領域としてのブロックの輝度、及び、ノイズ分散を算出する。 Next, in S132, the CPU 130 calculates the luminance and noise variance of each block in each divided region.
次にS133ではCPU130が、ノイズ検出領域におけるノイズ分散の平坦部の領域を抽出する。図7は、平坦部領域の抽出の例を説明する図である。具体的には、CPU130は、各ブロックのノイズ分散値が閾値以下であるか否かに基づいて平坦部を抽出する。例えば、CPU130は、図7に示すようにブロックのノイズ分散が閾値以下である場合には平坦部と判定して当該ブロックに1をセットする。一方、CPU130は、ブロックのノイズ分散が閾値以上である場合は平坦部ではないと判定して当該ブロックに0をセットする。上述のブロック単位で被写体のテクスチャー情報など輝度差が含まれる場合、当該輝度差がノイズ分散値として算出されることとなり、CPU130は、正しくノイズ推定することが困難である。 Next, in S133, the CPU 130 extracts flat areas of noise variance in the noise detection area. Figure 7 is a diagram illustrating an example of flat area extraction. Specifically, the CPU 130 extracts flat areas based on whether the noise variance value of each block is below a threshold. For example, as shown in Figure 7, if the noise variance of a block is below the threshold, the CPU 130 determines that the block is a flat area and sets the block to 1. On the other hand, if the noise variance of a block is above the threshold, the CPU 130 determines that the block is not a flat area and sets the block to 0. If the above-mentioned blocks contain brightness differences, such as texture information of the subject, the brightness differences will be calculated as the noise variance value, making it difficult for the CPU 130 to accurately estimate noise.
S134ではCPU130が、平坦部と判定されたブロックに限定して輝度対ノイズ分散の統計値を収集し、輝度対ノイズ分散特性をプロットする。これにより、CPU130は、上述のブロック単位で被写体のテクスチャー情報など輝度差が含まれる場合であっても、当該輝度差がノイズ分散値として算出されることを抑制して、精度よくノイズを推定することができる。 In S134, the CPU 130 collects statistical values of luminance versus noise variance limited to blocks determined to be flat areas, and plots the luminance versus noise variance characteristics. As a result, even if luminance differences such as texture information of the subject are included in the above-mentioned block units, the CPU 130 can prevent the luminance differences from being calculated as noise variance values, thereby enabling accurate noise estimation.
S135ではCPU130が、現在設定されているガンマ特性に対応したノイズ分散特性データをロードする。本ノイズ分散特性データは、接続されたカメラ200の機種、及び、設定されたガンマにおいて、あらかじめゲインごとに輝度対ノイズ分散特性を測定するなどして記憶部180に格納されている。図8は、カメラ200の設定別のノイズ分散特性の例を示す図である。例えば、記憶部180は、図8(a)及び図8(b)に示すような輝度及びゲインに関連付けられたノイズ分散特性を含むテーブルデータをノイズ分散特性として保持する。 In S135, the CPU 130 loads noise variance characteristic data corresponding to the currently set gamma characteristics. This noise variance characteristic data is stored in the memory unit 180 by measuring the luminance-to-noise variance characteristic for each gain in advance for the model of the connected camera 200 and the set gamma. Figure 8 is a diagram showing examples of noise variance characteristics for different camera 200 settings. For example, the memory unit 180 stores table data as noise variance characteristics, including noise variance characteristics associated with luminance and gain, as shown in Figures 8(a) and 8(b).
図6のS136ではCPU130が、S135でロードしたノイズ分散特性テーブルが持つ各ゲインにおけるノイズ分散特性を選択して参照する。 In S136 of Figure 6, the CPU 130 selects and references the noise dispersion characteristics for each gain contained in the noise dispersion characteristics table loaded in S135.
S137ではCPU130が、S134でプロットした各輝度における分散値に対し、S136で選択したゲインに応じたノイズ分散特性データの距離を測定し特性一致判定を行う。このとき任意の閾値以下の場合に一致判定をしてもよい。S137でノイズ分散特性が一致しない、すなわち偽の場合は、CPU130は、ステップ136に戻って、次のゲインにおけるノイズ分散特性データを参照して、ノイズ分散特性の一致判定を実施する。CPU130は、S137で一致と判定すると、すなわち真の場合はS138へと進む。 In S137, the CPU 130 measures the distance of the noise variance characteristic data corresponding to the gain selected in S136 relative to the variance value at each luminance plotted in S134, and performs a characteristic match determination. At this time, a match determination may be made if the distance is below an arbitrary threshold. If the noise variance characteristics do not match in S137, i.e., if the result is false, the CPU 130 returns to step 136 and references the noise variance characteristic data for the next gain to perform a noise variance characteristic match determination. If the CPU 130 determines a match in S137, i.e., if the result is true, the process proceeds to S138.
S138ではCPU130が、S136、及び、S137においてノイズ分散特性が一致すると判定したゲインを、画像処理装置100に入力されているゲインと推定する。 In S138, the CPU 130 estimates the gain for which it was determined in S136 and S137 that the noise variance characteristics match as the gain input to the image processing device 100.
カメラ200では様々なシーンが撮影され、画像処理装置100に入力される。図6で示したノイズ分散特性の推定は、検出対象とする領域をなるべく大きい面積で確保した方が望ましい。検出対象領域が広いほど、上述の平坦部ブロックの数が検出される確率を向上させることができる。その結果、図6のS134で集計される分散特性の情報を多くすることができる。 Various scenes are captured by the camera 200 and input to the image processing device 100. When estimating the noise variance characteristics shown in Figure 6, it is desirable to ensure that the detection target area is as large as possible. The larger the detection target area, the higher the probability of detecting the number of flat blocks described above. As a result, more variance characteristic information can be collected in S134 of Figure 6.
図6の説明に戻る。CPU130は、S138を実行すると、図6のS130サブルーチンを終了し、図2のS140へと進む。図2のS140では、CPU130が、画像処理変更制御を実行する。図9は、S140の画像処理変更制御のサブルーチンのフローチャートを示す。 Returning to the explanation of Figure 6, after executing S138, the CPU 130 ends the subroutine S130 in Figure 6 and proceeds to S140 in Figure 2. In S140 in Figure 2, the CPU 130 executes image processing change control. Figure 9 shows a flowchart of the subroutine for image processing change control in S140.
図9のS1401ではCPU130が、NRの有効または無効の選択を行う。CPU130は、コントローラ300から操作入力部150を通じてユーザなどによって入力された操作信号に基づいて、NRの有効または無効を選択してよい。また、CPU130は、ネットワークなどを介して、外部から入力された信号またはコマンドなどによってNRの有効または無効を選択してもよい。CPU130は、S1401が真すなわちNRが有効である場合はS1402へ進み、偽すなわちNRが無効である場合はS1409へと進む。 In S1401 of FIG. 9, the CPU 130 selects whether NR is enabled or disabled. The CPU 130 may select whether NR is enabled or disabled based on an operation signal input by a user or the like from the controller 300 via the operation input unit 150. The CPU 130 may also select whether NR is enabled or disabled based on a signal or command input from outside via a network or the like. If S1401 is true, i.e., NR is enabled, the CPU 130 proceeds to S1402, and if it is false, i.e., NR is disabled, the CPU 130 proceeds to S1409.
S1402ではCPU130が、図5のS125で選択したNRモードを判定する。CPU130は、S1402の判定において真すなわちNRモードがオートモードの場合はS1403へ進み、偽すなわちNRモードがマニュアルモードであればS1405へ進む。 In S1402, the CPU 130 determines the NR mode selected in S125 of Figure 5. If the determination in S1402 is true, i.e., the NR mode is auto mode, the CPU 130 proceeds to S1403; if the determination in S1402 is false, i.e., the NR mode is manual mode, the CPU 130 proceeds to S1405.
S1403すなわちNRモードがオートモードの場合、CPU130が図6のS138で推定した入力画像のゲインを取得する。 In S1403, i.e., when the NR mode is auto mode, the CPU 130 obtains the gain of the input image estimated in S138 of Figure 6.
S1404ではCPU130が、NRモードがオートモードの場合の目標値Aを設定する。ここでいう目標値Aとは、図4のノイズの強度パラメータ605に与える強調パラメータ、輝度信号加算比率、及び、色信号加算比率のそれぞれが目標とする値のことである。ゲインが高いほどノイズが多く含まれるので、CPU130は、S1403で取得したカメラ200の推定のゲインが高い場合、強調パラメータの目標値Aに高い値を設定する。一方、CPU130は、推定のゲインが低い場合は、強調パラメータの目標値Aに低い値を設定する。これにより、輝度信号加算比率、及び、色信号加算比率は、推定のゲインが高い場合は低い値が設定され、推定のゲインが低い場合は高い値が設定される。特にカメラ200のゲインが高い場合には色ノイズが画像品質に影響を与える場合がある。このように推定のゲインが高い場合、CPU130は、色信号加算比率を無しとしてもよい。 In S1404, the CPU 130 sets a target value A when the NR mode is auto mode. The target value A here refers to the target values for the enhancement parameter, luminance signal addition ratio, and color signal addition ratio assigned to the noise intensity parameter 605 in FIG. 4. Since the higher the gain, the more noise is included, the CPU 130 sets a high value for the enhancement parameter target value A when the estimated gain of the camera 200 acquired in S1403 is high. On the other hand, the CPU 130 sets a low value for the enhancement parameter target value A when the estimated gain is low. As a result, the luminance signal addition ratio and color signal addition ratio are set to low values when the estimated gain is high, and high values when the estimated gain is low. Color noise may affect image quality, particularly when the gain of the camera 200 is high. When the estimated gain is high, the CPU 130 may not use a color signal addition ratio.
強調パラメータについて説明する。カメラ200、及び、カメラ200のガンマ設定値によって入力されたノイズ量は、ゲインだけでなく、設定されたガンマによって上下することがある。高いゲインが推定されれば、強調パラメータは高い値で設定され、より高いNR効果が得られるように、CPU130は、ノイズに注目する感度を上げることができる。一方、低いゲインが推定された場合は強調パラメータを低く設定することによって、必要以上にNRが適用されることを抑制し、その結果、CPU130は、解像感の欠落やテクスチャー欠損などのNRによる弊害を抑制することができる。 The emphasis parameter will now be explained. The amount of noise input by the camera 200 and the gamma setting value of the camera 200 can fluctuate not only depending on the gain but also on the set gamma. If a high gain is estimated, the emphasis parameter is set to a high value, and the CPU 130 can increase the sensitivity to noise so as to obtain a higher NR effect. On the other hand, if a low gain is estimated, the emphasis parameter is set to a low value, preventing NR from being applied more than necessary. As a result, the CPU 130 can prevent adverse effects of NR, such as loss of resolution and texture loss.
S1405すなわちNRモードがマニュアルモードの場合、図5のS125と同様にCPU130が、NR強度を設定する。例えば、CPU130は、ユーザがNR強度メニューにて選択したHigh、Middle、Lowの情報を取得してNR強度を設定する。すなわち、NR強度は、前述の強調パラメータのような内部的なものとは異なり、画像処理装置100のユーザがUI等外部で選択するものである。CPU130は、Highを設定した場合、S1406へと進み、目標値Bを設定する。CPU130は、Middleを設定した場合、S1407へと進み、目標値Cを設定する。CPU130は、Lowを設定した場合、S1408へと進み、目標値Dを設定する。CPU130は、目標値Aと同様に、目標値B、目標値C、目標値Dを強調パラメータ、輝度信号加算比率、及び、色信号加算比率に対してそれぞれ設定する。これらの処理は、NRモードがマニュアルモードの場合の動作となるため、画像処理装置100は、各目標値B、目標値C、目標値D用に所定のパラメータをあらかじめ記憶部180などに保持する。強調パラメータの目標値はB>C>Dの関係で保持する。輝度信号加算比率、及び、色信号加算比率の目標値は、B<C<Dの関係で保持する。なお、前述のS1404と同様に、目標値Bにおいて、推定のゲイン推定が高い場合、CPU130は、色信号加算比率を無しとしてもよい。 In S1405, i.e., when the NR mode is manual mode, the CPU 130 sets the NR intensity in the same manner as in S125 of FIG. 5. For example, the CPU 130 obtains information on High, Middle, or Low selected by the user in the NR intensity menu and sets the NR intensity. In other words, the NR intensity is different from internal settings like the aforementioned emphasis parameters, and is selected externally by the user of the image processing device 100 via a UI, etc. If the CPU 130 sets High, the process proceeds to S1406 and sets target value B. If the CPU 130 sets Middle, the process proceeds to S1407 and sets target value C. If the CPU 130 sets Low, the process proceeds to S1408 and sets target value D. As with target value A, the CPU 130 sets target value B, target value C, and target value D for the emphasis parameter, luminance signal addition ratio, and color signal addition ratio, respectively. These processes are performed when the NR mode is manual, so the image processing device 100 stores predetermined parameters for each of the target values B, C, and D in the storage unit 180 or the like in advance. The target values of the enhancement parameters are stored in the relationship B>C>D. The target values of the luminance signal addition ratio and the color signal addition ratio are stored in the relationship B<C<D. As with S1404 described above, if the estimated gain is high for target value B, the CPU 130 may not use the color signal addition ratio.
S1409すなわちNRが無効の場合における目標値EをCPU130が設定する。例えば、CPU130は、目標値Eとして、強調パラメータを無効、輝度信号加算比率、及び、色信号加算比率を100%と設定する。 In S1409, the CPU 130 sets the target value E when NR is disabled. For example, the CPU 130 sets the target value E to disable the emphasis parameter, and to 100% for the luminance signal addition ratio and the color signal addition ratio.
CPU130が、S1404、S1406、S1407、S1408、S1409のいずれかを実行して、各NRの動作状態における目標値Aから目標値Eを設定すると、S1410へ進む。 When the CPU 130 executes one of S1404, S1406, S1407, S1408, and S1409 to set target values A through E for each NR operating state, it proceeds to S1410.
S1410では、CPU130が、現在の強調パラメータ、輝度信号加算比率、及び、色信号加算比率に対する、前述の目標値との偏差を算出する。 In S1410, the CPU 130 calculates the deviation of the current enhancement parameters, luminance signal addition ratio, and color signal addition ratio from the aforementioned target values.
S1411では、CPU130が、S1410で算出した目標値との偏差が閾値αよりも大きいか判定する。前述の通り、CPU130は、強調パラメータ、輝度信号加算比率、色信号加算比率のそれぞれに対して目標値との偏差を算出するので、閾値αは強調パラメータ偏差、輝度信号加算比率偏差、色信号加算比率偏差とでそれぞれ個別に設けてもよい。S1411が真すなわち目標値の偏差が閾値αよりも大きい場合、CPU130は、強調パラメータ、輝度信号加算比率、色信号加算比率のそれぞれが目標値に至っていないと判定しS1412へと進み、偽である場合は目標値に十分近づいたと判定しS1416へと進む。 In S1411, CPU 130 determines whether the deviation from the target value calculated in S1410 is greater than threshold value α. As described above, CPU 130 calculates the deviation from the target value for each of the emphasis parameter, luminance signal addition ratio, and color signal addition ratio, so threshold value α may be set separately for each of the emphasis parameter deviation, luminance signal addition ratio deviation, and color signal addition ratio deviation. If S1411 is true, i.e., the deviation of the target value is greater than threshold value α, CPU 130 determines that each of the emphasis parameter, luminance signal addition ratio, and color signal addition ratio has not reached the target value and proceeds to S1412; if it is false, it determines that they have come sufficiently close to the target value and proceeds to S1416.
S1412では、CPU130が各目標値すなわち、強調パラメータ、輝度信号加算比率、色信号加算比率に対する今回の制御量をそれぞれ設定する。S1412では一般的な制御工学で認知されている方式で制御量を設定してよい。制御量は、強調パラメータ、輝度信号加算比率、色信号加算比率のうち、目標値に近づけるために変更対象のパラメータに加算される値である。 In S1412, the CPU 130 sets the current control amount for each target value, i.e., the emphasis parameter, luminance signal addition ratio, and color signal addition ratio. In S1412, the control amount may be set using a method recognized in general control engineering. The control amount is a value added to the parameter to be changed, among the emphasis parameter, luminance signal addition ratio, and color signal addition ratio, in order to bring it closer to the target value.
S1413では、CPU130がS1412で算出した制御量が閾値βを超えているかを判定する。閾値βの値は任意の値でよい。閾値βは、前述のNRの各種状態において一定値でもよいし、閾値αと連動させて大小させてもよい。S1412でCPU130により算出された制御量をそのまま適用しても良いが、S1413では、CPU130が、1枚の入力画像に対する制御量が一定量すなわち閾値βを超えないように制限することで、設定した目標値への画像変化量を緩和させることを目的としている。S1413が真すなわち制御量が閾値βを超えている場合、CPU130は、S1414へ進み、偽すなわち制御量が閾値β以下である場合、S1415へ進む。 In S1413, the CPU 130 determines whether the control amount calculated in S1412 exceeds the threshold value β. The value of the threshold value β may be any value. The threshold value β may be a constant value for the various NR states described above, or may be increased or decreased in conjunction with the threshold value α. The control amount calculated by the CPU 130 in S1412 may be applied as is, but in S1413, the CPU 130 limits the control amount for one input image to a constant amount, i.e., the threshold value β, with the aim of mitigating the amount of image change toward the set target value. If S1413 is true, i.e., the control amount exceeds the threshold value β, the CPU 130 proceeds to S1414; if false, i.e., the control amount is equal to or less than the threshold value β, the CPU 130 proceeds to S1415.
S1414では、CPU130は、制御量に閾値βを設定する。S1416では、CPU130は、制御量に0を設定する。 In S1414, the CPU 130 sets the threshold value β to the control amount. In S1416, the CPU 130 sets the control amount to 0.
S1415では、CPU130が、次回設定値として、現在の各設定値すなわち現在の強調パラメータ、輝度信号加算比率、色信号加算比率に制御量を加算した値を設定して、図9のサブルーチンを終了して図2のS150へと進む。そして、CPU130は、順次取得する入力画像にわたって、S1415のステップを複数回繰り返すことで、強調パラメータ、輝度信号加算比率、色信号加算比率に複数回制御量を加算する。これにより、CPU130は、強調パラメータ、輝度信号加算比率、色信号加算比率を目標値へと近づける。図10は、S150のNR処理のサブルーチンのフローチャートを示す。 In S1415, the CPU 130 sets the next setting values to the current settings, i.e., the current emphasis parameters, luminance signal addition ratio, and color signal addition ratio, plus the control amounts, then ends the subroutine in FIG. 9 and proceeds to S150 in FIG. 2. The CPU 130 then repeats step S1415 multiple times for each input image acquired sequentially, thereby adding the control amounts multiple times to the emphasis parameters, luminance signal addition ratio, and color signal addition ratio. In this way, the CPU 130 brings the emphasis parameters, luminance signal addition ratio, and color signal addition ratio closer to the target values. FIG. 10 shows a flowchart of the NR processing subroutine in S150.
図10のS151では、CPU130が図9のS1415で設定された強調パラメータを設定する。強調パラメータは、図4で説明したノイズの強度パラメータ605に適用され、ノイズに着目したアテンションマップに適用される強調パラメータとして作用する。 In S151 of Figure 10, the CPU 130 sets the emphasis parameter set in S1415 of Figure 9. The emphasis parameter is applied to the noise intensity parameter 605 described in Figure 4, and acts as an emphasis parameter applied to an attention map focusing on noise.
S152では、CPU130が、図2のS110で取得した画像をメモリ140からロードして取得し、NR推論をするために画像処理部160に入力する。図11は、NR処理される画像を処理順に並べた図である。図11(a)は、カメラ200で撮影した暗部の画像の一例である。図11(a)の画像は、見えにくいが人の画像を含む。カメラ200が、図11(a)の画像にゲインを適用するので、画像処理装置100は、図11(b)のようなノイズが含まれた画像を取得する。したがって、CPU130は、NR推論のための画像として図11(b)に示すような画像をメモリ140からロードして取得する。 In S152, the CPU 130 loads and acquires the image acquired in S110 of Figure 2 from the memory 140, and inputs it to the image processing unit 160 for noise reduction inference. Figure 11 is a diagram showing images to be subjected to noise reduction in the order of processing. Figure 11(a) is an example of an image of a dark area captured by the camera 200. The image in Figure 11(a) includes an image of a person, although it is difficult to see. Because the camera 200 applies gain to the image in Figure 11(a), the image processing device 100 acquires an image containing noise, as shown in Figure 11(b). Therefore, the CPU 130 loads and acquires an image such as that shown in Figure 11(b) from the memory 140 as an image for noise reduction inference.
S153では、画像処理部160は、NR推論処理を実行する。 In S153, the image processing unit 160 executes NR inference processing.
S154では、画像処理部160がS153で推論した結果の画像(以下、推論画像)をCPU130が、メモリ140などに保存する。S153で得た推論画像は、図11(c)に示すようにNR推論処理が適用されノイズが低減している。CPU130がS154を実行すると図10のサブルーチンを終了し、図2のS160へ進む。 In S154, the CPU 130 stores the image resulting from the inference performed by the image processing unit 160 in S153 (hereinafter referred to as the inference image) in memory 140 or the like. The inference image obtained in S153 has had noise reduced by applying NR inference processing, as shown in Figure 11(c). When the CPU 130 executes S154, it ends the subroutine in Figure 10 and proceeds to S160 in Figure 2.
図2のS160ではCPU130がS150までにNR処理された推論画像を出力するための画像の出力処理を実行する。図12は、S160の画像出力処理のサブルーチンのフローチャートを示す。 In S160 of Figure 2, the CPU 130 executes image output processing to output the inference image that has undergone NR processing up to S150. Figure 12 shows a flowchart of the image output processing subroutine of S160.
図12のS161では、CPU130は、図11のS154で保存された推論画像を取得する。 In S161 of Figure 12, the CPU 130 acquires the inference image saved in S154 of Figure 11.
S162では、画像処理部160が、S154で保存された推論画像に輝度信号の合成処理を実行する。画像処理部160は、図9のS1415で設定された次回設定値としての輝度信号加算比率に基づいて、推論画像に輝度信号を合成する。 In S162, the image processing unit 160 performs a luminance signal synthesis process on the inference image saved in S154. The image processing unit 160 synthesizes the luminance signal with the inference image based on the luminance signal addition ratio set as the next setting value in S1415 of FIG. 9.
S163では、画像処理部160が、輝度信号が合成された推論画像に色信号の合成処理を実行する。画像処理部160は、次回設定値として設定された色信号加算比率に基づいて、推論画像に色信号を合成する。 In S163, the image processing unit 160 performs a color signal synthesis process on the inference image with the synthesized luminance signal. The image processing unit 160 synthesizes the color signal with the inference image based on the color signal addition ratio set as the next setting value.
S164では、CPU130が、画像処理部160によるS163までの合成処理によって得られた画像を、画像出力部170を通じて画像処理装置100から出力し、モニタ400に表示させる。例えばNRのモード、及び、強度メニュー状態による図11(b)の画像の一部が、図11(c)に示す推論画像に合成されて、図11(d)に示す画像となる。 In S164, the CPU 130 outputs the image obtained by the synthesis processing up to S163 by the image processing unit 160 from the image processing device 100 via the image output unit 170 and displays it on the monitor 400. For example, a portion of the image in Figure 11(b) in NR mode and strength menu status is synthesized with the inference image shown in Figure 11(c) to produce the image shown in Figure 11(d).
CPU130は、S164を実行すると、図12の画像出力処理のサブルーチンを終了して図2の処理に戻る。CPU130は、図2のS160を実行するとS110に戻り、再び画像処理を繰り返す。 After executing S164, the CPU 130 ends the image output processing subroutine in FIG. 12 and returns to the processing in FIG. 2. After executing S160 in FIG. 2, the CPU 130 returns to S110 and repeats image processing again.
NRの有効と無効との切り替え、NRモードのオートモードとマニュアルモードとの切り替え、及び、メニューからの強度設定変更により設定した目標値に対し、CPU130が、図2の画像処理を繰り返し実行することによって、図9のS1415が更新され、図12のS164で出力される画像が滑らかに変化していくこととなる。 By repeatedly executing the image processing shown in Figure 2 by the CPU 130 when switching NR between enabled and disabled, when switching NR mode between auto and manual modes, and when changing the intensity setting from the menu, S1415 in Figure 9 is updated, and the image output in S164 in Figure 12 changes smoothly.
上述の実施形態では、強調パラメータ、輝度信号加算比率、及び、色信号加算比率に目標値を設定して、制御量を加算して、次回設定値を順次設定する例を挙げたが、制御量を加算して順次設定する対象は上述の例に限らない。例えば、本実施形態は、NNパラメータに目標値を設定し、NNパラメータに制御量を加算して、NNパラメータを順次設定してもよい。 In the above-described embodiment, an example was given in which target values were set for the emphasis parameters, luminance signal addition ratio, and color signal addition ratio, and control amounts were added to sequentially set the next setting values, but the targets to which control amounts are added and sequentially set are not limited to the above example. For example, in this embodiment, target values may be set for NN parameters, and control amounts may be added to the NN parameters to sequentially set the NN parameters.
以上、本実施形態ではNRの有効と無効との切り替え、NRモードのオートモードとマニュアルモードとの切り替え、及び、メニューからの強度設定変更などにより強調パラメータ、輝度信号加算比率、及び、色信号加算比率の目標値が設定される。本実施形態は、設定された目標値に対して強調パラメータ、輝度信号加算比率、及び、色信号加算比率の次回設定値を、1フレームの画像ごとに制御量に基づいて順次更新していく方法について示した。これにより、本実施形態は、強調パラメータ、輝度信号加算比率、及び、色信号加算比率を含むNRパラメータの急激な変化を抑制し、パラメータを変更する際の画像のショックを低減し、滑らかなNR効果が適用された高品位な画像を提供できる。 As described above, in this embodiment, target values for the emphasis parameters, luminance signal addition ratio, and color signal addition ratio are set by switching NR between enabled and disabled, switching the NR mode between auto mode and manual mode, and changing the intensity setting from a menu. This embodiment shows a method in which the next setting values for the emphasis parameters, luminance signal addition ratio, and color signal addition ratio are sequentially updated for each frame of image based on the control amount relative to the set target values. As a result, this embodiment suppresses sudden changes in NR parameters, including the emphasis parameters, luminance signal addition ratio, and color signal addition ratio, reduces image shock when parameters are changed, and provides high-quality images with a smooth NR effect applied.
本実施形態は、制御量と閾値βとを比較して、閾値βよりも制御量が大きい場合、当該閾値βを制御量に設定している。これにより、本実施形態は、制御量が閾値βよりも大きくなることを防ぎ、制御量が加算される強調パラメータ、輝度信号加算比率、及び、色信号加算比率の変化を緩和することができる。 In this embodiment, the control amount is compared with a threshold value β, and if the control amount is greater than the threshold value β, the threshold value β is set as the control amount. This prevents the control amount from exceeding the threshold value β, and can mitigate changes in the emphasis parameters, luminance signal addition ratio, and color signal addition ratio to which the control amount is added.
本実施形態は、ユーザによって選択されたNR強度に基づいて目標値を設定している。これにより、本実施形態は、ユーザの希望に沿った目標値を設定することができ、目標値に基づいて設定された強調パラメータ、輝度信号加算比率、及び、色信号加算比率によってノイズ除去されて出力された画像をユーザの希望に沿ったものとすることができる。 In this embodiment, the target value is set based on the NR strength selected by the user. This allows the user to set a target value that meets their needs, and the output image, which has been noise-removed using the enhancement parameters, luminance signal addition ratio, and color signal addition ratio set based on the target value, can be tailored to the user's needs.
以上、本発明をその好適な実施形態に基づいて詳述してきたが、本発明はこれら特定の実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の様々な形態も本発明に含まれる。上述の実施形態の一部を適宜組み合わせてもよい。 The present invention has been described in detail above based on preferred embodiments, but the present invention is not limited to these specific embodiments, and various forms within the scope of the invention are also included. Parts of the above-described embodiments may be combined as appropriate.
上記実施形態の説明では、図3で示したように、カメラ200の機種の選択、及び、ガンマの選択において変更があった場合は、S124にてCPU130がNR初期化を実施した。このとき、CPU130が、DLNR学習済みモデルのロードに時間を要してしまい、滑らかなNR効果の推論が困難な場合がある。そこで、画像処理装置100は、NN処理を冗長化することによって、図2のS120の画像処理設定を図13に示すサブルーチンで実現してもよい。図13は、S120の画像処理設定においてNN冗長化切替処理を含むサブルーチンのフローチャートである。なお、図13の説明において、図5と同様のステップについては説明を省略または簡略する。 In the above embodiment, as shown in FIG. 3, if there is a change in the model selection and gamma selection of the camera 200, the CPU 130 performs NR initialization in S124. At this time, it may take time for the CPU 130 to load the DLNR trained model, making it difficult to smoothly infer the NR effect. Therefore, the image processing device 100 may implement the image processing setting of S120 in FIG. 2 using the subroutine shown in FIG. 13 by making the NN processing redundant. FIG. 13 is a flowchart of a subroutine that includes NN redundancy switching processing in the image processing setting of S120. Note that in the description of FIG. 13, explanations of steps similar to those in FIG. 5 will be omitted or simplified.
例えば、画像処理装置100は、NN冗長処理系として、NN-A、及び、NN-Bの2系統のNNを用意し、NN-AまたはNN-Bのいずれか一方でNN処理を実行し、他方のNNでNR初期化を実行してNNパラメータを制御量に基づいて変更してよい。 For example, the image processing device 100 may prepare two NN systems, NN-A and NN-B, as NN redundant processing systems, and perform NN processing using either NN-A or NN-B, while performing NR initialization using the other NN to change the NN parameters based on the control amount.
S123では、CPU130は、カメラ200の機種あるいはガンマの変更ありと判定した場合、S221に示すように使用中のNNがNN-AかNN-Bかを判定し、NN-Aが使用中であればS222へ進み、NN-Bが使用中であればS224へと進む。 In S123, if the CPU 130 determines that the model or gamma of the camera 200 has been changed, it determines whether the NN in use is NN-A or NN-B, as shown in S221. If NN-A is in use, the process proceeds to S222, and if NN-B is in use, the process proceeds to S224.
S222では、CPU130がNN-Aとは排他のNN-BをNR初期化し、NN-AによるNR処理を継続する。 In S222, the CPU 130 initializes NN-B, which is exclusive to NN-A, and continues NR processing by NN-A.
S223にて、CPU130がNN-Bの切替中フラグをセットする。 At S223, the CPU 130 sets the NN-B switching flag.
S224及びS225ではCPU130がS222及びS226とは排他な処理を実行する。具体的には、S224では、CPU130がNN-Bと排他のNN-AをNR初期化し、NN-BによるNN処理を継続する。S225では、CPU130がNN-Aの切替中フラグをセットする。 In S224 and S225, the CPU 130 executes processing exclusive of S222 and S226. Specifically, in S224, the CPU 130 initializes NN-A, which is exclusive to NN-B, and continues NN processing by NN-B. In S225, the CPU 130 sets the switching in progress flag for NN-A.
次回以降の図2のS110からの処理では、図13のS123が偽と判定されS226へと進む。 From the next time onwards, processing will begin at S110 in Figure 2, and S123 in Figure 13 will be determined to be false, and processing will proceed to S226.
S226では、CPU130がS223あるいはS225で設定された切替中フラグを参照し、S226が真すなわちNN切替中と判定すれば、S227へと進み、偽すなわちNN切替完了後と判定すればS125へと進む。 In S226, the CPU 130 references the switching flag set in S223 or S225, and if S226 is determined to be true, i.e., NN switching is in progress, proceeds to S227; if S226 is determined to be false, i.e., NN switching has been completed, proceeds to S125.
S227では、CPU130がNN-Aの画像からNN-Bの画像に合成またはNN-Bの画像からNN-Aの画像に合成するための比率である合成比率を更新する。ここで、CPU130は、図9に示したのと同様に所定の制御量で目標値へと切り替える切替対象のNN系統のNNパラメータを複数の画像にわたって遷移させて変更する。したがって、CPU130は、変更中のNNパラメータの遷移の進捗に対応させて、合成比率を遷移させて更新すればよい。なお、画像処理部160は、NN-Aから出力されたが画像と、NN-Bから出力された画像とを、合成比率に基づいて合成する。 In S227, the CPU 130 updates the composition ratio, which is the ratio for combining an image from NN-A with an image from NN-B, or combining an image from NN-B with an image from NN-A. Here, the CPU 130 changes the NN parameters of the NN system to be switched to target values by transitioning them across multiple images using a predetermined control amount, as shown in FIG. 9. Therefore, the CPU 130 can simply transition and update the composition ratio in accordance with the progress of the transition of the NN parameters being changed. The image processing unit 160 composites the image output from NN-A and the image output from NN-B based on the composition ratio.
S228では、CPU130は、NNの切り替えが完了したか否かを判定する。例えば、CPU130は、NN-AまたはNN-Bのいずれか一方から他方への画像の合成の比率を示す合成比率が100%に遷移したときに、真すなわちNN切替完了と判定しS229へと進み、偽すなわちNN切替中と判定すればS125へと進む。 In S228, the CPU 130 determines whether the NN switching has been completed. For example, when the composition ratio, which indicates the composition ratio of the image from either NN-A or NN-B to the other, transitions to 100%, the CPU 130 determines that this is true, i.e., that the NN switching has been completed, and proceeds to S229. If this is false, i.e., if the NN switching is in progress, the CPU 130 proceeds to S125.
S229では、CPU130が、S223またはS225で設定したNN-A切替中フラグ、及び、NN-B切替中フラグをクリアしてS125へと進む。 In S229, the CPU 130 clears the NN-A switching flag and the NN-B switching flag set in S223 or S225, and then proceeds to S125.
NN処理の冗長化、及び、図13に示したサブルーチンにより、より滑らかなDLNR切替処理が可能となる。さらには、図9、図11、図12で示した切替処理と組み合わせて実施してもよい。 The redundancy of the NN process and the subroutine shown in Figure 13 enable smoother DLNR switching processing. Furthermore, this may be implemented in combination with the switching processing shown in Figures 9, 11, and 12.
<第2実施形態>
第2実施形態では、設定された目標値に対する強調パラメータ、輝度信号加算比率、及び、色信号加算比率の次回設定値を参照テーブルとしてあらかじめ持っておき、1フレームの画像ごとに順次更新していく方法について示す。
Second Embodiment
In the second embodiment, a method is shown in which the next set values of the enhancement parameters, luminance signal addition ratio, and color signal addition ratio for the set target values are stored in advance as a reference table, and are updated sequentially for each frame of image.
第2実施形態における画像処理装置100の構成は第1実施形態すなわち図1と同じであるため説明を省略する。 The configuration of the image processing device 100 in the second embodiment is the same as that in the first embodiment (i.e., Figure 1), so a description will be omitted.
次に、画像処理装置100においてCPU130が行う画像処理について、図14を用いて説明する。図14のS100からS130までは第1実施形態と同様の処理実行しS240へ進む。図14のS240では画像処理変更制御を行う。S240のサブルーチンを図15に示す。 Next, the image processing performed by the CPU 130 in the image processing device 100 will be described using Figure 14. Steps S100 to S130 in Figure 14 are the same as those in the first embodiment, and then the process proceeds to S240. Image processing change control is performed in S240 in Figure 14. The subroutine for S240 is shown in Figure 15.
図15のS1401では、CPU130は、図9と同様にNRの有効または無効の選択を行う。CPU130は、S1401が真である場合はS1402へと進み、偽である場合はS2409へと進む。S1402では図9と同様にCPU130がNRモードを判定する。CPU130は、S1402が真すなわちNRモードがオートモードの場合はS2403へ進み、偽すなわちマニュアルモードの場合はS1405へ進む。S2403では、CPU130は、第1実施形態のS138、S1403と同様に入力画像の推定ゲイン値Aを取得し、S2404へと進む。 In S1401 of FIG. 15, the CPU 130 selects whether NR is enabled or disabled, as in FIG. 9. If S1401 is true, the CPU 130 proceeds to S1402, and if it is false, the CPU 130 proceeds to S2409. In S1402, as in FIG. 9, the CPU 130 determines the NR mode. If S1402 is true, i.e., the NR mode is auto mode, the CPU 130 proceeds to S2403, and if it is false, i.e., the NR mode is manual mode, the CPU 130 proceeds to S1405. In S2403, the CPU 130 acquires an estimated gain value A for the input image, as in S138 and S1403 of the first embodiment, and proceeds to S2404.
S2404では、CPU130は、NRモードがオートモードの場合の推定ゲイン値Aを変数TempGainに格納し、S2410へと進む。 In S2404, the CPU 130 stores the estimated gain value A when the NR mode is auto mode in the variable TempGain, and proceeds to S2410.
S1405すなわちNRモードがマニュアルモードの場合、画像処理装置100のユーザがUI等の外部のNR強度メニューを操作してゲイン値を切り替えるものとする。CPU130は、ユーザの選択にしたがってNR強度設定としてHighを設定した場合、S2406へと進み、変数TempGainにゲイン値Bを格納する。CPU130は、NR強度設定としてMiddleを設定した場合、S2407へと進み、変数TempGainにゲイン値Cを格納する。CPU130は、NR強度設定としてLowを設定した場合、S2408へと進み、変数TempGainにゲイン値Dを格納する。 In S1405, i.e., when the NR mode is manual mode, the user of the image processing device 100 operates an external NR intensity menu such as a UI to switch the gain value. If the NR intensity setting is set to High in accordance with the user's selection, the CPU 130 proceeds to S2406 and stores gain value B in the variable TempGain. If the NR intensity setting is set to Middle, the CPU 130 proceeds to S2407 and stores gain value C in the variable TempGain. If the NR intensity setting is set to Low, the CPU 130 proceeds to S2408 and stores gain value D in the variable TempGain.
第1実施形態と同様にゲイン値Bからゲイン値Dは、NRモードがマニュアルモードの場合の動作となる。各ゲイン値の大小関係はB>C>Dである。 As with the first embodiment, gain values B to D operate when the NR mode is manual. The magnitude relationship between the gain values is B>C>D.
S2409すなわちNRが無効の場合におけるゲイン値EをCPU130が変数TempGainに格納する。例えば、CPU130は、ゲイン値Eとして、例えば1倍あるいは0dBと設定する。なお、ゲイン値Eは、一般的にゲインが低い場合すなわちNRが不要なゲイン値としても良い。なお、ゲイン値Dとの関係は、D>Eである。 In S2409, the CPU 130 stores the gain value E in the case where NR is disabled in the variable TempGain. For example, the CPU 130 sets the gain value E to, for example, 1x or 0 dB. Note that the gain value E may generally be set to a low gain, i.e., a gain value where NR is not required. Note that the relationship with the gain value D is D>E.
S2404、S2406、S2407、S2408、S2409が実行されるとS2410へと進む。 After S2404, S2406, S2407, S2408, and S2409 are executed, proceed to S2410.
本実施形態は、強調パラメータ、輝度信号加算比率、及び、色信号加算比率をなめらかに推移させていくために、変数TempGainに格納されたゲイン値を配列Arrに格納する。なお、直近の複数フレーム分のゲイン値を保持するために、所謂FIFO(First In First Out)形式で格納していく。詳細な処理はS2410以降で後述するが、例えば配列Arrの配列長を10とすると、1フレームごとに更新されるTempGain値が直近10フレーム分保持されることになる。配列Arrに格納されたゲイン値の平均値を求めることによって、直近10フレーム分の時間フィルタを適用したゲイン値が得られる。TempGainに格納されるゲイン値は設定の変更や、NRモードがオートモードの場合はカメラのノイズの変化に対し、時間フィルタが適用され緩やかに変化するゲイン平均値が得られることとなる。なお、配列Arrの配列長は限定されず、任意の配列長で良い。また、配列Arrの配列長を変数lengthで示すものとする。 In this embodiment, the gain values stored in the variable TempGain are stored in the array Arr to smoothly transition the enhancement parameters, luminance signal addition ratio, and color signal addition ratio. To retain the gain values for the most recent frames, the gain values are stored in a so-called FIFO (First In First Out) format. Detailed processing will be described later from S2410 onward. For example, if the array length of array Arr is 10, the TempGain values updated every frame will be retained for the most recent 10 frames. By calculating the average of the gain values stored in array Arr, the gain values for the most recent 10 frames to which a time filter has been applied are obtained. The gain values stored in TempGain are subject to a time filter to accommodate changes in settings or, if the NR mode is auto, changes in camera noise, resulting in a gradually changing average gain value. The array length of array Arr is not limited and can be any length. Additionally, the array length of array Arr is indicated by the variable length.
S2410では、CPU130は、配列Arrの参照用インデックス変数iを0に初期化する。さらに配列Arrに格納されたゲイン値の合計値を求めるための変数SumをTempGainに格納された値、すなわち最新のゲイン値で初期化する。 At S2410, the CPU 130 initializes the reference index variable i of the array Arr to 0. Furthermore, it initializes the variable Sum, which is used to calculate the sum of the gain values stored in the array Arr, to the value stored in TempGain, i.e., the most recent gain value.
S2411では、CPU130は、配列Arrのi番目の要素であるArr[i]に配列Arrのi+1番目の要素であるArr[i+1]を格納する。S2412では、CPU130は、インデックス変数iを1インクリメントする。S2413では、CPU130は、変数Sumに配列Arrのi番目に格納されたゲイン値を加算する。S2414では、CPU130は、インデックス変数iが配列Arrの配列長の変数length-1より小さいか否かを判定する。S2414が真である場合、すなわち、CPU130が、インデックス変数iが配列長の変数length-1より小さいと判定した場合、S2411に戻って繰り返し処理を実行する。S2414が偽である場合、すなわち、CPU130が、インデックス変数iが配列長の変数length-1より小さくないと判定し、配列ArrへのFIFO処理および配列Arrに格納された合計値Sumが算出されると、S2415へと進む。 At S2411, the CPU 130 stores Arr[i+1], the i+1th element of the array Arr, in Arr[i], the i-th element of the array Arr. At S2412, the CPU 130 increments the index variable i by 1. At S2413, the CPU 130 adds the gain value stored in the i-th element of the array Arr to the variable Sum. At S2414, the CPU 130 determines whether the index variable i is smaller than the array length variable length-1 of the array Arr. If S2414 is true, that is, if the CPU 130 determines that the index variable i is smaller than the array length variable length-1, the process returns to S2411 and repeats the process. If S2414 is false, that is, if the CPU 130 determines that the index variable i is not less than the array length variable length-1, and once FIFO processing of the array Arr and the sum Sum stored in the array Arr have been calculated, the process proceeds to S2415.
S2415では、CPU130は、前述の合計値Sumを配列Arrの配列長lengthで除算した値、すなわちゲイン値の平均値を変数AveGainに格納する。S2416では、CPU130は、変数AveGainを、強調パラメータ、輝度信号加算比率、及び、色信号加算比率の各テーブルを参照するためのゲインインデックス値に変換する。例えば配列Arrの配列長lengthが10である場合は、CPU130は、直近10フレーム分のゲイン値の平均値を算出し、対応するゲインインデックス値を導出する。 In S2415, the CPU 130 stores the value obtained by dividing the aforementioned total value Sum by the array length length of the array Arr, i.e., the average value of the gain values, in the variable AveGain. In S2416, the CPU 130 converts the variable AveGain into a gain index value for referencing the tables for the emphasis parameters, luminance signal addition ratio, and color signal addition ratio. For example, if the array length length of the array Arr is 10, the CPU 130 calculates the average value of the gain values for the most recent 10 frames and derives the corresponding gain index value.
強調パラメータ、輝度信号加算比率、及び、色信号加算比率の次回設定値として参照する設定値の各参照テーブルの例を図16に示す。参照テーブルは参照データの一例である。図16(a)は強調パラメータテーブルである。図16(b)は輝度信号加算比率テーブルである。図16(c)は色信号加算比率テーブルである。それぞれ行ごとにカメラおよびそのガンマに対する各ゲインインデックス値におけるパラメータが格納されている。例えば図16(a)の強調パラメータテーブルにおいてはゲイン値が低い場合は強調倍率として1.0とし、高いゲインほど高い値としている。図16(b)の輝度信号加算比率テーブルおよび図16(c)の色信号加算比率テーブルではゲイン値が低い場合には比率を高くし、ゲイン値が低いほど比率を低くしている。したがって、各テーブルは、第1実施形態で示した考え方と同様でよい。各パラメータは、あらかじめカメラおよびガンマにおける各ゲイン特性に基づき最適なNR画質となるように定めておくとよい。なお、ゲインインデックス値の分解能は、例えば1dBごととしてよい。分解能を細かくした方がよりなめらかなNR変化の効果が得られる。ただし、分解能が細かい場合は各テーブルのメモリサイズが大きくなる可能性があるため、3dBや6dB毎としてよい。S2417ではテーブルの分解能に応じたゲインインデックス値変換の数式を実装すればよい。 FIG. 16 shows examples of reference tables for the setting values to be referenced as the next setting values for the enhancement parameters, luminance signal addition ratio, and color signal addition ratio. A reference table is an example of reference data. FIG. 16(a) is an enhancement parameter table. FIG. 16(b) is a luminance signal addition ratio table. FIG. 16(c) is a color signal addition ratio table. Each row stores parameters for each gain index value for a camera and its gamma. For example, in the enhancement parameter table of FIG. 16(a), the enhancement multiplier is set to 1.0 when the gain value is low, and the higher the gain, the higher the value. In the luminance signal addition ratio table of FIG. 16(b) and the color signal addition ratio table of FIG. 16(c), the ratio is increased when the gain value is low and decreased when the gain value is low. Therefore, each table can be based on the same concept as in the first embodiment. It is recommended that each parameter be determined in advance to achieve optimal NR image quality based on the gain characteristics of the camera and gamma. The resolution of the gain index value can be set to, for example, 1 dB. A finer resolution will result in a smoother NR change. However, since a finer resolution may increase the memory size of each table, it is fine to use 3 dB or 6 dB increments. In S2417, you can implement a formula for converting gain index values according to the table resolution.
図15の説明に戻る。S2417では、CPU130は、S2416で変換されたテーブル参照用インデックスに基づき、図16で説明した各参照テーブルを参照して、強調パラメータ、輝度信号加算比率、及び、色信号加算比率を取得し、画像処理部160に設定する。 Returning to the explanation of Figure 15, in S2417, the CPU 130 references the reference tables described in Figure 16 based on the table reference index converted in S2416, obtains the enhancement parameters, luminance signal addition ratio, and color signal addition ratio, and sets them in the image processing unit 160.
CPU130は、順次取得する入力画像にわたって、S2417のステップを複数回繰り返すことで、上述の平均値をゆるやかに変化させ、参照される強調パラメータ、輝度信号加算比率、色信号加算比率を緩やかに目標値へと近づけていくことができる。 By repeating step S2417 multiple times for each input image acquired sequentially, the CPU 130 can gradually change the average values described above, gradually bringing the referenced enhancement parameters, luminance signal addition ratio, and color signal addition ratio closer to their target values.
CPU130がS2417を実行するとS2418へと進む。S2418では、CPU130は、配列Arrのi+1番目の要素であるArr[i+1]にTempGain値を格納する。配列長lengthが10の場合は、i+1=9すなわち配列Arrの最後尾に最新のゲイン値が格納されることとなる。 After the CPU 130 executes S2417, the process proceeds to S2418. In S2418, the CPU 130 stores the TempGain value in Arr[i+1], which is the i+1th element of the array Arr. If the array length is 10, the latest gain value will be stored at i+1=9, i.e., at the end of the array Arr.
CPU130がS2418を実行すると図15のサブルーチンを終了し、図14のS150へと進む。図14のS150およびS160は、図2のS150およびS160と同様の処理のため説明を省略する。 When the CPU 130 executes S2418, it ends the subroutine in FIG. 15 and proceeds to S150 in FIG. 14. S150 and S160 in FIG. 14 are similar to S150 and S160 in FIG. 2, so a description thereof will be omitted.
以上、第2実施形態では、強調パラメータ、輝度信号加算比率、及び、色信号加算比率の次回設定値を参照テーブルとしてあらかじめ保持する実施形態を示した。また、第2実施形態は、1フレームごとに得られたゲイン値を複数フレームで平均化すなわち時間フィルタを適用することで、参照される次回設定値をなめらかに変化させていくことが可能となる。 In the second embodiment, the next setting values for the enhancement parameters, luminance signal addition ratio, and color signal addition ratio are stored in advance as a reference table. Furthermore, the second embodiment averages the gain values obtained for each frame over multiple frames, i.e., applies a time filter, making it possible to smoothly change the next setting values to be referenced.
<第3実施形態>
第1実施形態および第2実施形態では、図2および図14のS130で示したノイズ推定処理により、カメラ200から画像処理装置100に入力した映像に含まれるノイズ量からカメラ200に設定されているゲイン値を推定する例を示した。ところで、カメラ200に通信手段が備わっている場合、画像処理装置500は、カメラ200のカメラ名称、ガンマ設定、ゲイン設定を取得できることがある。設定値そのものを取得可能な画像処理装置500は、カメラ200のゲイン値情報を正確に取得でき、より最適なノイズ低減処理を実施することが可能となる。
Third Embodiment
In the first and second embodiments, an example has been shown in which the gain value set in the camera 200 is estimated from the amount of noise contained in the video input from the camera 200 to the image processing device 100 by the noise estimation process shown in S130 in Figures 2 and 14. However, if the camera 200 is equipped with a communication means, the image processing device 500 may be able to acquire the camera name, gamma setting, and gain setting of the camera 200. The image processing device 500, which can acquire the setting values themselves, can accurately acquire gain value information of the camera 200, making it possible to perform more optimal noise reduction processing.
図17は、第3実施形態における画像処理装置500の構成を示す図である。画像処理装置500は、図1に示した画像処理装置100に通信部510を追加した構成である。通信部510はバス120に接続されている。CPU130は、通信部510を通じてカメラ200のプロトコルに対応したコマンドを送信し、カメラ200を制御するとともに、カメラ200の設定値を取得する。カメラ200と通信部510の物理的な通信形態はEthernetおよびシリアル通信などを適用できるが、その通信形態は特に限定されない。なお、Ethernetの場合は、ソケット通信によるプロトコルやhttpプロトコルを用いたWebAPIなどが一般的である。シリアル通信の場合は調歩同期式通信によるプロトコルがあげられる。これらのプロトコルについても特に限定されない。 Figure 17 is a diagram showing the configuration of an image processing device 500 in the third embodiment. The image processing device 500 has a configuration in which a communication unit 510 is added to the image processing device 100 shown in Figure 1. The communication unit 510 is connected to the bus 120. The CPU 130 sends commands corresponding to the protocol of the camera 200 via the communication unit 510 to control the camera 200 and obtain the setting values of the camera 200. The physical communication format between the camera 200 and the communication unit 510 can be Ethernet or serial communication, but the communication format is not particularly limited. In the case of Ethernet, a protocol based on socket communication or a Web API using the http protocol is common. In the case of serial communication, a protocol based on asynchronous communication is used. There are also no particular limitations on these protocols.
次に、画像処理装置500においてCPU130が行う画像処理について、図18から図20を用いて説明する。図18のS100からS110までは第1実施形態と同様の処理をCPU130が実行しS320へ進む。図18のS320では、CPU130が、カメラの情報を取得するカメラパラメータ取得処理を行う。前述のとおり、CPU130は、カメラ200の通信プロトコルにしたがって、通信部510を通じてカメラ200の設定値などを取得する。 Next, the image processing performed by the CPU 130 in the image processing device 500 will be described using Figures 18 to 20. From S100 to S110 in Figure 18, the CPU 130 performs the same processing as in the first embodiment, and then proceeds to S320. In S320 in Figure 18, the CPU 130 performs camera parameter acquisition processing to acquire camera information. As described above, the CPU 130 acquires the setting values and other information of the camera 200 via the communication unit 510 in accordance with the camera 200's communication protocol.
図19は、S320のカメラパラメータ取得処理のサブルーチンの図である。図19のS321では、CPU130は、カメラ200の機種情報を取得する。S322では、CPU130は、カメラ200に現在設定されているガンマ情報を取得する。S323では、CPU130は、カメラ200に現在設定されているゲイン値を取得する。また、取得したゲイン値を後述する推定ゲイン値として設定する。S324では、CPU130は、カメラ200に現在設定されているシャッター値すなわち露光時間設定値を取得する。CPU130がS324まで実行すると、図19のサブルーチンを終了し、図18のS330へと進む。 Figure 19 is a diagram of the subroutine for the camera parameter acquisition process of S320. In S321 of Figure 19, the CPU 130 acquires model information for the camera 200. In S322, the CPU 130 acquires gamma information currently set in the camera 200. In S323, the CPU 130 acquires the gain value currently set in the camera 200. The CPU 130 also sets the acquired gain value as an estimated gain value, which will be described later. In S324, the CPU 130 acquires the shutter value, i.e., the exposure time setting value, currently set in the camera 200. When the CPU 130 has executed up to S324, it ends the subroutine of Figure 19 and proceeds to S330 of Figure 18.
図18のS330では、CPU130は、画像処理設定を行う。 In S330 of Figure 18, the CPU 130 performs image processing settings.
図20は、図18のS330の画像処理設定のサブルーチンの図である。図20の画像処理設定の各ステップのうち、図2のS120の画像処理設定と類似のステップについては説明を簡略化する。S331では、CPU130は、図19のS321で取得されたカメラの機種情報を選択する。S332では、CPU130は、図19のS322で取得されたカメラ200に選択されているガンマ値の情報を選択する。第1実施形態および第2実施形態では、画像処理装置100のメニューなどでカメラおよびカメラのガンマ値の情報をユーザなどによって選択する例について示したが、本実施形態では、CPU130は、カメラ200から通信によって得られたカメラおよびガンマ値の情報を選択する。したがって、接続したカメラ200のガンマ値の設定値に応じて自動でNR設定値が選択されることとなる。CPU130がS332を実行するとS123へと進む。S123からS125までは第1実施形態と同様の処理が実行されるため説明を省略する。接続するカメラ200が変更されるか、カメラ200のガンマ値の情報が変更されると、本サブルーチンでは、CPU130は、NR初期化を自動で実行する。CPU130がS125のNRモード選択処理を実行すると、図20のサブルーチンを終了し、図18のS140へと進む。 Figure 20 is a diagram of the image processing setting subroutine of S330 in Figure 18. Of the steps in Figure 20 for image processing setting, steps similar to those in S120 in Figure 2 will be explained briefly. In S331, the CPU 130 selects the camera model information acquired in S321 in Figure 19. In S332, the CPU 130 selects the gamma value information selected for the camera 200 acquired in S322 in Figure 19. In the first and second embodiments, examples were shown in which the user selected the camera and gamma value information for the camera via a menu on the image processing device 100, but in this embodiment, the CPU 130 selects the camera and gamma value information obtained via communication from the camera 200. Therefore, the NR setting value is automatically selected according to the gamma value setting value of the connected camera 200. After the CPU 130 executes S332, the process proceeds to S123. The same processing as in the first embodiment is performed from S123 to S125, so a description thereof will be omitted. When the connected camera 200 is changed or the gamma value information of the camera 200 is changed, the CPU 130 automatically performs NR initialization in this subroutine. When the CPU 130 executes the NR mode selection processing of S125, the subroutine in FIG. 20 ends and the process proceeds to S140 in FIG. 18.
図18のS140では、CPU130は第1実施形態と同様の処理が実行されるため説明を省略する。なお、本実施形態におけるS140と第2実施形態の図14で説明したS240に置き換えても以降の処理は同様に実行される。 In S140 of Figure 18, the CPU 130 executes the same processing as in the first embodiment, so the explanation will be omitted. Note that even if S140 in this embodiment is replaced with S240 described in Figure 14 of the second embodiment, the subsequent processing will be executed in the same way.
図18のS150およびS160の処理は第1実施形態と同様の処理が実行されるため説明を省略する。 The processing of S150 and S160 in Figure 18 is the same as that in the first embodiment, so a description thereof will be omitted.
以上、第3実施形態では、カメラ200から直接設定値情報を得ることによって、上述の実施形態と同様の処理を実施可能なことを示した。 As described above, the third embodiment has shown that it is possible to perform processing similar to that of the above-described embodiments by obtaining setting value information directly from the camera 200.
以上、本発明をその好適な実施形態に基づいて詳述してきたが、本発明はこれら特定の実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の様々な形態も本発明に含まれる。上述の実施形態の一部を適宜組み合わせてもよい。 The present invention has been described in detail above based on preferred embodiments, but the present invention is not limited to these specific embodiments, and various forms within the scope of the invention are also included. Parts of the above-described embodiments may be combined as appropriate.
なお、本実施形態では画像処理装置にはカメラからの画像を入力した例を示しているが、カメラ以外の画像出力装置からの入力とした構成においても本発明を実施可能である。 Note that while this embodiment shows an example in which an image is input to the image processing device from a camera, the present invention can also be implemented in a configuration in which input is from an image output device other than a camera.
上述の実施形態の機能を実現するソフトウェアのプログラムを、記録媒体から直接、或いは有線/無線通信を用いてプログラムを実行可能なコンピュータを有するシステム又は装置に供給し、そのプログラムを実行する場合も本発明に含む。 The present invention also includes cases where a software program that realizes the functions of the above-described embodiments is supplied to a system or device having a computer capable of executing the program, either directly from a recording medium or via wired or wireless communication, and the program is then executed.
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータに供給、インストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明の機能処理を実現するためのコンピュータプログラム自体も本発明に含まれる。 Therefore, the program code supplied to and installed on a computer to realize the functional processing of the present invention also realizes the present invention. In other words, the computer program itself for realizing the functional processing of the present invention is also included in the present invention.
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等、プログラムの形態を問わない。 In this case, as long as it has the functionality of a program, the form of the program is irrelevant, such as object code, a program executed by an interpreter, or script data supplied to the OS.
プログラムを供給するための記録媒体としては、例えば、ハードディスク、磁気テープ等の磁気記録媒体、光/光磁気記憶媒体、不揮発性の半導体メモリでもよい。 The recording medium for supplying the program may be, for example, a hard disk, a magnetic recording medium such as magnetic tape, an optical/magneto-optical storage medium, or a non-volatile semiconductor memory.
また、プログラムの供給方法としては、コンピュータネットワーク上のサーバに本発明を形成するコンピュータプログラムを記憶し、接続のあったクライアントコンピュータがコンピュータプログラムをダウンロードしてプログラムするような方法も考えられる。 Another possible method of providing the program is to store the computer program that forms the present invention on a server on a computer network, and have connected client computers download and program the computer program.
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
(Other Examples)
The present invention can also be realized by supplying a program that realizes one or more of the functions of the above-described embodiments to a system or device via a network or a storage medium, and having one or more processors in the computer of the system or device read and execute the program.The present invention can also be realized by a circuit (e.g., an ASIC) that realizes one or more of the functions.
本明細書の開示は、以下の画像処理装置、画像処理方法及びプログラムを含む。
(項目1)
画像のノイズ特性を学習することによって得た第一のパラメータを有する学習済みモデルによって、取得した入力画像を画像処理する画像処理手段と、
前記画像処理された入力画像のノイズを第二のパラメータによって低減するノイズ低減手段と、
前記入力画像と前記ノイズが低減された入力画像とを第三のパラメータに基づいて合成する合成手段と、
前記第一のパラメータ、前記第二のパラメータ、及び、前記第三のパラメータのいずれかを変更する場合、順次取得する複数の入力画像にわたって変更対象のパラメータを制御量および予め設定された参照データのいずれかに基づいて変更して設定する設定手段と、
を備えることを特徴とする画像処理装置。
(項目2)
前記第一のパラメータは、前記入力画像を撮像したカメラに関する情報においてノイズ特性を学習した結果のニューラルネットワークのパラメータである
ことを特徴とする項目1に記載の画像処理装置。
(項目3)
前記第二のパラメータは、前記ノイズを低減する強度を示すパラメータである
ことを特徴とする項目1または項目2に記載の画像処理装置。
(項目4)
前記第三のパラメータは、前記ノイズが低減された入力画像と、前記入力画像とを合成するための比率である
ことを特徴とする項目1から項目3のいずれか1項に記載の画像処理装置。
(項目5)
前記第三のパラメータは、前記ノイズが低減された入力画像の輝度信号と、前記入力画像の輝度信号とを合成するための比率である
ことを特徴とする項目1から項目4のいずれか1項に記載の画像処理装置。
(項目6)
前記第三のパラメータは、前記ノイズが低減された入力画像の色信号と、前記入力画像の色信号とを合成するための比率である
ことを特徴とする項目1から項目5のいずれか1項に記載の画像処理装置。
(項目7)
前記設定手段は、前記入力画像のノイズが多いほど、前記色信号を合成するための比率を低くする
ことを特徴とする項目6に記載の画像処理装置。
(項目8)
前記画像処理手段は、前記第一のパラメータに基づく2系統の学習済みモデルを有し、一方の学習済みモデルが使用中の場合、他方の学習済みモデルの前記第一のパラメータを前記制御量によって複数の入力画像にわたって変更し、
前記一方の学習済みモデルが画像処理して前記ノイズ低減手段がノイズを低減して出力する入力画像と、前記他方の学習済みモデルが画像処理して前記ノイズ低減手段がノイズを低減して出力する入力画像とを合成比率に基づいて合成する画像合成手段を
さらに備えることを特徴とする項目1から項目7のいずれか1項に記載の画像処理装置。
(項目9)
前記合成手段は、変更中の前記第一のパラメータの遷移の進捗に対応させて遷移する前記合成比率に基づいて前記画像を合成する
ことを特徴とする項目8に記載の画像処理装置。
(項目10)
前記設定手段は、前記第二のパラメータ、及び、前記第三のパラメータを、変更対象のパラメータの目標値に近づくように前記制御量を設定してパラメータを変更する
ことを特徴とする項目1から項目9のいずれか1項に記載の画像処理装置。
(項目11)
前記設定手段は、前記第一のパラメータ、及び、前記目標値のいずれかが変更される場合、前記第一のパラメータ、前記第二のパラメータ、及び、前記第三のパラメータを前記制御量に基づいて変更する
ことを特徴とする項目10に記載の画像処理装置。
(項目12)
前記設定手段は、前記制御量と閾値とを比較して、前記制御量が前記閾値よりも大きい場合、前記閾値を前記制御量として設定する
ことを特徴とする項目10に記載の画像処理装置。
(項目13)
前記設定手段は、ユーザによって選択された前記ノイズを低減する強度に応じて、前記目標値を設定する
ことを特徴とする項目12に記載の画像処理装置。
(項目14)
前記設定手段は、前記第二のパラメータおよび前記第三のパラメータの少なくともいずれかを予め保持されている参照データから取得する
ことを特徴とする項目1ないし項目13のいずれか1項目に記載の画像処理装置。
(項目15)
前記設定手段は、複数フレームの画像のゲイン値の平均値に基づいて、前記第二のパラメータおよび前記第三のパラメータの少なくともいずれかを前記参照データから取得する
ことを特徴とする項目14に記載の画像処理装置。
(項目16)
前記設定手段は、前記入力画像を撮像したカメラから取得したカメラに関する情報に基づいて、前記第二のパラメータおよび前記第三のパラメータの少なくともいずれかを設定する
ことを特徴とする項目1ないし項目15のいずれか1項目に記載の画像処理装置。
(項目17)
画像のノイズ特性を学習することによって得た第一のパラメータを有する学習済みモデルによって、取得した入力画像を画像処理する画像処理工程と、
前記画像処理された入力画像のノイズを第二のパラメータによって低減するノイズ低減工程と、
前記入力画像と前記ノイズが低減された入力画像とを第三のパラメータに基づいて合成する合成工程と、
前記第一のパラメータ、前記第二のパラメータ、及び、前記第三のパラメータのいずれかを変更する場合、順次取得する複数の入力画像にわたって変更対象のパラメータを制御量および予め設定された参照データのいずれかに基づいて変更して設定する設定工程と、
を備えることを特徴とする画像処理方法。
(項目18)
コンピュータを、項目1ないし項目16のいずれか1項目に記載の画像処理装置の各手段として機能させるためのプログラム。
The disclosure of this specification includes the following image processing device, image processing method, and program.
(Item 1)
an image processing means for performing image processing on an acquired input image using a trained model having first parameters obtained by training noise characteristics of the image;
a noise reduction means for reducing noise in the image-processed input image using a second parameter;
a synthesis means for synthesizing the input image and the noise-reduced input image based on a third parameter;
a setting means for changing and setting the parameter to be changed across a plurality of input images acquired sequentially based on a control amount or preset reference data when changing any of the first parameter, the second parameter, and the third parameter;
An image processing device comprising:
(Item 2)
2. The image processing device according to item 1, wherein the first parameter is a parameter of a neural network resulting from learning noise characteristics in information relating to a camera that captured the input image.
(Item 3)
3. The image processing device according to claim 1, wherein the second parameter is a parameter indicating a strength of the noise reduction.
(Item 4)
4. The image processing device according to claim 1, wherein the third parameter is a ratio for combining the input image in which the noise has been reduced with the input image.
(Item 5)
5. The image processing device according to claim 1, wherein the third parameter is a ratio for combining the luminance signal of the input image from which the noise has been reduced with the luminance signal of the input image.
(Item 6)
6. The image processing device according to claim 1, wherein the third parameter is a ratio for combining the color signal of the input image from which the noise has been reduced with the color signal of the input image.
(Item 7)
7. The image processing device according to item 6, wherein the setting means lowers the ratio for combining the color signals as the input image has more noise.
(Item 8)
the image processing means has two trained models based on the first parameters, and when one trained model is in use, the first parameters of the other trained model are changed across a plurality of input images using the control amount;
8. The image processing device according to any one of items 1 to 7, further comprising: an image synthesis unit that synthesizes, based on a synthesis ratio, an input image that is processed by the one trained model and output after noise reduction by the noise reduction unit, and an input image that is processed by the other trained model and output after noise reduction by the noise reduction unit.
(Item 9)
9. The image processing device according to item 8, wherein the combining means combines the images based on the combining ratio that changes in accordance with the progress of the change of the first parameter that is being changed.
(Item 10)
10. The image processing device according to any one of items 1 to 9, wherein the setting unit changes the second parameter and the third parameter by setting the control amount so that the second parameter and the third parameter approach target values of the parameters to be changed.
(Item 11)
Item 11. The image processing device according to item 10, wherein the setting means changes the first parameter, the second parameter, and the third parameter based on the control amount when either the first parameter or the target value is changed.
(Item 12)
Item 11. The image processing device according to item 10, wherein the setting means compares the control amount with a threshold value, and if the control amount is greater than the threshold value, sets the threshold value as the control amount.
(Item 13)
13. The image processing device according to item 12, wherein the setting means sets the target value in accordance with a strength for reducing the noise selected by a user.
(Item 14)
14. The image processing device according to any one of items 1 to 13, wherein the setting unit acquires at least one of the second parameter and the third parameter from reference data stored in advance.
(Item 15)
Item 15. The image processing device according to item 14, wherein the setting means acquires at least one of the second parameter and the third parameter from the reference data based on an average value of gain values of images of a plurality of frames.
(Item 16)
16. The image processing device according to any one of items 1 to 15, wherein the setting means sets at least one of the second parameter and the third parameter based on information about a camera acquired from the camera that captured the input image.
(Item 17)
an image processing step of processing an acquired input image using a trained model having first parameters obtained by training noise characteristics of the image;
a noise reduction step of reducing noise in the image-processed input image using a second parameter;
a combining step of combining the input image and the noise-reduced input image based on a third parameter;
a setting step of changing and setting the parameter to be changed across a plurality of input images acquired sequentially based on a control amount or preset reference data when changing any of the first parameter, the second parameter, and the third parameter;
An image processing method comprising:
(Item 18)
A program for causing a computer to function as each means of the image processing device according to any one of items 1 to 16.
発明は上記実施形態に制限されるものではなく、発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、発明の範囲を公にするために請求項を添付する。 The invention is not limited to the above-described embodiments, and various modifications and variations are possible without departing from the spirit and scope of the invention. Therefore, the following claims are appended to clarify the scope of the invention.
100・・・画像処理装置、200・・・カメラ、130・・・CPU、160・・・画像処理部、170・・・画像出力部。 100: Image processing device, 200: Camera, 130: CPU, 160: Image processing unit, 170: Image output unit.
Claims (18)
前記画像処理された入力画像のノイズを強調して低減するための強度パラメータである第二のパラメータによって前記ノイズを低減するノイズ低減手段と、
前記入力画像と前記ノイズが低減された入力画像とを第三のパラメータに基づいて合成する合成手段と、
前記第一のパラメータ、前記第二のパラメータ、及び、前記第三のパラメータのいずれかを変更する場合、順次取得する複数の入力画像にわたって変更対象のパラメータを、ユーザの選択に応じた目標値に近づけるための制御量または予め設定された参照データに基づいて変更して設定する設定手段と、
を備えることを特徴とする画像処理装置。 an image processing means for performing image processing on an acquired input image using a trained model having first parameters which are network parameters of a neural network obtained by training noise characteristics of the image;
a noise reduction means for reducing the noise in the image-processed input image using a second parameter, which is an intensity parameter for emphasizing and reducing the noise ;
a synthesis means for synthesizing the input image and the noise-reduced input image based on a third parameter;
a setting means for changing and setting the parameter to be changed across a plurality of input images acquired sequentially, when changing any of the first parameter, the second parameter, and the third parameter, based on a control amount for bringing the parameter closer to a target value selected by a user or preset reference data;
An image processing device comprising:
ことを特徴とする請求項1に記載の画像処理装置。 The image processing device according to claim 1, wherein the first parameter is a parameter of a neural network resulting from learning noise characteristics from information about the camera , which is information about the model or image quality settings of the camera that captured the input image.
ことを特徴とする請求項1に記載の画像処理装置。 The image processing device according to claim 1 , wherein the second parameter is a parameter indicating a strength of the noise reduction.
ことを特徴とする請求項1に記載の画像処理装置。 The image processing device according to claim 1 , wherein the third parameter is a ratio for combining the input image with the noise-reduced input image.
ことを特徴とする請求項1に記載の画像処理装置。 The image processing device according to claim 1 , wherein the third parameter is a ratio for combining the luminance signal of the input image from which the noise has been reduced with the luminance signal of the input image.
ことを特徴とする請求項1に記載の画像処理装置。 The image processing device according to claim 1 , wherein the third parameter is a ratio for combining the color signal of the input image from which the noise has been reduced with the color signal of the input image.
ことを特徴とする請求項6に記載の画像処理装置。 7. The image processing device according to claim 6, wherein the setting means lowers the ratio for combining the color signals as the input image has more noise.
前記一方の学習済みモデルが画像処理して前記ノイズ低減手段がノイズを低減して出力する入力画像と、前記他方の学習済みモデルが画像処理して前記ノイズ低減手段がノイズを低減して出力する入力画像とを合成比率に基づいて合成する画像合成手段を
さらに備えることを特徴とする請求項1に記載の画像処理装置。 the image processing means has two trained models based on the first parameters, and when one trained model is in use, the first parameters of the other trained model are changed across a plurality of input images using the control amount;
2. The image processing device according to claim 1, further comprising: an image synthesis means for synthesizing, based on a synthesis ratio, an input image that has been image processed by the one trained model and output after noise reduction by the noise reduction means, and an input image that has been image processed by the other trained model and output after noise reduction by the noise reduction means.
ことを特徴とする請求項8に記載の画像処理装置。 The image processing device according to claim 8 , wherein the combining means combines the images based on the combining ratio that changes in accordance with the progress of the change of the first parameter that is being changed.
ことを特徴とする請求項1に記載の画像処理装置。 2. The image processing apparatus according to claim 1, wherein the setting means changes the second parameter and the third parameter by setting the control amount so that the second parameter and the third parameter approach target values of the parameters to be changed.
ことを特徴とする請求項10に記載の画像処理装置。 11. The image processing device according to claim 10, wherein the setting means changes the first parameter, the second parameter, and the third parameter based on the control amount when either the first parameter or the target value is changed.
ことを特徴とする請求項10に記載の画像処理装置。 11. The image processing apparatus according to claim 10, wherein the setting means compares the control amount with a threshold value, and if the control amount is greater than the threshold value, sets the threshold value as the control amount.
ことを特徴とする請求項12に記載の画像処理装置。 13. The image processing apparatus according to claim 12, wherein the setting means sets the target value in accordance with a noise reduction intensity selected by a user.
ことを特徴とする請求項1に記載の画像処理装置。 2. The image processing apparatus according to claim 1, wherein the setting means acquires and sets at least one of the second parameter and the third parameter from reference data stored in advance.
ことを特徴とする請求項14に記載の画像処理装置。 15. The image processing device according to claim 14, wherein the setting means acquires at least one of the second parameter and the third parameter from the reference data based on an average value of gain values of images of a plurality of frames.
ことを特徴とする請求項1に記載の画像処理装置。 The image processing device according to claim 1 , wherein the setting means sets at least one of the second parameter and the third parameter based on information about a camera acquired from the camera that captured the input image.
前記画像処理された入力画像のノイズを強調して低減するための強度パラメータである第二のパラメータによって前記ノイズを低減するノイズ低減工程と、
前記入力画像と前記ノイズが低減された入力画像とを第三のパラメータに基づいて合成する合成工程と、
前記第一のパラメータ、前記第二のパラメータ、及び、前記第三のパラメータのいずれかを変更する場合、順次取得する複数の入力画像にわたって変更対象のパラメータを、ユーザの選択に応じた目標値に近づけるための制御量または予め設定された参照データに基づいて変更して設定する設定工程と、
を備えることを特徴とする画像処理方法。 an image processing step of performing image processing on the acquired input image using a trained model having first parameters which are network parameters of a neural network obtained by training noise characteristics of the image;
a noise reduction step of reducing the noise in the image-processed input image using a second parameter, which is an intensity parameter for emphasizing and reducing the noise ;
a combining step of combining the input image and the noise-reduced input image based on a third parameter;
a setting step of changing and setting the parameter to be changed across a plurality of input images acquired sequentially based on a control amount for bringing the parameter closer to a target value selected by a user or based on preset reference data , when changing any of the first parameter, the second parameter, and the third parameter;
An image processing method comprising:
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US18/887,498 US20250104201A1 (en) | 2023-09-27 | 2024-09-17 | Image processing apparatus, image processing method, and non-transitory computer-readable storage medium |
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2023166226 | 2023-09-27 | ||
| JP2023166226 | 2023-09-27 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2025058872A JP2025058872A (en) | 2025-04-09 |
| JP7748503B2 true JP7748503B2 (en) | 2025-10-02 |
Family
ID=95287376
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2024090281A Active JP7748503B2 (en) | 2023-09-27 | 2024-06-03 | Image processing device, image processing method, and program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7748503B2 (en) |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2021149719A (en) | 2020-03-20 | 2021-09-27 | 株式会社アイシン | Learning device for block noise detection and computer program |
-
2024
- 2024-06-03 JP JP2024090281A patent/JP7748503B2/en active Active
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2021149719A (en) | 2020-03-20 | 2021-09-27 | 株式会社アイシン | Learning device for block noise detection and computer program |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2025058872A (en) | 2025-04-09 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US10194091B2 (en) | Image capturing apparatus, control method therefor, program, and recording medium | |
| CN110619593B (en) | A dual-exposure video imaging system based on dynamic scenes | |
| CN107635102B (en) | Method and device for acquiring exposure compensation value of high-dynamic-range image | |
| CN108200354B (en) | Control method and apparatus, imaging device, computer device, and readable storage medium | |
| CN102905058B (en) | Produce the apparatus and method for eliminating the fuzzy high dynamic range images of ghost image | |
| US10021313B1 (en) | Image adjustment techniques for multiple-frame images | |
| JP7285791B2 (en) | Image processing device, output information control method, and program | |
| CN112703509A (en) | Artificial intelligence techniques for image enhancement | |
| US10972679B2 (en) | Image processing apparatus and method for controlling image processing apparatus | |
| EP3345388A1 (en) | System and method for real-time tone-mapping | |
| WO2014093042A1 (en) | Determining an image capture payload burst structure based on metering image capture sweep | |
| WO2019047620A1 (en) | Imaging device and imaging method | |
| JP2019071568A (en) | Image processing apparatus, image processing method, program, and storage medium | |
| US11394874B2 (en) | Imaging apparatus | |
| CN101197942B (en) | Multi-exposure control method and multi-exposure control device | |
| CN119325721A (en) | Image signal processing method using neural network model and computing device for performing the same | |
| JP7075271B2 (en) | Image processing equipment, information display equipment, control methods, and programs | |
| JP7748503B2 (en) | Image processing device, image processing method, and program | |
| US12501154B2 (en) | Image processing apparatus, image capturing apparatus, information processing method, and storage medium | |
| US20250071412A1 (en) | Methods and systems for enhancing low light frame in a multi camera system | |
| CN110913148B (en) | Method for measuring illumination condition by using double cameras | |
| US20250104201A1 (en) | Image processing apparatus, image processing method, and non-transitory computer-readable storage medium | |
| JP2025049968A (en) | Image processing device, image processing method and program | |
| JP2023155650A (en) | Imaging device, its control method, and program | |
| JP7075272B2 (en) | Image processing equipment, information display equipment, control methods, and programs |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240626 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250616 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250808 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250822 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250919 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7748503 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |