JP7749489B2 - Video analysis device and video analysis method - Google Patents
Video analysis device and video analysis methodInfo
- Publication number
- JP7749489B2 JP7749489B2 JP2022022167A JP2022022167A JP7749489B2 JP 7749489 B2 JP7749489 B2 JP 7749489B2 JP 2022022167 A JP2022022167 A JP 2022022167A JP 2022022167 A JP2022022167 A JP 2022022167A JP 7749489 B2 JP7749489 B2 JP 7749489B2
- Authority
- JP
- Japan
- Prior art keywords
- detection
- information
- image data
- video
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Studio Devices (AREA)
Description
実施形態は、映像、画像を解析する映像解析装置および映像解析方法に関する。 The embodiments relate to a video analysis device and a video analysis method for analyzing videos and images.
ニューラルネットワークを用いた画像認識においては、画像の中から特定の情報を検出する際に、検出窓という一定のサイズ(画素数)の枠を用いる。例えば、映像フレームからデジタルサンプリングにより得た画像に対して、検出窓を用いて情報の検出をしようとした場合、画像の画角(撮影領域)が同一でも解像度が異なると、同じサイズの検出窓に含まれる情報には違いが出る(例えば低解像度の方がより広い領域の情報を拾うこととなる)。通常、画像を拡大したり縮小したりすることで、検出窓のサイズとのバランスが取られる。 In image recognition using neural networks, a frame of a certain size (number of pixels) called a detection window is used to detect specific information from within an image. For example, if you try to use a detection window to detect information in an image obtained by digital sampling from a video frame, even if the image's angle of view (captured area) is the same, if the resolution is different, the information contained in detection windows of the same size will differ (for example, a lower resolution will pick up information from a wider area). Usually, the size of the detection window is balanced by enlarging or reducing the image.
しかしながら、解像度の異なる複数の画像から、同様の大きさの対象物をニューラルネットワークで検出する場合、検出窓内の情報の違いにより、安定した学習を行うことが困難であり、また検出窓に合わせて画像のサイズを縮小すると特徴量が失われてしまう問題がある。 However, when using a neural network to detect objects of similar size from multiple images with different resolutions, differences in the information within the detection window make it difficult to perform stable learning, and there is also the problem that features are lost when the image size is reduced to fit the detection window.
本発明が解決しようとする課題は、解像度の異なる複数の画像データを解析する映像解
析装置処理、方法を提供することを目的とする。
The problem to be solved by the present invention is to provide a video analysis device and method for analyzing a plurality of image data with different resolutions.
一実施形態に係る映像解析装置は、映像フレームをデジタルサンプリングして得た画像
データの解像度に応じてニューラルネットワークの検出窓のサイズ及びモデルパラメータ
を切り替えて、多様性をもたせており、各種の前記画像データから検出対象を検出する。
In one embodiment, the video analysis device switches the size of the detection window and model parameters of the neural network depending on the resolution of the image data obtained by digitally sampling the video frame , thereby providing diversity and detecting the target object from various types of image data.
以下、実施の形態について図面を参照して説明する。
(第1の実施形態)
例えば同じ場面を撮影した映像からデジタルサンプリングにより画像を取得する場合、デジタルサンプリングによっては画像の解像度が異なることがある。本実施形態においては、ニューラルネットワークを用いて、画角(撮影範囲)が同一もしくは同様であるが解像度の異なる複数の画像データからだいたい一定の大きさとなる対象(検出対象と称する)を検出する例を示す。
Hereinafter, embodiments will be described with reference to the drawings.
(First embodiment)
For example, when images are acquired by digital sampling from video footage of the same scene, the resolution of the images may differ depending on the digital sampling. In this embodiment, an example is shown in which a neural network is used to detect an object (referred to as a detection object) of roughly the same size from multiple image data sets that have the same or similar angle of view (photographing range) but different resolutions.
図1は、実施形態に係る映像解析装置の構成図である。 Figure 1 is a diagram showing the configuration of a video analysis device according to an embodiment.
映像解析装置1は、入力された映像や画像から検出対象を検出し、外部に出力する装置であり、CPUやメモリなどのコンピュータ、DSP(Digital Signal Processor)などのデジタル信号処理手段を備えていてもよい。 The video analysis device 1 is a device that detects a detection target from input video or images and outputs the result to the outside, and may be equipped with a computer such as a CPU and memory, and digital signal processing means such as a DSP (Digital Signal Processor).
映像入力部11は、外部からデジタルデータである画像データを映像解析装置1に取り込み、画像データを出力する。入力される画像データは、映像データの静止画像など任意の画像データであってよい。映像入力部11は、入力された画像データからメタ情報(画素数または解像度)を取り出して、画角取得部12に画角情報としてメタ情報を出力する。
また、映像入力部11は、画像データを出力する際に、例えば解析を実行しようとする画像データのサンプルを用いて、サンプルに合わせるように出力する画像データの画角(撮影範囲)を調整することでもよい。
The video input unit 11 inputs digital image data from the outside into the video analysis device 1 and outputs the image data. The input image data may be any image data, such as a still image of video data. The video input unit 11 extracts meta information (number of pixels or resolution) from the input image data and outputs the meta information to the field of view acquisition unit 12 as field of view information.
In addition, when outputting image data, the video input unit 11 may, for example, use a sample of the image data on which analysis is to be performed and adjust the angle of view (shooting range) of the image data to be output so that it matches the sample.
画角取得部12は、映像入力部11から画角情報を取得する。 The field of view acquisition unit 12 acquires field of view information from the video input unit 11.
検出用NN選択部13は、画角取得部12から入力される画角情報などに基づいて、画像データから検出対象を検出するためのニューラルネットワークNNを選択する。ニューラルネットワークNNは、例えばDeep Neural Network(DNN)であり、Convolutional Neural Network(CNN)を含んでもよい。また、ニューラルネットワークNNは、Recurrent Neural Network(RNN)、Long Term Short Memory(LTSM)など任意のニューラルネットワークを含めてもよい。各種ニューラルネットワークは一般的な技術であり、説明を省略する。 The detection NN selector 13 selects a neural network NN for detecting the detection target from the image data based on the field of view information input from the field of view acquisition unit 12. The neural network NN is, for example, a Deep Neural Network (DNN) and may also include a Convolutional Neural Network (CNN). The neural network NN may also include any neural network such as a Recurrent Neural Network (RNN) or a Long Term Short Memory (LTSM). These various neural networks are common technologies, and therefore will not be described here.
ニューラルネットワークNNは、検出窓サイズをパラメータとして備える。検出窓は、画像データから検出対象を検出するための画像データ上の領域を示し、検出窓サイズは、検出窓に含まれる画素数を示す。 The neural network NN has a detection window size as a parameter. The detection window indicates the area on the image data for detecting the detection target from the image data, and the detection window size indicates the number of pixels included in the detection window.
記憶部14は、メモリであり、テーブル141やNNモデルパラメータ142など各種情報が格納される。 The storage unit 14 is a memory that stores various information such as a table 141 and NN model parameters 142.
テーブル141は、映像入力部11から入力された画像データの画角情報ごとに、紐づけられたニューラルネットワークNNの検出窓サイズ、NNモデルなどが格納されている。すなわち、画像データの画角情報ごとにニューラルネットワークNNを紐づけられたNNモデルに変えることを示す。例えば、データTB1は、映像入力部11から入力された画像データの解像度が720[画素数]×480[画素数]の場合、NNモデルを検出用NN1とし、検出用NN1の検出窓サイズは、16×16とするニューラルネットワークNNを用いて、画像データを処理することを示す。テーブル141は、出荷時に設定されていることでもよいし、また映像解析装置1がインターネット経由でサーバなどからダウンロードして取得することでもよい。その他任意の方法でテーブル141を記憶部14に設定できるようにしてもよい。 Table 141 stores the detection window size and NN model of the associated neural network NN for each piece of field-of-view information for image data input from the video input unit 11. In other words, it indicates that the neural network NN is changed to the associated NN model for each piece of field-of-view information for the image data. For example, data TB1 indicates that when the resolution of the image data input from the video input unit 11 is 720 [number of pixels] x 480 [number of pixels], the image data is processed using a neural network NN with the NN model set to detection NN1 and the detection window size of the detection NN1 set to 16 x 16. Table 141 may be set at the time of shipment, or may be acquired by the video analysis device 1 by downloading it from a server or the like via the Internet. Table 141 may also be set in the storage unit 14 in any other manner.
NNモデルパラメータ142は、ニューラルネットワークNNで用いられるパラメータであり、テーブル141における使用NNモデルに相当するニューラルネットワークNNのパラメータである。例えば、データTB1の検出用NN1のモデルパラメータは、MP1であり、データTB2の検出用NN2のモデルパラメータは、MP2であり、データTB2の検出用NN2のモデルパラメータは、MP3であることを示す。NNモデルパラメータ142は、テーブル141で設定される検出窓サイズのデータで学習されて得られているものとする。 NN model parameters 142 are parameters used in the neural network NN, and are parameters of the neural network NN corresponding to the NN model used in table 141. For example, the model parameters of NN1 for detecting data TB1 are MP1, the model parameters of NN2 for detecting data TB2 are MP2, and the model parameters of NN2 for detecting data TB2 are MP3. The NN model parameters 142 are assumed to have been obtained by learning using data of the detection window size set in table 141.
画像認識部15は、映像入力部11が取り込んだ画像データに対して、検出用NN選択部13によって選択されたニューラルネットワークNNを実行する。 The image recognition unit 15 runs the neural network NN selected by the detection NN selection unit 13 on the image data captured by the video input unit 11.
特徴検出部151は、画像認識部15の機能の一部としてニューラルネットワークNNによる特徴検出を実行する。特徴検出部151は、例えばCNNであってもよい。 The feature detection unit 151 performs feature detection using a neural network (NN) as part of the functions of the image recognition unit 15. The feature detection unit 151 may be, for example, a CNN.
領域計算部152は、映像入力部11が取り込んだ画像データに対して、画像認識による特定の物体の検出を実行する。領域計算部152は、一般的なオブジェクト認識手法を用いてもよいし、ニューラルネットワークであってもよい。 The region calculation unit 152 performs image recognition to detect specific objects in the image data captured by the video input unit 11. The region calculation unit 152 may use a general object recognition method or a neural network.
結果出力部16は、画像認識部15によって解析した結果を図示せぬモニタなどの外部装置へ出力する。 The result output unit 16 outputs the results of analysis by the image recognition unit 15 to an external device such as a monitor (not shown).
図2は、実施形態に係る映像解析装置が解析処理するデータフローの例を示す模式図である。本実施形態の映像解析装置1は、リンゴを解析対象AOとし、リンゴ上の虫食いなどのキズを検出する。虫食いなどのキズを検出対象DOと称する。 Figure 2 is a schematic diagram showing an example of the data flow used for analysis processing by a video analysis device according to an embodiment. The video analysis device 1 of this embodiment uses an apple as the analysis object AO and detects defects such as worm holes on the apple. The defects such as worm holes are referred to as the detection object DO.
映像解析装置1は、解析対象AOであるリンゴの撮影データのデジタルサンプリングによって、低解像度の画像データSD1のデータを得たとする。 Let's say that the video analysis device 1 obtains low-resolution image data SD1 by digitally sampling the photographic data of the apple, which is the analysis target AO.
画角取得部12は、低解像度の画像データSD1が入力されると、画角情報を取得し、検出用NN選択部13に入力する。検出用NN選択部13は、入力された画角情報の解像度に基づいて記憶部14から情報を取得し、検出窓サイズDW1を5×7、検出用NNのモデルを低解像度用のDNN(検出用のニューラルネットワークNN1)とする。画像認識部15は、ニューラルネットワークNN1で、画像データSD1を解析する。ここでニューラルネットワークNN1は、検出対象DOの含まれた検出窓サイズDW1のデータで学習されているものとする。画像認識部15の解析により、画像データSD1から検出対象DOが検出される。 When low-resolution image data SD1 is input, the field of view acquisition unit 12 acquires field of view information and inputs it to the detection NN selection unit 13. The detection NN selection unit 13 acquires information from the memory unit 14 based on the resolution of the input field of view information, sets the detection window size DW1 to 5x7, and sets the detection NN model to a low-resolution DNN (detection neural network NN1). The image recognition unit 15 analyzes the image data SD1 using the neural network NN1. Here, it is assumed that the neural network NN1 has been trained using data of the detection window size DW1 that includes the detection target DO. The detection target DO is detected from the image data SD1 through the analysis by the image recognition unit 15.
同様に、映像解析装置1は、解析対象AOであるリンゴの撮影データのデジタルサンプリングによって、高解像度の画像データSD2のデータを得た場合、画像認識部15は、検出窓サイズDW2を25×37、検出用NNのモデルを高解像度用のDNN(検出用のニューラルネットワークNN2)で、画像データSD2を解析する。画像データSD2の画角は画像データSD1と同様であるものとし、図2に示すように画像データSD1、SD2において、画像データSDの大きさに対する解析対象AOであるりんごの大きさは同様であるものとする。ニューラルネットワークNN2は、検出対象DOの含まれた検出窓サイズDW2のデータで学習されているものとし、画像認識部15の解析により、画像データSD2から検出対象DOが検出される。 Similarly, when the video analysis device 1 obtains high-resolution image data SD2 by digitally sampling photographic data of an apple, which is the analysis object AO, the image recognition unit 15 analyzes the image data SD2 using a detection window size DW2 of 25 x 37 and a high-resolution DNN (detection neural network NN2) as the detection NN model. The image data SD2 has the same angle of view as the image data SD1, and as shown in Figure 2, the size of the apple, which is the analysis object AO, relative to the size of the image data SD is similar in the image data SD1 and SD2. The neural network NN2 is trained using data with a detection window size DW2 that includes the detection object DO, and the detection object DO is detected from the image data SD2 through analysis by the image recognition unit 15.
なお、画像データSD1またはSD2、検出窓サイズDW1またはDW2、ニューラルネットワークNN1またはNN2は、特に区別しない場合は、それぞれ画像データSD、検出窓サイズDW、ニューラルネットワークNNと称する。また、本実施形態において、映像解析装置1は、図1のテーブル141、NNモデルパラメータ142においてそれぞれ3つのデータを備える場合について示すが、3つ以上備えていてもよい。 Note that, unless otherwise specified, image data SD1 or SD2, detection window size DW1 or DW2, and neural network NN1 or NN2 will be referred to as image data SD, detection window size DW, and neural network NN, respectively. Also, in this embodiment, the video analysis device 1 is shown with three pieces of data each in table 141 and NN model parameters 142 in Figure 1, but may have more than three pieces of data.
図3は、実施形態に係る映像解析装置による解析処理を示すフローチャートである。 Figure 3 is a flowchart showing the analysis process performed by the video analysis device according to the embodiment.
映像解析装置1において、映像入力部11は、解析対象AO(図2におけるりんごに相当する)を含む画像データSD(静止画像)を得ると、画角取得部12は、画像データSDの画角情報を取得する(ステップ101)。なお、画角取得部12は、静止画像を用いずに、別の経路で例えばユーザの設定などにより画角情報を取得してもよい。 In the video analysis device 1, the video input unit 11 obtains image data SD (still image) including an analysis object AO (corresponding to the apple in Figure 2), and the field of view acquisition unit 12 acquires field of view information for the image data SD (step 101). Note that the field of view acquisition unit 12 may also acquire field of view information via a different route, for example, through user settings, without using a still image.
検出用NN選択部13は、記憶部14のテーブル141(画角と検出窓サイズおよびNNモデルの関係テーブル)の情報を利用して、ステップS101において取得された画角情報に紐づけられた使用NNモデルを選択する(ステップS102)。図1のTB1の例でより具体的に説明すると、検出用NN選択部13は、ステップS101において取得された解像度情報「720×480」に紐づけられた検出窓サイズDW「16×16」、検出用NNのモデル「検出用NN1」を選択する。 The detection NN selector 13 uses information from table 141 (a table showing the relationship between field of view, detection window size, and NN model) in the storage unit 14 to select the NN model to use that is linked to the field of view information acquired in step S101 (step S102). To explain this more specifically using the example of TB1 in Figure 1, the detection NN selector 13 selects the detection window size DW "16x16" and the detection NN model "detection NN1" that are linked to the resolution information "720x480" acquired in step S101.
検出用NN選択部13は、選択したNN情報および検出窓サイズを画像認識部15に伝えると、画像認識部15は、映像入力部が出力した画像データから対象となる物体(検出対象DO)の検出処理を行う(ステップ103)。より具体的にステップ103においては、画像SD全体を画像認識部15のNNへの入力に使うのではなく、検出窓DWの単位でNNへ入力する。検出窓DWは画像SDのサイズより小さいため、画像認識部15は、例えばまず画像SD上にて検出窓位置(範囲1とする)を決定して、範囲1についてNN計算して解析する。範囲1の解析が終了したら、また別の検出窓位置(範囲2とする)を決定して、範囲2についてNN計算するという流れで解析を実行する。以降、検出窓位置を少しずつずらして画像全体に対する解析を実行することでもよい。 The detection NN selector 13 then transmits the selected NN information and detection window size to the image recognition unit 15, which then performs a detection process for the target object (detection target DO) from the image data output by the video input unit (step 103). More specifically, in step 103, rather than using the entire image SD as input to the NN of the image recognition unit 15, input is made to the NN in units of detection windows DW. Because the detection window DW is smaller than the size of the image SD, the image recognition unit 15, for example, first determines the detection window position (say, range 1) on the image SD and performs NN calculations and analysis on range 1. After analysis of range 1 is complete, another detection window position (say, range 2) is determined and NN calculations are performed on range 2, and so on. Subsequently, the detection window position may be shifted slightly to perform analysis on the entire image.
NN計算の結果、検出対象が検出された場合、結果出力部16は、図示せぬモニタなどに出力することでもよい(ステップ104)。ステップ104における出力方法は、何かしらの映像を画面に出しても良いし、ログとして記憶部14などのファイルに保管する方法でもよい。 If the target is detected as a result of the NN calculation, the result output unit 16 may output the result to a monitor (not shown) or the like (step 104). The output method in step 104 may be to display some kind of image on the screen, or to store the result as a log in a file such as the memory unit 14.
以上の手順により、画角は同様だが解像度の異なる複数の画像データSDに対して、各画像SD中において一定の大きさである検出対象DOを検出することができる。 By following the above procedure, it is possible to detect a detection target DO of a consistent size in each image SD for multiple image data SDs with the same angle of view but different resolutions.
図4は、実施形態に係る映像解析装置が解析処理する映像サンプリングデータの例を示す模式図である。映像入力部11への入力データの種類(映像、画像など)および検出対象DOなどの性質により、検出範囲DAを決定することが考えられる。 Figure 4 is a schematic diagram showing an example of video sampling data analyzed by a video analysis device according to an embodiment. The detection range DA can be determined based on the type of input data (video, image, etc.) to the video input unit 11 and the characteristics of the detection target DO, etc.
図4(a)は、画像データSD1に複数の検出対象DO11、DO12が存在する場合の例である。映像解析装置1は、画像データSD1全体に検出窓DWを移動させながら図3の処理を実行することにより、検出対象DO11、DO12が検出できる。例えば、製品の品質チェックにおいて、製品の撮影映像を映像解析装置1に入力することにより、解析対象の製品にいくつの異常があるかを検出することができる。また例えば製品の良品検査においては、1つでも異常が検出された時点で不合格とする場合、結果出力部16などが結果を出力するとともに、画像認識部15における認識プロセスを終了させることでもよい。図4(b)以降については、以下の実施形態において説明する。
(第2の実施形態)
本実施形態は、図4(b)のケースにおいて検出対象DOを検出する例を示す。
FIG. 4A shows an example in which multiple detection targets DO11 and DO12 are present in image data SD1. The video analysis device 1 can detect the detection targets DO11 and DO12 by executing the process of FIG. 3 while moving the detection window DW over the entire image data SD1. For example, in a product quality check, a captured video of the product can be input into the video analysis device 1 to detect how many abnormalities exist in the product being analyzed. Furthermore, in a non-defective product inspection, if even one abnormality is detected, the product is deemed to have failed, and the result output unit 16 or the like may output the result and terminate the recognition process in the image recognition unit 15. Figures 4B and subsequent figures will be described in the following embodiments.
Second Embodiment
In this embodiment, an example of detecting the detection object DO in the case of FIG. 4B will be described.
図4(b)は、画像データSD2上の既知の特定領域に、1つもしくは複数の検出対象DOが存在する場合の例である。図4(b)のように、画像データSD2内において対象物が存在する領域DAが決まっている場合、映像解析装置1は、既知の特定領域を検出範囲DAとし、その検出範囲DAのみ認識を実行することでもよい。 Figure 4(b) shows an example where one or more detection targets DO exist in a known specific area on the image data SD2. As in Figure 4(b), when the area DA in which the target exists within the image data SD2 is determined, the video analysis device 1 may set the known specific area as the detection range DA and perform recognition only within that detection range DA.
図5は、第2の実施形態に係る映像解析装置による解析処理を示すフローチャートである。 Figure 5 is a flowchart showing the analysis process performed by the video analysis device according to the second embodiment.
画角取得部12は、入力画像データSD2の画角情報を取得し、検出用NN選択部13に入力する(ステップS201)。検出用NN選択部13は、検出対象DO、検出範囲DAを取得する(ステップS202)。検出対象DO、検出範囲DAは、映像解析装置1に接続された例えばキーボードなどからユーザが設定してもよいし、図4(b)のようなイメージを映像解析装置1に接続した図示せぬモニタなどに表示して、ユーザが検出対象DO、検出範囲DAを設定できるようにしてもよい。 The field of view acquisition unit 12 acquires field of view information of the input image data SD2 and inputs it to the detection NN selection unit 13 (step S201). The detection NN selection unit 13 acquires the detection target DO and detection range DA (step S202). The detection target DO and detection range DA may be set by the user using, for example, a keyboard connected to the video analysis device 1, or an image such as that shown in Figure 4(b) may be displayed on a monitor (not shown) connected to the video analysis device 1, allowing the user to set the detection target DO and detection range DA.
検出用NN選択部13は、入力された画角情報、検出対象DO、検出範囲DAに従って、検出窓サイズおよびNNモデルを選択し、画像認識部15に設定する(ステップS202)。 The detection NN selection unit 13 selects a detection window size and NN model based on the input field of view information, detection target DO, and detection range DA, and sets them in the image recognition unit 15 (step S202).
図6は、第2の実施形態に係る映像解析装置が備えるテーブルデータの例である。 Figure 6 shows an example of table data provided in the video analysis device according to the second embodiment.
テーブル1411は、記憶部14に備えられたデータであり、図1のテーブル141の内容に加え、入力画像の解像度に「検出対象」、「検出範囲」が紐づけられている。例えば、データTB11は、映像入力部11から入力された画像データの解像度が720×480の場合、解析に使用するニューラルネットワークNNのモデルを「検出用NN1」、検出用NN1の検出窓サイズを「16×16」(例えば図4(b)のDW21とする)、検出対象DOを「X部の異常」(例えば図4(b)のDO21とする)、検出範囲DAを「360x100+320x120」(例えば図4(b)のDA21とする)とすることを示す。検出対象DO21は、「X部の異常」として予めキズなどの異常の種類が決まっており、さらに検出範囲DA21が座標(x1、y1)=(360、100)、(x2、y2)=(320x120)の2点を対角とする四角であることを示す。本実施形態における検出用NN1は、検出対象DO21「X部の異常」を含む検出窓DW21「16×16」の画像データで学習がなされる。 Table 1411 is data stored in the memory unit 14, and in addition to the contents of Table 141 in Figure 1, the "detection target" and "detection range" are linked to the resolution of the input image. For example, data TB11 indicates that when the resolution of image data input from the video input unit 11 is 720 x 480, the model of the neural network NN used for analysis is "detection NN1," the detection window size of the detection NN1 is "16 x 16" (e.g., DW21 in Figure 4(b)), the detection target DO is "abnormality in part X" (e.g., DO21 in Figure 4(b)), and the detection range DA is "360 x 100 + 320 x 120" (e.g., DA21 in Figure 4(b)). The type of abnormality, such as a scratch, of the detection object DO21 has been determined in advance as "abnormality in part X," and the detection range DA21 is a square with two diagonal corners at coordinates (x1, y1) = (360, 100) and (x2, y2) = (320x120). In this embodiment, the detection NN1 is trained using image data of the "16x16" detection window DW21, which includes the "abnormality in part X" of the detection object DO21.
また例えば、データTB14は、映像入力部11から入力された画像データの解像度が720×480の場合、解析に使用するニューラルネットワークNNのモデルを「検出用NN1」、検出用NN1の検出窓サイズを「16×16」(例えば図4(b)のDW22とする)、検出対象DOを「Y部の異常」(例えば図4(b)のDO22とする)、検出範囲DAを「180x240+240x240」(例えば図4(b)のDA22とする)とすることを示す。本実施形態における検出用NN1は、データTB11による学習に加え、データTB14による学習もなされる。なお、図4(b)のDW21、DW22の例のように、検出対象DOの種類によって、検出窓DWのサイズを変更してもよい。この場合は、ニューラルネットワークNNは、それぞれの検出窓DWのサイズを用いて学習させ、異なるニューラルネットワークNNとすることでもよい。例えば図4(b)において、特に検出対象DO21(例えばX部異常とする)、検出対象DO21(例えばY部異常とする)の特徴が大きく異なるときには、それぞれ別に学習した専用のNNを使う方が、検出対象DOの認識精度が高くなることがある。 For example, when the resolution of the image data input from the video input unit 11 is 720x480, data TB14 indicates that the neural network NN model used for analysis is "Detection NN1," the detection window size of the detection NN1 is "16x16" (e.g., DW22 in Figure 4(b)), the detection target DO is "Y section abnormality" (e.g., DO22 in Figure 4(b)), and the detection range DA is "180x240+240x240" (e.g., DA22 in Figure 4(b)). In this embodiment, the detection NN1 is trained using data TB11 as well as data TB14. Note that the size of the detection window DW may be changed depending on the type of detection target DO, as in the examples of DW21 and DW22 in Figure 4(b). In this case, the neural network NN may be trained using each detection window DW size to create a different neural network NN. For example, in Figure 4(b), when the characteristics of the detection target DO21 (for example, an abnormality in part X) and the detection target DO21 (for example, an abnormality in part Y) are significantly different, using dedicated NNs that have been trained separately for each may result in higher recognition accuracy for the detection target DO.
図5に戻り、検出用NN選択部13は、記憶部14などに格納されたテーブル1411の情報から使用NNモデルを選択する(ステップS203)。画像認識部15は、検出範囲DAにおける検出窓DWの範囲について、ステップS203で選択したNNにより検出対象DOの検出処理を実行する(ステップS204)。ステップS204において検出対象DOが検出された場合(例えば図4(b)のDW21とする)、結果出力部16は、検出した検出対象DOの位置などの情報を記憶部14などに格納することでもよい(ステップS205のYes、ステップS206)。なお、ステップS206の代わりにステップS208に移り、結果出力部16に結果を出力することでもよい。 Returning to FIG. 5, the detection NN selector 13 selects the NN model to use from the information in table 1411 stored in the memory unit 14 or the like (step S203). The image recognition unit 15 executes a detection process for the detection target DO using the NN selected in step S203 for the range of the detection window DW in the detection range DA (step S204). If a detection target DO is detected in step S204 (for example, DW21 in FIG. 4(b)), the result output unit 16 may store information such as the position of the detected detection target DO in the memory unit 14 or the like (Yes in step S205, step S206). Note that instead of step S206, the process may proceed to step S208, where the result is output to the result output unit 16.
ステップS204において検出対象DOが検出されなかった場合(例えば、図4(b)のDA23の例)、次の検出範囲DAに移り、ステップS203から同様の処理を繰り返す(ステップS205のNo、ステップS207のNo)。全ての検出範囲DAに対する処理が終了したら、ステップS206で格納した検出対象DOの情報を結果出力部16に結果を出力することでもよい(ステップS207のYes、ステップS208)。 If the detection target DO is not detected in step S204 (for example, the example of DA23 in Figure 4(b)), the process moves to the next detection range DA and repeats the same process from step S203 (No in step S205, No in step S207). Once processing for all detection ranges DA has been completed, the information on the detection target DO stored in step S206 may be output to the result output unit 16 (Yes in step S207, step S208).
以上の手順により、複数の検出範囲DAに対する画像認識が可能となる。本実施形態においては、検出対象DOの認識範囲を映像全体ではなく、事前に設定した範囲(検出範囲DA)にのみ行うため、短時間で処理ができる。
(第3の実施形態)
本実施形態においては、図4(c)の例のように、映像内に映っているある物体(解析対象AO)の領域において検出対象DOを検出する例について示す。本実施形態の映像解析装置1は、例えば、食品検査において、映像(画像データSD)に映っている解析対象AOの異常を検査しようとした場合、まず解析対象AOの検出を行い、その解析対象AOの領域に対して検出対象DOの検出を行う。
The above procedure enables image recognition for multiple detection ranges DA. In this embodiment, the recognition range of the detection target DO is not the entire image, but is limited to a pre-set range (detection range DA), so processing can be completed in a short time.
(Third embodiment)
4C, an example is shown in which a detection target DO is detected in the area of a certain object (analysis target AO) shown in a video. For example, in food inspection, when an abnormality in the analysis target AO shown in a video (image data SD) is to be inspected, the video analysis device 1 of this embodiment first detects the analysis target AO, and then detects the detection target DO in the area of the analysis target AO.
図7は、第3の実施形態に係る映像解析装置による解析処理を示すフローチャートである。以下、図4(c)を例として説明する。 Figure 7 is a flowchart showing the analysis process performed by the video analysis device according to the third embodiment. The following explanation uses Figure 4(c) as an example.
画角取得部12は、入力画像データSD3の画角情報を取得し、検出用NN選択部13に入力する(ステップS301)。また同時に画像認識部15においては、領域計算部152が画像データSD3に対して解析対象AOの検出処理をする(ステップS302)。ステップS302において、画像認識部15は、解析対象AOに関する情報(例えば、りんご)が予め設定されていることでもよい。例えば映像解析装置1に接続されたキーボードなどから、ユーザが画像認識部15に解析対象AOに関する情報を設定することでもよい。 The field of view acquisition unit 12 acquires field of view information for the input image data SD3 and inputs it to the detection NN selection unit 13 (step S301). At the same time, in the image recognition unit 15, the area calculation unit 152 performs a detection process for the analysis target AO on the image data SD3 (step S302). In step S302, the image recognition unit 15 may have information about the analysis target AO (e.g., an apple) preset therein. Alternatively, the user may enter information about the analysis target AO into the image recognition unit 15 using, for example, a keyboard connected to the video analysis device 1.
領域計算部152は、入力された画像データSD3から解析対象AOの検出およびその領域の特定を行う。例えばリンゴの品質管理を行う例において、画像データSD3内に複数のリンゴが存在した場合、それらリンゴの表示エリアを計算し、取得する。この特定には一般的なオブジェクト認識手法を用いる。表示エリアは、解析対象AOそのものの形としてもよいし、解析対象AOを含む矩形などとして表してもいいし、その他のフォーマットで表現しても良い。画像認識部15は、算出された表示エリアを検出範囲DAとする。図4(c)の例では、ステップS302において、解析対象AOとして解析対象AO3、解析対象AO31が検出される。 The area calculation unit 152 detects the analysis target AO from the input image data SD3 and identifies its area. For example, in an example of apple quality control, if there are multiple apples in the image data SD3, the display area of those apples is calculated and obtained. A general object recognition method is used for this identification. The display area may be the shape of the analysis target AO itself, or it may be expressed as a rectangle containing the analysis target AO, or it may be expressed in some other format. The image recognition unit 15 sets the calculated display area as the detection range DA. In the example of Figure 4(c), in step S302, analysis target AO3 and analysis target AO31 are detected as the analysis targets AO.
検出用NN選択部13は、入力された画角情報、検出対象DOを含む情報から、例えば図6のテーブル1411で紐づけられた検出窓サイズおよびNNモデルを選択し、画像認識部15に設定する(ステップS303)。画像認識部15は、入力映像の中の、領域計算部152から与えられた検出範囲DA(解析対象AOの表示エリアに相当)に対して、選択された検出用NNにより検出対象DOの検出処理を行う(ステップS304)。ステップS304における処理の結果はモニタなどに出力されることでもよい(ステップS305)。ステップS303からS305の手順を、ステップS302において検出された解析対象AOすべてに対して実行することでもよい。 The detection NN selection unit 13 selects a detection window size and NN model linked, for example, to table 1411 in FIG. 6 from the input information including the angle of view information and detection target DO, and sets these in the image recognition unit 15 (step S303). The image recognition unit 15 performs detection processing of the detection target DO using the selected detection NN for the detection range DA (corresponding to the display area of the analysis target AO) provided by the area calculation unit 152 in the input video (step S304). The results of the processing in step S304 may be output to a monitor, etc. (step S305). The procedures from steps S303 to S305 may be performed for all analysis target AO detected in step S302.
本実施形態の映像解析装置1によれば、検出対象DOの認識範囲を映像全体ではなく、事前に取得した解析対象AOの表示エリアを検出範囲DAとすることで、短時間で検出対象DOの検出ができる。
(第4の実施形態)
本実施形態においては、図4(d)の例のように、画像データSD内に散らばっている検出対象DOを検出する例について示す。例えば、アナログデータである映像フィルム(フィルムの1枚1枚)には、フィルムグレインという現象が発生することがある。本実施形態の映像解析装置1は、例えば画像データSDにおいて、検出窓の位置をランダムに決めて、検出窓内の画像データに対してフィルムグレインの検出処理する例を示す。
According to the video analysis device 1 of this embodiment, the recognition range of the detection target DO is not the entire video, but the display area of the analysis target AO acquired in advance is set as the detection range DA, thereby enabling the detection target DO to be detected in a short time.
(Fourth embodiment)
In this embodiment, an example is shown in Fig. 4(d) in which detection targets DO scattered within image data SD are detected. For example, a phenomenon called film grain may occur in video film (each frame of the film), which is analog data. In this embodiment, the video analysis device 1 randomly determines the position of a detection window in the image data SD, for example, and performs film grain detection processing on the image data within the detection window.
図8は、第4の実施形態に係る映像解析装置による解析処理を示すフローチャートである。以下、図4(d)を例として説明する。 Figure 8 is a flowchart showing the analysis process performed by the video analysis device according to the fourth embodiment. The following explanation uses Figure 4(d) as an example.
画角取得部12は、入力画像データSD4の画角情報を取得し、検出用NN選択部13に入力する(ステップS401)。検出用NN選択部13は、検出対象DO(フィルムグレインに相当する)の情報を取得する(ステップS402)。検出対象DOの情報は、映像解析装置1に接続された例えばキーボードなどからユーザが検出用NN選択部13に設定してもよい。 The field of view acquisition unit 12 acquires field of view information of the input image data SD4 and inputs it to the detection NN selection unit 13 (step S401). The detection NN selection unit 13 acquires information on the detection target DO (equivalent to film grain) (step S402). The information on the detection target DO may be set in the detection NN selection unit 13 by the user via, for example, a keyboard connected to the video analysis device 1.
検出用NN選択部13は、取得した画角情報、検出対象DOに従って、例えば図6のテーブル1411から、紐づけられる検出窓サイズおよびNNモデルを選択し、画像認識部15に設定する(ステップS403)。ステップS403において選択されたニューラルネットワークNNは、例えば図6のテーブル1411における検出対象「フィルムグレイン」を含む検出窓サイズのデータで予めフィルムグレインが学習されている。 The detection NN selection unit 13 selects the associated detection window size and NN model from, for example, table 1411 in FIG. 6 according to the acquired field of view information and detection target DO, and sets them in the image recognition unit 15 (step S403). The neural network NN selected in step S403 has previously learned film grain using data on the detection window size that includes the detection target "film grain" in table 1411 in FIG. 6, for example.
また、図6のテーブル1411において、検出対象「フィルムグレイン」に対してさらに紐づける項目を増やしてもよい。例えば、項目としてフィルムグレインを検出する映像フィルムの「撮影年代」、実写、アニメなどの「映像種類」が考えられる。また映像フィルムから画像データを取り出すプロセスの違い、例えば、アナログデータからデジタル化したデータか、デジタル化したデータをさらにサンプリングしたデータかなどの「デジタル化プロセス」、ブルーレイ、DVD、4K/2Kブルーレイなどの「データ源」、フィルムのサイズ(8mm、16mm、24mm、35mmなど)の「フィルムサイズ」などの項目も考えられる。これらの項目を考慮した場合には、それぞれに対してニューラルネットワークNNの検出窓サイズおよびNNモデルを設定することでもよい。また、項目の組み合わせによって、別々のNNモデルを設定することでもよく、組み合わせた項目に合致するデータを用いて紐づけられたNNモデルの学習を実施する。 In addition, in table 1411 of FIG. 6, further items may be linked to the detection target "film grain." For example, possible items include the "filming era" of the footage for which film grain is to be detected, and the "video type" (live action, animation, etc.). Other possible items include the "digitization process" (e.g., whether the data is digitized from analog data or data obtained by further sampling the digitized data) used to extract image data from the footage, the "data source" (e.g., Blu-ray, DVD, 4K/2K Blu-ray), and the "film size" (e.g., 8mm, 16mm, 24mm, 35mm). When these items are taken into consideration, it is possible to set a detection window size and NN model for the neural network NN for each item. Furthermore, different NN models may be set depending on the combination of items, and the linked NN model is trained using data that matches the combined items.
画像認識部15は、検出窓DW4の位置を決定する(ステップS404)。ステップS204においては、画像データSD4中の任意の位置にランダムに検出窓DW4の位置を決定することでもよいし、ある規則に従って決定した画像データSD4中の位置を検出窓DW4の位置として決定することでもよい。 The image recognition unit 15 determines the position of the detection window DW4 (step S404). In step S204, the position of the detection window DW4 may be determined randomly at any position in the image data SD4, or a position in the image data SD4 determined according to a certain rule may be determined as the position of the detection window DW4.
ステップS404において位置選択された検出窓DW4のデータに対して、図3のステップS103と同様に、ステップS403で選択したNNにより検出対象DOの検出処理を実行する(ステップS405)。検出対象DOが検出された場合(ステップS406のYes)、結果出力部16は、検出した検出対象DOの位置などの情報を、外部のモニタなどに出力することでもよい(ステップS407)。一方、検出対象DOが検出されなかった場合(ステップS406のNo)、ステップS404に戻り、検出窓DW4に対する次の位置を決定し、同様の処理を繰り返す。戻った場合のステップS404において画像認識部15は、前回までに決定された検出窓DW4の範囲に重ならないように検出窓DW4の位置を決定することが望ましい。 For the data of the detection window DW4 whose position was selected in step S404, the NN selected in step S403 performs a detection process for the detection target DO (step S405), similar to step S103 in FIG. 3. If the detection target DO is detected (Yes in step S406), the result output unit 16 may output information such as the position of the detected detection target DO to an external monitor or the like (step S407). On the other hand, if the detection target DO is not detected (No in step S406), the process returns to step S404, where the next position for the detection window DW4 is determined and the same process is repeated. When returning to step S404, it is desirable that the image recognition unit 15 determine the position of the detection window DW4 so that it does not overlap with the range of the detection window DW4 determined previously.
以上の手順により、映像フィルムをデジタルサンプリングして得た画像データSDに発生するフィルムグレインの検出が可能となる。 The above procedure makes it possible to detect film grain that occurs in image data SD obtained by digitally sampling video film.
以上に述べた少なくとも1つの実施形態によれば、解像度の異なる複数の画像データを解析する映像解析装置および映像解析方法を提供することができる。 At least one of the embodiments described above can provide a video analysis device and a video analysis method for analyzing multiple image data with different resolutions.
なお、図面に示した解析画面などに表示される条件パラメータやそれらに対する選択肢、値、評価指標などの名称や定義、種類などは、本実施形態において一例として示したものであり、本実施形態に示されるものに限定されるものではない。 Note that the names, definitions, and types of condition parameters, their corresponding options, values, evaluation indicators, etc. displayed on the analysis screens shown in the drawings are shown as examples in this embodiment and are not limited to those shown in this embodiment.
本発明のいくつかの実施形態を説明したが、これらの実施形態は例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。さらにまた、請求項の各構成要素において、構成要素を分割して表現した場合、或いは複数を合わせて表現した場合、或いはこれらを組み合わせて表現した場合であっても本発明の範疇である。また、複数の実施形態を組み合わせてもよく、この組み合わせで構成される実施例も発明の範疇である。 While several embodiments of the present invention have been described, these embodiments are presented as examples and are not intended to limit the scope of the invention. These novel embodiments can be embodied in a variety of other forms, and various omissions, substitutions, and modifications can be made without departing from the spirit of the invention. These embodiments and their variations are within the scope and spirit of the invention, and are also included in the inventions and their equivalents as set forth in the claims. Furthermore, the scope of the present invention also includes cases in which each component in the claims is expressed separately, as a combination of multiple components, or as a combination of these. Furthermore, multiple embodiments may be combined, and examples composed of such combinations are also within the scope of the invention.
また、図面は、説明をより明確にするため、実際の態様に比べて、各部の幅、厚さ、形状等について模式的に表される場合がある。ブロック図においては、結線されていないブロック間もしくは、結線されていても矢印が示されていない方向に対してもデータや信号のやり取りを行う場合もある。フローチャートに示す処理は、ICチップ、デジタル信号処理プロセッサ(Digital Signal ProcessorまたはDSP)などのハードウェアもしくはマイクロコンピュータを含めたコンピュータなどで動作させるソフトウェア(プログラムなど)またはハードウェアとソフトウェアの組み合わせによって実現してもよい。また請求項を制御ロジックとして表現した場合、コンピュータを実行させるインストラクションを含むプログラムとして表現した場合、及び前記インストラクションを記載したコンピュータ読み取り可能な記録媒体として表現した場合でも本発明の装置を適用したものである。また、使用している名称や用語についても限定されるものではなく、他の表現であっても実質的に同一内容、同趣旨であれば、本発明に含まれるものである。 In addition, to clarify the explanation, the drawings may show the width, thickness, shape, etc. of each part more schematically than in the actual embodiment. In block diagrams, data and signals may be exchanged between unconnected blocks, or even between connected blocks in directions not indicated by arrows. The processes shown in the flowcharts may be realized by hardware such as an IC chip or a digital signal processor (DSP), software (e.g., a program) running on a computer including a microcomputer, or a combination of hardware and software. The device of the present invention is also applicable when the claims are expressed as control logic, a program containing instructions for a computer to execute, or a computer-readable recording medium containing the instructions. Furthermore, the names and terminology used are not intended to be limiting; other expressions that have substantially the same content and intent are also included in the present invention.
1…映像解析装置、11…映像入力部、12…画角取得部、13…検出用NN選択部、14…記憶部、15…画像認識部、16…結果出力部、141…テーブル、142…NNモデルパラメータ、151…特徴検出部、152…領域計算部。 1...Video analysis device, 11...Video input unit, 12...Viewing angle acquisition unit, 13...Detection NN selection unit, 14...Memory unit, 15...Image recognition unit, 16...Result output unit, 141...Table, 142...NN model parameters, 151...Feature detection unit, 152...Area calculation unit.
Claims (6)
異なる検出用ニューラルネットワーク(NNW)が複数準備されており、前記画像データが入力されたとき、前記画像データの所望の窓の領域を検出し、いずれかの検出用ニューラルネットワークを用いて、前記検出した窓の領域の画像データの特徴量を検出する画像認識部と、を備え、
前記映像入力部に入力している前記画像データの前記解像度に対応する画角情報を、前記映像入力部又は外部から受け取る画角取得部と、
画像データの前記画角情報と前記画角情報に対応する検出用窓サイズ及び検出用ニューラルネットワークモデルの情報とからなる組を複数組準備しているテーブルを記憶した記憶部と、
前記画角取得部から与えられた前記画角情報に基づいて、前記記憶部に記憶されている、互いに対応している前記検出用窓サイズ及び前記検出用ニューラルネットワークモデルを特定し、前記画像認識部に対して、前記特定した前記検出用窓サイズ及び前記検出用ニューラルネットワークモデルの情報を与え、複数組の中のいずれかの検出用ニューラルネットワークを選択させて前記画像認識部に画像データの特徴量を検出させる選択部と、
を備えた、映像解析装置。 a video input unit capable of selectively inputting a plurality of image data having different resolutions;
an image recognition unit that has a plurality of different detection neural networks (NNWs) prepared, and that, when the image data is input, detects a desired window area in the image data, and detects a feature amount of the image data of the detected window area using one of the detection neural networks;
a field of view acquisition unit that receives field of view information corresponding to the resolution of the image data input to the video input unit from the video input unit or from an external device;
a storage unit that stores a table that contains a plurality of sets of information on the angle of view of the image data and information on a detection window size and a detection neural network model that correspond to the angle of view;
a selection unit that identifies the detection window size and the detection neural network model that correspond to each other and are stored in the storage unit based on the field of view information provided by the field of view acquisition unit, provides information on the identified detection window size and the detection neural network model to the image recognition unit, and selects one of a plurality of sets of detection neural networks to cause the image recognition unit to detect feature quantities of image data;
A video analysis device equipped with :
第1の検出用ニューラルネットワークに対して画素数(720×480)、検出用窓サイズとして画素数(16×16)の第1の情報、
第2の検出用ニューラルネットワークに対して画素数(1920×1080)、検出用窓サイズとして画素数(32×32)の第2の情報、
第3の検出用ニューラルネットワークに対して画素数(3840×2160)、検出用窓サイズとして画素数(64×64)の第3の情報、が用意されており、
さらに
前記第1の情報としては、第1の検出範囲を付加された第1aの情報と、第2の検出範囲の情報が付加された第1bの情報が存在し、
前記第2の情報としては、第1の検出範囲を付加された第2aの情報と、第2の検出範囲の情報が付加された第2bの情報が存在し、
前記第3の情報としては、第1の検出範囲を付加された第3aの情報と、第2の検出範囲の情報が付加された第3bの情報が存在し、
前記画像認識部は、前記第1の情報に応答して前記第1の検出用ニューラルネットワーク、前記第2の情報に応答して前記第2の検出用ニューラルネットワーク、前記第3の情報に応答して前記第3の検出用ニューラルネットワークを動作させ、
さらに設定に応じて、
前記画素数(16×16)の検出用窓サイズにおいて、前記第1aの情報と第1bの情報に基づく動作が選択的に利用可能とし、
前記画素数(32×32)の検出用窓サイズにおいて、前記第2aの情報と第2bの情報に基づく動作が選択的に利用可能とし、
前記画素数(64×64)の検出用窓サイズにおいて、前記第3aの情報と第3bの情報に基づく動作が選択的に利用可能としている、
請求項1記載の映像解析装置。 In the storage unit,
First information for the first detection neural network, including the number of pixels (720 × 480) and the number of pixels (16 × 16) as the detection window size;
Second information for the second detection neural network, including the number of pixels (1920 x 1080) and the number of pixels (32 x 32) as the detection window size;
For the third detection neural network, third information is prepared, which is the number of pixels (3840 × 2160) and the number of pixels (64 × 64) as the detection window size,
moreover
The first information includes information 1a to which a first detection range is added and information 1b to which information on a second detection range is added,
The second information includes second-a information to which the first detection range is added and second-b information to which information on the second detection range is added,
The third information includes third-a information to which the first detection range is added and third-b information to which information on the second detection range is added,
the image recognition unit operates the first detection neural network in response to the first information, the second detection neural network in response to the second information, and the third detection neural network in response to the third information;
Furthermore, depending on the setting,
In the detection window size of the number of pixels (16 x 16), operations based on the information 1a and the information 1b are selectively available;
In the detection window size of the number of pixels (32 × 32), operations based on the information 2a and the information 2b are selectively available;
In the detection window size of the number of pixels (64 x 64), operations based on the information 3a and the information 3b are selectively available.
The video analysis device according to claim 1.
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2022022167A JP7749489B2 (en) | 2022-02-16 | 2022-02-16 | Video analysis device and video analysis method |
| PCT/CN2022/120835 WO2023155433A1 (en) | 2022-02-16 | 2022-09-23 | Video image analysis apparatus and video analysis method |
| CN202280007640.8A CN116806347A (en) | 2022-02-16 | 2022-09-23 | Video analysis device and video analysis method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2022022167A JP7749489B2 (en) | 2022-02-16 | 2022-02-16 | Video analysis device and video analysis method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2023119326A JP2023119326A (en) | 2023-08-28 |
| JP7749489B2 true JP7749489B2 (en) | 2025-10-06 |
Family
ID=87577422
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2022022167A Active JP7749489B2 (en) | 2022-02-16 | 2022-02-16 | Video analysis device and video analysis method |
Country Status (3)
| Country | Link |
|---|---|
| JP (1) | JP7749489B2 (en) |
| CN (1) | CN116806347A (en) |
| WO (1) | WO2023155433A1 (en) |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2022013433A (en) | 2020-07-03 | 2022-01-18 | キヤノン株式会社 | Information processing equipment, information processing method |
Family Cites Families (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP5317934B2 (en) * | 2009-11-25 | 2013-10-16 | 富士フイルム株式会社 | Object detection apparatus and method, and program |
| CN101807256B (en) * | 2010-03-29 | 2013-03-20 | 天津大学 | Object identification detection method based on multiresolution frame |
| US8406470B2 (en) * | 2011-04-19 | 2013-03-26 | Mitsubishi Electric Research Laboratories, Inc. | Object detection in depth images |
| JP5743742B2 (en) * | 2011-06-23 | 2015-07-01 | キヤノン株式会社 | Image processing apparatus, image processing method, and program |
| KR20210035269A (en) * | 2018-07-30 | 2021-03-31 | 옵티멈 세미컨덕터 테크놀로지스 인코포레이티드 | Object detection using multiple neural networks trained on different image fields |
| CN110348531B (en) * | 2019-07-17 | 2022-12-30 | 沈阳亚视深蓝智能科技有限公司 | Deep convolution neural network construction method with resolution adaptability and application |
| CN112884803B (en) * | 2020-08-18 | 2023-11-24 | 眸芯科技(上海)有限公司 | Real-time intelligent monitoring target detection method and device based on DSP |
| CN111709407B (en) * | 2020-08-18 | 2020-11-13 | 眸芯科技(上海)有限公司 | Method and device for improving video target detection performance in monitoring edge computing |
-
2022
- 2022-02-16 JP JP2022022167A patent/JP7749489B2/en active Active
- 2022-09-23 WO PCT/CN2022/120835 patent/WO2023155433A1/en not_active Ceased
- 2022-09-23 CN CN202280007640.8A patent/CN116806347A/en active Pending
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2022013433A (en) | 2020-07-03 | 2022-01-18 | キヤノン株式会社 | Information processing equipment, information processing method |
Also Published As
| Publication number | Publication date |
|---|---|
| WO2023155433A1 (en) | 2023-08-24 |
| CN116806347A (en) | 2023-09-26 |
| JP2023119326A (en) | 2023-08-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6882868B2 (en) | Image processing equipment, image processing method, system | |
| JP5956814B2 (en) | Appearance inspection apparatus, appearance inspection method, and computer program | |
| EP3889588A1 (en) | Inspection assistance device, inspection assistance method, and inspection assistance program for concrete structure | |
| US20150199585A1 (en) | Method of sampling feature points, image matching method using the same, and image matching apparatus | |
| US8295645B2 (en) | Image processing apparatus, image processing method, and computer program | |
| JP6494418B2 (en) | Image analysis apparatus, image analysis method, and program | |
| CN112418243B (en) | Feature extraction method, device and electronic equipment | |
| JP2018113683A5 (en) | ||
| US20220405878A1 (en) | Image processing apparatus, image processing method, and image processing program | |
| EP3764634A1 (en) | Photographing evaluation map, photographing evaluation map generation device, photographing evaluation map generation method, and photographing evaluation map generation program | |
| CN111582012A (en) | Method and device for detecting small target ship | |
| JP7749489B2 (en) | Video analysis device and video analysis method | |
| WO2023171184A1 (en) | Moving image integration device, moving image integration method, and moving image integration program | |
| JP2019028511A (en) | Image processing system, image processing apparatus, and image processing program | |
| Simic et al. | Real-time video fusion implemented in gstreamer framework | |
| US11308342B2 (en) | Information processing apparatus, control method, and storage medium | |
| CN114220065A (en) | Aisle detection method in showcase, showcase and storage medium | |
| KR20160035104A (en) | Method for detecting object and object detecting apparatus | |
| CN117218633A (en) | An article detection method, device, equipment and storage medium | |
| US11443521B2 (en) | Method and device for evaluating images, operational assistance method and operating device | |
| JP6238569B2 (en) | Image processing apparatus, image processing method, and program | |
| JP7408973B2 (en) | Learning model generation device, image correction device, learning model generation program, and image correction program | |
| JP4675133B2 (en) | Density analysis method from X-ray CT data, computer program for executing density analysis method, and density analysis system | |
| CN114168891B (en) | Method, device, terminal equipment and medium for digitizing vibration images | |
| JP6742178B2 (en) | MTF measuring device and its program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240710 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20250314 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250401 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250521 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250902 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250924 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7749489 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |