Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7799225B2 - Image processing device, image processing method and program - Google Patents
[go: Go Back, main page]

JP7799225B2 - Image processing device, image processing method and program - Google Patents

Image processing device, image processing method and program

Info

Publication number
JP7799225B2
JP7799225B2 JP2024545415A JP2024545415A JP7799225B2 JP 7799225 B2 JP7799225 B2 JP 7799225B2 JP 2024545415 A JP2024545415 A JP 2024545415A JP 2024545415 A JP2024545415 A JP 2024545415A JP 7799225 B2 JP7799225 B2 JP 7799225B2
Authority
JP
Japan
Prior art keywords
depth
image
threshold
size
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2024545415A
Other languages
Japanese (ja)
Other versions
JPWO2024053108A1 (en
Inventor
航 伊藤
淳 荒武
洋介 櫻田
大輔 内堀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
NTT Inc USA
Original Assignee
Nippon Telegraph and Telephone Corp
NTT Inc USA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, NTT Inc USA filed Critical Nippon Telegraph and Telephone Corp
Publication of JPWO2024053108A1 publication Critical patent/JPWO2024053108A1/ja
Application granted granted Critical
Publication of JP7799225B2 publication Critical patent/JP7799225B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Description

本開示は、画像処理装置、画像処理方法およびプログラムに関する。 This disclosure relates to an image processing device, an image processing method, and a program.

現在、インフラ設備の点検業務は主に、点検員による目視により行われている。目視に代わる手段として、画像認識による劣化検出技術が広く検討されている。例えば、非特許文献1,2には、コンクリートあるいはアスファルトに発生したクラックを検出する方法が記載されている。非特許文献1,2の記載の方法では、取得した画像中の微小なクラックを深層学習手法により高精度に検出している。Currently, infrastructure inspections are primarily performed visually by inspectors. Image recognition-based deterioration detection technology is being widely considered as an alternative to visual inspection. For example, Non-Patent Documents 1 and 2 describe methods for detecting cracks in concrete or asphalt. The methods described in Non-Patent Documents 1 and 2 use deep learning techniques to detect minute cracks in acquired images with high accuracy.

Mohamed Alipour, Devin K Harris, and Gregory R miller S. M. S. et al. “Robust Pixel-Level Crack Detection Using Convolutional Neural Networks”, Journal of Computing in Civil Engineering, 33(6), 04019040, 2019.Mohamed Alipour, Devin K Harris, and Gregory R miller S. M. S. et al. “Robust Pixel-Level Crack Detection Using Convolutional Neural Networks”, Journal of Computing in Civil Engineering, 33(6), 04019040, 2019. 全邦釘、井後敦史、南免羅裕治、黒木航汰、大窪和明、「車載カメラにより撮影された舗装画像からのディープラーニングによるひび割れ率評価」、土木学会論文集(E1), Vol. 73, No. 3, pp. I_97-I_105, 2017.K. Zenko, A. Igo, Y. Minamimenra, K. Kuroki, and K. Okubo, "Evaluation of crack rate using deep learning from pavement images captured by an in-vehicle camera," Journal of the Japan Society of Civil Engineers (E1), Vol. 73, No. 3, pp. I_97-I_105, 2017.

非特許文献1,2に記載の方法では、取得画像にコンクリート面のみが写っていることが前提であるため、カメラの画角内にコンクリート面のみを収めるといった撮影上の制約がある。実際の現場でインフラ設備の点検を、画像を用いて効率的に行うためには、上述したような制約の下で撮影された画像ではなく、MMS(Mobile Mapping System)などの機材を用いて一括して様々な設備を撮影した画像を利用可能であることが求められる。しかしながら、MMSなどを用いて一括して様々なインフラ設備を撮影しようとすると、撮影画像中の点検対象のインフラ設備の大きさを一様に写すことは難しく、画像におけるインフラ設備の大きさが、劣化の有無が確認できない大きさになってしまうことがある。 The methods described in Non-Patent Documents 1 and 2 are based on the assumption that only concrete surfaces are captured in the acquired images, which imposes limitations on the image capture, such as the requirement that only concrete surfaces be captured within the camera's field of view. To efficiently inspect infrastructure facilities on-site using images, it is necessary to use images of various facilities captured simultaneously using equipment such as an MMS (Mobile Mapping System), rather than images captured under the aforementioned limitations. However, when attempting to capture various infrastructure facilities simultaneously using an MMS or similar device, it is difficult to capture the size of the infrastructure facilities being inspected uniformly in the captured images, and the size of the infrastructure facilities in the images may be so large that it is impossible to determine whether they have deteriorated.

例えば、ガードレールあるいは標識といったインフラ設備をMMSで撮影する場合を考える。この場合、カメラを搭載した車両の走行車線、道路線形、インフラ設備の設置位置などにより、車両からのインフラ設備の撮影距離を一定に保つことは難しく、撮影画像中に常に一定の大きさあるいは構図でインフラ設備を写し続けることは困難である。そのため、撮影画像の画角内に、遠方に存在するインフラ設備が写りこんでしまうことがある。遠方に存在するインフラ設備が写りこんだ領域では、インフラ設備に生じた劣化を検出することができない可能性があるため、このような領域を点検の対象とすることは望ましくない。したがって、インフラ設備などの対象物を撮影した画像において、対象物の劣化の有無を点検する点検領域を適切に決定する手法が求められている。For example, consider the case of capturing images of infrastructure facilities such as guardrails or signs using an MMS. In this case, it is difficult to maintain a constant shooting distance of the infrastructure facilities from the vehicle due to factors such as the lane of travel of the vehicle equipped with the camera, the road alignment, and the location of the infrastructure facilities. It is also difficult to consistently capture the infrastructure facilities at a consistent size or composition in the captured image. As a result, infrastructure facilities located far away may appear within the field of view of the captured image. Areas where distant infrastructure facilities are captured may not be able to detect any deterioration in the infrastructure facilities, making it undesirable to subject such areas to inspection. Therefore, a method is needed to appropriately determine inspection areas to inspect for deterioration of objects such as infrastructure facilities in images captured by the camera.

上記のような問題点に鑑みてなされた本開示の目的は、インフラ設備などの対象物を撮影した画像において、対象物の劣化の有無を点検する点検領域を適切に決定することができる画像処理装置、画像処理方法およびプログラムを提供することにある。 The purpose of this disclosure, made in consideration of the above-mentioned problems, is to provide an image processing device, image processing method, and program that can appropriately determine an inspection area for inspecting whether or not an object, such as infrastructure equipment, has deteriorated in an image of the object.

上記課題を解決するため、本開示に係る画像処理装置は、対象物を撮影した画像における、前記対象物に生じた劣化の有無を点検する点検領域を決定する画像処理装置であって、前記画像を構成する画素ごとに、前記画像における奥行き方向の距離である深度を推定する深度推定部と、前記画像における、点検の対象とする劣化のサイズに対する前記対象物のサイズの比が所定値以上となる前記対象物の領域の深度を深度閾値として決定し、前記深度推定部により推定された画素ごとの深度に基づき、前記深度閾値よりも近傍の領域を、前記点検領域と決定する点検領域決定部と、前記点検領域決定部による前記点検領域の決定結果を出力する結果出力部と、を備える。 In order to solve the above problem, the image processing device disclosed herein is an image processing device that determines an inspection area in an image of an object captured to check for the presence or absence of deterioration of the object, and includes: a depth estimation unit that estimates the depth, which is the distance in the depth direction in the image, for each pixel that constitutes the image; an inspection area determination unit that determines the depth of the area of the object in the image where the ratio of the size of the object to the size of the deterioration to be inspected is equal to or greater than a predetermined value as a depth threshold, and determines an area closer to the depth threshold as the inspection area based on the depth for each pixel estimated by the depth estimation unit; and a result output unit that outputs the inspection area determination result obtained by the inspection area determination unit.

また、上記課題を解決するため、本開示に係る画像処理方法は、対象物を撮影した画像における、前記対象物に生じた劣化の有無を点検する点検領域を決定する画像処理装置による画像処理方法であって、前記画像を構成する画素ごとに、前記画像における奥行き方向の距離である深度を推定するステップと、前記画像における、点検の対象とする劣化のサイズに対する前記対象物のサイズの比が所定値以上となる前記対象物の領域の深度を深度閾値として決定し、前記推定された画素ごとの深度に基づき、前記深度閾値よりも近傍の領域を前記点検領域と決定するステップと、前記点検領域の決定結果を出力するステップと、を含む。 In addition, to solve the above problem, the image processing method disclosed herein is an image processing method by an image processing device that determines an inspection area in an image of an object captured to check for the presence or absence of deterioration of the object, and includes the steps of: estimating the depth, which is the distance in the depth direction in the image, for each pixel constituting the image; determining the depth of the area of the object in the image where the ratio of the size of the object to the size of the deterioration to be inspected is equal to or greater than a predetermined value as a depth threshold; determining an area closer to the depth threshold as the inspection area based on the estimated depth for each pixel; and outputting the inspection area determination result.

また、上記課題を解決するため、本開示に係るプログラムは、コンピュータを、上述した画像処理装置として動作させる。 In addition, to solve the above problem, the program disclosed herein causes a computer to operate as the above-mentioned image processing device.

本開示に係る画像処理装置、画像処理方法およびプログラムによれば、対象物を撮影した画像において、対象物の劣化の有無を点検する点検領域を適切に決定することができる。 The image processing device, image processing method, and program disclosed herein make it possible to appropriately determine an inspection area in an image of an object to check for deterioration of the object.

本開示の一実施形態に係る画像処理装置の構成例を示す図である。FIG. 1 is a diagram illustrating an example of the configuration of an image processing device according to an embodiment of the present disclosure. 図1に示す深度推定部による深度の推定について説明するための図である。2 is a diagram for explaining depth estimation by a depth estimation unit shown in FIG. 1 . FIG. 図1に示す画像処理装置の動作の一例を示すフローチャートである。2 is a flowchart showing an example of the operation of the image processing device shown in FIG. 1 . 図1に示す判定部の動作の一例を示すフローチャートである。2 is a flowchart showing an example of the operation of a determination unit shown in FIG. 1 . 点検に必要な対象物の画素数について説明するための図である。FIG. 10 is a diagram for explaining the number of pixels of an object required for inspection. 対象物としてのガードレールを撮影した画像である。This is an image of a guardrail as an object. 図6Aに示す画像に対して、ガードレールの画素領域の情報を付与したアノテーション画像である。This is an annotation image in which information about the pixel area of the guardrail is added to the image shown in FIG. 6A. 図6Aに示す画像における、ガードレールの画素領域の深度の推定結果を示す図である。FIG. 6B is a diagram showing the depth estimation results of the pixel region of the guardrail in the image shown in FIG. 6A. GR幅と深度との分布の一例を示す図である。FIG. 10 is a diagram showing an example of the distribution of GR width and depth. 図7に示す分布に基づき計算された指標(Accuracy)の一例を示す図である。FIG. 8 is a diagram illustrating an example of an index (Accuracy) calculated based on the distribution shown in FIG. 7 . 図1に示す閾値決定部による深度閾値αの決定方法の別の一例について説明するための図である。1. FIG. 4 is a diagram for explaining another example of a method for determining a depth threshold α by the threshold determination unit shown in FIG. 図1に示す閾値決定部による深度閾値αの決定方法のさらに別の一例について説明するための図である。1. FIG. 10 is a diagram for explaining yet another example of a method for determining a depth threshold α by the threshold determination unit shown in FIG. 図1に示す閾値決定部の構成例を示す図である。FIG. 2 is a diagram illustrating an example of the configuration of a threshold value determination unit illustrated in FIG. 1 . 図1に示す画像処理装置のハードウェア構成の一例を示す図である。FIG. 2 is a diagram illustrating an example of a hardware configuration of the image processing apparatus illustrated in FIG. 1 .

以下、本開示の実施の形態について図面を参照して説明する。 Embodiments of the present disclosure are described below with reference to the drawings.

図1は、本開示の一実施形態に係る画像処理装置10の構成例を示す図である。本実施形態に係る画像処理装置10は、インフラ設備などの対象物を単眼カメラにより撮影した画像における、対象物の劣化の有無を点検する点検領域を決定するものである。 Figure 1 is a diagram showing an example configuration of an image processing device 10 according to one embodiment of the present disclosure. The image processing device 10 according to this embodiment determines an inspection area in an image of an object, such as infrastructure equipment, captured by a monocular camera to check for deterioration of the object.

図1に示すように、本実施形態に係る画像処理装置10は、画像入力部11と、深度推定部12と、点検領域決定部13と、結果出力部14とを備える。 As shown in Figure 1, the image processing device 10 of this embodiment includes an image input unit 11, a depth estimation unit 12, an inspection area determination unit 13, and a result output unit 14.

画像入力部11は、インフラ設備などの対象物を撮影した画像が入力される。画像入力部11は、入力された画像を深度推定部12に出力する。 The image input unit 11 receives an image of an object such as infrastructure equipment. The image input unit 11 outputs the input image to the depth estimation unit 12.

深度推定部12は、画像入力部11から出力された画像を構成する画素ごとに、当該画素における奥行き方向の距離である深度を推定する。深度推定部12は、例えば、深層学習手法の一種であるCNN(Convolutional neural network)をベースとした深度推定モデル(例えば、Midas)を用いて、画素ごとの深度を推定する。 The depth estimation unit 12 estimates the depth, which is the distance in the depth direction at each pixel constituting the image output from the image input unit 11. The depth estimation unit 12 estimates the depth for each pixel using, for example, a depth estimation model (e.g., Midas) based on a convolutional neural network (CNN), a type of deep learning method.

図2は、深度推定部12による深度推定の結果の一例を示す図である。図2においては、ガードレールを撮影した画像を深度推定部12の入力画像とした場合に、深度推定部12が深度推定の結果として出力する出力画像の一例を示している。 Figure 2 shows an example of the results of depth estimation by the depth estimation unit 12. Figure 2 shows an example of an output image that the depth estimation unit 12 outputs as a result of depth estimation when an image of a guardrail is used as the input image to the depth estimation unit 12.

深度推定部12は、入力画像を深度推定モデルに入力し、図2に示すように、画素ごとの奥行き方向の相対距離を数値(0(黒)~255(白))で示す出力画像を出力する。このような画像を生成することで、画像中の物体がどの程度遠くにあるかを推定することが可能となる。なお、図2においては、奥行き方向の距離が小さいほど深度を示す値が大きくなり、奥行き方向の距離が大きいほど深度を示す値が小さくなる例を示しているが、これに限られるものではない。 The depth estimation unit 12 inputs the input image into the depth estimation model and outputs an output image that indicates the relative distance in the depth direction for each pixel as a numerical value (0 (black) to 255 (white)), as shown in Figure 2. By generating such an image, it becomes possible to estimate how far away an object in the image is. Note that Figure 2 shows an example in which the smaller the distance in the depth direction, the larger the value indicating the depth, and the larger the distance in the depth direction, the smaller the value indicating the depth, but this is not limited to this.

図1を再び参照すると、深度推定部12は、推定結果を点検領域決定部13に出力する。 Referring again to Figure 1, the depth estimation unit 12 outputs the estimation result to the inspection area determination unit 13.

点検領域決定部13は、画像における、点検の対象とする劣化のサイズに対する対象物のサイズの比が所定値以上となる対象物の領域の深度を、点検領域の決定に用いるための深度閾値αとして決定する。そして、点検領域決定部13は、深度推定部12により推定された画素ごとの深度に基づき、深度閾値αよりも近傍の領域(深度閾値αよりも手前の領域)を点検領域と決定する。図1に示すように、点検領域決定部13は、閾値決定部131と、判定部132とを備える。The inspection area determination unit 13 determines the depth of the area of the object in the image where the ratio of the size of the object to the size of the defect to be inspected is equal to or greater than a predetermined value as the depth threshold α to be used in determining the inspection area. Then, based on the depth of each pixel estimated by the depth estimation unit 12, the inspection area determination unit 13 determines the area closer to the depth threshold α (the area closer to the depth threshold α) as the inspection area. As shown in FIG. 1, the inspection area determination unit 13 includes a threshold determination unit 131 and a determination unit 132.

閾値決定部131は、深度閾値αを決定する。本実施形態においては、画素ごとの深度として、0から255の値を設定しているため、深度閾値αは0以上、255以下(0≦α≦255)である。ただし、これに限られるものではなく、深度閾値αは、画素ごとの深度の表し方に応じて、適宜設定することができる。閾値決定部131による深度閾値αの決定の詳細については後述する。 The threshold determination unit 131 determines the depth threshold α. In this embodiment, a value between 0 and 255 is set as the depth for each pixel, so the depth threshold α is greater than or equal to 0 and less than or equal to 255 (0≦α≦255). However, this is not limited to this, and the depth threshold α can be set appropriately depending on how the depth for each pixel is expressed. Details of how the threshold determination unit 131 determines the depth threshold α will be described later.

判定部132は、深度推定部12により推定された画素ごとの深度に基づき、閾値決定部131により決定された深度閾値αよりも近傍の領域を点検領域と決定する。 The determination unit 132 determines the area closer to the depth threshold α determined by the threshold determination unit 131 as the inspection area based on the depth of each pixel estimated by the depth estimation unit 12.

結果出力部14は、点検領域決定部13による点検領域の決定の結果を出力する。結果出力部14は、例えば、画像入力部11に入力された画像から、点検領域決定部13により点検領域と決定された領域の画像を抽出して出力してよい。また、結果出力部14は、例えば、画像入力部11に入力された画像に、点検領域決定部13により決定された点検領域を示す画像を重畳して出力してよい。 The result output unit 14 outputs the results of the inspection area determination by the inspection area determination unit 13. The result output unit 14 may, for example, extract and output an image of the area determined to be the inspection area by the inspection area determination unit 13 from the image input to the image input unit 11. Furthermore, the result output unit 14 may, for example, superimpose an image showing the inspection area determined by the inspection area determination unit 13 on the image input to the image input unit 11 and output the image.

次に、本実施形態に係る画像処理装置10の動作について説明する。 Next, we will explain the operation of the image processing device 10 related to this embodiment.

図3は、本実施形態に係る画像処理装置10の動作の一例を示すフローチャートであり、本実施形態に係る画像処理装置10により実行される画像処理方法を説明するための図である。 Figure 3 is a flowchart showing an example of the operation of the image processing device 10 of this embodiment, and is a diagram for explaining the image processing method performed by the image processing device 10 of this embodiment.

深度推定部12は、画像入力部11を介して入力された、対象物を撮影した画像を構成する画素ごとに、深度を推定する(ステップS11)。上述したように、深度推定部12は、例えば、Midasなどの深度推定モデルを用いて、画素ごとの深度を推定する。The depth estimation unit 12 estimates the depth for each pixel constituting the image of the object that is input via the image input unit 11 (step S11). As described above, the depth estimation unit 12 estimates the depth for each pixel using a depth estimation model such as Midas.

点検領域決定部13(閾値決定部131)は、点検の対象とする劣化のサイズに対する対象物のサイズの比が所定値以上となる領域の深度を深度閾値αとして決定する。そして、点検領域決定部13(判定部132)は、深度推定部12により推定された画素ごとの深度に基づき、深度閾値αよりも近傍の領域を点検領域と決定する(ステップS12)。The inspection area determination unit 13 (threshold determination unit 131) determines the depth of the area where the ratio of the size of the object to the size of the deterioration to be inspected is equal to or greater than a predetermined value as the depth threshold α. Then, the inspection area determination unit 13 (determination unit 132) determines the area closer to the depth threshold α as the inspection area based on the depth of each pixel estimated by the depth estimation unit 12 (step S12).

図4は、点検領域決定部13(判定部132)による点検領域の決定の動作について説明するための図である。 Figure 4 is a diagram for explaining the operation of determining the inspection area by the inspection area determination unit 13 (judgment unit 132).

判定部132は、深度推定部12により推定された、画素i,jの深度pi,jを取得する(ステップS121)。 The determination unit 132 acquires the depth p i,j of pixel i,j estimated by the depth estimation unit 12 (step S121).

次に、判定部132は、深度pi,jが深度閾値α以上である(pi,j≧α)か否かを判定する(ステップS122)。 Next, the determination unit 132 determines whether the depth p i,j is equal to or greater than a depth threshold α (p i,j ≧α) (step S122).

i,j≧αを満たす(画素i,jが深度閾値αよりも近傍の領域である)と判定した場合(ステップS122:Yes)は、判定部132は、画素i,jに対する判定結果Ri,j=1と設定する(ステップS123)。 If it is determined that p i,j ≧α is satisfied (pixel i,j is in a region closer than the depth threshold α) (step S122: Yes), the determination unit 132 sets the determination result for pixel i,j to R i,j =1 (step S123).

i,j≧αを満たさないと判定した場合(ステップS122:No)は、判定部132は、画素i,jに対する判定結果Ri,j=0と設定する(ステップS124)。 If it is determined that p i,j ≧α is not satisfied (step S122: No), the determining unit 132 sets the determination result for pixel i,j to R i,j =0 (step S124).

すべての画素について上述した処理が完了すると、判定部132は、判定結果Ri,j=1の画素i,jからなる領域を、点検領域として決定する(ステップS125)。図4を参照して説明した処理により、点検領域決定部13(判定部132)は、深度閾値αより遠方の領域を点検領域とは決定せず、深度閾値αよりも近傍の領域だけを点検領域と決定することができる。 When the above-described process is completed for all pixels, the determination unit 132 determines the region consisting of pixels i and j for which the determination result R i,j = 1 as the inspection region (step S125). By the process described with reference to Fig. 4, the inspection region determination unit 13 (determination unit 132) does not determine regions farther than the depth threshold value α as the inspection region, but can determine only regions closer to the depth threshold value α as the inspection region.

図3を再び参照すると、結果出力部14は、点検領域決定部13による点検領域の決定の結果を出力する(ステップS13)。 Referring again to Figure 3, the result output unit 14 outputs the result of the inspection area determination by the inspection area determination unit 13 (step S13).

次に、閾値決定部131による深度閾値αの決定方法について説明する。 Next, we will explain how the threshold determination unit 131 determines the depth threshold α.

本実施形態においては、対象物を点検するために必要な、画像上の対象物の画素数Nが予め設定され、閾値決定部131は、その画素数Nを基準として深度閾値αを決定する。具体的には、閾値決定部131は、画像における対象物のサイズと、そのサイズを有する対象物の領域の深度との分布(以下、「対象物のサイズ-深度分布」と称する。)に基づき、深度閾値αを決定する。In this embodiment, the number of pixels N of an object on an image required to inspect the object is set in advance, and the threshold determination unit 131 determines the depth threshold α based on that number of pixels N. Specifically, the threshold determination unit 131 determines the depth threshold α based on the size of the object in the image and the distribution of the depth of the area of the object having that size (hereinafter referred to as the "object size-depth distribution").

図5は、点検に必要な対象物の画素数Nの決定方法について説明するための図である。 Figure 5 is a diagram explaining how to determine the number of pixels N of an object required for inspection.

図5に示すように、点検の対象物の大きさxとする。xは、点検の対象物の短辺と平行な方向のサイズである。また、図5に示すように、点検により検出したい最小の劣化のサイズをyとする。劣化のサイズyは、対象物のサイズxと同じ方向の大きさである。 As shown in Figure 5, the size of the object to be inspected is defined as x. x is the size in the direction parallel to the short side of the object to be inspected. Also, as shown in Figure 5, the size of the smallest deterioration that we want to detect through inspection is defined as y. The size of the deterioration y is the size in the same direction as the size x of the object.

対象物の画素数Nがx/y以上(N≧x/y)であれば、サイズyの劣化が存在した場合に、その劣化が1画素以上にまたがるため、劣化の検出が可能となる。例えば、対象物のサイズx=35cmであり、劣化のサイズy=7cmであるとする。この場合、35/7=5より、対象物の画素数Nが、対象物のサイズxを求めた方向と同方向に5画素以上あれば、点検の対象である劣化が1画素以上にまたがるため、劣化の検出が可能となる。一方、対象物の画素数Nが5画素未満あれは、点検の対象である劣化が1画素に満たない情報量しか持たないため、劣化の検出が困難となる。このように、対象物の画素数(画像上の対象物のサイズ)がN以上であれば、点検により検出したい劣化を検出することができる。したがって、画像上の、対象物の画素数がN以上の領域を点検領域と決定すればよいことが分かる。If the number of pixels N of an object is x/y or greater (N≧x/y), then if there is degradation of size y, that degradation will span more than one pixel, making it possible to detect the degradation. For example, suppose the object's size x = 35 cm and the degradation size y = 7 cm. In this case, since 35/7 = 5, if the object's pixel count N is 5 or more pixels in the same direction as the object's size x was determined, the degradation to be inspected will span more than one pixel, making it possible to detect the degradation. On the other hand, if the object's pixel count N is less than 5 pixels, the degradation to be inspected will contain less information than one pixel, making it difficult to detect the degradation. Thus, if the object's pixel count (the size of the object on the image) is N or greater, the desired degradation can be detected through inspection. Therefore, it is clear that the inspection area can be determined to be the area on the image where the object's pixel count is N or greater.

次に、N≧x/yである領域(点検の対象とする劣化のサイズyに対する対象物のサイズxの比が所定値以上となる対象物の領域)の抽出方法について説明する。以下では、例として、対象物がガードレールであるとして説明する。Next, we will explain how to extract areas where N≧x/y (areas of an object where the ratio of the size x of the object to the size y of the deterioration to be inspected is equal to or greater than a predetermined value). In the following, we will explain the example of an object being a guardrail.

図6Aは、車載カメラによりガードレールを撮影した画像である。図6Bは、図6Aに示す画像に対して、ガードレールの画素領域には「1」を付与し、その他の領域の画素には「0」を付与したアノテーション画像である。図6Cは、深度推定モデルを用いた、ガードレールの画素領域のみの深度の推定結果を示す画像である。図6A~6Cでは、紙面横方向をx方向と称し、紙面縦方向をy方向と称する。なお、図6Bに示すようなアノテーション画像は、例えば、画像入力部11を介して入力された画像に対する物体認識処理を行うことで作成することができる。 Figure 6A is an image of a guardrail captured by an in-vehicle camera. Figure 6B is an annotation image of the image shown in Figure 6A, in which the pixel area of the guardrail is assigned a "1" and pixels in other areas are assigned a "0". Figure 6C is an image showing the depth estimation results for only the pixel area of the guardrail using a depth estimation model. In Figures 6A to 6C, the horizontal direction on the paper is referred to as the x-direction, and the vertical direction on the paper is referred to as the y-direction. Note that an annotation image such as that shown in Figure 6B can be created, for example, by performing object recognition processing on an image input via the image input unit 11.

ガードレールは、波状断面のビームと、ビームを支持する支柱とから構成される。ガードレールの大きさは、画像中のガードレールの画素領域におけるy方向の画素数で定義する。閾値決定部131は、図6Bに示すアノテーション画像における左上の画素の座標を(1,1)と定義し、x座標ごとに、y方向に1が入力されている画素数をカウントし、カウント数を当該x座標におけるガードレール幅(以下、「GR幅」と称する。)と決定する。例えば、図6Bにおいて、破線箇所は、x座標が100であり、GR幅が48である。図6Aから分かるように、x座標が大きくなるにつれて、GR幅は小さくなる。 The guardrail is composed of a beam with a wavy cross-section and supports that support the beam. The size of the guardrail is defined by the number of pixels in the y-direction in the pixel area of the guardrail in the image. The threshold determination unit 131 defines the coordinates of the upper left pixel in the annotation image shown in Figure 6B as (1, 1), counts the number of pixels with a 1 input in the y-direction for each x-coordinate, and determines the counted number as the guardrail width at that x-coordinate (hereinafter referred to as the "GR width"). For example, in Figure 6B, the dashed line location has an x-coordinate of 100 and a GR width of 48. As can be seen from Figure 6A, the GR width decreases as the x-coordinate increases.

次に、閾値決定部131は、アノテーション画像に基づき求めたGR幅を有する対象物の領域の深度を算出する。具体的には、閾値決定部131は、図6Cに示す画像における左上の画素の座標を(1,1)と定義し、ガードレールの画素領域における各画素の深度値をy方向に合計する。そして、閾値決定部131は、x座標ごとの深度値の合計を、当該x座標におけるGR幅で割った値を、当該x座標におけるGR幅を有する対象物の領域の深度として算出する。例えば、図6Cにおいて、破線箇所は、x座標が100であり、GR幅を有する対象物の領域の深度が183である。 Next, the threshold determination unit 131 calculates the depth of the region of the object having the GR width determined based on the annotation image. Specifically, the threshold determination unit 131 defines the coordinates of the upper left pixel in the image shown in Figure 6C as (1, 1) and sums the depth values of each pixel in the pixel region of the guardrail in the y direction. The threshold determination unit 131 then divides the sum of the depth values for each x coordinate by the GR width at that x coordinate to calculate the depth of the region of the object having the GR width at that x coordinate. For example, in Figure 6C, the dashed line location has an x coordinate of 100, and the depth of the region of the object having the GR width is 183.

図7は、4400枚のサンプル画像から求められた、GR幅と、当該GR幅を有する対象物(ガードレール)の領域の深度との関係(対象物のサイズ-深度分布)をプロットした図である。例えば、点検することが可能なガードレールの領域を、GR幅がN=20画素以上である領域と定義した場合、深度閾値αを設定することで、図7に示すように、対象物のサイズ-深度分布を4つの領域に分類することができる。 Figure 7 is a plot of the relationship between GR width and the depth of the area of the object (guardrail) having that GR width (object size-depth distribution), obtained from 4,400 sample images. For example, if the area of the guardrail that can be inspected is defined as the area where the GR width is N = 20 pixels or more, by setting a depth threshold α, the object size-depth distribution can be classified into four areas, as shown in Figure 7.

右上の領域は、GR幅が20画素以上、かつ、深度が深度閾値α以上である領域(劣化のサイズyに対する対象物のサイズxの比(x/y)が所定値(N=20)以上であり、かつ、深度が深度閾値α以上である領域)である。この領域をTPと定義する。TPは、GR幅が20画素以上の画像領域が点検に有効な範囲として正しく抽出される領域である。 The upper right region is a region where the GR width is 20 pixels or more and the depth is greater than or equal to the depth threshold α (the region where the ratio (x/y) of the object size x to the degradation size y is greater than or equal to a predetermined value (N=20) and the depth is greater than or equal to the depth threshold α). This region is defined as TP. TP is a region where an image region with a GR width of 20 pixels or more is correctly extracted as a valid range for inspection.

右下の領域は、GR幅が20画素未満、かつ、深度が深度閾値α以上である領域(劣化のサイズyに対する対象物のサイズxの比(x/y)が所定値(N=20)未満であり、かつ、深度が深度閾値α以上である領域)である。この領域をFPと定義する。FPは、GR幅が20画素未満の画像領域が点検に有効な範囲として誤って抽出される領域である。 The area in the lower right is an area where the GR width is less than 20 pixels and the depth is greater than or equal to the depth threshold α (an area where the ratio (x/y) of the object size x to the degradation size y is less than a predetermined value (N=20) and the depth is greater than or equal to the depth threshold α). This area is defined as FP. FP is an area where an image area with a GR width of less than 20 pixels is mistakenly extracted as a valid area for inspection.

左上の領域は、GR幅が20画素以上、かつ、深度が深度閾値α未満である領域(点検の対象とする劣化のサイズyに対する対象物のサイズxの比(x/y)が所定値(N=20)以上であり、かつ、深度が深度閾値α未満である領域)である。この領域をFNと定義する。FNは、GR幅が20画素以上の画像領域が点検に有効でない範囲として誤って除外される領域である。 The upper left area is an area where the GR width is 20 pixels or more and the depth is less than the depth threshold α (an area where the ratio (x/y) of the size x of the object to the size y of the deterioration to be inspected is greater than or equal to a predetermined value (N=20) and the depth is less than the depth threshold α). This area is defined as FN. FN is an area where image areas with a GR width of 20 pixels or more are mistakenly excluded as areas that are not valid for inspection.

左下の領域は、GR幅が20画素未満、かつ、深度が深度閾値α未満である領域(劣化のサイズyに対する対象物のサイズxの比(x/y)が所定値(N=20)未満であり、かつ、深度が深度閾値α未満である領域)である。この領域をTNと定義する。TNは、GR幅が20画素未満の画像領域が点検に有効でない範囲として正しく除外される領域である。 The area in the lower left is an area where the GR width is less than 20 pixels and the depth is less than the depth threshold α (an area where the ratio (x/y) of the object size x to the degradation size y is less than a predetermined value (N=20) and the depth is less than the depth threshold α). This area is defined as TN. TN is an area where image areas with a GR width less than 20 pixels are correctly excluded as areas that are not valid for inspection.

閾値決定部131は、上述した分類に基づき、例えば、式(1)を用いて、指標(Accuracy)を計算する。なお、式(1)におけるTP,FP,FN,TNはそれぞれ、領域TP,FP,FN,TNに分類されたデータ数である。
Accuracy=(TP+TN)/(TP+FP+FN+TN) 式(1)
The threshold determination unit 131 calculates the index (Accuracy) based on the above classification, for example, using formula (1). Note that TP, FP, FN, and TN in formula (1) are the numbers of data classified into the regions TP, FP, FN, and TN, respectively.
Accuracy=(TP+TN)/(TP+FP+FN+TN) Formula (1)

閾値決定部131は、上述した式(1)に従い計算した指標(Accuracy)に基づき、深度閾値αを決定する。具体的には、閾値決定部131は、式(1)に基づき計算した指標(Accuracy)が最も大きくなる深度を深度閾値αと決定する。The threshold determination unit 131 determines the depth threshold α based on the index (Accuracy) calculated according to the above-described formula (1). Specifically, the threshold determination unit 131 determines the depth at which the index (Accuracy) calculated based on formula (1) is greatest as the depth threshold α.

図8は、図7に示す分布に基づき、式(1)に従い計算された指標(Accuracy)の一例を示す図である。図8に示すように、深度閾値α=73の場合に、指標(Accuracy)が最も高くなる(分類精度が最も高くなる)。したがって、閾値決定部131は、深度閾値αを73と決定する。 Figure 8 shows an example of the index (Accuracy) calculated according to formula (1) based on the distribution shown in Figure 7. As shown in Figure 8, when the depth threshold α = 73, the index (Accuracy) is highest (classification accuracy is highest). Therefore, the threshold determination unit 131 determines the depth threshold α to be 73.

深度閾値αの決定に用いる指標は、上述した指標(Accuracy)に限られるものではない。閾値決定部131は、例えば、以下の式(2)に従い計算される指標(Recall)を用いて、深度閾値αを決定してもよい。
Recall=TP/(TP+FN) 式(2)
The index used to determine the depth threshold α is not limited to the above-described index (Accuracy). The threshold determination unit 131 may determine the depth threshold α using, for example, an index (Recall) calculated according to the following formula (2):
Recall=TP/(TP+FN) Formula (2)

式(2)に従い計算される指標(Recall)を用いる場合、点検領域としてもよい可能性がある領域であっても決定領域から除外されることがある。すなわち、指標(Recall)を用いることで、不適当な領域が点検領域に含まれることがより少なくなるような深度閾値αを決定することができる。 When using the index (Recall) calculated according to equation (2), areas that may be suitable for the inspection area may be excluded from the decision area. In other words, by using the index (Recall), it is possible to determine a depth threshold α that reduces the likelihood of inappropriate areas being included in the inspection area.

また、閾値決定部131は、例えば、以下の式(3)に従い計算される指標(Specificity)を用いて、深度閾値αを決定してもよい。
Specificity=TN/(FP+TN) 式(3)
Furthermore, the threshold value determination unit 131 may determine the depth threshold value α using an index (Specificity) calculated according to the following equation (3), for example.
Specificity=TN/(FP+TN) Formula (3)

式(3)に従い計算される指標(Specificity)を用いる場合、点検領域とならない可能性がある領域であっても点検領域として抽出されることがある。すなわち、指標(Specificity)を用いることで、より広範な領域が点検領域に含まれるような深度閾値αを決定することができる。 When using the index (Specificity) calculated according to formula (3), areas that may not be included in the inspection area may be extracted as inspection areas. In other words, by using the index (Specificity), it is possible to determine a depth threshold α that will include a wider area in the inspection area.

閾値決定部131は、図7に示すような対象物のサイズ-深度分布を、入力された画像についてx座標ごとに計算した、GR幅と、当該GR幅を有する領域の深度とに基づき作成し、上述した指標を用いて、深度閾値αを決定する。 The threshold determination unit 131 creates a size-depth distribution of the object as shown in Figure 7 based on the GR width calculated for each x-coordinate of the input image and the depth of the area having that GR width, and determines the depth threshold α using the above-mentioned indicators.

なお、本実施形態においては、対象物がガードレールである例を用いて説明したが、対象物はガードレールに限られるものではない。閾値決定部131は、任意の対象物について、当該対象物のサイズ-深度分布に基づきTP,FP,FN,TNを設定し、上述したような指標を用いて深度閾値αを決定すればよい。 In this embodiment, the object is described as a guardrail, but the object is not limited to a guardrail. The threshold determination unit 131 sets TP, FP, FN, and TN for any object based on the size-depth distribution of the object, and determines the depth threshold α using the indices described above.

また、上述した例では、閾値決定部131は、対象物のサイズ-深度分布に基づきTP,FP,FN,TNを設定し、上述した指標を用いて深度閾値αを決定する例を用いて説明したが、これに限られるものではない。例えば、閾値決定部131は、対象物のサイズ-深度分布に対する近似線(近似直線あるいは近似曲線)を設定して、深度閾値αを決定してもよい。 In addition, in the above example, the threshold determination unit 131 sets TP, FP, FN, and TN based on the size-depth distribution of the object, and determines the depth threshold α using the above-mentioned index, but this is not limited to this. For example, the threshold determination unit 131 may set an approximation line (approximation line or approximation curve) for the size-depth distribution of the object, and determine the depth threshold α.

具体的には、閾値決定部131は、図9に示すように、対象物のサイズ-深度分布に対して、近似線(図9においては、近似直線)を設定する。そして、閾値決定部131は、近似線における、劣化のサイズyに対する対象物のサイズxの比(x/y)が所定値(N=20)以上となる対象物のサイズに対応する深度を深度閾値αと決定する。図9に示す例では、N=20であるとすると、近似線における、GR幅=20画素に対応する深度である47が、深度閾値αと決定される。 Specifically, the threshold determination unit 131 sets an approximation line (an approximation straight line in FIG. 9) for the size-depth distribution of the object, as shown in FIG. 9. The threshold determination unit 131 then determines the depth corresponding to the object size on the approximation line where the ratio (x/y) of the object size x to the degradation size y is equal to or greater than a predetermined value (N=20) as the depth threshold α. In the example shown in FIG. 9, if N=20, then 47, which is the depth on the approximation line corresponding to a GR width of 20 pixels, is determined as the depth threshold α.

また、閾値決定部131は、対象物のサイズ-深度分布に対して、複数の近似線を設定してもよい。例えば、閾値決定部131は、図10に示すように、傾きの異なる、対象物のサイズ-深度分布に対してそれぞれ、近似線を設定してもよい。図10に示す例では、画像1では、N=20であるとすると、GR幅=20画素に対応する深度は80となる。また、画像2では、N=20であるとすると、GR幅=20画素に対応する深度は70となる。 The threshold determination unit 131 may also set multiple approximation lines for the size-depth distribution of an object. For example, as shown in FIG. 10, the threshold determination unit 131 may set approximation lines for size-depth distributions of an object with different slopes. In the example shown in FIG. 10, if N = 20 in image 1, the depth corresponding to a GR width of 20 pixels is 80. Also, if N = 20 in image 2, the depth corresponding to a GR width of 20 pixels is 70.

この場合、閾値決定部131は、図11に示すように、分類モデル1311を備える。 In this case, the threshold determination unit 131 has a classification model 1311, as shown in FIG. 11.

分類モデル1311は、画像における対象物のサイズ-深度分布に応じて入力画像を分類するモデルである。分類モデル1311は、例えば、画像における対象物のサイズ-深度分布の傾きに応じて入力画像を分類する。分類モデル1311は、深層学習などの統計的な判別モデルを用いて構築される。 Classification model 1311 is a model that classifies an input image according to the size-depth distribution of objects in the image. Classification model 1311 classifies an input image according to, for example, the gradient of the size-depth distribution of objects in the image. Classification model 1311 is constructed using a statistical discrimination model such as deep learning.

閾値決定部131は、分類モデル1311による入力画像の分類ごとに、画像における対象物のサイズ-深度分布に対する近似線を設定する。そして、閾値決定部131は、分類モデル1311により分類された画像について設定された近似線における、劣化のサイズyに対する対象物のサイズxの比(x/y)が所定値以上となる対象物の領域の深度を深度閾値αと決定する。例えば、N=20であり、入力画像が分類モデル1311により画像1に分類されたとすると、閾値決定部131は、画像1に対して設定した近似線における、GR幅=20画素の領域に対応する深度である80を深度閾値αと設定する。また、例えば、N=20であり、入力画像が分類モデル1311により画像2に分類されたとすると、閾値決定部131は、画像2に対して設定した近似線における、GR幅=20画素の領域の深度である70を、深度閾値αと設定する。このような処理により、1つの近似式を用いる場合よりも、高精度に点検領域を決定することができる。 The threshold determination unit 131 sets an approximation line for the size-depth distribution of objects in the image for each classification of the input image by the classification model 1311. The threshold determination unit 131 then determines the depth threshold α to be the depth of the object region on the approximation line set for the image classified by the classification model 1311, where the ratio (x/y) of the object size x to the degradation size y is equal to or greater than a predetermined value. For example, if N = 20 and the input image is classified as image 1 by the classification model 1311, the threshold determination unit 131 sets the depth threshold α to 80, which is the depth corresponding to the region with a GR width of 20 pixels on the approximation line set for image 1. Also, for example, if N = 20 and the input image is classified as image 2 by the classification model 1311, the threshold determination unit 131 sets the depth threshold α to 70, which is the depth of the region with a GR width of 20 pixels on the approximation line set for image 2. By performing such processing, the inspection area can be determined with higher accuracy than when a single approximation formula is used.

次に、本実施形態に係る画像処理装置10のハードウェア構成について説明する。 Next, we will explain the hardware configuration of the image processing device 10 related to this embodiment.

図12は、本実施形態に係る画像処理装置10のハードウェア構成の一例を示す図である。図12においては、画像処理装置10がプログラム命令を実行可能なコンピュータにより構成される場合の、画像処理装置10のハードウェア構成の一例を示している。ここで、コンピュータは、汎用コンピュータ、専用コンピュータ、ワークステーション、PC(Personal computer)、電子ノートパッドなどであってもよい。プログラム命令は、必要なタスクを実行するためのプログラムコード、コードセグメントなどであってもよい。 Figure 12 is a diagram showing an example of the hardware configuration of an image processing device 10 according to this embodiment. Figure 12 shows an example of the hardware configuration of the image processing device 10 when the image processing device 10 is configured by a computer capable of executing program instructions. Here, the computer may be a general-purpose computer, a dedicated computer, a workstation, a PC (Personal Computer), an electronic notepad, etc. The program instructions may be program code, code segments, etc. for performing the required tasks.

図12に示すように、画像処理装置10は、プロセッサ21、ROM(Read Only Memory)22、RAM(Random Access Memory)23、ストレージ24、入力部25、表示部26および通信インタフェース(I/F)27を有する。各構成は、バス29を介して相互に通信可能に接続されている。プロセッサ21は、具体的にはCPU(Central Processing Unit)、MPU(Micro Processing Unit)、GPU(Graphics Processing Unit)、DSP(Digital Signal Processor)、SoC(System on a Chip)などであり、同種または異種の複数のプロセッサにより構成されてもよい。 As shown in FIG. 12, the image processing device 10 has a processor 21, a ROM (Read Only Memory) 22, a RAM (Random Access Memory) 23, a storage 24, an input unit 25, a display unit 26, and a communication interface (I/F) 27. Each component is connected to each other via a bus 29 so that they can communicate with each other. The processor 21 is specifically a CPU (Central Processing Unit), MPU (Micro Processing Unit), GPU (Graphics Processing Unit), DSP (Digital Signal Processor), SoC (System on a Chip), etc., and may be composed of multiple processors of the same or different types.

プロセッサ21は、各構成の制御および各種の演算処理を実行する制御部である。すなわち、プロセッサ21は、ROM22またはストレージ24からプログラムを読み出し、RAM23を作業領域としてプログラムを実行する。プロセッサ21は、ROM22あるいはストレージ24に記憶されているプログラムに従って、上記各構成の制御および各種の演算処理を行う。本実施形態では、ROM22またはストレージ24には、コンピュータを本開示に係る画像処理装置10として動作させるためのプログラムが格納されている。当該プログラムがプロセッサ21により読み出されて実行されることで、画像処理装置10の各構成、すなわち、画像入力部11、深度推定部12,点検領域決定部13および結果出力部14が実現される。 The processor 21 is a control unit that controls each component and performs various calculation processes. That is, the processor 21 reads a program from the ROM 22 or the storage 24 and executes the program using the RAM 23 as a working area. The processor 21 controls each component and performs various calculation processes in accordance with the program stored in the ROM 22 or the storage 24. In this embodiment, the ROM 22 or the storage 24 stores a program for operating a computer as the image processing device 10 according to the present disclosure. The program is read and executed by the processor 21 to realize each component of the image processing device 10, namely, the image input unit 11, the depth estimation unit 12, the inspection area determination unit 13, and the result output unit 14.

プログラムは、CD-ROM(Compact Disk Read Only Memory)、DVD-ROM(Digital Versatile Disk Read Only Memory)、USB(Universal Serial Bus)メモリなどの非一時的(non-transitory)記憶媒体に記憶された形態で提供されてもよい。また、プログラムは、ネットワークを介して外部装置からダウンロードされる形態としてもよい。 The program may be provided in a form stored on a non-transitory storage medium such as a CD-ROM (Compact Disk Read Only Memory), a DVD-ROM (Digital Versatile Disk Read Only Memory), or a USB (Universal Serial Bus) memory. The program may also be provided in a form that can be downloaded from an external device via a network.

ROM22は、各種プログラムおよび各種データを格納する。RAM23は、作業領域として一時的にプログラムまたはデータを記憶する。ストレージ24は、HDD(Hard Disk Drive)またはSSD(Solid State Drive)により構成され、オペレーティングシステムを含む各種プログラムおよび各種データを格納する。ROM22またはストレージ24は、例えば、切り出しフレームとして出力されたフレームを記憶する。 ROM 22 stores various programs and data. RAM 23 temporarily stores programs or data as a working area. Storage 24 is composed of an HDD (Hard Disk Drive) or SSD (Solid State Drive) and stores various programs and data including the operating system. ROM 22 or storage 24 stores, for example, frames output as cut-out frames.

入力部25は、マウスなどのポインティングデバイス、およびキーボードを含み、各種の入力を行うために使用される。 The input unit 25 includes a pointing device such as a mouse and a keyboard, and is used to make various inputs.

表示部26は、例えば、液晶ディスプレイであり、各種の情報を表示する。表示部26は、タッチパネル方式を採用して、入力部25として機能してもよい。 The display unit 26 is, for example, a liquid crystal display, and displays various information. The display unit 26 may also function as the input unit 25 by adopting a touch panel system.

通信インタフェース27は、他の装置(例えば、対象物を撮影したカメラ)と通信するためのインタフェースであり、例えば、LAN用のインタフェースである。 The communication interface 27 is an interface for communicating with other devices (e.g., a camera that photographs an object), and is, for example, an interface for a LAN.

上述した画像処理装置10の各部として機能させるためにコンピュータを好適に用いることが可能である。そのようなコンピュータは、画像処理装置10の各部の機能を実現する処理内容を記述したプログラムを該コンピュータの記憶部に格納しておき、該コンピュータのプロセッサによってこのプログラムを読み出して実行させることで実現することができる。すなわち、当該プログラムは、コンピュータを、上述した画像処理装置10として機能させることができる。また、当該プログラムを非一時的記憶媒体に記憶することも可能である。また、当該プログラムを、ネットワークを介して提供することも可能である。 A computer can be suitably used to function as each part of the image processing device 10 described above. Such a computer can be realized by storing a program describing the processing content that realizes the functions of each part of the image processing device 10 in the computer's memory, and having the computer's processor read and execute this program. In other words, the program can cause the computer to function as the image processing device 10 described above. The program can also be stored on a non-transitory storage medium. The program can also be provided via a network.

このように、本実施形態に係る画像処理装置10は、深度推定部12と、点検領域決定部13と、点検領域決定部13の決定結果を出力する結果出力部14とを備える。深度推定部12は、画像を構成する画素ごとに、深度を推定する。点検領域決定部13は、画像における、点検の対象とする劣化のサイズyに対する対象物のサイズxの比が所定値以上となる対象物の領域の深度を深度閾値αとして決定する。そして、点検領域決定部13は、深度推定部12により推定された画素ごとの深度に基づき、深度閾値αよりも近傍の領域を点検領域と決定する。 As such, the image processing device 10 according to this embodiment includes a depth estimation unit 12, an inspection area determination unit 13, and a result output unit 14 that outputs the determination results of the inspection area determination unit 13. The depth estimation unit 12 estimates the depth for each pixel constituting the image. The inspection area determination unit 13 determines the depth of the object area in the image where the ratio of the object size x to the degradation size y to be inspected is equal to or greater than a predetermined value as the depth threshold α. Then, based on the depth for each pixel estimated by the depth estimation unit 12, the inspection area determination unit 13 determines the area closer to the depth threshold α as the inspection area.

劣化のサイズyに対する対象物のサイズxの比が所定値以上となる対象物の領域の深度を深度閾値αとし、深度閾値αよりも近傍の領域を点検領域と決定することで、決定領域における劣化のサイズは、検出の対象となる劣化のサイズy以上となる。そのため、インフラ設備などの対象物を撮影した画像において、対象物の劣化の有無を点検可能な領域を点検領域として決定することができる。 The depth of the object area where the ratio of the object size x to the deterioration size y is equal to or greater than a predetermined value is set as the depth threshold α, and the area closer to the depth threshold α is determined as the inspection area. This ensures that the size of the deterioration in the determined area is equal to or greater than the deterioration size y to be detected. Therefore, in an image of an object such as infrastructure equipment, the area that can be inspected for deterioration can be determined as the inspection area.

以上の実施形態に関し、更に以下の付記を開示する。 The following notes are further disclosed regarding the above embodiments.

[付記項1]
対象物を撮影した画像における、前記対象物に生じた劣化の有無を点検する点検領域を決定する画像処理装置であって、
メモリと、
前記メモリに接続された制御部と、
を備え、
前記制御部は、
前記画像を構成する画素ごとに、前記画像における奥行き方向の距離である深度を推定し、
前記画像における、点検の対象とする劣化のサイズに対する前記対象物のサイズの比が所定値以上となる前記対象物の領域の深度を深度閾値として決定し、前記推定した画素ごとの深度に基づき、前記深度閾値よりも近傍の領域を前記点検領域と決定し、
前記点検領域の決定結果を出力する、画像処理装置。
[Additional note 1]
An image processing device that determines an inspection area in an image of an object to inspect for the presence or absence of deterioration of the object,
Memory and
a control unit connected to the memory;
Equipped with
The control unit
Estimating a depth, which is a distance in a depth direction in the image, for each pixel constituting the image;
A depth threshold is determined as a depth of a region of the object in the image where a ratio of a size of the object to a size of the deterioration to be inspected is equal to or greater than a predetermined value, and an area closer to the depth threshold is determined as the inspection area based on the estimated depth of each pixel;
an image processing device that outputs the result of determining the inspection area;

[付記項2]
付記項1に記載の画像処理装置において、
前記制御部は、前記画像における前記対象物のサイズと、前記サイズを有する対象物の領域の深度との分布に基づき、前記深度閾値を決定する、画像処理装置。
[Additional note 2]
In the image processing device according to claim 1,
The control unit determines the depth threshold based on a distribution of the size of the object in the image and the depth of a region of the object having that size.

[付記項3]
付記項2に記載の画像処理装置において、
前記分布における、前記比が前記所定値以上であり、かつ、前記深度が前記深度閾値以上である領域のデータ数をTPとし、前記比が前記所定値未満であり、かつ、前記深度が前記深度閾値以上である領域のデータ数をFPとし、前記比が前記所定値以上であり、かつ、前記深度が前記深度閾値未満である領域のデータ数をFNとし、前記比が前記所定値未満であり、かつ、前記深度が前記深度閾値未満である領域のデータ数をTNとすると、
前記制御部は、(TP+TN)/(TP+FP+FN+TN)、TP/(TP+FN)またはTN/(FP+TN)から得られる指標に基づき、前記深度閾値を決定する、画像処理装置。
[Additional note 3]
In the image processing device according to supplementary item 2,
In the distribution, let TP be the number of data in the region where the ratio is equal to or greater than the predetermined value and the depth is equal to or greater than the depth threshold, let FP be the number of data in the region where the ratio is less than the predetermined value and the depth is equal to or greater than the depth threshold, let FN be the number of data in the region where the ratio is equal to or greater than the predetermined value and the depth is less than the depth threshold, and let TN be the number of data in the region where the ratio is less than the predetermined value and the depth is less than the depth threshold.
The control unit determines the depth threshold based on an index obtained from (TP+TN)/(TP+FP+FN+TN), TP/(TP+FN), or TN/(FP+TN).

[付記項4]
付記項2に記載の画像処理装置において、
前記制御部は、前記分布に対する近似線を設定し、前記近似線における、前記比が前記所定値以上となる前記対象物のサイズに対応する深度を前記深度閾値と決定する、画像処理装置。
[Additional note 4]
In the image processing device according to supplementary item 2,
The control unit sets an approximation line for the distribution and determines the depth threshold as the depth corresponding to the size of the object on the approximation line at which the ratio is equal to or greater than the predetermined value.

[付記項5]
付記項2に記載の画像処理装置において、
前記制御部は、前記分布に応じて入力画像を分類する分類モデルを備え、前記分類モデルによる入力画像の分類ごとに前記分布に対する近似線を設定し、前記分類モデルにより分類された画像について設定された近似線における、前記比が前記所定値以上となる前記対象物のサイズに対応する深度を前記深度閾値と決定する、画像処理装置。
[Additional note 5]
In the image processing device according to supplementary item 2,
The control unit is provided with a classification model that classifies an input image according to the distribution, sets an approximation line for the distribution for each classification of the input image by the classification model, and determines the depth threshold to be the depth corresponding to the size of the object at which the ratio is greater than or equal to the predetermined value on the approximation line set for the image classified by the classification model.

[付記項6]
対象物を撮影した画像における、前記対象物に生じた劣化の有無を点検する点検領域を決定する画像処理装置による画像処理方法であって、
前記画像を構成する画素ごとに、前記画像における奥行き方向の距離である深度を推定し、
前記画像における、点検の対象とする劣化のサイズに対する前記対象物のサイズの比が所定値以上となる前記対象物の領域の深度を深度閾値として決定し、前記推定された画素ごとの深度に基づき、前記深度閾値よりも近傍の領域を前記点検領域と決定し、
前記点検領域の決定結果を出力する、画像処理方法。
[Additional note 6]
1. An image processing method for an image processing device that determines an inspection area in an image of an object, in which the presence or absence of deterioration of the object is inspected, comprising:
Estimating a depth, which is a distance in a depth direction in the image, for each pixel constituting the image;
A depth threshold is determined as a depth of a region of the object in the image where a ratio of a size of the object to a size of the deterioration to be inspected is equal to or greater than a predetermined value, and an area closer to the depth threshold is determined as the inspection area based on the estimated depth of each pixel;
and outputting the result of determining the inspection area.

[付記項7]
コンピュータによって実行可能なプログラムを記憶した非一時的記憶媒体であって、前記コンピュータを、付記項1から5のいずれか一項に記載の画像処理装置として動作させる、プログラムを記憶した非一時的記憶媒体。
[Additional note 7]
A non-transitory storage medium storing a program executable by a computer, the non-transitory storage medium storing the program causing the computer to operate as the image processing device described in any one of appendix items 1 to 5.

上述の実施形態は代表的な例として説明したが、本開示の趣旨および範囲内で、多くの変更および置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、請求の範囲から逸脱することなく、種々の変形または変更が可能である。例えば、実施形態の構成図に記載の複数の構成ブロックを1つに組み合わせたり、あるいは1つの構成ブロックを分割したりすることが可能である。 The above-described embodiments have been described as representative examples, but it will be apparent to those skilled in the art that numerous modifications and substitutions are possible within the spirit and scope of the present disclosure. Therefore, the present invention should not be construed as being limited to the above-described embodiments, and various modifications and alterations are possible without departing from the scope of the claims. For example, multiple component blocks shown in the configuration diagrams of the embodiments may be combined into one, or one component block may be divided.

10 画像処理装置
11 画像入力部
12 深度推定部
13 点検領域決定部
14 結果出力部
131 閾値決定部
132 判定部
1311 分類モデル
21 プロセッサ
22 ROM
23 RAM
24 ストレージ
25 入力部
26 表示部
27 通信I/F
29 バス
REFERENCE SIGNS LIST 10 Image processing device 11 Image input unit 12 Depth estimation unit 13 Inspection area determination unit 14 Result output unit 131 Threshold determination unit 132 Determination unit 1311 Classification model 21 Processor 22 ROM
23 RAM
24 Storage 25 Input unit 26 Display unit 27 Communication I/F
29 Bus

Claims (7)

対象物を撮影した画像における、前記対象物に生じた劣化の有無を点検する点検領域を決定する画像処理装置であって、
前記画像を構成する画素ごとに、前記画像における奥行き方向の距離である深度を推定する深度推定部と、
前記画像における、点検の対象とする劣化のサイズに対する前記対象物のサイズの比が所定値以上となる前記対象物の領域の深度を深度閾値として決定し、前記深度推定部により推定された画素ごとの深度に基づき、前記深度閾値よりも近傍の領域を、前記点検領域と決定する点検領域決定部と、
前記点検領域決定部による前記点検領域の決定結果を出力する結果出力部と、を備える画像処理装置。
An image processing device that determines an inspection area in an image of an object to inspect for the presence or absence of deterioration of the object,
a depth estimation unit that estimates a depth, which is a distance in a depth direction in the image, for each pixel that constitutes the image;
an inspection area determination unit that determines a depth of an area of the object in the image where the ratio of the size of the object to the size of the deterioration to be inspected is equal to or greater than a predetermined value as a depth threshold, and determines an area closer to the depth threshold as the inspection area based on the depth of each pixel estimated by the depth estimation unit;
a result output unit that outputs a result of the inspection area determination by the inspection area determination unit.
請求項1に記載の画像処理装置において、
前記点検領域決定部は、前記画像における前記対象物のサイズと、前記サイズを有する対象物の領域の深度との分布に基づき、前記深度閾値を決定する、画像処理装置。
2. The image processing device according to claim 1,
The inspection area determination unit determines the depth threshold based on a distribution of the size of the object in the image and the depth of the area of the object having that size.
請求項2に記載の画像処理装置において、
前記分布における、前記比が前記所定値以上であり、かつ、前記深度が前記深度閾値以上である領域をTPとし、前記比が前記所定値未満であり、かつ、前記深度が前記深度閾値以上である領域をFPとし、前記比が前記所定値以上であり、かつ、前記深度が前記深度閾値未満である領域をFNとし、前記比が前記所定値未満であり、かつ、前記深度が前記深度閾値未満である領域をTNとすると、
前記点検領域決定部は、(TP+TN)/(TP+FP+FN+TN)、TP/(TP+FN)またはTN/(FP+TN)から得られる指標に基づき、前記深度閾値を決定する、画像処理装置。
3. The image processing device according to claim 2,
In the distribution, a region where the ratio is equal to or greater than the predetermined value and the depth is equal to or greater than the depth threshold is defined as TP, a region where the ratio is less than the predetermined value and the depth is equal to or greater than the depth threshold is defined as FP, a region where the ratio is equal to or greater than the predetermined value and the depth is less than the depth threshold is defined as FN, and a region where the ratio is less than the predetermined value and the depth is less than the depth threshold is defined as TN.
An image processing device wherein the inspection area determination unit determines the depth threshold based on an index obtained from (TP+TN)/(TP+FP+FN+TN), TP/(TP+FN), or TN/(FP+TN).
請求項2に記載の画像処理装置において、
前記点検領域決定部は、前記分布に対する近似線を設定し、前記近似線における、前記比が前記所定値以上となる前記対象物のサイズに対応する深度を前記深度閾値と決定する、画像処理装置。
3. The image processing device according to claim 2,
The inspection area determination unit sets an approximation line for the distribution and determines the depth threshold as the depth on the approximation line corresponding to the size of the object at which the ratio is greater than or equal to the predetermined value.
請求項2に記載の画像処理装置において、
前記点検領域決定部は、前記分布に応じて入力画像を分類する分類モデルを備え、前記分類モデルによる入力画像の分類ごとに前記分布に対する近似線を設定し、前記分類モデルにより分類された画像について設定された近似線における、前記比が前記所定値以上となる前記対象物のサイズに対応する深度を前記深度閾値と決定する、画像処理装置。
3. The image processing device according to claim 2,
The inspection area determination unit is provided with a classification model that classifies an input image according to the distribution, sets an approximation line to the distribution for each classification of the input image by the classification model, and determines the depth threshold to be the depth corresponding to the size of the object at which the ratio is greater than or equal to the predetermined value on the approximation line set for the image classified by the classification model.
対象物を撮影した画像における、前記対象物に生じた劣化の有無を点検する点検領域を決定する画像処理装置による画像処理方法であって、
前記画像を構成する画素ごとに、前記画像における奥行き方向の距離である深度を推定するステップと、
前記画像における、点検の対象とする劣化のサイズに対する前記対象物のサイズの比が所定値以上となる前記対象物の領域の深度を深度閾値として決定し、前記推定された画素ごとの深度に基づき、前記深度閾値よりも近傍の領域を前記点検領域と決定するステップと、
前記点検領域の決定結果を出力するステップと、を含む画像処理方法。
1. An image processing method for an image processing device that determines an inspection area in an image of an object, in which the presence or absence of deterioration of the object is inspected, comprising:
a step of estimating a depth, which is a distance in a depth direction in the image, for each pixel constituting the image;
determining a depth threshold as a depth of a region of the object in the image where the ratio of the size of the object to the size of the deterioration to be inspected is equal to or greater than a predetermined value, and determining an area closer to the depth threshold as the inspection region based on the estimated depth of each pixel;
and outputting the result of determining the inspection area.
コンピュータを、請求項1に記載の画像処理装置として動作させる、プログラム。 A program that causes a computer to operate as the image processing device described in claim 1.
JP2024545415A 2022-09-09 2022-09-09 Image processing device, image processing method and program Active JP7799225B2 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2022/033949 WO2024053108A1 (en) 2022-09-09 2022-09-09 Image processing device, image processing method, and program

Publications (2)

Publication Number Publication Date
JPWO2024053108A1 JPWO2024053108A1 (en) 2024-03-14
JP7799225B2 true JP7799225B2 (en) 2026-01-15

Family

ID=90192221

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2024545415A Active JP7799225B2 (en) 2022-09-09 2022-09-09 Image processing device, image processing method and program

Country Status (2)

Country Link
JP (1) JP7799225B2 (en)
WO (1) WO2024053108A1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001264257A (en) 2000-01-12 2001-09-26 Sharp Corp Image defect detection device, image defect detection method, and storage medium storing procedure of image defect detection method
JP2018017103A (en) 2016-07-29 2018-02-01 エヌ・ティ・ティ・コムウェア株式会社 Information processing apparatus, information processing method, and program

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001264257A (en) 2000-01-12 2001-09-26 Sharp Corp Image defect detection device, image defect detection method, and storage medium storing procedure of image defect detection method
JP2018017103A (en) 2016-07-29 2018-02-01 エヌ・ティ・ティ・コムウェア株式会社 Information processing apparatus, information processing method, and program

Also Published As

Publication number Publication date
WO2024053108A1 (en) 2024-03-14
JPWO2024053108A1 (en) 2024-03-14

Similar Documents

Publication Publication Date Title
Wang et al. Automated estimation of reinforced precast concrete rebar positions using colored laser scan data
Huyan et al. Detection of sealed and unsealed cracks with complex backgrounds using deep convolutional neural network
Wu et al. Road pothole extraction and safety evaluation by integration of point cloud and images derived from mobile mapping sensors
Hoang et al. Metaheuristic optimized edge detection for recognition of concrete wall cracks: a comparative study on the performances of roberts, prewitt, canny, and sobel algorithms
Arena et al. A new computational approach to cracks quantification from 2D image analysis: Application to micro-cracks description in rocks
US10880541B2 (en) Stereo correspondence and depth sensors
Jiang et al. Enhanced crack segmentation algorithm using 3D pavement data
Paal et al. Automated damage index estimation of reinforced concrete columns for post-earthquake evaluations
US9135710B2 (en) Depth map stereo correspondence techniques
CN103400139A (en) Method for identifying concrete crack characteristic information
CN114581890B (en) Method and device for determining lane line, electronic equipment and storage medium
JP6980208B2 (en) Structure maintenance work support system
CN116309660B (en) A method, apparatus, device and storage medium for linear detection
CN114202631A (en) Method for determining rock working face and working point in secondary rock crushing operation
Zhong et al. YOLOv8 and point cloud fusion for enhanced road pothole detection and quantification
Huang et al. A three-stage detection algorithm for automatic crack-width identification of fine concrete cracks
Li et al. Automatic tiny crack positioning and width measurement with parallel laser line‐camera system
Adu-Gyamfi et al. Functional evaluation of pavement condition using a complete vision system
Shin et al. Paving block displacement detection and measurement using 3D laser sensors on unmanned ground vehicles
Yang et al. Enhanced detection and prediction of concrete filling defects with deep learning
JP7799225B2 (en) Image processing device, image processing method and program
CN119559171B (en) Method, device, electronic device and readable storage medium for measuring ore and rock block size
CN118311035A (en) Road disease detection method, device, medium and product based on visual image
WO2021186640A1 (en) Deterioration detection device, deterioration detection system, deterioration detection method, and program
JP7174601B2 (en) Crest surface level difference extraction system and crown surface level difference extraction method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20250205

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20251007

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20251113

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20251125

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20251208

R150 Certificate of patent or registration of utility model

Ref document number: 7799225

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150