JP7832141B2 - Information processing device, information processing method, and program - Google Patents
Information processing device, information processing method, and programInfo
- Publication number
- JP7832141B2 JP7832141B2 JP2023043112A JP2023043112A JP7832141B2 JP 7832141 B2 JP7832141 B2 JP 7832141B2 JP 2023043112 A JP2023043112 A JP 2023043112A JP 2023043112 A JP2023043112 A JP 2023043112A JP 7832141 B2 JP7832141 B2 JP 7832141B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- region
- information processing
- orientation
- machine learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Image Analysis (AREA)
Description
本発明は、情報処理装置、情報処理方法、及びプログラムに関する。 This invention relates to an information processing device, an information processing method, and a program.
機械学習により、画像上において所望の対象物を検出するというアノテーションに関する技術が知られている(例えば、特許文献1参照)。 A technique for annotating images using machine learning to detect desired objects is known (see, for example, Patent Document 1).
しかしながら従来の技術では、対象物の領域のセグメンテーションの精度が不十分であり、その結果、検出された対象物をアノテーションとして画像に付与するのが効果的でない場合があった。 However, conventional techniques lacked sufficient accuracy in segmenting the object's region, resulting in ineffective methods of annotating the detected object onto the image.
本発明は、このような事情が考慮されたものであり、画像上において対象物の領域を精度よくセグメンテーションすることで、アノテーションを効果的に行うことができる情報処理装置、情報処理方法、及びプログラムを提供することを目的の一つとする。 This invention takes these circumstances into consideration and aims to provide an information processing device, an information processing method, and a program that can effectively perform annotation by accurately segmenting the region of an object on an image.
本発明の一態様は、上空から地表面が撮像された画像上において対象物の領域を検出する検出部と、前記領域の向きを推定する推定部と、前記向きに基づいて、前記領域を整形する画像処理部と、を備える情報処理装置である。 One aspect of the present invention is an information processing apparatus comprising: a detection unit for detecting the region of an object on an image of the ground surface captured from above; an estimation unit for estimating the orientation of the region; and an image processing unit for shaping the region based on the orientation.
本発明の一態様によれば、画像上において対象物の領域を精度よくセグメンテーションすることで、アノテーションを効果的に行うことができる。 According to one aspect of the present invention, annotation can be effectively performed by accurately segmenting the region of an object on an image.
以下、図面を参照し、本発明の情報処理装置、情報処理方法、及びプログラムの実施形態について説明する。 The following describes embodiments of the information processing apparatus, information processing method, and program of the present invention with reference to the drawings.
[概要]
本実施形態の一態様の情報処理装置は、上空から地表面が撮像された画像上において対象物の領域を検出するとともに、対象物の領域の向きを推定する。
[overview]
One aspect of this embodiment of the information processing device detects the region of an object on an image of the ground surface taken from above, and estimates the orientation of the region of the object.
上空から地表面が撮像された画像は、例えば、衛星画像(衛星写真)、航空画像(航空写真)、空中画像(空中写真)などである。 Images of the Earth's surface taken from above include, for example, satellite images (satellite photographs), aerial images (aerial photographs), and aerial photographs (aerial photographs).
画像上において検出される対象物は、ユーザに提供されるサービスやアプリ―ションの種類に応じて任意に決定することができる。例えば、ユーザに対して衛星画像や航空画像などを地図データとして提供する場合、それら画像上に写るあらゆるものが対象物となり得る。より具体的には、地図データを用いてユーザを目的地までナビゲーションする場合、目的地までの経路上に存在する横断歩道や信号機、スクールゾーン、踏切などの交通規制設置物が対象物として選択されてよい。以下、一例として対象物が「横断歩道」であるものとして説明する。 The objects detected on an image can be arbitrarily determined depending on the type of service or application provided to the user. For example, when providing users with satellite or aerial imagery as map data, anything visible in those images can be considered an object. More specifically, when navigating a user to a destination using map data, traffic control structures such as pedestrian crossings, traffic lights, school zones, and railway crossings along the route to the destination may be selected as objects. The following explanation will use "pedestrian crossings" as an example object.
なお、衛星画像や航空画像などの地図データが土砂くずれや河川氾濫といった自然災害の防災に利用される場合、それら災害を引き起こし得るもの(例えば森林を伐採して設置された太陽光パネルなど)が対象物として選択されてもよい。 Furthermore, when map data such as satellite imagery and aerial imagery is used for disaster prevention against natural disasters such as landslides and river flooding, objects that could potentially cause these disasters (for example, solar panels installed after forests have been cleared) may be selected as targets.
情報処理装置は、画像上において対象物(例えば横断歩道)の領域を検出し、かつ対象物の領域の向きを推定すると、推定された向きに基づいて対象物の領域を整形する。このように、対象物(例えば横断歩道)の領域を整形することでセグメンテーションの精度が向上する。この結果、横断歩道などの対象物を衛星画像などにアノテーションとして付与する際に、そのアノテーションを効果的に行うことができる。 The information processing device detects the region of an object (e.g., a pedestrian crossing) in an image and estimates its orientation. Based on the estimated orientation, it then reshapes the region of the object. This reshaping of the object's region improves the accuracy of segmentation. As a result, when adding annotations to satellite imagery, such as pedestrian crossings, the annotation process becomes more effective.
[情報処理装置]
図1は、実施形態に係る情報処理装置100の構成の一例を表す図である。例えば、情報処理装置100は、ユーザの端末装置と情報の送受信を行うウェブサーバやアプリケーションサーバである。
[Information Processing Device]
Figure 1 is a diagram showing an example of the configuration of an information processing device 100 according to the embodiment. For example, the information processing device 100 is a web server or application server that sends and receives information with a user's terminal device.
ユーザの端末装置は、スマートフォンやパーソナルコンピュータ、タブレット端末などの通信機能と表示機能を有するコンピュータ装置である。具体的には、端末装置は、ネットワークNWを介してコンテンツ提供装置50などの外部装置を通信するための通信インタフェースと、ディスプレイと、GNSS(Global Navigation Satellite System)受信機とを備える。ネットワークNWは、インターネットやLAN(Local Area Network)、WAN(Wide Area Network)、セルラー網などを含む。 The user's terminal device is a computer device with communication and display functions, such as a smartphone, personal computer, or tablet terminal. Specifically, the terminal device includes a communication interface for communicating with external devices such as the content provision device 50 via a network NW, a display, and a GNSS (Global Navigation Satellite System) receiver. The network NW includes the Internet, LAN (Local Area Network), WAN (Wide Area Network), and cellular networks.
通信インタフェースは、例えば、NIC(Network Interface Card)等のネットワークカード、無線通信モジュールを含む。ディスプレイは、例えば、LCD(Liquid Crystal Display)や有機EL(Electro Luminescence)ディスプレイ等を含む。これらディスプレイには、ユーザからの各種の入力操作を受け付けるためのGUI(Graphical User Interface)が表示される。GNSS受信機は、端末装置の位置を測位する。 The communication interface includes, for example, a network card such as a NIC (Network Interface Card) and a wireless communication module. The display includes, for example, an LCD (Liquid Crystal Display) or an organic EL (Electro-Luminescence) display. These displays show a GUI (Graphical User Interface) for accepting various user input operations. The GNSS receiver determines the location of the terminal device.
更に、端末装置は、CPU(Central Processing Unit)などのプロセッサを備えており、そのCPUがUA(User Agent)を実行することで、各種コンテンツがディスプレイに表示される。 Furthermore, the terminal device is equipped with a processor such as a CPU (Central Processing Unit), and the CPU executes a User Agent (UA), which then displays various content on the screen.
情報処理装置100は、ユーザの端末装置上においてウェブブラウザ又はアプリケーションがUAとして起動され、そのUAからリクエストが送信されると、そのリクエストに対するレスポンスとして、各種コンテンツを端末装置に提供する。コンテンツには、例えば、横断歩道などの対象物がアノテーションとして付与された衛星画像などが含まれる。 The information processing device 100, when a web browser or application is launched as a user agent (UA) on the user's terminal device and a request is sent from that UA, provides various content to the terminal device as a response to that request. This content includes, for example, satellite images with annotations indicating objects such as pedestrian crossings.
図示のように情報処理装置100は、通信部102と、処理部110と、記憶部130とを備える。 As shown in the figure, the information processing device 100 comprises a communication unit 102, a processing unit 110, and a storage unit 130.
通信部102は、例えば、ネットワークNWに接続するためのネットワークカード等の通信インターフェースである。 The communication unit 102 is, for example, a communication interface such as a network card for connecting to a network NW.
処理部110は、取得部112と、領域検出部114と、向き推定部116と、画像処理部118と、通信制御部120と、学習部122とを備える。これらの構成要素は、例えば、CPU(Central Processing Unit)などのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。処理部110の構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)などのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。 The processing unit 110 comprises an acquisition unit 112, a region detection unit 114, an orientation estimation unit 116, an image processing unit 118, a communication control unit 120, and a learning unit 122. These components are realized, for example, by a hardware processor such as a CPU (Central Processing Unit) executing a program (software). Some or all of the components of the processing unit 110 may be realized by hardware (including circuitry) such as LSI (Large Scale Integration), ASIC (Application Specific Integrated Circuit), FPGA (Field-Programmable Gate Array), and GPU (Graphics Processing Unit), or by the collaboration of software and hardware.
記憶部130は、例えば、HDD(Hard Disc Drive)、フラッシュメモリ、EEPROM(Electrically Erasable Programmable Read Only Memory)、ROM(Read Only Memory)、RAM(Random Access Memory)などの記憶装置により実現される。記憶部130には、プロセッサによって実行されるファームウェアやアプリケーションプログラムなどが格納される。プログラムは、予め記憶部130に格納されていてもよいし、DVDやCD-ROMなどの着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置に装着されることで記憶部130にインストールされてもよい。 The storage unit 130 is implemented using, for example, a storage device such as an HDD (Hard Disc Drive), flash memory, EEPROM (Electrically Erasable Programmable Read Only Memory), ROM (Read Only Memory), or RAM (Random Access Memory). The storage unit 130 stores firmware and application programs executed by the processor. The programs may be pre-stored in the storage unit 130, or they may be stored on a removable storage medium (non-transient storage medium) such as a DVD or CD-ROM, and installed in the storage unit 130 when the storage medium is inserted into the drive device.
また記憶部130には、衛星画像や航空画像を含む地図データ132や、トレーニングデータセット134が記憶されている。地図データ132には、衛星画像や航空画像といった上空から地表面を撮像した各種画像が含まれる。トレーニングデータセット134は、後述の機械学習モデルを学習するために用意されたデータセット(入力データと正解の出力データの組み)である。 The memory unit 130 also stores map data 132, which includes satellite and aerial images, and a training dataset 134. The map data 132 includes various images of the Earth's surface taken from above, such as satellite and aerial images. The training dataset 134 is a dataset (a combination of input data and correct output data) prepared for training the machine learning model described later.
[情報処理装置の処理フロー]
以下、フローチャートに即して処理部110の処理内容についてフローチャートを用いて説明する。図2は、実施形態に係る処理部110の一連の処理の流れを示すフローチャートである。本フローチャートの処理は、例えば、所定の周期で繰り返し実行されてよい。
[Processing flow of information processing equipment]
The processing details of the processing unit 110 will be explained below using a flowchart. Figure 2 is a flowchart showing the sequence of processing steps of the processing unit 110 according to this embodiment. The processing steps in this flowchart may be executed repeatedly, for example, at a predetermined cycle.
まず、取得部112は、衛星画像IMG1を取得する(ステップS100)。例えば、記憶部130に地図データ132として衛星画像IMG1が記憶されている場合、取得部112は、記憶部130から衛星画像IMG1を読み出して取得してよい。また、取得部112は、通信部102を介して外部サーバ(例えばデータソースサーバ)から衛星画像IMG1を取得してもよい。また、例えば、情報処理装置100のドライブ装置に、衛星画像IMG1が格納された非一過性の記憶媒体(例えばフレッシュメモリ等)が接続された場合、取得部112は、記憶媒体から衛星画像IMG1を読み出してもよい。上述したように取得部112は、衛星画像の代わりに航空画像や空中画像を取得してもよい。以下、一例として取得対象の画像が衛星画像IMG1であるものとして説明する。 First, the acquisition unit 112 acquires the satellite image IMG1 (step S100). For example, if the satellite image IMG1 is stored as map data 132 in the storage unit 130, the acquisition unit 112 may read and acquire the satellite image IMG1 from the storage unit 130. Alternatively, the acquisition unit 112 may acquire the satellite image IMG1 from an external server (e.g., a data source server) via the communication unit 102. Furthermore, if a non-transient storage medium (e.g., fresh memory) containing the satellite image IMG1 is connected to the drive device of the information processing device 100, the acquisition unit 112 may read the satellite image IMG1 from the storage medium. As described above, the acquisition unit 112 may acquire aerial images or other images instead of satellite images. The following explanation assumes that the image to be acquired is the satellite image IMG1.
次に、領域検出部114は、取得部112によって取得された衛星画像IMG1(航空画像や空中画像でもよい)上において、対象物の一例である横断歩道の領域を検出する(ステップS102)。 Next, the region detection unit 114 detects the region of a pedestrian crossing, which is an example of an object, on the satellite image IMG1 (which may also be an aerial or aerial image) acquired by the acquisition unit 112 (step S102).
例えば、領域検出部114は、セグメンテーションモデルの一つである第1機械学習モデルMDL1を用いて、衛星画像IMG1上において横断歩道の領域を検出する(セグメンテーションを行う)。 For example, the region detection unit 114 uses the first machine learning model MDL1, which is one of the segmentation models, to detect the area of a pedestrian crossing on the satellite image IMG1 (performing segmentation).
第1機械学習モデルMDL1は、例えば、例えば、CNN(Convolutional Neural Network(s))等のニューラルネットワークを用いて実装されたセグメンテーションモデルであってよい。 The first machine learning model, MDL1, may be a segmentation model implemented using a neural network such as a CNN (Convolutional Neural Network(s)).
第1機械学習モデルMDL1は、あるトレーニング対象の衛星画像に対して、トレーニング対象の衛星画像上において検出されるべき正解の対象物(例えば横断歩道)の領域が対応付けられた第1トレーニングデータセットに基づいて学習される。対象物を横断歩道とした場合、その領域は4頂点をもつ四角形の領域となる。 The first machine learning model, MDL1, is trained based on a first training dataset in which a given satellite image is associated with the regions of the correct objects (e.g., crosswalks) that should be detected on that satellite image. If the object is a crosswalk, its region will be a quadrilateral with four vertices.
図3は、第1機械学習モデルMDL1を用いて横断歩道の領域を検出する方法を説明するための図である。領域検出部114は、取得部112によって取得された衛星画像IMG1を、第1機械学習モデルMDL1に入力する。上述したように、第1機械学習モデルMDL1は、第1トレーニングデータセットに基づき学習されている。そのため、第1機械学習モデルMDL1は、衛星画像IMG1が入力されたことを受けて、横断歩行の領域として、その領域の位置やサイズを出力する。更に、第1機械学習モデルMDL1は、領域の位置やサイズの尤もらしさ、つまりどの程度信頼できるのかを表すスコア(以下、信頼スコアという)を出力してよい。 Figure 3 illustrates a method for detecting a pedestrian crossing area using the first machine learning model MDL1. The area detection unit 114 inputs the satellite image IMG1 acquired by the acquisition unit 112 into the first machine learning model MDL1. As described above, the first machine learning model MDL1 is trained based on the first training dataset. Therefore, upon receiving the satellite image IMG1, the first machine learning model MDL1 outputs the location and size of the pedestrian crossing area. Furthermore, the first machine learning model MDL1 may output a score (hereinafter referred to as the confidence score) representing the likelihood, or reliability, of the location and size of the area.
フローチャートの説明に戻る。次に、画像処理部118は、衛星画像IMG1から横断歩行の領域をクロッピングし(切り出し)、そのクロッピングした衛星画像IMG1の一部領域をクロップド画像IMG2として生成する(ステップS104)。 Returning to the flowchart explanation, the image processing unit 118 then crops (extracts) the area of the traverse from the satellite image IMG1, and generates a cropped image IMG2 from the cropped portion of the satellite image IMG1 (step S104).
第1機械学習モデルMDL1を用いて横断歩道の領域を検出した場合、その横断歩道の領域は四角形の領域として検出されやすいが、一方で5頂点をもつ五角形の領域や、それ以上の頂点をもつ多角形の領域として検出される場合がある。 When detecting the area of a pedestrian crossing using the first machine learning model MDL1, the area of the pedestrian crossing is often detected as a quadrilateral, but it may also be detected as a pentagon with five vertices or a polygon with more than five vertices.
横断歩道の領域が5頂点以上の多角形の領域として検出された場合、画像処理部118は、以下の条件をもとに、多角形である横断歩道の領域を4頂点をもつ四角形(或いは5頂点をもつ五角形)に近似してよい。
(1)最初に4頂点をもつ四角形のポリゴンで横断歩道の領域を近似する。
(2)近似した四角形のポリゴンの面積と、元の横断歩道の領域の面積との差が、元の横断歩道の領域の面積の25%未満、又は1ピクセルの面積を1とした場合に、元の横断歩道の領域の面積が128未満であれば、近似せずに元の横断歩道の領域をそのまま採用する。
(3)次に5頂点をもつ五角形のポリゴンで、四角形のポリゴンに近似した横断歩道の領域を更に近似する。
If the area of a pedestrian crossing is detected as a polygonal area with five or more vertices, the image processing unit 118 may approximate the polygonal area of the pedestrian crossing to a quadrilateral with four vertices (or a pentagon with five vertices) based on the following conditions.
(1) First, approximate the area of the crosswalk with a quadrilateral polygon having four vertices.
(2) If the difference between the area of the approximated quadrilateral polygon and the area of the original crosswalk is less than 25% of the area of the original crosswalk, or if the area of the original crosswalk is less than 128 when the area of one pixel is set to 1, the original crosswalk area will be used as is without approximation.
(3) Next, the area of the pedestrian crossing, which is approximated by the quadrilateral polygon, is further approximated by a pentagonal polygon with 5 vertices.
次に、画像処理部118は、クロップド画像IMG2のアスペクト比が許容範囲内であるか否かを判定する(ステップS106)。例えば、後述の第2機械学習モデルMDL2に対して入力するクロップド画像IMG2が正方形であるものと想定されている場合(学習時に正方形の画像を含む第2トレーニングデータセットを用いている場合)、アスペクト比の許容範囲は、例えば、正方形のアスペクト比1:1と同じか、又は正方形のアスペクト比に数%の誤差を許容したものであってよい。 Next, the image processing unit 118 determines whether the aspect ratio of the cropped image IMG2 is within an acceptable range (step S106). For example, if the cropped image IMG2 input to the second machine learning model MDL2 (described later) is assumed to be square (i.e., if a second training dataset containing square images is used during training), the acceptable range for the aspect ratio may be, for example, the same as the aspect ratio of a square image (1:1), or one that allows for an error of a few percent in the aspect ratio of a square image.
クロップド画像IMG2のアスペクト比が許容範囲外である場合(つまりクロップド画像IMG2が正方形でない場合)、画像処理部118は、アスペクト比が許容範囲内となるように、クロップド画像IMG2をパディングする(ステップS108)。 If the aspect ratio of the cropped image IMG2 is outside the acceptable range (i.e., the cropped image IMG2 is not square), the image processing unit 118 pads the cropped image IMG2 so that the aspect ratio is within the acceptable range (step S108).
例えば、画像処理部118は、パディングとして、クロップド画像IMG2を表す行列に対して、そのクロップド画像IMG2の上下左右のいずれか一つ又は全部に任意の画素値(例えば道路面と同色の画素値)を加えることで、クロップド画像IMG2の形状を正方形に近づける。 For example, the image processing unit 118, as padding, adds an arbitrary pixel value (for example, a pixel value of the same color as the road surface) to one or all of the top, bottom, left, or right sides of the matrix representing the cropped image IMG2, thereby making the shape of the cropped image IMG2 closer to a square.
一方、クロップド画像IMG2のアスペクト比が許容範囲内である場合(つまりクロップド画像IMG2が正方形である場合)、画像処理部118は、S118の処理であるパディングを省略する。 On the other hand, if the aspect ratio of the cropped image IMG2 is within an acceptable range (i.e., if the cropped image IMG2 is square), the image processing unit 118 omits the padding process in S118.
一般的に、横断歩道の形状は道路やその周辺の交通事情に応じて決められており、横断歩道の形状が極端に縦長であったり、横長であったりする場合がある。このように様々な形状の横断歩道のクロップド画像IMG2が、後述の第2機械学習モデルMDL2に入力されることになると、第2機械学習モデルMDL2によって推定される各向き(詳細は後述する)が、学習時に想定された向きから乖離しやすい。例えば、学習時に想定された向きが0度、90度、180度である場合、それら角度以外が第2機械学習モデルMDL2によって推定されやすい。 Generally, the shape of pedestrian crossings is determined according to the road and surrounding traffic conditions, and pedestrian crossings can sometimes be extremely elongated vertically or horizontally. When cropped images of pedestrian crossings of various shapes (IMG2) are input into the second machine learning model (MDL2), the orientations estimated by MDL2 (details below) tend to deviate from the orientations assumed during training. For example, if the orientations assumed during training were 0 degrees, 90 degrees, and 180 degrees, angles other than these are more likely to be estimated by MDL2.
これに対して、後述の第2機械学習モデルMDL2に対して入力するクロップド画像IMG2のアスペクト比をパディングによって調整することで、後述の第2機械学習モデルMDL2の出力結果の精度を向上させることができる。例えば、アスペクト比を統一した上でクロップド画像IMG2を第2機械学習モデルMDL2へと入力することで、第2機械学習モデルMDL2が学習時に想定された向き(0度、90度、180度)を出力しやすくなる。 In contrast, by adjusting the aspect ratio of the cropped image IMG2 input to the second machine learning model MDL2 (described later) using padding, the accuracy of the output results of the second machine learning model MDL2 can be improved. For example, by inputting the cropped image IMG2 into the second machine learning model MDL2 after unifying the aspect ratio, the second machine learning model MDL2 becomes more likely to output the orientation (0 degrees, 90 degrees, 180 degrees) that was assumed during training.
なお、第2機械学習モデルMDL2に対して入力するクロップド画像IMG2が正方形ではなく長方形であると想定されている場合(学習時に長方形の画像を含む第2トレーニングデータセットを用いている場合)、S106の判定処理で比較されるアスペクト比の許容範囲は、正方形ではなく長方形のアスペクト比に応じて決められてよい。 Furthermore, if the cropped image IMG2 input to the second machine learning model MDL2 is assumed to be rectangular rather than square (i.e., if a second training dataset containing rectangular images is used during training), the acceptable range of aspect ratios compared in the judgment process of S106 may be determined according to the aspect ratio of a rectangle, rather than a square.
次に、向き推定部116は、クロップド画像IMG2に含まれる横断歩道の向きV1と、横断歩道として道路上に描かれた白線の向きV2とを推定する(ステップS110)。 Next, the orientation estimation unit 116 estimates the orientation V1 of the pedestrian crossing included in the cropped image IMG2 and the orientation V2 of the white line drawn on the road as the pedestrian crossing (step S110).
横断歩道の向きV1は、歩行者が横断歩道を横断する方向であり、白線の長手方向(白線が延在する方向)と交差する方向である。白線の向きV2は、白線の長手方向(白線が延在する方向)である。横断歩道の向きV1は「第1方向」の一例であり、白線の向きV2は「第2方向」の一例である。 The direction V1 of the crosswalk is the direction in which pedestrians cross the crosswalk, and it intersects with the longitudinal direction of the white line (the direction in which the white line extends). The direction V2 of the white line is the longitudinal direction of the white line (the direction in which the white line extends). The direction V1 of the crosswalk is an example of the "first direction," and the direction V2 of the white line is an example of the "second direction."
例えば、向き推定部116は、CNN(Convolutional Neural Network(s))等のニューラルネットワークを用いて実装された第2機械学習モデルMDL2を用いて、クロップド画像IMG2上において横断歩道の向きV1及び白線の向きV2を推定する。 For example, the orientation estimation unit 116 uses a second machine learning model MDL2, implemented using a neural network such as a CNN (Convolutional Neural Network(s)), to estimate the orientation V1 of the crosswalk and the orientation V2 of the white line on the cropped image IMG2.
第2機械学習モデルMDL2は、あるトレーニング対象のクロップド画像上において推定されるべき正解の対象物の領域の向きとして横断歩道の向きV1及び白線の向きV2が対応付けられた第2トレーニングデータセットに基づいて学習される。トレーニング対象のクロップド画像は、トレーニング対象の衛星画像から横断歩道の領域が切り出された画像であり、例えば、上述したように正方形の画像である。 The second machine learning model, MDL2, is trained on a second training dataset in which the orientation of the crosswalk (V1) and the orientation of the white line (V2) are associated with the orientation of the ground truth object region to be estimated on a cropped image used for training. The cropped image used for training is an image extracted from a satellite image containing the crosswalk region, and is, for example, a square image as described above.
図4は、第2機械学習モデルMDL2を用いて各種向きを推定する方法を説明するための図である。向き推定部116は、画像処理部118によって生成されたクロップド画像IMG2を、第2機械学習モデルMDL2に入力する。上述したように、第2機械学習モデルMDL2は、第2トレーニングデータセットに基づき学習されている。そのため、第2機械学習モデルMDL2は、クロップド画像IMG2が入力されたことを受けて、対象物の領域の向きとして、横断歩道の向きV1及び白線の向きV2を出力する。 Figure 4 illustrates the method for estimating various orientations using the second machine learning model MDL2. The orientation estimation unit 116 inputs the cropped image IMG2, generated by the image processing unit 118, into the second machine learning model MDL2. As described above, the second machine learning model MDL2 is trained based on the second training dataset. Therefore, upon receiving the cropped image IMG2, the second machine learning model MDL2 outputs the orientation of the crosswalk V1 and the orientation of the white line V2 as the orientation of the object's region.
次に、画像処理部118は、向き推定部116によって推定された横断歩道の向きV1及び白線の向きV2に基づいて、領域検出部114によって検出された横断歩道の領域を整形する(ステップS112)。 Next, the image processing unit 118 reshapes the area of the pedestrian crossing detected by the area detection unit 114 based on the direction V1 of the pedestrian crossing and the direction V2 of the white line estimated by the direction estimation unit 116 (step S112).
図5は、横断歩道の領域を整形する方法を説明するための図である。図中の(a)は、クロップド画像IMG2を表しており、そのクロップド画像IMG2上のRは、領域検出部114によって検出された横断歩道の領域を表している。クロップド画像IMG2は便宜上長方形となっているが実際には正方形であってよい。またクロップド画像IMG2が長方形であっても上述のようにパディングによって正方形に変換されてよい。 Figure 5 illustrates a method for shaping the area of a pedestrian crossing. (a) in the figure represents the cropped image IMG2, and R on the cropped image IMG2 represents the area of the pedestrian crossing detected by the area detection unit 114. Although the cropped image IMG2 is shown as a rectangle for convenience, it may actually be a square. Furthermore, even if the cropped image IMG2 is rectangular, it may be converted to a square by padding as described above.
図中の(b)は、(a)のクロップド画像IMG2上において横断歩道の向きV1及び白線の向きV2が推定されていることを表している。図示のように、検出された横断歩道の領域Rは、実際の横断歩道の領域を完全にはマスクしない場合がある。これはセグメンテーションモデルが第1機械学習モデルMDL1を用いたモデルベースであることに起因する。従って、画像処理部118は、横断歩道の向きV1及び白線の向きV2に基づいて、実際の横断歩道の領域を完全にマスクするように、第1機械学習モデルMDL1を用いて検出された横断歩道の領域Rを整形する。 Figure (b) indicates that the orientation of the pedestrian crossing V1 and the orientation of the white line V2 are estimated on the cropped image IMG2 of (a). As shown in the figure, the detected pedestrian crossing region R may not completely mask the actual pedestrian crossing region. This is because the segmentation model is model-based using the first machine learning model MDL1. Therefore, the image processing unit 118 reshapes the detected pedestrian crossing region R using the first machine learning model MDL1 to completely mask the actual pedestrian crossing region, based on the orientation of the pedestrian crossing V1 and the orientation of the white line V2.
(c)に示すように、まず画像処理部118は、横断歩道の領域Rとして検出された四角形の4辺のうち、互いに対向する辺同士、つまり対辺を一組にして2つの組に分ける。具体的には、画像処理部118は、横断歩道の領域Rとして検出された四角形の4辺を、横断歩道の向きV1の角度に近い(V1との角度差が小さくより平行な)2辺と、白線の向きV2の角度に近い(V2との角度差が小さくより平行な)2辺とに分類する。横断歩道の向きV1の角度に近い(V1との角度差が小さくより平行な)2辺は「第1の対辺」の一例であり、白線の向きV2の角度に近い(V2との角度差が小さくより平行な)2辺は「第2の対辺」の一例である。 As shown in (c), the image processing unit 118 first divides the four sides of the rectangle detected as the crosswalk area R into two pairs, with opposite sides forming a pair. Specifically, the image processing unit 118 classifies the four sides of the rectangle detected as the crosswalk area R into two sets: two sides that are close to the angle of the crosswalk direction V1 (smaller angle difference with V1 and more parallel) and two sides that are close to the angle of the white line direction V2 (smaller angle difference with V2 and more parallel). The two sides that are close to the angle of the crosswalk direction V1 (smaller angle difference with V1 and more parallel) are an example of the "first pair of opposite sides," and the two sides that are close to the angle of the white line direction V2 (smaller angle difference with V2 and more parallel) are an example of the "second pair of opposite sides."
(d)に示すように、次に画像処理部118は、横断歩道の向きV1の角度に近い(V1との角度差が小さくより平行な)2辺を、横断歩道の向きV1に近づくように回転させる。同様に、画像処理部118は、白線の向きV2の角度に近い(V2との角度差が小さくより平行な)2辺を、白線の向きV2に近づくように回転させる。この際、画像処理部118は、各辺の中点周りにそれら辺を回転させてよい。 As shown in (d), the image processing unit 118 then rotates two sides that are close in angle to the direction V1 of the crosswalk (i.e., the angle difference with V1 is small and they are more parallel) so that they approach the direction V1 of the crosswalk. Similarly, the image processing unit 118 rotates two sides that are close in angle to the direction V2 of the white line (i.e., the angle difference with V2 is small and they are more parallel) so that they approach the direction V2 of the white line. In this case, the image processing unit 118 may rotate the sides around their midpoints.
(e)に示すように、画像処理部118は、角度が修正された4辺によって閉じた領域(つまり整形された領域)を、新たな横断歩道の領域R#とする。この際、画像処理部118は、新たな横断歩道の領域R#の面積が、整形前の横断歩道の領域Rの面積の50%以下となった場合、新たな横断歩道の領域R#を採用せずに、整形前の横断歩道の領域Rを採用する。また画像処理部118は、新たな横断歩道の領域R#と、整形前の横断歩道の領域Rとの重複する部分が、整形前の横断歩道の領域Rの面積の50%以下となった場合であっても、新たな横断歩道の領域R#を採用せずに、整形前の横断歩道の領域Rを採用してよい。 As shown in (e), the image processing unit 118 defines the region enclosed by the four sides with corrected angles (i.e., the reshaped region) as the new crosswalk region R#. In this case, if the area of the new crosswalk region R# is 50% or less of the area of the crosswalk region R before reshaping, the image processing unit 118 will not adopt the new crosswalk region R# and will instead adopt the crosswalk region R before reshaping. Furthermore, even if the overlapping portion between the new crosswalk region R# and the crosswalk region R before reshaping is 50% or less of the area of the crosswalk region R before reshaping, the image processing unit 118 may still adopt the crosswalk region R before reshaping instead of the new crosswalk region R#.
このような一連の処理によって横断歩道の領域Rが整形され、本フローチャートの処理が終了する。通信制御部120は、ユーザの端末装置から送信された地図データのリクエストが通信部102によって受信されると、そのリクエストに対するレスポンスとして、整形後の横断歩道の領域R#(面積の条件を満たさない場合には整形前の横断歩道の領域R)がアノテーションとして付与された衛星画像を、通信部102を介してユーザの端末装置に送信してよい。 Through this series of processes, the area R of the pedestrian crossing is shaped, and the processing in this flowchart is completed. When the communication control unit 120 receives a request for map data transmitted from the user's terminal device via the communication unit 102, it may, as a response to that request, transmit a satellite image to the user's terminal device via the communication unit 102, with the shaped pedestrian crossing area R# (or the unshaped pedestrian crossing area R if the area conditions are not met) annotated.
図6は、アノテーションが付与された衛星画像の一例を表す図である。図中のANは、アノテーションを表しており、そのアノテーションは、衛星画像上の横断歩道に、整形後の横断歩道の領域R#を重畳表示している。このようなアノテーションANの表示によって、ユーザは、横断歩道などの対象物の位置や形状をよりリアルに認識することができ、ナビゲーションなどのサービスを違和感なく(不自然に感じることなく)利用することができる。 Figure 6 shows an example of annotated satellite imagery. In the figure, AN represents the annotation, which overlays the reshaped crosswalk area R# onto the crosswalk in the satellite image. This display of annotation AN allows users to more realistically perceive the location and shape of objects such as crosswalks, enabling them to use navigation and other services without feeling any discomfort or unnaturalness.
[機械学習モデルのトレーニング]
以下、上述した第1機械学習モデルMDL1と第2機械学習モデルMDL2の学習方法(トレーニング方法)について説明する。学習部122は、上述した第1トレーニングデータセットを用いて第1機械学習モデルMDL1を学習し、上述した第2トレーニングデータセットを用いて第2機械学習モデルMDL2を学習する。学習部122は、第2機械学習モデルMDL2を学習する際に、損失関数を以下のようにする。上述した「向き」は「角度」と同義で扱ってよい。第2機械学習モデルMDL2によってV1及びV2の角度として出力される数値は0~1の範囲であり、この数値範囲0~1は、角度範囲0度~180度に対応している。
[Training machine learning models]
The training methods for the first machine learning model MDL1 and the second machine learning model MDL2 described above are explained below. The learning unit 122 trains the first machine learning model MDL1 using the first training dataset described above, and trains the second machine learning model MDL2 using the second training dataset described above. When the learning unit 122 trains the second machine learning model MDL2, it sets the loss function as follows. The term "direction" mentioned above can be treated as synonymous with "angle". The numerical values output by the second machine learning model MDL2 as angles V1 and V2 are in the range of 0 to 1, and this numerical range of 0 to 1 corresponds to the angle range of 0 degrees to 180 degrees.
(i)第2機械学習モデルMDL2によって出力された角度(以下、推定角度という)と、第2トレーニングデータセットに含まれる正解の角度とが90度(0.5)以上異なっており、
(ii)推定角度と正解の角度の両方が、18度(0.1)未満、又は162度(0.9)以上のどちらかに該当していれば、
(iii)正解の角度を推定角度に近づけるように(0度又は180度に近づけるように)修正してからBCELoss(Binary Cross Entropy Loss)によって損失関数の最適化を行う。
(i) The angle output by the second machine learning model MDL2 (hereinafter referred to as the estimated angle) differs from the correct angle included in the second training dataset by 90 degrees (0.5) or more.
(ii) If both the estimated angle and the correct angle are less than 18 degrees (0.1) or 162 degrees (0.9) or greater,
(iii) The correct angle is corrected to be closer to the estimated angle (closer to 0 degrees or 180 degrees), and then the loss function is optimized using BCELoss (Binary Cross Entropy Loss).
クロップド画像IMG2を入力したことに応じて第2機械学習モデルMDL2によって出力される(推定される)V1及びV2の角度が、ほぼ0度又はほぼ180度となる場合、正解の角度と推定角度とが真逆の向きとなる場合がある。例えば、正解の角度が179.8度程度(第2機械学習モデルMDL2の出力値に換算すると0.999程度)となっている場合に、推定角度がほぼ0度(第2機械学習モデルMDL2の出力値に換算すると0.0001程度)になっていまう場合がある。 When the angles V1 and V2 output (estimated) by the second machine learning model MDL2 in response to the input cropped image IMG2 are approximately 0 degrees or approximately 180 degrees, the estimated angle and the correct angle may be in opposite directions. For example, if the correct angle is approximately 179.8 degrees (equivalent to approximately 0.999 in the output values of the second machine learning model MDL2), the estimated angle may be approximately 0 degrees (equivalent to approximately 0.0001 in the output values of the second machine learning model MDL2).
ほぼ180度とほぼ0度は実際にはほとんど同一の角度であるが、第2機械学習モデルMDL2の出力値である推定角度が、ほぼ0(例えば0.0001程度)か、ほぼ1(例えば0.999程度)と異なる値であっても、正解と見做した方がよい。 Although nearly 180 degrees and nearly 0 degrees are practically the same angle, it is best to consider the estimated angle, which is the output value of the second machine learning model MDL2, as correct even if it is a different value from nearly 0 (e.g., around 0.0001) or nearly 1 (e.g., around 0.999).
従って、上記の(i)~(iii)の例外条件を含む損失関数に基づいて第2機械学習モデルMDL2を学習する。これによって、第2機械学習モデルMDL2の学習効率やその精度を向上させることができる。 Therefore, the second machine learning model MDL2 is trained based on the loss function that includes the exception conditions (i) to (iii) above. This improves the training efficiency and accuracy of the second machine learning model MDL2.
以上説明した実施形態によれば、情報処理装置100は、衛星画像(衛星写真)、航空画像(航空写真)、空中画像(空中写真)といった上空から地表面が撮像された画像上において対象物(例えば横断歩道)の領域を検出するとともに、対象物の領域の向きを推定する。情報処理装置100は、推定された向きに基づいて対象物の領域を整形する。このように、対象物(例えば横断歩道)の領域を整形することでセグメンテーションの精度が向上する。この結果、横断歩道などの対象物を衛星画像などにアノテーションとして付与する際に、そのアノテーションを効果的に行うことができる。 According to the embodiments described above, the information processing device 100 detects the area of an object (e.g., a pedestrian crossing) on an image of the Earth's surface taken from above, such as satellite imagery, aerial imagery, or aerial photograph, and estimates the orientation of the object's area. The information processing device 100 then reshapes the object's area based on the estimated orientation. By reshaping the object's area in this way, the accuracy of segmentation is improved. As a result, when adding annotations to satellite imagery or other data containing objects such as pedestrian crossings, the annotation can be performed more effectively.
<ハードウェア構成>
上述した実施形態の情報処理装置100は、例えば、図7に示すようなハードウェア構成により実現される。図7は、実施形態の情報処理装置100のハードウェア構成の一例を示す図である。
<Hardware Configuration>
The information processing device 100 of the above-described embodiment can be realized by a hardware configuration such as that shown in Figure 7. Figure 7 is a diagram showing an example of the hardware configuration of the information processing device 100 of the embodiment.
情報処理装置100は、NIC100-1、CPU100-2、RAM100-3、ROM100-4、フラッシュメモリやHDDなどの二次記憶装置100-5、およびドライブ装置100-6が、内部バスあるいは専用通信線によって相互に接続された構成となっている。ドライブ装置100-6には、光ディスクなどの可搬型記憶媒体が装着される。二次記憶装置100-5、またはドライブ装置100-6に装着された可搬型記憶媒体に格納されたプログラムがDMAコントローラ(不図示)などによってRAM100-3に展開され、CPU100-2によって実行されることで処理部110が実現される。CPU100-2が参照するプログラムは、ネットワークNWを介して他の装置からダウンロードされてもよい。 The information processing device 100 consists of a NIC 100-1, a CPU 100-2, a RAM 100-3, a ROM 100-4, a secondary storage device 100-5 such as flash memory or an HDD, and a drive device 100-6, all interconnected via an internal bus or dedicated communication lines. A portable storage medium, such as an optical disc, is mounted in the drive device 100-6. A program stored in the secondary storage device 100-5 or the portable storage medium mounted in the drive device 100-6 is loaded into the RAM 100-3 by a DMA controller (not shown), and executed by the CPU 100-2 to realize the processing unit 110. The program referenced by the CPU 100-2 may be downloaded from another device via a network NW.
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。 Although embodiments for carrying out the present invention have been described above using examples, the present invention is not limited in any way to these embodiments, and various modifications and substitutions can be made without departing from the spirit of the invention.
100…情報処理装置、102…通信部、110…処理部、112…取得部、114…領域検出部、116…向き推定部、118…画像処理部、120…通信制御部、122…学習部 100...Information processing unit, 102...Communication unit, 110...Processing unit, 112...Acquisition unit, 114...Region detection unit, 116...Orientation estimation unit, 118...Image processing unit, 120...Communication control unit, 122...Learning unit
Claims (7)
前記領域の向きを推定する推定部と、
前記向きに基づいて、前記領域を整形する画像処理部と、
ユーザからのリクエストを受けて前記画像を表示する端末装置と通信する通信部と、
整形された前記対象物の領域がアノテーションとして付与された前記画像であるアノテーション画像を、前記通信部を介して前記端末装置に送信する通信制御部と、を備え、
前記アノテーション画像は、前記リクエストに対するレスポンスとして前記端末装置に表示される、
情報処理装置。 A detection unit that detects the area of an object on an image of the ground surface taken from above,
An estimation unit for estimating the orientation of the said region,
An image processing unit that shapes the region based on the orientation,
A communication unit that communicates with a terminal device that displays the aforementioned image upon receiving a request from a user,
The system includes a communication control unit that transmits an annotation image, which is the image to which the shaped region of the object has been annotated, to the terminal device via the communication unit,
The annotation image is displayed on the terminal device as a response to the request.
Information processing device.
前記検出部は、前記画像上において前記横断歩道の領域を検出し、
前記推定部は、歩行者が前記横断歩道を横断する方向である第1方向と、前記横断歩道として道路上に描かれた白線の長手方向である第2方向とを推定し、
前記画像処理部は、前記第1方向及び前記第2方向に基づいて、前記横断歩道の領域を整形する、
請求項1に記載の情報処理装置。 The aforementioned object is a pedestrian crossing,
The detection unit detects the area of the pedestrian crossing on the image,
The estimation unit estimates a first direction, which is the direction in which a pedestrian crosses the crosswalk, and a second direction, which is the longitudinal direction of the white line drawn on the road as the crosswalk.
The image processing unit shapes the area of the pedestrian crossing based on the first direction and the second direction.
The information processing apparatus according to claim 1.
前記画像処理部は、前記4辺のうち第1の対辺の組みが前記第1方向と平行になり、かつ前記4辺のうち第2の対辺の組みが前記第2方向と平行になるように前記四角形状の領域を整形する、
請求項2に記載の情報処理装置。 The area of the aforementioned pedestrian crossing is a quadrilateral area consisting of four sides.
The image processing unit reshapes the quadrilateral region such that the first pair of opposite sides of the four sides is parallel to the first direction, and the second pair of opposite sides of the four sides is parallel to the second direction.
The information processing apparatus according to claim 2.
前記第1機械学習モデルは、あるトレーニング対象画像に対して、前記トレーニング対象画像上において検出されるべき正解の前記対象物の領域が対応付けられた第1トレーニングデータセットに基づいて学習された機械学習モデルである、
請求項1又は2に記載の情報処理装置。 The detection unit uses a first machine learning model to detect the region of the object on the image.
The first machine learning model is a machine learning model that has been trained on a first training dataset in which a training target image is associated with the region of the correct object to be detected on the training target image.
The information processing apparatus according to claim 1 or 2.
前記第2機械学習モデルは、あるトレーニング対象画像から前記対象物の領域が切り出された画像であるトレーニング対象のクロップド画像に対して、前記トレーニング対象のクロップド画像上において推定されるべき正解の前記対象物の領域の向きが対応付けられた第2トレーニングデータセットに基づいて学習された機械学習モデルである、
請求項1又は2に記載の情報処理装置。 The estimation unit uses a second machine learning model to estimate the orientation of the detected region on a cropped image, which is an image extracted from the image.
The second machine learning model is a machine learning model trained on a second training dataset in which the orientation of the object region to be estimated on the cropped image of the training target is associated with the cropped image of the training target, which is an image obtained by cutting out the region of the object from a training target image.
The information processing apparatus according to claim 1 or 2.
上空から地表面が撮像された画像上において対象物の領域を検出すること、
前記領域の向きを推定すること、
前記向きに基づいて、前記領域を整形すること、
ユーザからのリクエストを受けて前記画像を表示する端末装置と通信すること、
整形された前記対象物の領域がアノテーションとして付与された前記画像であるアノテーション画像を、通信部を介して前記端末装置に送信すること、を含み、
前記アノテーション画像は、前記リクエストに対するレスポンスとして前記端末装置に表示される、
情報処理方法。 A computer-based information processing method,
Detecting the area of an object on an image of the ground surface taken from above,
To estimate the orientation of the said region,
To shape the region based on the orientation,
To communicate with a terminal device that displays the aforementioned image upon receiving a request from a user,
This includes transmitting an annotated image, which is the image to which the shaped region of the object has been annotated, to the terminal device via a communication unit .
The annotation image is displayed on the terminal device as a response to the request.
Information processing methods.
上空から地表面が撮像された画像上において対象物の領域を検出すること、
前記領域の向きを推定すること、
前記向きに基づいて、前記領域を整形すること、
ユーザからのリクエストを受けて前記画像を表示する端末装置と通信すること、
整形された前記対象物の領域がアノテーションとして付与された前記画像であるアノテーション画像を、通信部を介して前記端末装置に送信すること、を含み、
前記アノテーション画像は、前記リクエストに対するレスポンスとして前記端末装置に表示される、
プログラム。 A program to be executed by a computer,
Detecting the area of an object on an image of the ground surface taken from above,
To estimate the orientation of the said region,
To shape the region based on the orientation,
To communicate with a terminal device that displays the aforementioned image upon receiving a request from a user,
This includes transmitting an annotated image, which is the image to which the shaped region of the object has been annotated, to the terminal device via a communication unit .
The annotation image is displayed on the terminal device as a response to the request.
program.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2023043112A JP7832141B2 (en) | 2023-03-17 | 2023-03-17 | Information processing device, information processing method, and program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2023043112A JP7832141B2 (en) | 2023-03-17 | 2023-03-17 | Information processing device, information processing method, and program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2024132374A JP2024132374A (en) | 2024-10-01 |
| JP7832141B2 true JP7832141B2 (en) | 2026-03-17 |
Family
ID=92909278
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2023043112A Active JP7832141B2 (en) | 2023-03-17 | 2023-03-17 | Information processing device, information processing method, and program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7832141B2 (en) |
Citations (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2011070473A (en) | 2009-09-28 | 2011-04-07 | Daihatsu Motor Co Ltd | Obstacle detection device |
| JP2013115559A (en) | 2011-11-28 | 2013-06-10 | Mitsubishi Electric Corp | Bird's -eye video generation apparatus, bird's-eye video generation method, video display system and navigation device |
| JP2013129278A (en) | 2011-12-21 | 2013-07-04 | Alpine Electronics Inc | Image display device, calibration method of imaging camera in image display device, and calibration program |
| WO2019235433A1 (en) | 2018-06-04 | 2019-12-12 | 日本電信電話株式会社 | Crosswalk detection device, method and program |
| CN112446231A (en) | 2019-08-27 | 2021-03-05 | 丰图科技(深圳)有限公司 | Pedestrian crossing detection method and device, computer equipment and storage medium |
| CN112528917A (en) | 2020-12-18 | 2021-03-19 | 深兰科技(上海)有限公司 | Zebra crossing region identification method and device, electronic equipment and storage medium |
| CN113449669A (en) | 2021-07-08 | 2021-09-28 | 河海大学 | Application of computer vision in traffic field |
| JP2022050107A (en) | 2020-09-17 | 2022-03-30 | 株式会社東芝 | Position management system, position specification device, and method for position specification |
| CN114937088A (en) | 2022-04-12 | 2022-08-23 | 浙江大华技术股份有限公司 | Camera equipment calibration method, training method, image processing method and device |
-
2023
- 2023-03-17 JP JP2023043112A patent/JP7832141B2/en active Active
Patent Citations (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2011070473A (en) | 2009-09-28 | 2011-04-07 | Daihatsu Motor Co Ltd | Obstacle detection device |
| JP2013115559A (en) | 2011-11-28 | 2013-06-10 | Mitsubishi Electric Corp | Bird's -eye video generation apparatus, bird's-eye video generation method, video display system and navigation device |
| JP2013129278A (en) | 2011-12-21 | 2013-07-04 | Alpine Electronics Inc | Image display device, calibration method of imaging camera in image display device, and calibration program |
| WO2019235433A1 (en) | 2018-06-04 | 2019-12-12 | 日本電信電話株式会社 | Crosswalk detection device, method and program |
| CN112446231A (en) | 2019-08-27 | 2021-03-05 | 丰图科技(深圳)有限公司 | Pedestrian crossing detection method and device, computer equipment and storage medium |
| JP2022050107A (en) | 2020-09-17 | 2022-03-30 | 株式会社東芝 | Position management system, position specification device, and method for position specification |
| CN112528917A (en) | 2020-12-18 | 2021-03-19 | 深兰科技(上海)有限公司 | Zebra crossing region identification method and device, electronic equipment and storage medium |
| CN113449669A (en) | 2021-07-08 | 2021-09-28 | 河海大学 | Application of computer vision in traffic field |
| CN114937088A (en) | 2022-04-12 | 2022-08-23 | 浙江大华技术股份有限公司 | Camera equipment calibration method, training method, image processing method and device |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2024132374A (en) | 2024-10-01 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US10678257B2 (en) | Generating occlusion-aware bird eye view representations of complex road scenes | |
| EP4152204B1 (en) | Lane line detection method, and related apparatus | |
| US11030525B2 (en) | Systems and methods for deep localization and segmentation with a 3D semantic map | |
| US11348263B2 (en) | Training method for detecting vanishing point and method and apparatus for detecting vanishing point | |
| WO2023123837A1 (en) | Map generation method and apparatus, electronic device, and storage medium | |
| CN115147328A (en) | Three-dimensional target detection method and device | |
| WO2021136528A1 (en) | Instance segmentation method and apparatus | |
| US12499673B2 (en) | Large scene neural view synthesis | |
| CN114419564B (en) | Vehicle pose detection method, device, equipment, medium and automatic driving vehicle | |
| CN112990009B (en) | End-to-end lane line detection method, device, equipment and storage medium | |
| EP2583217A1 (en) | Method for obtaining drivable road area | |
| CN114519819A (en) | Remote sensing image target detection method based on global context awareness | |
| US20200252550A1 (en) | Method for correcting misalignment of camera by selectively using information generated by itself and information generated by other entities and device using the same | |
| TW201922004A (en) | Positioning a terminal device based on deep learning | |
| CN110930384A (en) | Crowd counting method, device, device and medium based on density information | |
| CN116704203A (en) | Target detection method, device, electronic device, computer-readable storage medium | |
| CN107563299A (en) | A kind of pedestrian detection method using ReCNN integrating context informations | |
| CN110705366A (en) | Real-time human head detection method based on stair scene | |
| JP7832141B2 (en) | Information processing device, information processing method, and program | |
| CN112765302A (en) | Method and device for processing position information and computer readable medium | |
| CN108268138A (en) | Processing method, device and the electronic equipment of augmented reality | |
| JP2022055164A (en) | Space evaluation support apparatus, space evaluation support system, and space evaluation support program | |
| CN116503460A (en) | Depth map acquisition method, device, electronic equipment and storage medium | |
| CN118314055A (en) | Point cloud processing method, device, medium and electronic equipment | |
| CN113628349B (en) | AR navigation method, device and readable storage medium based on scene content adaptation |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20231026 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20250820 |
|
| A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20250820 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250909 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20251110 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20251202 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20260127 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20260203 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20260305 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7832141 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |