Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7797003B2 - Class inference system, tree species map generation system, class inference method, and tree species map generation method - Google Patents
[go: Go Back, main page]

JP7797003B2 - Class inference system, tree species map generation system, class inference method, and tree species map generation method - Google Patents

Class inference system, tree species map generation system, class inference method, and tree species map generation method

Info

Publication number
JP7797003B2
JP7797003B2 JP2022040304A JP2022040304A JP7797003B2 JP 7797003 B2 JP7797003 B2 JP 7797003B2 JP 2022040304 A JP2022040304 A JP 2022040304A JP 2022040304 A JP2022040304 A JP 2022040304A JP 7797003 B2 JP7797003 B2 JP 7797003B2
Authority
JP
Japan
Prior art keywords
tree
inference
feature vector
image
classes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022040304A
Other languages
Japanese (ja)
Other versions
JP2023135210A (en
Inventor
信徳 大西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyoto University NUC
Original Assignee
Kyoto University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyoto University NUC filed Critical Kyoto University NUC
Priority to JP2022040304A priority Critical patent/JP7797003B2/en
Publication of JP2023135210A publication Critical patent/JP2023135210A/en
Application granted granted Critical
Publication of JP7797003B2 publication Critical patent/JP7797003B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Description

本発明は、森林の樹木などの物体を分類する技術に関する。 The present invention relates to technology for classifying objects such as trees in a forest.

非特許文献1に記載されるように、従来、ハイパースペクトルカメラ、マルチスペクトルカメラ、またはLiDAR(Light Detection and Ranging)センサなどの特殊なハードウェアで森林の情報を取得し、森林に生えている樹木の種類を、取得した情報に基づいて特定する方法が提案されている。 As described in Non-Patent Document 1, methods have been proposed in the past to acquire forest information using specialized hardware such as hyperspectral cameras, multispectral cameras, or LiDAR (Light Detection and Ranging) sensors, and to identify the types of trees growing in the forest based on the acquired information.

しかし、これらのハードウェアは高価なので、この方法によるとコストが嵩んでしまう。そこで、AI(Artificial Intelligence)によって樹木の種類を推論する方法が提案されている。 However, this hardware is expensive, so this method increases costs. Therefore, a method has been proposed that uses AI (Artificial Intelligence) to infer tree species.

例えば、特許文献1に記載される方法によると、上空からのテスト領域の写真またはテスト領域の各地点の高さの分布である第一の分布と各地点の勾配の分布である第二の分布とに基づいて、テスト領域に存在する複数の物体それぞれの輪郭を特定する。特定された輪郭ごとに、所定の複数の種類のうちの輪郭に存在する物体の種類に対応するラベルを付与し、輪郭ごとに、写真の中の各輪郭に囲まれた部分の部分画像および各輪郭に付与されたラベルを示す学習データを生成する。学習データそれぞれに示される部分画像およびラベルをそれぞれ入力および正解として用いて学習済モデルを生成する。そして、生成した学習済モデルに基づいて、推論対象の樹木の種類を推論する。 For example, according to the method described in Patent Document 1, the contours of each of multiple objects present in a test area are identified based on a photograph of the test area taken from above or a first distribution that is the distribution of heights at each point in the test area and a second distribution that is the distribution of gradients at each point. For each identified contour, a label corresponding to the type of object present in the contour from among multiple predetermined types is assigned, and training data is generated for each contour, showing partial images of the part of the photograph surrounded by each contour and the labels assigned to each contour. A trained model is generated using the partial images and labels shown in each training data as input and correct answer, respectively. The type of tree to be inferred is then inferred based on the generated trained model.

特開2020-91640号公報Japanese Patent Application Laid-Open No. 2020-91640

"Review of studies on tree species classification from remotely sensed data." Remote Sensing of Environment Sensing of Environment Sensing of Environment Sensing of Environment Sensing of Environment Sensing of Environment , 186 , 64 -87.,Fassnacht, F. E., Latifi, H., Sterenczak, K., Modzelewska, A., Lefsky, M., Waser, L. T., ... & Ghosh, A. 2016年著"Review of studies on tree species classification from remotely sensed data." Remote Sensing of Environment Sensing of Environment Sensing of Environment Sensing of Environment Sensing of Environment , 186 , 64 -87., Fassnacht, F. E., Latifi, H., Sterenczak, K., Modzelewska, A., Lefsky, M., Waser, L. T., ... & Ghosh, A. 2016

しかし、特許文献1に記載されるような、AIによる従来の方法によると、学習していないクラス(種類)を識別することができない。したがって、ある植生の下で取得した学習データに基づいて生成された既存の学習済モデルを、植生の異なる地域で使用することができない。 However, conventional AI methods such as those described in Patent Document 1 are unable to distinguish between classes (types) that have not been trained. Therefore, an existing trained model generated based on training data acquired under a certain type of vegetation cannot be used in areas with different vegetation.

そこで、その地域の植生に応じて新たに学習済モデルを生成することが考えられるが、そのためには、膨大な学習データを新たに取得しなければならない。さらに、機械学習の演算のために高性能なコンピュータが必要である。 One possible solution would be to generate a new trained model based on the vegetation of the area, but this would require acquiring a huge amount of new training data. Furthermore, a high-performance computer would be required for the machine learning calculations.

本発明は、このような問題点に鑑み、樹木などのクラスを推論するAIを従来よりも容易に構築することを、目的とする。 In light of these problems, the present invention aims to make it easier than ever to build AI that can infer classes such as trees.

本発明の一形態に係るクラス推論システムは、特定の地域に生育する、複数のクラスそれぞれに属する樹木の樹冠の画像の特徴を表わす第一の特徴ベクトルを、当該画像を学習済モデルに入力することによって取得する第一の取得手段と、前記特定の地域に生育する、推論の対象である推論対象樹木の樹冠の画像の特徴を表わす第二の特徴ベクトルを、当該画像を前記学習済モデルに入力することによって取得する第二の取得手段と、前記複数のクラスのうちの前記推論対象樹木が属するクラスを、前記複数のクラスそれぞれの前記第一の特徴ベクトルおよび当該推論対象樹木の前記第二の特徴ベクトルに基づいて推論する推論手段と、を有し、前記学習済モデルは、複数の樹木それぞれのクラスおよび樹冠の画像をそれぞれ目的変数および説明変数としてディープラーニングによって生成されたCNN(Convolutional Neural Network)のうちの、入力画像の特徴ベクトルを畳込み処理によって算出する部分のネットワークである。
本発明の一形態に係る樹種マップ生成システムは、複数のクラスそれぞれに属する樹木が生育しかつ複数の地域を有する領域の樹種マップを生成する樹種マップ生成システムであって、前記複数の地域それぞれについて、当該地域に生育する、前記複数のクラスそれぞれに属する樹木の樹冠の画像の特徴を表わす第一の特徴ベクトルを、当該画像を学習済モデルに入力することによって取得する第一の取得手段と、前記領域に生育する複数の推論対象樹木それぞれの樹冠の画像の特徴を表わす第二の特徴ベクトルを、当該画像を前記学習済モデルに入力することによって取得する第二の取得手段と、前記複数の推論対象樹木それぞれが属するクラスを、前記複数の地域のうちの当該推論対象樹木が生育する地域における前記複数のクラスそれぞれの前記第一の特徴ベクトルおよび当該推論対象樹木の前記第二の特徴ベクトルに基づいて推論する推論手段と、前記複数の推論対象樹木それぞれの位置情報および前記推論手段による推論結果に基づいて前記樹種マップを生成するマップ生成手段と、を有する。

A class inference system according to one embodiment of the present invention comprises a first acquisition means for acquiring a first feature vector representing the features of an image of the crown of a tree belonging to each of a plurality of classes that grows in a specific region by inputting the image into a trained model; a second acquisition means for acquiring a second feature vector representing the features of an image of the crown of an inference target tree that grows in the specific region and is the subject of inference by inputting the image into the trained model; and an inference means for inferring the class to which the inference target tree belongs among the plurality of classes based on the first feature vector of each of the plurality of classes and the second feature vector of the inference target tree, wherein the trained model is a network that calculates the feature vector of the input image by convolution processing within a convolutional neural network (CNN) generated by deep learning using the class and the image of the crown of each of a plurality of trees as the objective variable and the explanatory variable, respectively.
A tree species map generation system according to one embodiment of the present invention is a tree species map generation system that generates a tree species map of an area having multiple regions and in which trees belonging to each of multiple classes grow, and includes a first acquisition means that acquires, for each of the multiple regions, a first feature vector representing the characteristics of an image of the crown of a tree belonging to each of the multiple classes that grows in the area by inputting the image into a trained model; a second acquisition means that acquires a second feature vector representing the characteristics of an image of the crown of each of multiple inference target trees that grow in the area by inputting the image into the trained model; an inference means that infers the class to which each of the multiple inference target trees belongs based on the first feature vector of each of the multiple classes in the area in which the inference target tree grows among the multiple regions and the second feature vector of the inference target tree; and a map generation means that generates the tree species map based on location information of each of the multiple inference target trees and the inference results by the inference means.

本発明によると、樹木などのクラスを推論するAIを従来よりも容易に構築することができる。 This invention makes it easier than ever to build AI that can infer classes such as trees.

樹木分類システムの全体的な構成の例を示す図である。FIG. 1 is a diagram illustrating an example of the overall configuration of a tree classification system. コンピュータのハードウェア構成の例を示す図である。FIG. 1 illustrates an example of a hardware configuration of a computer. コンピュータの機能的構成の例を示す図である。FIG. 2 is a diagram illustrating an example of a functional configuration of a computer. 樹木分類ネットワークの例を示す図である。FIG. 1 illustrates an example of a tree classification network. 上空写真およびキャノピマップそれぞれの例を示す図である。1A and 1B are diagrams showing examples of an aerial photograph and a canopy map, respectively. 物体データの例を示す図である。FIG. 10 is a diagram illustrating an example of object data. 推論の方法の例を示す図である。FIG. 10 is a diagram illustrating an example of an inference method. 2640次元空間における特徴点の分布の例を示す図である。FIG. 10 is a diagram illustrating an example of the distribution of feature points in a 2640-dimensional space. 樹木分類マップの例を示す図である。FIG. 10 is a diagram illustrating an example of a tree classification map. 樹木分類プログラムによる全体的な処理の流れの例を説明するフローチャートである。10 is a flowchart illustrating an example of the overall processing flow of a tree classification program. 正誤結果の例を示す図である。FIG. 10 is a diagram showing an example of a correct/incorrect result. 特徴抽出ネットワークの汎用化および全国の樹木マップの作成の方法の例を示す図である。FIG. 1 shows an example of a method for generalizing a feature extraction network and creating a national tree map.

〔全体の構成〕
図1は、樹木分類システム3の全体的な構成の例を示す図である。図2は、コンピュータ1のハードウェア構成の例を示す図である。図3は、コンピュータ1の機能的構成の例を示す図である。
[Overall structure]
Fig. 1 is a diagram showing an example of the overall configuration of a tree classification system 3. Fig. 2 is a diagram showing an example of the hardware configuration of a computer 1. Fig. 3 is a diagram showing an example of the functional configuration of the computer 1.

図1に示すように、樹木分類システム3は、コンピュータ1およびドローン2などによって構成される。樹木分類システム3は、上空からの写真に写っている樹木をAI(Artificial Intelligence)によって分類するサービスを提供する。 As shown in Figure 1, the tree classification system 3 is composed of a computer 1, a drone 2, and other components. The tree classification system 3 provides a service that uses AI (artificial intelligence) to classify trees that appear in aerial photographs.

ドローン2は、デジタルカメラが搭載されたUAV(Unmanned Aerial Vehicle)であって、森林を上空から撮影することによって学習データの基となるカラー写真を取得するために用いられる。ドローン2は、市販のものでよく、例えば、DJI社のPHANTOM 4が用いられる。 Drone 2 is a UAV (Unmanned Aerial Vehicle) equipped with a digital camera, and is used to photograph the forest from above to obtain color photographs that will serve as the basis for learning data. Drone 2 can be a commercially available model; for example, a DJI PHANTOM 4 is used.

コンピュータ1は、図2に示すように、プロセッサ10、RAM(Random Access Memory)11、ROM(Read Only Memory)12、補助記憶装置13、ネットワークアダプタ14、キーボード15、ポインティングデバイス16、入出力ボード17、タッチパネルディスプレイ18、および音声出力ユニット19などによって構成される。 As shown in FIG. 2, the computer 1 is composed of a processor 10, RAM (Random Access Memory) 11, ROM (Read Only Memory) 12, auxiliary storage device 13, network adapter 14, keyboard 15, pointing device 16, input/output board 17, touch panel display 18, and audio output unit 19.

ROM12または補助記憶装置13には、オペレーティングシステムのほか種々のプログラムがインストールされている。特に、本実施形態では、樹木分類プログラム4(図3参照)がインストールされている。補助記憶装置13として、SSD(Solid State Drive)またはハードディスクなどが用いられる。 In addition to the operating system, various other programs are installed in the ROM 12 or auxiliary storage device 13. In particular, in this embodiment, the tree classification program 4 (see Figure 3) is installed. The auxiliary storage device 13 may be an SSD (Solid State Drive) or a hard disk.

RAM11は、コンピュータ1のメインメモリである。RAM11には、オペレーティングシステムのほか樹木分類プログラム4などのプログラムがロードされる。 RAM 11 is the main memory of computer 1. In addition to the operating system, programs such as tree classification program 4 are loaded into RAM 11.

プロセッサ10は、RAM11にロードされたプログラムを実行する。プロセッサ10として、GPU(Graphics Processing Unit)またはCPU(Central Processing Unit)などが用いられる。 The processor 10 executes programs loaded into the RAM 11. The processor 10 may be a GPU (Graphics Processing Unit) or a CPU (Central Processing Unit).

ネットワークアダプタ14は、TCP/IP(Transmission Control Protocol/Internet Protocol)などのプロトコルでドローン2など他の装置と通信するための装置である。 The network adapter 14 is a device for communicating with other devices such as the drone 2 using protocols such as TCP/IP (Transmission Control Protocol/Internet Protocol).

キーボード15およびポインティングデバイス16は、コマンドまたはデータなどをオペレータが入力するための入力装置である。 The keyboard 15 and pointing device 16 are input devices that allow the operator to input commands, data, etc.

入出力ボード17は、ドローン2と有線または無線を介して通信する。入出力ボード17として、例えば、USB(Universal Serial Bus)またはBluetoothに準拠した入出力ボードが用いられる。 The input/output board 17 communicates with the drone 2 via wired or wireless communication. For example, an input/output board compliant with USB (Universal Serial Bus) or Bluetooth is used as the input/output board 17.

タッチパネルディスプレイ18は、コマンドもしくはデータを入力するための画面またはプロセッサ10によって生成されたマップなどを表示する。 The touch panel display 18 displays a screen for inputting commands or data, or a map generated by the processor 10.

音声出力ユニット19は、音声ボードおよびスピーカなどによって構成され、警告音などの音声を出力する。 The audio output unit 19 is composed of an audio board and speaker, and outputs sounds such as warning sounds.

樹木分類プログラム4は、図3に示すキャノピマップ生成部41、ラベル付与部42、特徴ベクトル算出部43、教師データ記憶部44、キャノピ検出部45、特徴量算出部46、クラス推論部47、樹木分類マップ生成部48、および樹木分類マップ出力部49などを実現するためのコンピュータプログラムである。樹木分類プログラム4によると、樹木のクラス(種類)を推論するための分類器を生成し、この分類器に基づいて対象の樹木のクラスを推論することができる。 The tree classification program 4 is a computer program for realizing the canopy map generation unit 41, label assignment unit 42, feature vector calculation unit 43, training data storage unit 44, canopy detection unit 45, feature calculation unit 46, class inference unit 47, tree classification map generation unit 48, and tree classification map output unit 49 shown in Figure 3. The tree classification program 4 can generate a classifier for inferring the class (type) of a tree, and infer the class of a target tree based on this classifier.

以下、ある地域(サイト)の森林80の樹木を分類するために樹木分類システム3をチューニングして使用する場合を例に、ドローン2および図3に示す各部の処理を、学習のフェーズおよび推論のフェーズに大別して説明する。 Below, we will explain the processing of the drone 2 and each part shown in Figure 3, broadly dividing it into a learning phase and an inference phase, using an example in which the tree classification system 3 is tuned and used to classify trees in a forest 80 in a certain region (site).

〔学習のフェーズ〕
(1)ネットワークおよびデータ
図4は、樹木分類ネットワーク5の例を示す図である。図5は、上空写真60およびキャノピマップ61それぞれの例を示す図である。図6は、物体データ62の例を示す図である。
[Learning Phase]
(1) Network and Data Fig. 4 is a diagram showing an example of a tree classification network 5. Fig. 5 is a diagram showing examples of an aerial photograph 60 and a canopy map 61. Fig. 6 is a diagram showing examples of object data 62.

コンピュータ1には、予め、特徴抽出ネットワーク51が用意されている。特徴抽出ネットワーク51は、図4に示す樹木分類ネットワーク5の一部分である。 A feature extraction network 51 is prepared in advance in the computer 1. The feature extraction network 51 is part of the tree classification network 5 shown in Figure 4.

樹木分類ネットワーク5は、分類する対象の樹木がN個のクラスのうちのいずれに属するのかをその樹木のキャノピ(樹冠)の画像に基づいて推論するCNN(Convolutional Neural Network)であって、主に特徴抽出ネットワーク51および確率算出ネットワーク52によって構成される。 The tree classification network 5 is a convolutional neural network (CNN) that infers which of N classes a target tree belongs to based on an image of the tree's canopy, and is primarily composed of a feature extraction network 51 and a probability calculation network 52.

特徴抽出ネットワーク51は、入力層、畳込み層、プーリング層、および出力層を有するネットワークであって、入力された画像の特徴を表わす特徴ベクトルFを算出する。畳込み層およびプーリング層が交互に連なっていてもよい。本実施形態では、224×224ピクセルのRGBのカラー画像が入力層に入力され、各層の演算によって、2560次元のベクトルが特徴ベクトルとして出力層から出力される。 The feature extraction network 51 is a network having an input layer, a convolutional layer, a pooling layer, and an output layer, and calculates a feature vector F representing the features of the input image. The convolutional layers and pooling layers may be arranged alternately. In this embodiment, a 224 x 224 pixel RGB color image is input to the input layer, and through calculations in each layer, a 2560-dimensional vector is output from the output layer as a feature vector.

確率算出ネットワーク52は、入力層、1つまたは複数の全結合層、および出力層によって構成される。出力層の活性化関数としてsoftmaxが用いられる。特徴ベクトルFが入力層に入力されると、各層の演算によって、対象の樹木が1番目、2番目、…、N番目それぞれのクラスに属する確率p、p、…pが出力層から出力される。 The probability calculation network 52 is composed of an input layer, one or more fully connected layers, and an output layer. Softmax is used as the activation function for the output layer. When a feature vector F is input to the input layer, the output layer outputs the probabilities p1 , p2 , ..., pN that the target tree belongs to the first, second, ..., Nth class, respectively, through calculations in each layer.

樹木分類ネットワーク5は、森林80以外の森林の樹木のキャノピの画像に基づいて学習された既存のネットワーク(学習済モデル)で構わない。例えば、特開2020-91640号公報に記載される方法またはwatershed segmentation法によって作成されたものでよい。特開2020-91640号公報に記載される方法によると、コンピュータ1は、上空写真(空中写真)60を用いてオルソ写真を生成し、オルソ写真に基づいてDSM(Digital Surface Model)を生成し、DSMに基づいてスロープモデルを生成する。そして、オルソ写真の赤、緑、および青それぞれの階調の写真、DSMモデル、ならびにスロープモデルに基づいて、キャノピマップ61を生成する。 The tree classification network 5 may be an existing network (trained model) trained based on images of the tree canopy of forests other than forest 80. For example, it may be created using the method described in JP 2020-91640 A or the watershed segmentation method. According to the method described in JP 2020-91640 A, the computer 1 generates an orthophotograph using an aerial photograph 60, generates a DSM (Digital Surface Model) based on the orthophotograph, and generates a slope model based on the DSM. The canopy map 61 is then generated based on the red, green, and blue gradations of the orthophotograph, the DSM model, and the slope model.

樹木分類ネットワーク5が学習した森林の植生が森林80の植生と異なっていても構わない。つまり、植生を問わず森林80以外の森林のために生成されたCNNの特徴抽出ネットワークを、コンピュータ1において特徴抽出ネットワーク51として使用することができる。 It does not matter if the vegetation of the forest learned by the tree classification network 5 is different from the vegetation of forest 80. In other words, a CNN feature extraction network generated for a forest other than forest 80, regardless of the vegetation, can be used as feature extraction network 51 in computer 1.

オペレータは、森林80の上空にドローン2を飛ばして所定の高度から森林80の一部分または全体を撮影することによって図5(A)のような上空写真60を取得する。そして、上空写真60をコンピュータ1に入力する。なお、上空写真60は、RGBのカラー写真である。 The operator flies the drone 2 over the forest 80 and photographs part of or the entire forest 80 from a predetermined altitude, thereby obtaining an aerial photograph 60 such as that shown in Figure 5(A). The aerial photograph 60 is then input into the computer 1. Note that the aerial photograph 60 is an RGB color photograph.

すると、コンピュータ1のキャノピマップ生成部41(図3参照)は、上空写真60に写っているキャノピなどの物体の位置および形状を検出し、図5(B)のようなキャノピマップ61を生成する。キャノピマップ61には、物体それぞれの位置および形状がポリゴン61Aとして表われている。キャノピマップ61は、公知の方法によって作成することができる。例えば、特開2020-91640号公報に記載される方法によって作成することができる。 The canopy map generator 41 (see Figure 3) of the computer 1 then detects the position and shape of objects such as canopies that appear in the aerial photograph 60, and generates a canopy map 61 as shown in Figure 5(B). The canopy map 61 shows the position and shape of each object as polygons 61A. The canopy map 61 can be created using known methods. For example, it can be created using the method described in JP 2020-91640 A.

ラベル付与部42は、上空写真60に写っている一部の物体の画像に対して、その物体のクラスに対応するラベルを次のように付与する。 The labeling unit 42 assigns labels corresponding to the object classes to images of some of the objects captured in the aerial photograph 60 as follows:

ラベル付与部42は、キャノピマップ61をタッチパネルディスプレイ18によって表示する。キャノピマップ61の代わりに、ポリゴン61Aそれぞれの輪郭を上空写真60の上に重ねて表示させてもよい。 The labeling unit 42 displays the canopy map 61 on the touch panel display 18. Instead of the canopy map 61, the outlines of each polygon 61A may be displayed superimposed on the aerial photograph 60.

ここで、オペレータは、森林80に生育する樹木のクラスごとに、キャノピを表わすポリゴン61Aを1個ないし数個ずつ選択(サンプリング)する。例えば、森林80に生育する樹木のクラスがメタセコイア、ストローブマツ、およびヒノキの3種類である場合は、メタセコイアを表わすポリゴン61A、ストローブマツを表わすポリゴン61A、およびヒノキを表わすポリゴン61Aをそれぞれ1個ないし数個ずつ選択する。さらに、オペレータは、樹木でない物体(例えば、地面)を表わすポリゴン61Aを1個ないし数個、選択する。なお、ポリゴン61Aを同数ずつ選択するのが望ましい。つまり、例えば、メタセコイア、ストローブマツ、ヒノキ、および地面それぞれのポリゴン61Aを3つずつ選択するのが望ましい。 Here, the operator selects (samples) one to several polygons 61A representing the canopy for each class of trees growing in forest 80. For example, if the classes of trees growing in forest 80 are metasequoia, white pine, and cypress, the operator selects one to several polygons 61A representing metasequoia, white pine, and cypress. Furthermore, the operator selects one to several polygons 61A representing non-tree objects (for example, the ground). It is desirable to select the same number of polygons 61A for each. That is, for example, it is desirable to select three polygons 61A each for metasequoia, white pine, cypress, and the ground.

すると、ラベル付与部42は、選択された各ポリゴン61Aに対応する物体の画像を物体画像62Gとして上空写真60から抽出し、その物体を識別するラベルをラベル62Lとして物体画像62Gへ付与する。例えば、選択されたポリゴン61Aがメタセコイアのものであれば、そのポリゴン61Aに対応する物体の画像を物体画像62Gとして上空写真60から抽出し、メタセコイアのラベルをラベル62Lとして物体画像62Gへ付与する。そして、物体画像62Gとラベル62Lとを示す物体データ62を生成する。 The labeling unit 42 then extracts an image of the object corresponding to each selected polygon 61A from the aerial photograph 60 as object image 62G, and assigns a label identifying the object to the object image 62G as label 62L. For example, if the selected polygon 61A is a metasequoia, the labeling unit 42 extracts an image of the object corresponding to the polygon 61A from the aerial photograph 60 as object image 62G, and assigns the metasequoia label to the object image 62G as label 62L. Then, it generates object data 62 indicating the object image 62G and label 62L.

オペレータの操作およびラベル付与部42の処理によって、図6のような、クラスごとのサンプルの物体データ64が生成される。 Through the operator's operations and the processing of the labeling unit 42, sample object data 64 for each class is generated, as shown in Figure 6.

なお、図6の例では、ラベル62Lの値が「クラス_1」、「クラス_2」、…であるが、「アカガシ」、「アカマツ」、「その他」などの種類名であってもよい。この場合は、ポリゴン61Aを選択する際にオペレータが各種類名を入力すればよい。 In the example of Figure 6, the values of label 62L are "Class_1", "Class_2", etc., but they may also be type names such as "Red Oak", "Red Pine", "Other". In this case, the operator simply inputs each type name when selecting polygon 61A.

(2)学習
図7は、推論の方法の例を示す図である。図8は、2640次元空間における特徴点の分布の例を示す図である。図9は、樹木分類マップ67の例を示す図である。
(2) Learning Fig. 7 is a diagram showing an example of an inference method. Fig. 8 is a diagram showing an example of the distribution of feature points in a 2640-dimensional space. Fig. 9 is a diagram showing an example of a tree classification map 67.

特徴ベクトル算出部43(図3参照)は、物体データ62が生成されると、図7に示すように、物体データ62それぞれの物体画像62Gの特徴ベクトルFを、特徴抽出ネットワーク51に物体画像62Gを入力することによって算出する。なお、物体画像62Gは、特徴抽出ネットワーク51の入力層のサイズに合わせて適宜、縮小されて入力される。 When object data 62 is generated, the feature vector calculation unit 43 (see Figure 3) calculates the feature vector F of each object image 62G of the object data 62 by inputting the object image 62G into the feature extraction network 51, as shown in Figure 7. Note that the object image 62G is appropriately reduced in size to match the size of the input layer of the feature extraction network 51 before being input.

そして、特徴ベクトル算出部43は、物体データ62の中の物体画像62Gを、算出した特徴ベクトルFに置き換えることによって教師データ63を生成し、教師データ記憶部44に記憶させる。 Then, the feature vector calculation unit 43 generates training data 63 by replacing the object image 62G in the object data 62 with the calculated feature vector F, and stores the training data 63 in the training data storage unit 44.

キャノピマップ生成部41ないし特徴ベクトル算出部43の処理によると、例えば、オペレータが11クラスの物体(樹木またはその他の物体)それぞれについて5つずつポリゴン61Aを選択した場合は、55個の教師データ63が生成され、教師データ記憶部44に記憶される。 For example, if the operator selects five polygons 61A for each of 11 classes of objects (trees or other objects), processing by the canopy map generation unit 41 or feature vector calculation unit 43 generates 55 pieces of training data 63 and stores them in the training data storage unit 44.

以下、P個の教師データ63が教師データ記憶部44に記憶された場合を例に説明する。それぞれの教師データ63に示される特徴ベクトルFを「特徴ベクトルF」、「特徴ベクトルF」、…、「特徴ベクトルF」と区別して記載することがある。 The following description will be given taking as an example a case where P pieces of teacher data 63 are stored in the teacher data storage unit 44. The feature vectors F indicated in the respective teacher data 63 may be distinguished and described as "feature vector F 1 ,""feature vector F 2 ," ..., "feature vector F P ."

これらの特徴ベクトルFは、2640次元空間(ユークリッド空間)の原点を始点とする位置ベクトルであると言える。以下、2640次元空間での特徴ベクトルFの終点を「特徴点」と記載する。各物体の特徴ベクトルFの特徴点を2640次元空間にプロットすると、図8(A)に示すように、森林80に存在する物体の特徴の分布が表われる。 These feature vectors F can be thought of as position vectors starting from the origin of 2640-dimensional space (Euclidean space). Hereinafter, the end points of feature vectors F in 2640-dimensional space will be referred to as "feature points." When the feature points of each object's feature vector F are plotted in 2640-dimensional space, the distribution of the features of the objects present in forest 80 appears, as shown in Figure 8 (A).

〔推論のフェーズ〕
オペレータは、所定の高度からドローン2によって森林80の一部分または全体を撮影した上空写真65をコンピュータ1に入力する。上空写真65は、上空写真60と同様、RGBのカラー写真である。
[Inference Phase]
The operator inputs an aerial photograph 65, which is a photograph of a part or the whole of the forest 80 taken by the drone 2 from a predetermined altitude, into the computer 1. The aerial photograph 65, like the aerial photograph 60, is an RGB color photograph.

キャノピ検出部45(図3参照)は、上空写真65が入力されると、上空写真65に写っているキャノピなどの物体の位置および形状を検出する。検出の方法は、キャノピマップ生成部41による検出の方法と同様であって、例えば特開2020-91640号公報に記載される方法が用いられる。 When an aerial photograph 65 is input, the canopy detection unit 45 (see Figure 3) detects the position and shape of objects such as canopies that appear in the aerial photograph 65. The detection method is the same as the detection method used by the canopy map generation unit 41, and for example, the method described in JP 2020-91640 A is used.

上空写真65に写っているキャノピなどの各物体の位置および形状がキャノピ検出部45によって検出されると、特徴量算出部46およびクラス推論部47によって各物体のクラスを推論するための処理が行われる。以下、ある物体αのクラスを推論する場合を例に説明する。 When the canopy detection unit 45 detects the position and shape of each object, such as a canopy, captured in the aerial photograph 65, the feature calculation unit 46 and class inference unit 47 perform processing to infer the class of each object. Below, we will explain an example of inferring the class of a certain object α.

特徴量算出部46は、物体αの位置および形状に基づいて、物体αの画像を物体画像66として上空写真65から抽出する。そして、物体画像66を特徴抽出ネットワーク51に入力することによって物体αの特徴ベクトルFを算出する。この特徴抽出ネットワーク51は、学習のフェーズにおいて特徴量F、F、…、Fを算出するために使用した特徴抽出ネットワーク51と同じものである。以下、特徴量算出部46によって算出された特徴ベクトルFを「特徴ベクトルF」と記載する。 The feature amount calculation unit 46 extracts an image of the object α from the aerial photograph 65 as an object image 66 based on the position and shape of the object α. Then, the feature vector F of the object α is calculated by inputting the object image 66 to a feature extraction network 51. This feature extraction network 51 is the same as the feature extraction network 51 used to calculate the feature amounts F 1 , F 2 , ..., F P in the learning phase. Hereinafter, the feature vector F calculated by the feature amount calculation unit 46 will be referred to as a "feature vector F A ".

クラス推論部47は、教師データ記憶部44に記憶される各教師データ63の特徴ベクトルF(F、F、…、F)の特徴点のうちの特徴ベクトルFの特徴点に最も近いものをk個、k近傍法によって選出する。そして、選出した各特徴点の特徴ベクトルFに対応する教師データ63のラベル62Lを抽出し、最も多くのラベル62Lに示されるクラスを物体αのクラスであると推論する。なお、2つの特徴点同士の距離は、ユーグリッド距離である。 The class inference unit 47 uses the k-nearest neighbor method to select k feature points that are closest to the feature point of the feature vector F A from among the feature points of the feature vector F (F 1 , F 2 , ..., F P ) of each piece of teacher data 63 stored in the teacher data storage unit 44. Then, it extracts the labels 62L of the teacher data 63 that correspond to the feature vector F of each selected feature point, and infers that the class indicated by the most labels 62L is the class of the object α. The distance between two feature points is the Euclidean distance.

例えば、図8(B)のように特徴ベクトルFの終点が「×」に位置し、かつ、kが「3」である場合は、特徴ベクトルFの終点に最も近い3つの終点は点線で囲まれる3点であり、これらの3点のうちクラス_1の終点が最多である。したがって、クラス推論部47は、クラス_1を物体αのクラスであると推論する。 8B, when the end point of the feature vector F A is located at "X" and k is "3", the three end points closest to the end point of the feature vector F A are the three points surrounded by dotted lines, and of these three points, the most common are end points of class_1. Therefore, the class inference unit 47 infers that class_1 is the class of the object α.

クラス推論部47は、キャノピ検出部45によって位置および形状が判別された他の各物体についても物体αと同様に、k近傍法によってクラスを推論する。 The class inference unit 47 infers the class of each of the other objects whose position and shape have been determined by the canopy detection unit 45 using the k-nearest neighbor method, in the same way as for object α.

樹木分類マップ生成部48は、キャノピ検出部45によって位置および形状が判別された各物体の、クラス推論部47によって推論されたクラスに基づいて、図9のような樹木分類マップ67を生成する。具体的には、上空写真65に写っている各物体の画像を、各物体のクラスに対応する色のポリゴンに置き換えることによって、樹木分類マップ67を生成する。 The tree classification map generation unit 48 generates a tree classification map 67 as shown in Figure 9 based on the class inferred by the class inference unit 47 for each object whose position and shape have been determined by the canopy detection unit 45. Specifically, the tree classification map 67 is generated by replacing the image of each object in the aerial photograph 65 with a polygon of a color corresponding to the class of each object.

そして、樹木分類マップ出力部49は、生成された樹木分類マップ67をタッチパネルディスプレイ18に表示させることによって出力する。または、通信回線を介して樹木分類マップ67のファイルを他のコンピュータへ送信してもよい。 The tree classification map output unit 49 then outputs the generated tree classification map 67 by displaying it on the touch panel display 18. Alternatively, the tree classification map 67 file may be transmitted to another computer via a communication line.

〔全体的な処理の流れおよび本実施形態の効果〕
図10は、樹木分類プログラム4による全体的な処理の流れの例を説明するフローチャートである。図11は、正誤結果の例を示す図である。
[Overall Processing Flow and Effects of This Embodiment]
Fig. 10 is a flowchart illustrating an example of the overall processing flow by the tree classification program 4. Fig. 11 is a diagram showing an example of a correct/incorrect result.

次に、コンピュータ1による全体的な処理の流れを、図10のフローチャートを参照しながら説明する。コンピュータ1は、樹木分類プログラム4に基づいて、図10に示す手順で処理を実行する。 Next, the overall processing flow by the computer 1 will be explained with reference to the flowchart in Figure 10. The computer 1 executes processing based on the tree classification program 4, following the procedure shown in Figure 10.

コンピュータ1は、図5(A)に示したような上空写真60が入力されると、上空写真60に基づいて、図5(B)に示したようなキャノピマップ61を生成し(図10の#101)、表示する(#102)。 When an aerial photograph 60 such as that shown in Figure 5(A) is input, the computer 1 generates a canopy map 61 such as that shown in Figure 5(B) based on the aerial photograph 60 (#101 in Figure 10) and displays it (#102).

各クラスに対応するポリゴン61Aをオペレータが1個ないし数個ずつ選択すると、コンピュータ1は、選択されたポリゴン61Aそれぞれの元の画像(物体画像62G)に対して、それぞれに対応するクラスのラベル62Lを付与することによって、図6に示したような物体データ62を生成する(#103)。そして、物体画像62Gそれぞれの特徴ベクトルFを算出し(#104)、物体画像62Gそれぞれの特徴ベクトルFおよびラベル62Lを示す教師データ63を生成して記憶する(#105)。以上の処理によって、学習のフェーズが完了する。 When the operator selects one or several polygons 61A corresponding to each class, the computer 1 generates object data 62 as shown in FIG. 6 by assigning the corresponding class label 62L to the original image (object image 62G) of each selected polygon 61A (#103). Then, the computer 1 calculates the feature vector F for each object image 62G (#104), and generates and stores training data 63 indicating the feature vector F and label 62L for each object image 62G (#105). The learning phase is completed with the above processing.

コンピュータ1は、上空写真65が入力されると、上空写真65に写っている物体の位置および形状を検出し(#121)、上空写真65の中の各物体の物体画像66の特徴ベクトルFを算出する(#122)。 When the aerial photograph 65 is input, the computer 1 detects the position and shape of objects shown in the aerial photograph 65 (#121) and calculates the feature vector F of the object image 66 of each object in the aerial photograph 65 (#122).

さらに、コンピュータ1は、教師データ63それぞれに示される特徴ベクトルFおよびステップ#122で算出した特徴ベクトルFに基づいてk近傍法によって、上空写真65の中の各物体のクラスを推論する(#123)。そして、図9に示したような樹木分類マップ67を推論結果に基づいて生成し(#124)、出力する(#125)。 Furthermore, the computer 1 infers the class of each object in the aerial photograph 65 using the k-nearest neighbor method based on the feature vector F indicated in each training data 63 and the feature vector F calculated in step #122 (#123). Then, a tree classification map 67 like the one shown in Figure 9 is generated based on the inference results (#124) and output (#125).

本実施形態によると、オペレータは、従来のディープラーニングのケースのように膨大な学習データを用意する必要がなく、ある地域(サイト)に生育する樹木のクラス(種類)ごとの物体データ62を1ないし数個ずつ用意すればよい。これらの物体データ62に基づいてコンピュータ1によって教師データ63が生成され、推論のための準備が完了する。したがって、本実施形態によると、樹木などのクラスを推論するAIを従来よりも容易に構築することができる。 According to this embodiment, the operator does not need to prepare a huge amount of training data as in the case of conventional deep learning; instead, it is sufficient to prepare one or several pieces of object data 62 for each class (type) of trees growing in a certain area (site). Based on this object data 62, the computer 1 generates training data 63, completing preparations for inference. Therefore, according to this embodiment, it is easier than ever to build AI that can infer classes such as trees.

ここで、実験結果の一例を挙げて、本実施形態の効果を補足する。コシアブラ、ミズメ、ブナ、サワグルミ、ホオ、アズキナシ、ウワミズザクラ、イタヤカエデ、およびトチの9種類の樹木および樹木以外の物体(ギャップ)の10のクラスのいずれかに分類するためのCNNをディープラーニングによって生成し、このCNNによって推論対象の物体を分類し、実際のクラスと推論されたクラスとを集計すると、図11に示す正誤結果_1が得られた。 Here, an example of experimental results will be presented to further explain the effects of this embodiment. A CNN was generated using deep learning to classify nine types of trees (Japanese koshiabura, Mizume, beech, Japanese walnut, magnolia, adzuki pear, Japanese cherry, sugar maple, and horse chestnut) and non-tree objects (gaps) into one of 10 classes. The object to be inferred was then classified using this CNN, and the actual class and the inferred class were tallied to obtain the true/false result_1 shown in Figure 11.

一方、本実施形態の方法の通り、既存の特徴抽出ネットワーク51を用いて少量の(例えば、各クラス10個ずつの)教師データ63を生成し、これらの教師データ63に基づいてk近傍法で推論対象の物体を分類し、実際のクラスと推論されたクラスとを集計すると、正誤結果_2が得られた。 On the other hand, as per the method of this embodiment, a small amount of training data 63 (e.g., 10 for each class) is generated using an existing feature extraction network 51, and the object to be inferred is classified using the k-nearest neighbor method based on this training data 63. The actual classes and inferred classes are then tallied, resulting in a true/false result of _2.

正誤結果_1および正誤結果_2それぞれのκ値は、0.414および0.456である。つまり、地域(サイト)に合わせて取得した各クラス10個ずつ程度の教師データ63の集合によるk近傍法であっても、ディープラーニングで取得したCNNと同程度の識別精度を達成することができる。さらに、一部のクラス(イタヤカエデ)の識別の精度をディープラーニングよりも大幅に向上させることができる。 The kappa values for correct/incorrect result_1 and correct/incorrect result_2 are 0.414 and 0.456, respectively. In other words, even with the k-nearest neighbor method using a set of training data 63 of approximately 10 items per class acquired for each region (site), it is possible to achieve classification accuracy on the same level as the CNN acquired through deep learning. Furthermore, the classification accuracy of some classes (sugar maple) can be significantly improved compared to deep learning.

〔変形例および応用例〕
推論の対象の物体の物体画像66の特徴ベクトルF(例えば、図7の特徴ベクトルF)の特徴点と特徴ベクトルF、F、…、Fそれぞれの特徴点との距離がすべて、所定の距離以上である場合は、その物体がどのクラスにも属さない可能性が高い。そこで、コンピュータ1は、このような場合に、k近傍法を使用せず、その物体のクラスを樹木分類ネットワーク5(図4参照)によって推論してもよい。つまり、その物体の物体画像66を特徴抽出ネットワーク51へ入力し、確率算出ネットワーク52から出力される確率p、p、…、pのうち最も高い確率に対応するクラスをその物体のクラスであると推論してもよい。
[Modifications and Applications]
If the distances between the feature points of feature vector F (e.g., feature vector F A in FIG. 7 ) of object image 66 of the object to be inferred and the feature points of each of feature vectors F 1 , F 2 , ..., F P are all equal to or greater than a predetermined distance, it is highly likely that the object does not belong to any class. Therefore, in such a case, computer 1 may infer the class of the object using tree classification network 5 (see FIG. 4 ) without using the k-nearest neighbor method. That is, object image 66 of the object may be input to feature extraction network 51, and the class corresponding to the highest probability among probabilities p 1 , p 2 , ..., p N output from probability calculation network 52 may be inferred to be the class of the object.

本実施形態では、図8で説明したように、コンピュータ1は、2640次元でk近傍法によって対象の物体のクラスを推論したが、次元を落としてから推論してもよい。例えば、特徴ベクトルFの2640の元(要素)のうちの最も重要な幾つかの(例えば、10個の)元をSFS(Sequential Forward Selection)法によって決定し、決定した元の特徴量に基づいてk近傍法によって対象の物体のクラスを推論してもよい。つまり、例えば、図7の特徴ベクトルF、F、…、FをそれぞれSFS法によって低次元ベクトルG、G、…、Gに変換し、特徴ベクトルFをSFS法によって低次元ベクトルGに変換する。そして、低次元ベクトルGの特徴点と特徴ベクトルF、F、…、Fそれぞれの特徴点との距離を算出し、k近傍法によってクラスを推論する。 In this embodiment, as described with reference to FIG. 8 , the computer 1 infers the class of the target object using the k-nearest neighbor algorithm in 2640 dimensions. However, the inference may be performed after reducing the dimensions. For example, several (e.g., 10) most important elements of the 2640 elements (components) of the feature vector F may be determined using the Sequential Forward Selection (SFS) method, and the class of the target object may be inferred using the k-nearest neighbor algorithm based on the determined feature quantities. That is, for example, the feature vectors F 1 , F 2 , ..., F P in FIG. 7 may be converted into low-dimensional vectors G 1 , G 2 , ..., G P using the SFS method, and the feature vector F A may be converted into a low-dimensional vector G A using the SFS method. Then, the distances between the feature points of the low-dimensional vector G A and the feature points of each of the feature vectors F 1 , F 2 , ..., F P are calculated, and the class is inferred using the k-nearest neighbor algorithm.

最も重要な幾つかの元は、推論のフェーズにおいて推論の対象の物体の画像すなわち物体画像66の特徴ベクトルFを算出した後(図10のステップ#122の後)、その特徴ベクトルFに基づいて決定すればよい。または、学習のフェーズにおいていずれかのサンプルの画像すなわち物体画像62Gの特徴ベクトルFを算出した後(#104の後)、その特徴ベクトルFに基づいて決定してもよい。 The most important few elements may be determined based on the feature vector F of the image of the object to be inferred, i.e., object image 66, calculated in the inference phase (after step #122 in Figure 10). Alternatively, the most important few elements may be determined based on the feature vector F of one of the sample images, i.e., object image 62G, calculated in the learning phase (after #104).

または、SBS(Sequential Backward Selection)法または総当たり法など、SFS法の以外のラッパー法によって、重要な元を決定してもよい。または、ラッパー法以外の特徴量選択方法によって重要な元を決定してもよい。 Alternatively, important elements may be determined by a wrapper method other than the SFS method, such as the Sequential Backward Selection (SBS) method or a brute force method. Alternatively, important elements may be determined by a feature selection method other than the wrapper method.

図12は、特徴抽出ネットワーク51の汎用化および全国の樹木マップの作成の方法の例を示す図である。 Figure 12 shows an example of how to generalize the feature extraction network 51 and create a nationwide tree map.

樹木分類プログラム4の提供者は、樹木分類プログラム4を日本国内の各地のユーザへ提供し各ユーザからデータを収集することによって、日本全国の樹種マップを作成するとともに、樹木分類ネットワーク5(図4参照)の精度の向上を図ることができる。以下、図12を参照しながら、この仕組みについて説明する。 By providing the tree classification program 4 to users throughout Japan and collecting data from each user, the provider of the tree classification program 4 can create a tree species map for the entire country of Japan and improve the accuracy of the tree classification network 5 (see Figure 4). This mechanism is explained below with reference to Figure 12.

樹木分類プログラム4の提供者は、予め、樹木分類ネットワーク5を有するサーバ31を用意しておく。さらに、日本で見られる各樹木のクラス(種類)の識別子(クラスのコードまたは呼び名)を予め統一し、それらを記載した樹木リストを用意しておく。 The provider of the tree classification program 4 prepares in advance a server 31 that has a tree classification network 5. Furthermore, the provider standardizes in advance the identifiers (class codes or names) of the classes (types) of trees found in Japan, and prepares a tree list that lists these.

サーバ31は、ユーザからリクエストを受け付けるごとに、樹木分類プログラム4とともに特徴抽出ネットワーク51および樹木リストをそのユーザのコンピュータへ送信する(#131)。特徴抽出ネットワーク51は、各ユーザの地域(サイト)で汎用的に用いられるニューラルネットワーク(汎用モデル)であるが、最新のものであることが望ましい。 Each time the server 31 receives a request from a user, it sends the tree classification program 4, along with the feature extraction network 51 and tree list, to the user's computer (#131). The feature extraction network 51 is a neural network (general-purpose model) that is generally used in each user's region (site), and it is desirable that it be the latest version.

ユーザは、樹木分類プログラム4および特徴抽出ネットワーク51をコンピュータによって受信すると、そのコンピュータに樹木分類プログラム4および特徴抽出ネットワーク51をインストールする。これにより、そのコンピュータがコンピュータ1として機能する。 When the user receives the tree classification program 4 and feature extraction network 51 on a computer, the user installs the tree classification program 4 and feature extraction network 51 on the computer. This causes the computer to function as computer 1.

ユーザは、樹木分類プログラム4、特徴抽出ネットワーク51、およびドローン2などを使用して自分の地域の森林に合わせて樹木分類プログラム4をチューニングし、樹木分類マップ67を作成する(#132)。ラベリングは、樹木リストに従う。そして、樹木分類マップ67を、撮影場所の位置情報および作成の過程で得られた物体データ62とともに自分のコンピュータからサーバ31へ送信する(#133)。 The user uses the tree classification program 4, feature extraction network 51, drone 2, etc. to tune the tree classification program 4 to the forests in their area and create a tree classification map 67 (#132). Labeling follows the tree list. The user then transmits the tree classification map 67 from their computer to the server 31 along with location information of the photographing location and object data 62 obtained during the creation process (#133).

サーバ31は、物体データ62、樹木分類マップ67、および位置情報を受信すると、物体データ62に示される物体画像62Gおよびラベル62Lをそれぞれ説明変数および目的変数として用いて樹木分類ネットワーク5のさらなる学習(訓練)をディープラーニングによって行う(#134)。物体データ62の一部を検証データまたはテストデータとして用いることもある。さらに、位置情報に基づいて樹木分類マップ67を全国地図に重ねる(#135)。 When the server 31 receives the object data 62, tree classification map 67, and location information, it performs further learning (training) of the tree classification network 5 by deep learning using the object image 62G and label 62L shown in the object data 62 as explanatory variables and target variables, respectively (#134). Part of the object data 62 may also be used as validation data or test data. Furthermore, the tree classification map 67 is overlaid on a national map based on the location information (#135).

以上の処理によって、特徴抽出ネットワーク51の学習および日本全国の樹種マップの作成が進む。その後、各ユーザへは、最新の状態の特徴抽出ネットワーク51が提供される。この一連の処理を繰り返すことによって、各地から物体データ62が集まり、特徴抽出ネットワーク51が大規模な汎用モデルになるように学習されていく。なお、日本国内に限らず全世界の樹種マップを作成するとともに、全世界の樹木の種類の分類が可能になるように樹木分類ネットワーク5をディープラーニングさせてもよい。 The above process progresses the training of the feature extraction network 51 and the creation of a tree species map for all of Japan. The latest version of the feature extraction network 51 is then provided to each user. By repeating this series of processes, object data 62 is collected from various locations, and the feature extraction network 51 is trained to become a large-scale, general-purpose model. Note that the tree classification network 5 may be subjected to deep learning to create a tree species map for the entire world, not just Japan, and to classify tree species worldwide.

本実施形態では、樹木などの物体のクラスを推論する際にk近傍法を用いたが、k近傍法を例えば次のように変形して用いてもよい。各教師データ63の特徴ベクトルF(F、F、…)の特徴点の中から推論の対象の物体の特徴ベクトルFの特徴点に最も近いものをk個、選出する。選出した各特徴点を各特徴点に対応する教師データ63のラベル62Lに示されるクラスごとに分類する。そして、クラスごとに、選出した各特徴点と推論の対象の物体の特徴点との距離の総和を算出し、総和が最も短いクラスを推論の対象の物体のクラスであると推論する。または、票の代わりに距離が近いほど大きな点数を与え、点数の総和が最も大きいクラスを推論の対象の物体のクラスであると推論してもよい。 In this embodiment, the k-nearest neighbor method is used when inferring the class of an object such as a tree. However, the k-nearest neighbor method may be modified as follows: From the feature points of the feature vectors F (F 1 , F 2 , ...) of each piece of training data 63, k feature points that are closest to the feature points of the feature vector F A of the object to be inferred are selected. Each selected feature point is classified into a class indicated by the label 62L of the training data 63 corresponding to each feature point. Then, for each class, the sum of the distances between each selected feature point and the feature points of the object to be inferred is calculated, and the class with the shortest sum is inferred to be the class of the object to be inferred. Alternatively, instead of votes, a larger score may be assigned to a closer distance, and the class with the largest sum of scores may be inferred to be the class of the object to be inferred.

または、k近傍法の代わりにSVM(Support Vector Machine)またはランダムフォレストを使用して学習器を生成し、生成した学習器によってクラスを推論してもよい。SVMを使用する場合もランダムフォレストを使用する場合も、SFS法などによって特徴ベクトルF、F、…、Fの次元を減らして学習器を生成し、同様の方法で特徴ベクトルFの次元を減らしてクラスを推論してもよい。 Alternatively, instead of the k-nearest neighbor method, a support vector machine (SVM) or random forest may be used to generate a learner, and a class may be inferred using the generated learner. Whether an SVM or a random forest is used, a learner may be generated by reducing the dimensions of the feature vectors F 1 , F 2 , ..., F P using an SFS method or the like, and a class may be inferred by reducing the dimensions of the feature vector F A in a similar manner.

本実施形態では、図3に示した各機能をコンピュータ1に集約したが、複数の装置に分散してもよい。例えば、キャノピマップ生成部41およびラベル付与部42を第一のコンピュータに設け、特徴ベクトル算出部43を第二のコンピュータに設け、教師データ記憶部44を第三のコンピュータに設け、キャノピ検出部45を第四のコンピュータに設け、クラス推論部47を第五のコンピュータに設け、樹木分類マップ生成部48および樹木分類マップ出力部49を第六のコンピュータに設けてもよい。第一のコンピュータないし第六のコンピュータは、それぞれの機能を実現するためのコンピュータプログラムがインストールされており、通信回線を介して互いに連携することによって上空写真60から樹木分類マップ67を生成するための学習および推論の一連の処理を実行する。 In this embodiment, the functions shown in FIG. 3 are concentrated in computer 1, but they may be distributed across multiple devices. For example, the canopy map generation unit 41 and label assignment unit 42 may be provided in a first computer, the feature vector calculation unit 43 in a second computer, the teacher data storage unit 44 in a third computer, the canopy detection unit 45 in a fourth computer, the class inference unit 47 in a fifth computer, and the tree classification map generation unit 48 and tree classification map output unit 49 in a sixth computer. Computer programs for realizing each function are installed in the first through sixth computers, and by cooperating with each other via communication lines, they execute a series of learning and inference processes for generating a tree classification map 67 from an aerial photograph 60.

本実施形態では、コンピュータ1を、樹木を分類するために用いたが、他の物体を分類するために用いてもよい。例えば、草原に分布する草花、低木、動物の住処(蟻塚、モグラの巣などの、動物の巣)、または地形などを分類するために用いてもよい。または、岩石(火山岩、半深成岩、深成岩、堆積岩など)を分類するために用いてもよいし、建築物を分類するために用いてもよい。 In this embodiment, the computer 1 is used to classify trees, but it may also be used to classify other objects. For example, it may be used to classify grassland flowers, shrubs, animal habitats (animal nests such as anthills and mole nests), or landforms. It may also be used to classify rocks (volcanic rocks, hypabyssal rocks, plutonic rocks, sedimentary rocks, etc.), or to classify buildings.

いずれの種類を分類する場合も、コンピュータ1およびドローン2は、基本的に本実施形態と同様の処理を行えばよい。 Regardless of the type of classification, the computer 1 and drone 2 can basically perform the same processing as in this embodiment.

ただし、草花を分類する場合は、ドローン2は、樹木を分類する場合よりも低い高度で撮影を行うことによって上空写真60、65を収集する。草花の形状はビルの形状のように急傾斜が生じているので、本実施形態と同様にスロープモデルを用いることが有効的であるが、樹木よりも小さいので、草花のサイズに合わせて高度を下げて撮影するのが望ましい。低木を分類する場合および湖沼の植物(例えば、葦)を分類する場合も、同様である。 However, when classifying flowers and plants, the drone 2 collects aerial photographs 60, 65 by taking photographs at a lower altitude than when classifying trees. Because flowers and plants have a steep slope like the shape of a building, it is effective to use a slope model as in this embodiment, but because they are smaller than trees, it is desirable to take photographs at a lower altitude to match their size. The same applies when classifying shrubs and lake plants (e.g., reeds).

一方、地形(湖沼、平野、丘陵、河川)を分類する場合は、ドローン2は、樹木を分類する場合よりも高い高度で撮影を行うことによって上空写真60、65を収集してもよい。または、解像度を下げて上空写真60、65を収集してもよい。 On the other hand, when classifying landforms (lakes, marshes, plains, hills, rivers), the drone 2 may collect aerial photographs 60, 65 by taking photographs at a higher altitude than when classifying trees. Alternatively, the aerial photographs 60, 65 may be collected at a lower resolution.

その他、コンピュータ1の全体または各部の構成、処理の内容、処理の順序、データの構成などは、本発明の趣旨に沿って適宜変更することができる。 In addition, the overall configuration of computer 1 or each part, the processing content, processing order, data structure, etc. may be modified as appropriate in accordance with the spirit of the present invention.

1 コンピュータ(学習装置)
3 樹木分類システム(クラス推論システム)
31 サーバ(学習手段)
4 樹木分類プログラム(コンピュータプログラム)
42 ラベル付与部(第一の取得手段)
46 特徴量算出部(第二の取得手段)
47 クラス推論部(推論手段)
5 樹木分類ネットワーク(CNN)
51 特徴抽出ネットワーク(学習済モデル)
63 教師データ(推論用データ)
62G 物体画像
63 教師データ(サンプル特徴量)
66 物体画像(推論対象物の画像)
1. Computer (learning device)
3. Tree Classification System (Class Inference System)
31 Server (learning means)
4. Tree classification program (computer program)
42 Label assignment unit (first acquisition means)
46 Feature calculation unit (second acquisition means)
47 Class inference unit (inference means)
5. Tree Classification Network (CNN)
51 Feature extraction network (trained model)
63 Training data (data for inference)
62G Object image 63 Training data (sample feature)
66 Object image (image of the object to be inferred)

Claims (8)

特定の地域に生育する、複数のクラスそれぞれに属する樹木の樹冠の画像の特徴を表わす第一の特徴ベクトルを、当該画像を学習済モデルに入力することによって取得する第一の取得手段と、
前記特定の地域に生育する、推論の対象である推論対象樹木の樹冠の画像の特徴を表わす第二の特徴ベクトルを、当該画像を前記学習済モデルに入力することによって取得する第二の取得手段と、
前記複数のクラスのうちの前記推論対象樹木が属するクラスを、前記複数のクラスそれぞれの前記第一の特徴ベクトルおよび当該推論対象樹木の前記第二の特徴ベクトルに基づいて推論する推論手段と、
を有し、
前記学習済モデルは、複数の樹木それぞれのクラスおよび樹冠の画像をそれぞれ目的変数および説明変数としてディープラーニングによって生成されたCNN(Convolutional Neural Network)のうちの、入力画像の特徴ベクトルを畳込み処理によって算出する部分のネットワークである、
ことを特徴とするクラス推論システム。
a first acquisition means for acquiring a first feature vector representing features of an image of a crown of a tree belonging to each of a plurality of classes that grows in a specific region by inputting the image into a trained model;
a second acquisition means for acquiring a second feature vector representing features of an image of a crown of an inference target tree that is a target of inference and grows in the specific region by inputting the image into the trained model;
an inference means for inferring a class to which the inference target tree belongs from among the plurality of classes, based on the first feature vector of each of the plurality of classes and the second feature vector of the inference target tree;
and
The trained model is a network of a part of a CNN (Convolutional Neural Network) generated by deep learning using the classes of a plurality of trees and the images of tree crowns as objective variables and explanatory variables, respectively, that calculates the feature vectors of input images by convolution processing.
A class inference system characterized by:
前記推論手段は、k近傍法によって前記複数のクラスのうちの前記推論対象樹木が属するクラスを推論する、
請求項1に記載のクラス推論システム。
the inference means infers a class to which the inference target tree belongs among the plurality of classes by a k-nearest neighbor method;
The class inference system of claim 1 .
前記第一の取得手段は、前記複数のクラスそれぞれに属する樹木の樹冠の画像の前記第一の特徴ベクトルとして、当該画像を前記学習済モデルに入力することによって算出される特徴ベクトルの特定の複数の元の各値からなる第一の低次元ベクトルを取得し、
前記第二の取得手段は、前記第二の特徴ベクトルとして、前記推論対象樹木の樹冠の画像を前記学習済モデルに入力することによって算出される特徴ベクトルの前記特定の複数の元の各値からなる第二の低次元ベクトルを取得する、
請求項1または請求項2に記載のクラス推論システム。
the first acquisition means acquires, as the first feature vector of an image of a crown of a tree belonging to each of the plurality of classes, a first low-dimensional vector composed of each of a plurality of specific element values of a feature vector calculated by inputting the image into the trained model;
the second acquisition means acquires, as the second feature vector, a second low-dimensional vector consisting of each of the specific plurality of element values of a feature vector calculated by inputting an image of a crown of the inference target tree into the trained model;
3. The class inference system according to claim 1 or claim 2.
前記特定の複数の元は、前記学習済モデルによって算出される特徴ベクトルに対してSFS(Sequential Forward Selection)法の処理を行うことによって求められる、
請求項3に記載のクラス推論システム。
The specific elements are obtained by performing a sequential forward selection (SFS) process on the feature vector calculated by the trained model.
4. The class inference system of claim 3.
前記複数のクラスそれぞれに属する樹木の樹冠の画像および当該樹木のクラスそれぞれを説明変数および目的変数として前記CNNをさらに学習させる、学習手段、
を有する、
請求項1ないし請求項4のいずれかに記載のクラス推論システム。
a learning means for further training the CNN using images of tree crowns belonging to each of the plurality of classes and each of the tree classes as explanatory variables and objective variables;
having
5. A class inference system according to claim 1.
複数のクラスそれぞれに属する樹木が生育しかつ複数の地域を有する領域の樹種マップを生成する樹種マップ生成システムであって、
前記複数の地域それぞれについて、当該地域に生育する、前記複数のクラスそれぞれに属する樹木の樹冠の画像の特徴を表わす第一の特徴ベクトルを、当該画像を学習済モデルに入力することによって取得する第一の取得手段と、
前記領域に生育する複数の推論対象樹木それぞれの樹冠の画像の特徴を表わす第二の特徴ベクトルを、当該画像を前記学習済モデルに入力することによって取得する第二の取得手段と、
前記複数の推論対象樹木それぞれが属するクラスを、前記複数の地域のうちの当該推論対象樹木が生育する地域における前記複数のクラスそれぞれの前記第一の特徴ベクトルおよび当該推論対象樹木の前記第二の特徴ベクトルに基づいて推論する推論手段と、
前記複数の推論対象樹木それぞれの位置情報および前記推論手段による推論結果に基づいて前記樹種マップを生成するマップ生成手段と、
を有することを特徴とする樹種マップ生成システム。
A tree species map generation system for generating a tree species map for an area having multiple regions where trees belonging to each of multiple classes grow, comprising:
a first acquisition means for acquiring, for each of the plurality of regions, a first feature vector representing features of an image of a crown of a tree growing in the region and belonging to each of the plurality of classes, by inputting the image into a trained model;
a second acquisition means for acquiring a second feature vector representing features of an image of the crown of each of a plurality of inference target trees growing in the region by inputting the image into the trained model;
an inference means for inferring a class to which each of the plurality of inference target trees belongs based on the first feature vector of each of the plurality of classes in an area where the inference target tree grows among the plurality of areas and the second feature vector of the inference target tree;
a map generating means for generating the tree species map based on the position information of each of the plurality of inference target trees and the inference result by the inference means;
A tree species map generation system comprising:
特定の地域に生育する、複数のクラスそれぞれに属する樹木の樹冠の画像の特徴を表わす第一の特徴ベクトルを、当該画像を学習済モデルに入力することによって取得し、
前記特定の地域に生育する、推論の対象である推論対象樹木の樹冠の画像の特徴を表わす第二の特徴ベクトルを、当該画像を前記学習済モデルに入力することによって取得し、
前記複数のクラスのうちの前記推論対象樹木が属するクラスを、前記複数のクラスそれぞれの前記第一の特徴ベクトルおよび当該推論対象樹木の前記第二の特徴ベクトルに基づいて推論し、
前記学習済モデルとして、複数の樹木それぞれのクラスおよび樹冠の画像をそれぞれ目的変数および説明変数としてディープラーニングによって生成されたCNN(Convolutional Neural Network)のうちの、入力画像の特徴ベクトルを畳込み処理によって算出する部分のネットワークが用いられる、
ことを特徴とするクラス推論方法。
Obtaining a first feature vector representing features of an image of a crown of a tree belonging to each of a plurality of classes growing in a specific region by inputting the image into a trained model;
A second feature vector representing features of an image of a crown of an inference target tree that is a target of inference and grows in the specific region is obtained by inputting the image into the trained model;
inferring a class to which the inference target tree belongs from among the plurality of classes based on the first feature vector of each of the plurality of classes and the second feature vector of the inference target tree;
As the trained model, a network of a part of a CNN (Convolutional Neural Network) that calculates feature vectors of input images by convolution processing is used, the part being generated by deep learning using the classes of a plurality of trees and the images of tree crowns as objective variables and explanatory variables, respectively.
A class inference method characterized by:
複数のクラスそれぞれに属する樹木が生育しかつ複数の地域を有する領域の樹種マップを生成する樹種マップ生成方法であって、
前記複数の地域それぞれについて、当該地域に生育する、前記複数のクラスそれぞれに属する樹木の樹冠の画像の特徴を表わす第一の特徴ベクトルを、当該画像を学習済モデルに入力することによって取得し、
前記領域に生育する複数の推論対象樹木それぞれの樹冠の画像の特徴を表わす第二の特徴ベクトルを、当該画像を前記学習済モデルに入力することによって取得し、
前記複数の推論対象樹木それぞれが属するクラスを、前記複数の地域のうちの当該推論対象樹木が生育する地域における前記複数のクラスそれぞれの前記第一の特徴ベクトルおよび当該推論対象樹木の前記第二の特徴ベクトルに基づいて推論し、
前記複数の推論対象樹木それぞれの位置情報および推論したクラスに基づいて前記樹種マップを生成する、
ことを特徴とする樹種マップ生成方法。
A tree species map generation method for generating a tree species map for an area having multiple regions and in which trees belonging to multiple classes grow, comprising the steps of:
For each of the plurality of regions, a first feature vector representing features of an image of a crown of a tree belonging to each of the plurality of classes growing in the region is obtained by inputting the image into a trained model;
A second feature vector representing features of an image of a crown of each of a plurality of inference target trees growing in the region is obtained by inputting the image into the trained model;
inferring a class to which each of the plurality of inference target trees belongs based on the first feature vector of each of the plurality of classes in a region where the inference target tree grows among the plurality of regions and the second feature vector of the inference target tree;
generating the tree species map based on the position information and the inferred class of each of the plurality of inference target trees;
A tree species map generation method characterized by:
JP2022040304A 2022-03-15 2022-03-15 Class inference system, tree species map generation system, class inference method, and tree species map generation method Active JP7797003B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022040304A JP7797003B2 (en) 2022-03-15 2022-03-15 Class inference system, tree species map generation system, class inference method, and tree species map generation method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022040304A JP7797003B2 (en) 2022-03-15 2022-03-15 Class inference system, tree species map generation system, class inference method, and tree species map generation method

Publications (2)

Publication Number Publication Date
JP2023135210A JP2023135210A (en) 2023-09-28
JP7797003B2 true JP7797003B2 (en) 2026-01-13

Family

ID=88144446

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022040304A Active JP7797003B2 (en) 2022-03-15 2022-03-15 Class inference system, tree species map generation system, class inference method, and tree species map generation method

Country Status (1)

Country Link
JP (1) JP7797003B2 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001357380A (en) 2000-06-13 2001-12-26 Pasuko:Kk Method for evaluating forest region by picture processing and storage medium with stored program concerning the evaluation
JP2016208516A (en) 2015-04-23 2016-12-08 アディダス アーゲー Method and device for associating frames in video of activity of person with event
JP2020091640A (en) 2018-12-05 2020-06-11 国立大学法人京都大学 Object classification system, learning system, learning data generation method, learned model generation method, learned model, discrimination device, discrimination method, and computer program
JP2021189701A (en) 2020-05-29 2021-12-13 富士通株式会社 Information processing program, information processing device and information processing method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001357380A (en) 2000-06-13 2001-12-26 Pasuko:Kk Method for evaluating forest region by picture processing and storage medium with stored program concerning the evaluation
JP2016208516A (en) 2015-04-23 2016-12-08 アディダス アーゲー Method and device for associating frames in video of activity of person with event
JP2020091640A (en) 2018-12-05 2020-06-11 国立大学法人京都大学 Object classification system, learning system, learning data generation method, learned model generation method, learned model, discrimination device, discrimination method, and computer program
JP2021189701A (en) 2020-05-29 2021-12-13 富士通株式会社 Information processing program, information processing device and information processing method

Also Published As

Publication number Publication date
JP2023135210A (en) 2023-09-28

Similar Documents

Publication Publication Date Title
US20260098980A1 (en) Method, system, and medium for processing satellite orbital information using a generative adversarial network
Liu et al. Comparing fully convolutional networks, random forest, support vector machine, and patch-based deep convolutional neural networks for object-based wetland mapping using images from small unmanned aircraft system
CN106407880B (en) Stock, growth and risk prediction using image processing
Ok et al. Evaluation of random forest method for agricultural crop classification
US11113525B1 (en) Using empirical evidence to generate synthetic training data for plant detection
US20200250427A1 (en) Shadow and cloud masking for agriculture applications using convolutional neural networks
CN111462223A (en) Identification method of soybean and corn planting area in Jianghuai region based on Sentinel-2 image
JP2020091640A (en) Object classification system, learning system, learning data generation method, learned model generation method, learned model, discrimination device, discrimination method, and computer program
CN116597602A (en) Forest fire early warning method, device, equipment and storage medium
Pádua et al. Classification of an agrosilvopastoral system using RGB Imagery from an unmanned aerial vehicle
CN116309366A (en) Method and device for early detection of pine nematode disease
CN117218400A (en) An image recognition model training method, device, electronic equipment and storage medium
Djenouri et al. A knowledge-enhanced object detection for sustainable agriculture
Kwong et al. Enhancing oil palm segmentation model with GAN-based augmentation
Mao et al. UAV-based high-throughput phenotyping to segment individual apple tree row based on geometrical features of poles and colored point cloud
Mehmood et al. Time series-based active labeling framework for curating a multispectral sentinel 2 imagery dataset for crop type mapping
JP7797003B2 (en) Class inference system, tree species map generation system, class inference method, and tree species map generation method
Kovačovič et al. Satellite-based forest stand detection using artificial intelligence
Hooshyar et al. Economic fruit trees recognition in hillsides: A CNN-based approach using enhanced UAV imagery
US20220383042A1 (en) Generating labeled synthetic training data
Hamzah et al. Drone aerial image identification of tropical forest tree species using the mask R-CNN
CN114782844B (en) Pine wood nematode disease tree identification method, system and storage medium
Arriola-Valverde et al. Coffee Crop Detection from UAS Orthomaps with Convolutional Neural Networks
Gromova Weed detection in UAV images of cereal crops with instance segmentation
Hamzah et al. Visualization of tree species identification using mask rcnns for tropical forests in malaysia

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240726

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20250317

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20250415

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20250616

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20250715

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20251104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20251202

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20251216

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20251217

R150 Certificate of patent or registration of utility model

Ref document number: 7797003

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150