Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP6587407B2 - Image processing apparatus, image processing method, and program - Google Patents
[go: Go Back, main page]

JP6587407B2 - Image processing apparatus, image processing method, and program - Google Patents

Image processing apparatus, image processing method, and program Download PDF

Info

Publication number
JP6587407B2
JP6587407B2 JP2015075224A JP2015075224A JP6587407B2 JP 6587407 B2 JP6587407 B2 JP 6587407B2 JP 2015075224 A JP2015075224 A JP 2015075224A JP 2015075224 A JP2015075224 A JP 2015075224A JP 6587407 B2 JP6587407 B2 JP 6587407B2
Authority
JP
Japan
Prior art keywords
representative data
pixels
continuous
image
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015075224A
Other languages
Japanese (ja)
Other versions
JP2016194861A (en
Inventor
大介 中嶋
大介 中嶋
賀保 橋口
賀保 橋口
政博 有泉
政博 有泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2015075224A priority Critical patent/JP6587407B2/en
Publication of JP2016194861A publication Critical patent/JP2016194861A/en
Application granted granted Critical
Publication of JP6587407B2 publication Critical patent/JP6587407B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Description

本発明は、特に、画像を座標など属性が類似した複数の領域に分割するために用いて好適な画像処理装置、画像処理方法及びプログラムに関する。   The present invention particularly relates to an image processing apparatus, an image processing method, and a program suitable for use in dividing an image into a plurality of regions having similar attributes such as coordinates.

近年、画像を色やテクスチャ、座標など属性が類似した複数の領域に分割する技術が注目されている。このように分割された領域はスーパーピクセルと呼ばれ、分割された領域の単位で符号化処理や、画像処理、画像認識処理等を実行できるため、様々な画像処理装置におけて応用することができる。   In recent years, a technique for dividing an image into a plurality of regions having similar attributes such as color, texture, and coordinates has attracted attention. The area divided in this way is called a super pixel, and since encoding processing, image processing, image recognition processing, and the like can be executed in units of the divided area, it can be applied to various image processing apparatuses. it can.

従来、画像の領域分割に関して様々な手法が提案されている。特に、画素をクラスタリングすることによって画像を複数の領域に分割する手法が多く提案されている。これらの手法では、色やテクスチャ、座標を要素にもつデータをクラスタリングし、クラスタリングでは、各クラス(領域)の代表データを求め、入力データを最近傍代表データに割り当てる。ここで、最近傍代表データとは、入力データに対する複数の代表候補データの中で、入力データとの距離が最短の代表候補データのことである。   Conventionally, various methods have been proposed for image segmentation. In particular, many techniques for dividing an image into a plurality of regions by clustering pixels have been proposed. In these methods, data having colors, textures, and coordinates as elements are clustered. In the clustering, representative data of each class (region) is obtained, and input data is assigned to the nearest representative data. Here, the nearest representative data is representative candidate data having a shortest distance from the input data among a plurality of representative candidate data for the input data.

非特許文献1には、SLIC(Simple Linear Iterative Clustering)と呼ばれるクラスタリング手法を用いて複数の領域に分割する方法が提案されている。SLICは、K−meansクラスタリングの最近傍代表データの探索範囲を画像中の局所領域に限定した手法である。また、特許文献1には、領域の形状が線形状の小領域である場合に、その領域を隣接するクラスに統合する手法が提案されている。   Non-Patent Document 1 proposes a method of dividing into a plurality of regions using a clustering technique called SLIC (Simple Linear Iterative Clustering). SLIC is a technique in which the search range of nearest neighbor representative data in K-means clustering is limited to a local region in an image. Patent Document 1 proposes a method of integrating a region into an adjacent class when the shape of the region is a linear small region.

また、非特許文献2に記載の手法では、入力データと代表候補データとの距離計算において、注目する入力データの近傍に異なるクラスの入力データが存在する程距離が大きくなる項を導入している。これにより、分割される形状が円形に近くなるようにクラスタリングしている。   Further, in the method described in Non-Patent Document 2, in the distance calculation between input data and representative candidate data, a term is introduced in which the distance increases as different classes of input data exist in the vicinity of the input data of interest. . Thus, clustering is performed so that the shape to be divided is close to a circle.

特許第5335581号公報Japanese Patent No. 5335581

Radhakrishna Achanta, et al., "SLIC Superpixels Compared to State-of-the-Art Superpixel Methods", IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 34, No. 11, pp. 2274-2282, Nov. 2012.Radhakrishna Achanta, et al., "SLIC Superpixels Compared to State-of-the-Art Superpixel Methods", IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 34, No. 11, pp. 2274-2282, Nov. 2012. J. Wang, and X. Wang, "VCells: Simple and Efficient Superpixels Using Edge-Weighted Centroidal Voronoi Tessellations", IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 34, No. 6, pp. 1241-1247, Jun. 2012.J. Wang, and X. Wang, "VCells: Simple and Efficient Superpixels Using Edge-Weighted Centroidal Voronoi Tessellations", IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 34, No. 6, pp. 1241-1247, Jun. 2012. C. Cortes, and V. Vapnik, "Support-Vector Networks", Machine Learning, 20, pp.273-297, 1995.C. Cortes, and V. Vapnik, "Support-Vector Networks", Machine Learning, 20, pp.273-297, 1995. C.M.ビショップ、「パターン認識と機械学習 上」、丸善出版、2012.C. M.M. Bishop, “Pattern recognition and machine learning,” Maruzen Publishing, 2012.

クラスタリングは画像の領域分割においてよく用いられる技術である。ただし、クラスタリングによる領域分割では、フラグメンテーションが発生することがある。フラグメンテーションとは、同一クラス内の画素が座標空間上で連続していない状態のことである。領域分割結果を応用する場合には、フラグメンテーションが発生しないことが好ましい。   Clustering is a technique often used in image segmentation. However, fragmentation may occur in region division by clustering. Fragmentation is a state in which pixels in the same class are not continuous in the coordinate space. When applying the region division result, it is preferable that no fragmentation occurs.

非特許文献1に記載の方式では、フラグメンテーションを解消するために、まず、同じクラスに属する連続した画素の領域サイズを算出する。そして、領域サイズが閾値未満であれば近傍のクラスにその領域を統合し、領域サイズが閾値以上であれば新たなクラスを割り当てることによってすべてのフラグメンテーションを解消するとしている。しかしながら、同じクラスに属する連続した画素の領域を抽出するために、ある画素とその近傍の画素とのクラス情報を順次比較する必要があるため、処理量が大きいという課題がある。   In the method described in Non-Patent Document 1, in order to eliminate fragmentation, first, the region size of consecutive pixels belonging to the same class is calculated. If the region size is less than the threshold, the region is integrated into a neighboring class, and if the region size is equal to or larger than the threshold, all the fragmentation is eliminated by assigning a new class. However, in order to extract the area | region of the continuous pixel which belongs to the same class, since it is necessary to compare sequentially the class information of a certain pixel and its vicinity pixel, there exists a subject that processing amount is large.

また、特許文献1に記載の方式では、線形状の小領域となっているフラグメンテーションについては解消することができる。しかしながら、解消する対象となるフラグメンテーションの形状が限定されており、一定以上の大きさのフラグメンテーションを解消できないという課題がある。   Further, the method described in Patent Document 1 can eliminate fragmentation that is a linear small region. However, the shape of fragmentation to be eliminated is limited, and there is a problem that fragmentation of a certain size or more cannot be eliminated.

さらに非特許文献2に記載の方式では、フラグメンテーションの発生を抑制することができるが、各入力データについて代表候補データとの距離計算時に、近傍の入力データが属するクラス情報を参照する必要がある。このため、処理量が大きいという課題がある。   Furthermore, in the method described in Non-Patent Document 2, the occurrence of fragmentation can be suppressed, but it is necessary to refer to class information to which neighboring input data belongs when calculating the distance between each input data and representative candidate data. For this reason, there exists a subject that processing amount is large.

本発明は前述の問題点に鑑み、属性が類似した複数の領域に画像を分割する際に、処理量を抑えてフラグメンテーションの発生を抑制できるようにすることを目的としている。   In view of the above-described problems, an object of the present invention is to suppress the generation of fragmentation by suppressing the processing amount when an image is divided into a plurality of regions having similar attributes.

本発明に係る画像処理装置は、画像中の複数の領域に対してそれぞれ代表データを設定する代表データ設定手段と、前記代表データとの座標、及び、色及びテクスチャのうちの少なくとも何れかに係る距離に基づいて、前記画像中のそれぞれの画素を前記複数の領域の中の何れかの代表データと関連付けるとともに、前記関連付けられた画素の集合に基づいて前記それぞれの代表データを更新し、前記更新された代表データとの前記距離に基づいて、前記画像中のそれぞれの画素を前記何れかの更新された代表データと関連付ける関連付け手段と、前記関連付け手段によって前記更新された代表データと関連付けされた画素の集合で構成された領域が座標空間上で連続している状態であるか否かを、前記領域に係る代表データから所定の範囲内の画素が関連付けされているパターンに基づいて判定する判定手段と、前記判定手段によって連続していない状態と判定された場合に、前記連続していないと判定された領域に係る代表データを含む領域において座標空間上で連続している状態に補正する補正手段とを有することを特徴とする。 An image processing apparatus according to the present invention relates to at least one of representative data setting means for setting representative data for each of a plurality of regions in an image, coordinates of the representative data, color, and texture. Based on the distance, each pixel in the image is associated with any representative data in the plurality of regions, and each representative data is updated based on the set of associated pixels, and the update An association means for associating each pixel in the image with any of the updated representative data based on the distance to the representative data, and a pixel associated with the updated representative data by the association means Whether or not an area constituted by a set of the following is a predetermined range from the representative data related to the area, whether or not the area is continuous in the coordinate space. Region comprising a determining means based on the pattern of pixels are associated, when it is determined that the state of non-contiguous by the determination unit, the representative data pertaining to the is determined not contiguous region And a correction means for correcting to a continuous state in the coordinate space.

本発明によれば、属性が類似した複数の領域に画像を分割する際に、処理量を抑えてフラグメンテーションの発生を抑制することができる。   According to the present invention, when an image is divided into a plurality of regions having similar attributes, the amount of processing can be suppressed and occurrence of fragmentation can be suppressed.

実施形態におけるクラスタリング処理の処理手順の一例を示すフローチャートである。It is a flowchart which shows an example of the process sequence of the clustering process in embodiment. 画像中のブロック及びその代表データを説明するための図である。It is a figure for demonstrating the block in an image, and its representative data. フラグメンテーションが発生している領域分割結果の一例を示す図である。It is a figure which shows an example of the area division | segmentation result in which fragmentation has generate | occur | produced. 実施形態におけるデータ処理装置のハードウェア構成例を示すブロック図である。It is a block diagram which shows the hardware structural example of the data processor in embodiment. フラグメンテーションが発生しているか否かを判定する手順を説明するための図である。It is a figure for demonstrating the procedure which determines whether fragmentation has generate | occur | produced.

以下、本発明の好適な実施形態について、図面を参照しながら詳細に説明する。本実施形態では、本発明による画像領域分割方法を用いて画像を領域分割する例について説明する。   DESCRIPTION OF EXEMPLARY EMBODIMENTS Hereinafter, preferred embodiments of the invention will be described in detail with reference to the drawings. In the present embodiment, an example in which an image is divided into regions using the image region dividing method according to the present invention will be described.

<データ処理装置の構成例>
図4は、本実施形態におけるクラスタリング方法を実現可能なデータ処理装置400のハードウェア構成例を示すブロック図である。
図4において、データ保存部401は、画像データを保持する記憶媒体である。データ保存部401は、ハードディスク、フレキシブルディスク、CD−ROM、CD−RやDVD、メモリーカード、CFカード、スマートメディア、SDカード、メモリスティック、xDピクチャーカード、USBメモリ等で構成される。また、データ保存部401には、画像データの他にも、プログラムやその他のデータを保存することも可能である。あるいは、後述するRAM406の一部をデータ保存部401として用いてもよい。さらに、後述する通信部402により接続した先の機器の記憶装置を、通信部402を介して利用するというように仮想的に構成するのであってもよい。
<Configuration example of data processing device>
FIG. 4 is a block diagram illustrating a hardware configuration example of the data processing apparatus 400 that can implement the clustering method according to the present embodiment.
In FIG. 4, a data storage unit 401 is a storage medium that holds image data. The data storage unit 401 includes a hard disk, flexible disk, CD-ROM, CD-R, DVD, memory card, CF card, smart media, SD card, memory stick, xD picture card, USB memory, and the like. In addition to image data, the data storage unit 401 can also store programs and other data. Alternatively, a part of the RAM 406 described later may be used as the data storage unit 401. Furthermore, a storage device of a destination device connected by the communication unit 402 described later may be virtually configured to be used via the communication unit 402.

表示部403は、領域分割処理を行う前後の画像を表示したり、GUI等の画像を表示したりする装置であり、一般的にはCRTや液晶ディスプレイなどが用いられる。あるいは、ケーブル等で接続された外部のディスプレイ装置であっても構わない。   The display unit 403 is a device that displays images before and after performing the area division processing, or displays an image such as a GUI, and generally uses a CRT, a liquid crystal display, or the like. Alternatively, it may be an external display device connected by a cable or the like.

CPU404は、本実施形態に係る主要な処理を実行すると共にデータ処理装置400全体の動作を制御する。ROM405及びRAM406は、その処理に必要なプログラム、データ、作業領域などをCPU404に提供する。後述する処理に必要なプログラムがデータ保存部401に格納されている場合や、ROM405に格納されている場合には、RAM406に一旦書き込まれてから後述する処理が実行される。また、通信部402を経由してデータ処理装置400がプログラムを受信する場合には、データ保存部401に一旦記録した後にRAM406に書き込まれるか、通信部402からRAM406に直接書き込まれてから処理が実行される。   The CPU 404 executes main processing according to the present embodiment and controls the overall operation of the data processing device 400. The ROM 405 and the RAM 406 provide the CPU 404 with programs, data, work areas, and the like necessary for the processing. When a program necessary for processing to be described later is stored in the data storage unit 401 or stored in the ROM 405, the processing described later is executed after being once written in the RAM 406. When the data processing apparatus 400 receives a program via the communication unit 402, the program is temporarily recorded in the data storage unit 401 and then written in the RAM 406 or directly from the communication unit 402 to the RAM 406. Executed.

CPU404は、RAM406またはデータ保存部401に書き込まれた画像データを読み出して本実施形態に係る画像処理(クラスタリング処理)を実行する。代表データ等の処理途中のデータはCPU404によりRAM406に書き込まれ、必要な場合に読み出される。そして、クラスタリングの処理結果がRAM406に書き込まれる。また、CPU404は、表示部403に画像を表示する制御を行ったり、通信部402を介して外部装置に画像データを送信する制御を行ったりする。   The CPU 404 reads image data written in the RAM 406 or the data storage unit 401 and executes image processing (clustering processing) according to the present embodiment. Data in the middle of processing such as representative data is written into the RAM 406 by the CPU 404 and is read out when necessary. Then, the clustering processing result is written in the RAM 406. Further, the CPU 404 performs control for displaying an image on the display unit 403, and performs control for transmitting image data to an external apparatus via the communication unit 402.

通信部402は、機器間の通信を行うためのI/Fである。I/Fとしては、例えば、公知のローカルエリアネットワーク、USB、IEEE1284、IEEE1394、電話回線などの有線による通信方式であってもよい。また、赤外線(IrDA)、IEEE802.11a、IEEE802.11b、IEEE802.11g、IEEE802.11n、Bluetooth(登録商標)、UWB(Ultra wide Band)等の無線通信方式であってもよい。   The communication unit 402 is an I / F for performing communication between devices. As the I / F, for example, a well-known local area network, USB, IEEE1284, IEEE1394, a wired communication system such as a telephone line may be used. Further, a wireless communication system such as infrared (IrDA), IEEE802.11a, IEEE802.11b, IEEE802.11g, IEEE802.11n, Bluetooth (registered trademark), or UWB (Ultra wide Band) may be used.

なお、図4に示す例では、データ保存部401、表示部403が全て1つの装置内に含まれるような例を示しているが、これらの部分が公知の通信方式による通信路で接続されており、全体としてこのような構成となっているのであっても構わない。また、図4に示す例においては、CPUが1つだけの構成であるが、CPUを複数設けるような構成にしてもよい。システム構成については、上記以外にも様々な構成要素が存在してもよいが、本発明の主眼ではないのでその説明は省略する。   In the example shown in FIG. 4, an example is shown in which the data storage unit 401 and the display unit 403 are all included in one device, but these parts are connected by a communication path using a known communication method. Therefore, the configuration as a whole may be used. Further, in the example shown in FIG. 4, the configuration has only one CPU, but a configuration in which a plurality of CPUs are provided may be employed. As for the system configuration, various components other than those described above may exist, but the description thereof is omitted because it is not the main point of the present invention.

以下、図4に示したデータ処理装置400が行う処理の概要について説明する。本実施形態では、クラスタリング結果に対して、各クラスの代表データの近傍にある入力データが属するクラスを参照する。そして、代表データと同じクラスに属する入力データの数に基づいてフラグメンテーションが発生しているかどうかを判定する。その結果、フラグメンテーションが発生している場合には解消処理を施す。   Hereinafter, an outline of processing performed by the data processing apparatus 400 illustrated in FIG. 4 will be described. In the present embodiment, the class to which the input data in the vicinity of the representative data of each class belongs is referred to the clustering result. Then, it is determined whether fragmentation has occurred based on the number of input data belonging to the same class as the representative data. As a result, when fragmentation has occurred, a cancellation process is performed.

<領域分割のためのクラスタリング>
図1(a)は、本実施形態におけるクラスタリング処理の処理手順の一例を示すフローチャートである。なお、図1(a)に示す各ステップはCPU404の動作を示すものとする。
まず、クラスタリング対象のデータについて説明する。以下の式(1)は第i番目の入力データを示す。入力データは画像中の画素と対応する5次元のベクトルであり、第i番目の入力データとは、画像をラスタスキャンして第i番目に読み出された画素に関する情報である。
i=(xi,1,xi,2,xi,3,xi,4,xi,5) ・・・(1)
<Clustering for region division>
FIG. 1A is a flowchart illustrating an example of a processing procedure of clustering processing in the present embodiment. Note that each step shown in FIG. 1A indicates the operation of the CPU 404.
First, clustering target data will be described. Equation (1) below shows the i-th input data. The input data is a five-dimensional vector corresponding to the pixel in the image, and the i-th input data is information regarding the i-th pixel read out by raster scanning the image.
X i = (x i, 1 , x i, 2 , x i, 3 , x i, 4 , x i, 5 ) (1)

式(1)中のxi,1、xi,2は二次元の座標空間上の位置を表し、それぞれ画像の縦方向、横方向の座標値を意味する。また、xi,3、xi,4、xi,5は画素の色成分を表わす三次元の色特徴である。 In formula (1), x i, 1 and x i, 2 represent positions in a two-dimensional coordinate space, and mean coordinate values in the vertical and horizontal directions of the image, respectively. X i, 3 , x i, 4 and x i, 5 are three-dimensional color features representing the color components of the pixels.

まず、ステップS101においては、初期化した代表データを生成する。具体的には、代表データ設定処理として、例えば図2に示した画像201を座標空間上のブロックに分割し、各々のブロック203の中に1個の代表データ205を設定する。そして、ブロック203内の入力データをランダムに選択し、選択した入力データの座標と色特徴とを要素とするベクトルをその代表データのベクトルとする。以下の式(2)は第j番目の代表データCjを示す。ここで、jとは、図2に示すように配置した代表データにラスター順に割り当てたクラスインデックスである。
j=(cj,1,cj,2,cj,3,cj,4,cj,5) ・・・(2)
First, in step S101, initialized representative data is generated. Specifically, as representative data setting processing, for example, the image 201 shown in FIG. 2 is divided into blocks on the coordinate space, and one representative data 205 is set in each block 203. Then, input data in the block 203 is selected at random, and a vector having the coordinates and color features of the selected input data as elements is set as a vector of the representative data. Equation (2) below shows the j-th representative data C j . Here, j is a class index assigned to the representative data arranged as shown in FIG. 2 in raster order.
C j = (c j, 1 , c j, 2 , c j, 3 , c j, 4 , c j, 5 ) (2)

式(2)中のcj,1、cj,2は二次元の座標空間上の位置を表し、それぞれ画像の縦方向、横方向の座標値を意味する。また、cj,3、cj,4、cj,5は画素の色成分を表わす三次元の色特徴である。 In equation (2), c j, 1 and c j, 2 represent positions in a two-dimensional coordinate space, and mean coordinate values in the vertical and horizontal directions of the image, respectively. Further, c j, 3 , c j, 4 , and c j, 5 are three-dimensional color features representing the color components of the pixels.

ステップS102において、最大繰り返し回数を設定し、ステップS103〜S111までの繰り返し計算のループを開始する。
ステップS103においては、入力データのループを開始する。画像の中の入力データXiの順番iを制御し、ステップS104からステップS109までの処理を繰り返して全ての入力データをクラスタリングする。
In step S102, the maximum number of iterations is set, and a loop of iteration calculation from steps S103 to S111 is started.
In step S103, an input data loop is started. The order i of the input data X i in the image is controlled, and the processing from step S104 to step S109 is repeated to cluster all the input data.

まず、ステップS104においては、探索範囲を設定する。具体的には、入力データの座標位置によって代表候補データの探索範囲を設定する。ここで、入力データの代表候補データとは、該当する入力データを割り当てる(帰属させる)代表データの候補である。   First, in step S104, a search range is set. Specifically, the search range for representative candidate data is set according to the coordinate position of the input data. Here, the representative candidate data of the input data is a candidate of representative data to which the corresponding input data is assigned (belongs to).

ここで、探索範囲202の幅および高さがそれぞれ5個の代表データの例について説明する。まず、処理対象の入力データ(以下、注目入力データ)206が含まれるブロックを中心に、代表候補データの探索範囲を設定する。この場合、探索範囲は5×5個の座標近傍の代表データである。探索範囲202は、縦方向が5〜9までであり、横方向が6〜10までである。図2に示す例の場合、1ラインあたりの代表データ数が15個であるため、探索範囲202に含まれるインデックスは、66〜70、81〜85、96〜100、111〜115、126〜130である。したがって、注目入力データ206を含め、ブロック204の範囲に入っている全ての入力データの探索範囲202は同じである。なお、入力データの位置と探索範囲の代表候補データとの関係は最初に固定され、繰り返し処理によって代表データの位置が変わっても、代表データのインデックスは変わらないものとする。   Here, an example of representative data in which the width and height of the search range 202 are each five will be described. First, a search range of representative candidate data is set around a block including input data to be processed (hereinafter referred to as attention input data) 206. In this case, the search range is representative data in the vicinity of 5 × 5 coordinates. The search range 202 has a vertical direction of 5 to 9, and a horizontal direction of 6 to 10. In the case of the example shown in FIG. 2, since the number of representative data per line is 15, the indexes included in the search range 202 are 66 to 70, 81 to 85, 96 to 100, 111 to 115, 126 to 130. It is. Therefore, the search range 202 of all input data included in the range of the block 204 including the target input data 206 is the same. It is assumed that the relationship between the position of the input data and the representative candidate data in the search range is fixed first, and the index of the representative data does not change even if the position of the representative data is changed by iterative processing.

ステップS105〜S107は、入力データの最近傍代表データを探索するステップである。ここで、最近傍代表データとは、入力データとの距離が最短な代表データ、即ち、距離空間上一番近い代表データである。各ステップにおける処理内容を説明する前に、本実施形態における入力データと代表候補データとの距離の計算方法について説明する。以下の式(3)は第i番目の入力データと第j番目の代表候補データとの間の距離D(Xi,Cj)を表す計算式である。
D(Xi,Cj)=W×Ds(Xi,Cj)+Dc(Xi,Cj)・・・(3)
Steps S105 to S107 are steps for searching the nearest representative data of the input data. Here, the nearest representative data is representative data having the shortest distance from the input data, that is, representative data closest in the distance space. Before describing the processing contents in each step, a method for calculating the distance between input data and representative candidate data in the present embodiment will be described. The following formula (3) is a calculation formula representing the distance D (X i , C j ) between the i-th input data and the j-th representative candidate data.
D (X i , C j ) = W × D s (X i , C j ) + D c (X i , C j ) (3)

式(3)中のDsは座標空間上の距離を表し、Dcは色空間上の距離を表す。Wは座標空間上の距離に対する重みである。式(3)に示すように、入力データと代表候補データとの間の距離Dは、座標空間上の距離Dsと色空間上の距離Dcの線形結合により算出される。以下、このように複数の部分距離から算出される距離のことを総合距離と呼ぶ。以下の式(4)及び式(5)は、それぞれ座標空間上の距離Ds、色空間上の距離Dcを算出する計算式である。本実施形態では、距離としてユークリッド距離を使用するが、これに限る訳ではない。 In the equation (3), D s represents a distance on the coordinate space, and D c represents a distance on the color space. W is a weight for the distance in the coordinate space. As shown in Expression (3), the distance D between the input data and the representative candidate data is calculated by linear combination of the distance D s on the coordinate space and the distance D c on the color space. Hereinafter, such a distance calculated from a plurality of partial distances is referred to as a total distance. The following formulas (4) and (5) are calculation formulas for calculating the distance D s in the coordinate space and the distance D c in the color space, respectively. In the present embodiment, the Euclidean distance is used as the distance, but the present invention is not limited to this.

Figure 0006587407
Figure 0006587407

ステップS105においては、代表候補データのループを開始する。代表候補データCjの順番jを順次更新し、全ての代表候補データを探索する。そして、ステップS106において、式(3)に従って第i番目の入力データと第j番目の代表候補データとの間の総合距離を算出する。ステップS107においては、全ての代表候補データとの総合距離の算出が完了したかどうかを判定する。この判定の結果、全ての代表候補データとの総合距離を算出した場合は、ステップS108に進み、代表候補データのループを終了する。一方、まだ総合距離を算出していない代表候補データがある場合は、ステップS106に戻り、次の代表候補データとの総合距離を計算する。 In step S105, a representative candidate data loop is started. The order j of the representative candidate data C j is sequentially updated to search for all representative candidate data. In step S106, the total distance between the i-th input data and the j-th representative candidate data is calculated according to equation (3). In step S107, it is determined whether or not the calculation of the total distance with all representative candidate data has been completed. As a result of the determination, if the total distance with all the representative candidate data is calculated, the process proceeds to step S108, and the representative candidate data loop is terminated. On the other hand, if there is representative candidate data for which the total distance has not yet been calculated, the process returns to step S106 to calculate the total distance with the next representative candidate data.

続いてステップS108においては、ステップS105〜S107のループで算出された総合距離の中から距離が最短であった代表候補データ(最近傍代表データ)のクラスに入力データを帰属(関連付け)させる。そして、ステップS109において、全ての入力データを処理したかどうかを判定する。この判定の結果、全ての入力データを処理した場合は、ステップS110に進み、入力データのループを終了する。一方、まだ処理していない入力データがある場合はステップS104に戻り、次の入力データの処理を開始する。   Subsequently, in step S108, the input data is attributed (associated) to the class of representative candidate data (nearest neighbor representative data) having the shortest distance from the total distance calculated in the loop of steps S105 to S107. In step S109, it is determined whether all input data has been processed. If all the input data is processed as a result of this determination, the process proceeds to step S110, and the input data loop is terminated. On the other hand, if there is input data that has not been processed yet, the process returns to step S104 to start processing the next input data.

ステップS110においては、各代表データに対して、帰属させた入力データのベクトルの平均ベクトルを計算する。そして、その平均ベクトルを該当代表データの新しいベクトルCjとし、代表データを更新する。そして、ステップS111において、最大繰り返し回数を超えるかどうか、又はクラスタリングの結果が収束したかどうかを判定する。この判定の結果、何れかの条件が成立する場合は、繰り返し計算を終了する。一方、いずれの条件も成立しない場合はステップS103に戻り、次の繰り返し計算を開始する。ここで、クラスタリング結果とは、各入力データが属するクラスインデックスを示すものである。本実施形態では、入力データと同様に2次元の画像形式であるものとする。 In step S110, an average vector of the assigned input data vectors is calculated for each representative data. Then, the average vector is set as a new vector C j of the corresponding representative data, and the representative data is updated. In step S111, it is determined whether or not the maximum number of repetitions has been exceeded, or whether or not the clustering result has converged. If any of the conditions is satisfied as a result of this determination, the iterative calculation is terminated. On the other hand, if neither condition is satisfied, the process returns to step S103 to start the next iterative calculation. Here, the clustering result indicates the class index to which each input data belongs. In the present embodiment, it is assumed that the input data has a two-dimensional image format.

次に、ステップS112において、クラスタリング結果を解析し、フラグメンテーションが発生したクラスに対してフラグメンテーション解消処理を施す。この処理の詳細については後述する。以上の処理が完了すると、CPU404は、フラグメンテーション解消後のクラスタリング結果(領域分割結果)を表示部403などに出力する。   Next, in step S112, the clustering result is analyzed, and fragmentation elimination processing is performed on the class in which fragmentation has occurred. Details of this processing will be described later. When the above processing is completed, the CPU 404 outputs the clustering result (region division result) after the fragmentation is eliminated to the display unit 403 or the like.

<フラグメンテーション検出&解消>
ここで、ステップS112の詳細な処理手順について、図1(b)を参照しながら説明する。図1(b)のステップS113〜S116では、各クラスに対してフラグメンテーションが発生しているかどうかを判定し、フラグメンテーションが発生したクラスに対して解消処理を適用する。
<Fragmentation detection &resolution>
Here, the detailed processing procedure of step S112 is demonstrated, referring FIG.1 (b). In steps S113 to S116 in FIG. 1B, it is determined whether or not fragmentation has occurred for each class, and the resolution processing is applied to the class in which fragmentation has occurred.

ここで、フラグメンテーションとは、同一クラスに属する入力データが座標空間上で連続していない状態のことである。図3は、フラグメンテーションが発生したクラスタリング結果の例を説明するための図である。図3において、各々の領域は、代表データに帰属する入力データの集合によって構成され、図3における各領域は、その領域内のクラスインデックスが同一であることを示す。領域301〜303、領域304〜307、領域308〜315、領域316〜317はそれぞれ同じクラスに属するが、座標空間上で分離している。   Here, fragmentation is a state in which input data belonging to the same class is not continuous in the coordinate space. FIG. 3 is a diagram for explaining an example of a clustering result in which fragmentation has occurred. In FIG. 3, each area is constituted by a set of input data belonging to the representative data, and each area in FIG. 3 indicates that the class index in the area is the same. The areas 301 to 303, the areas 304 to 307, the areas 308 to 315, and the areas 316 to 317 belong to the same class, but are separated on the coordinate space.

ステップS113においては、代表データのループを開始する。代表データCjの順番jを順次更新し、全ての代表データに対して以下のステップS114〜S115の処理を実行する。 In step S113, a representative data loop is started. The order j of the representative data C j is sequentially updated, and the following steps S114 to S115 are executed for all the representative data.

まず、ステップS114においては、第j番目のクラスに対してフラグメンテーションが発生しているかどうかを推定する。本実施形態では、代表データCjの近傍に同じクラスに属さない入力データが存在する場合に、フラグメンテーションが発生したと判定する。判定処理の詳細を以下に説明する。 First, in step S114, it is estimated whether fragmentation has occurred for the j-th class. In the present embodiment, it is determined that fragmentation has occurred when there is input data that does not belong to the same class in the vicinity of the representative data C j . Details of the determination process will be described below.

まず、第j番目の代表データの座標位置(cj,1、cj,2)を読み込む。また、代表データと同じクラスに属する入力データの数をカウントするためのカウンタを0に初期化する。次に、クラスタリング結果から、代表データの座標位置(cj,1、cj,2)を中心とする所定の範囲内(本実施形態では3×3の領域内)の座標位置(cj,1+αn,1、cj,2+αn,2)におけるクラスインデックスを読み込む。ここで、αn,1={−1,0,1}、αn,2={−1,0,1}であり、αn,1 2+αn,2 2≠0を満たすものとする。そして、読み込んだクラスインデックスの値がjであった場合に前記カウンタをインクリメントする。なお、参照する座標位置がクラスタリング結果の領域外であった場合は、クラスインデックスの比較処理をスキップする。 First, the coordinate position (c j, 1 , c j, 2 ) of the jth representative data is read. In addition, a counter for counting the number of input data belonging to the same class as the representative data is initialized to zero. Next, from the clustering result, the coordinate position (c j, 1 , within a predetermined range (in this embodiment, a 3 × 3 area) centered on the coordinate position (c j, 1 , c j, 2 ) of the representative data . 1 + α n, 1 , c j, 2 + α n, 2 ) is read. Here, α n, 1 = {− 1, 0 , 1 }, α n, 2 = {− 1 , 0 , 1 }, and α n, 1 2 + α n, 2 2 ≠ 0. . When the read class index value is j, the counter is incremented. If the coordinate position to be referred to is outside the clustering result area, the class index comparison process is skipped.

以上の処理をすべてのαn,1、αn,2に対して実行した後、カウンタの値が3×3=9であった場合は、フラグメンテーションは発生していないと判定する。一方、カウント値が9未満であった場合は、フラグメンテーションが発生したと判定する。つまり、代表データを中心とする3×3の領域内に1つでも代表データと異なるクラスに属する入力データが存在する場合にはフラグメンテーションが発生したと判定する。図5は、本実施形態におけるフラグメンテーションの有無の判定結果の例を示している。 After the above processing is executed for all α n, 1 and α n, 2, if the value of the counter is 3 × 3 = 9, it is determined that no fragmentation has occurred. On the other hand, if the count value is less than 9, it is determined that fragmentation has occurred. That is, it is determined that fragmentation has occurred when at least one input data belonging to a class different from the representative data exists in a 3 × 3 area centered on the representative data. FIG. 5 shows an example of the determination result of the presence or absence of fragmentation in the present embodiment.

以上のような手順でフラグメンテーションが発生していると判定された場合はステップS115に進み、フラグメンテーションが発生していないと判定された場合はステップS116に進む。   When it is determined that fragmentation has occurred in the above procedure, the process proceeds to step S115, and when it is determined that fragmentation has not occurred, the process proceeds to step S116.

ステップS115においては、フラグメンテーションを解消する補正処理を行う。本実施形態では、フラグメンテーションが発生したと判定されたクラスの近傍の領域に対して非特許文献1に記載の手法を適用することによりフラグメンテーションを解消する。詳細について以下に説明する。   In step S115, correction processing for eliminating fragmentation is performed. In the present embodiment, fragmentation is eliminated by applying the method described in Non-Patent Document 1 to a region in the vicinity of a class in which it is determined that fragmentation has occurred. Details will be described below.

まず、クラスタリング結果に対して、第j番目の代表データの座標位置(cj,1、cj,2)を中心とするN×Nサイズの領域を設定する。ここでNの値は、N×Nサイズの領域内に第j番目のクラスインデックスの入力データが十分に含まれるように設定する。本実施形態では、例えば図2に示した探索範囲202と同じサイズとなるようにNの値を設定する。 First, an N × N size region centered on the coordinate position (c j, 1 , c j, 2 ) of the j-th representative data is set for the clustering result. Here, the value of N is set so that the input data of the jth class index is sufficiently included in the N × N size area. In this embodiment, for example, the value of N is set so as to be the same size as the search range 202 shown in FIG.

そして、N×Nサイズの領域に対して次のように非特許文献1に記載の手法を適用してフラグメンテーションを解消する。まず、同じクラスインデックスが連続する領域サイズを算出する。そして、領域サイズが閾値未満である場合にはその領域内のクラスインデックスを近傍のクラスインデックスに変更する。一方、領域サイズが閾値以上である場合には新たなクラスインデックスを割り当てる。   Then, the method described in Non-Patent Document 1 is applied to the N × N size area as follows to eliminate fragmentation. First, a region size in which the same class index continues is calculated. If the area size is smaller than the threshold value, the class index in the area is changed to a nearby class index. On the other hand, if the area size is greater than or equal to the threshold, a new class index is assigned.

ステップS116においては、全ての代表データについてステップS114〜S115の処理を実行したかどうかを判定する。この判定の結果、全ての代表データについて処理を実行した場合は処理を終了する。一方、まだ処理していない代表データが存在する場合はステップS114に戻り、次の代表データに対して処理を開始する。   In step S116, it is determined whether or not the processing in steps S114 to S115 has been executed for all representative data. If the result of this determination is that processing has been performed for all representative data, the processing ends. On the other hand, if there is representative data that has not yet been processed, the process returns to step S114 to start processing for the next representative data.

以上説明したように本実施形態によれば、代表データの近傍に1つでも代表データと異なるクラスに属する入力データが存在する場合にフラグメンテーションが発生したと判定するようにした。そして、このような場合には、その近傍の領域に対してのみフラグメンテーション解消処理を実行するようにした。このようにフラグメンテーションの有無の判定処理は代表データの近傍の入力データのクラスを参照するのみであるため処理量を小さくすることができる。また、フラグメンテーション解消処理を実行する領域が限定されるため、画像全体にフラグメンテーション解消処理を施すよりも処理量が低減される。さらに、フラグメンテーションを解消する処理を行うことにより、出力結果として、フラグメンテーションの発生を抑制することができる。   As described above, according to the present embodiment, it is determined that fragmentation has occurred when at least one input data belonging to a class different from the representative data exists in the vicinity of the representative data. In such a case, the fragmentation elimination process is executed only for the neighboring area. As described above, since the determination process for the presence or absence of fragmentation only refers to the class of input data in the vicinity of the representative data, the processing amount can be reduced. In addition, since the region for executing the fragmentation elimination process is limited, the processing amount is reduced as compared with the case where the fragmentation elimination process is performed on the entire image. Furthermore, by performing a process for eliminating fragmentation, the generation of fragmentation can be suppressed as an output result.

(その他の実施形態)
前述した実施形態において、図1のステップS114においては、代表データの近傍として代表データを中心とする3×3サイズの領域を設定したが、これに限る訳ではない。例えば任意のサイズの矩形領域であってもよく、代表データを中心とする半径r(r≧1)の円形領域であってもよい。
(Other embodiments)
In the embodiment described above, in step S114 of FIG. 1, a 3 × 3 size area centered on the representative data is set as the vicinity of the representative data, but the present invention is not limited to this. For example, it may be a rectangular area having an arbitrary size or a circular area having a radius r (r ≧ 1) with the representative data as the center.

また、図1のステップS114においては、代表データの近傍に代表データと異なるクラスインデックスの入力データが1つでも存在する場合にフラグメンテーションが発生していると判定したが、これに限る訳ではない。例えば代表データの近傍の入力データのうち、代表データと同じクラスインデックスの入力データの数をカウントする。そして、カウント値が閾値以上であった場合にフラグメンテーションが発生していないと判定し、カウント値が閾値未満であった場合にフラグメンテーションが発生したと判定してもよい。   Further, in step S114 of FIG. 1, it is determined that fragmentation has occurred when at least one input data having a class index different from the representative data exists in the vicinity of the representative data. However, the present invention is not limited to this. For example, among the input data in the vicinity of the representative data, the number of input data having the same class index as the representative data is counted. Then, it may be determined that fragmentation has not occurred when the count value is equal to or greater than the threshold value, and it may be determined that fragmentation has occurred when the count value is less than the threshold value.

また、代表データの近傍のクラスインデックスのうち、代表データと同じクラスインデックスではなく、代表データと異なるクラスインデックスの入力データの数をカウントしてもよい。さらには、クラスインデックスのパターンを予め指定し、代表データの近傍のクラスインデックスのパターン(関連付けされているパターン)が予め指定したパターンと類似する場合にフラグメンテーションが発生したと判定してもよい。   In addition, among the class indexes in the vicinity of the representative data, the number of input data having a class index different from the representative data may be counted instead of the same class index as the representative data. Furthermore, a class index pattern may be designated in advance, and it may be determined that fragmentation has occurred when the class index pattern (associated pattern) in the vicinity of the representative data is similar to the pattern designated in advance.

また、フラグメンテーションが発生している場合と発生していない場合との代表データの近傍のクラスインデックスのパターンを学習データとし、フラグメンテーションが発生しているかどうかを判定する2クラス識別モデルを予め学習してもよい。この場合、識別モデルとしては、例えば非特許文献3に記載のSVM(Support Vector Machine)を用いる。   In addition, a class index pattern in the vicinity of representative data when fragmentation occurs and when it does not occur is used as learning data, and a two-class identification model for determining whether fragmentation has occurred is learned in advance. Also good. In this case, as the identification model, for example, SVM (Support Vector Machine) described in Non-Patent Document 3 is used.

前述した実施形態の図1のステップS114においては、フラグメンテーションが発生しているか否かの2値を決定したが、フラグメンテーションが発生している確率を算出してもよい。この場合、例えば、代表データの近傍のクラスインデックスのうち、代表データと同じクラスインデックスの数に応じて確率を算出する。または、代表データの近傍のクラスインデックスのパターンを学習データとして確率的識別モデルを学習する。このとき、確率的識別モデルとしては、例えば非特許文献4に記載のロジスティック回帰を使用する。   In step S114 of FIG. 1 of the above-described embodiment, the binary value indicating whether or not fragmentation has occurred is determined, but the probability that fragmentation has occurred may be calculated. In this case, for example, the probability is calculated according to the number of class indexes that are the same as the representative data among the class indexes in the vicinity of the representative data. Alternatively, the probabilistic identification model is learned using the pattern of the class index near the representative data as learning data. At this time, for example, logistic regression described in Non-Patent Document 4 is used as the probabilistic identification model.

前述した実施形態の図1のステップS115においては、フラグメンテーション解消処理として非特許文献1の手法を適用するとしたが、これに限る訳ではない。例えばフラグメンテーションが発生したと判定されたクラスの代表データの周辺に新たな代表データを配置して再度クラスタリング処理を実行してもよい。このように代表データの数が増加することにより、フラグメンテーションが発生したクラスの各領域において異なる代表データに割り当てられ、フラグメンテーションが解消されるものと期待できる。   In step S115 of FIG. 1 of the above-described embodiment, the technique of Non-Patent Document 1 is applied as the fragmentation elimination process, but the present invention is not limited to this. For example, new representative data may be arranged around the representative data of the class determined to have fragmentation, and the clustering process may be executed again. By increasing the number of representative data in this way, it can be expected that fragmentation is eliminated by allocating to different representative data in each region of the class where fragmentation occurs.

前述した実施形態においては、入力データの座標空間上の位置をxi1,xi2の二次元で表したが、これに限る訳ではなく、任意の次元の座標であってもよい。また、入力データの色特徴をxi3、xi4、xi5の三次元で表したが、色特徴に限る訳ではなく、テクスチャ特徴やテクスチャ特徴と色特徴とを複合した特徴量であってもよい。また、特徴量の次元は三次元に限定される訳でなく、任意の次元であってもよい。 In the embodiment described above, the position of the input data in the coordinate space is represented by two dimensions x i1 and x i2 , but the present invention is not limited to this, and coordinates of an arbitrary dimension may be used. In addition, although the color features of the input data are represented in three dimensions x i3 , x i4 , and x i5 , they are not limited to color features, but may be texture features or a feature amount that combines texture features and color features. Good. Further, the dimension of the feature amount is not limited to three dimensions, and may be an arbitrary dimension.

また、前述の実施形態では、探索範囲202が幅及び高さがそれぞれ5個の代表データの例について説明したが、探索範囲の幅は5個の代表データに限定される訳でなく、任意の探索範囲であってもよい。   In the above-described embodiment, an example in which the search range 202 has five widths and heights of representative data has been described. However, the width of the search range is not limited to five representative data, and is arbitrary. It may be a search range.

(その他の実施形態)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
(Other embodiments)
The present invention supplies a program that realizes one or more functions of the above-described embodiments to a system or apparatus via a network or a storage medium, and one or more processors in a computer of the system or apparatus read and execute the program It is also possible to implement this process. It can also be realized by a circuit (for example, ASIC) that realizes one or more functions.

401 データ保存部
404 CPU
401 Data storage unit 404 CPU

Claims (8)

画像中の複数の領域に対してそれぞれ代表データを設定する代表データ設定手段と、
前記代表データとの座標、及び、色及びテクスチャのうちの少なくとも何れかに係る距離に基づいて、前記画像中のそれぞれの画素を前記複数の領域の中の何れかの代表データと関連付けるとともに、前記関連付けられた画素の集合に基づいて前記それぞれの代表データを更新し、前記更新された代表データとの前記距離に基づいて、前記画像中のそれぞれの画素を前記何れかの更新された代表データと関連付ける関連付け手段と、
前記関連付け手段によって前記更新された代表データと関連付けされた画素の集合で構成された領域が座標空間上で連続している状態であるか否かを、前記領域に係る代表データから所定の範囲内の画素が関連付けされているパターンに基づいて判定する判定手段と、
前記判定手段によって連続していない状態と判定された場合に、前記連続していないと判定された領域に係る代表データを含む領域において座標空間上で連続している状態に補正する補正手段とを有することを特徴とする画像処理装置。
Representative data setting means for setting representative data for each of a plurality of regions in the image;
Associating each pixel in the image with any representative data in the plurality of regions based on coordinates with the representative data and a distance relating to at least one of color and texture, and Updating each of the representative data based on a set of associated pixels, and, based on the distance from the updated representative data, replacing each of the pixels in the image with any of the updated representative data; An association means to associate;
Whether or not an area constituted by a set of pixels associated with the updated representative data by the associating means is continuous in the coordinate space is within a predetermined range from the representative data related to the area. Determining means for determining based on a pattern associated with the pixels;
Correction means for correcting to a state of being continuous on a coordinate space in a region including representative data relating to the region determined to be non-continuous when the determination unit determines that the state is not continuous. An image processing apparatus comprising:
前記判定手段は、前記領域に係る代表データから所定の範囲内の画素のうち、前記領域に係る代表データと関連付けされている画素の数に基づいて、座標空間上で連続している状態であるか否かを判定することを特徴とする請求項1に記載の画像処理装置。   The determination unit is in a state of being continuous in the coordinate space based on the number of pixels associated with the representative data related to the region among the pixels within a predetermined range from the representative data related to the region. The image processing apparatus according to claim 1, wherein the image processing apparatus determines whether or not the image processing is in progress. 前記判定手段は、前記領域に係る代表データから所定の範囲内のすべての画素が前記領域に係る代表データと関連付けされている画素である場合に、座標空間上で連続している状態であると判定することを特徴とする請求項2に記載の画像処理装置。   The determination means is a state in which all pixels within a predetermined range from the representative data related to the area are pixels associated with the representative data related to the area and are continuous on the coordinate space. The image processing apparatus according to claim 2, wherein the determination is performed. 前記判定手段は、前記領域に係る代表データから所定の範囲内の画素における前記領域に係る代表データと関連付けされている画素の数が閾値以上である場合に、座標空間上で連続している状態であると判定することを特徴とする請求項2に記載の画像処理装置。   When the number of pixels associated with the representative data related to the region in the pixels within a predetermined range from the representative data related to the region is greater than or equal to a threshold value, the determination unit is continuous in the coordinate space The image processing apparatus according to claim 2, wherein it is determined that 前記判定手段は、予め学習された識別モデルを用いて座標空間上で連続している状態であるか否かを判定することを特徴とする請求項に記載の画像処理装置。 The image processing apparatus according to claim 1 , wherein the determination unit determines whether or not the state is continuous in a coordinate space by using an identification model learned in advance. 前記代表データから所定の範囲とは、前記代表データを中心とした矩形または円形の領域であることを特徴とする請求項1〜の何れか1項に記載の画像処理装置。 Wherein the predetermined range from the representative data, an image processing apparatus according to any one of claim 1 to 5, characterized in that the representative data is a rectangular or circular area centering on. 画像中の複数の領域に対してそれぞれ代表データを設定する代表データ設定工程と、
前記代表データとの座標、及び、色及びテクスチャのうちの少なくとも何れかに係る距離に基づいて、前記画像中のそれぞれの画素を前記複数の領域の中の何れかの代表データと関連付けるとともに、前記関連付けられた画素の集合に基づいて前記それぞれの代表データを更新し、前記更新された代表データとの前記距離に基づいて、前記画像中のそれぞれの画素を前記何れかの更新された代表データと関連付ける関連付け工程と、
前記関連付け工程において前記更新された代表データと関連付けされた画素の集合で構成された領域が座標空間上で連続している状態であるか否かを、前記領域に係る代表データから所定の範囲内の画素が関連付けされているパターンに基づいて判定する判定工程と、
前記判定工程において連続していない状態と判定された場合に、前記連続していないと判定された領域に係る代表データを含む領域において座標空間上で連続している状態に補正する補正工程とを有することを特徴とする画像処理方法。
A representative data setting step for setting representative data for each of a plurality of regions in the image;
Associating each pixel in the image with any representative data in the plurality of regions based on coordinates with the representative data and a distance relating to at least one of color and texture, and Updating each of the representative data based on a set of associated pixels, and, based on the distance from the updated representative data, replacing each of the pixels in the image with any of the updated representative data; An association step to associate;
Whether or not an area composed of a set of pixels associated with the updated representative data in the association step is continuous in a coordinate space within a predetermined range from the representative data related to the area A determination step for determining based on a pattern associated with the pixels of
When it is determined that the state is not continuous in the determination step, a correction step for correcting the state including the representative data related to the region determined not to be continuous to a state continuous on the coordinate space; An image processing method comprising:
画像中の複数の領域に対してそれぞれ代表データを設定する代表データ設定工程と、
前記代表データとの座標、及び、色及びテクスチャのうちの少なくとも何れかに係る距離に基づいて、前記画像中のそれぞれの画素を前記複数の領域の中の何れかの代表データと関連付けるとともに、前記関連付けられた画素の集合に基づいて前記それぞれの代表データを更新し、前記更新された代表データとの前記距離に基づいて、前記画像中のそれぞれの画素を前記何れかの更新された代表データと関連付ける関連付け工程と、
前記関連付け工程において前記更新された代表データと関連付けされた画素の集合で構成された領域が座標空間上で連続している状態であるか否かを、前記領域に係る代表データから所定の範囲内の画素が関連付けされているパターンに基づいて判定する判定工程と、
前記判定工程において連続していない状態と判定された場合に、前記連続していないと判定された領域に係る代表データを含む領域において座標空間上で連続している状態に補正する補正工程とをコンピュータに実行させることを特徴とするプログラム。
A representative data setting step for setting representative data for each of a plurality of regions in the image;
Associating each pixel in the image with any representative data in the plurality of regions based on coordinates with the representative data and a distance relating to at least one of color and texture, and Updating each of the representative data based on a set of associated pixels, and, based on the distance from the updated representative data, replacing each of the pixels in the image with any of the updated representative data; An association step to associate;
Whether or not an area composed of a set of pixels associated with the updated representative data in the association step is continuous in a coordinate space within a predetermined range from the representative data related to the area A determination step for determining based on a pattern associated with the pixels of
When it is determined that the state is not continuous in the determination step, a correction step for correcting the state including the representative data related to the region determined not to be continuous to a state continuous on the coordinate space; A program characterized by being executed by a computer.
JP2015075224A 2015-04-01 2015-04-01 Image processing apparatus, image processing method, and program Active JP6587407B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015075224A JP6587407B2 (en) 2015-04-01 2015-04-01 Image processing apparatus, image processing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015075224A JP6587407B2 (en) 2015-04-01 2015-04-01 Image processing apparatus, image processing method, and program

Publications (2)

Publication Number Publication Date
JP2016194861A JP2016194861A (en) 2016-11-17
JP6587407B2 true JP6587407B2 (en) 2019-10-09

Family

ID=57323568

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015075224A Active JP6587407B2 (en) 2015-04-01 2015-04-01 Image processing apparatus, image processing method, and program

Country Status (1)

Country Link
JP (1) JP6587407B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2025163767A1 (en) * 2024-01-30 2025-08-07 Ntt株式会社 Determination device

Also Published As

Publication number Publication date
JP2016194861A (en) 2016-11-17

Similar Documents

Publication Publication Date Title
US10885365B2 (en) Method and apparatus for detecting object keypoint, and electronic device
US10769473B2 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
EP3295424B1 (en) Systems and methods for reducing a plurality of bounding regions
US10395136B2 (en) Image processing apparatus, image processing method, and recording medium
CN110088805B (en) Method for detecting and segmenting multiple foreground objects
CN110705709A (en) Method and apparatus for training graph neural network model
JP6287855B2 (en) Image processing apparatus and image processing method
US20170178348A1 (en) Image Alignment Method and Apparatus
KR102047953B1 (en) Method and System for Recognizing Faces
JP2023159216A (en) Image processing device, image processing method, program
JP2015001982A (en) Image similarity determination device and method, and image feature acquisition device and method
JP6271937B2 (en) Image processing method and apparatus, and program
US20240062048A1 (en) Learning device, learning method, and storage medium
JP6305856B2 (en) Image processing apparatus, image processing method, and program
KR101296734B1 (en) Method for object segmentation by combination of gaussian mixture model and rgb clustering
KR20240121054A (en) Method and apparatus for training a defect detection model
JP5894492B2 (en) Image processing apparatus, image search apparatus, and program
JP6587407B2 (en) Image processing apparatus, image processing method, and program
JP5560925B2 (en) 3D shape search device, 3D shape search method, and program
JP2006501530A (en) Handling boundary information for graphical objects
JP2016194862A (en) Image processing apparatus, image processing method, and program
JP6418841B2 (en) Data processing method and data processing apparatus
CN116823761A (en) Information processing methods, devices, equipment and storage media based on cell segmentation
JP7770837B2 (en) Information processing device, information processing method, and program
JP6468897B2 (en) Image processing apparatus, image processing method, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180330

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190404

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190416

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190612

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190813

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190910

R151 Written notification of patent or utility model registration

Ref document number: 6587407

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151