Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP6678445B2 - Quantizer and operation method of quantizer - Google Patents
[go: Go Back, main page]

JP6678445B2 - Quantizer and operation method of quantizer - Google Patents

Quantizer and operation method of quantizer Download PDF

Info

Publication number
JP6678445B2
JP6678445B2 JP2015247106A JP2015247106A JP6678445B2 JP 6678445 B2 JP6678445 B2 JP 6678445B2 JP 2015247106 A JP2015247106 A JP 2015247106A JP 2015247106 A JP2015247106 A JP 2015247106A JP 6678445 B2 JP6678445 B2 JP 6678445B2
Authority
JP
Japan
Prior art keywords
inclusion
determination
vector data
cluster
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015247106A
Other languages
Japanese (ja)
Other versions
JP2017111710A (en
Inventor
岩崎 雅二郎
雅二郎 岩崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2015247106A priority Critical patent/JP6678445B2/en
Publication of JP2017111710A publication Critical patent/JP2017111710A/en
Application granted granted Critical
Publication of JP6678445B2 publication Critical patent/JP6678445B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Description

本発明は、多次元のベクトルデータをベクトル空間内でクラスタリングして保持する技術に関する。   The present invention relates to a technique for clustering and holding multidimensional vector data in a vector space.

例えば、類似画像検索などの画像認識(あるいは画像照合)技術において、近年BoVW(Bag of Visual Words)という手法が用いられるようになっている。この手法は、母集団となる複数の画像(学習画像という)から抽出される多次元のベクトルデータである局所特徴量をクラスタリング(個々のクラスターをビジュアルワード、Visual Words= VWと称する。)し所定のベクトル空間領域を割り当てて保持しておくとともに、認識すべき画像が有する局所特徴量がいずれのクラスターに属しているか、ないしは属していないか、さらには属しているとした場合にそのクラスターに属する局所特徴量の出現数(出現頻度)はいくつか、などに基づき認識画像と類似する画像を母集団中にて特定する手法である。このように多次元データである局所特徴量を量子化することで画像認識などを高速で処理することができる。   For example, in image recognition (or image collation) technology such as similar image search, a method called BoVW (Bag of Visual Words) has recently been used. In this method, a local feature amount, which is multidimensional vector data extracted from a plurality of images (referred to as learning images) serving as a population, is clustered (each cluster is referred to as a visual word, and Visual Words = VW). Vector space region is allocated and held, and if the local feature of the image to be recognized belongs to or does not belong to any cluster, and if it belongs to the cluster, it belongs to that cluster This is a method of specifying an image similar to the recognition image in a population based on the number of appearances (appearance frequencies) of local feature amounts. By quantizing the local feature amount, which is multidimensional data, image recognition and the like can be processed at high speed.

ここで画像認識の精度は、各クラスターに割り当てられるベクトル空間領域の広狭に依存する傾向がある。広すぎる場合には非類似と認識すべき画像を類似画像として抽出するおそれがあり、狭すぎる場合には類似と認識すべき画像を非類似画像と判断してしまうおそれがある。そのため、クラスタリングによる各領域を適正な所定範囲に収めるため、新たにビジュアルワードを登録する際には、既登録の各ビジュアルワードを検索し局所特徴量において同一ないし所定範囲内に近接する局所特徴量については新たなビジュアルワードとして登録しない処理を行う(特許文献1)。   Here, the accuracy of image recognition tends to depend on the size of the vector space area allocated to each cluster. If it is too wide, an image to be recognized as dissimilar may be extracted as a similar image, and if it is too narrow, an image to be recognized as similar may be determined as a dissimilar image. Therefore, when registering a new visual word in order to keep each area by clustering within an appropriate predetermined range, each registered visual word is searched, and a local feature amount that is the same or close to a predetermined range in the local feature amount is searched. Is not registered as a new visual word (Patent Document 1).

特開2015−22466号公報JP 2015-22466 A

前述のようなビジュアルワードの新規登録処理を進めていくことで各クラスターが所定の領域を有しつつベクトル空間領域がそれら各クラスターにより埋められていく。それに伴い、学習画像から抽出された局所特徴量が新たなビジュアルワードとして登録される頻度が低下していく。ビジュアルワードの登録数が充足してもなお新たにビジュアルワードとして登録するための処理を継続することは無駄である。   By proceeding with the new registration processing of the visual word as described above, the vector space area is filled with each cluster while each cluster has a predetermined area. Accordingly, the frequency of local feature amounts extracted from the learning image being registered as new visual words decreases. It is useless to continue the process for registering a new visual word even if the number of registered visual words is satisfied.

例示したように、画像や音声などの対象から抽出した多次元のベクトルデータにより対象の解析や認識などを行うにあたり、ベクトル空間における各クラスターの登録を所定条件の下、停止するように構成し、新たにクラスターを登録するための処理が無用に継続することを抑制することが望ましい。   As exemplified, when performing analysis or recognition of an object using multidimensional vector data extracted from an object such as an image or a sound, the registration of each cluster in a vector space is stopped under a predetermined condition, It is desirable to suppress unnecessary processing for registering a new cluster.

そこで、上記課題を解決するために本発明において、以下の量子化装置などを提供する。すなわち、多次元ベクトルデータを取得するベクトルデータ取得部と、近傍にある多次元ベクトルデータどうしをクラスター化したベクトル空間における領域を複数保持するためのクラスター保持部と、取得した多次元ベクトルデータがいずれかの領域に含まれるか判断する包含判断部と、包含判断部での判断結果が包含されないとの判断結果である場合には取得した多次元ベクトルデータに基づいて新たな領域をクラスター保持部に登録するクラスター登録部と、包含判断部での判断結果が包含されるとの判断結果である場合にはその履歴である包含判断結果履歴を記録する包含判断結果履歴記録部と、包含判断結果記録部での包含判断結果履歴が領域の新規登録を中止する所定の条件を満たすか判断する中止判断部と、中止判断部での判断結果が所定の条件を満たすとの判断結果である場合にはクラスター登録部での新規の登録を中止するようにクラスター登録部を制御する中止制御部と、を有する量子化装置などを提供する。   Therefore, in order to solve the above problem, the present invention provides the following quantization device and the like. That is, the vector data acquisition unit for acquiring multidimensional vector data, the cluster holding unit for holding a plurality of areas in the vector space in which neighboring multidimensional vector data are clustered, and the acquired multidimensional vector data The inclusion determination unit that determines whether the region is included in the region, and if the determination result by the inclusion determination unit is not included, a new region is stored in the cluster holding unit based on the acquired multidimensional vector data. A cluster registration unit to be registered, an inclusion determination result history recording unit that records an inclusion determination result history that is a history of a determination result that the determination result by the inclusion determination unit is included, and an inclusion determination result record And a stop judging unit for judging whether the inclusion judgment result history in the unit satisfies a predetermined condition for stopping the new registration of the area. Results provide such quantizer having a stop control unit for controlling the cluster registration unit to stop a new registration of a cluster registration unit when a determination result of the predetermined condition is satisfied.

本発明によれば、登録のために抽出した多次元ベクトルデータが既存のベクトル空間における領域に含まれるか否かの判断結果の履歴に基づき、新規にベクトル空間内の領域を登録する処理を中止することでき、新規登録のための処理を無用に行い続けることを抑制することができる。   According to the present invention, a process of newly registering a region in a vector space is stopped based on a history of determination results on whether or not multidimensional vector data extracted for registration is included in a region in an existing vector space. It is possible to prevent the process for new registration from being performed unnecessarily.

本量子化装置の機能的構成の一例を示すブロック図FIG. 2 is a block diagram illustrating an example of a functional configuration of the quantization device. 認識対象画像から抽出される局所特徴量の一例を示す概念図Conceptual diagram showing an example of local features extracted from a recognition target image ベクトル空間における領域を登録する処理の一例を示す概念図Conceptual diagram showing an example of processing for registering an area in a vector space 包含判断結果履歴の一例を示す図Diagram showing an example of the inclusion determination result history 包含判断結果履歴の一例を示す図Diagram showing an example of the inclusion determination result history 本量子化装置のハードウェア構成の一例を表す概略図Schematic diagram illustrating an example of a hardware configuration of the quantization device 本量子化装置における処理の流れの一例を表すフロー図Flow chart showing an example of the flow of processing in the present quantization device

以下、本発明の実施の形態について、添付図面を用いて説明する。なお、本発明は、これら実施形態に何ら限定されるべきものではなく、その要旨を逸脱しない範囲において、種々なる態様で実施し得る。
<実施形態>
<概要>
Hereinafter, embodiments of the present invention will be described with reference to the accompanying drawings. It should be noted that the present invention is not limited to these embodiments at all, and can be implemented in various modes without departing from the gist thereof.
<Embodiment>
<Overview>

本実施形態の量子化装置は、登録のために抽出した多次元ベクトルデータがベクトル空間においてすでにクラスタリングされた領域に含まれるか否かの判断結果の履歴に基づき、新規にクラスターを登録する処理を中止することを特徴とする。かかる構成によりクラスターの新規登録のための処理を無用に行い続けることを抑制することができる。
<構成>
The quantization device according to the present embodiment performs a process of registering a new cluster based on a history of determination results as to whether or not the multidimensional vector data extracted for registration is included in a region already clustered in the vector space. It is characterized by stopping. With this configuration, it is possible to prevent the process for newly registering the cluster from being performed unnecessarily.
<Structure>

図1は、本実施形態の量子化装置の機能ブロックの一例を示すブロック図である。なお、以下に記載する本装置の機能ブロックは、ハードウェア及びソフトウェアの組み合わせとして実現され得る。具体的には、コンピュータを利用するものであれば、CPU(中央演算装置)や主メモリ、システムバス、あるいは二次記憶装置(ハードディスクドライブや不揮発性メモリ、CDやDVDなどの記憶メディアとそれらメディアの読取ドライブなど)、情報入力に利用される入力デバイス、表示装置、その他の外部周辺装置などのハードウェア構成部、またその外部周辺装置用のインターフェース、通信用インターフェース、それらハードウェアを制御するためのドライバプログラムやその他アプリケーションプログラム、ユーザ・インターフェース用アプリケーションなどが挙げられる。   FIG. 1 is a block diagram illustrating an example of functional blocks of the quantization device according to the present embodiment. The functional blocks of the present apparatus described below can be realized as a combination of hardware and software. Specifically, if a computer is used, a CPU (Central Processing Unit), a main memory, a system bus, or a secondary storage device (a hard disk drive, a non-volatile memory, a storage medium such as a CD or a DVD, and such a medium) Read drive, etc.), input devices used for information input, display devices, and other external peripheral devices, such as hardware components, interfaces for the external peripheral devices, communication interfaces, and control of these hardware Driver programs, other application programs, user interface applications, and the like.

そして主メモリ上に展開したプログラムに従ったCPUの演算処理によって、入力デバイスやその他インターフェースなどから入力され、メモリやハードディスク上に保持されているデータなどが加工、蓄積されたり、上記各ハードウェアやソフトウェアを制御するための命令が生成されたりする。あるいは本装置の機能ブロックは専用ハードウェアによって実現されてもよい。また、本装置は一つのハードウェアやソフトウェアにより構成される場合に限られず、複数のハードウェアやソフトウェアの組み合わせによって構成されてもよく、ネットワークを介在したサーバ装置を含んで構成されてもよい。   Then, by arithmetic processing of the CPU in accordance with the program developed on the main memory, data input from an input device or other interfaces and stored in the memory or the hard disk are processed and accumulated, and the above-described hardware, Instructions for controlling software are generated. Alternatively, the functional blocks of the present device may be realized by dedicated hardware. Further, the present apparatus is not limited to the case where the apparatus is configured by one piece of hardware or software, and may be configured by a combination of a plurality of pieces of hardware or software, or may be configured to include a server apparatus via a network.

また、この発明は装置として実現できるのみでなく、方法としても実現可能である。また、このような発明の一部をソフトウェアとして構成することができる。さらに、そのようなソフトウェアをコンピュータに実行させるために用いるプログラム、及びプログラムを固定した記録媒体も、当然にこの発明の技術的な範囲に含まれる(本明細書の全体を通じて同様である)。   The present invention can be realized not only as an apparatus but also as a method. Further, a part of the invention can be configured as software. Further, a program used for causing a computer to execute such software, and a recording medium on which the program is fixed are naturally included in the technical scope of the present invention (the same applies throughout the present specification).

図1に示すように、本実施形態の量子化装置0100は、ベクトルデータ取得部0101と、クラスター保持部0102と、包含判断部0103と、クラスター登録部0104と、包含判断結果履歴記録部0105、中止判断部0106と、中止制御部0107とを有する。   As shown in FIG. 1, the quantization apparatus 0100 of the present embodiment includes a vector data acquisition unit 0101, a cluster holding unit 0102, an inclusion determination unit 0103, a cluster registration unit 0104, an inclusion determination result history recording unit 0105, It has a suspension determination unit 0106 and a suspension control unit 0107.

ベクトルデータ取得部0101は、多次元ベクトルデータを取得する機能を有する。多次元データを取得する対象としては、例えば、画像や音声の特徴量、水位や潮位、地震動(地面の動き)、大気中のCOやPM2.5の濃度分布など数値で表現されるものすべてである。また、多次元データの例としては、画像を対象として取得することができる局所特徴量などがある。 The vector data acquisition unit 0101 has a function of acquiring multidimensional vector data. The subject of acquiring multidimensional data, for example, feature quantity of the image and sound, the water level or tide, ground motion (movement of the ground), all that is expressed by numerical values such as density distribution of CO 2 and PM2.5 atmospheric It is. An example of the multidimensional data is a local feature that can be acquired for an image.

画像における局所特徴量は、対象に応じて種々に定義され、あるいは対象の解析や認識をする者により任意に定義され得る特徴領域から取得される特徴量である。例えば、画像においては輪郭やコーナーなどの領域が該当する。   The local feature amount in an image is a feature amount obtained from a feature region that can be variously defined according to a target or arbitrarily defined by a person who analyzes and recognizes the target. For example, in an image, an area such as a contour or a corner corresponds.

また、対象からベクトルデータを取得するための技術は、対象に応じてすでに種々存在し、いずれかを用いるかは限定しない。例えば、画像を対象としてベクトルデータを取得する場合には、SIFTやHoGなどの手法を用いることができる。これらの手法により取得されるベクトルデータは、数百にも及ぶ高次元のベクトルデータとなる。   In addition, various techniques for acquiring vector data from a target already exist depending on the target, and there is no limitation on which one to use. For example, when acquiring vector data for an image, a technique such as SIFT or HoG can be used. The vector data obtained by these methods is hundreds of high-dimensional vector data.

以下、ベクトルデータを取得する対象の一例としての画像を挙げ、各構成について説明する。   Hereinafter, each configuration will be described using an image as an example of a target from which vector data is acquired.

図2は、ベクトルデータを取得する対象を画像とした場合に、取得されるベクトルデータを例示する概念図である。図2(a)に示すように、「トラック」の画像を対象としており、図中の丸で指し示す箇所が特徴領域であり、である当該領域における特徴量をベクトルデータとして取得する。   FIG. 2 is a conceptual diagram exemplifying vector data to be obtained when the target for obtaining vector data is an image. As shown in FIG. 2A, the image of the “track” is targeted, and a point indicated by a circle in the figure is a characteristic region, and the characteristic amount in the region is acquired as vector data.

クラスター保持部0102は、近傍にある多次元ベクトルデータどうしをクラスター化したベクトル空間における領域を複数保持する機能を有する。このようなベクトル空間においてクラスタリングされる領域のことを、画像認識などの技術分野においてはビジュアルワードという。そして、ベクトル空間を多次元ベクトルデータ間の距離(ユークリッド距離など)に基づきクラスタリングする。例えば、図2(b)は、10のビジュアルワードで分画されたベクトル空間を示す概念図である。   The cluster holding unit 0102 has a function of holding a plurality of regions in a vector space obtained by clustering neighboring multidimensional vector data. An area that is clustered in such a vector space is called a visual word in technical fields such as image recognition. Then, the vector space is clustered based on the distance between multidimensional vector data (such as the Euclidean distance). For example, FIG. 2B is a conceptual diagram illustrating a vector space divided by 10 visual words.

クラスターの保持は、例えば、クラスターを代表する多次元ベクトルデータをそのクラスターのIDと紐付けて保持する。また、当該クラスターに含まれると判断するために規定される距離(当該クラスターを代表する多次元ベクトルデータとの距離)を併せて保持してもよい。   The cluster is held, for example, by linking multidimensional vector data representing the cluster with the ID of the cluster. Further, a distance (distance from multidimensional vector data representing the cluster) specified for determining that the cluster is included may be stored together.

また、クラスターIDと紐付けられる多次元ベクトルデータは、対象から取得したベクトルデータそのものであってもよいし、後述するクラスターの登録処理による総クラスター数の増加に伴い改めてもよい。   Further, the multidimensional vector data associated with the cluster ID may be the vector data itself obtained from the target, or may be changed as the total number of clusters increases due to the cluster registration process described later.

包含判断部0103は、取得した多次元ベクトルデータがいずれかの領域に含まれるか判断する機能を有する。前述の通り、保持されるクラスターはそのクラスターを代表する多次元ベクトルデータと規定された距離に基づく所定の範囲を有する。例えば、その多次元ベクトルデータを中心とし規定された距離を半径とする円領域である。   The inclusion determining unit 0103 has a function of determining whether the acquired multidimensional vector data is included in any of the regions. As described above, the retained cluster has a predetermined range based on multidimensional vector data representing the cluster and a defined distance. For example, it is a circular area having a radius defined by a distance defined around the multidimensional vector data.

図3は、クラスターの登録について概略を示す概念図である。図3(a)は、保持される5つのクラスターの領域をベクトル空間0300に配置した概念図である。ID1のクラスター0301は、所定範囲の領域(点線円内)を有している。ID2からID5のクラスターについても同様である。   FIG. 3 is a conceptual diagram schematically showing cluster registration. FIG. 3A is a conceptual diagram in which regions of five held clusters are arranged in a vector space 0300. The cluster 0301 of ID1 has an area within a predetermined range (within a dotted circle). The same applies to the clusters of ID2 to ID5.

包含判断部は、取得した多次元ベクトルデータ0302と、保持されている各クラスターと紐付けられている多次元ベクトルデータとの距離(ユークリッド距離など)を計算する。その結果、取得した多次元ベクトルデータがいずれのクラスターの領域に含まれるか否かを判断する。本図の例においては、取得した多次元ベクトルデータ0302がいずれかのクラスターの領域に含まれないとの判断結果が得られる。このように取得した多次元ベクトルデータを包含するクラスターの存否や包含するクラスターを特定する処理を、クラスターの検索という場合がある。また、このような検索により取得したベクトルデータを包含するクラスターが存在したことを、ヒットしたという。   The inclusion determination unit calculates a distance (such as a Euclidean distance) between the acquired multidimensional vector data 0302 and the stored multidimensional vector data associated with each cluster. As a result, it is determined whether the acquired multidimensional vector data is included in any of the cluster regions. In the example of this drawing, a determination result is obtained that the obtained multidimensional vector data 0302 is not included in any of the cluster regions. The process of specifying the existence or non-existence of a cluster including the multidimensional vector data acquired in this way, and the process of specifying the included cluster may be referred to as a cluster search. Also, the existence of a cluster including the vector data obtained by such a search is called a hit.

クラスター登録部0104は、包含判断部での判断結果が包含されないとの判断結果である場合には取得した多次元ベクトルデータに基づいて新たな領域をクラスター保持部に登録する機能を有する。前述の通り、取得した多次元ベクトルデータ0302は、いずれかのクラスターに包含されないとの判断結果が得られている。したがって、クラスター登録部は、図3(b)に示すように、この多次元ベクトルデータに基づき新たな領域(ID6)としてクラスター保持部に登録する。   The cluster registration unit 0104 has a function of registering a new area in the cluster holding unit based on the acquired multidimensional vector data when the determination result by the inclusion determination unit is not a inclusion result. As described above, it is determined that the obtained multidimensional vector data 0302 is not included in any of the clusters. Therefore, as shown in FIG. 3B, the cluster registration unit registers a new area (ID6) in the cluster holding unit based on the multidimensional vector data.

また、図3(c)に示すように、取得した多次元ベクトルデータ0304が保持されるクラスター(ID1)の領域に包含されると判断された場合には、その取得した多次元ベクトルデータに基づいて新たなクラスターとして登録されない。   Further, as shown in FIG. 3C, when it is determined that the acquired multidimensional vector data 0304 is included in the area of the cluster (ID1) held, based on the acquired multidimensional vector data. Is not registered as a new cluster.

包含判断結果履歴記録部0105は、包含判断部での判断結果が包含されるとの判断結果である場合にはその履歴である包含判断結果履歴を記録する機能を有する。図4は、包含判断結果履歴の一例を示す図である。図示するように、累積判断回数、累積包含判断回数及び遡及包含判断回数を包含判断結果履歴として保持している。累積判断回数は、包含判断部により直近の判断時点までになされた判断の累積数である。また、累積包含判断回数は、直近の判断時点までになされたすべての判断において、包含するとの判断結果となった回数である。また、遡及包含判断回数は、直近の判断時点から遡って規定回数(N)の判断において包含するとの判断結果となった回数である。図では、規定回数を100としている。また、包含判断回数は、ヒット回数と読み替えてもよい。   The inclusion determination result history recording unit 0105 has a function of recording an inclusion determination result history that is a history of a determination result that the determination result of the inclusion determination unit is included. FIG. 4 is a diagram illustrating an example of the inclusion determination result history. As shown in the figure, the cumulative judgment count, the cumulative inclusion judgment count, and the retrospective inclusion judgment count are held as the inclusion judgment result history. The cumulative determination count is the cumulative number of determinations made by the inclusion determination unit up to the latest determination time. In addition, the cumulative inclusion judgment frequency is the number of times that the judgment result of inclusion is obtained in all the determinations made up to the latest determination time. The number of times of retrospective inclusion determination is the number of times that the result of the determination of inclusion in the specified number of times (N) has been retroactive from the time of the most recent determination. In the figure, the prescribed number is set to 100. Also, the number of inclusion determinations may be read as the number of hits.

なお、累積包含判断回数と遡及包含判断回数との双方を必ず保持しなければならないものではなく、いずれか一方を保持するものとしてもよい。また、包含判断結果履歴として、いずれの領域にも包含されないとの結果を得た回数を保持してもよい。例えば、累積包含判断回数に換えて累積非包含判断回数を保持してもよいし、遡及包含判断回数に換えて遡及非包含判断回数を保持してもよい。   It should be noted that both the cumulative inclusion judgment count and the retrospective inclusion judgment count need not always be held, and either one may be held. Further, the number of times that a result indicating that no area is included may be held as the inclusion determination result history. For example, the number of cumulative non-inclusion judgments may be held instead of the cumulative inclusion judgment number, or the number of retrospective non-inclusion judgments may be held instead of the retroactive inclusion judgment number.

中止判断部0106は、包含判断結果記録部での包含判断結果履歴がクラスターの新規登録を中止するための所定の条件を満たすか判断する機能を有する。   The cancellation determination unit 0106 has a function of determining whether the inclusion determination result history in the inclusion determination result recording unit satisfies a predetermined condition for canceling new registration of a cluster.

図5は、図4で例示した包含判断結果履歴として記録したいずれかの回数の関係を所定の条件に用いた例を示している。例えば、累積包含判断率は、累積判断回数に対する累積包含判断回数の割合である。図4に示したように、累積判断回数(A)が「26985」で累積包含判断回数(B)が「8096」であるので、図5に示すように、累積包含判断率(B/A)は30.0%となる。ここで、累積包含判断率が30%を超えたことを所定の条件とした場合には、この時点で所定の条件を満たすことになる。   FIG. 5 shows an example in which the relationship of any number of times recorded as the inclusion determination result history illustrated in FIG. 4 is used as a predetermined condition. For example, the cumulative inclusion judgment rate is a ratio of the cumulative inclusion judgment number to the cumulative judgment number. As shown in FIG. 4, the cumulative judgment frequency (A) is “26985” and the cumulative inclusion judgment frequency (B) is “8096”. Therefore, as shown in FIG. 5, the cumulative inclusion judgment rate (B / A) Is 30.0%. Here, when the predetermined condition is that the cumulative inclusion judgment rate exceeds 30%, the predetermined condition is satisfied at this time.

また、前述の規定回数に対する遡及包含回数の割合である遡及包含判断率を所定の条件として用いてもよい。図4に示したように、規定回数(N)が「100」で遡及包含判断回数(B')が「90」であるので、図5に示すように、遡及包含判断率(B'/N)は90.0%となる。ここで、遡及包含判断率が90%を超えたことを所定の条件とした場合には、この時点で所定の条件を満たすことになる。   In addition, the retrospective inclusion rate, which is the ratio of the retrospective inclusion frequency to the prescribed frequency, may be used as the predetermined condition. As shown in FIG. 4, the specified number (N) is “100” and the retrospective inclusion judgment frequency (B ′) is “90”. Therefore, as shown in FIG. 5, the retrospective inclusion judgment rate (B ′ / N) is obtained. ) Is 90.0%. Here, when the predetermined condition is that the retrospective inclusion judgment rate exceeds 90%, the predetermined condition is satisfied at this time.

なお、所定の条件は、前述のように一つ設けるものであってもよいが、複数の条件を重畳して規定してもよい。例えば、前述の累積包含判断率による条件と遡及包含判断率による条件とで、いずれか一方がその条件を満たすことを条件としてもよいし、双方の条件が満たされることを条件としてもよい。   The predetermined condition may be one provided as described above, or a plurality of conditions may be superimposed and defined. For example, the condition based on the cumulative inclusion judgment rate and the condition based on the retrospective inclusion judgment rate may be a condition that one of the conditions is satisfied, or a condition that both conditions are satisfied.

また、累積判断回数が閾値Xを超え、かつ累積包含判断率又は遡及包含判断率がそれぞれの閾値Y又はY'を超えたことを条件としてもよい。また、累積判断回数が閾値Xを超え、かつ包含するとの判断結果が連続してZ回得られたことを所定の条件としてもよい。また、包含判断率とクラスター数を組み合わせた条件としてもよい。例えば包含判断率が閾値Xを超えて、かつ、クラスター数が閾値Cを超えた場合にのみ中止とする、条件としてもよい。   Further, the condition may be that the cumulative number of times of judgment exceeds the threshold X and the cumulative inclusion judgment rate or the retrospective inclusion judgment rate exceeds the respective threshold Y or Y ′. Alternatively, the predetermined condition may be that the cumulative determination count exceeds the threshold X and the determination result that the cumulative determination count includes Z times is continuously obtained. Alternatively, the condition may be a combination of the inclusion judgment rate and the number of clusters. For example, the condition may be set to stop only when the inclusion judgment rate exceeds the threshold value X and the number of clusters exceeds the threshold value C.

なお、包含判断結果履歴として、累積包含判断回数に換えて累積非包含判断回数を保持し、遡及包含判断回数に換えて遡及非包含判断回数を保持する場合にも、前述に準じ例えば遡及非包含判断率が規定の割合を下回ったことを所定の条件とするなどして、中止の条件を定めてもよい。   In the case where the number of cumulative non-inclusion judgments is stored as the inclusion judgment result history in place of the cumulative inclusion judgment number, and the number of retroactive non-inclusion judgments is stored in place of the retrospective inclusion judgment number, the same applies to the above description, for example, The stop condition may be determined by, for example, setting a predetermined condition that the judgment rate falls below a specified ratio.

中止制御部は、中止判断部での判断結果が所定の条件を満たすとの判断結果である場合にはクラスター登録部での新規の登録を中止するようにクラスター登録部を制御する機能を有する。前述のような所定条件を満たす場合にクラスターの新規登録を中止することで、新規登録のための処理を無用に行い続けることを抑制することができる。なお、中止の制御は、中止のための条件が満たされて直ちに行ってもよいし、満たされた後に所定回数の検索(包含判断の処理)を行った後に行うようにしてもよい。
<ハードウェア構成>
The suspension control unit has a function of controlling the cluster registration unit to suspend the new registration in the cluster registration unit when the result of the determination by the suspension determination unit is a determination result that the predetermined condition is satisfied. By stopping the new registration of the cluster when the above-described predetermined condition is satisfied, it is possible to prevent the process for the new registration from being performed unnecessarily. The control of the suspension may be performed immediately after the condition for suspension is satisfied, or may be performed after a predetermined number of searches (processing of inclusion determination) are performed after the condition is satisfied.
<Hardware configuration>

図6は、上記機能的な各構成要件をハードウェアとして実現した際の、本量子化装置の構成の一例を表す概略図である。この図を利用して本量子化装置に係るそれぞれのハードウェア構成の働きについて説明する。   FIG. 6 is a schematic diagram illustrating an example of the configuration of the present quantization device when the above functional components are implemented as hardware. The operation of each hardware configuration according to the present quantization device will be described with reference to FIG.

この図にあるように、量子化装置は、各種演算処理を実行するためのCPU0601と、主メモリ0602と、二次記憶装置0603と、通信インターフェース0604などを備える。二次記憶装置には画像や音声などの対象、対象から取得した多次元ベクトルデータ、クラスターデータベース、包含判断結果履歴、新規登録を中止するための条件、ベクトルデータ取得プログラムなどの各種プログラムなどが格納されている。なお、多次元ベクトルデータを取得する対象は、通信インターフェース0604を介して外部から取得してもよい。   As shown in this figure, the quantization device includes a CPU 0601 for executing various arithmetic processing, a main memory 0602, a secondary storage device 0603, a communication interface 0604, and the like. The secondary storage device stores objects such as images and sounds, multidimensional vector data obtained from the objects, a cluster database, a history of inclusion determination results, conditions for canceling new registration, and various programs such as a vector data acquisition program. Have been. Note that the target from which the multidimensional vector data is obtained may be obtained from outside via the communication interface 0604.

CPUはこれら各種プログラムを主メモリに展開したうえで実行する。前記の各ハードウェア構成は、システムバス0605などのデータ通信経路によって相互に接続され、情報の送受信や処理を行う。   The CPU executes these various programs after expanding them in the main memory. The above-described hardware components are mutually connected by a data communication path such as a system bus 0605, and perform transmission / reception and processing of information.

まず、CPUは、ベクトルデータ取得プログラムを実行し、画像などの対象の多次元ベクトルデータを取得し所定の記憶領域に格納する。そして、包含判断プログラムを実行し取得した多次元ベクトルデータが保持するいずれかのクラスターの領域に含まれるか判断する。包含されないとの判断結果の場合にはクラスター登録プログラムを実行しその多次元ベクトルデータに基づいて新たな領域を登録する。包含するとの判断結果の場合には包含判断結果履歴を記録する。そして、中止判断プログラムを実行し包含判断履歴が所定の条件を満たすか判断する。満たすとの判断結果の場合には中止制御プログラムを実行しクラスターの新規登録を中止する制御を行う。
<処理の流れ>
First, the CPU executes a vector data acquisition program to acquire target multidimensional vector data such as an image and store it in a predetermined storage area. Then, it is determined whether or not the multidimensional vector data obtained by executing the inclusion determining program is included in any of the cluster areas held. If it is determined that the area is not included, the cluster registration program is executed, and a new area is registered based on the multidimensional vector data. In the case of a judgment result of inclusion, an inclusion judgment result history is recorded. Then, the suspension determination program is executed to determine whether the inclusion determination history satisfies a predetermined condition. If it is determined that the condition is satisfied, the suspension control program is executed to control the suspension of the new registration of the cluster.
<Process flow>

図7は、本量子化装置における処理の流れの一例を表すフロー図である。なお、以下に示すステップは、上記のような計算機の各ハードウェア構成によって実行されるステップであっても良いし、媒体に記録され計算機を制御するためのプログラムを構成する処理ステップであっても構わない。   FIG. 7 is a flowchart illustrating an example of a processing flow in the quantization device. The following steps may be executed by each hardware configuration of the computer as described above, or may be processing steps recorded on a medium and constituting a program for controlling the computer. I do not care.

図示するように、まず、多次元ベクトルデータを取得する(ベクトルデータ取得ステップ:S0701)。そして、取得した多次元ベクトルデータがいずれかのクラスターの領域に含まれるか判断する(包含判断ステップ:S0702)。包含されないとの判断結果である場合には取得した多次元ベクトルデータに基づいて新たな領域をクラスター保持部に登録する(クラスター登録ステップ:S0703)。包含判断ステップでの判断結果が包含されるとの判断結果である場合にはその履歴である包含判断結果履歴を記録する(包含判断結果履歴記録ステップ:S0704)。   As shown in the figure, first, multidimensional vector data is obtained (vector data obtaining step: S0701). Then, it is determined whether the acquired multidimensional vector data is included in any of the cluster regions (inclusion determination step: S0702). If it is determined that the area is not included, a new area is registered in the cluster holding unit based on the obtained multidimensional vector data (cluster registration step: S0703). If the judgment result in the inclusion judgment step is a judgment result indicating inclusion, the inclusion judgment result history, which is the history, is recorded (inclusion judgment result history recording step: S0704).

続いて、包含判断結果履歴がクラスターの新規登録を中止するための所定の条件を満たすか判断する(中止判断ステップ:S0705)。中止判断ステップでの判断結果が満たさないとの結果である場合には、取得したすべての多次元ベクトルデータについていずれかのクラスターの領域に含まれるかの判断が完了したか判断する(完了判断ステップ:S0706)。完了判断ステップでの判断結果が完了していないとの結果である場合には未了の多次元ベクトルデータについて包含判断ステップでの処理を行う。完了判断ステップでの判断結果が完了しているとの結果である場合には処理を終了する。中止判断ステップでの判断結果が満たすとの結果である場合にはクラスター登録ステップでの新規登録を中止する制御を行う(中止制御ステップ:S0707)。そして、処理を終了する。
<効果>
Subsequently, it is determined whether or not the inclusion determination result history satisfies a predetermined condition for stopping new registration of a cluster (stop determination step: S0705). If the result of the determination in the stop determination step is not satisfied, it is determined whether the determination of whether or not all the acquired multidimensional vector data is included in any of the cluster regions has been completed (the completion determination step). : S0706). If the result of the judgment in the completion judging step is not completed, the process in the inclusion judging step is performed on the uncompleted multidimensional vector data. If the result of the determination in the completion determination step is that the processing has been completed, the processing ends. If the result of the determination in the stop determination step is satisfied, control is performed to stop the new registration in the cluster registration step (stop control step: S0707). Then, the process ends.
<Effect>

本量子化装置によれば、登録のために取得した多次元ベクトルデータが既存のベクトル空間における領域に含まれるか否かの判断結果の履歴に基づき、新規に領域の登録をする処理を中止することでき、新規登録のための処理を無用に行い続けることを抑制することができる。   According to the present quantization device, the process of registering a new area is stopped based on the history of the determination result of whether or not the multidimensional vector data acquired for registration is included in the area in the existing vector space. Therefore, it is possible to prevent the process for new registration from being performed unnecessarily.

0100 量子化装置
0101 多次元データ取得部
0102 クラスター保持部
0103 包含判断部
0104 クラスター登録部
0105 包含判断結果履歴記録部
0106 中止判断部
0107 中止制御部
0100 Quantization device 0101 Multidimensional data acquisition unit 0102 Cluster holding unit 0103 Inclusion judgment unit 0104 Cluster registration unit 0105 Inclusion judgment result history recording unit 0106 Stop judgment unit 0107 Stop control unit

Claims (4)

多次元ベクトルデータを取得するベクトルデータ取得部と、
近傍にある多次元ベクトルデータどうしをクラスター化したベクトル空間における領域を複数保持するためのクラスター保持部と、
取得した多次元ベクトルデータがいずれかの領域に含まれるか判断する包含判断部と、
包含判断部での判断結果が包含されないとの判断結果である場合には取得した多次元ベクトルデータに基づいて新たな領域をクラスター保持部に登録するクラスター登録部と、
包含判断部での判断結果が包含されるとの判断結果である場合にはその履歴である包含判断結果履歴を記録する包含判断結果履歴記録部と、
包含判断結果記録部での包含判断結果履歴における包含判断率が領域の新規登録を中止する所定の条件を満たすか判断する中止判断部と、
中止判断部での判断結果が所定の条件を満たすとの判断結果である場合にはクラスター登録部での新規の登録を中止するようにクラスター登録部を制御する中止制御部と、
を有する量子化装置。
A vector data acquisition unit for acquiring multidimensional vector data,
A cluster holding unit for holding a plurality of regions in a vector space obtained by clustering neighboring multidimensional vector data,
An inclusion determining unit that determines whether the acquired multidimensional vector data is included in any of the regions,
A cluster registration unit that registers a new area in the cluster holding unit based on the obtained multidimensional vector data when the determination result in the inclusion determination unit is a determination result that it is not included,
An inclusion determination result history recording unit that records an inclusion determination result history that is a history of the determination result that the determination result in the inclusion determination unit is included,
An interruption determination unit that determines whether the inclusion determination rate in the inclusion determination result history in the inclusion determination result recording unit satisfies a predetermined condition for stopping new registration of an area,
If the determination result in the suspension determination unit is a determination result that satisfies a predetermined condition, a suspension control unit that controls the cluster registration unit to suspend the new registration in the cluster registration unit;
A quantization device having:
前記所定の条件は、包含判断部での所定回数中の判断結果としてのいずれにも包含されないとの結果を得た回数、いずれかに包含されるとの結果を得た回数、の関係で定められる請求項1に記載の量子化装置。   The predetermined condition is determined by a relationship between the number of times that the result of not being included in any of the determination results in the predetermined number of times in the inclusion determination unit and the number of times that the result of being included in any of the determination results are obtained. The quantization device according to claim 1, wherein 近傍にある多次元ベクトルデータどうしをクラスター化したベクトル空間における領域を複数保持するためのクラスター保持部を有する量子化装置の動作方法であって、
多次元ベクトルデータを取得するベクトルデータ取得ステップと、
取得した多次元ベクトルデータがいずれかの領域に含まれるか判断する包含判断ステップと、
包含判断ステップでの判断結果が包含されないとの判断結果である場合には取得した多次元ベクトルデータに基づいて新たな領域をクラスター保持部に登録するクラスター登録ステップと、
包含判断ステップでの判断結果が包含されるとの判断結果である場合にはその履歴である包含判断結果履歴を記録する包含判断結果履歴記録ステップと、
包含判断結果記録ステップでの包含判断結果履歴における包含判断率が領域の新規登録を中止するための所定の条件を満たすか判断する中止判断ステップと、
中止判断ステップでの判断結果が所定の条件を満たすとの判断結果である場合にはクラスター登録ステップでの新規の登録を中止するように制御する中止制御ステップと、
を有する量子化装置の動作方法。
An operation method of a quantization device having a cluster holding unit for holding a plurality of regions in a vector space obtained by clustering neighboring multidimensional vector data,
A vector data acquisition step of acquiring multidimensional vector data;
An inclusion determining step of determining whether the obtained multidimensional vector data is included in any of the regions,
A cluster registration step of registering a new area in the cluster holding unit based on the obtained multidimensional vector data if the determination result in the inclusion determination step is a determination result that the area is not included,
An inclusion judgment result history recording step of recording an inclusion judgment result history that is a history of the judgment result that the judgment result in the inclusion judgment step is included,
A cancellation determination step of determining whether the inclusion determination rate in the inclusion determination result history in the inclusion determination result recording step satisfies a predetermined condition for stopping new registration of an area,
A stop control step of controlling the new registration in the cluster registration step to be stopped if the result of the determination in the stop determination step is a determination result that satisfies a predetermined condition;
The operation method of the quantization device having
近傍にある多次元ベクトルデータどうしをクラスター化したベクトル空間における領域を複数保持するためのクラスター保持部を有する量子化装置を動作させるプログラムであって、
多次元ベクトルデータを取得するベクトルデータ取得ステップと、
取得した多次元ベクトルデータがいずれかの領域に含まれるか判断する包含判断ステップと、
包含判断ステップでの判断結果が包含されないとの判断結果である場合には取得した多次元ベクトルデータに基づいて新たな領域をクラスター保持部に登録するクラスター登録ステップと、
包含判断ステップでの判断結果が包含されるとの判断結果である場合にはその履歴である包含判断結果履歴を記録する包含判断結果履歴記録ステップと、
包含判断結果記録ステップでの包含判断結果履歴における包含判断率が領域の新規登録を中止するための所定の条件を満たすか判断する中止判断ステップと、
中止判断ステップでの判断結果が所定の条件を満たすとの判断結果である場合にはクラスター登録ステップでの新規の登録を中止するように制御する中止制御ステップと、
を計算機に実行させるプログラム。
A program for operating a quantization device having a cluster holding unit for holding a plurality of regions in a vector space obtained by clustering neighboring multidimensional vector data,
A vector data acquisition step of acquiring multidimensional vector data;
An inclusion determining step of determining whether the obtained multidimensional vector data is included in any of the regions,
A cluster registration step of registering a new area in the cluster holding unit based on the obtained multidimensional vector data if the determination result in the inclusion determination step is a determination result that the area is not included,
An inclusion judgment result history recording step of recording an inclusion judgment result history that is a history of the judgment result that the judgment result in the inclusion judgment step is included,
A cancellation determination step of determining whether the inclusion determination rate in the inclusion determination result history in the inclusion determination result recording step satisfies a predetermined condition for stopping new registration of an area,
A stop control step of controlling the new registration in the cluster registration step to be stopped if the result of the determination in the stop determination step is a determination result that satisfies a predetermined condition;
A program that causes a computer to execute
JP2015247106A 2015-12-18 2015-12-18 Quantizer and operation method of quantizer Active JP6678445B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015247106A JP6678445B2 (en) 2015-12-18 2015-12-18 Quantizer and operation method of quantizer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015247106A JP6678445B2 (en) 2015-12-18 2015-12-18 Quantizer and operation method of quantizer

Publications (2)

Publication Number Publication Date
JP2017111710A JP2017111710A (en) 2017-06-22
JP6678445B2 true JP6678445B2 (en) 2020-04-08

Family

ID=59081305

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015247106A Active JP6678445B2 (en) 2015-12-18 2015-12-18 Quantizer and operation method of quantizer

Country Status (1)

Country Link
JP (1) JP6678445B2 (en)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1185985A (en) * 1997-09-02 1999-03-30 Adoin Kenkyusho:Kk Object registration method and collation method by picture, object collation device by picture and storage medium for storing object collation program by picture
JP5265656B2 (en) * 2010-12-27 2013-08-14 ヤフー株式会社 Clustering apparatus and clustering method
JP5791666B2 (en) * 2013-07-18 2015-10-07 ヤフー株式会社 Dynamic generation device for visual keywords
JP2015207047A (en) * 2014-04-17 2015-11-19 日本電信電話株式会社 Similar feature extraction device, method, and program

Also Published As

Publication number Publication date
JP2017111710A (en) 2017-06-22

Similar Documents

Publication Publication Date Title
US10817599B2 (en) Application execution control utilizing ensemble machine learning for discernment
US11663161B2 (en) Fuzzy hash algorithms to calculate file similarity
KR102251807B1 (en) Hyperparameter Optimization Algorithm Recommendation Method and Optimization Algorithm Recommendation System
CN110335115A (en) A kind of service order processing method and processing device
KR102878575B1 (en) Method and apparatus for determining storage load of application
JP5679074B2 (en) Method, program, and apparatus for determining software installation order
WO2017031837A1 (en) Disk capacity prediction method, device and apparatus
US20190122381A1 (en) Apparatus and methods of automated tracking and counting of objects on a resource-constrained device
CN109561052B (en) Method and device for detecting abnormal flow of website
JP7171471B2 (en) LEARNING MODEL GENERATION SUPPORT DEVICE AND LEARNING MODEL GENERATION SUPPORT METHOD
CN106339510A (en) The click prediction method and device based on artificial intelligence
US11204935B2 (en) Similarity analyses in analytics workflows
CN109376590A (en) Obstacle classification method, apparatus, equipment and storage medium based on unmanned vehicle
WO2015180340A1 (en) Data mining method and device
CN111832815B (en) Scientific research hotspot prediction methods and systems
JP6110281B2 (en) Moving unit prediction model generation apparatus, moving unit prediction model generation method, and moving unit prediction model generation program
JP6678445B2 (en) Quantizer and operation method of quantizer
WO2021208320A1 (en) Flight path processing method and device for unmanned aerial vehicle, electronic apparatus, and storage medium
US10324837B2 (en) Reducing minor garbage collection overhead
JP2012133608A (en) Histogram generation device, method and program
WO2010082885A1 (en) A method to prevent churn of customers
CN106776623B (en) A user behavior analysis method and device
CN117555993A (en) Method, device and medium for retrieving multidimensional data in ERP system
US20210357589A1 (en) Method of detecting change and information processing apparatus
CN111401383B (en) Target frame estimation method, system, device and medium based on image detection

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180507

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190510

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190516

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190627

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20191101

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20191112

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200218

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200317

R150 Certificate of patent or registration of utility model

Ref document number: 6678445

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250