JP6941331B2 - Image recognition system - Google Patents
Image recognition system Download PDFInfo
- Publication number
- JP6941331B2 JP6941331B2 JP2020115230A JP2020115230A JP6941331B2 JP 6941331 B2 JP6941331 B2 JP 6941331B2 JP 2020115230 A JP2020115230 A JP 2020115230A JP 2020115230 A JP2020115230 A JP 2020115230A JP 6941331 B2 JP6941331 B2 JP 6941331B2
- Authority
- JP
- Japan
- Prior art keywords
- image information
- product
- area
- processing unit
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Input (AREA)
- Image Analysis (AREA)
Description
本発明は,店舗などに陳列されている商品を特定するための画像認識システムに関する。 The present invention relates to an image recognition system for identifying products displayed in stores and the like.
小売業界においては,商品の陳列状況が商品の販売に影響することが知られている。そのため,商品の製造会社,販売会社としては,自社または他社のどのような商品が店舗に陳列されているのかを把握することで,自社商品の開発戦略,販売戦略につなげることができる。 In the retail industry, it is known that the display status of products affects the sales of products. Therefore, as a product manufacturing company or sales company, it is possible to connect to the development strategy and sales strategy of the company's products by grasping what kind of products of the company or other companies are displayed in the store.
一方,その実現のためには,店頭に陳列されている商品の正確な特定が重要である。そこで,店舗の陳列棚を撮影し,その画像情報から陳列されている商品を,人間が手作業で特定をすることが考えられる。この場合,ほぼ正確に商品を特定することができる。しかし,商品の陳列状況を継続的に把握するためには,一定期間ごとにその陳列状況を把握しなければならないが,店舗の陳列棚を撮影した画像情報から毎回,人間が商品を特定するのは負担が大きく,また非効率である。 On the other hand, in order to realize this, it is important to accurately identify the products displayed in the store. Therefore, it is conceivable that a person manually identifies the products displayed from the image information of the display shelves of the store. In this case, the product can be identified almost accurately. However, in order to continuously grasp the display status of products, it is necessary to grasp the display status at regular intervals, but humans identify the products every time from the image information taken of the display shelves of the store. Is burdensome and inefficient.
そこで店舗の陳列棚を撮影した画像情報から,そこに陳列されている商品を自動的に特定し,商品の陳列状況を把握することが求められる。たとえば商品ごとの標本画像をもとに,店舗の陳列棚を撮影した画像に対して画像認識技術を用いる方法がある。これらの従来技術として,たとえば,下記特許文献1乃至特許文献3に示すような技術を用いて,商品の陳列状況を管理するシステムが存在する。
Therefore, it is required to automatically identify the products displayed on the display shelves of the store from the image information taken and grasp the display status of the products. For example, there is a method of using image recognition technology for an image of a store display shelf based on a sample image of each product. As these conventional techniques, for example, there is a system for managing the display status of products by using the techniques shown in
特許文献1の発明は,商品をどの陳列棚に陳列すべきかが知識のない者にもできるように支援するシステムである。そのため,実際に陳列されている商品を把握することはできない。また特許文献2は,商品の陳列を支援する棚割支援システムにおいて,商品画像の入力を支援するシステムである。しかし特許文献2のシステムでは,棚割支援システムを利用する際の商品画像の入力を支援するのみであって,このシステムを用いたとしても,実際に陳列されている商品を把握することはできない。
The invention of
特許文献3は,陳列棚に空き空間がある場合に,その空き空間に陳列すべき商品を特定したり,陳列棚に陳列すべき商品を置き間違えた場合にそれを通知する発明である。この発明でも,商品と,陳列棚に陳列されている商品との画像マッチング処理を行って,陳列棚に陳列されている商品を特定しているが,認識精度が低いのが実情である。
陳列棚を撮影した画像に対して,商品の標本画像をもとに画像認識技術を用いる場合,その画像認識の精度や処理負荷が問題となる。たとえば,陳列棚が設置されている店舗では,照明の状態が均一ではなく,標本画像の照明との差が大きいと,画像認識の精度が低下する。そのため,陳列棚を撮影した画像から,そこに陳列されている商品を特定することは容易ではない場合がある。また,画像認識には大きな処理負荷が発生するので,多大なリソースが必要となってしまう。そのため,投下資本が大きくなってしまう。 When image recognition technology is used based on a sample image of a product for an image taken on a display shelf, the accuracy of the image recognition and the processing load become problems. For example, in a store where display shelves are installed, if the lighting conditions are not uniform and the difference from the lighting of the sample image is large, the accuracy of image recognition deteriorates. Therefore, it may not be easy to identify the products displayed on the display shelves from the images taken. In addition, a large processing load is generated for image recognition, which requires a large amount of resources. Therefore, the invested capital becomes large.
本発明者は,陳列棚を撮影した画像に写っている商品を識別するための一つの方法として,その商品の価格等を表示するための商品タグに着目し,陳列されている商品を精度よく特定することができる画像認識システムを発明した。また,陳列棚に写っている商品を認識するとともに,商品タグに記載されている情報を認識し,それらを照合することで,陳列されている商品を精度よく特定することができる画像認識システムを発明した。 The present inventor pays attention to a product tag for displaying the price of the product, etc. as one method for identifying the product shown in the image of the display shelf, and accurately displays the displayed product. We have invented an image recognition system that can be identified. In addition, an image recognition system that can accurately identify the products on display by recognizing the products on the display shelves, recognizing the information on the product tags, and collating them. Invented.
第1の発明は,商品を陳列する陳列棚が写っている第1の画像情報に対して第1の正置化処理をして第2の画像情報を生成する第1の正置化処理部と,前記第2の画像情報における商品タグ配置領域を含む領域に対して第2の正置化処理をする第2の正置化処理部と,前記第2の正置化処理をした画像情報から商品タグ領域を特定する商品タグ特定処理部と,前記特定した商品タグ領域においてOCR認識処理を行うことで商品タグに表記された情報を特定する商品タグ内情報特定処理部と,を有する画像認識システムである。 The first invention is a first emplacement processing unit that generates a second image information by performing a first emplacement process on the first image information showing a display shelf for displaying products. And the second emplacement processing unit that performs the second emplacement processing on the area including the product tag arrangement area in the second image information, and the image information that has undergone the second emplacement processing. An image having a product tag specifying processing unit that specifies the product tag area from the above, and an information specifying processing unit in the product tag that specifies the information written on the product tag by performing OCR recognition processing in the specified product tag area. It is a recognition system.
本発明の画像認識システムを用いることで,商品タグに表記されている情報を精度よく認識できるので,それに対応して陳列されている商品を精度よく特定することができる。 By using the image recognition system of the present invention, the information written on the product tag can be accurately recognized, and therefore the products displayed corresponding to the information can be accurately identified.
上述の発明において,前記商品タグ内情報特定処理部は,前記特定した商品タグ領域を二値化してラベリング処理を行うことでボックスを特定し,特定したボックスのうち,ボックスの高さ,幅,ベースラインが所定条件を充足するボックス同士をブロックとして特定し,前記特定したブロックに対して前記OCR認識処理を実行する,画像認識システムである。 In the above-described invention, the information specifying processing unit in the product tag identifies the box by binarizing the specified product tag area and performing labeling processing, and among the specified boxes, the height, width, and the like of the box. This is an image recognition system that specifies boxes whose baseline satisfies a predetermined condition as blocks and executes the OCR recognition process on the specified blocks.
第1の発明は,本発明のコンピュータプログラムを読み込ませて実行することで実現することができる。すなわち,コンピュータを,商品を陳列する陳列棚が写っている第1の画像情報に対して第1の正置化処理をして第2の画像情報を生成する第1の正置化処理部,前記第2の画像情報における商品タグ配置領域を含む領域に対して第2の正置化処理をする第2の正置化処理部,前記第2の正置化処理をした画像情報から商品タグ領域を特定する商品タグ特定処理部,前記特定した商品タグ領域においてOCR認識処理を行うことで商品タグに表記された情報を特定する商品タグ内情報特定処理部,として機能させる画像認識プログラムである。 The first invention can be realized by loading and executing the computer program of the present invention. That is, the first emplacement processing unit, which generates the second image information by performing the first emplacement processing on the first image information in which the display shelf for displaying the products is shown. A second emplacement processing unit that performs a second emplacement process on an area including a product tag arrangement area in the second image information, and a product tag from the image information that has undergone the second emplacement process. This is an image recognition program that functions as a product tag identification processing unit that specifies an area and an information identification processing unit within a product tag that specifies the information written on the product tag by performing OCR recognition processing in the specified product tag area. ..
本発明の画像認識システムを用いることによって,陳列棚に陳列されている商品を精度よく特定することができる。 By using the image recognition system of the present invention, it is possible to accurately identify the products displayed on the display shelves.
本発明の画像認識システム1のシステム構成の一例を図1に示す。画像認識システム1は,管理端末2と撮影画像情報入力端末4とを用いる。
An example of the system configuration of the
管理端末2は,画像認識システム1を運営する企業等の組織が利用するコンピュータである。また,撮影画像情報入力端末4は,店舗の陳列棚を撮影した画像情報の入力を行う端末である。
The
画像認識システム1における管理端末2,撮影画像情報入力端末4は,コンピュータを用いて実現される。図2にコンピュータのハードウェア構成の一例を模式的に示す。コンピュータは,プログラムの演算処理を実行するCPUなどの演算装置70と,情報を記憶するRAMやハードディスクなどの記憶装置71と,情報を表示するディスプレイなどの表示装置72と,情報の入力が可能なキーボードやマウスなどの入力装置73と,演算装置70の処理結果や記憶装置71に記憶する情報をインターネットやLANなどのネットワークを介して送受信する通信装置74とを有している。
The
コンピュータがタッチパネルディスプレイを備えている場合には,表示装置72と入力装置73とが一体的に構成されていてもよい。タッチパネルディスプレイは,たとえばタブレット型コンピュータやスマートフォンなどの可搬型通信端末などで利用されることが多いが,それに限定するものではない。
When the computer is provided with a touch panel display, the
タッチパネルディスプレイは,そのディスプレイ上で,直接,所定の入力デバイス(タッチパネル用のペンなど)や指などによって入力を行える点で,表示装置72と入力装置73の機能が一体化した装置である。
The touch panel display is a device in which the functions of the
撮影画像情報入力端末4は,上記の各装置のほか,カメラなどの撮影装置を備えていてもよい。撮影画像情報入力端末4として,携帯電話,スマートフォン,タブレット型コンピュータなどの可搬型通信端末を用いることもできる。
The captured image
本発明における各手段は,その機能が論理的に区別されているのみであって,物理上あるいは事実上は同一の領域を為していても良い。本発明の各手段における処理は,その処理順序を適宜変更することもできる。また,処理の一部を省略してもよい。たとえば正置化処理を省略することもできる。その場合,正置化処理をしていない画像情報に対する処理を実行することができる。 Each means in the present invention has only a logical distinction in its function, and may form the same area physically or substantially. The processing order of the processing in each means of the present invention may be changed as appropriate. In addition, a part of the processing may be omitted. For example, the emplacement process can be omitted. In that case, it is possible to execute processing on the image information that has not been subjected to the orthostatic processing.
画像認識システム1における管理端末2は,撮影画像情報入力端末4とネットワークを介して情報の送受信が可能である。
The
画像認識システム1は,撮影画像情報入力受付処理部20と,撮影画像情報記憶部21と,撮影画像情報正置化処理部22と,位置特定処理部23と,商品タグ配置領域切出処理部24と,商品タグ配置領域正置化処理部25と,商品タグ特定処理部26と,商品タグ内情報特定処理部27とを有する。
The
撮影画像情報入力受付処理部20は,撮影画像情報入力端末4で撮影した店舗の陳列棚の画像情報(撮影画像情報)の入力を受け付け,後述する撮影画像情報記憶部21に記憶させる。撮影画像情報入力端末4からは,撮影画像情報のほか,撮影日時,店舗名などの店舗識別情報,画像情報を識別する画像情報識別情報などをあわせて入力を受け付けるとよい。
The photographed image information input
撮影画像情報記憶部21は,撮影画像情報入力受付処理部20で受け付けた撮影画像情報,撮影日時,店舗識別情報,画像情報識別情報などを対応づけて記憶する。撮影画像情報とは,台形補正処理を実行する対象となる画像情報であればよく,一つの陳列棚を複数枚で撮影した場合に,それが一つの画像情報として合成された画像情報も含まれる。また,歪み補正処理が実行された後の画像情報も撮影画像情報に含まれる。
The photographed image
撮影画像情報正置化処理部22は,撮影画像情報記憶部21に記憶した撮影画像情報に対して台形補正処理を実行して正置化した,正置画像情報を生成する。台形補正処理は,撮影画像情報に写っている陳列棚の棚段が水平に,そこに陳列されている商品に対する商品タグが垂直になるように行う補正処理である。
The captured image information
撮影画像情報正置化処理部22が実行する台形補正処理は,撮影画像情報において4頂点の指定の入力を受け付け,その各頂点を用いて台形補正処理を実行する。指定を受け付ける4頂点としては,陳列棚の棚段の4頂点であってもよいし,陳列棚の棚位置の4頂点であってもよい。また,2段,3段の棚段のまとまりの4頂点であってもよい。4頂点としては任意の4点を指定できる。
The keystone correction process executed by the captured image information
図7および図8に正置化処理がされた撮影画像情報(正置画像情報)の一例を示す。図7は,陳列棚として,ビールなどの飲料用缶の商品を,上下2段の棚段に陳列をしている正置画像情報である。図8は,歯ブラシなどの商品を陳列棚に吊す態様で陳列する吊し棚であって,上下2段に商品を陳列している正置画像情報である。 7 and 8 show an example of the photographed image information (normal image information) that has been subjected to the normalization process. FIG. 7 is vertical image information in which beverage can products such as beer are displayed on two upper and lower shelves as display shelves. FIG. 8 is a hanging shelf for displaying products such as toothbrushes on a display shelf, and is vertical image information in which the products are displayed in two upper and lower stages.
位置特定処理部23は,撮影画像情報正置化処理部22において撮影画像情報に対して台形補正処理を実行した正置画像情報のうち,商品タグが取り付けられる可能性のある領域(商品タグ配置領域)を特定する。すなわち,撮影画像情報および正置画像情報には陳列棚が写っているが,陳列棚には,商品が陳列される棚段の領域と,そこに陳列される商品に対する商品タグが取り付けられる可能性のある商品タグ配置領域とがある。そのため,正置画像情報から商品タグ配置領域を特定する。商品タグ配置領域の特定としては,管理端末2の操作者が手動で商品タグ配置領域を指定し,それを位置特定処理部23が受け付けてもよいし,初回に手動で入力を受け付けた商品タグ配置領域の情報に基づいて,二回目以降は自動で商品タグ配置領域を特定してもよい。
The position
図9に,図7の正置画像情報に対して商品タグ配置領域の指定の入力を受け付けた状態を模式的に示す。また,図10に,図8の正置画像情報に対して商品タグ配置領域の指定の入力を受け付けた状態を模式的に示す。 FIG. 9 schematically shows a state in which the input of the designation of the product tag placement area is accepted for the normal image information of FIG. 7. Further, FIG. 10 schematically shows a state in which the input of the designation of the product tag arrangement area is accepted for the normal image information of FIG.
商品タグ配置領域切出処理部24は,位置特定処理部23で特定した商品タグ配置領域の画像情報を商品タグ配置領域画像情報として切り出す。商品タグ配置領域切出処理部24は,実際に,画像情報として切り出してもよいし,実際には画像情報としては切り出さずに,仮想的に切り出すのでもよい。画像情報を仮想的に切り出すとは,特定した領域,たとえば商品タグ配置領域の範囲を処理対象として処理を実行させることをいう。
The product tag arrangement area
商品タグ配置領域正置化処理部25は,商品タグ配置領域切出処理部24において切り出した商品タグ配置領域画像情報を正置化する台形補正処理を実行する。陳列棚の面が垂直であるのに対し,商品タグの面は,顧客から見やすいように,垂直面よりも上向きをしていることが多い。そこで商品タグ配置領域の画像情報を正置化することで,認識精度を向上させる。図11に,図9の商品タグ配置領域の画像情報に対して,正置化した商品タグ配置領域の画像情報の一例を示す。図11(a)が図9における上の棚段の商品タグ配置領域の画像情報を正置化した商品タグ配置領域の画像情報であり,図11(b)が図9における下の棚段の商品タグ配置領域の画像情報を正置化した商品タグ配置領域の画像情報である。
The product tag placement area
商品タグ配置領域正置化処理部25は,以下のような処理を実行することで,商品タグ配置領域の画像情報を正置化する。すなわち,商品タグ配置領域の画像情報において,エッジ検出を行い,左右の両端に近い箇所で,一定の長さ以上の垂直に近い輪郭線(たとえば70度から110度のように,垂直(90度)から所定範囲の角度内の輪郭線)を特定する。なお,左右の両端に近い箇所の輪郭線を抽出することが好ましいが,それに限定しない。図9の商品タグ配置領域の画像情報の場合,図12に示すように,L1乃至L4をそれぞれ特定する。図12(a)が図9における上の棚段の商品タグ配置領域であり,図12(b)が図9における下の棚段の商品タグ配置領域である。なお,特定する輪郭線L1乃至L4は,実際に商品タグ配置領域の画像情報に描画するわけではない。そして図12(a)のL1,L2,図12(b)のL3,L4が,それぞれ垂直線となるように,商品タグ配置領域の画像情報に対する台形補正処理をそれぞれ実行する。このような処理を実行することで,商品タグ配置領域の画像情報を正置化し,図11に示す正置化した商品タグ配置領域の画像情報を得られる。なお,商品タグ配置領域正置化処理部25の処理を実行することで,商品タグ特定処理部26,商品タグ内情報特定処理部27の精度を向上させることができることから,その処理を実行することが好ましいが,省略することもできる。その場合,商品タグ特定処理部26,商品タグ内情報特定処理部27は,商品タグ配置領域切出処理部24で切り出した商品タグ配置領域に対して実行することとなる。
The product tag placement area
商品タグ特定処理部26は,正置化した商品タグ配置領域画像情報から,各商品タグの領域(商品タグ領域)を特定する。商品タグ領域の特定処理には,主に2種類の方法を用いることができる。第1の方法は,輪郭線に基づいて商品タグ領域を特定する方法であり,第2の方法は,全体の明暗の分布などの全体的な特徴を,商品タグのテンプレートの画像情報とマッチングすることで商品タグ領域を特定する方法である。第1の方法,第2の方法以外の方法を用いることもできる。
The product tag
第1の方法は,商品タグの地の色(背景色)が白色が多い(背景より明るい)ことを利用する方法である。すなわち,まず正置化した商品タグ配置領域の画像情報のうち,画像情報の明度情報を横方向に積算したヒストグラムを生成する。そしてヒストグラムの立ち上がり,立ち下がり位置を特定し,商品タグの上辺位置A,下辺位置Bを特定する。この処理を模式的に示すのが図13である。立ち上がりとは,ヒストグラムにおいて,黒から白の方向に急峻(あらかじめ定められた比率以上)に増加する箇所であり,立ち下がりとは,ヒストグラムにおいて,白から黒の方向に急峻に減少する箇所である。 The first method is a method that utilizes the fact that the background color (background color) of the product tag is often white (brighter than the background). That is, first, among the image information of the product tag placement area that has been placed upright, a histogram is generated in which the brightness information of the image information is integrated in the horizontal direction. Then, the rising and falling positions of the histogram are specified, and the upper side position A and the lower side position B of the product tag are specified. FIG. 13 schematically shows this process. The rising edge is the point where the histogram increases sharply from black to white (more than a predetermined ratio), and the falling edge is the point where the histogram sharply decreases from white to black. ..
そして,正置化した商品タグ配置領域の画像情報のうち,上辺位置A,下辺位置Bの間を切り出し,正置化した商品タグ配置領域画像情報の明度情報を縦方向に積算したヒストグラムを生成する。そして,ヒストグラムの立ち上がり,立ち下がり位置を特定し,立ち上がりとその右の所定の距離範囲にある立ち下がりとをペアとし,それぞれを左辺位置,右辺位置として,商品タグ領域を特定する。そして,ペアを形成できなかった立ち上がりについてはその右側に,ペアを形成できなかった立ち下がりについてはその左側に,あらかじめ定めた距離内に商品タグ領域がなければ,商品タグ領域として特定をする。この処理を模式的に示すのが図14である。 Then, out of the image information of the product tag placement area that has been placed upright, a histogram is generated in which the brightness information of the image information of the product tag placement area that has been placed upright is integrated in the vertical direction by cutting out between the upper side position A and the lower side position B. do. Then, the rising and falling positions of the histogram are specified, and the rising edge and the falling edge within a predetermined distance range to the right of the rising edge are paired, and the product tag area is specified by setting each as the left side position and the right side position. Then, if there is no product tag area within a predetermined distance, it is specified as a product tag area on the right side of the rising edge where the pair could not be formed and on the left side of the falling edge where the pair could not be formed. FIG. 14 schematically shows this process.
また第1の方法により,図11の正置化した商品タグ配置領域の画像情報から,商品タグ領域を特定した状態を図15に示す。上辺位置A,下辺位置B,左辺位置(立ち上がり)U,右辺位置(立ち下がり)Dのそれぞれで構成される矩形領域が,特定された商品タグの領域である。 Further, FIG. 15 shows a state in which the product tag area is specified from the image information of the product tag placement area that is placed upright in FIG. 11 by the first method. A rectangular area composed of each of the upper side position A, the lower side position B, the left side position (rising) U, and the right side position (falling) D is the specified product tag area.
第2の方法は,いわゆるテンプレートマッチングである。すなわち,テンプレートとして,商品タグの画像情報をあらかじめ登録しておき,テンプレートと,正置化した商品タグ配置領域の画像情報とのマッチングをすることで,商品タグ領域を特定する。 The second method is so-called template matching. That is, the product tag area is specified by registering the image information of the product tag as a template in advance and matching the template with the image information of the product tag placement area that has been placed upright.
商品タグには,税抜価格,税込価格,商品識別情報(商品名など),メーカー名,定格などが含まれる。そのため,テンプレートとなる商品タグの画像情報に,商品名など商品識別情報や価格の具体的な数字,文字を含めるとその部分も含めて画像マッチング処理の判定対象となるため,その部分をモザイク化,削除等することで,判定対象から中立化や除外してあることが好ましい。中立化とは,どんな入力について高い点,低い点を配点しないことであり,除外とは,画像マッチング処理の際に,その部分をマッチングの対象から除外することである。 The product tag includes the tax-excluded price, the tax-included price, the product identification information (product name, etc.), the manufacturer name, the rating, and the like. Therefore, if the image information of the product tag used as a template includes product identification information such as the product name, specific price numbers, and characters, that part is also included in the judgment target of the image matching process, so that part is mosaicked. , It is preferable to neutralize or exclude it from the judgment target by deleting it. Neutralization means not allocating high and low points for any input, and exclusion means excluding that part from the matching target during image matching processing.
商品タグ内情報特定処理部27は,商品タグ特定処理部26で特定した商品タグ領域に記載されている情報をOCR認識などにより特定する処理を実行する。OCR認識をする場合には,商品タグ領域として特定した領域のすべてまたは一部について行うことができる。商品タグ領域として特定したすべての領域に行うとノイズなどにより誤認識が発生する可能性が高いので,OCR認識をする対象領域を限定することが好ましい。この場合,商品タグ特定処理部26で用いた第1の方法,第2の方法にそれぞれ対応した処理を実行する。
The product tag information
商品タグ特定処理部26で第1の方法を用いた場合,特定した商品タグ領域において,まず二値化処理を行う。そして,二値化した画像情報においてラベリング処理を実行する。ラベリング処理とは,二値画像情報において,白または黒が連続した画素に同一の番号(識別情報)を割り振る処理を実行することで,連続する画素同士を一つの島(グループ)化する処理である。そしてラベリング処理によって検出した島を含む矩形領域(ボックス)を生成し,ボックスの高さ,幅,ベースラインを求める。ボックスを生成する際には,同一番号にラベリングされた領域を囲む最小の,垂直,水平の線分で囲まれた長方形を生成することが好ましいが,それに限定しない。なおボックスを生成する際に,あらかじめ定めた閾値となる高さ,幅を充足しない島はノイズとしてボックスを生成せず,そのまま処理対象から除去する。たとえば高さが小さすぎる島は横罫線や画像上のゴミの可能性があり,幅が広すぎる島はロゴなどの可能性があり,これらはノイズとして除去をする。
When the first method is used in the product tag specifying
商品タグで使用される文字は,一般的にはゴシック体など太字が多い。そのため,画像情報に多少のピンぼけがある場合でも,一つの文字列を形成する文字群は,ベースラインと高さがそろった島として検出することができる。 The characters used in product tags are generally in bold, such as Gothic. Therefore, even if the image information is slightly out of focus, the character group forming one character string can be detected as an island having the same height as the baseline.
そして商品タグ内情報特定処理部27は,所定の類似性を有する隣接したボックス同士を併合し,ブロックを構成する。すなわち,ベースラインと高さが所定範囲内で一致し,高さおよび幅が一定の閾値の範囲内にある連続するボックスを併合し,ブロックを構成する。この際に,併合するブロックの間にある小さいボックスなどもまとめて一つのブロックとして構成する。これによって,濁点,半濁点,ハイフンなども一つのブロックに取り込まれることとなる。ブロックは,OCR認識の対象となる領域である。そして,ブロックのうち,高さがもっとも高いブロックを価格領域(税抜価格領域)と推定し,OCR認識を行う。また,ほかのブロックについても同様に,OCR認識を行う。以上のような処理を実行することで,商品タグ領域において複数行にわたって自由にレイアウトされた原稿に対応したOCR認識を行うよりも精度よく,文字認識処理を実行することができる。この処理を模式的に示すのが図16乃至図18である。図16は二値化した画像情報であり,図17はボックス(破線で示す領域)を生成した状態を示す図である。また図18はブロック(破線で示す領域)を生成した状態を示す図である。
Then, the information
以上のようにして商品タグ内情報特定処理部27は,商品タグに記載した情報を文字認識することができる。
As described above, the information
商品タグ特定処理部26で第2の方法を用いた場合,テンプレートとした商品タグの画像情報に,あらかじめ税抜価格,税込価格,メーカー名,商品名などの商品識別情報,定格が表記されるそれぞれの文字枠の位置,大きさ(高さ,幅)が設定されている。そのため,商品タグ特定処理部26で特定した商品タグ領域から,該当箇所の画像情報を切り出し,OCR認識処理を実行する。この際に,価格,メーカー名,商品名などの商品識別情報,定格によって使用される文字種別(たとえば数字,ローマ字,記号,文字列など)を制約条件として定めておくことで,OCR認識処理の精度を向上させることができる。
When the second method is used in the product tag
さらに商品タグ内情報特定処理部27は,読み取った情報の整合性を確認する処理を実行する。整合性確認処理としては,辞書照合による整合性の確認処理,ロジカルチェックの2種類を行うことが好ましい。
Further, the information
辞書照合による整合性の確認処理は,たとえば以下のように実行する。画像認識システム1には,陳列棚に陳列される可能性のある商品の商品名などの商品識別情報と,それに対応するコード情報(たとえばJANコード)とを対応づけて記憶する商品辞書(図示せず)を備えている。そして,商品タグ内情報特定処理部27で認識した価格を示す領域から読み取った文字列以外の文字列と,商品辞書に登録されたすべての商品名などの商品識別情報との編集距離(レーベンシュタイン距離)を求める。そして求めた編集距離のうち,最小の編集距離が一つであるならば,その編集距離の商品名などの商品識別情報を最終候補とする。そして最終候補となった商品名などの商品識別情報の文字列の長さに対して,許容できる編集距離をあらかじめ定めておき,許容できる編集距離内であれば商品名などの商品識別情報を同定する。許容できる編集距離を超えていれば,読み取った文字列は未確定とする。また,最小の編集距離が複数ある場合には,読み取った文字列は未確定とする。
The consistency confirmation process by dictionary collation is executed as follows, for example. The
編集距離とは,二つの文字列がどの程度異なっているかを示す距離の一種であって,具体的には,一文字の挿入,削除,置換によって,一方の文字列をもう一方の文字列に変形するのに必要な手順の最小回数である。図19に商品タグに表記された商品名,OCR認識の結果,商品辞書に記憶する商品名のうち編集距離が最小の商品名,編集距離の一例を示す。また,図20に,最終候補の文字数ごとの確定してよい編集距離の対応関係の表を示す。なお,本明細書では編集距離を用いて処理をする場合を説明するが,編集距離の算出において置換の距離を短くする処理を行った距離関数であってもよい。この距離関数には,二つの文字列がどの程度異なっているかを示す距離を算出する関数であって,上述の編集距離も含まれる。 The edit distance is a type of distance that indicates how different the two character strings are. Specifically, one character string is transformed into the other character string by inserting, deleting, or replacing one character. The minimum number of steps required to do this. FIG. 19 shows an example of the product name and the editing distance with the shortest editing distance among the product names stored in the product dictionary as a result of the product name and OCR recognition written on the product tag. Further, FIG. 20 shows a table of correspondences of edit distances that may be determined for each number of characters of the final candidate. In this specification, the case where the processing is performed using the editing distance will be described, but the distance function may be a distance function that has been processed to shorten the replacement distance in the calculation of the editing distance. This distance function is a function that calculates the distance indicating how different the two character strings are, and includes the above-mentioned editing distance.
そして,上記の最小の編集距離の商品名などの商品識別情報を求めた後,OCR認識結果から商品名などの商品識別情報の該当部分を除いた文字列に対し,別に備える定格辞書(図示せず)に記憶する各定格との編集距離,メーカー名辞書(図示せず)に記憶する各メーカー名との編集距離をそれぞれ求める。たとえば図19における「のどごし 生 350ml」の例では,「350ml」の部分に対し,定格の辞書における「350ml」と編集距離0で一致し,定格部分の文字列であることを同定する。同様に,メーカー名についても編集距離を求め,最小の編集距離にある文字列をメーカー名であることを同定する。そしてOCR認識結果から定格部分,メーカー名部分の各文字列を取り除いて,取り除いた残りの文字列に対し,商品名辞書における最短の編集距離にある文字列を求め,許容できる編集距離であるか否かを判定する。許容できる編集距離内であれば,商品名などの商品識別情報,メーカー名,定格を確定する。このような処理をすることで,商品名などの商品識別情報に定格,メーカー名が含まれる場合にも適切に確定をすることができる。なお,定格辞書とは,陳列棚に陳列される可能性のある商品の定格(容量など)を記憶する辞書である。メーカー名辞書とは,陳列棚に陳列される可能性のある商品のメーカー名を記憶する辞書である。 Then, after obtaining the product identification information such as the product name with the minimum editing distance described above, a rating dictionary (shown) is separately prepared for the character string excluding the relevant part of the product identification information such as the product name from the OCR recognition result. The editing distance with each rating stored in (not shown) and the editing distance with each manufacturer name stored in the manufacturer name dictionary (not shown) are obtained. For example, in the example of "350 ml of throat raw" in FIG. 19, the part of "350 ml" matches "350 ml" in the rated dictionary with an editing distance of 0, and it is identified that it is a character string of the rated part. Similarly, the editing distance is obtained for the maker name, and the character string with the minimum editing distance is identified as the maker name. Then, each character string of the rated part and the manufacturer name part is removed from the OCR recognition result, and the character string having the shortest editing distance in the product name dictionary is obtained from the removed remaining character string, and is it an acceptable editing distance? Judge whether or not. If it is within the allowable editing distance, determine the product identification information such as the product name, the manufacturer name, and the rating. By performing such processing, even if the product identification information such as the product name includes the rating and the manufacturer name, it can be appropriately determined. The rating dictionary is a dictionary that stores the ratings (capacity, etc.) of products that may be displayed on the display shelves. The manufacturer name dictionary is a dictionary that stores the manufacturer names of products that may be displayed on the display shelf.
認識結果を利用者に示し,選択してもらうための表示を行う際には,確定した文字列,未確定の文字列については,それぞれが特定可能な方法で表示が行われているとよい。たとえば確定した文字列と未確定の文字列との色を分ける,確定の文字列および/または未確定の文字列には確定または未確定を示す情報を付するなどがある。未確定の文字列については,最小の編集距離となった商品名などの商品識別情報の候補が複数ある場合には,各候補を表示してもよい。 When displaying the recognition result to the user and displaying it for selection, it is preferable that the confirmed character string and the unconfirmed character string are displayed in a method that can be identified by each. For example, the color of a confirmed character string and an unconfirmed character string may be separated, and information indicating confirmed or unconfirmed may be added to a confirmed character string and / or an unconfirmed character string. For undetermined character strings, if there are multiple candidates for product identification information such as the product name with the minimum editing distance, each candidate may be displayed.
商品タグ内情報特定処理部27におけるロジカルチェック(認識した情報の論理的整合性の判定処理)は以下のように行うことができる。たとえば価格領域として2つの価格を読み取った場合,一つは税抜価格,一つは税込価格となるが,税抜価格が税込価格よりも高くなっている場合には,それらを逆転して認識させる。また,税抜価格に消費税率を乗算して得た値が税込価格とは一致しない場合には,いずれかまたは双方に誤認識があるとする。さらに,商品名などの商品識別情報を認識した場合には,その商品または商品カテゴリの通常の価格帯に収まっているか,を判定する。また,商品名などの商品識別情報,メーカー名,定格の対応関係が一致しているかを判定してもよい。
The logical check (the processing for determining the logical consistency of the recognized information) in the information specifying
以上のように商品タグ内の情報の整合性を確認することで,撮影画像情報に写っている商品タグに含まれる情報を確定することができる。このように確定した情報は,たとえば表形式で出力をすることができる。 By confirming the consistency of the information in the product tag as described above, the information included in the product tag reflected in the photographed image information can be determined. The information determined in this way can be output in tabular format, for example.
つぎに本発明の画像認識システム1の処理プロセスの一例を図3乃至図6のフローチャートを用いて説明する。
Next, an example of the processing process of the
店舗の陳列棚が撮影された撮影画像情報は,撮影画像情報入力端末4から入力され,管理端末2の撮影画像情報入力受付処理部20でその入力を受け付ける(S100)。図21および図22に,撮影画像情報の一例を示す。また,撮影日時,店舗識別情報,撮影画像情報の画像情報識別情報の入力を受け付ける。そして,撮影画像情報入力受付処理部20は,入力を受け付けた撮影画像情報,撮影日時,店舗識別情報,撮影画像情報の画像情報識別情報を対応づけて撮影画像情報記憶部21に記憶させる。
The photographed image information photographed on the display shelf of the store is input from the photographed image
管理端末2において所定の操作入力を受け付けると,正置画像情報正置化処理部は,撮影画像情報記憶部21に記憶する撮影画像情報を抽出し,台形補正処理を行うための頂点である棚位置(陳列棚の位置)の4点の入力を受け付け,台形補正処理を実行する(S110)。このようにして台形補正処理が実行された撮影画像情報(正置画像情報)の一例が,図7および図8である。
When the
そして,正置画像情報に対して,管理端末2において所定の操作入力を受け付けることで,位置特定処理部23は,商品タグ配置領域を特定する(S120)。すなわち,正置画像情報における商品タグ配置領域の入力を受け付ける。図9および図10が,商品タグ配置領域が特定された状態を示す図である。そして,商品タグ配置領域切出処理部24はS120で特定した商品タグ配置領域の画像情報を切り出し(S130),商品タグ配置領域正置化処理部25が台形補正処理を実行することで,商品タグ配置領域の画像情報に対する正置化処理を実行する(S140)。
Then, the position specifying
商品タグ配置領域の画像情報に対する正置化処理としては,まず,商品タグ配置領域の画像情報においてエッジ検出を行う。そして,検出したエッジのうち,一定の長さ以上であって,垂直から所定範囲の角度内にある輪郭線を特定する(S200)。そして,特定した輪郭線のうち,もっとも左および右にある輪郭線を特定する(S210)。このように特定した輪郭線の一例を図12に示す。そして,特定した輪郭線(図12(a)のL1,L2,図12(b)のL3,L4)が,それぞれ垂直線となるように,商品タグ配置領域の画像情報に対する台形補正処理を実行する(S220)。このような処理を実行することで,商品タグ配置領域の画像情報を正置化し,図11に示す正置化した商品タグ配置領域の画像情報を得られる。 As the normalization process for the image information in the product tag placement area, first, edge detection is performed in the image information in the product tag placement area. Then, among the detected edges, a contour line having a certain length or more and within an angle within a predetermined range from the vertical is specified (S200). Then, among the specified contour lines, the leftmost and rightmost contour lines are specified (S210). An example of the contour line thus specified is shown in FIG. Then, the trapezoidal correction process is executed for the image information of the product tag arrangement area so that the specified contour lines (L1, L2 in FIG. 12A and L3 and L4 in FIG. 12B) become vertical lines, respectively. (S220). By executing such a process, the image information of the product tag arrangement area is made normal, and the image information of the product tag arrangement area shown in FIG. 11 can be obtained.
S140において商品タグ配置領域の画像情報の正置化処理が終了すると,商品タグ特定処理部26が,第1の方法または第2の方法により,商品タグ配置領域の画像情報から,個々の商品タグ領域を特定する(S150)。
When the process of normalizing the image information of the product tag placement area is completed in S140, the product tag
第1の方法の場合には,正置化した商品タグ配置領域の画像情報のうち,画像情報の明度情報を横方向に積算したヒストグラムを生成し(S300),ヒストグラムの立ち上がり,立ち下がり位置を特定する。そして,特定したヒストグラムの立ち上がりを商品タグの上辺位置A,ヒストグラムの立ち下がり位置を商品タグの下辺位置Bとして特定する(S310)。 In the case of the first method, among the image information of the product tag placement area that has been placed upright, a histogram that integrates the brightness information of the image information in the horizontal direction is generated (S300), and the rising and falling positions of the histogram are set. Identify. Then, the rising position of the specified histogram is specified as the upper side position A of the product tag, and the falling position of the histogram is specified as the lower side position B of the product tag (S310).
つぎに,正置化した商品タグ配置領域の画像情報のうち,上辺位置A,下辺位置Bの間を切り出し,正置化した商品タグ配置領域の画像情報の明度情報を縦方向に積算したヒストグラムを生成する(S320)。 Next, of the image information of the product tag placement area that has been placed upright, a histogram that cuts out between the upper side position A and the lower side position B and integrates the brightness information of the image information of the product tag placement area that has been placed upright in the vertical direction. Is generated (S320).
生成したヒストグラムにおいて立ち上がり位置U,立ち下がり位置Dを特定し,立ち上がり位置U(左辺位置)とその右の所定の距離範囲にある立ち下がり位置D(右辺位置)とをペアとして特定し,商品タグ領域として特定する(S330)。 In the generated histogram, the rising position U and the falling position D are specified, the rising position U (left side position) and the falling position D (right side position) within a predetermined distance range to the right of the rising position U are specified as a pair, and the product tag is specified. It is specified as an area (S330).
ペアを形成できなかった立ち上がり位置Uについてはその右側に,ペアを形成できなかった立ち下がり位置Dについてはその左側に,あらかじめ定めた距離内に商品タグ領域がなければ,商品タグ領域として特定をする(S340)。 If there is no product tag area within a predetermined distance, specify it as a product tag area on the right side of the rising position U where the pair could not be formed, and on the left side of the falling position D where the pair could not be formed. (S340).
以上のような処理によって,それぞれの商品タグ領域を特定した状態が図15である。 FIG. 15 shows a state in which each product tag area is specified by the above processing.
また第2の方法を用いる場合には,商品タグ特定処理部26は,あらかじめ登録しているテンプレートの商品タグの画像情報と,正置化した商品タグ配置領域の画像情報との画像マッチング処理を実行することで,商品タグ領域を特定する。
When the second method is used, the product tag
以上のようにして商品タグ特定処理部26が商品タグ領域を特定すると,商品タグ内情報特定処理部27が,商品タグ内における情報を特定する(S160)。
When the product tag specifying
商品タグ内情報特定処理部27における第1の方法は,特定した商品タグ領域について二値化処理することで,二値化した画像情報とする(S400)。そして,二値化した画像情報におけるラベリング処理により,ボックスを特定する(S410)。なお,あらかじめ定めた閾値となる高さ,幅を充足しない島はノイズとしてボックスを生成せず,そのまま処理対象から除去する。
The first method in the product tag information specifying
そして生成したボックスの高さ,幅,ベースラインを求め,ベースラインと高さが所定範囲内で一致し,高さおよび幅が一定の閾値の範囲内にある隣接するボックスを特定することで,特定したボックスを併合し,ブロックを構成する(S420)。そしてブロックのうち,高さがもっとも高いブロックを価格領域(税抜価格領域)と推定し,OCR認識を行う(S430)。OCR認識の結果,価格情報を得られなければ(数値の文字列を認識できなければ)(S440),高さが次に高いブロックを価格領域(税抜価格領域)と推定し,同様にOCR認識を行う。 Then, by finding the height, width, and baseline of the generated box, and identifying adjacent boxes whose baseline and height match within a predetermined range and whose height and width are within a certain threshold range, The specified boxes are merged to form a block (S420). Then, among the blocks, the block with the highest height is estimated as the price range (price range excluding tax), and OCR recognition is performed (S430). If the price information cannot be obtained as a result of OCR recognition (if the numerical character string cannot be recognized) (S440), the block with the next highest height is estimated to be the price range (tax-excluded price range), and the OCR is also obtained. Recognize.
なおS430のOCR認識においては,価格に用いる「数字」,「コンマ」等の価格表示を構成する文字認識を制約条件として付加することで価格の読み取り精度を向上することができる。 In the OCR recognition of S430, the reading accuracy of the price can be improved by adding the character recognition constituting the price display such as "number" and "comma" used for the price as a constraint condition.
このように価格領域(税抜価格領域)と推定したブロックから価格情報をOCR認識により取得すると(S440),S430で価格領域(税抜価格領域)と推定して取得した価格情報以外のブロックを特定し(S450),特定した各ブロックに対してOCR認識を行う(S460)。このOCR認識については,2種類のOCR認識処理を行うことが好ましい。すなわち,通常の標準的なOCR認識処理と,価格表示を構成する文字認識を制約条件として付加したOCR認識処理である。 When the price information is acquired by OCR recognition from the block estimated as the price area (tax-excluded price area) in this way (S440), the blocks other than the price information acquired by estimating the price area (tax-excluded price area) in S430 are obtained. It is specified (S450), and OCR recognition is performed for each specified block (S460). For this OCR recognition, it is preferable to perform two types of OCR recognition processing. That is, it is an ordinary standard OCR recognition process and an OCR recognition process in which character recognition constituting a price display is added as a constraint condition.
S450で特定したブロックには,価格領域(税込価格領域)のブロックと,メーカー名,商品名などの商品識別情報,定格などの情報の領域のブロックが含まれる。そして各ブロックについて2種類のOCR認識処理を実行する。メーカー名,商品名などの商品識別情報,定格などの情報の領域のブロックについては,標準的なOCR認識処理では文字列を認識し,制約条件を付したOCR認識処理では多くはエラーを含む文字列となる。この場合,2つの認識処理の認識結果が所定値以上相違するかを判定し,相違する場合には,標準的なOCR認識処理で実行した文字列を認識結果とし,価格領域(税込価格領域)のブロック以外のブロックであると判定する。一方,価格領域(税込価格領域)のブロックについては,標準的なOCR認識処理では価格情報の文字列を認識し,制約条件を付したOCR認識処理でも価格情報の文字列を認識する。この場合,2つの認識処理の認識結果が所定値以上相違するかを判定し,相違しない場合には,価格領域(税込価格領域)のブロックであると判定し,制約条件を付加した認識処理による文字列を認識結果の価格情報とする。 The block specified in S450 includes a block in the price area (price area including tax) and a block in the area of information such as product identification information such as manufacturer name and product name, and rating. Then, two types of OCR recognition processing are executed for each block. For blocks in the area of product identification information such as manufacturer name and product name, and information such as rating, character strings are recognized by standard OCR recognition processing, and many characters containing errors in OCR recognition processing with constraints. Become a column. In this case, it is determined whether the recognition results of the two recognition processes differ by a predetermined value or more, and if they differ, the character string executed by the standard OCR recognition process is used as the recognition result, and the price area (tax-included price area). It is determined that the block is other than the block of. On the other hand, for blocks in the price area (price area including tax), the standard OCR recognition process recognizes the price information character string, and the constrained OCR recognition process also recognizes the price information character string. In this case, it is determined whether the recognition results of the two recognition processes differ by a predetermined value or more, and if they do not differ, it is determined that the block is in the price range (price range including tax), and the recognition process with constraints added. The character string is used as the price information of the recognition result.
以上のようにして商品タグ内情報特定処理部27は,商品タグに記載した情報を文字認識することができる。
As described above, the information
なお,商品タグ特定処理部26で第2の方法を用いた場合には,テンプレートとした商品タグには,あらかじめ税抜価格,税込価格,メーカー名,商品名などの商品識別情報,定格がそれぞれ表記される文字枠の位置,サイズが設定されている。そのため,商品タグ特定処理部26で特定した商品タグ領域から,該当箇所の画像情報を切り出し,OCR認識処理を実行すればよい。
When the second method is used in the product tag specifying
そして商品タグ内情報特定処理部27は,特定した商品名等との辞書照合処理を実行する(S470)。すなわち,読み取った文字列と,商品辞書における各商品名などの商品識別情報との編集距離を求め,最小の編集距離の商品名などの商品識別情報を特定し,それがあらかじめ定めた所定距離内であれば商品名などの商品識別情報として同定する。そして,読み取った文字列から最短の編集距離の商品名部分を取り除き,残りの部分文字列に対し,定格辞書における各定格との編集距離を求め,最小の編集距離が所定距離内であるかを判定して,所定距離内にあればその部分を定格の文字列として同定する。同様に,読み取った文字列から最小の編集距離の商品名部分と定格部分を取り除き,残りの部分文字列に対し,メーカー名辞書における各メーカー名との編集距離を求め,最小の編集距離が所定距離内であるかを判定して,所定距離内にあればその部分をメーカー名の文字列として同定する。
Then, the product tag information specifying
さらに,商品タグ内情報特定処理部27は,文字認識した文字列に対するロジカルチェックの処理を実行する(S480)。すなわち文字認識した文字列が論理的に矛盾しないか,などを判定する。
Further, the product tag information
ロジカルチェックの結果,矛盾がないようであれば,それぞれ認識した文字列について,税抜価格,税込価格,商品名などの商品識別情報,メーカー,定格を特定し,それらを,撮影日時,店舗識別情報,撮影画像情報の画像情報識別情報と対応づけて所定の記憶領域に記憶,出力をする。たとえば表形式で出力をする。 If there is no inconsistency as a result of the logical check, identify the product identification information such as tax-excluded price, tax-included price, product name, manufacturer, and rating for each recognized character string, and identify them as the shooting date and time and store identification. Information and captured image information is stored and output in a predetermined storage area in association with the image information identification information. For example, output in tabular format.
実施例1においては,撮影画像情報から商品タグに記載される情報を読み取る場合を説明したが,さらに,陳列棚に陳列する商品の画像認識と対応づけるようにしてもよい。すなわち,陳列棚に陳列する商品の商品名などの商品識別情報を,商品タグに記載される情報からも特定し,それらを照合するようにしてもよい。 In the first embodiment, the case where the information described in the product tag is read from the photographed image information has been described, but further, it may be associated with the image recognition of the product displayed on the display shelf. That is, the product identification information such as the product name of the product displayed on the display shelf may be specified from the information described in the product tag and collated with each other.
この場合,実施例1の画像認識システム1は,本実施例2における画像認識システム1の一部の機能を構成する。実施例2における画像認識システム1は,撮影画像情報入力受付処理部20と,撮影画像情報記憶部21と,撮影画像情報記憶部21と,撮影画像情報正置化処理部22と,位置特定処理部23と,商品タグ認識処理部28と,陳列商品認識処理部29と,標本画像情報記憶部30と,商品識別情報記憶部31と,整合性判定処理部32と,認識結果照合処理部33とを有する。図23に,実施例2における画像認識システム1のシステム構成の一例を示す。また,図24に商品タグ認識処理部28の構成の一例を,図25に陳列商品認識処理部29の構成の一例を示す。
In this case, the
画像認識システム1における管理端末2は,撮影画像情報入力端末4とネットワークを介して情報の送受信が可能である。
The
撮影画像情報入力受付処理部20,撮影画像情報記憶部21,撮影画像情報正置化処理部22は,実施例1と同様である。
The photographed image information input
位置特定処理部23は,実施例1における位置特定処理部23の機能に加え,棚段の領域(棚段領域)を特定する。すなわち,撮影画像情報および正置画像情報に写っている陳列棚のうち,商品が陳列される棚段領域と,そこに陳列される商品に対する商品タグが取り付けられている商品タグ配置領域とがある。そのため,正置画像情報から商品タグ配置領域と棚段領域とを特定する。商品タグ配置領域,棚段領域の特定としては,管理端末2の操作者が手動で商品タグ配置領域,棚段領域を指定し,それを位置特定処理部23が受け付けてもよいし,初回に手動で入力を受け付けた商品タグ配置領域,棚段領域の情報に基づいて,二回目以降は自動で商品タグ配置領域,棚段領域を特定してもよい。
The position
商品タグ認識処理部28は,商品タグの認識処理を実行する。すなわち,実施例1の画像認識システム1における商品タグ配置領域切出処理部24,商品タグ配置領域正置化処理部25,商品タグ特定処理部26,商品タグ内情報特定処理部27の各処理を実行する。各処理部における処理は,実施例1の画像認識システム1の場合と同様である。
The product tag
陳列商品認識処理部29は,撮影画像情報に写っている陳列棚における棚段に陳列されている商品を認識する処理を実行する。陳列商品認識処理部29は,棚段領域切出処理部291とフェイス特定処理部292と商品識別情報特定処理部293と棚段画像マッチング処理部294とを有する。
The display product
棚段領域切出処理部291は,位置特定処理部23で特定した棚段の領域の画像情報を棚段領域画像情報として切り出す。棚段領域切出処理部291は,実際に,画像情報として切り出してもよいし,実際には画像情報としては切り出さずに,仮想的に切り出すのでもよい。なお,陳列棚に棚段が複数ある場合には,それぞれが棚段領域画像情報として切り出される。
The shelf area
フェイス特定処理部292は,正置画像情報における棚段領域における棚段ごとに,商品が置かれているフェイス(商品が置かれている領域)を特定する。フェイス特定処理部292は,初回のフェイスの特定処理と,二回目以降のフェイスの特定処理とに分かれる。
The face specifying
フェイス特定処理部292における初回のフェイスの特定処理は,位置特定処理部23で特定した棚段の座標で構成される領域(好ましくは矩形領域)の範囲内において,商品が置かれている領域(フェイス)を特定する。具体的には,商品と商品との間に生じる細く狭い陰影を特定する,画像の繰り返しパターンを特定する,パッケージの上辺の段差を特定する,商品幅が同一であるなどの制約に基づいて区切り位置を特定する,などによって,フェイスの領域を特定する。フェイスの特定処理としては,商品のカテゴリや商品の形態によって,任意の方法を採用可能であり,上記に限定するものではない。また,自動的に特定したフェイスに対して,担当者による修正入力を受け付けてもよい。さらに,担当者からフェイスの位置の入力を受け付けるのでもよい。特定したフェイスを構成する領域の座標は,正置画像情報におけるフェイスの領域の座標に,撮影日時情報,店舗情報,撮影画像情報の画像情報識別情報,正置画像情報の画像識別情報,フェイスを識別するためのフェイス識別情報とを対応づけて管理する。またフェイスの領域を示す座標としては,矩形領域を特定するために必要な頂点の座標であり,たとえば4点,または右上と左下,左上と右下の2点の座標でよい。
The first face identification process in the face
フェイス特定処理部292における二回目以降のフェイスの特定処理は,同一の陳列棚の同一の棚段について,前回(N−1回目)の正置画像情報で特定したフェイスの領域の座標を今回(N回目)の正置画像情報で特定したフェイスの領域の座標とする。
In the second and subsequent face identification processes in the face
フェイスの領域の座標は,棚段の位置の座標と同様に,正置画像情報における陳列棚など,画像情報における所定箇所(たとえば陳列棚の左上の頂点C1)を基準とした相対座標である。 Similar to the coordinates of the position of the shelf, the coordinates of the face area are relative coordinates based on a predetermined position in the image information (for example, the upper left vertex C1 of the display shelf) such as the display shelf in the vertical image information.
商品識別情報特定処理部293は,陳列棚の棚段ごとに,フェイスに表示されている商品の商品識別情報を特定する。商品識別情報としては,商品名のほか,その商品に対して割り当てられているJANコードなどがあるが,それに限定されない。商品を識別することができる情報であればいかなるものでもよい。
The product identification information
商品識別情報特定処理部293は,以下のような処理を実行する。すなわち,フェイスごとに,フェイスの画像情報と,後述する標本画像情報記憶部30に記憶する商品の標本画像情報とマッチングすることで,そのフェイスに表示されている商品の商品識別情報を特定する。具体的には,まず,処理対象となるフェイスの座標で構成される領域の画像情報と,標本画像情報記憶部30に記憶する標本画像情報との類似性を判定し,その類似性がもっとも高い標本画像情報に対応する商品識別情報を,上記座標で構成されるフェイスに表示されている商品の商品識別情報として特定をする。
The product identification information
ここでフェイスの画像情報と標本画像情報との類似性を判定するには,以下のような処理を行う。まず,商品識別情報特定処理部293における商品識別情報の特定処理の前までの処理において,正置画像情報の棚段におけるフェイスの領域の画像情報と,標本画像情報との方向が同じ(横転や倒立していない)となっており,また,それぞれの画像情報の大きさがおおよそ同じとなっている(所定範囲以上で画像情報の大きさが異なる場合には,類似性の判定の前にそれぞれの画像情報の大きさが所定範囲内となるようにサイズ合わせをしておく)。そして,フェイスの画像情報と,標本画像情報との類似性は,フェイスの画像情報の画像特徴量(たとえば局所特徴量)に基づく特徴点と,標本画像情報との画像特徴量(たとえば局所特徴量)に基づく特徴点を,それぞれ抽出する。そして,フェイスの画像情報の特徴点と,標本画像情報の特徴点とでもっとも類似性が高いペアを検出し,それぞれで対応する点の座標の差を求める。そして,差の平均値を求める。差の平均値は,フェイスの画像情報と,標本画像情報との全体の平均移動量を示している。そして,すべての特徴点のペアの座標差を平均の座標差と比較し,外れ度合いの大きなペアを除外する。そして,残った対応点の数で類似性を順位付ける。
Here, in order to determine the similarity between the face image information and the sample image information, the following processing is performed. First, in the processing before the product identification information identification processing in the product identification information
以上のような方法でフェイスの画像情報と,標本画像情報との類似性を算出できる。また,その精度を向上させるため,さらに,色ヒストグラム同士のEMD(Earth Movers Distance)を求め,類似性の尺度としてもよい。これによって,撮影された画像情報の明度情報等の環境変化に比較的強い類似性の比較を行うことができ,高精度で特定をすることができる。なお,類似性の判定は,上述に限定をするものではない。特定した商品識別情報は,撮影日時情報,店舗情報,撮影画像情報の画像情報識別情報,正置画像情報の画像識別情報,フェイスを識別するためのフェイス識別情報に対応づけて商品識別情報記憶部31に記憶する。 The similarity between the face image information and the sample image information can be calculated by the above method. Further, in order to improve the accuracy, the EMD (Earth Movers Distance) between the color histograms may be obtained and used as a measure of similarity. As a result, it is possible to compare the similarity of the captured image information, which is relatively strong against environmental changes such as the brightness information, and to specify it with high accuracy. The determination of similarity is not limited to the above. The identified product identification information corresponds to the shooting date / time information, the store information, the image information identification information of the shooting image information, the image identification information of the normal image information, and the face identification information for identifying the face, and the product identification information storage unit. Store in 31.
以上のようにして特定した商品識別情報は,撮影日時情報,店舗情報,撮影画像情報の画像情報識別情報,正置画像情報の画像識別情報,フェイスを識別するためのフェイス識別情報に対応づけて商品識別情報記憶部31に記憶する。
The product identification information identified as described above is associated with the shooting date / time information, the store information, the image information identification information of the shooting image information, the image identification information of the orthodox image information, and the face identification information for identifying the face. It is stored in the product identification
棚段画像マッチング処理部294は,前回(N−1回目)の正置画像情報における棚段の領域の画像情報と,今回(N回目)の正置画像情報における棚段の領域の画像情報とに基づいて,その類似性が高ければその棚段における各フェイスの商品識別情報は同一と判定する。この類似性の判定処理は,上述のように,前回(N−1回目)の正置画像情報における棚段の領域の画像情報の画像特徴量と,今回(N回目)の正置画像情報における棚段の領域の画像情報とに基づく類似性の判定でもよいし,色ヒストグラム同士のEMDを用いたものであってもよい。また,それらに限定するものではない。そして,商品識別情報特定処理部293におけるフェイス単位ごとの特定処理ではなく,商品識別情報特定処理部293に,N回目の正置画像情報におけるその棚段における各フェイスの商品識別情報を,N−1回目の同一の棚段における各フェイスの商品識別情報と同一として,商品識別情報記憶部31に記憶させる。これによって,あまり商品の動きがない棚段や逆にきわめて短いサイクルで管理される棚段など,変化がほとんど生じない棚段についての処理を省略することができる。なお,棚段画像マッチング処理部294による処理は設けなくてもよい。
The shelf image matching
標本画像情報記憶部30は,正置画像情報に写っている陳列棚の棚段における各フェイスの商品がどの商品であるかを識別するための標本画像情報を記憶する。標本画像情報は,陳列棚に陳列される可能性のある商品を,上下,左右,斜めなど複数の角度から撮影をした画像情報である。図28に標本画像情報記憶部30に記憶される標本画像情報の一例を示す。図28では,標本画像情報として,缶ビールをさまざまな角度から撮影をした場合を示しているが,缶ビールに限られない。標本画像情報記憶部30は,標本画像情報と,商品識別情報とを対応付けて記憶する。
The sample image
なお,標本画像情報記憶部30には,標本画像情報とともに,または標本画像情報に代えて,標本画像情報から抽出された,類似性の算出に必要となる情報,たとえば画像特徴量とその位置のペアの情報を記憶していてもよい。標本画像情報には,類似性の算出に必要となる情報も含むとする。この場合,商品識別情報特定処理部293は,フェイスの領域の画像情報と,標本画像情報とのマッチング処理を行う際に,標本画像情報について毎回,画像特徴量を算出せずともよくなり,計算時間を短縮することができる。
In the sample image
商品識別情報記憶部31は,陳列棚の棚段の各フェイスに表示されている商品の商品識別情報を記憶する。たとえば,商品識別情報に対応付けて,撮影日時情報,店舗情報,撮影画像情報の画像情報識別情報,正置画像情報の画像識別情報,フェイスを識別するためのフェイス識別情報に対応づけて商品識別情報記憶部31に記憶する。
The product identification
整合性判定処理部32は,商品タグ認識処理部28による商品タグに表示される情報の認識結果と,陳列商品認識処理部29による商品(商品識別情報)の認識結果について,各棚や各棚段に含まれている可能性の高い商品かどうかの整合性を判定する。たとえば,商品タグに表示される情報の認識結果,または商品の認識結果において,定格が350mlの商品と認識しているが,その商品の陳列棚または棚段には500mlの商品が陳列されていること定められている場合には,同一の商品名の定格を「500ml」に変更する。陳列棚または棚段に載置される商品については,あらかじめ設定されており,撮影画像情報記憶部21に記憶する撮影画像情報に対応づけられていることが好ましい。
The consistency
認識結果照合処理部33は,陳列商品認識処理部29において認識したフェイスごとの商品の商品識別情報と,商品タグ認識処理部28において認識した商品の情報(商品識別情報)とを突合し,認識結果が一致しているかを照合する。
The recognition result
具体的には,まず陳列商品認識処理部29による認識処理の結果,類似性の高いフェイスが並んでいる区画を一群として,一つの棚段に何群あるかを特定する。また,それぞれの群の棚段の左右位置がどこかを特定する。そして,各群と左右位置が一致している,商品タグ認識処理部28による商品タグの認識結果の情報を,各群に対応づける。
Specifically, first, as a result of the recognition process by the display product
フェイスによる群と商品タグとが対応づけている場合,以下の処理を実行する。まず,商品タグ認識処理部28による商品タグの認識の結果,読み取った商品名(商品識別情報)を,尤度付きの候補商品リストに変換をする。この場合,商品A1である確率をp1,商品A2である確率をp2といったように確率に対応させて変換をする。なお,商品タグの認識結果から,メーカー名や定格情報が得られている場合には,そのメーカーの商品,その定格が存在する商品の尤度を高く設定する。また,商品タグの認識結果から価格情報が得られている場合には,その価格帯を売価としてもつ商品の尤度を高くする。さらに,税抜価格と税込価格の2つの価格が読み取られ,それらの間の比率がちょうど消費税の有無に一致しているなど,ロジカルチェックと一致している場合には,尤度を一層,高く設定する。加えて,このとき,陳列棚の棚段に陳列されている商品のジャンルなどがわかっている場合には,それらのジャンルに属する商品の尤度を高くまたは低く設定する。
When the group by face and the product tag are associated, the following processing is executed. First, as a result of product tag recognition by the product tag
そして陳列商品認識処理部29による認識の結果,認識した商品の情報についても,同様に,画像類似性の程度に基づいて,尤度付きの候補商品リストを与える。この場合,商品B1である確率をPb1,商品B2である確率をPb2といったように確率に対応させて変換をする。
Then, as a result of the recognition by the display product
そして,商品タグの認識結果による商品A1,A2などの各候補商品のリストと,陳列商品認識処理部29の認識結果による商品B1,B2などの各候補商品のリストとを比較し,商品が両方に現れる(ケース1),A群のみに現れる(ケース2),B群のみに現れる(ケース3)のいずれかに分類をし,ケース1についてはそれぞれのA群,B群の商品の尤度を合成した,いずれよりも高い尤度とする。また,ケース2,ケース3については,商品タグ認識処理部28による商品タグの認識結果の精度と,陳列商品認識処理部29による商品情報の認識結果の精度の総意を反映させた合成関数を適用することで,最終的な尤度付きの候補商品リストを生成する。
Then, the list of each candidate product such as products A1 and A2 based on the recognition result of the product tag is compared with the list of each candidate product such as products B1 and B2 based on the recognition result of the display product
以上のように最終的な尤度付きの候補商品リストを生成することで,候補となる商品を順位づけて特定することができるので,たとえば最上位(1位)の候補となる商品を商品として確定してもよいし,1位から所定順位までの候補となる商品を表示させ,目視の判断結果の選択入力を受け付けてもよい。 By generating the final list of candidate products with likelihood as described above, the candidate products can be ranked and specified. Therefore, for example, the highest (first) candidate product is used as the product. It may be confirmed, or the candidate products from the first place to the predetermined order may be displayed and the selection input of the visual judgment result may be accepted.
そして,確定した商品について,再度,読み取られた価格の尤度を算出する。すなわち,税抜価格と税込価格の比率,商品の売価の範囲内か,同商品の頻出価格との一致性または乖離性を判定し,価格の尤度を決定する。そして,この尤度があらかじめ定められた閾値よりも高ければその価格を自動的に確定し,低ければその旨を表示に反映させ,選択による入力を受け付けてもよい。 Then, the likelihood of the read price is calculated again for the confirmed product. That is, the ratio of the tax-excluded price to the tax-included price, whether it is within the range of the selling price of the product, or the consistency or divergence with the frequent price of the product is determined, and the likelihood of the price is determined. Then, if this likelihood is higher than a predetermined threshold value, the price may be automatically determined, and if it is lower, that fact may be reflected in the display and input by selection may be accepted.
つぎに本実施例2における画像認識システム1の処理プロセスの一例を図26のフローチャートを用いて説明する。なお,実施例1と同様の処理は説明を省略する。
Next, an example of the processing process of the
店舗の陳列棚が撮影された撮影画像情報(図21,図22)は,撮影画像情報入力端末4から入力され,管理端末2の撮影画像情報入力受付処理部20でその入力を受け付ける(S100)。また,撮影日時,店舗識別情報,撮影画像情報の画像情報識別情報の入力を受け付ける。そして,撮影画像情報入力受付処理部20は,入力を受け付けた撮影画像情報,撮影日時,店舗識別情報,撮影画像情報の画像情報識別情報を対応づけて撮影画像情報記憶部21に記憶させる。
The photographed image information (FIGS. 21 and 22) photographed on the display shelf of the store is input from the photographed image
管理端末2において所定の操作入力を受け付けると,撮影画像情報正置化処理部22は,撮影画像情報記憶部21に記憶する撮影画像情報を抽出し,台形補正処理を行うための頂点である棚位置(陳列棚の位置)の4点の入力を受け付け,台形補正処理を実行する(S110)。このようにして台形補正処理が実行された撮影画像情報(正置画像情報)の一例が,図7,図8である。
When the
そして,正置画像情報に対して,管理端末2において所定の操作入力を受け付けることで,位置特定処理部23は,棚段領域および商品タグ配置領域を特定する(S120)。すなわち,正置画像情報における棚段領域,商品タグ配置領域の入力を受け付ける。図29および図30が,棚段領域および商品タグ配置領域が特定された状態を示す図である。
Then, the position specifying
以上のようにして,棚段領域,商品タグ配置領域を特定すると,棚段領域における陳列商品の認識処理を陳列商品認識処理部29が,商品タグ配置領域における商品タグ認識処理を商品タグ認識処理部28がそれぞれ実行する。なお陳列商品認識処理部29における陳列商品の認識処理,商品タグ認識処理部28による商品タグ認識処理は,並行して行ってもよいし,異なるタイミングで行ってもよい。
When the shelf area and the product tag arrangement area are specified as described above, the display product
商品タグ認識処理部28における商品タグ認識処理(S130乃至S160)は,実施例1と同様である。すなわち,商品タグ認識処理部28における商品タグ配置領域切出処理部24はS120で特定した商品タグ配置領域の画像情報を切り出し(S130),商品タグ配置領域正置化処理部25が台形補正処理を実行することで,正置化処理を実行する(S140)。
The product tag recognition process (S130 to S160) in the product tag
S140において商品タグ配置領域の正置化処理が終了すると,商品タグ認識処理部28における商品タグ特定処理部26が,正置化した商品タグ配置領域の画像情報から,個々の商品タグ領域を特定する(S150)。
When the product tag placement area normalization processing is completed in S140, the product tag
商品タグ特定処理部26が商品タグ領域を特定すると,商品タグ内情報特定処理部27が,商品タグ内における情報を特定する(S160)。この特定によって,商品タグに記載した情報,たとえば税抜価格,税込価格,商品名(商品識別情報),定格などの情報を文字認識することができる。
When the product tag specifying
つぎに陳列商品認識処理部29による陳列商品の認識処理を説明する。
Next, the display product recognition processing by the display product
棚段領域切出処理部291は,S120で入力を受け付けた棚段の領域に基づいて,正置画像情報から棚段領域の画像情報を切り出す(S170)。そして,棚段領域画像情報における棚段ごとに,フェイスを特定する処理を実行する(S180)。具体的には,棚段領域における棚段について,4点の座標で構成される矩形領域の範囲内において,商品と商品との間に生ずる細く狭い陰影を特定する,画像の繰り返しパターンを特定する,パッケージの上辺の段差を特定する,商品幅が同一であるなどの制約に基づいて区切り位置を特定する,などによって,フェイスを特定する。特定したフェイスには,フェイスを識別するためのフェイス識別情報を付す。そして,特定した各フェイスの座標は,撮影日時,店舗識別情報,撮影画像情報の画像情報識別情報,正置画像情報の画像情報識別情報,フェイスを識別するためのフェイス識別情報と対応付けて記憶させる。なお,フェイスの座標は4点を記憶せずとも,矩形領域を特定可能な2点であってもよい。
The shelf area
以上のように正置画像情報の棚段位置領域画像情報における各棚段の各フェイスを特定すると,商品識別情報特定処理部293は,フェイスごとに,標本画像情報記憶部30に記憶する標本画像情報とマッチング処理を実行し,そのフェイスに表示されている商品の商品識別情報を特定する(S190)。すなわち,ある棚段のフェイスの矩形領域(この領域のフェイスのフェイス識別情報をXとする)における画像情報と,標本画像情報記憶部30に記憶する各標本画像情報とから,それぞれの画像特徴量を算出し,特徴点のペアを求めることで,類似性を判定する。そして,もっとも類似性の高い標本画像情報を特定し,そのときの類似性があらかじめ定められた閾値以上であれば,その標本画像情報に対応する商品識別情報を標本画像情報記憶部30に基づいて特定する。そして,特定した商品識別情報を,そのフェイス識別情報Xのフェイスに表示されている商品の商品識別情報とする。そして商品識別情報特定処理部293は,特定した商品識別情報を,撮影日時,店舗識別情報,撮影画像情報の画像情報識別情報,正置画像情報の画像情報識別情報,フェイス識別情報に対応づけて商品識別情報記憶部31に記憶する(S200)。
When each face of each shelf in the shelf position area image information of the normal image information is specified as described above, the product identification information
なお,すべてのフェイスの商品識別情報を特定できるとは限らない。そこで,特定できていないフェイスについては,商品識別情報の入力を受け付け,入力を受け付けた商品識別情報を,撮影日時,店舗識別情報,撮影画像情報の画像情報識別情報,正置画像情報の画像情報識別情報,フェイス識別情報に対応づけて商品識別情報記憶部31に記憶する。また,特定した商品識別情報の修正処理についても同様に,入力を受け付けてもよい。
Not all face product identification information can be specified. Therefore, for faces that have not been identified, the input of product identification information is accepted, and the product identification information for which the input is accepted is used as the shooting date and time, store identification information, image information identification information of shot image information, and image information of orthodox image information. It is stored in the product identification
以上のような処理を行うことで,撮影画像情報に写っている陳列棚の棚段に陳列されている商品の商品識別情報を特定することができる。 By performing the above processing, it is possible to identify the product identification information of the product displayed on the shelf of the display shelf shown in the photographed image information.
このように商品タグ認識処理部28による商品タグの認識結果,陳列商品認識処理部29による陳列商品の認識結果,整合性判定処理部32が各棚,各棚段に含まれている可能性の高い商品かどうかの整合性を判定する(S210)。たとえば,商品タグの認識結果,または商品の認識結果において,定格が350mlの商品と認識しているが,その商品の陳列棚または棚段には500mlの商品が陳列されていること定められている場合には,同一の商品名の定格を「500ml」に変更する。
In this way, there is a possibility that the product tag
また,認識結果照合処理部33は,陳列商品認識処理部29において認識したフェイスごとの商品の商品識別情報と,商品タグ認識処理部28において認識した商品の情報(商品識別情報)とを突合し,認識結果が一致しているかを照合する(S220)。
Further, the recognition result
すなわち,認識結果照合処理部33は,陳列商品認識処理部29による認識処理の結果,類似性の高いフェイスが並んでいる区画を一群として,一つの棚段に何群あるかを特定する。また,それぞれの群の棚段の左右位置がどこかを特定する。そして,各群と左右位置が一致している,商品タグ認識処理部28による商品タグの認識結果の情報を,群に対応づける。
That is, as a result of the recognition processing by the display product
このようにフェイスによる群と商品タグとの対応付け後,商品識別情報記憶部31に記憶するフェイスまたは群に対応する商品識別情報(商品名)と,商品タグ認識処理部28による商品タグの認識結果とを比較し,それらの認識結果が一致するかを特定し,また読み取った価格を確定する。
After associating the group with the product tag by the face in this way, the product identification information (product name) corresponding to the face or group stored in the product identification
以上のような処理によって,陳列棚に陳列されている商品を画像認識処理によって認識した結果と,商品タグによる文字認識処理によって認識した結果とを比較して照合することができる。 By the above processing, it is possible to compare and collate the result of recognizing the product displayed on the display shelf by the image recognition processing and the result of recognizing by the character recognition processing by the product tag.
上述した実施例1,実施例2では,4点を指定することで台形補正処理を実行することとしたが,その基準となる頂点を毎回,指定して入力することは負担が大きい。そこで,台形補正処理の基準となる頂点を自動的に特定するように構成してもよい。この場合の処理を説明する。 In the above-mentioned Examples 1 and 2, the keystone correction process is executed by designating four points, but it is burdensome to specify and input the reference vertex each time. Therefore, it may be configured to automatically identify the vertex that is the reference of the keystone correction process. The processing in this case will be described.
この場合の撮影画像情報正置化処理部22は,初回の台形補正処理と,二回目以降の台形補正処理とに分かれる。なお,初回とは一回目のほか,頂点を自動的に特定する際のずれを修正するため,任意のタイミングで手動で行う場合も含まれる。二回目以降とは初回以外である。
In this case, the captured image information
撮影画像情報正置化処理部22における初回の台形補正処理は,実施例1と同様に,陳列棚の長方形の領域の4頂点の指定の入力を受け付ける。陳列棚の長方形の領域の4頂点としては,陳列棚の棚位置の4頂点であってもよいし,棚段の4頂点や商品タグを取り付ける領域の4頂点であってもよい。また,2段,3段の棚段のまとまりの4頂点であってもよい。ここで指定を受け付けた4頂点は,撮影日時情報,店舗情報,撮影画像情報の画像情報識別情報と対応づけて記憶させる。そして撮影画像情報正置化処理部22は,指定を受け付けた4頂点の座標に基づいて,撮影画像情報に対して台形補正処理を実行し,正置画像情報とする。
In the first keystone correction processing in the captured image information
撮影画像情報は,一定期間ごとに,同じような領域を同じような角度で撮影がされることが望ましい。しかし完全に同じ領域を同じ角度で撮影をすることはできない。そこで,撮影画像情報正置化処理部22は,二回目以降の台形補正処理を以下のように実行をする。
It is desirable that the captured image information be captured in a similar area at a similar angle at regular intervals. However, it is not possible to shoot the exact same area at the same angle. Therefore, the captured image information
まず,撮影画像情報正置化処理部22は,N回目の撮影画像情報に対応する同じ(ほぼ同じ)領域を撮影したN−1回目の撮影画像情報の頂点座標を,前回の処理の際に記憶した情報から特定する。N回目の撮影画像情報に対応する同じ(ほぼ同じ)領域を撮影したN−1回目の撮影画像情報の頂点座標は,撮影画像情報に対応する店舗識別情報,画像識別情報,撮影日時情報などに基づいて特定をする。そして,N−1回目の撮影画像情報に対して,特定をした4頂点の頂点座標を含む所定の大きさの矩形領域,たとえば棚段の幅の1/5程度の正方形を特徴量採取領域220として設定をする。N−1回目の撮影画像情報に対して,特徴量採取領域220を設定した状態の一例を図31に示す。特徴量採取領域220は,頂点座標を含む矩形領域であればよい。一方,陳列棚の背景同士がマッチングをしてしまうと,撮影位置が少しずれるだけで背景が大きくずれてしまう。そこで,特徴量採取領域220は,なるべく陳列棚の内側を多く含む位置に設定することが好ましい。つまり,頂点座標は,特徴量採取領域220において,特徴量採取領域220の中心点よりも陳列棚の外側方向に位置していることが好ましい。
First, the captured image information
たとえば,頂点座標の4点は左上,右上,左下,右下に位置する。そして,特徴量採取領域220の矩形領域を縦横の中心でそれぞれ2分割した合計4領域に分割すると,左上の頂点座標を含む特徴量採取領域220では,その頂点座標が矩形領域のうち左上の領域に位置するように特徴量採取領域220を設定する。同様に,右上の頂点座標を含む特徴量採取領域220では,その頂点座標が矩形領域のうち右上の領域に位置するように特徴量採取領域220を設定し,左下の頂点座標を含む特徴量採取領域220では,その頂点座標が矩形領域のうち左下の領域に位置するように特徴量採取領域220を設定し,右下の頂点座標を含む特徴量採取領域220では,その頂点座標が矩形領域のうち右下の領域に位置するように特徴量採取領域220を設定する。これによって,頂点座標は,特徴量採取領域220において,特徴量採取領域220の中心点よりも陳列棚の外側方向に位置することとなる。
For example, the four points of vertex coordinates are located at the upper left, upper right, lower left, and lower right. Then, when the rectangular area of the feature
つぎに,撮影画像情報正置化処理部22は,N回目の撮影画像情報において,N−1回目の撮影画像情報に設定した特徴量採取領域220を内包し,N−1回目の撮影画像情報の特徴量採取領域220以上の大きさの特徴量採取領域221を設定する。N回目の撮影画像情報に設定する特徴量採取領域221は,短辺の1/2の大きさは超えない。さらに,撮影画像情報よりも外側に出る場合には,その範囲をトリミングする。N回目の撮影画像情報に対して特徴量採取領域221を設定した状態の一例を図32に示す。
Next, the captured image information
そして撮影画像情報正置化処理部22は,N−1回目の撮影画像情報に対して設定した各特徴量採取領域220において,局所特徴量を採取し,局所特徴量による特徴点とその座標のセットとを記憶する。また,N回目の撮影画像情報に対して設定した各特徴量採取領域221において,局所特徴量を採取し,局所特徴量による特徴点とその座標のセットとを記憶する。
Then, the captured image information
撮影画像情報正置化処理部22は,N−1回目の撮影画像情報の特徴量採取領域220における特徴点の局所特徴量と,N−1回目の撮影画像情報の特徴量採取領域220に対応する位置にあるN回目の撮影画像情報の特徴量採取領域221における特徴点の局所特徴量とを比較する。そして,N−1回目の撮影画像情報の各特徴点の各局所特徴量にもっとも近い,N回目の撮影画像情報の各局所特徴量の特徴点を特定する。そしてもっとも近い局所特徴量同士の特徴点をペアとし,ペアとなる局所特徴量による特徴点の座標を対応づける。なお,この際に,局所特徴量同士の近さ(類似性)があらかじめ定められた閾値未満のペアは除外をする。これによって,N−1回目の特徴量採取領域220における局所特徴量の特徴点と,N回目の特徴量採取領域221におけるもっとも近い局所特徴量の特徴点同士のペアを特定できる。N−1回目の特徴量採取領域220の局所特徴量の特徴点と,N回目の特徴量採取領域221の局所特徴量の特徴点とのペアの関係を図33に示す。図33では,N−1回目の特徴量採取領域220における局所特徴量による特徴点の点群をA,N回目の特徴量採取領域221における局所特徴量による特徴点の点群をB,N−1回目の台形補正処理に用いた頂点をCで示している。
The captured image information
N−1回目の特徴量採取領域220における局所特徴量による特徴点の点群Aの座標と,点群Aに対応するN回目の特徴量採取領域221における局所特徴量による特徴点の点群Bの座標とに基づいて,点群Aを点群Bに射影する関数F(アフィン変換)を求める。関数Fは,サンプリング推定を反復する,ロバスト推定の一種であるOpenCVのRANSACを利用するなどの方法があるが,それらに限定しない。なお,射影の関係にある関係線からずれが大きいペアは処理対象から除外をする。
The coordinates of the point cloud A of the feature points due to the local feature amount in the N-1st feature
撮影画像情報正置化処理部22において関数Fを求めたのち,撮影画像情報正置化処理部22は,N−1回目の台形補正処理で用いた頂点Cの座標を,関数Fに基づいてN回目の撮影画像情報に射影し,N回目の台形補正処理のための頂点Dの座標として特定する。これを模式的に示すのが図34である。
After the function F is obtained by the captured image information
以上の処理を各特徴量採取領域220,221に対して行うことで,N回目の撮影画像情報における台形補正処理のための棚位置の4頂点を特定する。そして,撮影画像情報正置化処理部22は,特定した4頂点に基づいて,N回目の撮影画像情報に対する台形補正処理を実行して正置化し,正置画像情報を生成し,記憶する。この際に,撮影画像情報正置化処理部22は,正置画像情報に対応付けて,撮影日時情報,店舗情報,撮影画像情報の画像情報識別情報,正置画像情報の画像識別情報と対応づけて記憶をさせる。特定したN回目の撮影画像情報に対応する頂点の座標は,撮影日時情報,店舗情報,撮影画像情報の画像情報識別情報と対応づけて記憶させる。
By performing the above processing for each feature
なお,撮影画像情報正置化処理部22における台形補正処理で用いる頂点の特定処理は,本発明のように陳列棚を撮影した画像情報から商品を特定する場合に限らず,同一の撮影対象物を撮影した複数の画像情報を正置化し,正置画像情報を生成する画像認識システム1にも適用することができる。これによって,同一の撮影対象物を撮影した複数の画像情報について,それぞれ正置化して,その撮影対象物の正置画像情報を生成することができる。
Note that the vertex identification process used in the trapezoidal correction processing in the captured image information
また,N回目の撮影画像情報における台形補正処理のための棚位置の4頂点を特定するため,上述では,N−1回目の撮影画像情報における特徴量採取領域220での局所特徴量による特徴点の点群Aと,N回目の撮影画像情報における特徴量採取領域221での局所特徴量による特徴点の点群Bとを用いて関数Fを求め,N−1回目の台形補正処理で用いた頂点Cの座標を,関数FによりN回目の撮影画像情報に射影し,N回目の台形補正処理のための頂点Dの座標として特定する処理を説明した。しかし,かかる処理では,N−1回目の撮影画像情報と,N回目の撮影画像情報とにおいて,類似する画像情報の対応点の座標(位置)を見つければよいので,上記の方法にするものではなく,画像情報内の箇所を特定するタイプの特徴量であればいかなるものであってもよい。たとえば,画像情報内における尖った箇所,ハイライトのポイントなどがある。本明細書では,局所特徴量などの,画像情報内の箇所を特定する特徴量を画像特徴量(位置特定型画像特徴量)という。なお,本明細書の説明では,画像特徴量として,上述のように局所特徴量を用いる場合を説明する。
Further, in order to specify the four vertices of the shelf position for the trapezoidal correction processing in the Nth shot image information, the feature points based on the local feature amount in the feature
つぎに,実施例3における台形補正処理を行うための頂点の特定処理を説明する。この場合,任意の陳列棚を撮影した撮影画像情報において台形補正処理を行うための頂点がすでに特定されており,所定期間(たとえば一週間)経過後に,同一の陳列棚について,同じような領域を同じような角度で撮影した撮影画像情報について行う場合を説明する。 Next, the vertex identification process for performing the keystone correction process in the third embodiment will be described. In this case, the apex for performing the keystone correction processing has already been specified in the photographed image information obtained by photographing an arbitrary display shelf, and after a predetermined period (for example, one week) has elapsed, a similar area is formed for the same display shelf. A case will be described in which the captured image information captured at the same angle is used.
店舗の陳列棚が撮影された撮影画像情報は,撮影画像情報入力端末4から入力され,管理端末2の撮影画像情報入力受付処理部20でその入力を受け付ける。図35に,撮影画像情報の一例を示す。また,撮影日時,店舗識別情報,撮影画像情報の画像情報識別情報の入力を受け付ける。そして,撮影画像情報入力受付処理部20は,入力を受け付けた撮影画像情報,撮影日時,店舗識別情報,画像情報識別情報を対応づけて撮影画像情報記憶部21に記憶させる。
The photographed image information photographed on the display shelf of the store is input from the photographed image
管理端末2において所定の操作入力を受け付けると,撮影画像情報正置化処理部22は撮影画像情報記憶部21に記憶する撮影画像情報を抽出し,台形補正処理を実行するための,棚位置の頂点D(D1乃至D4)を特定する処理を実行する。
When the
今回(N回目)の撮影画像情報(図35)に対応する同じまたはほぼ同じ領域を撮影した前回(N−1回目)の撮影画像情報(図36)の頂点座標(たとえば頂点座標C1乃至C4とする)を特定する。前回の撮影画像情報の頂点座標は,撮影日時,店舗識別情報,撮影画像情報の画像識別情報などに基づいて特定をすればよい。 The vertex coordinates (for example, vertex coordinates C1 to C4) of the previous (N-1st) captured image information (FIG. 36) in which the same or almost the same area corresponding to the captured image information (FIG. 35) of this time (Nth) was captured. To identify). The vertex coordinates of the previously captured image information may be specified based on the shooting date and time, the store identification information, the image identification information of the captured image information, and the like.
撮影画像情報正置化処理部22は,撮影画像情報記憶部21からN−1回目の撮影画像情報を抽出し,それぞれの頂点C1乃至C4について,頂点を一つずつ含む所定の大きさの矩形領域を特徴量採取領域220として,N−1回目の撮影画像情報に設定する。N−1回目の撮影画像情報に特徴量採取領域220を設定した状態を図36に示す。
The captured image information
また,撮影画像情報正置化処理部22は,撮影画像情報記憶部21からN回目の撮影画像情報(図35)を抽出し,N−1回目の特徴量採取領域220よりも広い範囲の特徴量採取領域221を,N回目の撮影画像情報に設定する。N回目の撮影画像情報に特徴量採取領域221を設定した状態を図37に示す。N回目の撮影画像情報におけるそれぞれの特徴量採取領域221は,N−1回目の特徴量採取領域220を一つずつ含む。図37では,N回目の特徴量採取領域221に,N−1回目の特徴量採取領域220を示すことで,その包含関係を示している。
Further, the captured image information
そして撮影画像情報正置化処理部22は,N−1回目の撮影画像情報に対して設定した各特徴量採取領域220において局所特徴量を採取し,局所特徴量による特徴点と座標のセットとを記憶する。また,N回目の撮影画像情報に対して設定した各特徴量採取領域221において局所特徴量を採取し,局所特徴量による特徴点と座標のセットとを記憶する。
Then, the captured image information
撮影画像情報正置化処理部22は,N−1回目の撮影画像情報の特徴量採取領域220での各特徴点の各局所特徴量にもっとも近いN回目の撮影画像情報の特徴量採取領域221での局所特徴量の特徴点を特定し,それらをペアとなる局所特徴量の特徴点として,それぞれの座標を対応付ける。図33に示すのがN−1回目のN−1回目の特徴量採取領域220と,N回目の特徴量採取領域221とのペアの関係である。
The captured image information
そして,N−1回目の特徴量採取領域220における局所特徴量による特徴点の点群をA,N回目の特徴量採取領域221における局所特徴量による特徴点の点群をB,N−1回目の台形補正処理に用いた頂点をC(C1乃至C4)とすると,撮影画像情報正置化処理部22は,点群Aと点群Bの座標とに基づいて,点群Aを点群Bに射影する関数F(アフィン変換)を求める。
Then, the point cloud of the feature point by the local feature amount in the N-1th feature
そして撮影画像情報正置化処理部22は,N−1回目の台形補正処理で用いた頂点C(C1乃至C4)の座標を,求めた関数Fに基づいて射影し,N回目の台形補正処理のための頂点D(D1乃至D4)の座標として特定する。
Then, the captured image information
以上の処理を各特徴量採取領域220,221に対して行うことで,N回目の台形補正処理のための4頂点D(D1乃至D4)が自動的に特定できる。特定したN回目の頂点D(D1乃至D4)の座標は,撮影日時,店舗識別情報,撮影画像情報の画像情報識別情報に対応づけて記憶させる。特定された頂点D1乃至D4を示すのが図38である。
By performing the above processing for each feature
以上のようにして,N回目の撮影画像情報に対する台形補正処理のための棚位置の頂点D(D1乃至D4)を特定すると,撮影画像情報正置化処理部22は,頂点D(D1乃至D4)に基づいて,N回目の撮影画像情報に対して台形補正処理を実行する。
As described above, when the vertices D (D1 to D4) of the shelf position for the keystone correction processing for the Nth captured image information are specified, the captured image information
以上のような処理を実行することで,二回目以降の台形補正処理について,台形補正処理で用いる4頂点を指定せずとも,対応する頂点を自動的に特定することができるようになり,担当者の負担を軽減することができる。 By executing the above processing, it becomes possible to automatically identify the corresponding vertices for the second and subsequent keystone correction processing without specifying the four vertices used in the keystone correction processing. The burden on the person can be reduced.
さらに実施例2のフェイス特定処理部292におけるフェイスの特定処理の変形例を説明する。本実施例では,実施例2のフェイスの特定処理を初回の処理として,二回目以降のフェイスの特定処理として,自動的にフェイスを特定する処理を行うようにしてもよい。この場合の処理を説明する。
Further, a modification of the face identification process in the face
なお,初回とは一回目のほか,自動的に特定する際のずれを修正するため,任意のタイミングで実施例2の処理を行う場合も含まれる。二回目以降とは初回以外である。 In addition to the first time, the first time includes the case where the processing of the second embodiment is performed at an arbitrary timing in order to correct the deviation at the time of automatic identification. The second and subsequent times are other than the first time.
フェイス特定処理部292は,実施例2の処理と同様の処理を初回のフェイスの特定処理として実行する。そして,フェイス特定処理部292における二回目以降のフェイスの特定処理は,同一の陳列棚の同一の棚段について,前回(N−1回目)の正置画像情報で特定したフェイスの領域の座標を抽出し,その座標を今回(N回目)の正置画像情報で特定したフェイスの領域の座標とする。
The face
フェイスの領域の座標は,棚段の位置の座標と同様に,正置画像情報における,陳列棚内での所定箇所(たとえば陳列棚の左上の頂点C1)を基準とした相対座標である。 Similar to the coordinates of the position of the shelf, the coordinates of the face area are relative coordinates based on a predetermined position in the display shelf (for example, the apex C1 on the upper left of the display shelf) in the orthodox image information.
さらに実施例2の変形例として,商品識別情報特定処理部293における,陳列棚の棚段ごとに,フェイスに表示されている商品の商品識別情報を特定する処理として,実施例2の処理を初回の商品識別情報の特定処理とし,二回目以降の商品識別情報の特定処理として,以下のような処理を実行する。
Further, as a modification of Example 2, the process of Example 2 is first performed as a process of specifying the product identification information of the product displayed on the face for each shelf of the display shelf in the product identification information
商品識別情報特定処理部293は,N回目の正置画像情報におけるフェイスの商品識別情報の特定処理は,まず処理対象となるフェイスのフェイス識別情報を特定する。特定したフェイス識別情報をXとする。そして,N回目の正置画像情報におけるフェイス識別情報Xの領域の画像情報と,フェイス識別情報Xに対応する位置にあるN−1回目の正置画像情報における領域の画像情報とを比較する。類似性の判定については,色ヒストグラム同士のEMDを求め,類似性の尺度とすることが好ましいが,それに限定するものではない。その類似性が一定の閾値以上であれば,N−1回目の正置画像情報におけるその領域のフェイスに対応する商品識別情報を商品識別情報記憶部31から抽出し,N回目の正置画像情報におけるフェイス識別情報Xの商品識別情報とする。これによって,処理対象となるN回目の正置画像情報におけるフェイス識別情報Xの商品識別情報を特定できる。もし類似性が一定の閾値未満であれば,初回の場合と同様に,N回目の正置画像情報におけるフェイス識別情報Xの領域の画像情報と,標本画像情報記憶部30に記憶する標本画像情報とを比較して,類似性が所定の閾値以上で,かつ,もっとも類似性が高い商品識別情報を,N回目の正置画像情報におけるフェイス識別情報Xのフェイスの商品識別情報として特定をする。
The product identification information
なお,N−1回目の正置画像情報におけるフェイスの領域の画像情報との比較において,対応するフェイスの位置との比較のみならず,所定範囲のフェイスを比較対象として含めてもよい。たとえばN回目の正置画像情報におけるフェイス識別情報Xの領域の画像情報と比較する場合,比較対象としては,N−1回目の正置画像情報におけるフェイス識別情報Xの領域のほか,その領域から所定範囲にあるフェイスの領域,たとえばその左右方向に一または複数離隔している位置にあるフェイス,上下の棚段に位置するフェイスの領域も含めてもよい。さらに,N−1回目の正置画像情報におけるフェイス識別情報Xの領域のほか,フェイス識別情報X−2,X−1,X,X+1,X+2のように,複数の隣接するフェイスの領域を含めてもよい。 In the comparison with the image information of the face area in the N-1th orthodox image information, not only the comparison with the position of the corresponding face but also the faces in a predetermined range may be included as the comparison target. For example, when comparing with the image information in the area of face identification information X in the Nth normal image information, the comparison target is from the area of face identification information X in the N-1th normal image information and from that area. The area of the face within a predetermined range, for example, the area of the face located one or more apart in the left-right direction thereof, and the area of the face located on the upper and lower shelves may be included. Further, in addition to the area of the face identification information X in the N-1th orthodox image information, the area of a plurality of adjacent faces such as the face identification information X-2, X-1, X, X + 1, X + 2 is included. You may.
この場合,N回目の正置画像情報におけるフェイス識別情報Xの領域の画像情報と,N−1回目の正置画像情報における,比較対象となる範囲のフェイスの範囲の領域のそれぞれの画像情報とを比較し,もっとも類似性が高いN−1回目の正置画像情報のフェイス識別情報を特定する。なお,類似性は,類似性は一定の閾値以上であることを条件としてもよい。そして特定したN−1回目の正置画像情報のフェイス識別情報に対応する商品識別情報を商品識別情報記憶部31から抽出し,N回目の正置画像情報におけるフェイス識別情報Xの商品識別情報とする。この処理を模式的に示すのが図27である。図27(a)は前回(N−1回目)の正置画像情報であり,図27(b)は今回(N回目)の正置画像情報である。そして,N回目の正置画像情報の棚段1の各フェイスの領域の画像情報と,N−1回目の正置画像情報の棚段1の各フェイスの領域の画像情報とをそれぞれ比較することで類似性を判定し,もっとも類似性が高いN−1回目の正置画像情報の棚段1のフェイスの商品識別情報を,N回目の正置画像情報の棚段1のフェイスの商品識別情報として特定をすることを示す。図27では,N回目の正置画像情報のフェイスに対応する位置にあるN−1回目の正置画像情報のフェイスに加え,その左右2つずつのフェイスとの比較を行う場合を示している。なお同一棚段のみならず,上下の棚段のフェイス位置の画像情報との比較を行ってもよい。たとえば図27の場合,N回目の正置画像情報の棚段2の中心のフェイス位置の商品識別情報を特定する際に,N−1回目の正置画像情報の棚段2の中心およびその左右2つずつのフェイスの領域の画像情報と比較するのみならず,N−1回目の正置画像情報の棚段1の中心およびその左右2つずつのフェイスの領域の画像情報,N−1回目の正置画像情報の棚段3の中心およびその左右2つずつのフェイスの領域の画像情報と類似性の比較を行ってもよい。
In this case, the image information in the area of the face identification information X in the Nth normal image information and the image information in the area of the face range in the N-1th normal image information to be compared. To identify the face identification information of the N-1th orthodox image information having the highest similarity. The similarity may be conditional on the similarity being equal to or higher than a certain threshold value. Then, the product identification information corresponding to the face identification information of the specified N-1th normal image information is extracted from the product identification
N−1回目の正置画像情報のフェイスの画像情報との比較の結果,類似性が閾値を充足しないなどによって商品識別情報を特定できなかった場合には,N回目の正置画像情報におけるフェイス識別情報Xの領域の画像情報と,標本画像情報記憶部30に記憶する標本画像情報とを比較して,類似性が所定の閾値以上で,かつ,もっとも類似性が高い商品識別情報を,N回目の正置画像情報におけるフェイス識別情報Xのフェイスの商品識別情報として特定をする。この場合の類似性の判定処理は,初回の商品識別情報の特定処理と同様に行える。
As a result of comparison with the image information of the face of the N-1th orthodox image information, if the product identification information cannot be specified because the similarity does not satisfy the threshold, the face in the Nth orthodox image information is not specified. By comparing the image information in the region of the identification information X with the sample image information stored in the sample image
以上のようにして特定した商品識別情報は,撮影日時情報,店舗情報,撮影画像情報の画像情報識別情報,正置画像情報の画像識別情報,フェイスを識別するためのフェイス識別情報に対応づけて商品識別情報記憶部31に記憶する。
The product identification information identified as described above is associated with the shooting date / time information, the store information, the image information identification information of the shooting image information, the image identification information of the orthodox image information, and the face identification information for identifying the face. It is stored in the product identification
なお本発明の画像認識システム1の実施例1乃至実施例5において,各処理部における処理対象となる画像情報については,それぞれ前処理として正置化処理などが実行されていることで精度を向上させることができ,上述の各実施例ではその場合を説明した。しかし,必ずしも処理対象となる画像情報について正置化処理が実行されている必要はなく,その場合は,各処理部における処理対象となるのは,正置化処理が実行されていない場合の画像情報である。たとえば,位置特定処理部23,商品タグ配置領域切出処理部24,商品タグ配置領域正置化処理部25,商品タグ特定処理部26,商品タグ内情報特定処理部27,商品タグ認識処理部28,陳列商品認識処理部29,棚段領域切出処理部291,フェイス特定処理部292,商品識別情報特定処理部293,棚段画像マッチング処理部294において,正置化処理が実行されていない画像情報を処理対象としてもよい。この場合,正置化処理が実行されていなくても,商品を陳列した陳列棚が写っている画像情報に対する処理を実行すればよい。なお,商品を陳列した陳列棚が写っている画像情報には,正置化処理をした画像情報,正置化処理をしていない画像情報の双方が含まれる。
In the first to fifth embodiments of the
本発明の画像認識システム1を用いることによって,陳列棚に陳列されている商品を精度よく特定することができる。
By using the
1:画像認識システム
2:管理端末
4:撮影画像情報入力端末
20:撮影画像情報入力受付処理部
21:撮影画像情報記憶部
22:撮影画像情報正置化処理部
23:位置特定処理部
24:商品タグ配置領域切出処理部
25:商品タグ配置領域正置化処理部
26:商品タグ特定処理部
27:商品タグ内情報特定処理部
28:商品タグ認識処理部
29:陳列商品認識処理部
30:標本画像情報記憶部
31:商品識別情報記憶部
32:整合性判定処理部
33:認識結果照合処理部
220:N−1回目の画像情報における特徴量採取領域
221:N回目の画像情報における特徴量採取領域
291:棚段領域切出処理部
292:フェイス特定処理部
293:商品識別情報特定処理部
294:棚段画像マッチング処理部
70:演算装置
71:記憶装置
72:表示装置
73:入力装置
74:通信装置
1: Image recognition system 2: Management terminal 4: Photographed image information input terminal 20: Photographed image information input reception processing unit 21: Photographed image information storage unit 22: Photographed image information emplacement processing unit 23: Position identification processing unit 24: Product tag placement area cutout processing unit 25: Product tag placement area normalization processing unit 26: Product tag identification processing unit 27: Product tag information identification processing unit 28: Product tag recognition processing unit 29: Display product recognition processing unit 30 : Specimen image information storage unit 31: Product identification information storage unit 32: Consistency determination processing unit 33: Recognition result collation processing unit 220: N-1 Feature amount collection area in the first image information 221: Features in the Nth image information Quantity collection area 291: Shelf stage area cutout processing unit 292: Face identification processing unit 293: Product identification information identification processing unit 294: Shelf stage image matching processing unit 70: Computing device 71: Storage device 72: Display device 73: Input device 74: Communication device
Claims (3)
前記第2の画像情報における商品タグ配置領域を含む領域に対して第2の正置化処理をする第2の正置化処理部と,
前記第2の正置化処理をした画像情報から商品タグ領域を特定する商品タグ特定処理部と,
前記特定した商品タグ領域においてOCR認識処理を行うことで商品タグに表記された情報を特定する商品タグ内情報特定処理部と,
を有することを特徴とする画像認識システム。 A first emplacement processing unit that performs a first emplacement process on the first image information showing a display shelf for displaying products and generates a second image information, and a first emplacement processing unit.
A second emplacement processing unit that performs a second emplacement process on the area including the product tag arrangement area in the second image information, and
A product tag identification processing unit that specifies a product tag area from the image information that has undergone the second orthostatic processing, and a product tag identification processing unit.
An information identification processing unit in the product tag that specifies the information written on the product tag by performing OCR recognition processing in the specified product tag area, and
An image recognition system characterized by having.
前記特定した商品タグ領域を二値化してラベリング処理を行うことでボックスを特定し,
特定したボックスのうち,ボックスの高さ,幅,ベースラインが所定条件を充足するボックス同士をブロックとして特定し,
前記特定したブロックに対して前記OCR認識処理を実行する,
ことを特徴とする請求項1に記載の画像認識システム。 The information identification processing unit in the product tag
The box is specified by binarizing the specified product tag area and performing labeling processing.
Among the specified boxes, the boxes whose height, width, and baseline satisfy the predetermined conditions are specified as blocks.
The OCR recognition process is executed for the specified block.
The image recognition system according to claim 1.
商品を陳列する陳列棚が写っている第1の画像情報に対して第1の正置化処理をして第2の画像情報を生成する第1の正置化処理部,
前記第2の画像情報における商品タグ配置領域を含む領域に対して第2の正置化処理をする第2の正置化処理部,
前記第2の正置化処理をした画像情報から商品タグ領域を特定する商品タグ特定処理部,
前記特定した商品タグ領域においてOCR認識処理を行うことで商品タグに表記された情報を特定する商品タグ内情報特定処理部,
として機能させることを特徴とする画像認識プログラム。 Computer,
A first emplacement processing unit, which performs a first emplacement process on the first image information showing a display shelf for displaying products and generates a second image information.
A second emplacement processing unit that performs a second emplacement process on an area including a product tag arrangement area in the second image information.
Product tag identification processing unit that specifies the product tag area from the image information that has undergone the second orthostatic processing,
Information identification processing unit in the product tag that specifies the information written on the product tag by performing OCR recognition processing in the specified product tag area,
An image recognition program characterized by functioning as.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020115230A JP6941331B2 (en) | 2018-10-16 | 2020-07-02 | Image recognition system |
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2018194877A JP6831951B2 (en) | 2018-10-16 | 2018-10-16 | Image recognition system |
| JP2020115230A JP6941331B2 (en) | 2018-10-16 | 2020-07-02 | Image recognition system |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2018194877A Division JP6831951B2 (en) | 2018-10-16 | 2018-10-16 | Image recognition system |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2020161196A JP2020161196A (en) | 2020-10-01 |
| JP6941331B2 true JP6941331B2 (en) | 2021-09-29 |
Family
ID=72643665
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020115230A Active JP6941331B2 (en) | 2018-10-16 | 2020-07-02 | Image recognition system |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6941331B2 (en) |
Families Citing this family (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7815886B2 (en) * | 2022-03-14 | 2026-02-18 | オムロン株式会社 | Information processing device, information processing method, and program |
| JP7708017B2 (en) * | 2022-06-30 | 2025-07-15 | トヨタ自動車株式会社 | Image Processing Device |
| JP7777507B2 (en) * | 2022-08-10 | 2025-11-28 | 株式会社日立エルジーデータストレージ | Item identification system, item identification method, item identification program, and item acquisition determination system |
| JP7601356B1 (en) * | 2023-07-04 | 2024-12-17 | 株式会社マーケットヴィジョン | Information Processing System |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2012022413A (en) * | 2010-07-12 | 2012-02-02 | Canon Inc | Image processing apparatus, image processing method and program |
| JP5675194B2 (en) * | 2010-07-15 | 2015-02-25 | キヤノン株式会社 | Image processing apparatus, image processing method, and program |
| JP6705075B2 (en) * | 2014-10-01 | 2020-06-03 | 株式会社マーケットヴィジョン | Product display information collection system |
-
2020
- 2020-07-02 JP JP2020115230A patent/JP6941331B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| JP2020161196A (en) | 2020-10-01 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6831951B2 (en) | Image recognition system | |
| JP6458239B1 (en) | Image recognition system | |
| JP6941331B2 (en) | Image recognition system | |
| JP6619634B2 (en) | Image processing apparatus and image processing method | |
| JP6143111B2 (en) | Object identification device, object identification method, and program | |
| JP6278276B2 (en) | Object identification device, object identification method, and program | |
| JP6569532B2 (en) | Management system, list creation device, list creation method, management method, and management program | |
| JP6651169B2 (en) | Display status judgment system | |
| JP6900164B2 (en) | Information processing equipment, information processing methods and programs | |
| JPWO2014103297A1 (en) | Object identification device, method and program | |
| CN106056112B (en) | Image processing apparatus and image processing method | |
| JP6885563B2 (en) | Display status judgment system | |
| JP6579456B1 (en) | Search target information narrowing system | |
| JPWO2015008732A1 (en) | Optical character recognition device | |
| JP6628336B2 (en) | Information processing system | |
| CN107403179B (en) | Registration method and device for article packaging information | |
| JP7449505B2 (en) | information processing system | |
| JP6890849B2 (en) | Information processing system | |
| CN115830026A (en) | Workpiece surface quality detection method and device based on vision | |
| JP7328642B1 (en) | Information processing system | |
| JP7592252B1 (en) | Information Processing System | |
| JP2023130540A (en) | information processing system |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200702 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210729 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210827 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210827 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6941331 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |