JP5454466B2 - Character detection device, character detection method, and computer program - Google Patents
Character detection device, character detection method, and computer program Download PDFInfo
- Publication number
- JP5454466B2 JP5454466B2 JP2010294504A JP2010294504A JP5454466B2 JP 5454466 B2 JP5454466 B2 JP 5454466B2 JP 2010294504 A JP2010294504 A JP 2010294504A JP 2010294504 A JP2010294504 A JP 2010294504A JP 5454466 B2 JP5454466 B2 JP 5454466B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- gradation
- pixel
- frequency
- pixels
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/147—Determination of region of interest
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/168—Smoothing or thinning of the pattern; Skeletonisation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/18086—Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/155—Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Facsimile Image Signal Circuits (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Description
本発明は、透過画像を含む画像に対して画像処理を行う装置および方法などに関する。 The present invention relates to an apparatus and method for performing image processing on an image including a transparent image.
近年、コピー、PCプリント、スキャン、ファックス、およびファイルサーバなどの様々な機能を備えた画像形成装置が普及している。このような画像形成装置は、「複合機」または「MFP(Multi Function Peripherals)」などと呼ばれる。 In recent years, image forming apparatuses having various functions such as copying, PC printing, scanning, faxing, and file servers have become widespread. Such an image forming apparatus is called a “multifunction machine” or “MFP (Multi Function Peripherals)”.
PCプリントは、パーソナルコンピュータから画像データを受信し画像を用紙に印刷する機能である。 PC printing is a function for receiving image data from a personal computer and printing the image on paper.
また、近年、パーソナルコンピュータで描画を行うためのアプリケーションが流通している。このようなアプリケーションは、「描画ソフト」と呼ばれている。描画ソフトの中には、透過画像をディスプレイに表示する機能が備わっているものがある。 In recent years, applications for drawing on personal computers have been distributed. Such an application is called “drawing software”. Some drawing software has a function of displaying a transparent image on a display.
「透過画像」は、後ろに他のオブジェクトの画像があっても当該他のオブジェクトの画像が透けて表れる性質を有する。 The “transparent image” has a property that even if there is an image of another object behind, the image of the other object can be seen through.
つまり、例えば、図4(A)に示すように、背後画像40bの左半分の上に透過画像40aを重ねる。すると、図4(B)に示すように、背後画像40bの、透過画像40aと重なる部分は、透けて見える。しかし、背後画像40bの右半分の上に透過画像でない非透過画像40cを重ねても、透けて見えない。透過画像の透過率が高いほど、それが重ねられた背後の画像は、よく透けて見える。
That is, for example, as shown in FIG. 4A, the
画像形成装置は、パーソナルコンピュータに表示されている透過画像を用紙に印刷することができる。印刷されるまでに透過画像は、透過率の高さに応じて、図5(B)および図5(C)に示すように、画素の間引きの処理が施される。そして、間引かれた画素の位置に、透過画像の背後の画像が印刷される。これにより、背後の画像が透けて表れているように見える。 The image forming apparatus can print the transparent image displayed on the personal computer on paper. Before printing, the transparent image is subjected to pixel thinning processing as shown in FIGS. 5B and 5C in accordance with the high transmittance. Then, an image behind the transparent image is printed at the thinned pixel position. As a result, the background image appears to show through.
また、画像の中の文字または数字などの字を検出する技術が、実用化されている。さらに、字を精度よく検出する方法が提案されている。例えば、次のような方法が提案されている。 A technique for detecting characters such as letters or numbers in an image has been put into practical use. Furthermore, a method for accurately detecting characters has been proposed. For example, the following method has been proposed.
デジタル画像を複数のブロックに分割し、ブロックに含まれる複数の画素の画素値に関するコントラスト量を求め、ブロックに含まれる複数の画素の画素値のヒストグラムに関する画素値二峰性評価値を求め、複数の上記コントラスト量に基づくコントラスト閾値を求め、複数の上記画素値二峰性評価値に基づく二峰性閾値を求め、上記ブロックをテキストブロックまたは非テキストブロックとして分類する。上記分類においては、上記コントラスト量および上記画素値二峰性評価値が、上記コントラスト閾値および上記二峰性閾値に基づいた第1基準を満たしている上記ブロックを、テキストブロックとして分類し、上記第1基準を満たしていない上記ブロックを、非テキストブロックとして分類する(特許文献1)。 A digital image is divided into a plurality of blocks, a contrast amount relating to pixel values of a plurality of pixels included in the block is obtained, a pixel value bimodal evaluation value relating to a histogram of pixel values of a plurality of pixels included in the block is obtained, and a plurality of A contrast threshold value based on the contrast amount is obtained, a bimodal threshold value is obtained based on a plurality of the pixel value bimodal evaluation values, and the block is classified as a text block or a non-text block. In the classification, the block in which the contrast amount and the pixel value bimodal evaluation value satisfy the first criterion based on the contrast threshold and the bimodal threshold is classified as a text block, and the first The above blocks that do not satisfy one standard are classified as non-text blocks (Patent Document 1).
しかし、特許文献1に記載されるような従来の方法では、透過画像が重ねられた字を上手く検出することは、できない。透過画像を重ねられた部分の全面がテキストの領域であると、判定されるからである。
However, with the conventional method described in
本発明は、このような問題点に鑑み、透過画像が重ねられた字を従来よりも精度よく検出することを、目的とする。 In view of such a problem, an object of the present invention is to detect a character on which a transparent image is superimposed with higher accuracy than in the past.
本発明の一形態に係る文字検出装置は、文字を表わす第一の画像と半透明のオブジェクトを表わす第二の画像と含む画像から前記文字を検出する文字検出装置であって、前記第一の画像に前記第二の画像が重なっている領域である重畳領域を複数に分割したブロックごとに、画素の属性の階調ごとの出現の度数を算出する、度数分布算出手段と、前記度数のうちの、前記階調のうちの第一の階調における度数である第一の度数、前記階調のうちの第二の階調における度数である第二の度数、および前記階調のうちの第三の階調における度数である第三の度数がピークであり、かつ、前記各ブロックにおける前記第三の度数同士の差が、前記各ブロックにおける前記第一の度数同士の差および前記各ブロックにおける前記第二の度数同士の差よりも大きい場合に、前記重畳領域の画素のうちの前記第三の階調の画素の階調を前記第一の階調に変更することによって第一の置換画像を生成し、前記重畳領域の画素のうちの前記第三の階調の画素の階調を前記第二の階調に変更することによって第二の置換画像を生成する、置換画像生成手段と、前記第一の置換画像の前記第二の階調の画素をクロージングする第一のクロージング処理手段と、前記第二の置換画像の前記第一の階調の画素をクロージングする第二のクロージング処理手段と、前記重畳領域の画素のうちの、クロージング後の前記第一の置換画像の前記第一の階調の画素と同じ位置またはクロージング後の前記第二の置換画像の前記第二の階調の画素と同じ位置にある画素の集合を、前記文字として検出する、文字検出手段と、を有する。
A character detection device according to an aspect of the present invention is a character detection device that detects a character from an image including a first image representing a character and a second image representing a translucent object, A frequency distribution calculating means for calculating a frequency of appearance for each gradation of a pixel attribute for each block obtained by dividing an overlapping area, which is an area where the second image overlaps an image, and the frequency A first frequency that is a frequency in a first gradation of the gradations, a second frequency that is a frequency in a second gradation of the gradations, and a first frequency of the gradations The third frequency which is the frequency in the third gradation is a peak, and the difference between the third frequencies in the respective blocks is the difference between the first frequencies in the respective blocks and the respective blocks. The difference between the second frequencies Is larger, a first replacement image is generated by changing the gradation of the pixel of the third gradation among the pixels of the overlapping area to the first gradation, and the pixel of the overlapping area A replacement image generating means for generating a second replacement image by changing the gradation of the pixel of the third gradation to the second gradation, and the first of the first replacement image A first closing processing unit that closes a second gradation pixel; a second closing processing unit that closes the first gradation pixel of the second replacement image; and a pixel in the overlapping region. A set of pixels at the same position as the first gradation pixel of the first replacement image after closing or at the same position as the second gradation pixel of the second replacement image after closing and detected as the character, the character detecting means It has a.
前記第二の画像がカラー画像である場合は、前記属性は、例えば、色の明るさである。または、前記第一の画像および前記第二の画像がモノクロ画像である場合は、前記属性は、例えば、濃度である。 When the second image is a color image, the attribute is, for example, color brightness. Alternatively, when the first image and the second image are monochrome images, the attribute is, for example, density.
本発明によると、透過画像が重ねられた字を従来よりも精度よく検出することができる。 According to the present invention, it is possible to detect a character on which a transparent image is superimposed with higher accuracy than in the past.
図1は、画像形成装置1を含むネットワークシステムの例を示す図である。図2は、画像形成装置1のハードウェア構成の例を示す図である。
FIG. 1 is a diagram illustrating an example of a network system including an
図1に示す画像形成装置1は、一般に複合機またはMFP(Multi Function Peripherals)などと呼ばれる装置であって、コピー、ネットワークプリンティング(PCプリント)、ファックス、およびスキャナなどの機能を集約した装置である。
An
画像形成装置1は、LAN(Local Area Network)、公衆回線、またはインターネットなどの通信回線4Tを介してパーソナルコンピュータ4Aなどの装置と画像データのやり取りを行うこととができる。
The
画像形成装置1は、図2に示すように、CPU(Central Processing Unit)10a、RAM(Random Access Memory)10b、ROM(Read Only Memory)10c、大容量記憶装置10d、スキャナ10e、印刷装置10f、ネットワークインタフェース10g、タッチパネルディスプレイ10h、モデム10i、および画像処理回路10jなどによって構成される。
As shown in FIG. 2, the
スキャナ10eは、原稿の用紙に記されている写真、文字、絵、図表などの画像を読み取って画像データを生成する装置である。
The
タッチパネルディスプレイ10hは、ユーザに対してメッセージまたは指示を与えるための画面、ユーザが処理の指令および条件を入力するための画面、およびCPU10aの処理の結果を示す画面などを表示する。また、ユーザが指で触れた位置を検知し、検知結果を示す信号をCPU10aに送信する。
The
ネットワークインタフェース10gは、通信回線4Tを介してパーソナルコンピュータ4Aなどの他の装置と通信を行うためのNIC(Network Interface Card)である。
The
モデム10iは、固定電話網を介して他のファックス端末との間でG3などのプロトコルで画像データをやり取りするための装置である。
The
画像処理回路10jは、パーソナルコンピュータ4Aから送信されてきた画像データに基づいて、印刷の対象の画像に対して画像処理を施す。画像処理回路10jの各部は、ASIC(Application Specific Integrated Circuit)またはFPGA(Field Programmable Gate Array)などの回路によって実現される。画像処理回路10jの各部の処理については、後述する。
The
印刷装置10fは、スキャナ10eによって読み取られた画像または画像処理回路10jによって画像処理が施された画像などを用紙に印刷する。
The printing device 10f prints an image read by the
ROM10cおよび大容量記憶装置10dには、OS(Operating System)のほかファームウェアおよびアプリケーションなどのプログラムが記憶されている。これらのプログラムは、必要に応じてRAM10bにロードされ、CPU10aによって実行される。大容量記憶装置10dとして、ハードディスクまたはフラッシュメモリなどが用いられる。
The
次に、画像処理回路10jの構成および画像処理回路10jによる画像処理について、説明する。
Next, the configuration of the
図3は、画像処理回路10jの構成の例を示す図である。図4は、背後画像40bへの透過画像40aおよび非透過画像40cの重ね合わせの例を説明するための図である。図5は、透過画像の特性の例を説明するための図である。図6は、背後画像41bへの透過画像41aの重ね合わせの例を説明するための図である。図7は、背後画像50bに透過画像50aを重ね合せた際の透過画像重畳領域50Kと透過画像非重畳領域50Lとの位置関係の例を示す図である。図8は、透過画像重畳領域50Kを構成する画素の例を示す図である。図9は、各明度の画素の個数の分布の例を示すヒストグラムである。図10は、文字画素判別部104の構成の例を示す図である。図11は、第一の画素置換部303、第一のクロージング処理部304、および第一の文字画素判別部305の処理の例を説明するための図である。図12は、第二の画素置換部306、第二のクロージング処理部307、および第二の文字画素判別部308の処理の例を説明するための図である。図13は、論理和演算部309の処理の例を説明するための図である。
FIG. 3 is a diagram illustrating an example of the configuration of the
画像処理回路10jは、図3に示すように、透過画像重畳領域抽出部101、ブロック分割部102、ヒストグラム算出部103、文字画素判別部104、および透過画像重畳領域補正部105などによって構成される。画像処理回路10jは、印刷の対象の画像に対して画像処理を施す。画像処理は、具体的には、印刷の対象の画像を表す画像データ70を編集する情報処理である。
As shown in FIG. 3, the
本実施形態では、画像データ70として、透過画像が他の画像に重なった様子を表す画像データが用いられる。
In the present embodiment, as the
一般に、「透過画像」は、後ろに他のオブジェクトの画像があっても当該他のオブジェクトの画像が透けて表れる性質を有する画像である。つまり、透過画像はガラスおよびセロハンなどのような半透明のオブジェクトを表わしていると、言える。 In general, a “transparent image” is an image having a property that an image of another object can be seen through even if there is an image of another object behind. That is, it can be said that the transmission image represents a translucent object such as glass and cellophane.
例えば、図4(A)に示すように、背後画像40bの左半分の上に透過画像40aを重ね、背後画像40bの右半分の上に非透過画像40cを重ねる。すると、図4(B)に示すように、背後画像40bの、透過画像40aと重なる部分は、透けて見える。しかし、背後画像40bの、非透過画像40cと重なる部分は、全く表れない。
For example, as shown in FIG. 4A, the
透過画像の透過率が高いほど、その透過画像が上に重ねられた他の画像(つまり、背後画像)は、よく透けて見える。 The higher the transmittance of the transparent image, the more transparent the other image (that is, the background image) on which the transparent image is superimposed.
また、一般に、透過画像は、パーソナルコンピュータ4Aなどで表示されるときには図5(A)に示すようにすべての画素が一定の濃度を有していても、印刷時には、図5(B)または図5(C)に示すように一定の濃度を有する画素と有しない画素とによって構成されるように変換される。
In general, when a transparent image is displayed on a
なお、図5(B)および図5(C)において、ハッチングした画素が、一定の濃度を有する画素である。一方、ハッチングしていない画素が、一定の濃度を有しない画素である。図6、図8、図11(A)〜(C)、および図12(A)〜(C)においても、同様である。以下、一定の濃度を有する画素を「濃度有画素」と記載し、一定の濃度を有しない画素を「濃度無画素」と記載する。また、「濃度」は、透過画像がカラー画像である場合は各色(例えば、Red、Green、Blueそれぞれ)の階調であり、透過画像がモノクロ画像である場合はグレースケールである。 Note that in FIGS. 5B and 5C, hatched pixels are pixels having a certain density. On the other hand, pixels that are not hatched are pixels that do not have a certain density. The same applies to FIGS. 6, 8, 11 </ b> A to 11 </ b> C, and FIGS. 12A to 12 </ b> C. Hereinafter, a pixel having a constant density is referred to as a “density pixel”, and a pixel having no constant density is referred to as a “non-density pixel”. “Density” is the gradation of each color (for example, Red, Green, and Blue, respectively) when the transparent image is a color image, and is gray scale when the transparent image is a monochrome image.
濃度有画素は、決められた濃度で印刷される。一方、濃度無画素は、後ろに他の画像がなければ印刷されないが、他の画像があれば、当該他の画像の中の、この濃度無画素と同じ位置にある画素が印刷される。 The pixels with density are printed at a determined density. On the other hand, the non-density pixel is not printed if there is no other image behind, but if there is another image, the pixel at the same position as the non-density pixel in the other image is printed.
よって、例えば図6に示すように透過画像41aの一部分が背後画像41bの一部分の上に重なっている場合は、透過画像41aの濃度無画素の位置に背後画像41bの対応する画素を配置して印刷することによって、背後画像41bが透過画像41aに透けているかのように、両画像が印刷される。
Therefore, for example, as shown in FIG. 6, when a part of the
また、透過画像の透過率が高いほど、濃度有画素が出現する頻度が低い。したがって、図5(B)に示す透過画像のほうが図5(C)に示す透過画像よりも透過率が高い。 In addition, the higher the transmittance of the transmission image, the lower the frequency with which the pixels with density appear. Therefore, the transmittance of the transmission image shown in FIG. 5B is higher than that of the transmission image shown in FIG.
図5(B)に示す濃度有画素の上下左右には、濃度無画素が存在する。一方、図5(C)に示す濃度無画素の上下左右には、濃度有画素が存在する。 Non-density pixels exist on the top, bottom, left, and right of the pixels with density shown in FIG. On the other hand, pixels with density exist on the top, bottom, left, and right of the non-density pixel shown in FIG.
以下、他方のタイプの画素が上下左右に存在する画素を「孤立点」と記載する。したがって、図5(B)においては、濃度有画素が孤立点画素であり、図5(C)においては、濃度無画素が孤立点画素である。 Hereinafter, a pixel in which the other type of pixel exists vertically and horizontally is referred to as an “isolated point”. Therefore, in FIG. 5B, a pixel with density is an isolated point pixel, and in FIG. 5C, a pixel without density is an isolated point pixel.
本実施形態では、画像データ70として、オリジナル画像50を表す画像データを取り扱う場合を例に、画像処理回路10jによる画像処理を説明する。
In the present embodiment, image processing by the
オリジナル画像50は、図7(A)に示すように、背後画像50bの上に透過画像50aを重ねたものである。ユーザは、オリジナル画像50を、パーソナルコンピュータ4Aにインストールされている描画ソフトなどのアプリケーションを用いて作成する。これにより、オリジナル画像50を再現するためのデータが画像データ70として生成される。
As shown in FIG. 7A, the
なお、透過画像50aは、背後画像50bよりも小さい。よって、オリジナル画像50には、図7(B)に示すように、背後画像50bと透過画像50aとが重なっている領域と背後画像50bのみの領域とがある。以下、前者を「透過画像重畳領域50K」と記載し、後者を「透過画像非重畳領域50L」と記載する。また、背後画像50bの、透過画像50aが重なった部分には、「A」という文字が記されている。この文字の色は、特定の1つの色(例えば、青色)である。また、この文字の背景の色は、別の特定の1つの色(例えば、黄色)である。
The
パーソナルコンピュータ4Aは、印刷の指令とともに画像データ70を画像形成装置1へ送信する。
The
画像形成装置1において、印刷の指令および画像データ70が受信されると、画像処理回路10jの各部は、次のような処理を実行する。
When the
透過画像重畳領域抽出部101は、オリジナル画像50の中から透過画像重畳領域50Kを判別し、抽出する。
The transparent image superimposed
具体的には、透過画像重畳領域抽出部101は、透過画像の上述の特性に基づいて、透過画像重畳領域50Kを、例えば次のように判別し検出する。
Specifically, the transparent image overlapping
透過画像重畳領域抽出部101は、オリジナル画像50の中から孤立点を次のように検出する。ある1つの画素に注目する。以下、この画素を「注目画素」と記載する。注目画素の濃度(階調)と、注目画素の上下左右に隣接する他の画素(以下、「隣接画素」と記載する。)それぞれの濃度とを比較する。
The transparent image superimposed
注目画素の濃度と当該他の画素それぞれの濃度との差がすべて所定の値β以上であるという要件を満たす場合は、透過画像重畳領域抽出部101は、注目画素を孤立点として検出する。
When the requirement that the difference between the density of the pixel of interest and the density of each of the other pixels is all equal to or greater than a predetermined value β, the transparent image overlapping
なお、オリジナル画像50がカラー画像である場合は、透過画像重畳領域抽出部101は、この比較を各色それぞれについて独立して行う。そして、いずれか1つでも要件を満たす場合は、注目画素を孤立点として検出する。以下、オリジナル画像50がカラー画像である場合における要件の具備の判断において、同様である。
Note that, when the
図5(B)および図5(C)に示したように、透過画像の孤立点の出現には、一定の周期性(規則性)がある。そこで、透過画像重畳領域抽出部101は、検出した孤立点のうちの、出現の仕方に周期性がある複数の孤立点を抽出する。
As shown in FIGS. 5B and 5C, the appearance of isolated points in the transmission image has a certain periodicity (regularity). Therefore, the transparent image overlapping
そして、透過画像重畳領域抽出部101は、抽出した複数の孤立点の分布を表す画像(以下、「分布画像」と記載する。)に対してクロージングの処理を行う。つまり、各孤立点の位置にあるドットを拡張(膨張)させ縮小(収縮)させる処理を行う。クロージングの処理がなされた分布画像の位置および形状が、透過画像重畳領域50Kの位置および形状にほぼ対応する。
Then, the transparent image superimposed
透過画像重畳領域抽出部101は、このようにして透過画像重畳領域50Kの位置および形状を特定し、オリジナル画像50から透過画像重畳領域50Kを抽出する。
In this way, the transparent image overlapping
なお、透過画像の透過率が50%前後である場合は、濃度有画素が孤立点として検出されるとともに、濃度無画素の位置に表れている背後画像の画素も孤立点として検出される。つまり、領域の中のほとんどの画素が孤立点として検出される。各濃度有画素の濃度は一定であるが、各濃度無画素の位置に表れている背後画像の画素は、一定でない。そこで、領域の中のほとんどの画素が孤立点として検出された場合は、透過画像重畳領域抽出部101は、一定の濃度を有する孤立点だけを選出し、選出した孤立点の分布を表す画像を分布画像としてクロージングを行えばよい。
Note that when the transmittance of the transparent image is around 50%, the pixels with density are detected as isolated points, and the pixels of the background image appearing at the positions without density pixels are also detected as isolated points. That is, most pixels in the area are detected as isolated points. The density of each pixel with density is constant, but the pixel of the background image that appears at the position of each pixel without density is not constant. Therefore, when most of the pixels in the region are detected as isolated points, the transparent image overlapping
ブロック分割部102は、透過画像重畳領域抽出部101によって抽出された透過画像重畳領域50Kを所定の個数のブロック51に分割する。本実施形態では、図8(A)に示す透過画像重畳領域50Kを、図8(B)に示すように、4×4個のブロック51A〜51Pに分割する。ブロック51A〜51Pのサイズはすべて等しいものとする。
The
なお、図8(A)および図8(B)において、ハッチングした画素は、透過画像50aの濃度有画素である。黒色の画素およびグレー色の画素は、ともに、透過画像50aの濃度無画素の位置に表れた、背後画像50bの画素であるが、黒色の画素は「A」の文字の画素であり、グレー色の画素は文字の背景の画素である。
In FIG. 8A and FIG. 8B, the hatched pixels are the pixels with density of the
ヒストグラム算出部103は、ブロック51A〜51Pそれぞれの、各明度の画素の個数を度数とする度数分布を算出する。算出された各度数分布は、図9に示すように、ヒストグラムとして表すことができる。
The
図9(A)、図9(B)、および図9(C)に示すヒストグラムは、それぞれ、ブロック51A、ブロック51B、およびブロック51Cの度数分布を表すヒストグラムである。
The histograms shown in FIG. 9A, FIG. 9B, and FIG. 9C are histograms representing the frequency distributions of the
これらの3つのヒストグラムには、2つまたは3つのピークが表れている。各ピークは、透過画像50aの濃度有画素と明度が同じである画素の個数の分布、背後画像50bの文字と明度が同じである画素の個数の分布、および背後画像50bの文字の背景と明度が同じである画素の個数の分布のうちのいずれか1つに対応している。
In these three histograms, two or three peaks appear. Each peak has a distribution of the number of pixels having the same brightness as the pixels having density in the
文字画素判別部104は、図10に示すように、24個の比較演算部、画素種別明度判別部302、第一の画素置換部303、第一のクロージング処理部304、第一の文字画素判別部305、第二の画素置換部306、第二のクロージング処理部307、第二の文字画素判別部308、および論理和演算部309などによって構成される。このような構成により、文字画素判別部104は、ヒストグラム算出部103によって算出された各ブロック51の度数分布に基づいて、透過画像重畳領域50Kの中から文字の画素を次のように判別する。以下、24個の比較演算部の1つ1つを「第一の比較演算部201」、「第二の比較演算部202」、…、「第二十四の比較演算部224」と区別して記載することがある。
As shown in FIG. 10, the character
透過画像重畳領域50Kには、上下または前後に隣り合う2つのブロック51の組合せが、24通りある。文字画素判別部104には、これらの組合せごとに、比較演算部が設けられている。そして、比較演算部は、ヒストグラム算出部103によって算出された、ブロック51それぞれの度数分布を比較する。
There are 24 combinations of two
例えば、第一の比較演算部201は、ブロック51Aの度数分布とブロック51Bの度数分布とを比較する。第二の比較演算部202は、ブロック51Bの度数分布とブロック51Cの度数分布とを比較する。第三の比較演算部203は、ブロック51Cの度数分布とブロック51Dの度数分布とを比較する。
For example, the first
比較演算部は、ブロック51それぞれの度数分布を次のように比較する。図9で説明した通り、ブロック51の度数分布には、2つまたは3つのピークがある。比較演算部は、2つのブロック51の、明度が同じであるピーク同士を比較する。
The comparison operation unit compares the frequency distributions of the
例えば、第一の比較演算部201は、ブロック51Aの第一の明度Br1の度数とブロック51Bの第一の明度Br1の度数とを比較する。ブロック51Aの第二の明度Br2の度数とブロック51Bの第二の明度Br2の度数とを比較する。さらに、ブロック51Aの第三の明度Br3の度数とブロック51Bの第三の明度Br3の度数とを比較する。
For example, the first
同様に、第二の比較演算部202は、ブロック51Bの第一の明度Br1の度数とブロック51Cの第一の明度Br1の度数とを比較する。ブロック51Bの第二の明度Br2の度数とブロック51Cの第二の明度Br2の度数とを比較する。さらに、ブロック51Bの第三の明度Br3の度数とブロック51Cの第三の明度Br3の度数とを比較する。
Similarly, the second
そして、比較演算部は、画素種別明度判別部302へ、2つの度数の差が所定の値α未満である明度を一定明度として通知するとともに、2つの度数の差が所定の値α以上である明度を不定明度として通知する。
Then, the comparison calculation unit notifies the pixel type
例えば、ブロック51Aの度数分布は、図9(A)のヒストグラムの通りであり、ブロック51Bの度数分布は、図9(B)のヒストグラムの通りである。両者を比較すると、両ブロック51の明度Br3の画素の度数は等しいが、明度Br1の画素の度数は相違し、明度Br2の画素の度数も相違する。
For example, the frequency distribution of the
よって、第一の比較演算部201は、明度Br3を一定明度として画素種別明度判別部302へ通知する。さらに、明度Br1および明度Br2を、所定の値αに応じて、一定明度または不定明度として画素種別明度判別部302へ通知する。例えば、所定の値αが「1」であれば、2つの度数が少しでも違えば差が「1」以上になるので、不定明度に決まる。したがって、明度Br1および明度Br2を不定明度として通知する。
Therefore, the first
画素種別明度判別部302には、24個の比較演算部から、合計、約24個の一定明度と約48個の不定明度とが通知される。
The pixel type
前述の通り、透過画像50aの濃度有画素の色はすべて同じであり、背後画像50bの文字の画素の色はすべて同じであり、背後画像50bの文字の背景の画素の色はすべて同じである。したがって、これらの一定明度および不定明度は、第一の明度Br1、第二の明度Br2、および第三の明度Br3のうちのいずれかと一致する。
As described above, the colors of the pixels with density in the
画素種別明度判別部302は、通知された約24個の一定明度を、値ごとに分類する。本例では、第一の明度Br1、第二の明度Br2、および第三の明度Br3のいずれかに分類することができる。そして、最も多く分類された一定明度を、透過画像50aの濃度有画素の明度であると、判別する。その結果、本例では、第三の明度Br3に分類される一定明度が最も多く、第三の明度Br3が透過画像50aの濃度有画素の明度であると判別されるはずである。透過画像50aの濃度有画素の明度の分布は、すべてのブロック51において、ほぼ一定だからである。以下、透過画像50aの濃度有画素の明度であると判別された明度(一定明度)を「濃度有画素明度Bn」と記載する。
The pixel type
さらに、画素種別明度判別部302は、通知された約48個の不定明度も同様に、値ごとに分類する。本例では、第一の明度Br1、第二の明度Br2、および第三の明度Br3のいずれかに分類されるはずである。そして、分類された不定明度のうちの、透過画像50aの濃度有画素の明度でないものを、背後画像50bの画素の明度であると、判別する。本例では、先に第三の明度Br3を透過画像50aの濃度有画素の明度であると判別しているので、第一の明度Br1および第二の明度Br2を背後画像50bの画素の明度であると、判別する。以下、背後画像50bの画素の明度であると判別された2つの明度(不定明度)をそれぞれ「第一の背後画像明度Bh1」、「第二の背後画像明度Bh2」と記載する。以下、第一の明度Br1が第一の背後画像明度Bh1であり、第二の明度Br2が第二の背後画像明度Bh2である場合を例に、説明する。
Further, the pixel type
そして、画素種別明度判別部302は、第一の画素置換部303および第二の画素置換部306へ、濃度有画素明度Bn、第一の背後画像明度Bh1、および第二の背後画像明度Bh2を通知する。
Then, the pixel type
第一の画素置換部303、第一のクロージング処理部304、および第一の文字画素判別部305は、画像データ70、濃度有画素明度Bn、第一の背後画像明度Bh1、および第二の背後画像明度Bh2に基づいて処理を行う。ここで、この処理の手順を、図11を参照しながら説明する。
The first
第一の画素置換部303は、オリジナル画像50の中から、透過画像重畳領域50Kに属しかつ明度が濃度有画素明度Bnである画素を検索する。これにより、図11(A)においてハッチングで示す画素が見つかる。そして、第一の画素置換部303は、濃度有画素明度Bnである画素を、図11(B)に示すように、明度が第一の背後画像明度Bh1である画素(グレー色で示す画素)に置換する。以下、第一の画素置換部303によって置換の処理がなされた透過画像重畳領域50Kの画像を「置換処理画像52A」と記載する。
The first
第一のクロージング処理部304は、第二の背後画像明度Bh2の画素(黒色で示す画素)を膨張させ収縮させることによって、置換処理画像52Aに対してクロージングの処理を行う。これにより、図11(C)に示すような結果が得られる。以下、第一のクロージング処理部304によってクロージングの処理がなされた置換処理画像52Aを「クロージング処理画像52B」と記載する。
The first
クロージング処理画像52Bを構成する画素の明度は、第一の背後画像明度Bh1および第二の背後画像明度Bh2のうちのいずれかである。
The brightness of the pixels constituting the closing processed
第一の文字画素判別部305は、第一の背後画像明度Bh1の画素および第二の背後画像明度Bh2の画素のうちの個数が多い方を画素を、文字の画素であると、判別する。そして、それらの画素が「1」になり、それ以外の画素が「0」になるように、クロージング処理画像52Bを二値化する。これにより、図11(D)に示すような結果が得られる。なお、図11(D)において、黒点を付した画素の値が「1」であり、付していない画素の値が「0」である。後に示す図12(D)および図13においても、同様である。
以下、第一の文字画素判別部305によって二値化されたクロージング処理画像52Bを「第一の二値画像52C」と記載する。
The first character
Hereinafter, the
第二の画素置換部306、第二のクロージング処理部307、および第二の文字画素判別部308も、第一の画素置換部303、第一のクロージング処理部304、および第一の文字画素判別部305と同様に、画像データ70、濃度有画素明度Bn、第一の背後画像明度Bh1、および第二の背後画像明度Bh2に基づいて処理を行う。ただし、第一の背後画像明度Bh1および第二の背後画像明度Bh2の使い方が、異なる。
The second
以下、第二の画素置換部306、第二のクロージング処理部307、および第二の文字画素判別部308の処理を、図12を参照しながら説明する。
Hereinafter, the processes of the second
第二の画素置換部306は、オリジナル画像50の中から、透過画像重畳領域50Kに属しかつ明度が濃度有画素明度Bnである画素を検索し、図12(B)に示すように、それらの画素を、明度が第二の背後画像明度Bh2である画素(黒色で示す画素)に置換する。以下、第二の画素置換部306によって置換の処理がなされた透過画像重畳領域50Kの画像を「置換処理画像53A」と記載する。
The second
第二のクロージング処理部307は、第一の背後画像明度Bh1の画素(グレー色で示す画素)を膨張させ収縮させることによって、置換処理画像53Aに対してクロージングの処理を行う。これにより、図12(C)に示すような結果が得られる。以下、第二のクロージング処理部307によってクロージングの処理がなされた置換処理画像53Aを「クロージング処理画像53B」と記載する。
The second
置換処理画像53Aを構成する画素の明度も、クロージング処理画像52Bを構成する画素の明度と同様に、第一の背後画像明度Bh1および第二の背後画像明度Bh2のうちのいずれかである。
The brightness of the pixels constituting the replacement processed
第二の文字画素判別部308は、第一の背後画像明度Bh1の画素および第二の背後画像明度Bh2の画素のうちの個数が多い方を画素を、文字の画素であると、判別する。そして、それらの画素が「1」になり、それ以外の画素が「0」になるように、クロージング処理画像53Bを二値化する。これにより、図12(D)に示すような結果が得られる。以下、第二の文字画素判別部308によって二値化されたクロージング処理画像53Bを「第二の二値画像53C」と記載する。
The second character
論理和演算部309は、図13に示すように、同じ位置にある、第一の二値画像52Cの画素の値および第二の二値画像53Cの画素の値同士の論理和を算出する。二値画像54は、各位置の論理和を表している。
As shown in FIG. 13, the logical
二値画像54の中の値が「1」である画素が、透過画像重畳領域50Kの中の文字の画素に対応する。
A pixel having a value “1” in the
以上のようにして、文字画素判別部104の各部による処理によって、透過画像重畳領域50Kの中の文字の画素が判別される。
As described above, the pixel of the character in the transparent
図3に戻って、透過画像重畳領域補正部105は、文字画素判別部104による判別結果などに基づいて、オリジナル画像50の中の透過画像重畳領域50Kの補正を行う。例えば、文字の画素であると判別された画素群に対して、エッジ強調処理を行い、残りの部分に対して、ぼかしの処理を行う。以下、透過画像重畳領域補正部105によって処理がなされたオリジナル画像50を「補正画像60」と記載する。
Returning to FIG. 3, the transparent image superimposing
その後、印刷装置10fは、補正画像60を用紙に印刷する。または、ネットワークインタフェース10gは、補正画像60の画像データをパーソナルコンピュータ4Aなどに送信する。
Thereafter, the printing apparatus 10f prints the corrected
本実施形態によると、透過画像が重ねられた字を従来よりも精度よく検出することができる。 According to the present embodiment, it is possible to detect a character on which a transparent image is superimposed with higher accuracy than in the past.
本実施形態では、透過画像重畳領域50Kを、濃度有画素である孤立点の位置の規則性に基づいて検出したが、画像データ70に透過画像50aの位置を示すデータが予め含まれている場合は、このデータに基づいて検出すればよい。
In the present embodiment, the transparent
本実施形態では、透過画像重畳領域50Kを16個のブロック51に分割したが、16個未満のブロック51に分割してもよいし、17個以上のブロック51に分割してもよい。
In the present embodiment, the transparent
本実施形態では、上下左右に隣り合うブロック51の度数分布同士を比較したが、他の組合せであってもよい。例えば、さらに、斜めの方向に並ぶブロック51の度数分布同士を比較してもよい。または、上下に隣り合うブロック51の度数分布同士のみを比較してもよいし、左右に隣り合うブロック51の度数分布同士のみを比較してもよい。
In the present embodiment, the frequency distributions of the
本実施形態では、透過画像重畳領域50Kを複数のブロック51に等分したが、サイズの異なる複数のブロック51に分割してもよい。ただし、その場合は、図3のヒストグラム算出部103は、各明度の画素の度数として、個数の代わりに、ブロック51全体に対して占める割合を算出するのが、望ましい。
In the present embodiment, the transparent
本実施形態では、図11〜図13で説明した通り、クロージングの処理および論理和の演算によって、文字を構成する画素を判別した。 In the present embodiment, as described with reference to FIGS. 11 to 13, the pixels constituting the character are determined by the closing process and the logical sum operation.
上述の通り、3つのピークの明度のうち、透過画像50aの濃度有画素の明度を最初に特定することができる。図9の例では、第三の明度Br3が、透過画像50aの濃度有画素の明度である。
As described above, among the lightness of the three peaks, the lightness of the pixel with density of the
よって、残りの2つのピークの明度(第一の明度Br1、第二の明度Br2)のうちの、一方が文字を構成する画素であり、もう一方が文字の背景を構成する画素である。 Therefore, one of the remaining two peak lightness values (first lightness Br1 and second lightness Br2) is a pixel constituting a character, and the other is a pixel constituting a character background.
両明度のうちのどちらがどちらのオブジェクトのものであるのかを、図11〜図13で説明した方法以外の方法によって、判別してもよい。 It may be determined by which method other than the method described with reference to FIGS.
例えば、ブロック51A〜51Pの第一の明度Br1の度数の合計を算出し、ブロック51A〜51Pの第二の明度Br2の度数の合計を算出する。そして、合計が少ない方の明度を文字の明度であると判別し、合計が多い方の明度を文字の背景の明度であると判別してもよい。
For example, the sum of the frequencies of the first brightness Br1 of the
この方法によると、図9の例では、第二の明度Br2が文字の明度であると判別され、第一の明度Br1が文字の背景の明度であると判別される。 According to this method, in the example of FIG. 9, it is determined that the second brightness Br2 is the brightness of the character, and the first brightness Br1 is determined to be the brightness of the background of the character.
本実施形態では、透過画像重畳領域50Kからの文字の検出を主に画像処理回路10jによって行ったが、コンピュータプログラムをCPU10aに実行させることによって行うこともできる。この場合は、図3に示す透過画像重畳領域抽出部101ないし透過画像重畳領域補正部105の処理の手順をメインルーチンとするプログラムモジュールと図10に示す第一の比較演算部201ないし論理和演算部309の処理の手順をサブルーチンとするプログラムモジュールとを有するコンピュータプログラムを、用意すればよい。そして、このコンピュータプログラムをROM10cまたは大容量記憶装置10dに記憶させておき、CPU10aに実行させればよい。
In the present embodiment, detection of characters from the transparent
本実施形態では、ヒストグラム算出部103は、明度の度数分布を算出したが、他の属性の度数分布を算出してもよい。例えば、明度の代わりに、色相または彩度を用いてもよい。オリジナル画像50がモノクロ画像である場合は、濃度の度数分布を算出してもよい。
In the present embodiment, the
その他、画像形成装置1全体または各部の構成、処理内容、処理順序、データの構成などは、本発明の趣旨に沿って適宜変更することができる。
In addition, the configuration of the entire
1 画像形成装置
10j 画像処理回路(文字検出装置)
103 ヒストグラム算出部(度数分布算出手段)
104 文字画素判別部(文字検出手段)
303 第一の画素置換部(置換画像生成手段)
304 第一のクロージング処理部(第一のクロージング処理手段)
306 第二の画素置換部(置換画像生成手段)
307 第二のクロージング処理部(第二のクロージング処理手段)
309 論理和演算部(文字検出手段)
50a 透過画像(第二の画像)
50b 背後画像(第一の画像)
50K 透過画像重畳領域(重畳領域)
51 ブロック(ブロック)
1
103 Histogram calculation unit (frequency distribution calculation means)
104 Character pixel discrimination unit (character detection means)
303 1st pixel replacement part (replacement image generation means)
304 1st closing process part (1st closing process means)
306 Second pixel replacement unit (replacement image generation means)
307 Second closing processing unit (second closing processing means)
309 OR operation unit (character detection means)
50a Transmission image (second image)
50b Background image (first image)
50K transparent image superimposition area (superimposition area)
51 blocks
Claims (5)
前記第一の画像に前記第二の画像が重なっている領域である重畳領域を複数に分割したブロックごとに、画素の属性の階調ごとの出現の度数を算出する、度数分布算出手段と、
前記度数のうちの、前記階調のうちの第一の階調における度数である第一の度数、前記階調のうちの第二の階調における度数である第二の度数、および前記階調のうちの第三の階調における度数である第三の度数がピークであり、かつ、前記各ブロックにおける前記第三の度数同士の差が、前記各ブロックにおける前記第一の度数同士の差および前記各ブロックにおける前記第二の度数同士の差よりも大きい場合に、前記重畳領域の画素のうちの前記第三の階調の画素の階調を前記第一の階調に変更することによって第一の置換画像を生成し、前記重畳領域の画素のうちの前記第三の階調の画素の階調を前記第二の階調に変更することによって第二の置換画像を生成する、置換画像生成手段と、
前記第一の置換画像の前記第二の階調の画素をクロージングする第一のクロージング処理手段と、
前記第二の置換画像の前記第一の階調の画素をクロージングする第二のクロージング処理手段と、
前記重畳領域の画素のうちの、クロージング後の前記第一の置換画像の前記第一の階調の画素と同じ位置またはクロージング後の前記第二の置換画像の前記第二の階調の画素と同じ位置にある画素の集合を、前記文字として検出する、文字検出手段と、
を有することを特徴とする文字検出装置。 A character detection device for detecting the character from an image including a first image representing a character and a second image representing a translucent object,
A frequency distribution calculating means for calculating the frequency of appearance for each gradation of the attribute of the pixel for each block obtained by dividing the overlapping area, which is an area where the second image overlaps the first image,
Of the frequencies, a first frequency that is a frequency in a first gradation of the gradations, a second frequency that is a frequency in a second gradation of the gradations, and the gradation The third frequency that is the frequency in the third gradation is the peak, and the difference between the third frequencies in each block is the difference between the first frequencies in each block and If the difference between the second frequencies in each block is larger than the difference between the second frequencies, the gradation of the third gradation pixel among the pixels in the overlapping region is changed to the first gradation. A replacement image that generates one replacement image and generates a second replacement image by changing the gradation of the pixel of the third gradation among the pixels of the overlapping region to the second gradation Generating means;
First closing processing means for closing pixels of the second gradation of the first replacement image;
Second closing processing means for closing the first gradation pixel of the second replacement image;
Of the pixels in the overlapping region, the same position as the first gradation pixel of the first replacement image after closing or the second gradation pixel of the second replacement image after closing Character detection means for detecting a set of pixels at the same position as the character;
A character detection device comprising:
請求項1記載の文字検出装置。 If the second image is a color image, the attribute is color brightness.
Claim 1 Symbol placement of character detection device.
請求項1記載の文字検出装置。 When the first image and the second image are monochrome images, the attribute is density.
Claim 1 Symbol placement of character detection device.
前記第一の画像に前記第二の画像が重なっている領域である重畳領域を複数に分割したブロックごとに、画素の属性の階調ごとの出現の度数を算出し、
前記度数のうちの、前記階調のうちの第一の階調における度数である第一の度数、前記階調のうちの第二の階調における度数である第二の度数、および前記階調のうちの第三の階調における度数である第三の度数がピークであり、かつ、前記各ブロックにおける前記第三の度数同士の差が、前記各ブロックにおける前記第一の度数同士の差および前記各ブロックにおける前記第二の度数同士の差よりも大きい場合に、前記重畳領域の画素のうちの前記第三の階調の画素の階調を前記第一の階調に変更することによって第一の置換画像を生成し、前記重畳領域の画素のうちの前記第三の階調の画素の階調を前記第二の階調に変更することによって第二の置換画像を生成し、
前記第一の置換画像の前記第二の階調の画素をクロージングし、
前記第二の置換画像の前記第一の階調の画素をクロージングし、
前記重畳領域の画素のうちの、クロージング後の前記第一の置換画像の前記第一の階調の画素と同じ位置またはクロージング後の前記第二の置換画像の前記第二の階調の画素と同じ位置にある画素の集合を、前記文字として検出する、
ことを特徴とする文字検出方法。 A character detection method for detecting the character from an image including a first image representing a character and a second image representing a translucent object,
For each block obtained by dividing the overlap region, which is the region where the second image overlaps the first image, into a plurality of blocks, the frequency of appearance for each gradation of the pixel attribute is calculated,
Of the frequencies, a first frequency that is a frequency in a first gradation of the gradations, a second frequency that is a frequency in a second gradation of the gradations, and the gradation The third frequency that is the frequency in the third gradation is the peak, and the difference between the third frequencies in each block is the difference between the first frequencies in each block and If the difference between the second frequencies in each block is larger than the difference between the second frequencies, the gradation of the third gradation pixel among the pixels in the overlapping region is changed to the first gradation. Generating one replacement image, and generating a second replacement image by changing the gradation of the third gradation pixel of the pixels in the overlap region to the second gradation;
Closing the second gradation pixel of the first replacement image;
Closing the first gradation pixel of the second replacement image;
Of the pixels in the overlapping region, the same position as the first gradation pixel of the first replacement image after closing or the second gradation pixel of the second replacement image after closing A set of pixels at the same position is detected as the character;
The character detection method characterized by the above-mentioned.
前記コンピュータに、
前記第一の画像に前記第二の画像が重なっている領域である重畳領域を複数に分割したブロックごとに、画素の属性の階調ごとの出現の度数を算出する処理を実行させ、
前記度数のうちの、前記階調のうちの第一の階調における度数である第一の度数、前記階調のうちの第二の階調における度数である第二の度数、および前記階調のうちの第三の階調における度数である第三の度数がピークであり、かつ、前記各ブロックにおける前記第三の度数同士の差が、前記各ブロックにおける前記第一の度数同士の差および前記各ブロックにおける前記第二の度数同士の差よりも大きい場合に、前記重畳領域の画素のうちの前記第三の階調の画素の階調を前記第一の階調に変更することによって第一の置換画像を生成し、前記重畳領域の画素のうちの前記第三の階調の画素の階調を前記第二の階調に変更することによって第二の置換画像を生成する処理を実行させ、
前記第一の置換画像の前記第二の階調の画素をクロージングする処理を実行させ、
前記第二の置換画像の前記第一の階調の画素をクロージングする処理を実行させ、
前記重畳領域の画素のうちの、クロージング後の前記第一の置換画像の前記第一の階調の画素と同じ位置またはクロージング後の前記第二の置換画像の前記第二の階調の画素と同じ位置にある画素の集合を、前記文字として検出する処理を実行させる、
ことを特徴とするコンピュータプログラム。 A computer program used in a computer for detecting a character from an image including a first image representing a character and a second image representing a translucent object,
In the computer,
For each block obtained by dividing the overlapping region, which is the region where the second image overlaps the first image, into a plurality of blocks, a process of calculating the frequency of appearance for each gradation of the pixel attribute is executed,
Of the frequencies, a first frequency that is a frequency in a first gradation of the gradations, a second frequency that is a frequency in a second gradation of the gradations, and the gradation The third frequency that is the frequency in the third gradation is the peak, and the difference between the third frequencies in each block is the difference between the first frequencies in each block and If the difference between the second frequencies in each block is larger than the difference between the second frequencies, the gradation of the third gradation pixel among the pixels in the overlapping region is changed to the first gradation. Generate one replacement image, and execute a process of generating a second replacement image by changing the gradation of the third gradation pixel of the pixels in the overlapping region to the second gradation Let
Executing a process of closing the pixels of the second gradation of the first replacement image;
Executing a process of closing the pixels of the first gradation of the second replacement image;
Of the pixels in the overlapping region, the same position as the first gradation pixel of the first replacement image after closing or the second gradation pixel of the second replacement image after closing A process of detecting a set of pixels at the same position as the character;
A computer program characterized by the above.
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2010294504A JP5454466B2 (en) | 2010-12-29 | 2010-12-29 | Character detection device, character detection method, and computer program |
| PCT/JP2012/000007 WO2012091180A1 (en) | 2010-12-29 | 2012-01-04 | Character detection device, character detection method, and recording medium |
| US13/393,768 US9098768B2 (en) | 2010-12-29 | 2012-01-04 | Character detection apparatus, character detection method, and computer-readable storage medium |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2010294504A JP5454466B2 (en) | 2010-12-29 | 2010-12-29 | Character detection device, character detection method, and computer program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2012142802A JP2012142802A (en) | 2012-07-26 |
| JP5454466B2 true JP5454466B2 (en) | 2014-03-26 |
Family
ID=46383243
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2010294504A Expired - Fee Related JP5454466B2 (en) | 2010-12-29 | 2010-12-29 | Character detection device, character detection method, and computer program |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US9098768B2 (en) |
| JP (1) | JP5454466B2 (en) |
| WO (1) | WO2012091180A1 (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7081685B2 (en) * | 2018-11-30 | 2022-06-07 | 日本電気株式会社 | Image collation device, image collation method, program |
Family Cites Families (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS63131272A (en) * | 1986-11-21 | 1988-06-03 | Fuji Electric Co Ltd | Decision method for binarization threshold |
| US5594809A (en) * | 1995-04-28 | 1997-01-14 | Xerox Corporation | Automatic training of character templates using a text line image, a text line transcription and a line image source model |
| JP2002369011A (en) * | 2001-06-06 | 2002-12-20 | Canon Inc | Image processing apparatus, image processing method, and image processing program |
| US7505604B2 (en) * | 2002-05-20 | 2009-03-17 | Simmonds Precision Prodcuts, Inc. | Method for detection and recognition of fog presence within an aircraft compartment using video images |
| JP4071701B2 (en) * | 2003-11-11 | 2008-04-02 | 富士通株式会社 | Color image compression method and color image compression apparatus |
| JP4992832B2 (en) * | 2008-06-18 | 2012-08-08 | コニカミノルタビジネステクノロジーズ株式会社 | Image processing apparatus and image processing method |
| US8189917B2 (en) | 2008-09-25 | 2012-05-29 | Sharp Laboratories Of America, Inc. | Methods and systems for locating text in a digital image |
| JP5300639B2 (en) * | 2009-07-23 | 2013-09-25 | キヤノン株式会社 | Image processing method, image processing apparatus, and program |
| JP2012155010A (en) * | 2011-01-24 | 2012-08-16 | Keyence Corp | Microscope system, surface state observation method, and surface state observation program |
-
2010
- 2010-12-29 JP JP2010294504A patent/JP5454466B2/en not_active Expired - Fee Related
-
2012
- 2012-01-04 WO PCT/JP2012/000007 patent/WO2012091180A1/en not_active Ceased
- 2012-01-04 US US13/393,768 patent/US9098768B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| US20120201461A1 (en) | 2012-08-09 |
| US9098768B2 (en) | 2015-08-04 |
| WO2012091180A1 (en) | 2012-07-05 |
| JP2012142802A (en) | 2012-07-26 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4333708B2 (en) | Method, apparatus, and computer program for processing input data related to generation of electronic file | |
| US9723177B2 (en) | Image processing system, image processing apparatus, and image forming apparatus | |
| US8340411B2 (en) | Smart image resizing with color-based entropy and gradient operators | |
| JP7600805B2 (en) | Image processing device, image processing method, and program | |
| US20140293353A1 (en) | Document file output apparatus, document file output method, and computer program | |
| JP5187331B2 (en) | Image processing apparatus, image processing method, and computer program | |
| JP2016058879A (en) | Image processing apparatus and image processing method | |
| JP5056899B2 (en) | Transmission image detection device, transmission image edge detection device, transmission image detection method, and transmission image edge detection method | |
| JP2010074342A (en) | Image processing apparatus, image forming apparatus, and program | |
| JP5454466B2 (en) | Character detection device, character detection method, and computer program | |
| JP5598325B2 (en) | Character detection device, character detection method, and computer program | |
| US11405525B2 (en) | Image processing apparatus, control method, and product capable of improving compression efficiency by converting close color to background color in a low light reading mode | |
| JP5212425B2 (en) | Image processing apparatus and image processing method | |
| JP4710672B2 (en) | Character color discrimination device, character color discrimination method, and computer program | |
| JP2012145978A (en) | Character detecting device, character detecting method, and computer program | |
| JP5825142B2 (en) | Image processing apparatus, image processing method, and computer program | |
| JP6413450B2 (en) | Image processing apparatus, image forming apparatus, and program | |
| JP5884509B2 (en) | Image processing apparatus, image reading apparatus, and program | |
| JP6292061B2 (en) | Information processing apparatus and program | |
| JP2012151730A (en) | Character detector, character detection method, and computer program | |
| JP2010004152A (en) | Image processor and character region extraction method, and computer program | |
| JP2011139373A (en) | Black color determining apparatus and black color determining method | |
| JP5983124B2 (en) | Edge detection device, edge detection method, and computer program | |
| JP5870830B2 (en) | Boundary determination device, boundary line determination method, and computer program | |
| JP2016133893A (en) | Image processing apparatus and control method thereof |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121018 |
|
| A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20130417 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130903 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20131029 Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131029 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131210 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131223 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5454466 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| LAPS | Cancellation because of no payment of annual fees |