JP3299873B2 - Image processing apparatus and image processing method - Google Patents
Image processing apparatus and image processing methodInfo
- Publication number
- JP3299873B2 JP3299873B2 JP28717995A JP28717995A JP3299873B2 JP 3299873 B2 JP3299873 B2 JP 3299873B2 JP 28717995 A JP28717995 A JP 28717995A JP 28717995 A JP28717995 A JP 28717995A JP 3299873 B2 JP3299873 B2 JP 3299873B2
- Authority
- JP
- Japan
- Prior art keywords
- area
- section
- region
- extracting
- sections
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Input (AREA)
Description
【0001】[0001]
【発明の属する技術分野】本発明は、複数枚の定型用紙
を含む画像中より用紙一枚一枚の領域を自動的に抽出す
る装置及び方法に関するもので、例えば複数枚の名刺を
一度に読み取り、名刺領域を自動的に抽出し文字認識・
住所録作成を行なうために利用される。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an apparatus and a method for automatically extracting an area of each sheet from an image including a plurality of standard sheets, for example, reading a plurality of business cards at once. , Business card area is automatically extracted and character recognition
Used to create an address book.
【0002】[0002]
【従来の技術】文書を画像として読み取り、自動的に認
識を行なう場合、読み取った画像中には一つの用紙だけ
が存在し、その用紙の範囲及び傾きを調べた後に、用紙
内の認識を行なうのが一般的である。例えば、市販され
ている名刺読み取り機は名刺を一枚ずつ画像として読み
取った後、認識処理を行なっている。2. Description of the Related Art When a document is read as an image and is automatically recognized, only one sheet is present in the read image, and after checking the range and inclination of the sheet, recognition within the sheet is performed. It is common. For example, a commercially available business card reader reads a business card one by one as an image and then performs a recognition process.
【0003】[0003]
【発明が解決しようとする課題】本発明は、複数枚の定
型用紙を画像として一度に読み取り、一枚一枚の領域を
自動的かつ高速に抽出し、抽出した領域のデータを文字
認識処理することで、複数名刺などの定形用紙に印刷さ
れた文字を一度に認識処理させるものである。SUMMARY OF THE INVENTION According to the present invention, a plurality of fixed-size sheets are read at once as an image, an area of each sheet is automatically and quickly extracted, and data of the extracted area is subjected to character recognition processing. In this way, characters printed on standard paper such as a plurality of business cards are recognized at a time.
【0004】[0004]
【課題を解決するための手段】本発明に係る画像処理装
置は、複数枚の定型用紙を画像として読み取り入力され
て、各一枚ごとの領域を抽出し、該抽出した領域内を認
識処理する機能を備えた画像処理装置であって、前記入
力された画像に対して、この入力画像内を縦方向及び横
方向に走査し、白画素を抽出することで周辺分布を求
め、この周辺分布を用いて縦方向及び横方向の白画素が
存在する連続領域を有効区間として区間分割し、この分
割された各区間を前記入力された画像内での白画素が存
在する画像領域として判定することで前記各一枚ごとの
領域を抽出する領域抽出制御手段を備え、 1)前記領域抽出制御手段は、前記分割された各区間か
ら開始座標と終了座標を抽出し、この開始座標と終了座
標とから区間長を求め、該区間長を予め定めた基準値と
比較し、該基準値より小さい場合には該区間での白画素
のデータを削除することで前記区間からなる領域を白画
素が存在しない領域と判定する。 2)前記領域抽出制御手段は、前記分割された各区間か
ら開始座標と終了座標を抽出し、隣合った2区間分の開
始座標と終了座標とから両区間の間の長さと両区間の全
長を求め、この求めたそれぞれの長さを予め定めた基準
値とそれぞれ比較し、該基準値より小さい場合にはその
中の白画素のデータが1つの区間となるように両区間を
統合することで前記区間からなる領域を白画素が存在す
る領域と判定する。 3)前記領域抽出制御手段は、前記分割された各区間か
ら開始座標と終了座標を抽出し、この開始座標と終了座
標とから区間長を求め、該区間長が前記予め定めた定型
用紙の長さを自然数倍した長さに予め定めた読み取り誤
差を含めた長さの範囲内に含まれる場合、該区間長を前
記自然数倍する予め定めた定型用紙の長さの区間に分割
することで前記区間からなる領域を白画素が存在する領
域と判定する。ことを特徴とする ものである。An image processing apparatus according to the present invention reads and inputs a plurality of fixed-size sheets as images, extracts an area for each sheet, and performs recognition processing on the extracted area. An image processing apparatus having a function, for the input image, scans the input image in the vertical and horizontal directions and extracts a white pixel to obtain a peripheral distribution. By dividing a continuous area where white pixels in the vertical direction and the horizontal direction are present as an effective section, and determining each of the divided sections as an image area where a white pixel exists in the input image. The image processing apparatus further includes an area extraction control unit that extracts an area for each of the sheets . 1) The area extraction control unit determines whether each of the divided sections
The start coordinates and end coordinates are extracted from the
Calculate the section length from the target and set the section length to a predetermined reference value.
Compare, if less than the reference value, the white pixel in the section
By deleting the data of
It is determined that there is no element. 2) The region extraction control means determines whether each of the divided sections
The start and end coordinates are extracted from the
From the start coordinate and end coordinate, the length between both sections and the total of both sections
The length is determined, and each determined length is a predetermined standard.
Value, and if smaller than the reference value,
Both sections are set so that the data of white pixels in
By integrating, the area consisting of the section has white pixels.
Area. 3) The area extraction control means determines whether each of the divided sections
The start coordinates and end coordinates are extracted from the
The section length is obtained from the target, and the section length is the predetermined fixed form.
Incorrect reading error that has been set to a length that is a natural number times the length of the paper
If the section length is included in the range of the length including the difference,
Divided into sections of a predetermined form length multiplied by a natural number
By doing so, the area consisting of the section is
Area. It is characterized by the following.
【0005】本発明に係る画像処理装置は、さらに上記
画像処理装置において、領域抽出制御手段は、前記分割
された各区間から規定される白画素が存在する領域の判
定を該領域内の複数回の直線走査によって行なうことを
特徴とするものである。[0005] In the image processing apparatus according to the present invention, in the above-mentioned image processing apparatus, the area extraction control means may determine a region where a white pixel defined from each of the divided sections exists by a plurality of times in the region. Is performed by linear scanning.
【0006】本発明に係る画像処理方法は、複数枚の定
型用紙を画像として読み取り入力されて、各一枚ごとの
領域を抽出し、該抽出した領域内を認識処理する機能を
備えた画像処理装置の画像処理方法であって、前記入力
された画像に対して、この入力画像内を縦方向及び横方
向に走査し、白画素を抽出することで周辺分布を求め、
この周辺分布を用いて縦方向及び横方向の白画素が存在
する連続領域を有効区間として区間分割し、この分割さ
れた各区間を前記入力された画像内での白画素が存在す
る画像領域として判定することで前記各一枚ごとの領域
を抽出する領域抽出ステップを有し、 1)前記領域抽出ステップは、前記分割された各区間か
ら開始座標と終了座標を抽出し、この開始座標と終了座
標とから区間長を求め、該区間長を予め定めた基準値と
比較し、該基準値より小さい場合には該区間での白画素
のデータを削除することで前記区間からなる領域を白画
素が存在しない領域と判定する。 2)前記領域抽出ステップは、前記分割された各区間か
ら開始座標と終了座標を抽出し、隣合った2区間分の開
始座標と終了座標とから両区間の間の長さと両区間の全
長を求め、この求めたそれぞれの長さを予め定めた基準
値とそれぞれ比較し、該基準値より小さい場合にはその
中の白画素のデータが1つの区間となるように両区間を
統合することで前記区間からなる領域を白画素が存在す
る領域と判定する。 3)前記領域抽出ステップは、前記分割された各区間か
ら開始座標と終了座標を抽出し、この開始座標と終了座
標とから区間長を求め、該区間長が前記予め定めた定型
用紙の長さを自然数倍した長さに予め定めた読み取り誤
差を含めた長さの範囲内に含まれる場合、該区間長を前
記自然数倍する予め定めた定型用紙の長さの区間に分割
することで前記区間からなる領域を白画素が存在する領
域と判定する。 ことを特徴とする方法である。本発明に
係る画像処理方法は、さらに上記画像処理方法におい
て、前記領域抽出ステップは、前記分割された各区間か
ら規定される白画素が存在する領域の判定を該領域内の
複数回の直線走査によって行なうことを特徴とする方法
である。An image processing method according to the present invention has a function of reading and inputting a plurality of fixed-size sheets as images, extracting an area for each sheet, and recognizing the extracted area. An image processing method of the apparatus, wherein the input image is scanned in a vertical direction and a horizontal direction in the input image, and a peripheral distribution is obtained by extracting white pixels.
Using this peripheral distribution, a continuous area where white pixels in the vertical and horizontal directions are present is divided into sections as effective sections, and each of the divided sections is used as an image area where white pixels exist in the input image. have a region extraction step of extracting an area of each of said piece by determining, 1) the area extracting step, whether the respective divided sections
The start coordinates and end coordinates are extracted from the
Calculate the section length from the target and set the section length to a predetermined reference value.
Compare, if less than the reference value, the white pixel in the section
By deleting the data of
It is determined that there is no element. 2) The region extraction step is performed for each of the divided sections.
The start and end coordinates are extracted from the
From the start coordinate and end coordinate, the length between both sections and the total of both sections
The length is determined, and each determined length is a predetermined standard.
Value, and if smaller than the reference value,
Both sections are set so that the data of white pixels in
By integrating, the area consisting of the section has white pixels.
Area. 3) The region extraction step is performed for each of the divided sections.
The start coordinates and end coordinates are extracted from the
The section length is obtained from the target, and the section length is the predetermined fixed form.
Incorrect reading error that has been set to a length that is a natural number times the length of the paper
If the section length is included in the range of the length including the difference,
Divided into sections of a predetermined form length multiplied by a natural number
By doing so, the area consisting of the section is
Area. A method characterized by the following. In the image processing method according to the present invention, in the above-described image processing method, the area extraction step may determine a region where a white pixel defined from each of the divided sections exists by performing a plurality of linear scans in the region. The method is characterized in that the method is performed by:
【0007】(作用) 本発明においては、入力された画像の周辺分布を用いて
縦方向・横方向にそれぞれ分割し、求めた区間の長さと
あらかじめ定めた値を比較して区間を統合あるいは削除
し、縦・横両方向の区間で規定される領域のうち白画素
が存在する領域を抽出するものであることから、あらか
じめ定めた値を元にして、縦方向・横方向の区間を統合
あるいは削除することにより、適切な大きさの領域を抽
出し、ノイズ領域を無視することができる。(Operation) In the present invention, the peripheral distribution of an input image is used
Divide vertically and horizontally, and calculate the length of the section
Combine or delete sections by comparing predetermined values
And white pixels in the area defined by the vertical and horizontal sections
Is to extract the area where exists, and by integrating or deleting the vertical and horizontal sections based on the predetermined value, the area of the appropriate size is extracted, and the noise area is extracted. Can be ignored.
【0008】さらに本発明においては、求めた区間の長
さがあらかじめ定めた値の整数倍の場合、あらかじめ定
めた値の長さとなる複数個の区間に分割するものである
ことから、用紙が接近し、周辺分布を用いて用紙の領域
を分離できない場合においても、用紙一枚一枚の領域を
抽出することを可能とする。さらに本発明においては、
領域内の白画素の存在の判別を領域内の複数回の直線走
査によって行なうものであることから、周辺分布を用い
て求めた領域に実際に用紙が存在するかを確認するた
め、必要最小限の走査を行なうことで、高速な処理を可
能とする。Further, in the present invention, the length of the obtained section is
If the value is an integral multiple of the predetermined value,
Is divided into multiple sections with the length of the value
Therefore, even when the paper approaches and the area of the paper cannot be separated using the peripheral distribution, it is possible to extract the area of each sheet. Further, in the present invention,
Judgment of the presence of white pixels in the area
Since the inspection is performed by inspection, it is possible to perform high-speed processing by performing a minimum necessary scan in order to confirm whether a sheet actually exists in an area obtained using the peripheral distribution.
【0009】[0009]
【発明の実施の形態】以下に、本発明による複数領域を
抽出する画像処理装置の一実施例について、図1〜図1
2に基づき説明する。DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of an image processing apparatus for extracting a plurality of regions according to the present invention will be described below with reference to FIGS.
2 will be described.
【0010】図1は、本発明を適用した一実施例システ
ムの構成を示す機能ブロック図である。Sは画像を取り
込むスキャナ、M1は入力画像用メモリ、M2,M3は
周辺分布用メモリ、M4,M5は区間座標用メモリ、R
はプログラム用ROM、PはR内のプログラムに従って
処理の流れを制御する制御部である。FIG. 1 is a functional block diagram showing the configuration of an embodiment system to which the present invention is applied. S is a scanner for taking in an image, M1 is a memory for input images, M2 and M3 are memories for peripheral distribution, M4 and M5 are memories for section coordinates, R
Is a program ROM, and P is a control unit that controls the flow of processing according to the program in R.
【0011】図2〜図10は、実施例の処理の流れを示
すフローチャートである。なお、定型用紙幅をXP、定
型用紙高さをYPとする。FIG. 2 to FIG. 10 are flowcharts showing the flow of the processing of the embodiment. Note that the standard paper width is XP and the standard paper height is YP.
【0012】画像より領域を次のように抽出する。 [図2のステップ(1)]スキャナSで読み取った画像
は、入力画像用メモリM1に転送されるようにする。画
像の格納方法は、画像(横:X画素,縦:Y画素)に対
し、画像左上の画素から画像右下の画素へと順に、画素
が白の場合には“1”を、黒の場合には“0”を1by
teずつメモリに格納していく。すなわち座標(x,
y)の画素値を、メモリの(x+X×y)番目のアドレ
スに1byte単位で格納する。画像1枚につきメモリ
容量は(X×Y)byte必要である。A region is extracted from an image as follows. [Step (1) in FIG. 2] The image read by the scanner S is transferred to the input image memory M1. An image is stored in an image (horizontal: X pixels, vertical: Y pixels) in order from the upper left pixel to the lower right pixel in the image. "0" is 1by
te is stored in the memory. That is, the coordinates (x,
The pixel value of y) is stored at the (x + X × y) -th address of the memory in units of 1 byte. The memory capacity of one image requires (X × Y) bytes.
【0013】[図2のステップ(2)]入力画像用メモ
リM1に格納された画像をもとに、制御部Pは画像内の
周辺分布を求め、周辺分布用メモリM2,M3に値を格
納する。周辺分布とは領域内を縦方向あるいは横方向に
走査し白画素をカウントすることによって求まるもの
で、画像M1内の縦方向投影による周辺分布PPv,横
方向投影による周辺分布PPhは、iを横方向の座標,
jを縦方向の座標とするとそれぞれ以下の数式(1)、
数式(2)と表現される。[Step (2) in FIG. 2] Based on the image stored in the input image memory M1, the control unit P obtains the peripheral distribution in the image and stores the values in the peripheral distribution memories M2 and M3. I do. The peripheral distribution is obtained by scanning the area in the vertical or horizontal direction and counting the number of white pixels. The peripheral distribution PPv in the vertical direction and the peripheral distribution PPh in the horizontal direction in the image M1 are obtained by dividing i by the horizontal direction. Direction coordinates,
When j is a coordinate in the vertical direction, the following formula (1),
It is expressed as Equation (2).
【0014】[0014]
【数1】 (Equation 1)
【0015】このとき、PPv(i)=0の区間は縦方
向に連続して求める領域がない部分、PPh(j)=0
の区間は横方向に連続して求める領域がない部分に相当
する。格納方法は、縦方向投影による周辺分布について
は、i:0〜(横画素数−1)においてPPv(i)=
0の場合は“0”を、PPv(i)≠0の場合“1”を
周辺分布メモリM2上に順に1byte単位で格納し、
横方向投影による周辺分布については、j:0〜(縦画
素数−1)においてPPh(j)=0の場合は“0”
を、PPh(j)≠0の場合“1”を周辺分布メモリM
3上に順に1byte単位で格納していく。メモリ容量
は、M2の場合:横画素数byte、M3の場合:縦画
素数byte必要である。At this time, the section where PPv (i) = 0 is a portion where there is no area continuously obtained in the vertical direction, and PPh (j) = 0
Section corresponds to a portion where there is no area to be continuously obtained in the horizontal direction. The storage method is such that, for the peripheral distribution by vertical projection, PPv (i) = i = 0 to (number of horizontal pixels−1).
If 0, “0” is stored in PPv (i) ≠ 0, and “1” is sequentially stored in the peripheral distribution memory M2 in units of 1 byte.
Regarding the marginal distribution by the horizontal projection, “0” when PPh (j) = 0 in j: 0 (the number of vertical pixels−1).
And if PPh (j) ≠ 0, “1” is stored in the peripheral distribution memory M
3 are sequentially stored in units of 1 byte. The memory capacity is required for M2: the number of horizontal pixels, and for M3: the number of vertical pixels, byte.
【0016】[図2〜図3のステップ(3)]制御部P
は周辺分布メモリM2内を走査し、M2(i)=1の区
間を求め、区間座標用メモリM4に区間開始座標値/終
了座標値を格納する(図11)。同様に、制御部Pは周
辺分布メモリM3内を走査し、M3(j)=1の区間を
求め、区間座標用メモリM5に区間開始座標値/終了座
標値を格納する。[Step (3) in FIGS. 2 and 3] Controller P
Scans the inside of the peripheral distribution memory M2, finds a section where M2 (i) = 1, and stores the section start coordinate value / end coordinate value in the section coordinate memory M4 (FIG. 11). Similarly, the control unit P scans the inside of the peripheral distribution memory M3, finds a section where M3 (j) = 1, and stores the section start coordinate value / end coordinate value in the section coordinate memory M5.
【0017】[図4のステップ(4)]制御部Pは、区
間座標用メモリM4より区間開始/終了座標値を取り出
し、区間長を求め、区間長があらかじめ指定した値Th
sx(=用紙間の横方向距離のうちの最小値)未満の場
合、その区間データを削除する。また、区間座標用メモ
リM5より区間開始/終了座標値を取り出し、区間長を
求め、区間長があらかじめ指定した値Thsy(=用紙
間の縦方向距離のうちの最小値)未満の場合、その区間
データを削除する。これにより、ノイズ成分をデータか
ら取り除くことができる。[Step (4) in FIG. 4] The control section P retrieves the section start / end coordinate values from the section coordinate memory M4, finds the section length, and sets the section length to a predetermined value Th.
If it is less than sx (= the minimum value of the horizontal distance between sheets), the section data is deleted. Also, the section start / end coordinate values are extracted from the section coordinate memory M5, the section length is determined, and if the section length is less than a predetermined value Thsy (= the minimum value of the vertical distance between sheets), the section is determined. Delete data. Thereby, the noise component can be removed from the data.
【0018】[図5〜図6のステップ(5)]制御部P
は、区間座標用メモリM4から隣合った2区間分の区間
開始/終了座標値を取り出し、両区間の間の距離がTh
sx以下で、両区間を統合した場合の区間長があらかじ
め指定した値Thlx(=XP+誤差)以下の場合、両
区間を統合して一つの区間データとする。また、区間座
標用メモリM5から隣合った2区間分の区間開始/終了
座標値を取り出し、両区間の間の距離がThsy以下
で、両区間を統合した場合の区間長があらかじめ指定し
た値Thly(=YP+誤差)以下の場合、両区間を統
合して一つの区間データとする。これにより、一つの領
域が周辺分布データでは複数に分かれている場合でも、
一つの領域として抽出することができる。[Step (5) in FIGS. 5 and 6] Control unit P
Extracts the section start / end coordinate values of two adjacent sections from the section coordinate memory M4, and sets the distance between the two sections to Th.
If sx or less and the section length when both sections are integrated are equal to or less than a predetermined value Thlx (= XP + error), both sections are integrated into one section data. The section start / end coordinate values of two adjacent sections are taken out from the section coordinate memory M5, the distance between the two sections is equal to or less than Thsy, and the section length when both sections are integrated is a predetermined value Thly. In the case of (= YP + error) or less, both sections are integrated into one section data. As a result, even if one area is divided into a plurality in the peripheral distribution data,
It can be extracted as one area.
【0019】[図7のステップ(6)] 制御部Pは、区間座標用メモリM4より区間開始/終了
座標値を取り出し、区間長を求め、あらかじめ指定した
値をThn(=読み取り誤差)としたとき、(XP×n
−Thn)≦区間長≦(XP×n+Thn)(n:自然
数)が成立する場合には、その区間をn個に等分する。
すなわち、[開始座標値+(i−1)×(終了座標値−
開始座標値)/n, 開始座標値+i×(終了座標値−
開始座標値)/n](i:1〜n)のn個の区間データ
を元データの代わりにM4に格納する。また、区間座標
用メモリM5より区間開始/終了座標値を取り出し、区
間長を求め、(YP×n−Thn)≦区間長≦(YP×
n+Thn)(n:自然数)が成立する場合には、その
区間をn個に等分する。これにより、複数の領域が周辺
分布データでは一つになっている場合でも、分離して抽
出することができる。[Step (6) in FIG. 7] The control unit P takes out the section start / end coordinate values from the section coordinate memory M4, finds the section length, and sets a predetermined value to Thn (= reading error). Then, (XP × n
-Thn) ≦ District between length ≦ (X P × n + Thn ) (n: if a natural number) is satisfied, aliquoted its section into n.
That is, [start coordinate value + (i−1) × (end coordinate value−
Start coordinate value) / n, start coordinate value + i x (end coordinate value-
The n pieces of section data of (start coordinate value) / n] (i: 1 to n) are stored in M4 instead of the original data. The section start / end coordinate values are extracted from the section coordinate memory M5, the section length is obtained, and (YP × n−Thn) ≦ section length ≦ (YP ×
If (n + Thn) (n: natural number) holds, the section is equally divided into n sections. Thereby, even when a plurality of regions are one in the marginal distribution data, they can be separated and extracted.
【0020】[図8〜図9のステップ(7)]制御部P
は、区間座標用メモリM4より区間開始/終了座標値を
取り出し、区間長を求め、区間長があらかじめ指定した
値Thmx(=XP−誤差)未満の場合またはThlx
より大きい場合、その区間データを削除する。また、区
間座標用メモリM5より区間開始/終了座標値を取り出
し、区間長を求め、区間長があらかじめ指定した値Th
my(=YP−誤差)未満の場合またはThlyより大
きい場合、その区間データを削除する。これにより、定
型用紙以外の用紙が使用された場合に、データから取り
除くことができる。[Step (7) in FIGS. 8 and 9]
Fetches the section start / end coordinate values from the section coordinate memory M4, finds the section length, and when the section length is smaller than a predetermined value Thmx (= XP-error) or Thlx
If it is larger, the section data is deleted. Also, the section start / end coordinate values are extracted from the section coordinate memory M5, the section length is obtained, and the section length is set to a predetermined value Th.
If it is smaller than my (= YP-error) or larger than Thly, the section data is deleted. Thus, when a sheet other than the standard sheet is used, it can be removed from the data.
【0021】[図10のステップ(8)]制御部Pは、
区間座標用メモリM4より横方向の区間開始/終了座標
値を、区間座標用メモリM5より縦方向の区間開始/終
了座標値をそれぞれ一つずつ取り出し、区間で囲まれた
矩形領域内に用紙が存在するかどうかを調べる。具体的
には、制御部Pは入力画像用メモリM1内を矩形左上よ
り右下方向に直線走査して白画素の個数を調べ、個数が
あらかじめ指定した値Thc(例えば用紙高さの1/
5)以上の場合、その矩形領域は求める用紙の領域であ
るとする。個数がThc未満の場合は、さらに矩形左端
中点より右方向に直線走査して白画素の個数を調べ、個
数がThc以上の場合には、その矩形領域は求める用紙
の領域であるとする(図12)。個数がThc未満の場
合は、その矩形領域内に求める用紙の領域は存在しない
とする。領域全体を走査する場合に比べ、高速に用紙が
存在するかどうかの判断が可能である。なお、走査方向
については、矩形右上より左下方向、矩形右下より左上
方向、矩形左下より右上方向、矩形上端中点より下方向
といった様々な走査を組み合わせることで領域の検出漏
れを減らすことも可能である。[Step (8) in FIG. 10] The control unit P
The section start / end coordinate values in the horizontal direction are taken out from the section coordinate memory M4, and the section start / end coordinate values in the vertical direction are taken out one by one from the section coordinate memory M5. Check if it exists. Specifically, the controller P scans the input image memory M1 linearly from the upper left corner to the lower right corner of the rectangle to check the number of white pixels.
5) In the above case, it is assumed that the rectangular area is the area of the sheet to be obtained. When the number is less than Thc, the number of white pixels is further examined by linear scanning rightward from the middle point of the left end of the rectangle, and when the number is greater than Thc, the rectangular area is assumed to be a paper area to be obtained ( (FIG. 12). If the number is less than Thc, it is assumed that there is no paper area to be found in the rectangular area. It is possible to determine whether or not a sheet exists at a higher speed than when scanning the entire area. For the scanning direction, it is also possible to reduce the detection omission of the area by combining various scans such as the lower right direction from the upper right of the rectangle, the upper left direction from the lower right of the rectangle, the upper right direction from the lower left of the rectangle, the lower direction from the middle point of the upper end of the rectangle. It is.
【0022】上記のようにして抽出された複数の矩形領
域内に存在する画像データは、図示しない文字認識部に
導入され、各領域単位に文字認識が実行されて認識結果
は図示しない住所録メモリなどに記憶されることとな
る。The image data present in the plurality of rectangular areas extracted as described above is introduced into a character recognition unit (not shown), and character recognition is executed for each area, and the recognition result is stored in an address book memory (not shown). And so on.
【0023】[0023]
【発明の効果】以上のように本発明では、複数枚の定型
用紙を画像として一度に読み取り、一枚一枚の領域を自
動的かつ高速に抽出し、抽出した領域のデータを文字認
識処理することで、複数名刺などの定形用紙に印刷され
た文字を一度に認識処理させることが可能となる。As described above, according to the present invention, a plurality of fixed-size sheets are read at once as an image, an area of each sheet is automatically and rapidly extracted, and data of the extracted area is subjected to character recognition processing. it is, that Do is possible to print characters in standard size paper, such as a plurality name card recognized processed at one time.
【0024】したがって、本発明に係る画像処理装置で
は、あらかじめ定めたしきい値を元にして、縦方向・横
方向の区間を統合あるいは削除することにより、適切な
大きさの領域を抽出するとともにノイズ領域を無視する
ことができる。[0024] Thus, <br/> in the image processing apparatus according to the present invention, based on the predetermined threshold value, by integrating or remove the vertical and horizontal direction of the section, a suitably sized Regions can be extracted and noise regions can be ignored.
【0025】また本発明に係る画像処理装置では、用紙
が接近し、周辺分布を用いて複数の用紙の領域を一枚ず
つに分離できない場合においても、あらかじめ定めた用
紙の大きさを元にして、用紙一枚一枚の領域を抽出する
ことができる。[0025] In the image processing apparatus according to the present invention, the paper approaches, in the case that can not be separated one by one area of the plurality of sheets using the marginal distribution also, on the basis of the magnitude of the predetermined paper Thus, an area of each sheet can be extracted.
【0026】さらに本発明に係る画像処理装置では、周
辺分布を用いて求めた領域に実際に用紙が存在するかど
うかを確認するため、必要最小限の直線走査を行なうこ
とにより、処理を高速にできる。[0026] In the image processing apparatus according to the present invention further fast to see if in fact the paper in a region determined using the marginal distribution is present, by performing the required minimum linear scan, handle Can be.
【図1】本発明を適用した一実施例システムの構成を示
す機能ブロック図である。FIG. 1 is a functional block diagram showing a configuration of a system according to an embodiment to which the present invention is applied.
【図2】本発明を適用した一実施例システムの動作を示
すフローチャート図である。FIG. 2 is a flowchart showing an operation of the system according to the embodiment to which the present invention is applied.
【図3】本発明を適用した一実施例システムの動作を示
すフローチャート図である。FIG. 3 is a flowchart illustrating an operation of the system according to the embodiment to which the present invention is applied;
【図4】本発明を適用した一実施例システムの動作を示
すフローチャート図である。FIG. 4 is a flowchart showing an operation of the system according to the embodiment to which the present invention is applied.
【図5】本発明を適用した一実施例システムの動作を示
すフローチャート図である。FIG. 5 is a flowchart illustrating an operation of the system according to the embodiment to which the present invention is applied;
【図6】本発明を適用した一実施例システムの動作を示
すフローチャート図である。FIG. 6 is a flowchart illustrating an operation of the system according to the embodiment to which the present invention is applied;
【図7】本発明を適用した一実施例システムの動作を示
すフローチャート図である。FIG. 7 is a flowchart showing an operation of the system according to the embodiment to which the present invention is applied.
【図8】本発明を適用した一実施例システムの動作を示
すフローチャート図である。FIG. 8 is a flowchart showing an operation of the system according to the embodiment to which the present invention is applied.
【図9】本発明を適用した一実施例システムの動作を示
すフローチャート図である。FIG. 9 is a flowchart showing an operation of the system according to the embodiment to which the present invention is applied.
【図10】本発明を適用した一実施例システムの動作を
示すフローチャート図である。FIG. 10 is a flowchart showing the operation of the system according to the embodiment to which the present invention is applied.
【図11】区間座標用メモリへの値の格納方法の一実施
例を示す図である。FIG. 11 is a diagram showing an embodiment of a method of storing a value in a section coordinate memory.
【図12】矩形領域内の走査方法の一実施例を示す図で
ある。FIG. 12 is a diagram showing an embodiment of a method for scanning a rectangular area.
S スキャナ M1 入力画像用メモリ M2,M3 周辺分布用メモリ M4,M5 区間座標用メモリ R プログラム用ROM P 制御部 S scanner M1 Input image memory M2, M3 Peripheral distribution memory M4, M5 Section coordinate memory R Program ROM P control unit
Claims (8)
入力されて、各一枚ごとの領域を抽出し、該抽出した領
域内を認識処理する機能を備えた画像処理装置であっ
て、 前記入力された画像に対して、この入力画像内を縦方向
及び横方向に走査し、白画素を抽出することで周辺分布
を求め、この周辺分布を用いて縦方向及び横方向の白画
素が存在する連続領域を有効区間として区間分割し、こ
の分割された各区間を前記入力された画像内での白画素
が存在する画像領域として判定することで前記各一枚ご
との領域を抽出する領域抽出制御手段を備え、 前記領域抽出制御手段は、前記分割された各区間から開
始座標と終了座標を抽出し、この開始座標と終了座標と
から区間長を求め、該区間長を予め定めた基準値と比較
し、該基準値より小さい場合には該区間での白画素のデ
ータを削除することで前記区間からなる領域を白画素が
存在しない領域と判定する ことを特徴とする画像処理装
置。1. An image processing apparatus having a function of reading and inputting a plurality of fixed-size sheets as images, extracting an area for each sheet, and performing a recognition process on the extracted area. The input image is scanned in the vertical direction and the horizontal direction in the input image, and a peripheral distribution is obtained by extracting white pixels. White pixels in the vertical direction and the horizontal direction exist using the peripheral distribution. Area extraction control for extracting a region for each sheet by dividing a continuous region as an effective region and determining each of the divided regions as an image region where a white pixel exists in the input image. Means, and the area extraction control means starts from each of the divided sections.
Extract the start and end coordinates, and calculate the start and end coordinates
From section and compare the section length with a predetermined reference value
If it is smaller than the reference value, the white pixel data
By deleting the data, the white pixels
An image processing apparatus for determining an area that does not exist .
入力されて、各一枚ごとの領域を抽出し、該抽出した領
域内を認識処理する機能を備えた画像処理装置であっ
て、 前記入力された画像に対して、この入力画像内を縦方向
及び横方向に走査し、白画素を抽出することで周辺分布
を求め、この周辺分布を用いて縦方向及び横方向の白画
素が存在する連続領域を有効区間として区間分割し、こ
の分割された各区間を前記入力された画像内での白画素
が存在する画像領域として判定することで前記各一枚ご
との領域を抽出する領域抽出制御手段を備え、 前記領域抽出制御手段は、前記分割された各区間から開
始座標と終了座標を抽出し、隣合った2区間分の開始座
標と終了座標とから両区間の間の長さと両区間の全長を
求め、この求めたそれぞれの長さを予め定めた基準値と
それぞれ比較し、該基準値より小さい場合にはその中の
白画素のデータが1つの区間となるように両区間を統合
することで前記区間からなる領域を白画素が存在する領
域と判定する ことを特徴とする画像処理装置。2. A plurality of standard papers are read as images.
After input, an area for each sheet is extracted, and the extracted area is extracted.
An image processing device with a function of recognizing the area
Te, to the input image, the vertical direction in the input image
And by scanning in the horizontal direction and extracting white pixels, the marginal distribution
And use this marginal distribution to create vertical and horizontal white images.
The continuous area where the element exists
Is a white pixel in the input image.
Is determined as an image area where
An area extracting control means for extracting a region of the region extraction control means, opening from the respective divided sections
Extracts the start and end coordinates, and the start position for two adjacent sections
From the mark and the end coordinates, the length between both sections and the total length of both sections
Calculated, and the obtained lengths are determined by a predetermined reference value.
Each is compared, and if smaller than the reference value,
Combine both sections so that white pixel data becomes one section
By doing so, the area consisting of the section is
Images processor characterized by determining the frequency.
入力されて、各一枚 ごとの領域を抽出し、該抽出した領
域内を認識処理する機能を備えた画像処理装置であっ
て、 前記入力された画像に対して、この入力画像内を縦方向
及び横方向に走査し、白画素を抽出することで周辺分布
を求め、この周辺分布を用いて縦方向及び横方向の白画
素が存在する連続領域を有効区間として区間分割し、こ
の分割された各区間を前記入力された画像内での白画素
が存在する画像領域として判定することで前記各一枚ご
との領域を抽出する領域抽出制御手段を備え、 前記領域抽出制御手段は、前記分割された各区間から開
始座標と終了座標を抽出し、この開始座標と終了座標と
から区間長を求め、該区間長が前記予め定めた定型用紙
の長さを自然数倍した長さに予め定めた読み取り誤差を
含めた長さの範囲内に含まれる場合、該区間長を前記自
然数倍する予め定めた定型用紙の長さの区間に分割する
ことで前記区間からなる領域を白画素が存在する領域と
判定する ことを特徴とする画像処理装置。3. A plurality of standard papers are read as images.
After input , an area for each sheet is extracted, and the extracted area is extracted.
An image processing device with a function of recognizing the area
Te, to the input image, the vertical direction in the input image
And by scanning in the horizontal direction and extracting white pixels, the marginal distribution
And use this marginal distribution to create vertical and horizontal white images.
The continuous area where the element exists
Is a white pixel in the input image.
Is determined as an image area where
An area extracting control means for extracting a region of the region extraction control means, opening from the respective divided sections
Extract the start and end coordinates, and calculate the start and end coordinates
Is calculated from the section length, and the section length is determined by the predetermined fixed form paper.
Is a natural number times the length of
If the section length is included in the range of the included
Divide into sections of a predetermined standard paper length that is several times larger
Thus, the region including the section is defined as a region where white pixels exist.
Images processor wherein the determining.
た各区間から規定される白画素が存在する領域の判定を
該領域内の複数回の直線走査によって行なうことを特徴
とする請求項1乃至3のいずれか記載の画像処理装置。Wherein said area extraction control means being the divided
The area where the white pixel defined from each section exists
The image processing apparatus according to any one of claims 1 to 3, wherein the performing by multiple linear scan within the region.
入力されて、各一枚ごとの領域を抽出し、該抽出した領
域内を認識処理する機能を備えた画像処理装置の画像処
理方法であって、 前記入力された画像に対して、この入力画像内を縦方向
及び横方向に走査し、白画素を抽出することで周辺分布
を求め、この周辺分布を用いて縦方向及び横方向の白画
素が存在する連続領域を有効区間として区間分割し、こ
の分割された各区間を前記入力された画像内での白画素
が存在する画像領域として判定することで前記各一枚ご
との領域を抽出する領域抽出ステップを有し、 前記領域抽出ステップは、前記分割された各区間から開
始座標と終了座標を抽出し、この開始座標と終了座標と
から区間長を求め、該区間長を予め定めた基準値と比較
し、該基準値より小さい場合には該区間での白画素のデ
ータを削除することで前記区間からなる領域を白画素が
存在しない領域と判定することを特徴とする画像処理方
法 。5. A plurality of standard papers are read as images.
After input, an area for each sheet is extracted, and the extracted area is extracted.
Image processing of an image processing apparatus having a function of recognizing the area
A physical method, with respect to the input image, the vertical direction in the input image
And by scanning in the horizontal direction and extracting white pixels, the marginal distribution
And use this marginal distribution to create vertical and horizontal white images.
The continuous area where the element exists
Is a white pixel in the input image.
Is determined as an image area where
And a region extracting step of extracting a region from the divided sections.
Extract the start and end coordinates, and calculate the start and end coordinates
From section and compare the section length with a predetermined reference value
If it is smaller than the reference value, the white pixel data
By deleting the data, the white pixels
An image processing method characterized by determining that a region does not exist
Law .
入力されて、各一枚ごとの領域を抽出し、該抽出した領
域内を認識処理する機能を備えた画像処理装置の画像処
理方法であって、 前記入力された画像に対して、この入力画像内を縦方向
及び横方向に走査し、白画素を抽出することで周辺分布
を求め、この周辺分布を用いて縦方向及び横方向の白画
素が存在する連続領域を有効区間として区間分割し、こ
の分割された各区間を前記入力された画像内での白画素
が存在する画像領域として判定することで前記各一枚ご
との領域を抽出する領域抽出ステップを有し、 前記領域抽出ステップは、前記分割された各区間から開
始座標と終了座標を抽出し、隣合った2区間分の開始座
標と終了座標とから両区間の間の長さと両区間の全長を
求め、この求めたそれぞれの長さを予め定めた基準値と
それぞれ比較し、該基準値より小さい場合にはその中の
白画素のデータが1つの区間となるように両区間を統合
することで前記区間からなる領域を白画素が存在する領
域と判定する ことを特徴とする画像処理方法。6. An image processing method of an image processing apparatus having a function of reading and inputting a plurality of fixed-size sheets as images, extracting a region for each sheet, and performing a recognition process on the extracted region. The input image is scanned in the vertical and horizontal directions in the input image, and a peripheral distribution is obtained by extracting white pixels. The continuous area where pixels are present is divided into sections as effective sections, and each of the divided sections is determined as an image area where white pixels are present in the input image, thereby extracting the area for each of the individual sheets. have a region extraction step of, the area extracting step, open from the respective divided sections
Extracts the start and end coordinates, and the start position for two adjacent sections
From the mark and the end coordinates, the length between both sections and the total length of both sections
Calculated, and the obtained lengths are determined by a predetermined reference value.
Each is compared, and if smaller than the reference value,
Combine both sections so that white pixel data becomes one section
By doing so, the area consisting of the section is
An image processing method characterized by determining a region .
入力されて、各一枚ごとの領域を抽出し、該抽出した領
域内を認識処理する機能を備えた画像処理装置の画像処
理方法であって、 前記入力された画像に対して、この入力画像内を縦方向
及び横方向に走査し、白画素を抽出することで周辺分布
を求め、この周辺分布を用いて縦方向及び横方向の白画
素が存在する連続領域を有効区間として区間分割し、こ
の分割された各区間を前記入力された画像内での白画素
が存在する画像領域として判定することで前記各一枚ご
との領域を抽出する領域抽出ステップを有し、 前記領域抽出ステップは、前記分割された各区間から開
始座標と終了座標を抽出し、この開始座標と終了座標と
から区間長を求め、該区間長が前記予め定めた定型用紙
の長さを自然数倍した長さに予め定めた読み取り誤差を
含めた長さの範囲内に含まれる場合、該区間長を前記自
然数倍する予め定めた定型用紙の長さの区間に分割する
ことで前記区間からなる領域を白画素が存在する領域と
判定する ことを特徴とする画像処理方法。7. A plurality of standard papers are read as images.
After input, an area for each sheet is extracted, and the extracted area is extracted.
Image processing of an image processing apparatus having a function of recognizing the area
A physical method, with respect to the input image, the vertical direction in the input image
And by scanning in the horizontal direction and extracting white pixels, the marginal distribution
And use this marginal distribution to create vertical and horizontal white images.
The continuous area where the element exists
Is a white pixel in the input image.
Is determined as an image area where
And a region extracting step of extracting a region from the divided sections.
Extract the start and end coordinates, and calculate the start and end coordinates
Is calculated from the section length, and the section length is determined by the predetermined fixed form paper.
Is a natural number times the length of
If the section length is included in the range of the included
Divide into sections of a predetermined standard paper length that is several times larger
Thus, the region including the section is defined as a region where white pixels exist.
Images processing how to wherein the determining.
た各区間から規定さ れる白画素が存在する領域の判定を
該領域内の複数回の直線走査によって行なうことを特徴
とする請求項5乃至7のいずれか記載の画像処理方法。8. The method according to claim 8, wherein the step of extracting the area includes
The area where the white pixel defined from each section exists
8. The image processing method according to claim 5, wherein the scanning is performed by a plurality of linear scans in the area .
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP28717995A JP3299873B2 (en) | 1995-11-06 | 1995-11-06 | Image processing apparatus and image processing method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP28717995A JP3299873B2 (en) | 1995-11-06 | 1995-11-06 | Image processing apparatus and image processing method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH09128478A JPH09128478A (en) | 1997-05-16 |
| JP3299873B2 true JP3299873B2 (en) | 2002-07-08 |
Family
ID=17714108
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP28717995A Expired - Fee Related JP3299873B2 (en) | 1995-11-06 | 1995-11-06 | Image processing apparatus and image processing method |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3299873B2 (en) |
Families Citing this family (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003016424A (en) * | 2001-07-04 | 2003-01-17 | Pfu Ltd | IMAGE PROCESSING APPARATUS, CONTROL METHOD OF IMAGE PROCESSING APPARATUS, AND PROGRAM THEREOF |
| JP6458239B1 (en) * | 2017-08-29 | 2019-01-30 | 株式会社マーケットヴィジョン | Image recognition system |
| JP6831951B2 (en) * | 2018-10-16 | 2021-02-24 | 株式会社マーケットヴィジョン | Image recognition system |
| JP7447472B2 (en) * | 2019-12-19 | 2024-03-12 | 富士フイルムビジネスイノベーション株式会社 | Image processing device and image processing program |
-
1995
- 1995-11-06 JP JP28717995A patent/JP3299873B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JPH09128478A (en) | 1997-05-16 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3338537B2 (en) | Image tilt detector | |
| JP2940936B2 (en) | Tablespace identification method | |
| JP6139396B2 (en) | Method and program for compressing binary image representing document | |
| US5075895A (en) | Method and apparatus for recognizing table area formed in binary image of document | |
| JP3278471B2 (en) | Area division method | |
| KR20170101125A (en) | Information processing apparatus, information processing method, and storage medium | |
| JP4013060B2 (en) | Image correction method and image correction apparatus | |
| JP3299873B2 (en) | Image processing apparatus and image processing method | |
| JPH0418351B2 (en) | ||
| EP0602180A1 (en) | Locating characters for character recognition. | |
| JP2002199179A (en) | Inclination detector | |
| JPH05114045A (en) | Area separating method and image processor | |
| US6678427B1 (en) | Document identification registration system | |
| JP4974794B2 (en) | Document recognition apparatus, document recognition method, and computer program | |
| JP2923004B2 (en) | Image generation device | |
| JPH0822507A (en) | Document recognition device | |
| JPH0797390B2 (en) | Character recognition device | |
| JP3031565B2 (en) | Table space judgment method | |
| JPS6343788B2 (en) | ||
| JPS6327752B2 (en) | ||
| JP2827227B2 (en) | Character recognition method | |
| JPH05135202A (en) | Document picture reader | |
| JP2931041B2 (en) | Character recognition method in table | |
| JPH04205287A (en) | Device and method for extracting feature of character | |
| JPH05189604A (en) | Optical character reader |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |