JP3409992B2 - Black and white reversal area identification device and table recognition device using the device - Google Patents
Black and white reversal area identification device and table recognition device using the deviceInfo
- Publication number
- JP3409992B2 JP3409992B2 JP14270897A JP14270897A JP3409992B2 JP 3409992 B2 JP3409992 B2 JP 3409992B2 JP 14270897 A JP14270897 A JP 14270897A JP 14270897 A JP14270897 A JP 14270897A JP 3409992 B2 JP3409992 B2 JP 3409992B2
- Authority
- JP
- Japan
- Prior art keywords
- black
- area
- white
- white inversion
- line segment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Input (AREA)
- Document Processing Apparatus (AREA)
Description
【0001】[0001]
【発明の属する技術分野】本発明は帳票等の表形式の画
像データをスキャナ等の入力装置で入力し、該画像デー
タに対して表認識処理を行う際使用する白黒反転領域識
別装置、及びその装置を使用する表認識装置に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a black-and-white reversal area identifying device used when inputting tabular image data such as a form with an input device such as a scanner and performing table recognition processing on the image data. A table recognition device using the device.
【0002】[0002]
【従来の技術】近年、原稿上の文字や帳票フォームをイ
メージデータとしてコンピュータに供給する装置として
スキャナ等の入力装置が広く使用されている。また、こ
のような入力装置から供給された表を含むイメージデー
タは、画像認識装置により文字や罫線として認識され、
対応する文字コードやベクトルデータとして例えばコン
ピュータ内に記憶される。2. Description of the Related Art In recent years, an input device such as a scanner has been widely used as a device for supplying characters on a document or a form form to a computer as image data. Further, image data including a table supplied from such an input device is recognized as a character or ruled line by the image recognition device,
For example, it is stored in the computer as a corresponding character code or vector data.
【0003】上述のような画像認識装置の中で、罫線の
ように比較的細く、上下又は左右に長いラインを有する
表を認識するため、特にランを使用した表認識装置(特
開平6-33790)が提案されている。この装置は、
図34に示すように画像入力部101から画像領域10
2に表画像を入力し、該入力画像に対し、実線ラン抽出
部103により縦、横2方向のランを使用し、一定の長
さ以上の線分抽出し、それらを連結することにより罫線
を抽出するものである。また、抽出された罫線のうち、
幅がしきい値以上の罫線で囲まれた部分を白黒反転候補
として白黒反転セル候補抽出部104に出力する。そし
て、白黒反転セル決定部105では抽出した白黒反転セ
ル候補の内部の黒画素の密度が、例えば50%以上であ
れば、対応する領域(セル)を白黒反転セルと認定し、
画素反転部106によって当該セルに対し白黒反転処理
を行うものである。In the image recognition apparatus as described above, in order to recognize a table having a relatively thin line such as a ruled line and having long lines in the vertical and horizontal directions, a table recognition apparatus using run in particular (Japanese Patent Laid-Open No. 6-33790). ) Is proposed. This device
As shown in FIG. 34, from the image input unit 101 to the image area 10
The table image is input to 2, and the solid line run extraction unit 103 uses runs in the vertical and horizontal directions with respect to the input image to extract line segments of a certain length or more and connect them to form a ruled line. To extract. Also, among the extracted ruled lines,
A portion surrounded by a ruled line having a width equal to or larger than a threshold value is output to the black / white inversion cell candidate extraction unit 104 as a black / white inversion candidate. Then, in the black / white inversion cell determination unit 105, if the density of black pixels inside the extracted black / white inversion cell candidate is, for example, 50% or more, the corresponding area (cell) is recognized as a black / white inversion cell,
The pixel inversion unit 106 performs black and white inversion processing on the cell.
【0004】尚、上述の白黒反転処理後、白黒反転領域
に書き込まれたデータに対して文字の切り出し処理を行
い、切り出した文字に対して認識処理を行う。After the black-and-white inversion processing described above, character cutting processing is performed on the data written in the black-and-white inversion area, and recognition processing is performed on the cut out characters.
【0005】[0005]
【発明が解決しようとする課題】上記従来の表認識装置
では以下の問題が発生する。
(イ)先ず、従来例の表認識装置では、図35(a)に
示すように、長い横ラン及び縦ランを使用するので同図
(b)に示すように1つのセル内が全て白黒反転画像で
構成されている場合には問題ないが、例えば同図(c)
に示すように、1つのセル内に白黒反転領域と通常セル
領域が混在する場合問題となる。すなわち、同図(c)
に示す例に対し、同図(a)の長さの横ラン及び縦ラン
を使用して黒画素数を計数する場合、白画素数が極めて
多くなり、正確な黒画素数を計数できない。このため白
黒反転領域の識別を誤る。
(ロ)また、従来例の表認識装置では、図35(a)に
示すように、長い横ラン、及び縦ラン(例えば、同図
(b)に示す白黒反転領域の長さと同じ長さの横ラン、
及び縦ラン)を使用するので、認識するセルの横及び縦
の長さが異なる白黒反転領域を認識する場合、正確な黒
画素数の計数ができない。例えば、同図(a)に示すよ
うに、横ランの長さをL1とし、縦ランの長さをL2と
する時、認識する白黒反転セルの横幅が上記L1より長
く、又縦幅が上記L2より長い場合、やはり白画素数が
多くなり、正確な白黒反転領域の識別ができない。The above-described conventional table recognition device has the following problems. (A) First, in the table recognition device of the conventional example, as shown in FIG. 35 (a), long horizontal runs and vertical runs are used, and therefore, as shown in FIG. If it is composed of images, there is no problem, but for example, FIG.
As shown in (1), there is a problem when the black and white reversal area and the normal cell area are mixed in one cell. That is, FIG.
When the number of black pixels is counted using the horizontal run and the vertical run of the length shown in FIG. 9A, the number of white pixels is extremely large, and the number of black pixels cannot be accurately counted. Therefore, the black-and-white inversion area is erroneously identified. (B) In the conventional table recognition device, as shown in FIG. 35 (a), a long horizontal run and a vertical run (for example, a length equal to the length of the black-and-white reversal area shown in FIG. Lateral run,
And vertical run), it is not possible to accurately count the number of black pixels when recognizing black-and-white inversion areas in which the horizontal and vertical lengths of the cells to be recognized are different. For example, when the length of the horizontal run is L1 and the length of the vertical run is L2 as shown in FIG. 8A, the horizontal width of the black-and-white reversal cell to be recognized is longer than the above L1 and the vertical width is the above. When the length is longer than L2, the number of white pixels is large and the black-and-white inversion area cannot be accurately identified.
【0006】また、同様なことは白黒反転セル領域内の
文字サイズが大きい場合にも生じる。すなわち、この場
合同図(b)に示す文字列「会社名」の白抜き文字の文
字サイズが大きい場合であり、横ラン又は縦ランに従っ
て黒画素数を計数すると白抜き文字部分が大きいため、
黒画素数の計数値が少なくなり、正確な白黒反転領域
(白黒反転セル)の認識ができない。
(ハ)さらに、スキャナーによる帳票フォーム等の表画
像の読み出し処理が、例えば傾いた状態で行われた場
合、白黒反転領域に傾きが生じており、傾きのない長い
横ラン、及び縦ランを用いて黒画素数を計数すること
は、誤った(より少ない)数の黒画素数を計数すること
になり、白黒反転セルの認識を誤る結果となる。The same thing occurs when the character size in the black-and-white inversion cell area is large. That is, in this case, the character size of the blank characters of the character string “company name” shown in FIG. 7B is large, and when the number of black pixels is counted according to the horizontal run or the vertical run, the blank character part is large,
Since the count value of the number of black pixels becomes small, it is not possible to accurately recognize the black and white inversion area (black and white inversion cell). (C) Further, when the reading process of the front image such as the form form by the scanner is performed in a tilted state, for example, the black-and-white reversal region has a tilt, and a long horizontal run without tilt and a vertical run are used. Counting the number of black pixels by counting the wrong (smaller) number of black pixels results in erroneous recognition of the black-and-white inversion cell.
【0007】かかる場合、例えば横ラン、及び縦ランを
同じ角度だけ傾けて計数処理を行うことが必要である。
しかし、このような傾き補正には煩雑な処理が必要とな
る。本発明は上記課題を解決するため、水平方向に短い
線分抽出マスク、及び垂直方向に短い線分抽出マスクを
使用し、当該線分抽出マスクに含まれる黒画素数を計数
し且つ統合処理し、統合線分の線幅が所定の閾値を越え
る場合白黒反転候補領域とし、当該白黒反転候補領域を
水平方向及び垂直方向に作成し、これらを例えば線分セ
グメント列で囲った領域を白黒反転領域とすることで、
上記(イ)〜(ハ)の課題を解決する白黒反転領域識別
装置、及びその装置を使用する表認識装置を提供するも
のである。In such a case, for example, it is necessary to perform the counting process by inclining the horizontal run and the vertical run by the same angle.
However, such tilt correction requires complicated processing. In order to solve the above problems, the present invention uses a short line segment extraction mask in the horizontal direction and a short line segment extraction mask in the vertical direction, counts the number of black pixels included in the line segment extraction mask, and performs integrated processing. , If the line width of the integrated line segment exceeds a predetermined threshold value, the black-and-white inversion candidate region is created, and the black-and-white inversion candidate region is created in the horizontal direction and the vertical direction. By doing,
(EN) A black and white reversal area identifying device that solves the above problems (A) to (C), and a table recognition device that uses the device.
【0008】[0008]
【課題を解決するための手段】請求項1記載の発明は上
記課題を解決するため、表形式の2値イメージデータに
対し、水平方向に長い線分抽出マスクを用いて水平方向
に走査し、垂直方向に長い線分抽出マスクを用いて垂直
方向に走査し、黒画素密度が所定の閾値より高い領域を
それぞれ抽出する領域抽出手段と、該領域抽出手段で抽
出した前記黒画素密度の高い領域をそれぞれのマスク走
査方向に直交する方向で統合する第1の統合手段と、該
第1の統合手段で統合した領域の線幅が所定の閾値以上
であれば白黒反転候補領域であるとし、該白黒反転候補
領域をそれぞれのマスク走査方向に統合する第2の統合
手段と、該第2の統合手段で統合した白黒反転候補領域
の輪郭に対し、水平方向及び垂直方向の線分セグメント
列を作成する線分セグメント列作成手段と、該線分セグ
メント列作成手段で作成された水平方向の線分セグメン
ト列と垂直方向の線分セグメント列で囲まれた領域を白
黒反転領域に設定する白黒反転領域設定手段とを備えた
白黒反転領域識別装置を提供することによって達成でき
る。In order to solve the above-mentioned problems, the invention described in claim 1 scans the binary image data in the table format in the horizontal direction using a line segment extraction mask long in the horizontal direction, A region extracting unit that scans in the vertical direction using a line segment extraction mask that is long in the vertical direction, and extracts regions each having a black pixel density higher than a predetermined threshold value; and a region having a high black pixel density extracted by the region extracting unit. And a first unifying means for unifying the areas in a direction orthogonal to the respective mask scanning directions, and if the line width of the area integrated by the first unifying means is equal to or larger than a predetermined threshold value, it is regarded as a black and white reversal candidate area. Second integration means for integrating the black-and-white inversion candidate areas in the respective mask scanning directions, and line segment segments in the horizontal and vertical directions are created for the contours of the black-and-white inversion candidate areas integrated by the second integration means. Line segment And a black and white reversal area setting means for setting an area surrounded by the line segment segment row in the horizontal direction and the line segment segment row in the vertical direction created by the line segment segment row creating means as a black and white inversion area. It can be achieved by providing a black-and-white reversal area identification device with.
【0009】すなわち、本例は水平方向に長い、縦×横
(m×n)が例えば、1×6、1×15、1×30等)
の線分抽出マスクを使用し、水平方向に順次一定ドット
毎に走査し、当該線分抽出マスクで切り取られる矩形領
域内に所定の閾値以上の黒画素が含まれている時、当該
領域を上記水平方向に直交する方向に統合し、該統合結
果によって所定の閾値以上の線幅であれば白黒反転候補
領域とし、更に第2の統合手段によって当該白黒反転候
補領域の領域(線分)を水平方向に延長する。That is, in this example, the horizontal length is long, and vertical × horizontal (m × n) is, for example, 1 × 6, 1 × 15, 1 × 30, etc.)
The line segment extraction mask is used to scan in the horizontal direction at regular intervals, and when the rectangular region cut out by the line segment extraction mask contains black pixels of a predetermined threshold value or more, the region is The black and white inversion candidate area is integrated if it is integrated in a direction orthogonal to the horizontal direction and the line width is equal to or larger than a predetermined threshold value as a result of the integration, and the area (line segment) of the black and white inversion candidate area is made horizontal by the second integration means. Extend in the direction.
【0010】一方、垂直方向に対しても同様の処理を行
い、垂直方向に長いm×n(例えば、6×1、15×
1、30×1等)の線分抽出マスクを使用し、垂直方向
に順次一定ドット毎に走査し、当該線分抽出マスクで切
り取られる領域内に所定の閾値以上の黒画素が含まれて
いる時、当該領域(線分)を上記垂直方向に直交する方
向に統合し、該統合結果得られる線幅が所定の閾値以上
の線幅であれば白黒反転候補領域とし、更に第2の統合
手段によって当該白黒反転候補領域の線分を垂直方向に
延長する。On the other hand, the same processing is performed also in the vertical direction, and m × n (for example, 6 × 1, 15 ×) that is long in the vertical direction is performed.
1, 30 × 1, etc.) line segment extraction mask is used, and scanning is sequentially performed in the vertical direction for every fixed dot, and black pixels of a predetermined threshold value or more are included in the region cut by the line segment extraction mask. At this time, the regions (line segments) are integrated in a direction orthogonal to the vertical direction, and if the line width obtained as a result of the integration is a line width equal to or larger than a predetermined threshold value, it is set as a black-and-white reversal candidate region, and the second integrating means is further included. The line segment of the black-and-white inversion candidate area is extended in the vertical direction.
【0011】そして、上記水平方向及び垂直方向に作成
した白黒反転候補領域に対し、それぞれの輪郭を示す線
分セグメント列を水平方向、垂直方向に作成し、このよ
うにして作成された線分セグメント列で囲われた領域を
白黒反転領域とする。Then, with respect to the black-and-white reversal candidate regions created in the horizontal direction and the vertical direction, line segment segment lines showing respective contours are created in the horizontal direction and the vertical direction, and the line segment segments created in this way The area surrounded by columns is the black-and-white inversion area.
【0012】このように本請求項1記載の発明は、水平
方向に極めて細く(例えば1ドット)、且つ比較的短い
(例えば6ドット、15ドット、30ドット)線分抽出
マスクを使用し、また垂直方向に極めて細く(例えば1
ドット)、且つ比較的短い(例えば6ドット、15ドッ
ト、30ドット)線分抽出マスクを使用し、黒画素数の
多い領域を統合して白黒反転領域を識別するものであ
り、一つのセル内の一部に白黒反転領域が存在する場合
でも正確にその領域を識別することができる(前記課題
(イ)の解決)。また、白黒反転領域内に大きいサイズ
の反転文字が存在する場合でも、上記のように本例で使
用する線分抽出マスクは極めて細く比較的短い線分抽出
マスクを使用するので白黒反転領域を正確に識別するこ
とができる(前記課題(ロ)の解決)。さらに、表画像
が傾いて読み出された場合でも、狭い範囲の黒画素数を
認識しつつ統合処理により白黒反転領域を識別するの
で、傾いた線分として認識でき、傾斜のある状態の白黒
反転領域として認識できる(前記課題(ハ)の解決)。As described above, the invention according to claim 1 uses the line segment extraction mask which is extremely thin in the horizontal direction (for example, 1 dot) and is relatively short (for example, 6 dots, 15 dots, 30 dots), and Very thin in the vertical direction (eg 1
(Dot) and a relatively short line segment extraction mask (for example, 6 dots, 15 dots, 30 dots) is used to identify the black and white reversal area by integrating the areas with a large number of black pixels. Even if a black-and-white reversal area exists in a part of the area, the area can be accurately identified (solution to the above-mentioned problem (a)). Even if a large-sized inverted character exists in the black-and-white inversion area, the line segment extraction mask used in this example uses an extremely thin and relatively short line segment extraction mask as described above, so Can be identified (solution of the above problem (b)). Further, even if the front image is read with an inclination, the black-and-white inversion area is identified by the integration process while recognizing the number of black pixels in a narrow range, so that it can be recognized as an inclined line segment, and the black-and-white inversion in an inclined state can be recognized. It can be recognized as an area (solution of the above-mentioned problem (C)).
【0013】請求項2記載の発明は上記課題を解決する
ため、表形式の2値イメージデータに対し、水平方向に
長い線分抽出マスクを用いて水平方向に走査し、垂直方
向に長い線分抽出マスクを用いて垂直方向に走査し、黒
画素密度が所定の閾値より高い領域をそれぞれ抽出する
領域抽出手段と、該領域抽出手段で抽出した前記黒画素
密度の高い領域をそれぞれのマスク走査方向に直交する
方向で統合する第1の統合手段と、該第1の統合手段で
統合した領域の線幅が所定の閾値以上であれば白黒反転
候補領域であるとし、該白黒反転候補領域をそれぞれの
マスク走査方向に統合する第2の統合手段と、該第2の
統合手段で統合した水平方向の白黒反転候補領域と垂直
方向の白黒反転候補領域の重なり状態により白黒反転領
域を設定する白黒反転領域設定手段とを備えた白黒反転
領域識別装置を提供することによって達成できる。In order to solve the above-mentioned problems, the invention according to claim 2 scans the binary image data in the table format in the horizontal direction using a line segment extraction mask which is long in the horizontal direction and long line segments in the vertical direction. A region extracting unit that vertically scans by using the extraction mask and extracts regions in which the black pixel density is higher than a predetermined threshold, and the regions with high black pixel density extracted by the region extracting unit in respective mask scanning directions. If the line width of the area integrated by the first integration means and the area integrated by the first integration means is greater than or equal to a predetermined threshold value, it is determined as a black and white inversion candidate area, and each of the black and white inversion candidate areas is Second unifying means for unifying in the mask scanning direction, and a black and white reversing area is set according to the overlapping state of the horizontally reversing black and white reversing candidate area and the vertical black and white reversing candidate area integrated by the second unifying means. It can be achieved by providing a rolling tone reversal region identification apparatus provided with an area setting means.
【0014】すなわち、本例は上記請求項1記載の発明
が白黒反転候補領域の輪郭に対し線分セグメント列を作
成し、当該線分セグメント列で囲まれた領域を白黒反転
領域であると識別したのに対し、本例の発明は水平方向
の白黒反転候補領域と垂直方向の白黒反転候補領域の重
なり状態により白黒反転領域を識別する構成である。That is, in this embodiment, the invention according to claim 1 creates a line segment segment sequence for the contour of the black / white inversion candidate region and identifies the region surrounded by the line segment segment sequence as the black / white inversion region. On the other hand, the invention of the present embodiment has a configuration in which the black-and-white inversion area is identified by the overlapping state of the horizontal black-and-white inversion candidate area and the vertical direction black-and-white inversion candidate area.
【0015】すなわち、本例も水平方向に長いm×nの
線分抽出マスクを使用し、水平方向に順次一定ドット毎
に走査し、当該線分抽出マスクで切り取られる矩形領域
内に所定の閾値以上の黒画素が含まれている時、当該矩
形領域を上記水平方向に直交する方向に統合し、該統合
結果、所定の閾値以上の線幅であれば白黒反転候補領域
とし、また垂直方向に対しても同様の処理を行い、垂直
方向に長い線分抽出マスクを使用し、垂直方向に順次一
定ドット毎に走査し、当該線分抽出マスクで切り取られ
る矩形領域内に所定の閾値以上の黒画素が含まれている
時、当該矩形領域を上記垂直方向に直交する方向に統合
し、該統合結果、所定の閾値以上の線幅であれば白黒反
転候補領域とする。That is, also in this example, a line segment extraction mask of m × n which is long in the horizontal direction is used, and scanning is sequentially performed in the horizontal direction for every fixed dot, and a predetermined threshold value is set in a rectangular region cut by the line segment extraction mask. When the above black pixels are included, the rectangular areas are integrated in the direction orthogonal to the horizontal direction, and if the result of the integration is that the line width is equal to or greater than a predetermined threshold value, the black and white inversion candidate area is set, and the vertical direction is set. The same process is performed on the other hand, a line segment extraction mask that is long in the vertical direction is used, and scanning is performed in the vertical direction sequentially for every fixed dot, and a black value equal to or larger than a predetermined threshold value is drawn in the rectangular area cut by the line segment extraction mask. When pixels are included, the rectangular areas are integrated in the direction orthogonal to the vertical direction, and if the result of the integration is that the line width is equal to or greater than a predetermined threshold value, the black and white inversion candidate area is selected.
【0016】そして、上記水平方向及び垂直方向に作成
した白黒反転候補領域に対し、その重なり状態を判断
し、白黒反転領域の識別を行う。例えば、この重なりの
状態は水平、垂直両方向の白黒反転領域が重なり合う領
域面積を、一方(水平方向又は垂直方向の何れか一方)
方向の白黒反転領域の面積で割り算した値が所定の閾値
以上である場合、当該水平、垂直両方向の白黒反転領域
で囲まれた領域を白黒反転領域とする。このように構成
することにより、白黒反転領域を正確に識別でき、前記
課題(イ)〜(ハ)を解決することができる。Then, with respect to the black-and-white inversion candidate areas created in the horizontal direction and the vertical direction, the overlapping state is judged, and the black-and-white inversion area is identified. For example, in this overlapping state, one area (either the horizontal direction or the vertical direction) is defined as the area area where the black and white inverted areas in both the horizontal and vertical directions overlap.
When the value divided by the area of the black-and-white inversion area in the direction is equal to or larger than the predetermined threshold value, the area surrounded by the black-and-white inversion areas in both the horizontal and vertical directions is set as the black-and-white inversion area. With this configuration, the black-and-white reversal area can be accurately identified, and the problems (a) to (c) can be solved.
【0017】尚、白黒反転領域の識別は上記例に限ら
ず、水平方向と垂直方向の白黒反転候補領域の重なり合
う和を求め、当該和が所定値以上である時水平、垂直両
方向の白黒反転候補領域で囲まれた領域を白黒反転領域
とするようにしてもよく、その他各種方式が考えられ
る。The identification of the black and white reversal area is not limited to the above example, and the overlapping sum of the black and white reversal candidate areas in the horizontal direction and the vertical direction is obtained, and when the sum is a predetermined value or more, the black and white reversal candidates in both the horizontal and vertical directions. The area surrounded by the areas may be the black-and-white inverted area, and various other methods are possible.
【0018】請求項3の記載は、請求項1又は2記載の
発明を具体的にするものであり、例えば前記第1の統合
手段で統合した領域の線幅が所定の閾値以下であると判
断するとき、前記第1の統合手段で統合した領域を罫線
であると判断する罫線判断手段を有する構成である。The third aspect of the present invention is to embody the invention of the first or second aspect. For example, it is determined that the line width of the area integrated by the first integrating means is equal to or less than a predetermined threshold value. In doing so, it has a ruled line judging means for judging the area integrated by the first integrating means as a ruled line.
【0019】すなわち、罫線は比較的細い線幅であり、
上記第1の統合手段で統合した領域の線幅を所定の閾値
以上であると判断した時は上記のように白黒反転候補領
域と考えるが、所定の閾値以下であると判断する時には
当該領域を罫線であると判断する。That is, the ruled line has a relatively thin line width,
When it is determined that the line width of the area integrated by the first integrating means is equal to or larger than a predetermined threshold value, it is considered as the black-and-white reversal candidate area as described above, but when it is determined that the line width is equal to or smaller than the predetermined threshold value, the area is determined to be the same. Judge as a ruled line.
【0020】このように構成することにより、本例によ
れば白黒反転領域の識別と同時に、罫線の抽出も行うこ
とができ、極めて効率の良い白黒反転領域識別装置とす
ることができる。With this configuration, according to the present example, the black-and-white inversion area can be identified and the ruled line can be extracted at the same time, so that the black-and-white inversion area identifying apparatus can be made extremely efficient.
【0021】請求項4の記載は、請求項3の記載を更に
具体的にするものであり、例えば前記罫線判断手段で判
断した罫線をそれぞれのマスク走査方向に統合して罫線
を作成する罫線作成手段を有する構成である。The description of claim 4 further makes the description of claim 3 more concrete. For example, ruled line creation for creating ruled lines by integrating the ruled lines determined by the ruled line determination means in the respective mask scanning directions. It is a configuration having means.
【0022】このように構成することにより、帳票等の
表形式の画像データを認識処理する際、白黒反転領域
(白黒反転セル)の識別と共に罫線を認識でき、白黒反
転領域の識別処理が終了する時、同時に例えば帳票フォ
ームの罫線作成も終了することになり、極めて効率の良
い白黒反転領域識別装置とすることができる。With this configuration, when recognizing the tabular image data such as a form, the ruled lines can be recognized together with the black-and-white inversion area (black-and-white inversion cell), and the black-and-white inversion area identification processing ends. At the same time, the ruled lines of the form form are also completed at the same time, which makes it possible to provide an extremely efficient black and white reversal area identification device.
【0023】請求項5の記載は、上記請求項4の記載を
更に具体的にするものであり、前記罫線作成手段が垂直
方向の罫線を作成する場合、例えば前記線分セグメント
列作成手段で作成した水平方向の線分セグメント列と、
前記垂直方向の罫線間で囲まれた領域を白黒反転領域と
する構成である。According to a fifth aspect of the present invention, which is more specific than that of the fourth aspect, when the ruled line creating means creates vertical ruled lines, for example, the line segment segment string creating means creates the line segments. Horizontal line segment row,
The area surrounded by the ruled lines in the vertical direction is a black and white reversal area.
【0024】上記線分セグメント列は水平方向の白黒反
転候補領域の輪郭であり、例えば水平方向に長い白黒反
転候補領域と垂直方向の罫線で囲まれた領域を白黒反転
領域とする構成である。このように本例は、線分セグメ
ント列(白黒反転候補領域)と罫線で囲まれた領域を白
黒反転領域と識別するものである。The line segment sequence is the outline of the black-and-white inversion candidate area in the horizontal direction. For example, the area surrounded by the horizontally-inverted black-and-white inversion candidate area and the vertical ruled line is the black-and-white inversion area. As described above, in this example, the area surrounded by the line segment segment sequence (black and white inversion candidate area) and the ruled line is identified as the black and white inversion area.
【0025】また、請求項6の記載は、上記請求項4記
載の発明を具体的にするものであり、前記罫線設定手段
が水平方向の罫線を設定する場合、例えば前記線分セグ
メント列作成手段で作成した垂直方向の線分セグメント
列と、前記水平方向の罫線間で囲まれた領域を白黒反転
領域とする構成である。[0025] Further, the sixth aspect of the invention is a concrete example of the invention of the fourth aspect, and when the ruled line setting means sets a ruled line in the horizontal direction, for example, the line segment segment sequence creating means. The black and white inversion area is the area surrounded by the line segment segments in the vertical direction created in 1 above and the ruled lines in the horizontal direction.
【0026】本例の記載は、上記請求項5の記載とは逆
に、線分セグメント列は垂直方向の白黒反転候補領域の
輪郭であり、この線分セグメント列と水平方向の罫線で
囲まれた領域を白黒反転領域と識別するものである。Contrary to the above-mentioned claim 5, the description of the present example is such that the line segment segment sequence is the outline of the black-and-white inversion candidate region in the vertical direction, and is surrounded by this line segment segment sequence and the horizontal ruled line. The area that is marked is identified as the black-and-white reversal area.
【0027】請求項7の記載は、上記請求項1又は5又
は6の記載を具体的にするものであり、前記白黒反転領
域の輪郭の凹凸を吸収するマージンが、前記線分セグメ
ント列に付加されている構成である。The description of claim 7 is specific to the description of claim 1, 5 or 6, and a margin for absorbing the irregularities of the contour of the black-and-white reversal region is added to the line segment segment row. It is a configured structure.
【0028】すなわち、本例は上記線分抽出マスクを用
いて線分抽出処理を行うと、個々に抽出された領域は、
例えば上下方向又は左右方向に凹凸を有し、本例はこの
凹凸を例えば白黒反転領域の外側方向(線分の法線ベク
トルの外側方向)に所定数のドットを追加し、白黒反転
領域の輪郭の凹凸を吸収する構成である。That is, in this example, when line segment extraction processing is performed using the above line segment extraction mask, the individually extracted regions are
For example, it has an unevenness in the up-down direction or the left-right direction. In this example, a predetermined number of dots are added to the unevenness in the outer direction of the black-and-white inversion area (outer direction of the normal vector of the line segment) to obtain the outline of the black-and-white inversion area. This is a structure that absorbs the unevenness of.
【0029】請求項8の記載は、上記請求項1又は2記
載の発明を具体的にするものであり、前記白黒反転領域
設定手段は、例えば連結成分数が所定の閾値以下である
場合、水平方向の線分セグメント列と垂直方向の線分セ
グメント列で囲まれた領域を白黒反転領域に決定する構
成である。The eighth aspect of the present invention embodies the invention of the first or second aspect. The black-and-white reversal area setting means sets horizontal when the number of connected components is equal to or less than a predetermined threshold value. In this configuration, the area surrounded by the line segment segment row in the vertical direction and the line segment segment row in the vertical direction is determined as the black and white reversal area.
【0030】したがって、本例の場合請求項1記載の発
明により白黒反転領域が識別されても、当該白黒反転領
域内の連結成分数が所定の閾値以下でなければ白黒反転
領域と決定しない構成である。ここで、連結成分数は白
黒反転候補領域の領域内に黒印字部又は白印字部の接続
した部分がいくつあるかを示すものであり、例えば白黒
反転候補領域内に網点等の多数の黒ドットが含まれてい
る場合、上記連結成分数を限定することにより網点等の
影響をなくすものである。Therefore, in the case of the present embodiment, even if the black-and-white inversion area is identified by the invention according to claim 1, the black-and-white inversion area is not determined unless the number of connected components in the black-and-white inversion area is less than a predetermined threshold value. is there. Here, the number of connected components indicates how many black print portions or white print portions are connected in the black-and-white inversion candidate area. For example, a large number of black dots such as halftone dots in the black-and-white inversion candidate area. When dots are included, the influence of halftone dots and the like is eliminated by limiting the number of connected components.
【0031】請求項9の記載は、上記請求項8の記載を
より具体的にするものであり、前記連結成分数を算出す
る例えば算出手段と、該算出手段で算出した連結成分数
が所定の閾値以下であることを識別する識別手段とを有
する構成である。The description of claim 9 makes the description of claim 8 more concrete, and, for example, the calculating means for calculating the number of connected components and the number of connected components calculated by the calculating means are predetermined. And a discriminating means for discriminating that it is equal to or less than the threshold value.
【0032】ここで、上記算出手段による連結成分数の
算出は、例えば白黒反転領域内の独立する黒印字部を算
出する演算であり、また例えば網点等を有する場合、当
該黒ドット数を演算する構成である。一方、識別手段は
上記算出手段が算出した連結成分数が予め設定された閾
値以下であるか識別する手段であり、例えば網点等の模
様が白黒反転領域に付加されている場合、この識別手段
によって識別され、このような模様が付加されたセルと
白黒反転セルとを確実に識別するものである。Here, the calculation of the number of connected components by the calculation means is, for example, a calculation for calculating an independent black print portion in the black-and-white reversal region, and, for example, when a halftone dot or the like is provided, the number of black dots is calculated. This is the configuration. On the other hand, the identifying means is means for identifying whether the number of connected components calculated by the calculating means is less than or equal to a preset threshold value. For example, when a pattern such as a halftone dot is added to the black-and-white inversion area, the identifying means The cell to which the pattern is added and the black-and-white inverted cell are surely identified.
【0033】請求項10の記載は、上記請求項4記載の
発明をより具体的にするものであり、前記領域抽出手段
は孤立した罫線候補を抽出し、該孤立した罫線候補の周
辺に前記白黒反転候補領域が存在する時、前記孤立した
罫線候補も白黒反転候補領域に統合する孤立罫線統合手
段を有する構成である。According to a tenth aspect of the present invention, the invention according to the fourth aspect is more concretely described, in which the area extracting means extracts an isolated ruled line candidate, and the black-and-white is provided around the isolated ruled line candidate. When there is a reversal candidate area, the isolated ruled line candidate also has an isolated ruled line unifying means for unifying it with the black and white reversal candidate area.
【0034】すなわち、黒画素密度の高い領域をマスク
走査方向に直交する方向で統合した結果、その領域の線
幅が所定の閾値以上であれば白黒反転候補領域として抽
出する。しかし、当該罫線候補の周辺に前記白黒反転候
補領域が存在する時、本来白黒反転候補領域であるが、
例えば“かすれ”等により孤立した罫線候補として誤っ
て抽出される場合もある。したがって、このような場合
を救済するため、孤立罫線統合手段によって白黒反転候
補領域に統合する。That is, as a result of integrating the areas having a high black pixel density in the direction orthogonal to the mask scanning direction, if the line width of the areas is equal to or larger than a predetermined threshold value, it is extracted as a white / black inversion candidate area. However, when the black and white inversion candidate area exists around the ruled line candidate, it is originally a black and white inversion candidate area.
For example, it may be erroneously extracted as an isolated ruled line candidate due to "blurring" or the like. Therefore, in order to relieve such a case, the isolated ruled line integrating means integrates the black and white inversion candidate area.
【0035】このように構成することにより、白黒反転
領域内に“かすれ”等の薄い黒印字があったとしても確
実にこれを検出し、補正処理して白黒反転領域として識
別することができる。With this configuration, even if there is thin black print such as "blurring" in the black-and-white reversal area, it can be surely detected, corrected and identified as the black-and-white reversal area.
【0036】請求項11の記載は、上記請求項10の記
載をより具体的にするものであり、前記孤立した罫線候
補の抽出は、文字領域と罫線領域を区別する手段を備
え、罫線抽出処理後に白黒反転領域を抽出する構成であ
る。The description of claim 11 is more specific than that of claim 10, wherein the extraction of the isolated ruled line candidates is provided with a means for distinguishing between the character area and the ruled line area, and the ruled line extraction processing is performed. The configuration is such that the black-and-white inversion area is extracted later.
【0037】すなわち、罫線抽出により抽出される罫線
には、本来の罫線以外に文字列等が誤って罫線と認識さ
れる場合があり、かかる場合文字領域と罫線領域を区別
することにより、確実に罫線を抽出するものである。That is, in the ruled lines extracted by the ruled line extraction, a character string or the like may be erroneously recognized as a ruled line in addition to the original ruled line. In such a case, the character area and the ruled line area are distinguished from each other to ensure the ruled line. The ruled lines are extracted.
【0038】請求項12の記載は、上記請求項1記載の
発明をより具体的にするものであり、前記線分セグメン
ト列には、該線分セグメント列が白黒反転領域であるこ
とを示す属性が付加されている構成である。The twelfth aspect of the invention is a more specific version of the invention of the first aspect, wherein the line segment segment string has an attribute indicating that the line segment segment string is a black / white inverted area. Is added.
【0039】上記線分セグメント列への属性の付加は、
例えば線分セグメント列を記憶するメモリに専用のフラ
グを立て、白黒反転領域を示すセグメント列であること
を記憶させることで実現する。The addition of an attribute to the line segment segment sequence is as follows.
For example, it is realized by setting a dedicated flag in the memory for storing the line segment segment sequence and storing the segment sequence indicating the black / white inversion area.
【0040】請求項13の記載は、上記請求項12の記
載をより具体的にするものであり、前記線分セグメント
列には、白黒反転領域に対する前記線分セグメント列の
位置が、上下又は左右の辺の位置情報として付加されて
いる構成である。According to a thirteenth aspect of the present invention, the statement of the twelfth aspect of the present invention is made more concrete. In the line segment segment row, the position of the line segment segment row with respect to the black-and-white inversion region is vertical or horizontal. It is a configuration added as position information of the side of.
【0041】例えば、水平方向に2本の線分セグメント
列の場合、線分セグメント列には白黒反転領域に対する
位置によって、上又は下の位置情報が付加される。ま
た、垂直方向に2本の線分セグメント列の場合、白黒反
転領域に対する位置によって、右又は左の位置情報が付
加される。For example, in the case of two line segment segment rows in the horizontal direction, the position information above or below is added to the line segment segment row depending on the position with respect to the black and white reversal area. Also, in the case of two line segment segments in the vertical direction, right or left position information is added depending on the position with respect to the black and white reversal area.
【0042】このように構成することにより、作成され
た線分セグメント列の白黒反転領域に対する位置が明確
になり、例えば白黒反転領域と通常のセル領域を区別す
る際、容易に行うことができる。With this configuration, the position of the created line segment segment sequence with respect to the black-and-white inversion area becomes clear, and it can be easily performed, for example, when distinguishing the black-and-white inversion area from the normal cell area.
【0043】請求項14の記載は、上記請求項13の記
載をより具体的にするものであり、表のセル構造を解析
する際、該セルの位置情報が、前記線分セグメント列に
付加された上下又は左右の辺の位置情報と同じ場合には
白黒反転領域と判断し、異なる場合には通常のセル領域
と判断する構成である。The statement of claim 14 makes the statement of claim 13 more concrete. When analyzing the cell structure of the table, the position information of the cell is added to the line segment sequence. If it is the same as the position information of the upper and lower sides or the left and right sides, it is determined to be a black and white reversal area, and if it is different, it is determined to be a normal cell area.
【0044】本例は上記請求項13の具体的適応例であ
り、上記構成により白黒反転領域と通常のセル領域の区
別を簡単に行うことができる。尚、線分セグメント列に
付加された上下、左右の位置情報は、上記以外に、例え
ば表に含まれる白黒反転領域の数や白黒反転領域のサイ
ズの算出等にも使用できる。This example is a specific application example of the thirteenth aspect, and with the above configuration, it is possible to easily distinguish between the black / white inversion area and the normal cell area. In addition to the above, the vertical and horizontal position information added to the line segment sequence can be used, for example, for calculating the number of black and white reversal areas included in the table, the size of the black and white reversal areas, and the like.
【0045】請求項15の記載は、上記請求項1又は2
記載の発明をより具体的にするものであり、前記白黒反
転領域内が複数のセル領域より成る場合、前記白黒反転
領域に接続する罫線を延長して白黒反転領域内の前記セ
ル領域を抽出する構成である。The description of claim 15 relates to claim 1 or 2 above.
When the black-and-white inversion area is composed of a plurality of cell areas, the ruled line connecting to the black-and-white inversion area is extended to extract the cell area in the black-and-white inversion area. It is a composition.
【0046】例えば、白黒反転領域が水平方向に形成さ
れている場合、垂直方向の罫線を上記白黒反転領域内に
延長し、白黒反転領域を例えば短冊状に分割して垂直方
向の罫線によって仕切られた領域をセル領域とするもの
である。For example, when the black-and-white inversion area is formed in the horizontal direction, the ruled line in the vertical direction is extended into the black-and-white inversion area, and the black-and-white inversion area is divided into, for example, strips and separated by the vertical ruled line. The cell area is defined as the cell area.
【0047】このように構成することにより、容易に白
黒反転領域をセル分割することができる。請求項16の
記載は、上記請求項15の記載をより具体的にするもの
であり、前記白黒反転領域内のセルを分割する際、白黒
反転領域に接続する罫線を延長した領域を細分割して黒
画素密度を求める手段を有する構成である。With this structure, the black and white reversal area can be easily divided into cells. The description of claim 16 makes the description of claim 15 more specific, and when dividing the cells in the black-and-white inversion area, the area in which the ruled line connected to the black-and-white inversion area is extended is subdivided. This is a configuration having means for obtaining the black pixel density.
【0048】すなわち、上記請求項15の記載により白
黒反転領域内をセル分割する場合、例えば垂直方向の罫
線を上記白黒反転領域内に延長し、白黒反転領域を短冊
状に分割する際、罫線を延長した白黒反転領域の位置に
白黒反転文字が存在する場合、この位置を罫線で仕切る
ことができないので、白黒反転文字の存在を確認するた
めに行う処理である。That is, when dividing the black-and-white inversion area into cells according to the above-mentioned claim 15, for example, when extending the vertical ruled lines into the black-and-white inversion area and dividing the black-and-white inversion area into strips, the ruled lines are If a black-and-white inverted character exists at the position of the extended black-and-white inverted area, this position cannot be separated by a ruled line, so this is a process performed to confirm the existence of the black-and-white inverted character.
【0049】したがって、例えば垂直方向に長い線分抽
出マスクを使用し、対象となる白黒反転領域内を線分抽
出マスクで黒画素数の抽出処理を行い、黒画素数が少な
い場合、すなわち白画素数が多い場合、当該位置には白
黒反転文字(白抜き文字)が存在し、セル分割できない
位置であることが分かる。Therefore, for example, a line segment extraction mask that is long in the vertical direction is used, and the black pixel number is extracted in the target black-and-white inversion region by the line segment extraction mask. When the number is large, it can be seen that a black-and-white inverted character (white character) exists at the position and the position cannot be divided into cells.
【0050】このように構成することにより、白黒反転
領域内を正確にセル分割することができる。請求項17
記載の発明は上記課題を解決するため、表形式の2値イ
メージデータに対し、水平方向に長い線分抽出マスクを
用いて水平方向に走査し、垂直方向に長い線分抽出マス
クを用いて垂直方向に走査し、黒画素密度が所定の閾値
より高い領域をそれぞれ抽出する領域抽出手段と、該領
域抽出手段で抽出した前記黒画素密度の高い領域をそれ
ぞれのマスク走査方向に直交する方向で統合する第1の
統合手段と、該第1の統合手段で統合した領域の線幅が
所定の閾値以上であれば白黒反転候補領域であるとし、
該白黒反転候補領域をそれぞれのマスク走査方向に統合
する第2の統合手段と、該第2の統合手段で統合した白
黒反転候補領域の輪郭に対し、水平方向及び垂直方向の
線分セグメント列を作成する線分セグメント列作成手段
と、該線分セグメント列作成手段で作成した水平方向の
線分セグメント列と垂直方向の線分セグメント列で囲ま
れた領域を白黒反転領域に設定する第2の設定手段とを
備えた白黒反転領域識別部と、該白黒反転領域認識部に
より識別された白黒反転領域に対し、白黒反転処理を行
う白黒反転処理手段と、該白黒反転処理手段によって反
転処理された領域に位置する文字列に対して認識処理を
施す認識手段とを有する表認識装置を提供することによ
り達成できる。With this configuration, the black and white inversion area can be accurately divided into cells. Claim 17
In order to solve the above-mentioned problems, the described invention scans binary image data in a table format in the horizontal direction using a line segment extraction mask long in the horizontal direction, and vertically scans it using a line segment extraction mask long in the vertical direction. Area extraction means that scans each direction and extracts each area having a black pixel density higher than a predetermined threshold value, and the area having a high black pixel density extracted by the area extraction means is integrated in a direction orthogonal to each mask scanning direction. If the line widths of the first integrating means and the area integrated by the first integrating means are equal to or larger than a predetermined threshold value, it is determined that the area is a black / white inversion candidate area.
Second integration means for integrating the black-and-white inversion candidate areas in the respective mask scanning directions, and line segment segments in the horizontal and vertical directions with respect to the outline of the black-and-white inversion candidate areas integrated by the second integration means. A line segment segment string creating means to be created, and a region surrounded by the line segment segment string in the horizontal direction and the line segment segment string in the vertical direction created by the line segment segment string creating means is set as a black and white reversal area. A black and white reversal area identifying section including setting means, a black and white reversal processing section for performing a black and white reversal process on the black and white reversal area identified by the black and white reversal area recognizing section, and a reversal process by the black and white reversal processing section. This can be achieved by providing a table recognition device having a recognition means for performing recognition processing on a character string located in a region.
【0051】本発明は、前記請求項1記載の白黒反転領
域識別装置を使用した表認識装置である。すなわち、水
平方向に長い線分抽出マスクと垂直方向に長い線分抽出
マスクを使用し、黒画素密度が所定の閾値より高い領域
をそれぞれ抽出し、この黒画素密度の高い領域に対し、
マスク走査方向に直交する方向で統合し、更にマスク走
査方向に統合し、例えば白黒反転候補領域の輪郭に対の
線分セグメント列を形成し、その線分セグメント列に囲
まれた領域を白黒反転領域に設定した、当該領域に対
し、白黒反転処理手段によって白黒反転処理を施すもの
であり、更に白黒反転処理手段によって反転処理された
領域に位置する文字列に対して認識処理を行う認識手段
とを有する表認識装置である。The present invention is a table recognition device using the black-and-white reversal area identification device according to claim 1. That is, using a line segment extraction mask that is long in the horizontal direction and a line segment extraction mask that is long in the vertical direction, respectively extract regions where the black pixel density is higher than a predetermined threshold value, and for the region where the black pixel density is high,
Integration in the direction orthogonal to the mask scanning direction, and further integration in the mask scanning direction, for example, forming a pair of line segment segments in the outline of the black / white inversion candidate area, and black / white inversion of the area surrounded by the line segment segments A black-white reversal processing unit performs black-and-white reversal processing on the area set in the area, and a recognition unit that further performs recognition processing on a character string located in the reversal-processed area by the black-and-white reversal processing unit. It is a table recognition device having.
【0052】このように構成することにより、正確に識
別された白黒反転領域に対し白黒反転処理を行い、白黒
反転領域内の文字列に対し文字認識処理を施す表認識装
置を提供できる。この場合、白黒反転処理が施された文
字列は正確に黒印字されるので確実な表認識処理を行う
ことができる。With this configuration, it is possible to provide a table recognition device that performs black-and-white inversion processing on a correctly identified black-and-white inversion area and performs character recognition processing on a character string in the black-and-white inversion area. In this case, the character string subjected to the black-and-white reversal processing is accurately printed in black, so that reliable table recognition processing can be performed.
【0053】請求項18記載の発明は上記課題を解決す
るため、表形式の2値イメージデータに対し、水平方向
に長い線分抽出マスクを用いて水平方向に走査し、垂直
方向に長い線分抽出マスクを用いて垂直方向に走査し、
黒画素密度が所定の閾値より高い領域をそれぞれ抽出す
る領域抽出手段と、該領域抽出手段で抽出した前記黒画
素密度の高い領域をそれぞれのマスク走査方向に直交す
る方向で統合する第1の統合手段と、該第1の統合手段
で統合した領域の線幅が所定の閾値以上であれば白黒反
転候補領域であるとし、該白黒反転候補領域をそれぞれ
のマスク走査方向に統合する第2の統合手段と、該第2
の統合手段で統合した水平方向の白黒反転候補領域と垂
直方向の白黒反転候補領域の重なり状態により白黒反転
領域を設定する白黒反転領域設定手段とを備えた白黒反
転領域識別部と、該白黒反転領域認識部により識別され
た白黒反転領域に対し、白黒反転処理を行う白黒反転処
理手段と、該白黒反転処理手段によって反転処理された
領域に位置する文字列に対して認識処理を施す認識手段
とを有する表認識装置を提供することにより達成でき
る。In order to solve the above-mentioned problems, the eighteenth aspect of the present invention scans the binary image data in the table format in the horizontal direction using a line segment extraction mask that is long in the horizontal direction to obtain long line segments in the vertical direction. Scan vertically using the extraction mask,
Area extracting means for extracting areas each having a black pixel density higher than a predetermined threshold, and first integration for integrating the areas having a high black pixel density extracted by the area extracting means in a direction orthogonal to each mask scanning direction. Means, and if the line width of the area integrated by the first integrating means is equal to or larger than a predetermined threshold value, it is determined to be a black / white inversion candidate area, and the black / white inversion candidate area is integrated in each mask scanning direction. Means and the second
And a black-and-white inversion area identifying unit having a black-and-white inversion area setting means for setting the black-and-white inversion area according to the overlapping state of the horizontal black-and-white inversion candidate area integrated by the integration means of A black-and-white inversion processing means for performing a black-and-white inversion processing on the black-and-white inversion area identified by the area recognition section; and a recognition means for performing a recognition processing on a character string located in the area inverted by the black-and-white inversion processing means. This can be achieved by providing a table recognition device having
【0054】本発明は、前記請求項2記載の白黒反転領
域識別装置を使用した表認識装置であり、上記請求項1
7記載の表認識装置に対し、第2の統合手段で統合した
水平方向の白黒反転候補領域と垂直方向の白黒反転候補
領域の重なり状態により白黒反転領域を設定する白黒反
転領域識別装置を使用する表認識装置である。The present invention is a table recognition device using the black-and-white reversal area identification device according to claim 2, wherein
In contrast to the table recognition device described in No. 7, a black-and-white inversion area identification device is used which sets a black-and-white inversion area according to the overlapping state of the horizontal black-and-white inversion candidate area integrated by the second integrating means and the vertical black-and-white inversion candidate area. It is a table recognition device.
【0055】このように構成することにより、正確に識
別された白黒反転領域に対し白黒反転処理を行い、白黒
反転領域内の文字列に対し文字認識処理を施す表認識装
置を提供できる。この場合、白黒反転処理が施された文
字列は正確に黒印字されるので確実な認識処理を行うこ
とができる。With this configuration, it is possible to provide a table recognition device that performs black-and-white inversion processing on a correctly identified black-and-white inversion area and performs character recognition processing on a character string in the black-and-white inversion area. In this case, the character string subjected to the black-and-white reversal processing is accurately printed in black, so that reliable recognition processing can be performed.
【0056】請求項19の記載は、上記請求項17記載
の発明を具体的にするものであり、前記白黒反転処理手
段は、前記白黒反転領域の輪郭セグメントを塗りつぶす
塗りつぶし手段と、前記輪郭セグメント列以外の白黒反
転領域を白黒反転する処理手段を具備する構成である。A nineteenth aspect of the invention embodies the invention of the seventeenth aspect of the invention, wherein the black and white reversal processing means fills out the contour segments of the black and white reversal area, and the contour segment string. It is configured to include processing means for inverting the black and white inversion areas other than the above.
【0057】すなわち、本例は塗りつぶし手段によって
白黒反転領域の輪郭部分を、例えば黒色で塗りつぶして
枠取りし、その中の白黒反転領域を処理手段によって反
転処理する構成である。That is, in this example, the outline portion of the black-and-white reversal area is filled with, for example, black to frame the outline portion of the black-and-white inversion area, and the black-and-white inversion area therein is inverted by the processing means.
【0058】請求項20の記載は、上記請求項19の記
載を具体的にするものであり、前記白黒反転処理手段
は、セルによって分割された領域を塗りつぶすセル領域
塗りつぶし手段を有する構成である。A twentieth aspect of the present invention is a concrete description of the nineteenth aspect of the present invention, wherein the black and white reversal processing means has a cell area filling means for filling an area divided by cells.
【0059】この場合も、上記白黒反転領内のセル分割
される分割線を、例えば黒色で塗りつぶし、白黒反転領
域を反転処理した際にセル分割線が分かるようにする構
成である。Also in this case, the dividing line for dividing the cells in the black-and-white inversion area is filled with, for example, black so that the cell dividing line can be seen when the black-and-white inversion area is inverted.
【0060】請求項21の記載は、上記請求項17又は
18記載の発明を具体的にするものであり、前記白黒反
転処理手段によって反転処理された白黒反転領域に位置
する文字列の線幅を算出し、該算出した線幅に従って前
記文字列を膨張又は収縮処理し、前記文字列を整形する
構成である。The twenty-first aspect of the present invention is a concrete example of the invention of the seventeenth or eighteenth aspect of the present invention, in which the line width of the character string located in the black-and-white inversion area inverted by the black-and-white inversion processing means is determined. The character string is calculated, and the character string is expanded or contracted according to the calculated line width to shape the character string.
【0061】このように構成することにより、白黒反転
処理により起こり得る文字列の線幅の異常を修正し、正
確な文字列に整形するものである。請求項22の記載
は、上記請求項17又は18記載の発明を具体的にする
ものであり、前記白黒反転領域設定手段は、連結成分数
が所定の閾値以下である場合、白黒反転領域の設定処理
を行う構成である。With this configuration, the abnormal line width of the character string that may occur due to the black-and-white reversal process is corrected and the character string is shaped into an accurate character string. A twenty-second aspect of the invention embodies the invention of the seventeenth or eighteenth aspect, wherein the black-and-white inversion area setting means sets the black-and-white inversion area when the number of connected components is less than or equal to a predetermined threshold value. It is a configuration for performing processing.
【0062】本例は上記請求項8の記載に対応する構成
であり、当該構成を表認識装置に適用するものである。
すなわち、白黒反転領域の設定に際し連結成分数を計算
し、該連結成分数が所定の閾値以内である時白黒反転領
の決定を行うことにより確実に白黒反転領域セルを識別
でき、白黒反転領域に対して正確に反転処理を施した状
態で文字認識等の認識処理を行える表認識装置を提供で
きる。This example has a configuration corresponding to the above-mentioned claim 8, and the configuration is applied to a table recognition device.
That is, when setting the black-and-white inversion area, the number of connected components is calculated, and when the number of connected components is within a predetermined threshold value, the black-and-white inversion area cell can be surely identified to determine the black-and-white inversion area cell. On the other hand, it is possible to provide a table recognition device capable of performing recognition processing such as character recognition in a state where the inversion processing is accurately performed.
【0063】請求項23の記載は、上記請求項17又は
18記載の発明を具体的にするものであり、前記領域抽
出手段は孤立した罫線候補を抽出し、該孤立した罫線候
補の周辺に前記白黒反転候補領域が存在する時、前記孤
立した罫線候補も白黒反転候補領域に統合する孤立罫線
統合手段を有する構成である。The twenty-third aspect of the present invention is a concrete example of the seventeenth or eighteenth aspect of the invention, in which the area extracting means extracts an isolated ruled line candidate and surrounds the isolated ruled line candidate with the isolated ruled line candidate. When there is a black-and-white reversal candidate area, the isolated ruled line candidate is also integrated with the black-and-white reversal candidate area.
【0064】本例は上記請求項10の記載に対応する構
成であり、当該構成を表認識装置に適用するものであ
る。すなわち、黒画素密度の高い領域をマスク走査方向
に直交する方向で統合した結果、その領域の線幅が所定
の閾値以下であれば罫線候補として抽出し、当該罫線候
補の周辺に前記白黒反転候補領域が存在する時、白黒反
転候補領域とする。このように構成することにより、例
えば“かすれ”により孤立した罫線候補と判断された場
合でも、孤立罫線統合手段によって白黒反転候補領域に
統合され、白黒反転領域の正確な領域に対して反転処理
を施した状態で文字認識等の認識処理を行える表認識装
置を提供できる。This example has a configuration corresponding to the above-mentioned claim 10, and the configuration is applied to a table recognition device. That is, as a result of integrating the regions with high black pixel density in the direction orthogonal to the mask scanning direction, if the line width of the regions is less than or equal to a predetermined threshold value, it is extracted as a ruled line candidate, and the black-and-white inversion candidate is extracted around the ruled line candidate. When an area exists, it is set as a black and white inversion candidate area. With this configuration, for example, even when it is determined as an isolated ruled line candidate due to “blurring”, the isolated ruled line integration unit integrates the ruled line candidate into the black and white inversion candidate area, and the inversion processing is performed on the accurate area of the black and white inversion area. It is possible to provide a table recognition device that can perform recognition processing such as character recognition in the applied state.
【0065】請求項24の記載は、上記請求項17記載
の発明を具体的にするものであり、前記線分セグメント
列には、例えば該線分セグメント列が白黒反転領域であ
ることを示す属性が付加されている構成である。The statement of claim 24 is a concrete example of the invention of claim 17, wherein the line segment segment string has, for example, an attribute indicating that the line segment segment string is a black / white inversion area. Is added.
【0066】本例は上記請求項12の記載に対応する構
成であり、当該構成を表認識装置に適用するものであ
る。すなわち、線分セグメント列は白黒反転領域に対応
するものであり、当該線分セグメント列に白黒反転領域
に対する位置の属性として、上下又は左右等の属性を付
加することにより、線分セグメント列の位置が明確とな
り、白黒反転セルと通常セルとの区別も簡単になり、表
認識処理を容易とする表認識装置が提供できる。This example has a configuration corresponding to the above-mentioned claim 12, and the configuration is applied to a table recognition device. That is, the line segment segment sequence corresponds to the black / white inversion region, and the position of the line segment segment sequence is added by adding an attribute such as up / down or left / right as a position attribute to the line / segment inversion region. Therefore, it is possible to provide a table recognizing device that facilitates the table recognizing process because the distinction between the black-and-white inverted cell and the normal cell is simplified.
【0067】請求項25の記載は、上記請求項17又は
18記載の発明を具体的にするものであり、前記白黒反
転領域内が、例えば複数のセル領域より成る場合、前記
白黒反転領域に接続する罫線を延長して白黒反転領域内
の前記セル領域を抽出する構成である。The twenty-fifth aspect of the present invention is a concrete example of the invention of the seventeenth or eighteenth aspect, and when the inside of the black-and-white inversion area is composed of, for example, a plurality of cell areas, it is connected to the black-and-white inversion area. The ruled line is extended to extract the cell area in the black-and-white inverted area.
【0068】本例は上記請求項15の記載に対応する構
成であり、当該構成を表認識装置に適用するものであ
る。すなわち、白黒反転領域内に複数のセル領域が存在
する場合、当該白黒反転領域に対しその延長線が短冊状
に接続する罫線を利用し、白黒反転領域を複数のセルに
分割する構成である。This example has a configuration corresponding to the above-mentioned claim 15, and the configuration is applied to a table recognition device. That is, when a plurality of cell areas are present in the black-and-white inversion area, the black-and-white inversion area is divided into a plurality of cells by using ruled lines whose extension lines connect to the black-and-white inversion area in a strip shape.
【0069】このように構成することにより、1つの白
黒反転領域内に複数のセル領域が存在する場合でも、確
実にセル領域を分割することができ、正確に分割された
セル領域に対して認識処理を行うことができる表認識装
置を提供する。With this configuration, even if there are a plurality of cell areas in one black-and-white inversion area, the cell area can be surely divided, and the correctly divided cell area can be recognized. A table recognition device capable of performing processing is provided.
【0070】請求項26の記載は、上記請求項25記載
の発明を具体的にするものであり、前記白黒反転領域内
のセルを分割する際、例えば白黒反転領域に接続する罫
線を延長した領域を細分割して黒画素密度を求める手段
を有する構成である。A twenty-sixth aspect is a concrete embodiment of the invention according to the twenty-fifth aspect, and when dividing cells in the black-and-white inversion area, for example, an area in which a ruled line connected to the black-and-white inversion area is extended. Is subdivided to obtain the black pixel density.
【0071】本例は白黒反転領域内をセル分割する際の
1つの方式を説明するものであり、この方式によれば白
黒反転領域内の文字列を誤ってセル分割することがない
表認識装置を提供できる。尚、白黒反転領域内をセル分
割する方式は上記例に限るものではない。This example describes one method for dividing cells in the black-and-white inversion area. According to this method, a table recognition device that prevents a character string in the black-and-white inversion area from being mistakenly cell-divided. Can be provided. The method of dividing the black and white inversion area into cells is not limited to the above example.
【0072】請求項27記載の発明は上記課題を解決す
るため、表形式の2値イメージデータに対し、水平方向
に長い線分抽出マスクを用いて水平方向に走査し、垂直
方向に長い線分抽出マスクを用いて垂直方向に走査し、
黒画素密度が所定の閾値より高い領域をそれぞれ抽出す
る機能と、該機能で抽出した前記黒画素密度の高い領域
をそれぞれのマスク走査方向に直交する方向で統合する
機能と、該機能で統合した領域の線幅が所定の閾値以上
であれば白黒反転候補領域であるとし、該白黒反転候補
領域をそれぞれのマスク走査方向に統合する機能と、該
機能で統合した白黒反転候補領域の輪郭に対し、水平方
向及び垂直方向の線分セグメント列を作成する機能と、
該機能で作成された水平方向の線分セグメント列と垂直
方向の線分セグメント列で囲まれた領域を白黒反転領域
に設定する機能とをコンピュータに実行させる命令を含
むプログラムを格納した前記コンピュータが読み取り可
能な記憶媒体を提供することにより達成できる。In order to solve the above-mentioned problem, the invention according to claim 27 scans the binary image data in the table format in the horizontal direction by using a line segment extraction mask long in the horizontal direction, and long line segments in the vertical direction. Scan vertically using the extraction mask,
A function of extracting each area having a black pixel density higher than a predetermined threshold value, a function of integrating the areas having a high black pixel density extracted in the function in a direction orthogonal to each mask scanning direction, and an integration of the function If the line width of the area is greater than or equal to a predetermined threshold value, it is determined to be a black-and-white inversion candidate area, and the function of integrating the black-and-white inversion candidate area in each mask scanning direction and the outline of the black-and-white inversion candidate area integrated by the function , The ability to create horizontal and vertical line segment segments,
The computer storing a program including instructions for causing the computer to execute a function of setting a region surrounded by a horizontal line segment segment sequence and a vertical line segment segment sequence created by the function as a black and white inversion region, This can be achieved by providing a readable storage medium.
【0073】本発明は上記処理を行うプログラムをハー
ドディスク、ICメモリカード、磁気テープ、フロッピ
ーディスク、又は光ディスクなどの記憶媒体に記憶する
構成であり、プログラムの実行の際、上記記憶媒体から
プログラムを読み出して実行する。The present invention has a structure in which the program for performing the above processing is stored in a storage medium such as a hard disk, an IC memory card, a magnetic tape, a floppy disk, or an optical disk. When the program is executed, the program is read from the storage medium. To execute.
【0074】請求項28記載の発明は上記課題を解決す
るため、表形式の2値イメージデータに対し、水平方向
に長い線分抽出マスクを用いて水平方向に走査し、垂直
方向に長い線分抽出マスクを用いて垂直方向に走査し、
黒画素密度が所定の閾値より高い領域をそれぞれ抽出す
る機能と、該機能で抽出した前記黒画素密度の高い領域
をそれぞれのマスク走査方向に直交する方向で統合する
機能と、該機能で統合した領域の線幅が所定の閾値以上
であれば白黒反転候補領域であるとし、該白黒反転候補
領域をそれぞれのマスク走査方向に統合する機能と、該
機能で統合した水平方向の白黒反転候補領域と垂直方向
の白黒反転候補領域の重なり状態により白黒反転領域を
設定する機能とをコンピュータに実行させる命令を含む
プログラムを格納した前記コンピュータが読み取り可能
な記憶媒体を提供することにより達成できる。In order to solve the above-mentioned problem, the twenty-eighth aspect of the present invention scans the binary image data in the table format in the horizontal direction by using a line segment extraction mask long in the horizontal direction, and long line segments in the vertical direction. Scan vertically using the extraction mask,
A function of extracting each area having a black pixel density higher than a predetermined threshold value, a function of integrating the areas having a high black pixel density extracted in the function in a direction orthogonal to each mask scanning direction, and an integration of the function If the line width of the area is greater than or equal to a predetermined threshold value, it is determined to be a black-and-white inversion candidate area, and a function of integrating the black-and-white inversion candidate area in each mask scanning direction and a horizontal black-and-white inversion candidate area integrated by the function This can be achieved by providing the computer-readable storage medium that stores a program including an instruction for causing a computer to execute a function of setting a black-and-white inversion region depending on an overlapping state of black-and-white inversion candidate regions in the vertical direction.
【0075】本発明も上記処理を行うプログラムをハー
ドディスク、ICメモリカード、磁気テープ、フロッピ
ーディスク、又は光ディスクなどの記憶媒体に記憶する
構成であり、プログラムの実行の際、上記記憶媒体から
プログラムを読み出して実行する。The present invention also has a configuration in which the program for performing the above processing is stored in a storage medium such as a hard disk, an IC memory card, a magnetic tape, a floppy disk, or an optical disk. When the program is executed, the program is read from the storage medium. To execute.
【0076】また、請求項29の記載は、請求項1又は
2記載の発明の白黒反転領域の意味を具体的に示すもの
であり、前記白黒反転領域の白黒には色の三要素によっ
て作成される任意の2色を含むものであり、例えば白と
赤、白と青、黄色と赤、黄色と緑、等各種組み合わせが
考えられる。Further, the description of claim 29 specifically shows the meaning of the black-and-white inversion area of the invention of claim 1 or 2, and the black-and-white of the black-and-white inversion area is created by three elements of color. It is possible to consider various combinations such as white and red, white and blue, yellow and red, yellow and green, and the like.
【0077】さらに、請求項30の記載も同様に、請求
項17又は18記載の発明の白黒反転領域の意味を具体
的に示すものであり、前記白黒反転領域の白黒には色の
三要素によって作成される任意の2色を含むものであ
り、白と赤、白と青、黄色と赤、黄色と緑、等各種組み
合わせが考えられる。Further, similarly, the statement of claim 30 concretely shows the meaning of the black-and-white inversion area of the invention of claim 17 or 18, and the black-and-white of the black-and-white inversion area is defined by three elements of color. It includes any two colors to be created, and various combinations such as white and red, white and blue, yellow and red, and yellow and green are conceivable.
【0078】[0078]
【発明の実施の形態】以下、本発明の実施形態例を図面
を用いて詳細に説明する。図1は本実施形態例の白黒反
転領域認識装置を含む表認識装置のシステム構成図であ
る。本例は、例えば表計算ソフトや帳票フォーム等に使
用される表の中の白黒反転領域を抽出するため、m×n
の線分抽出マスクを用い、局所的に黒画素密度の高い領
域を求め、それらの統合により局所的に存在する白黒反
転領域の抽出を可能にするものである。BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of the present invention will be described in detail below with reference to the drawings. FIG. 1 is a system configuration diagram of a table recognition device including the black-and-white inverted region recognition device of the present embodiment. This example extracts m × n in order to extract the black and white reversal area in the table used for spreadsheet software or form form, for example.
The line segment extraction mask of is used to locally obtain a region having a high black pixel density, and by integrating them, it is possible to extract a locally existing black and white inversion region.
【0079】同図において、1は様々な処理を行う中央
演算処理ユニット(CPU)、2は上記CPU1で実行
されるプログラムを格納するプログラムメモリ、3は画
像データをビットマップ形式で格納する画像メモリ、4
は画像処理に使用するワークメモリ、5は画像を光学的
に読み取るスキャナ、6はスキャナ5により読み取られ
た情報を一時的に格納するメモリ、7は各文字画像の特
徴を格納した辞書ファイル、8は認識結果を表示するデ
ィスプレイ、9は認識結果を印刷するプリンタ、10は
ディスプレイ8及びプリンタ9のインターフェイス回
路、11はCPU1、プログラムメモリ2、画像メモリ
3、ワークメモリ4、メモリ6、辞書ファイル7、イン
ターフェイス回路10及びドライバ12を接続している
バス、13はハードディスク、14はICメモリカー
ド、15は磁気テープ、16はフロッピーディスク、1
7はCD−ROMなどの光ディスクである。In the figure, 1 is a central processing unit (CPU) for performing various processes, 2 is a program memory for storing programs executed by the CPU 1, and 3 is an image memory for storing image data in a bitmap format. Four
Is a work memory used for image processing, 5 is a scanner for optically reading an image, 6 is a memory for temporarily storing the information read by the scanner 5, 7 is a dictionary file storing the characteristics of each character image, 8 Is a display for displaying the recognition result, 9 is a printer for printing the recognition result, 10 is an interface circuit of the display 8 and the printer 9, 11 is the CPU 1, program memory 2, image memory 3, work memory 4, memory 6, dictionary file 7 , A bus connecting the interface circuit 10 and the driver 12, 13 is a hard disk, 14 is an IC memory card, 15 is a magnetic tape, 16 is a floppy disk, 1
Reference numeral 7 is an optical disk such as a CD-ROM.
【0080】本装置のシステムは、スキャナ5により読
み取った画像データをメモリ6に一時的に格納し、その
画像データをビットマップ形式で画像メモリ3に展開す
る。そして、画像メモリ3からワークメモリ4にコピー
された2値画像データに対してパターン抽出処理を行
う。その結果に基づいて、スキャナ5により読み取った
画像データから文字画像の切り出しを行い、切り出され
た文字画像の特徴と辞書ファイル7に格納された特徴デ
ータとの比較を行い、その認識結果をディスプレイ8又
はプリンタ9に出力する。The system of the present apparatus temporarily stores the image data read by the scanner 5 in the memory 6, and expands the image data in the image memory 3 in the bitmap format. Then, pattern extraction processing is performed on the binary image data copied from the image memory 3 to the work memory 4. Based on the result, a character image is cut out from the image data read by the scanner 5, the characteristics of the cut out character image and the characteristic data stored in the dictionary file 7 are compared, and the recognition result is displayed. Alternatively, it is output to the printer 9.
【0081】このシステムにおいて、白黒反転領域の抽
出は、プログラムメモリ2に格納されたプログラムに従
って処理を行うCPU1の機能として実現される。ここ
で、白黒反転領域抽出処理を行うプログラムは、プログ
ラムメモリ2のROMに予め格納されている。また、白
黒反転領域抽出処理を行うプログラムを、ハードディス
ク13、ICメモリカード14、磁気テープ15、フロ
ッピーディスク16、又は光ディスク17などの記憶媒
体からプログラムメモリ2のRAMにロードしてから、
このプログラムをCPU1で実行させるようにしてもよ
い。In this system, the extraction of the black-and-white reversal area is realized as a function of the CPU 1 which performs processing in accordance with the program stored in the program memory 2. Here, the program for performing the black-and-white reversal area extraction processing is stored in advance in the ROM of the program memory 2. In addition, after loading the program for performing the black-and-white inversion area extraction processing from the storage medium such as the hard disk 13, the IC memory card 14, the magnetic tape 15, the floppy disk 16, or the optical disk 17 into the RAM of the program memory 2,
This program may be executed by the CPU 1.
【0082】さらに、白黒反転領域抽出処理を行うプロ
グラムを、通信インターフェイスを介して通信ネットワ
ークから取り出すこともできる。例えば、通信インター
フェイス19と接続される通信ネットワークとして、例
えば、LAN(LocalArea Networ
k)、WAN(Wide Area Networ
k)、インターネット、アナログ電話網、デジタル電話
網(ISDN:Integral Service D
igital Network)、PHS(パーソナル
ハンディシステム)や衛星通信などの無線通信網などを
用いることができる。Further, the program for performing the black and white reversal area extraction processing can be taken out from the communication network via the communication interface. For example, as a communication network connected to the communication interface 19, for example, a LAN (Local Area Network)
k), WAN (Wide Area Network)
k), Internet, analog telephone network, digital telephone network (ISDN: Integral Service D)
It is possible to use a wireless communication network such as digital network), PHS (personal handy system), satellite communication, or the like.
【0083】次に、図2に示す処理は、上述のようにプ
ログラムメモリ2に記憶されたプログラムに基づいて、
CPU1が行う認識処理である。同図において、CPU
1は、先ず画像入力20の処理を行い、前述のように画
像メモリ3に記憶した画像データ(イメージデータ)の
入力処理を行う。次に、線分抽出マスクを用いてイメー
ジデータを順次抽出する線分抽出21の処理を行う。例
えば、この線分抽出マスクは縦×横がm×nのドット抽
出マスクであり、線分を抽出するマスクであるので、水
平方向の線分を抽出する場合、水平方向に長い(例えば
1×6、1×30等)のマスクを使用し、垂直方向の線
分を抽出する場合、垂直方向に長い(例えば6×1、3
0×1等)のマスクを使用する。そして、上述のような
水平方向に長い線分抽出マスク、又は垂直方向に長い線
分抽出マスクを使用し、イメージデータを順次切り出
し、切り出したデータに含まれる黒画素数が一定のスレ
ッショルド値(閾値)以上である時、全て黒画素成分の
線分とする。Next, the processing shown in FIG. 2 is based on the program stored in the program memory 2 as described above.
This is a recognition process performed by the CPU 1. In the figure, the CPU
1. First, the image input 20 is processed, and the image data (image data) stored in the image memory 3 is input as described above. Next, the process of line segment extraction 21 for sequentially extracting the image data using the line segment extraction mask is performed. For example, this line segment extraction mask is a dot extraction mask of m × n in the vertical and horizontal directions, and is a mask for extracting the line segment. Therefore, when extracting the line segment in the horizontal direction, it is long in the horizontal direction (for example, 1 × When a line segment in the vertical direction is extracted using a mask of 6, 1 × 30, etc., it is long in the vertical direction (for example, 6 × 1, 3).
0x1 mask is used. Then, using the line segment extraction mask that is long in the horizontal direction or the line segment extraction mask that is long in the vertical direction as described above, the image data is sequentially cut out, and the number of black pixels included in the cut out data is a constant threshold value (threshold value ) When it is more than the above, all are line segments of the black pixel component.
【0084】次に、白黒反転領域抽出22の処理を行
う。この処理は、上述の線分抽出21の処理で水平方向
に長い線分、又は垂直方向に長い線分を統合し、統合し
た領域が罫線であるか、又は白黒反転領域であるか判別
し、白黒反転領域を抽出する。この判別には所定の閾値
が使用され、所定の閾値以上の線幅を有する統合線分に
対し白黒反転領域の対象線分とする。Next, the black-and-white inversion area extraction 22 processing is performed. In this process, line segments that are long in the horizontal direction or line segments that are long in the vertical direction are integrated by the process of the above-described line segment extraction 21, and it is determined whether the integrated region is a ruled line or a black / white inverted region, Extract the black and white reversal area. A predetermined threshold value is used for this determination, and an integrated line segment having a line width equal to or larger than the predetermined threshold value is set as a target line segment of the black-and-white inversion area.
【0085】次に、セル領域抽出23では、上記線分抽
出21の処理で抽出された線分の中で上記白黒反転領域
抽出22にもれた線分、すなわち統合線分の中で所定の
閾値以下の線幅の統合線分を罫線候補とし、セル領域の
抽出処理を行う。Next, in the cell area extraction 23, among the line segments extracted in the processing of the line segment extraction 21, the line segment which is also subjected to the black-and-white inversion area extraction 22, that is, a predetermined integrated line segment, is determined. An integrated line segment having a line width equal to or smaller than the threshold is set as a ruled line candidate, and a cell area is extracted.
【0086】次に、セル内項目抽出24の処理は、セル
領域抽出23の処理により抽出されたセル領域内の項
目、及び白黒反転領域抽出22の処理によって抽出され
た白黒反転領域に対し白黒反転処理を行い、反転処理後
の例えば文字列に対しセル内項目抽出処理を行う。Next, the in-cell item extraction 24 is performed by inverting the items in the cell area extracted by the cell area extraction 23 and the black-and-white inversion area extracted by the black-and-white inversion area extraction 22 in black and white. Processing is performed, and in-cell item extraction processing is performed on, for example, the character string after the inversion processing.
【0087】そして、最後にセル内の項目データに対
し、文字認識25の処理を行う。この処理は、例えば抽
出した項目内の文字(ビットマップデータ)に対し、予
め前述の辞書7に登録された文字の特徴データと比較す
ることにより、特徴の一致した文字データ、又は最も特
徴が近似する文字データを認識文字とする。Finally, the character recognition 25 is performed on the item data in the cell. In this processing, for example, the character (bitmap data) in the extracted item is compared with the characteristic data of the character registered in the dictionary 7 in advance, so that the character data having the same characteristic, or the most characteristic is approximated. Character data to be recognized as a recognition character.
【0088】図3は上述の処理を具体的に説明するシス
テム構成図である。尚、同図において、画像入力部30
は、上述の図2で説明した画像入力20の処理を行うも
のであり、線分抽出部32は同じく図2の線分抽出21
の処理を行うものである。また、同図に示す線分統合部
33、罫線抽出部34、白黒反転領域決定部35、白黒
反転領域内セル決定部36、画素反転部37は、図2の
白黒反転領域抽出22の処理に対応する各部である。FIG. 3 is a system configuration diagram for specifically explaining the above-mentioned processing. In the figure, the image input unit 30
Is for performing the processing of the image input 20 described above with reference to FIG. 2, and the line segment extraction unit 32 similarly uses the line segment extraction 21 of FIG.
Is to be processed. Further, the line segment integration unit 33, ruled line extraction unit 34, black-and-white inversion region determination unit 35, black-and-white inversion region cell determination unit 36, and pixel inversion unit 37 shown in FIG. The corresponding parts.
【0089】尚、図3の画像領域格納部31は、図1の
ワークメモリ4のエリアの一部である。
<第1の実施形態例>以下、上述のシステム構成を使用
し、第1の実施形態例について説明する。The image area storage unit 31 of FIG. 3 is a part of the area of the work memory 4 of FIG. <First Embodiment> The first embodiment will be described below using the system configuration described above.
【0090】先ず、図4に示すフローチャートは本例の
処理を説明するものである。以下、同図に従って説明す
る。尚、前述の画像メモリ3には既にスキャナ5から表
形式の例えば帳票の原稿が読み込まれ、バス11を介し
て対応するイメージデータが格納されているものとす
る。First, the flow chart shown in FIG. 4 explains the processing of this example. Hereinafter, description will be given with reference to FIG. It is assumed that the image memory 3 has already read a document in the form of a table from the scanner 5 and stores corresponding image data via the bus 11.
【0091】先ず、CPU1は画像メモリ3に格納され
たイメージデータを読み出し、線分抽出22及び白黒反
転領域抽出23の各処理を行う。これらの処理は水平方
向、又は垂直方向に対して別々に行う。本例の説明で
は、図4に記載の左側の処理である水平方向処理から説
明する。First, the CPU 1 reads out the image data stored in the image memory 3 and executes the line segment extraction 22 and the black and white inversion area extraction 23. These processes are separately performed in the horizontal direction or the vertical direction. In the description of this example, the horizontal processing, which is the processing on the left side in FIG. 4, will be described.
【0092】先ず、水平方向の線分抽出処理(ステップ
(以下Sで示す)1)は、水平方向に長い線分抽出マス
クを用いて行う。この線分抽出マスクとしてはm×n
が、例えば1×6(尚、線分抽出マスクとしては1×6
のマスクに限らず、1×15、1×30等のマスクも使
用することができる)のマスクを使用する。First, the horizontal line segment extraction process (step (hereinafter referred to as S) 1) is performed using a horizontal line segment extraction mask. As this line segment extraction mask, m × n
However, for example, 1 × 6 (as a line segment extraction mask, 1 × 6
No. 1 mask, 1 × 15 mask, 1 × 30 mask, etc. can also be used.
【0093】図5は上述の線分抽出処理(S1)を具体
的に説明するフローチャートである。この処理は同図に
示すように、先ず上述の線分抽出マスクで対応する1×
6の領域を切り取り、その中の黒画素数をマスクサイズ
で割り算した値(マスク内のパターン黒画素数/マスク
サイズ)が予め設定した閾値より大きいか判断する(S
1−1)。この結果、割り算した値が所定の閾値より大
きい時、線分抽出マスクで切り取られた線分(すなわ
ち、細く比較的短い線分)には黒画素数が多く、この場
合マスク内を全て線分とする(黒画素とする)(S1−
1がYES、S1−2)。一方、マスク内の黒画素数を
マスサイズで割り算した値が閾値より小さい時、線分抽
出マスクで切り取られた領域には黒画素数が少なく、切
り取った領域は線分ではないと判断する(S1−1がN
O)。FIG. 5 is a flow chart for concretely explaining the above-mentioned line segment extraction processing (S1). As shown in the figure, this process is performed by first using the above-mentioned line segment extraction mask, which corresponds to 1 ×
Area 6 is cut out, and it is determined whether the value obtained by dividing the number of black pixels in the area by the mask size (the number of pattern black pixels in the mask / mask size) is larger than a preset threshold value (S
1-1). As a result, when the divided value is larger than the predetermined threshold value, the line segment cut out by the line segment extraction mask (that is, a thin and relatively short line segment) has many black pixels, and in this case, all line segments in the mask are (Black pixel) (S1-
1 is YES, S1-2). On the other hand, when the value obtained by dividing the number of black pixels in the mask by the mass size is smaller than the threshold, the number of black pixels in the area cut out by the line segment extraction mask is small, and it is determined that the cut area is not a line segment ( S1-1 is N
O).
【0094】図6は上述の処理を具体的に説明する図で
あり、例えば、m×n(縦×横)が1×6の画素(ドッ
ト)の領域を指定する線分抽出マスクにより、水平方向
成分を抽出する場合を説明するものである。同図(a)
は互いに重なり合ったマスク領域「1」〜「9」を示
し、同図(b)のイメージデータに対し、上記線分抽出
マスクを用いてマスク処理を行うことにより、水平方向
の線分が抽出されることを示す。この処理により、多数
の極めて細く短い領域(m×nが1×6の線分)が、水
平方向及び垂直方向に抽出される。FIG. 6 is a diagram for specifically explaining the above-described processing. For example, a line segment extraction mask designating a region of pixels (dots) in which m × n (vertical × horizontal) is 1 × 6 is used for horizontal scanning. The case where the direction component is extracted will be described. The same figure (a)
Indicates mask areas “1” to “9” which are overlapped with each other, and the line segment in the horizontal direction is extracted by performing mask processing on the image data of FIG. Indicates that By this processing, a large number of extremely thin and short regions (m × n is a 1 × 6 line segment) are extracted in the horizontal direction and the vertical direction.
【0095】次に、図4に示す線分統合処理(S2)を
実行する。この線分統合処理の具体例は、上述の図5に
示す判断(S2−1)と統合処理(S2−2)であり、
また上記統合処理の際、図4に示す白黒反転領域候補抽
出処理(S3)も同時に実行される(尚、上述の白黒反
転領域候補抽出処理(S3)の具体的な処理は図7のフ
ローチャートに従って行われる)。また、線分統合処理
は、図3に示した線分統合部33が行う処理である。す
なわち、前述の図4の処理(S1)に従って、抽出され
た線分に対し上下の線分、又は左右の線分が接している
か判断し(S2−1)、接している線分があれば(S2
−1がYES)、これらを統合し(S2−2)、矩形領
域を作成する(S2−3)。Next, the line segment integration process (S2) shown in FIG. 4 is executed. A specific example of this line segment integration processing is the determination (S2-1) and integration processing (S2-2) shown in FIG.
Further, during the integration processing, the black-and-white inverted area candidate extraction processing (S3) shown in FIG. 4 is also executed at the same time (the specific processing of the above-described black-and-white inverted area candidate extraction processing (S3) follows the flowchart of FIG. Done). Further, the line segment integration process is a process performed by the line segment integration unit 33 shown in FIG. That is, according to the process (S1) of FIG. 4 described above, it is determined whether the upper and lower line segments or the left and right line segments are in contact with the extracted line segment (S2-1). (S2
-1 is YES), these are integrated (S2-2), and a rectangular area is created (S2-3).
【0096】ここで、線分統合部33は第1の統合手段
としての機能、及び第2の統合手段としての機能を有
し、先ず始めには第1の統合手段としての機能として、
上記線分の上下方向(垂直方向)を統合する。すなわ
ち、上述のように線分抽出マスクを用いて水平方向に領
域(線分)を切り取った場合、その領域と直交する方向
(垂直方向)の他の領域(線分)を統合する。この場
合、統合領域(線分)間の距離が所定のスレッショルド
値(thd)より短くなければならず(S3−1)、上
記スレッショルド値(thd)より線分間の距離が長い
場合、接すると判断しない。この場合、線分間の距離が
離れすぎているため、同じ線分とは見なせないためであ
る。また、この統合は線分間の長さが同じ場合に行われ
(S3−2)、長さが違う場合には部分的な統合を行う
(S3−3)。Here, the line segment integrating section 33 has a function as a first integrating means and a function as a second integrating means. First, as a function as the first integrating means,
The vertical direction (vertical direction) of the above line segments is integrated. That is, when a region (line segment) is cut out in the horizontal direction using the line segment extraction mask as described above, another region (line segment) in a direction (vertical direction) orthogonal to the region is integrated. In this case, the distance between the integrated regions (line segments) must be shorter than a predetermined threshold value (thd) (S3-1), and if the distance between the line segments is longer than the threshold value (thd), it is determined that they are in contact with each other. do not do. This is because, in this case, the line segments are too far apart to be regarded as the same line segment. Further, this integration is performed when the lengths of the line segments are the same (S3-2), and when the lengths are different, partial integration is performed (S3-3).
【0097】以上の処理により水平方向に1×6の領域
(線分)は、当該領域に黒画素数が所定の閾値以上あれ
ば垂直方向に延びてゆき、上述の処理によって統合した
領域(線分)の幅が所定の閾値を越えれば白黒反転候補
領域とする。そして、白黒反転領域と判断された場合、
次に統合線分をマスク走査方向に統合する。By the above processing, the 1 × 6 area (line segment) in the horizontal direction extends in the vertical direction if the number of black pixels in the area is equal to or larger than a predetermined threshold value, and the area (line If the width of (min) exceeds a predetermined threshold value, it is determined as a black and white reversal candidate area. Then, if it is determined to be the black and white reversal area,
Next, the integrated line segments are integrated in the mask scanning direction.
【0098】この処理が線分統合部33の第2の機能で
ある。この統合処理は、マスク走査方向に隣り合う白黒
反転候補領域を順次統合するものである。そして、この
ようにして白黒反転候補領域がマスク走査方向に延びて
ゆき、上述の矩形領域が形成される(S2−3)。This processing is the second function of the line segment integration unit 33. In this integration processing, the black-and-white reversal candidate areas adjacent in the mask scanning direction are sequentially integrated. Then, in this way, the black-and-white reversal candidate area extends in the mask scanning direction, and the above-described rectangular area is formed (S2-3).
【0099】図8及び図9は上述の線分統合処理の結果
を示す図である。尚、図8は統合領域内に“かすれ”等
がない場合を示し、図9は統合領域内に“かすれ”等が
ある場合を示す。8 and 9 are diagrams showing the results of the above-mentioned line segment integration processing. 8 shows the case where there is no "blurring" in the integrated area, and FIG. 9 shows the case where there is "blurring" in the integrated area.
【0100】先ず、図8の例について説明すると、同図
に示す、は線幅がスレッショルド値以上(閾値以
上)の領域を統合した線分である。すなわち、水平方向
に長いm×nの線分抽出マスクを使用し、垂直方向、及
び水平方向に統合した結果得られた線幅がスレッショル
ド値(同図に示すスレッショルド値(thd1))以上
の線分であり、白黒反転候補領域である。尚、水平方向
に長いm×nの線分抽出マスクの大きさを、例えばMと
すると同図に示す大きさの関係が白黒反転候補領域との
間にある。First, the example of FIG. 8 will be described. In FIG. 8, a line segment is a line segment in which regions having a line width of a threshold value or more (a threshold value or more) are integrated. That is, the line width obtained as a result of integrating in the vertical direction and the horizontal direction using the line segment extraction mask of m × n which is long in the horizontal direction is equal to or larger than the threshold value (threshold value (thd1) shown in the figure). Minutes, which is a black and white reversal candidate area. If the size of the m × n line segment extraction mask that is long in the horizontal direction is M, for example, the size relationship shown in FIG.
【0101】一方、図9は、上述のように統合領域内に
“かすれ”部分を含む例であり、同図に示す’、
”、は線幅がスレッショルド値以上(同図に示すス
レッショルド値(thd1))の領域を統合した線分で
ある。これらの線分も白黒反転候補領域の線分である
が、図9の’−”の線分は、図8の線分に比較し
て“かすれ”部分に対応する部分が削られた状態であ
る。この理由は、前述の統合処理の際垂直方向への統合
線分距離が足りず、垂直方向への統合処理が厚く行われ
ず(S3−1が(>thd))、細い統合線分となった
ものである。On the other hand, FIG. 9 shows an example in which the "blurred" portion is included in the integrated area as described above.
“,” Is a line segment obtained by integrating regions having a line width equal to or larger than the threshold value (threshold value (thd1) shown in FIG. 6). These line segments are also line segments of the black-and-white inversion candidate region. The line segment of "-" is a state in which the portion corresponding to the "blurred" portion is deleted as compared with the line segment of FIG. The reason for this is that the integration line segment distance in the vertical direction is insufficient during the integration process described above, and the integration process in the vertical direction is not performed thickly (S3-1 is (> thd)), resulting in a thin integration line segment. It is a thing.
【0102】次に、図4に示す罫線候補抽出処理(S
4)を行う。この処理は前述の図3に示す罫線抽出部3
4が行う処理である。この処理を具体的に説明する図が
図10に示すフローチャートである。先ず、前述の処理
により統合された統合線分の中で白黒反転候補領域に含
まれない統合線分を抽出する(S4−1)。次に上記抽
出処理により抽出された統合線分に対し、当該統合線分
の線幅が所定のスレッショルド値(thd1)より狭い
か判断する(S4−2)。ここで、当該統合線分の線幅
が所定のスレッショルド値(thd1)より狭い時、罫
線候補とする(S4−2)。Next, the ruled line candidate extraction process (S
4) is performed. This processing is performed by the ruled line extraction unit 3 shown in FIG.
4 is the processing performed. FIG. 10 is a flowchart specifically explaining this processing. First, an integrated line segment which is not included in the black and white inversion candidate area is extracted from the integrated line segments integrated by the above-described processing (S4-1). Next, it is determined whether or not the line width of the integrated line segment extracted by the extraction processing is narrower than a predetermined threshold value (thd1) (S4-2). Here, when the line width of the integrated line segment is narrower than a predetermined threshold value (thd1), it is determined as a ruled line candidate (S4-2).
【0103】ここで、前述の図8、図9を用いて説明す
ると、スレッショルド値(thd1)が両図に示す幅の
時、統合線分の、’、、’は罫線候補となる。
また、図9の場合、統合線分、’、”、、’
が罫線候補となる。図8と図9を比べて異なる部分は罫
線候補に”が“かすれ”のある図9に存在することで
ある。尚、図4の罫線抽出処理(S5)は、上述の罫線
候補抽出処理によって抽出された罫線候補をマスク走査
方向に統合し、水平方向に長い線分を作成するものであ
る。Explaining with reference to FIG. 8 and FIG. 9 described above, when the threshold value (thd1) has the width shown in both figures, the integrated line segments ', ...' Are ruled line candidates.
Further, in the case of FIG. 9, integrated line segments, “,”, and “
Is a ruled line candidate. The difference between FIG. 8 and FIG. 9 is that the ruled line candidates are present in FIG. 9 with “blurred”. Note that the ruled line extraction processing (S5) of FIG. The extracted ruled line candidates are integrated in the mask scanning direction to create a long line segment in the horizontal direction.
【0104】次に、図4の孤立罫線抽出処理(S6)を
行う。この処理を具体的に説明する図が図11のフロー
チャートである。この処理は、上述の罫線候補抽出処理
により抽出された罫線に対し、左右、又は上下に距離の
スレッショルド値(thd2)以内に白黒反転候補領域
が存在するか判断するものである(S6−1)。前述の
図8の例の場合、統合線分、’、、’は上述の
孤立罫線にあたらない。すなわち、統合線分の、に
は線分の右側に白黒反転候補領域又はが存在する
が、線分の左側には白黒反転候補領域が存在しないから
である。また、統合線分の’、’には線分の左側に
白黒反転候補領域、が存在するが、線分の右側には
白黒反転候補領域が存在しないからである。Next, the isolated ruled line extraction process (S6) of FIG. 4 is performed. FIG. 11 is a flowchart specifically explaining this process. This processing is to determine whether or not there is a black-and-white reversal candidate area within the threshold value (thd2) of the distance to the left or right or up and down with respect to the ruled line extracted by the ruled line candidate extraction process described above (S6-1). . In the case of the example of FIG. 8 described above, the integrated line segments ',,' do not correspond to the above-mentioned isolated ruled line. That is, the black and white inversion candidate area or exists on the right side of the integrated line segment, but the black and white inversion candidate area does not exist on the left side of the line segment. In addition, the black and white inversion candidate region exists on the left side of the line segment in the integrated line segment “,”, but the black and white inversion candidate region does not exist on the right side of the line segment.
【0105】一方、図9の例の場合、統合線分、
’、、’については上述の図8の例と同じである
が、統合線分”の場合異なる。すなわち、統合線分
”の左右には白黒反転候補領域’、”が存在する
(S6−1がYES)。したがって、統合線分”は孤
立罫線として抽出される。On the other hand, in the case of the example of FIG.
“,,” are the same as in the example of FIG. 8 described above, but are different in the case of the integrated line segment. That is, there are black and white inversion candidate regions “,” on the left and right of the integrated line segment ”(S6-1). Therefore, the integrated line segment "is extracted as an isolated ruled line.
【0106】次に、図4の孤立罫線と白黒反転候補領域
の統合処理(S7)を行う。この処理は図3に示す白黒
反転領域決定部35が行う処理である。この処理を具体
的に説明する図が図12のフローチャートである。この
処理は、上述の処理(S6)によって抽出した孤立罫線
を囲む上下、又は左右の白黒反転候補領域に外接する矩
形領域の算出を行うものである(S7−1)。すなわ
ち、上述のように孤立罫線は、例えば図9の”の統合
線分であり、その左右には白黒反転領域’と”が位
置する。したがって、同図の”に示すような孤立罫線
を両側の白黒反転領域’、”に統合する処理を行
う。具体的には図9に□印で囲うの矩形領域を算出す
る。Next, the integrated ruled line of FIG. 4 and the black-and-white reversal candidate area are integrated (S7). This process is a process performed by the black and white reversal area determination unit 35 shown in FIG. FIG. 12 is a flowchart specifically explaining this processing. This processing is to calculate a rectangular area circumscribing the black-and-white inversion candidate area on the upper and lower sides or the left and right sides surrounding the isolated ruled line extracted by the above-described processing (S6) (S7-1). That is, as described above, the isolated ruled line is, for example, an integrated line segment of "in FIG. 9, and black and white reversal regions'and" are located on the left and right thereof. Therefore, the processing for integrating the isolated ruled line as shown by "in the figure" into the black and white inversion areas', "on both sides" is performed. Specifically, a rectangular area surrounded by a square in FIG. 9 is calculated.
【0107】以上の説明に従って水平方向に対する白黒
反転領域の抽出、及び罫線領域の抽出処理が完了する。
また、以上の処理は、水平方向に対する白黒反転領域、
及び罫線領域の抽出処理であるが、垂直方向に対しても
同様に行う。According to the above description, the extraction of the black and white reversal area in the horizontal direction and the extraction of the ruled line area are completed.
In addition, the above processing is performed in the black and white reversal area with respect to the horizontal
The extraction processing of the ruled line area is also performed in the vertical direction.
【0108】すなわち、図4に示すフローチャートの右
側の処理であり、垂直方向に長い線分抽出マスクを用い
て垂直方向の線分抽出処理(ステップ(以下S’で示
す)1)を行い、抽出した線分に対して線分統合処理を
行う(S2’)。この具体的な処理は、前述と同様、図
5及び図7のフローチャートに従って行われる。次に、
白黒反転候補領域抽出処理(S3’)を行い、白黒反転
候補領域を抽出し、罫線候補抽出処理(S4’)を行
い、罫線抽出を行う(S5’)。さらに孤立罫線に対す
る抽出処理を行い(S6’)、最後に垂直方向に対する
白黒反転候補領域の統合処理(S7’)を行う。尚、上
述の各処理共、水平方向の場合と同様、図10〜図12
の具体的なフローチャートに従って実行される。That is, in the process on the right side of the flowchart shown in FIG. 4, the line segment extraction process in the vertical direction (step (hereinafter referred to as S ′) 1) is performed by using the line segment extraction mask long in the vertical direction, and the extraction is performed. Line segment integration processing is performed on the selected line segment (S2 ′). This specific process is performed according to the flowcharts of FIGS. 5 and 7 as described above. next,
White / black inversion candidate area extraction processing (S3 ′) is performed, black / white inversion candidate areas are extracted, ruled line candidate extraction processing (S4 ′) is performed, and ruled line extraction is performed (S5 ′). Further, the extraction processing for the isolated ruled line is performed (S6 '), and finally the black-and-white inversion candidate area integration processing for the vertical direction (S7') is performed. It should be noted that in each of the above-described processes, as in the case of the horizontal direction, FIGS.
It is performed according to the concrete flowchart of.
【0109】以上の処理により、垂直方向に対する白黒
反転領域、及び罫線領域の抽出処理も終了し、次に水平
/垂直の白黒反転候補領域の統合処理に移行する(図4
のS8)。With the above processing, the extraction processing of the black-and-white inversion area and the ruled line area in the vertical direction is also completed, and then the processing moves to the integration processing of the horizontal / vertical black-and-white inversion candidate areas (FIG. 4).
S8).
【0110】図13はこの処理を具体的に説明するフロ
ーチャートである。また、図14は図13のフローチャ
ートに沿ってその処理を説明する図である。先ず、図1
3のフローチャートに従って、水平方向の白黒反転候補
領域を抽出する(S8−1)。この白黒反転候補領域は
図14の’、”、及びである。次に、水平方向の
白黒反転領域に重なる垂直方向の白黒反転領域の抽出を
行う(S8−2)。この白黒反転候補領域は図14に示
す、である。尚、この垂直方向の白黒反転候補領域
は、図4の白黒反転領域抽出処理(S3’)において抽
出された領域である。FIG. 13 is a flowchart specifically explaining this process. Further, FIG. 14 is a diagram for explaining the processing along the flowchart of FIG. First, Fig. 1
According to the flowchart of No. 3, the horizontal black-and-white inversion candidate area is extracted (S8-1). This black-and-white inversion candidate area is', ", and in Fig. 14. Next, the vertical-direction black-and-white inversion area overlapping the horizontal black-and-white inversion area is extracted (S8-2). This is shown in Fig. 14. The black-and-white inversion candidate area in the vertical direction is the area extracted in the black-and-white inversion area extraction processing (S3 ') in Fig. 4.
【0111】次に、水平方向の白黒反転候補領域と垂直
方向の白黒反転候補領域の重なっている部分の面積を算
出する(S8−3)。すなわち、図14の水平方向の白
黒反転候補領域’と垂直方向の白黒反転候補領域が
重なった領域A、白黒反転候補領域”と垂直方向の白
黒反転候補領域が重なった領域B、水平方向の白黒反
転候補領域と垂直方向の白黒反転候補領域が重なっ
た領域C、白黒反転候補領域と垂直方向の白黒反転候
補領域が重なった領域Dの各面積を計算し、上記A、
B、C、Dの面積を加算する。Next, the area of the overlapping portion of the horizontal black-and-white inversion candidate area and the vertical black-and-white inversion candidate area is calculated (S8-3). That is, the area A in which the horizontal black and white inversion candidate area 'and the vertical direction black and white inversion candidate area in FIG. 14 overlap, the area B in which the black and white inversion candidate area "and the vertical direction black and white inversion candidate area overlap, and the horizontal black and white. The respective areas of a region C where the reversal candidate region overlaps with the black-and-white reversal candidate region in the vertical direction and a region D where the black-and-white reversal candidate region overlaps with the black-and-white reversal candidate region in the vertical direction are calculated.
The areas of B, C and D are added.
【0112】次に、上述の処理によって算出した重なっ
た領域の面積を利用し、以下の計算を行う。すなわち、
(重なっている部分の面積)/水平方向の白黒反転領域
の面積を計算し、この値とスレッショルド値(thd
3)を比較する(S8−4)。そして、(重なっている
部分の面積)/水平方向の白黒反転領域の面積がスレッ
ショルド値(thd3)より大きい時(≧thd3)、
水平方向の白黒反転候補領域と垂直方向の白黒反転候補
領域が外接する矩形領域を算出する(S8−6)。すな
わち、この場合、水平方向の白黒反転候補領域と垂直方
向の白黒反転領域の(重なっている部分の面積)が大き
い場合であり、白黒反転領域であると識別してもよい場
合である。一方、上述の判断(S8−4)において、
(重なっている部分の面積)/水平方向の白黒反転領域
の面積がスレッショルド値(thd3)より小さい時
(<thd3)、水平方向の白黒反転候補領域と垂直方
向の白黒反転領域の(重なっている部分の面積)が小さ
く、白黒反転領域であると識別できない場合である。Next, the following calculation is performed by using the area of the overlapping region calculated by the above processing. That is,
(Area of overlapped area) / Area of horizontal black and white reversal area is calculated, and this value and threshold value (thd
3) are compared (S8-4). Then, when the area of (overlapped area) / horizontal black-and-white reversal region is larger than the threshold value (thd3) (≧ thd3),
A rectangular area circumscribing the horizontal black-and-white inversion candidate area and the vertical black-and-white inversion candidate area is calculated (S8-6). That is, in this case, the case where the horizontal black-and-white inversion candidate area and the vertical black-and-white inversion area are large (the area of the overlapping portion) is large, and the black-and-white inversion area may be identified. On the other hand, in the above determination (S8-4),
(Area of overlapping portion) / When the area of the horizontal black / white inversion area is smaller than the threshold value (thd3) (<thd3), (horizontal black / white inversion candidate area and vertical black / white inversion area) This is the case where the area) is so small that it cannot be identified as a black and white reversal region.
【0113】但し、この場合更に次の判断(S8−5)
を実行する。すなわち、上述とは逆に(重なっている部
分の面積)/垂直方向の白黒反転領域の面積を計算し、
この値とスレッショルド値(thd3)を比較する。そ
して、(重なっている部分の面積)/垂直方向の白黒反
転領域の面積がスレッショルド値(thd3)より大き
い時(≧thd3)、垂直方向に対する(重なっている
部分の面積)の比は大きいものであるとして、白黒反転
候補領域と垂直方向の白黒反転候補領域を外接する矩形
領域を算出する(S8−6)。すなわち、この場合、水
平方向の白黒反転候補領域と垂直方向の白黒反転領域の
(重なっている部分の面積)は、垂直方向の白黒反転候
補領域の面積に対しては充分大きいものであり、白黒反
転領域であると識別してもよいと判断できるからであ
る。However, in this case, the next judgment is made (S8-5).
To execute. That is, contrary to the above, (the area of the overlapping portion) / the area of the black and white reversal region in the vertical direction is calculated,
This value is compared with the threshold value (thd3). When the area of (overlapping portion) / vertical black / white reversal region is larger than the threshold value (thd3) (≧ thd3), the ratio of (area of overlapping portion) to the vertical direction is large. Assuming that there is, a rectangular area that circumscribes the black-and-white inversion candidate area and the vertical black-and-white inversion candidate area is calculated (S8-6). That is, in this case, the area of the overlapping portion of the black-and-white inversion candidate area in the horizontal direction and the black-and-white inversion area in the vertical direction is sufficiently larger than the area of the black-and-white inversion candidate area in the vertical direction. This is because it can be determined that it may be identified as the inverted region.
【0114】以上の処理により、水平方向の白黒反転候
補領域と垂直方向の白黒反転候補領域が外接する矩形領
域を算出すると、図14の□印で囲った実線領域Eとな
る。すなわち、この領域が水平方向及び垂直方向の白黒
反転候補領域から識別した白黒反転領域である。By calculating the rectangular area in which the horizontal black-and-white inversion candidate area and the vertical black-and-white inversion candidate area are circumscribed by the above processing, the solid line area E surrounded by a square mark in FIG. 14 is obtained. That is, this area is the black and white reversal area identified from the horizontal and vertical black and white reversal candidate areas.
【0115】但し、本例では上記水平/垂直の白黒反転
候補領域の統合処理で得られた結果から直ちに白黒反転
領域を決定するのではなく、次の白黒反転領域内の連結
成分の算出処理(図4のS9)を実行し、この結果に基
づき白黒反転領域の決定処理を行う(図4のS10)。
以下、具体的に説明する。However, in this example, the black-and-white inversion region is not immediately determined from the result obtained by the integration process of the horizontal / vertical black-and-white inversion candidate regions, but the process of calculating the connected component in the next black-and-white inversion region ( 4 is executed, and the white / black inversion area determination processing is performed based on this result (S10 in FIG. 4).
The details will be described below.
【0116】先ず、連結成分の算出は図15に示すフロ
ーチャートに従って実行され、例えば白黒反転領域内を
ラベリングして連結成分数を算出する(S9−1)。す
なわち、連結成分数の算出は、例えば白黒反転領域内の
独立する黒印字部にラベルを付し、そのラベル数(連結
成分数)を算出する処理である。尚、連結成分数とは白
黒反転領域内を反転処理する際の対象となる領域内の黒
印字成分、又は白印字成分の数であり、白黒反転処理を
行う範囲(枠)を構成する、例えば上下、左右の境界を
連結する際の判断基準となる数である。すなわち、連結
成分数とは、白黒反転処理を行う際、上下、左右の境界
線間を連結する際の連結の判断基準となる数である。し
たがって、例えば白黒反転領域内に網点等が有る場合、
当該黒ドット数(ラベル数、連結成分数)は極めて大き
な値となる。First, the calculation of the connected component is executed according to the flow chart shown in FIG. 15, and the number of connected components is calculated by, for example, labeling the black-and-white inversion area (S9-1). That is, the calculation of the number of connected components is, for example, a process of attaching a label to an independent black print portion in the black-and-white inversion area and calculating the number of labels (the number of connected components). The number of connected components is white.
Black in the target area when reversing the black inversion area
The number of print components or white print components.
Configure the range (frame) to be performed, for example, the upper and lower, left and right boundaries
It is the number that becomes the judgment standard when connecting. That is, concatenation
The number of components is the boundary between the top and bottom and the left and right when performing the black and white reversal
It is the number that serves as a criterion for connection when connecting lines. Therefore, for example, if there are halftone dots in the black and white reversal area,
The number of black dots (the number of labels, the number of connected components) becomes an extremely large value.
【0117】次に、白黒反転領域の決定処理を行う(S
10)。この決定処理は図16に示す処理によって行わ
れ、上述の連結成分が所定のスレッショルド値(thd
4)以上であれば白黒反転候補領域を棄却し、連結成分
が所定のスレッショルド値以下であれば白黒反転候補領
域を白黒反転領域として決定する(S10−1)。Next, the process for determining the black and white reversal area is performed (S
10). This determination processing is performed by the processing shown in FIG. 16, and the above-described connected component has a predetermined threshold value (thd
4) If it is greater than or equal to, the black and white inversion candidate area is rejected, and if the connected component is less than or equal to a predetermined threshold value, the black and white inversion candidate area is determined as the black and white inversion area (S10-1).
【0118】すなわち、前述のように算出した連結成分
数が予め設定された閾値以下であるか識別する処理であ
り、例えば網点等の模様が白黒反転領域に付加されてい
る場合、この処理によって識別され、このような模様が
付加されたセルは本来の白黒反転領域(白黒反転セル)
と確実に識別され、白黒反転領域から排除される。That is, this is a process for identifying whether or not the number of connected components calculated as described above is less than or equal to a preset threshold value. For example, when a pattern such as a halftone dot is added to the black-and-white inversion region, this process The cells that have been identified and have such a pattern added are the original black and white reversal areas (black and white reversal cells).
Is reliably identified and excluded from the black and white reversal area.
【0119】ここで、例えば図17に示す例の場合、黒
印字部は背景の黒部1個と、文字列「会社名」に含まれ
る独立の黒印字部(例えば6個)の合計7個である。し
たがって、この場合連結成分数のスレッショルド値(t
hd4)を「10」とすれば判断(S10−1)は(≦
thd4)であり、この場合白黒反転領域である。Here, in the case of the example shown in FIG. 17, for example, the black print portion is composed of one black portion of the background and independent black print portions (for example, six) included in the character string "company name", for a total of seven. is there. Therefore, in this case, the threshold value (t
If hd4) is set to “10”, the determination (S10-1) is (≦
thd4), which in this case is a black and white reversal area.
【0120】次に、上述の処理により決定した白黒反転
領域の輪郭セグメント表現を行う(S11)。この処理
は具体的には図18のフローチャートに従って処理され
る。すなわち、白黒反転領域の外郭に位置する抽出済み
線分に着目し、線分の線幅を白黒反転領域の外側方向
(線分の放線ベクトルの外側方向)に増分する(S11
−1)。そして、線分の矩形の頂点座標を格納する(S
11−2)。Next, the contour segment expression of the black-and-white reversal area determined by the above processing is performed (S11). This process is specifically performed according to the flowchart of FIG. That is, paying attention to the extracted line segment located outside the black-and-white inversion region, the line width of the line segment is incremented in the outward direction of the black-and-white inversion region (outward direction of the ray vector of the line segment) (S11).
-1). Then, the vertex coordinates of the rectangle of the line segment are stored (S
11-2).
【0121】具体的には図19に示すように、水平方向
と垂直方向の線分抽出マスクによって抽出される領域
(線分)は、元々の画像の傾き等により最大4度程度傾
く場合があり、抽出する領域(線分)も上下、左右にず
れて抽出される。このため、上述のように線分の線幅を
白黒反転領域の外側方向に増分する補正を行う。Specifically, as shown in FIG. 19, the area (line segment) extracted by the line segment extraction masks in the horizontal and vertical directions may be inclined up to about 4 degrees due to the inclination of the original image. The area (line segment) to be extracted is also shifted vertically and horizontally. Therefore, as described above, the correction is performed to increase the line width of the line segment in the outward direction of the black / white reversal region.
【0122】次に、白黒反転領域の属性付与処理を行う
(S12)。この処理は、具体的には図20に示すフロ
ーチャートの如く、上述の処理で作成した輪郭セグメン
トの白黒反転領域における位置情報を属性データとして
格納する(S12−1)。例えば、上述の図19の線分
セグメント列の例で説明すると、白黒反転領域の上側に
位置する線分セグメント列a1〜a4には白黒反転領域
の「上」の位置を示す属性が付加され、線分セグメント
列b1、b2には白黒反転領域の「右」の位置を示す属
性が付加され、白黒反転領域の下側に位置する線分セグ
メント列c1〜c4には白黒反転領域の「下」の位置を
示す属性が付加され、線分セグメント列d1、d2には
白黒反転領域の「左」の位置を示す属性が付加される。Next, the attribute assigning process for the black and white reversal area is performed (S12). Specifically, as shown in the flowchart of FIG. 20, this process stores the position information in the black-and-white reversal region of the contour segment created by the above process as attribute data (S12-1). For example, in the example of the line segment segment sequence in FIG. 19 described above, the line segment segment sequences a1 to a4 located above the black / white inversion region are added with an attribute indicating the “upper” position of the black / white inversion region, The line segment segment columns b1 and b2 are added with an attribute indicating the “right” position of the black / white inversion region, and the line segment segment columns c1 to c4 located below the black / white inversion region are “below” the black / white inversion region. Is added to the line segment segment columns d1 and d2, and the attribute indicating the "left" position of the black and white reversal area is added.
【0123】このように構成することにより、当該白黒
反転領域を囲う線分セグメント列には上記属性が付加さ
れ、例えばこれらの属性をワークメモリ4に線分セグメ
ント列の位置情報と共に格納しておくことにより、後に
表認識処理を行う際、当該線分セグメント(列)が白黒
反転領域を囲うセグメント(列)であり、しかもその属
性データから白黒反転領域のどの位置に対応するか容易
に判断できる。With this configuration, the above-mentioned attributes are added to the line segment segment sequence surrounding the black-and-white inversion area. For example, these attributes are stored in the work memory 4 together with the position information of the line segment segment sequence. As a result, when the table recognition processing is performed later, it is possible to easily determine which line segment segment (column) is a segment (column) that surrounds the black-and-white inversion region and which position of the black-and-white inversion region corresponds from the attribute data. .
【0124】次に、白黒反転領域内のセル分割を行う
(図4のS13)。尚、この処理は図3に示す白黒反転
領域内セル決定部36が行う処理である。すなわち、白
黒反転領域内が複数のセルで構成されている場合もあ
り、上述のように設定した白黒反転領域内をセル分割す
る。Next, cell division in the black / white inversion area is performed (S13 in FIG. 4). It should be noted that this process is a process performed by the in-black / white inversion area cell determination unit 36 shown in FIG. That is, the black and white reversal area may be composed of a plurality of cells, and the black and white reversal area set as described above is divided into cells.
【0125】この処理を具体的に説明するフローチャー
トが図21である。先ず、白黒反転領域に接する罫線で
輪郭セグメントから距離(スレッショルド値(thd
5))以上離れた罫線を抽出する(S13−1)。例え
ば、白黒反転領域が水平方向に形成されている場合、垂
直方向の罫線を抽出する。次に、罫線を白黒反転領域内
へ延長した短冊領域を抽出する(S13−2)。すなわ
ち、上述のように抽出した垂直方向の罫線を白黒反転領
域内に延長し、白黒反転領域を例えば短冊状に分割す
る。そして、短冊領域の白画素密度が所定のスレッショ
ルド(thd5)より少ないか判断する(S13−
3)。すなわち、この処理は白黒反転領域を短冊状に分
割する際、罫線を延長した白黒反転領域の位置に白黒反
転文字が存在する場合、この位置を罫線で仕切ることが
できないので、白黒反転文字の存在を確認するために行
う処理である。したがって、例えば垂直方向に長い線分
抽出マスクを使用し、対象となる白黒反転領域内を線分
抽出マスクで黒画素数の抽出処理を行い、黒画素数が少
ない場合、すなわち白画素数が多い場合、当該位置には
白黒反転文字が存在し、セル分割できない位置であるこ
とが分かる。FIG. 21 is a flowchart specifically explaining this processing. First, a ruled line in contact with the black-and-white reversal area is used to measure the distance (threshold value (thd
5)) The ruled lines separated from each other are extracted (S13-1). For example, when the black-and-white inversion area is formed in the horizontal direction, the ruled line in the vertical direction is extracted. Next, a strip area in which the ruled line is extended into the black and white inversion area is extracted (S13-2). That is, the vertical ruled lines extracted as described above are extended into the black-and-white inversion area, and the black-and-white inversion area is divided into strips, for example. Then, it is determined whether the white pixel density in the strip area is less than a predetermined threshold (thd5) (S13-).
3). That is, in this process, when the black-and-white inversion area is divided into strips, if there is a black-and-white inversion character at the position of the black-and-white inversion area where the ruled line is extended, this position cannot be separated by the ruled line. This is a process performed to confirm. Therefore, for example, a line segment extraction mask that is long in the vertical direction is used, and the black pixel number extraction processing is performed with the line segment extraction mask in the target black-and-white inversion region. When the number of black pixels is small, that is, the number of white pixels is large. In this case, it can be seen that there is a black-and-white inverted character at that position, and the position cannot be divided into cells.
【0126】ここで、上述の短冊領域の白画素密度が所
定のスレッショルド値(thd5)より少ない場合、短
冊領域の白黒反転領域の輪郭セグメント化を行う(S1
3−4)。そして、上述のセル分割した各白黒反転領域
の輪郭セグメント表現と属性付与を行う(S13−
5)。If the white pixel density of the strip area is smaller than the predetermined threshold value (thd5), the contour segmentation of the black-and-white inverted area of the strip area is performed (S1).
3-4). Then, the contour segment expression and attribute assignment of each of the black and white reversal areas obtained by dividing the cells are performed (S13-).
5).
【0127】最後に、白黒反転領域の画素反転処理を行
う(S14)。尚、この処理は図3の画素反転部37が
行う処理である。図22はこの具体的処理を説明するフ
ローチャートである。先ず、白黒反転領域を分割した輪
郭セグメント内の塗りつぶし処理を行う(S14−
1)。次に、白黒反転領域の輪郭セグメント以外の領域
の白黒反転処理を行う(S14−2)。すなわち、上記
塗りつぶし手段によって白黒反転領域の輪郭部分を、例
えば黒色で塗りつぶして枠取りし、その中の白黒反転領
域に対してのみ反転処理を行うものである。例えば、図
19の例で説明すると、線分セグメント列a1〜a4、
b1、b2、c1〜c4、d1、d2を黒色で塗りつぶ
し、その中の白黒反転領域に対して白黒反転処理を行
う。Finally, pixel inversion processing of the black and white inversion area is performed (S14). Note that this process is a process performed by the pixel inversion unit 37 in FIG. FIG. 22 is a flow chart for explaining this specific processing. First, a filling process is performed in the contour segment obtained by dividing the black and white reversal area (S14-
1). Next, black-and-white inversion processing is performed on an area other than the contour segment of the black-and-white inversion area (S14-2). That is, the outline portion of the black-and-white reversal area is filled with, for example, black and framed by the filling means, and the reversal processing is performed only on the black-and-white reversal area. For example, in the example of FIG. 19, line segment segment columns a1 to a4,
b1, b2, c1 to c4, d1, and d2 are painted in black, and the black and white reversal region is subjected to black and white reversal processing.
【0128】以上のようにして、白黒反転領域に対する
白黒反転処理を行うと、白黒反転領域内の白抜き文字は
白黒反転し、黒印字となる。尚、図23は上述の白黒反
転処理により反転処理を行った後の状態を示す図であ
る。When the black-and-white inversion processing is performed on the black-and-white inversion area as described above, the white characters in the black-and-white inversion area are black-and-white inversion and black printing is performed. Note that FIG. 23 is a diagram showing a state after the inversion processing is performed by the above-mentioned black-and-white inversion processing.
【0129】以上のように本例の白黒反転領域識別装置
は水平方向に長い線分抽出マスクと、垂直方向に長い線
分抽出マスクを使用し、統合処理によって白黒反転候補
領域を設定し、白黒反転領域を識別するものであり、白
黒反転領域を正確に識別できる装置である。As described above, the black / white reversal area identification device of this embodiment uses the line segment extraction masks that are long in the horizontal direction and the line segment extraction masks that are long in the vertical direction. This is a device for identifying the inversion region, and is a device that can accurately identify the black and white inversion region.
【0130】尚、本例の白黒反転領域識別装置におい
て、白黒反転領域の決定に連結成分数を算出し、該連結
成分数が所定のスレッショルド値(thd4)以下の時
白黒反転領域と決定したが、本発明は必ずしも連結成分
数の算出、及び該連結成分数による決定処理を必要とす
るものではない。In the black-and-white inversion area identifying apparatus of this example, the number of connected components is calculated to determine the black-and-white inversion area, and when the number of connected components is equal to or less than the predetermined threshold value (thd4), it is determined to be the black-and-white inversion area. The present invention does not necessarily require the calculation of the number of connected components and the determination processing based on the number of connected components.
【0131】また、本例の説明では白黒反転領域の設定
に図4の処理(S9)を実行し、(重なっている部分の
面積)/垂直方向の白黒反転領域の面積を計算し、この
値とスレッショルド値(thd3)を比較する処理を行
って白黒反転領域の設定を行ったが、水平方向及び垂直
方向の白黒反転候補領域を輪郭線で囲い、当該領域を白
黒反転領域に設定してもよい。Further, in the explanation of this example, the process (S9) of FIG. 4 is executed to set the black and white reversal area, and the area of the (overlapped portion) / vertical black and white reversal area is calculated. And the threshold value (thd3) are compared with each other to set the black-and-white inversion area, but even if the black-and-white inversion candidate area in the horizontal direction and the vertical direction is surrounded by a contour line and the area is set as the black-and-white inversion area. Good.
【0132】また、水平方向の線分セグメント列を抽出
し、この線分セグメント列に対して垂直方向の罫線情報
を用い、水平方向の線分セグメント列と垂直方向の罫線
で仕切られた領域を白黒反転領域に設定してもよい。ま
た、必ずしも線分セグメント列を使用する必要はなく、
水平方向の白黒反転候補領域をそのまま使用し、水平方
向の白黒反転候補領域を垂直方向の罫線で仕切り、白黒
反転領域に設定してもよい。Further, a line segment segment row in the horizontal direction is extracted, and the ruled line information in the vertical direction is used for this line segment segment row to determine the area partitioned by the line segment segment row in the horizontal direction and the ruled line in the vertical direction. It may be set in the black and white inversion area. Also, it is not always necessary to use the line segment sequence,
The horizontal black-and-white inversion candidate area may be used as it is, and the horizontal black-and-white inversion candidate area may be partitioned by vertical ruled lines to be set as the black-and-white inversion area.
【0133】図24は上述の処理によって白黒反転領域
を設定する例である。すなわち、同図(a)は水平方向
の白黒反転候補領域、と、垂直方向の罫線’、
’で仕切られた領域を白黒反転領域に設定するもので
ある。また、同図(b)に示すもう1つの例は、水平方
向の白黒反転候補領域、が同じ長さである時、両白
黒反転領域、間を白黒反転領域と認定するものであ
る。このように構成することによっても白黒反転領域を
正確に抽出することができる。FIG. 24 is an example of setting the black and white reversal area by the above-mentioned processing. That is, FIG. 7A shows a horizontal black-and-white reversal candidate area and a vertical ruled line ',
The area separated by 'is set to the black and white inversion area. In another example shown in FIG. 9B, when the black and white inversion candidate areas in the horizontal direction have the same length, both black and white inversion areas are recognized as black and white inversion areas. With such a configuration, it is possible to accurately extract the black and white reversal area.
【0134】一方、上述とは逆に、垂直方向の線分セグ
メント列を抽出し、この線分セグメント列に対して水平
方向の罫線情報を用い、垂直方向の線分セグメント列と
水平方向の罫線で仕切られた領域を白黒反転領域に設定
しても良い。また、必ずしも線分セグメント列を使用す
る必要はなく、垂直方向の白黒反転候補領域をそのまま
使用し、水平方向の罫線で仕切り、白黒反転領域を設定
してもよい。
<第2の実施形態例>次に、本発明の第2の実施形態例
について説明する。On the other hand, contrary to the above, a vertical line segment segment string is extracted, and the horizontal ruled line information is used for this line segment segment string, and the vertical line segment segment string and the horizontal ruled line are used. The area partitioned by may be set as the black and white inversion area. Further, it is not always necessary to use the line segment segment row, and the black-and-white inversion candidate area in the vertical direction may be used as it is, and the black-and-white inversion area may be set by partitioning with horizontal ruled lines. <Second Embodiment> Next, a second embodiment of the present invention will be described.
【0135】尚、本例は上述の白黒反転領域識別装置に
よって白黒反転領が抽出され、当該領域に白黒反転処理
を施すと共に、当該白黒反転領域及び通常のセル内の文
字列に対して認識処理を行い、表全体の認識処理を行う
表認識装置である。In this example, the black-and-white inversion area identification device extracts a black-and-white inversion area, performs black-and-white inversion processing on the area, and performs recognition processing on the black-and-white inversion area and a character string in a normal cell. Is a table recognition device for performing the recognition process for the entire table.
【0136】尚、本例の処理もプログラムメモリ2に記
憶された表認識処理プログラムに従ってCPU1が実行
する。先ず、図25は本例の表認識装置によって認識の
対象となる帳票原稿の例を示す図である。本例の帳票は
ある会社の例えば社員リストであり、会社名、社員の性
別、電話番号、名前、担当等の項目が記載され、強調等
の必要のため所定の項目には白黒反転領域が設けられて
いる。The processing of this example is also executed by the CPU 1 according to the table recognition processing program stored in the program memory 2. First, FIG. 25 is a diagram showing an example of a form document to be recognized by the table recognition device of this example. The form of this example is, for example, a list of employees of a certain company, in which items such as company name, employee gender, telephone number, name, and person in charge are described. Has been.
【0137】この帳票原稿はスキャナー5で読みとら
れ、バス11を介して対応するイメージデータが画像メ
モリ3に格納される。そして、先ず水平方向に長い線分
抽出マスクを用いて線分抽出処理(S1)を行い、抽出
した線分に対して線分統合処理を行う(S2)。尚、垂
直方向に対しても、同時又は水平方向の処理が完了した
後、垂直方向に長い線分抽出マスクを用いて線分抽出処
理(S1’)が行われ、抽出した線分に対して線分統合
処理を行う(S2’)。また、この線分抽出、線分統合
処理は前述の図5及び図7のフローチャートに従って行
われ、白黒反転領域セル又は通常のセルを含む罫線の抽
出が行われる。This form original is read by the scanner 5, and the corresponding image data is stored in the image memory 3 via the bus 11. Then, first, line segment extraction processing (S1) is performed using a line segment extraction mask that is long in the horizontal direction, and line segment integration processing is performed on the extracted line segments (S2). In the vertical direction as well, after the simultaneous or horizontal processing is completed, a line segment extraction process (S1 ′) is performed using a line segment extraction mask that is long in the vertical direction, and the extracted line segment is processed. Line segment integration processing is performed (S2 '). Further, this line segment extraction and line segment integration processing is performed according to the flow charts of FIGS. 5 and 7 described above, and ruled lines including black and white inversion area cells or normal cells are extracted.
【0138】図26は、例えば上述の線分抽出、線分統
合の処理を行った後の状態の表認識結果である。同図に
示すように、白黒反転領域の一部に充分線分統合処理で
きない領域が存在する。すなわち、項目記載の中の「店
名」の記載の一部、「会社名」の記載の一部、等に確実
に線分統合できない箇所がある。尚、この箇所を同図に
T、U、V、Wで示す。この箇所は図25に示す元々の
原稿の状態で“かすれ”等が存在した箇所である。FIG. 26 shows a table recognition result in a state after the above-described line segment extraction and line segment integration processing, for example. As shown in the figure, a part of the black-and-white reversal region has a region where the line segment integration processing cannot be performed sufficiently. That is, there is a part where the line segment cannot be surely integrated in a part of the "store name", a part of the "company name", etc. in the item description. Incidentally, this portion is indicated by T, U, V and W in the same figure. This portion is a portion where "blurring" or the like exists in the original document state shown in FIG.
【0139】次に、上述のような“かすれ”の箇所に対
する処理として、孤立罫線抽出処理を行う(S6、S
6’)と、上述のような“かすれ”箇所は孤立罫線とし
て抽出される。図27は、例えば上述の処理により抽出
される孤立罫線の状態を表認識出力したと場合の出力結
果である。同図に示すように、上述のT、U、V、Wに
対応する箇所に孤立罫線が形成されている。尚、これら
の罫線を同図にT’、U’、V’、W’で示す。Next, an isolated ruled line extraction process is performed as a process for the above-mentioned "blurred" portion (S6, S).
6 ') and the above-mentioned "blurred" portion are extracted as isolated ruled lines. FIG. 27 shows an output result when the state of the isolated ruled line extracted by the above-described processing is table-recognized and output. As shown in the figure, isolated ruled lines are formed at the locations corresponding to T, U, V, and W described above. In addition, these ruled lines are shown by T ', U', V ', and W'in the same figure.
【0140】本例の表認識装置は上述のような孤立罫線
に対しては、孤立罫線と白黒反転候補領域の統合処理に
よって当該領域を全て白黒反転候補領域に補正する(S
7)。すなわち、図27の孤立罫線T’、U’、V’、
W’の左右には何れの場合でも白黒反転候補領域が存在
し、上述の統合処理(S7)によって上記孤立罫線
T’、U’、V’、W’は両側の白黒反転候補領域に統
合される。図28は、上述の処理により孤立罫線が白黒
反転候補領域に統合された状態を出力した結果である。The table recognition apparatus of this example corrects the isolated ruled line as described above into the black and white inversion candidate region by integrating the isolated ruled line and the black and white inversion candidate region (S).
7). That is, the isolated ruled lines T ′, U ′, V ′ of FIG.
In either case, there are black-and-white inversion candidate areas on the left and right sides, and the isolated ruled lines T ', U', V ', and W'are integrated into the black-and-white inversion candidate areas on both sides by the above-described integration processing (S7). It FIG. 28 shows a result of outputting the state in which the isolated ruled line is integrated with the black-and-white inversion candidate area by the above-described processing.
【0141】次に、水平/垂直の白黒反転候補領域の統
合処理(S8)、白黒反転領域内の連結成分の算出処理
(S9)、この結果に基づく白黒反転領域の決定処理
(S10)を行った後、決定した白黒反転領域に対する
輪郭セグメントを作成する(S11)。図29は、決定
した白黒反転領域に対して輪郭セグメントを形成した状
態を示す図である。Next, a horizontal / vertical black / white inversion candidate area integration process (S8), a connected component calculation process in the black / white inversion region (S9), and a black / white inversion region determination process (S10) based on the result are performed. After that, a contour segment is created for the determined black and white reversal area (S11). FIG. 29 is a diagram showing a state in which a contour segment is formed in the determined black-and-white inversion area.
【0142】さらに、図30は上記白黒反転領域内に含
まれるセル領域を抽出するため白黒反転領域内セル分割
処理(S13)を行って表認識出力した結果である。同
図に示すように、本例のセル分割処理は、例えば水平方
向に形成された白黒反転領域に対し、垂直方向の罫線4
0〜45を白黒反転領域内に延長し、セル分割を行うも
のであり、簡単に白黒反転領域内のセル領域を分割処理
できる。また、図30に該当する箇所は存在しないが、
白黒反転領域内のセル領域を分割する際、垂直方向の罫
線の延長線上に文字列があれば、垂直方向の線分抽出マ
スクを用いて黒画素数を検出するので簡単に分割箇所で
はないことを認識することができる。Further, FIG. 30 shows a result of performing table division processing (S13) in order to extract a cell area included in the black-and-white inversion area and performing table recognition output. As shown in the figure, in the cell division processing of this example, for example, a black-and-white inversion region formed in the horizontal direction is applied to a vertical ruled line 4
Cell division is performed by extending 0 to 45 into the black / white inversion area, and the cell area in the black / white inversion area can be easily divided. Although there is no part corresponding to FIG. 30,
When dividing the cell area in the black and white inversion area, if there is a character string on the extension of the vertical ruled line, the number of black pixels is detected using the vertical line segment extraction mask, so it is not a simple division Can be recognized.
【0143】以上のようにして白黒反転領域を抽出した
後、白黒反転処理(S14)を実行することによって白
黒反転領域内には反転処理が施される。図31は白黒反
転領域の中で、例えば「会社名」の項目領域を反転処理
した出力結果を示す。After the black-and-white inversion area is extracted as described above, the black-and-white inversion area is subjected to the inversion processing by executing the black-and-white inversion processing (S14). FIG. 31 shows an output result obtained by inverting the item area of “company name” in the black and white inversion area.
【0144】一方、上記白黒反転処理により反転処理さ
れた文字列には、線幅の異常が発生し易い。すなわち、
白黒反転処理により白抜き文字が正確に黒印字されず、
例えば線幅の極めて狭い箇所や逆に広い箇所が生じる。
そこで、本例の表認識装置はこの問題に対処すべく、文
字列の整形処理を行う。On the other hand, a line width is likely to be abnormal in the character string reversed by the black-and-white inversion process. That is,
Due to black and white reversal processing, white characters are not printed correctly in black,
For example, a part having a very narrow line width or a part having a wide line width is generated.
Therefore, the table recognition device of this example performs shaping processing of the character string in order to deal with this problem.
【0145】図32は画素反転処理後の文字列の整形処
理を説明するフローチャートである。以下、具体的に説
明する。先ず、領域内のパターンの水平方向の平均線幅
を算出する(ステップ(以下STで示す)1)。この算
出は水平方向に白ドットが黒ドットに変わる位置からド
ット数の計数を開始し、次に黒ドットが白ドットに変わ
る位置で計数を終了する。そして、その間に計数したド
ット数を水平方向の線幅とする。次に、垂直方向に対し
ても同様に行い、領域内のパターンの垂直方向の平均線
幅を算出する(ST2)。この算出も垂直方向に白ドッ
トが黒ドットに変わる位置からドット数の計数を開始
し、次に黒ドットが白ドットに変わる位置で計数を終了
する。そして、その間に計数したドット数を垂直方向の
線幅とする。そして、上述の処理を複数回行った結果に
対してパターンの平均線幅を算出する((水平+垂直)
/2)(ST3)。FIG. 32 is a flow chart for explaining the character string shaping processing after the pixel inversion processing. The details will be described below. First, the average line width in the horizontal direction of the pattern in the area is calculated (step (hereinafter referred to as ST) 1). In this calculation, the counting of the number of dots is started from the position where the white dot changes to the black dot in the horizontal direction, and the counting is ended at the position where the black dot changes to the white dot next. Then, the number of dots counted during that time is set as the line width in the horizontal direction. Next, the same is done in the vertical direction, and the average line width in the vertical direction of the pattern in the region is calculated (ST2). Also in this calculation, the counting of the number of dots is started from the position where the white dot is changed to the black dot in the vertical direction, and the counting is ended at the position where the black dot is changed to the white dot next. Then, the number of dots counted during that time is taken as the line width in the vertical direction. Then, the average line width of the pattern is calculated for the result of performing the above-mentioned processing a plurality of times ((horizontal + vertical)).
/ 2) (ST3).
【0146】その後、上述の様にして求めた白黒反転処
理後の文字(列)の平均線幅を所定のスレッショルド値
(thw)と比較する(ST4)。そして、平均線幅が
所定のスレッショルド値(thw)以下であると判断す
る時(ST4が<thw)、膨張処理を行う(ST
5)。一方、文字(列)の平均線幅が所定のスレッショ
ルド値(thw)以上であると判断する時(ST4が>
thw)、収縮処理を行う(ST6)。すなわち、反転
した文字(列)の平均線幅がスレッショルド値(th
w)より狭い場合には膨張処理を行い、線幅が太い場合
には収縮処理を行い、反転処理後の文字(列)の整形を
行う。After that, the average line width of the character (column) after the black-and-white reversal processing obtained as described above is compared with a predetermined threshold value (thw) (ST4). When it is determined that the average line width is less than or equal to the predetermined threshold value (thw) (ST4 is <thw), expansion processing is performed (ST
5). On the other hand, when it is determined that the average line width of a character (column) is equal to or larger than a predetermined threshold value (thw) (ST4 is>
thw) and contraction processing (ST6). That is, the average line width of the reversed character (column) is the threshold value (th
If it is narrower than w), the expansion process is performed, if the line width is thick, the contraction process is performed, and the character (column) after the inversion process is shaped.
【0147】以上のようにして、反転処理後の文字
(列)に対する整形処理を行った後、セル領域抽出23
を実行するが、その際本例の表認識装置では既に白黒反
転領域抽出処理の際、罫線抽出と白黒反転領域に対応す
る線分セグメント列には属性が付加されているため容易
に白黒反転領域セルを囲む罫線か、又は通常セルを囲む
罫線か区別することができる。As described above, the cell area extraction 23 is performed after the shaping processing is performed on the character (string) after the inversion processing.
At this time, the table recognition apparatus of this example has already added the attributes to the line segment segments corresponding to the ruled line extraction and the black-and-white inversion area during the black-and-white inversion area extraction processing. It is possible to distinguish between a ruled line surrounding a cell and a ruled line surrounding a normal cell.
【0148】例えば、図33は上述の内容を具体的に説
明する図である。上述のように白黒反転領域に対応する
線分セグメント列には上下、左右の属性は付加されてい
るので各線分セグメント(列)が白黒反転領域のどの位
置に対応するか容易に判断できる。例えば、同図に示す
ように線分セグメント列の上下の属性に囲まれた領域は
白黒反転領域であり、上下の属性が逆の線分セグメント
列に囲まれた領域は通常のセル領域となる。For example, FIG. 33 is a diagram for specifically explaining the above contents. As described above, since the vertical and horizontal attributes are added to the line segment segment row corresponding to the black / white inversion area, it is possible to easily determine which position in the black / white inversion area each line segment (row) corresponds to. For example, as shown in the figure, the area surrounded by the upper and lower attributes of the line segment segment row is a black-and-white inverted area, and the area surrounded by the line segment segment rows having the opposite upper and lower attributes is a normal cell area. .
【0149】以上の処理の後、各セル内の文字列に対す
る認識処理を行い、帳票フォームと共に文字列に対する
認識結果を含む表出力を行う。尚、前述の図30は最終
的な本例の表認識装置の出力結果でもある。After the above processing, the character string in each cell is recognized, and the table form including the recognition result for the character string is output together with the form form. Note that FIG. 30 described above is also the final output result of the table recognition device of this example.
【0150】[0150]
【発明の効果】以上説明したように本発明によれば、以
下の効果が得られる。すなわち、本発明の白黒反転領域
識別装置によれば、一つのセル内の一部に白黒反転領域
が存在する場合でも正確にその領域を識別することがで
きる。また、白黒反転領域内に大きいサイズの反転文字
が存在する場合でも、本発明で使用する線分抽出マスク
は極めて細く比較的短いマスクを使用するので白黒反転
領域を正確に識別することができる。さらに、表画像が
傾いて読み出された場合でも、狭い範囲の黒画素数を認
識しつつ統合処理により白黒反転領域を識別するので、
傾斜のある状態の白黒反転領域として認識できる。As described above, according to the present invention, the following effects can be obtained. That is, according to the black / white inverted area identifying device of the present invention, even if a black / white inverted area exists in a part of one cell, the area can be accurately identified. Further, even when a large-sized inverted character exists in the black-and-white inversion area, the line segment extraction mask used in the present invention uses an extremely thin and relatively short mask, so that the black-and-white inversion area can be accurately identified. Further, even when the front image is read with a tilt, since the black-and-white inversion area is identified by the integration process while recognizing the number of black pixels in a narrow range,
It can be recognized as a black-and-white reversal region with a slope.
【0151】また、本発明の一態様によれば、白黒反転
領域に例えば“かすれ”等が存在する場合でも、孤立罫
線処理により救済するため、白黒反転領域を正確に識別
することができる。Further, according to one aspect of the present invention, even if there is, for example, "blurring" in the black and white reversal area, the black and white reversal area can be accurately identified because it is repaired by the isolated ruled line processing.
【0152】また、本発明の一態様によれば、作成され
た線分セグメント列の白黒反転領域に対する位置が明確
になり、例えば白黒反転領域と通常のセル領域を区別す
る際、容易に行うことができる。Further, according to one aspect of the present invention, the position of the created line segment segment sequence with respect to the black-and-white inversion area is clarified, which can be easily performed when distinguishing the black-and-white inversion area from the normal cell area, for example. You can
【0153】また、本発明の一態様によれば、白黒反転
領域を例えば短冊状に分割して水平方向又は垂直方向の
罫線によって仕切られた領域をセル領域とするので、簡
単に白黒反転領域内をセル分割することができる。Further, according to one aspect of the present invention, the black-and-white inversion area is divided into, for example, strips, and the area partitioned by the ruled lines in the horizontal direction or the vertical direction is used as the cell area. Can be divided into cells.
【0154】本発明の表認識装置によれば、一つのセル
内の一部に白黒反転領域が存在する場合でも反転領域を
正確に識別することができ、白黒反転領域内に大きいサ
イズの反転文字が存在する場合でも、その領域を正確に
識別することができ、表画像が傾いて読み出された場合
でも白黒反転領域を正確に識別することができる。According to the table recognition apparatus of the present invention, even if a black-and-white inversion area exists in a part of one cell, the inversion area can be accurately identified, and a large-sized inversion character can be identified in the black-and-white inversion area. Even if the image exists, the area can be accurately identified, and the black-and-white inversion area can be accurately identified even when the front image is read with an inclination.
【0155】また、本発明によれば、処理プログラムを
ハードディスク、ICメモリカード、磁気テープ、フロ
ッピーディスク、又は光ディスクなどの記憶媒体に記憶
し、必要に応じて読み出し白黒反転領域の識別、表認識
処理を行うことができる。Further, according to the present invention, the processing program is stored in a storage medium such as a hard disk, an IC memory card, a magnetic tape, a floppy disk, or an optical disk, and is read out as necessary to identify the black / white inverted area and to perform the table recognition processing. It can be performed.
【図1】本実施形態例の白黒反転領域認識装置を含む表
認識装置のシステム構成図である。FIG. 1 is a system configuration diagram of a table recognition device including a black-and-white inverted region recognition device according to the present embodiment.
【図2】CPUが行う認識処理を説明する図である。FIG. 2 is a diagram illustrating a recognition process performed by a CPU.
【図3】CPUが行う処理を具体的に説明するシステム
構成図であるFIG. 3 is a system configuration diagram specifically describing a process performed by a CPU.
【図4】第1の実施形態例の処理を説明するフローチャ
ートである。FIG. 4 is a flowchart illustrating processing of the first embodiment example.
【図5】線分抽出処理(S1)を具体的に説明するフロ
ーチャートである。FIG. 5 is a flowchart specifically explaining a line segment extraction process (S1).
【図6】m×n(縦×横)が1×6の画素(ドット)の
領域を指定する線分抽出マスクにより、水平方向成分を
抽出する場合を説明するものである。FIG. 6 illustrates a case where a horizontal direction component is extracted by a line segment extraction mask designating a pixel (dot) area in which m × n (vertical × horizontal) is 1 × 6.
【図7】線分統合処理を具体的に説明するフローチャー
トである。FIG. 7 is a flowchart specifically illustrating a line segment integration process.
【図8】線分統合処理の結果を示す図である。FIG. 8 is a diagram showing a result of line segment integration processing.
【図9】線分統合処理の結果を示す図である。FIG. 9 is a diagram showing a result of line segment integration processing.
【図10】罫線抽出処理のフローチャートである。FIG. 10 is a flowchart of ruled line extraction processing.
【図11】孤立罫線抽出処理を説明するフローチャート
である。FIG. 11 is a flowchart illustrating isolated ruled line extraction processing.
【図12】孤立罫線と白黒反転候補領域の統合処理を具
体的に説明するフローチャートである。FIG. 12 is a flowchart specifically illustrating a process of integrating an isolated ruled line and a black and white inversion candidate area.
【図13】水平/垂直の白黒反転候補領域の統合処理を
具体的に説明するフローチャートである。FIG. 13 is a flowchart specifically illustrating a process of integrating horizontal / vertical white / black inversion candidate regions.
【図14】水平/垂直の白黒反転候補領域の統合処理を
説明する図である。FIG. 14 is a diagram illustrating a process of integrating horizontal / vertical black / white inversion candidate regions.
【図15】連結成分の算出処理を具体的に説明するフロ
ーチャートである。FIG. 15 is a flowchart specifically illustrating a process of calculating a connected component.
【図16】白黒反転領域決定のフローチャートである。FIG. 16 is a flowchart for determining a black / white reversal area.
【図17】黒印字部は背景の黒部1個と、文字列「会社
名」に含まれる独立の黒印字部(例えば6個)の合計7
個の連結成分数を説明する図である。FIG. 17 shows a total of 7 black print parts including one black part in the background and independent black print parts (for example, 6) included in the character string “company name”.
It is a figure explaining the number of individual connected components.
【図18】白黒反転領域の輪郭セグメント表現を行う処
理を具体的に説明するフローチャートである。FIG. 18 is a flowchart specifically illustrating a process of expressing a contour segment of a black and white reversal region.
【図19】抽出する領域(線分)がずれて抽出される例
を説明する図であるFIG. 19 is a diagram illustrating an example in which an area (line segment) to be extracted is displaced and extracted.
【図20】白黒反転領域の属性付与処理を具体的に示す
フローチャートである。FIG. 20 is a flowchart specifically showing the attribute assigning process for the black and white reversal region.
【図21】白黒反転領域内セル分割のフローチャートで
ある。FIG. 21 is a flowchart of cell division in the black-and-white inversion area.
【図22】白黒反転領域の画素反転処理を説明するフロ
ーチャートである。FIG. 22 is a flowchart illustrating pixel inversion processing in a black / white inversion area.
【図23】白黒反転処理により反転処理を行った後の状
態を示す図である。FIG. 23 is a diagram showing a state after performing inversion processing by black-and-white inversion processing.
【図24】白黒反転領域を設定する例である。FIG. 24 is an example of setting a black / white inversion area.
【図25】第2の実施形態例を説明する表認識の対象と
なる帳票原稿の例を示す図である。FIG. 25 is a diagram illustrating an example of a form document that is a target of table recognition for explaining the second embodiment.
【図26】線分抽出、線分統合の処理を行った後の状態
で表認識出力したと仮定した場合の本例の表認識装置か
らの出力結果である罫線抽出処理のフローチャートであ
る。FIG. 26 is a flowchart of ruled line extraction processing which is an output result from the table recognition apparatus of this example, assuming that the table recognition output is performed after the line segment extraction and line segment integration processing is performed.
【図27】抽出される孤立罫線の状態を表認識出力した
と場合の出力結果である。FIG. 27 is an output result when the state of the extracted isolated ruled line is output by table recognition.
【図28】孤立罫線が白黒反転候補領域に統合された状
態を出力した結果である。FIG. 28 is a result of outputting a state in which an isolated ruled line is integrated into a white / black inversion candidate area.
【図29】決定した白黒反転領域に対して輪郭セグメン
トを形成した状態を示す図である。FIG. 29 is a diagram showing a state in which a contour segment is formed in the determined black-and-white inversion area.
【図30】白黒反転領域内に含まれるセル領域を抽出す
るため白黒反転領域内セル分割処理を行って表認識出力
した結果である。FIG. 30 shows a result of table recognition output after performing cell division processing in the black and white inversion area to extract a cell area included in the black and white inversion area.
【図31】白黒反転領域の中で、例えば「会社名」の項
目領域を反転処理した出力結果を示す図である。FIG. 31 is a diagram showing an output result obtained by inverting the item area of “company name” in the black and white inversion area.
【図32】画素反転処理後の文字列の整形処理を説明す
るフローチャートである。FIG. 32 is a flowchart illustrating a shaping process of a character string after the pixel inversion process.
【図33】白黒反転領域セルを囲む罫線か、又は通常セ
ルを囲む罫線か容易に区別できることを説明する図であ
る。FIG. 33 is a diagram illustrating that a ruled line surrounding a black / white reversal region cell or a ruled line surrounding a normal cell can be easily distinguished.
【図34】従来例の表認識システムを説明する図であ
る。FIG. 34 is a diagram illustrating a conventional table recognition system.
【図35】(a)はランの構成を説明する図であり、
(b)は白黒反転領域を説明する図であり、(c)は白
黒反転領域内の全ての領域が白黒反転領域ではないこと
を示す図である。FIG. 35 (a) is a diagram illustrating a run configuration;
(B) is a figure explaining a black-and-white inversion area, (c) is a figure which shows that all the areas in a black-and-white inversion area are not a black-and-white inversion area.
1 中央演算処理ユニット(CPU) 2 プログラムメモリ 3 画像メモリ 4 ワークメモリ 5 スキャナ 6 メモリ 7 辞書ファイル 8 ディスプレイ 9 プリンタ 10 インターフェイス回路 11 バス 12 ドライバ 13 ハードディスク 14 ICメモリカード 15 磁気テープ 16 フロッピーディスク 17 光ディスク 19 通信インターフェイス 20 画像入力 21 線分抽出 22 白黒反転領域抽出 23 セル領域抽出 24 セル内項目抽出 25 文字認識 30 画像入力部 31 画像領域格納部 32 線分抽出部 33 線分統合部 34 罫線抽出部 35 白黒反転領域決定部 36 白黒反転領域内セル決定部 37 画素反転部 40〜45 罫線 1 Central processing unit (CPU) 2 Program memory 3 image memory 4 work memory 5 scanner 6 memory 7 dictionary file 8 display 9 Printer 10 Interface circuit 11 bus 12 drivers 13 hard disk 14 IC memory card 15 magnetic tape 16 floppy disks 17 Optical disc 19 Communication interface 20 image input 21 Line segment extraction 22 Black and white reversal area extraction 23 Cell area extraction 24 Cell item extraction 25 character recognition 30 Image input section 31 Image area storage 32 line segment extractor 33 Line segment integration section 34 Ruled Line Extraction Unit 35 Black / white reversal area determination unit 36 Cell determination unit in black and white reversal area 37 Pixel inversion section 40-45 ruled lines
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/82 G06F 17/21 G06F 19/00 ─────────────────────────────────────────────────── ─── Continuation of the front page (58) Fields surveyed (Int.Cl. 7 , DB name) G06K 9/00-9/82 G06F 17/21 G06F 19/00
Claims (30)
平方向に長い線分抽出マスクを用いて水平方向に走査
し、垂直方向に長い線分抽出マスクを用いて垂直方向に
走査し、黒画素密度が所定の閾値より高い領域をそれぞ
れ抽出する領域抽出手段と、 該領域抽出手段で抽出した前記黒画素密度の高い領域を
それぞれのマスク走査方向に直交する方向で統合する第
1の統合手段と、 該第1の統合手段で統合した領域の線幅が所定の閾値以
上であれば白黒反転候補領域であるとし、該白黒反転候
補領域をそれぞれのマスク走査方向に統合する第2の統
合手段と、 該第2の統合手段で統合した白黒反転候補領域の輪郭に
対し、水平方向及び垂直方向の線分セグメント列を作成
する線分セグメント列作成手段と、 該線分セグメント列作成手段で作成された水平方向の線
分セグメント列と垂直方向の線分セグメント列で囲まれ
た領域を白黒反転領域に設定する白黒反転領域設定手段
と、 を備えたことを特徴とする白黒反転領域識別装置。1. The tabular binary image data is horizontally scanned using a line segment extraction mask long in the horizontal direction, and vertically scanned using a line segment extraction mask long in the vertical direction to obtain black. Area extracting means for extracting areas each having a pixel density higher than a predetermined threshold value, and first integrating means for integrating the areas having a high black pixel density extracted by the area extracting means in a direction orthogonal to each mask scanning direction. Second integration means for integrating the black and white inversion candidate areas into respective mask scanning directions if the line width of the areas integrated by the first integration means is equal to or larger than a predetermined threshold value. And a line segment segment string creating means for creating horizontal and vertical line segment segment strings for the outline of the black and white reversal candidate area integrated by the second integrating means, and the line segment segment string creating means. Tone reversal region identification apparatus characterized by comprising: a tone reversal region setting means for setting a region surrounded by horizontal line segments rows and vertical line segment row in tone reversal region, the.
平方向に長い線分抽出マスクを用いて水平方向に走査
し、垂直方向に長い線分抽出マスクを用いて垂直方向に
走査し、黒画素密度が所定の閾値より高い領域をそれぞ
れ抽出する領域抽出手段と、 該領域抽出手段で抽出した前記黒画素密度の高い領域を
それぞれのマスク走査方向に直交する方向で統合する第
1の統合手段と、 該第1の統合手段で統合した領域の線幅が所定の閾値以
上であれば白黒反転候補領域であるとし、該白黒反転候
補領域をそれぞれのマスク走査方向に統合する第2の統
合手段と、 該第2の統合手段で統合した水平方向の白黒反転候補領
域と垂直方向の白黒反転候補領域の重なり状態により白
黒反転領域を設定する白黒反転領域設定手段と、 を備えたことを特徴とする白黒反転領域識別装置。2. A tabular binary image data is scanned horizontally using a line segment extraction mask long in the horizontal direction, and vertically scanned using a line segment extraction mask long in the vertical direction to obtain black. Area extracting means for extracting areas each having a pixel density higher than a predetermined threshold value, and first integrating means for integrating the areas having a high black pixel density extracted by the area extracting means in a direction orthogonal to each mask scanning direction. Second integration means for integrating the black and white inversion candidate areas into respective mask scanning directions if the line width of the areas integrated by the first integration means is equal to or larger than a predetermined threshold value. And a black and white reversal area setting means for setting the black and white reversal area according to the overlapping state of the horizontal direction black and white reversal candidate area and the vertical direction black and white reversal candidate area integrated by the second integrating means. That black-and-white inversion region identification device.
幅が所定の閾値以下であると判断するとき、前記第1の
統合手段で統合した領域を罫線であると判断する罫線判
断手段を有することを特徴とする請求項1又は2記載の
白黒反転領域識別装置。3. A ruled line determining means for determining that the area integrated by the first integrating means is a ruled line when the line width of the area integrated by the first integrating means is less than or equal to a predetermined threshold value. The black-and-white reversal area identification device according to claim 1 or 2, further comprising:
ぞれのマスク走査方向に統合して罫線を作成する罫線作
成手段を有することを特徴とする請求項3記載の白黒反
転領域識別装置。4. The black-and-white reversal area identifying device according to claim 3, further comprising ruled line creating means for creating ruled lines by integrating the ruled lines judged by the ruled line judging means in respective mask scanning directions.
成する場合、前記線分セグメント列作成手段で作成した
水平方向の線分セグメント列と、前記垂直方向の罫線間
で囲まれた領域を白黒反転領域とすることを特徴とする
請求項4記載の白黒反転領域識別装置。5. When the ruled line creating unit creates a vertical ruled line, a region surrounded by the horizontal line segment segments created by the line segment segment string creating unit and the vertical ruled line is created. The black-and-white inversion area identifying device according to claim 4, wherein the black-and-white inversion area is defined.
成する場合、前記線分セグメント列作成手段で作成した
垂直方向の線分セグメント列と、前記水平方向の罫線間
で囲まれた領域を白黒反転領域とすることを特徴とする
請求項4記載の白黒反転領域識別装置。6. When the ruled line creating unit creates a horizontal ruled line, a vertical line segment segment string created by the line segment segment string creating unit and an area surrounded by the horizontal ruled lines are created. The black-and-white inversion area identifying device according to claim 4, wherein the black-and-white inversion area is defined.
るマージンが、前記線分セグメント列に付加されている
ことを特徴とする請求項1、又は5、又は6記載の白黒
反転領域識別装置。7. The black-and-white inverted area identifying device according to claim 1, wherein a margin for absorbing irregularities of the contour of the black-and-white inverted area is added to the line segment segment sequence. .
数が所定の閾値以下であるとき、白黒反転領域の設定を
行うことを特徴とする請求項1又は2記載の白黒反転領
域識別装置。8. The black-and-white inversion area identifying device according to claim 1, wherein the black-and-white inversion area setting means sets the black-and-white inversion area when the number of connected components is equal to or less than a predetermined threshold value.
該算出手段で算出した連結成分数が所定の閾値以下であ
ることを識別する識別手段とを有することを特徴とする
請求項8記載の白黒反転領域識別装置。9. A calculation means for calculating the number of connected components,
9. The black-and-white reversal area identifying device according to claim 8, further comprising: identifying means for identifying that the number of connected components calculated by the calculating means is less than or equal to a predetermined threshold value.
た罫線候補の周辺に前記白黒反転候補領域が存在する
時、前記孤立した罫線候補も白黒反転候補領域に統合す
る孤立罫線統合手段をさらに有することを特徴とする請
求項1又は2記載の白黒反転領域識別装置。10. An isolated ruled line integrating means for extracting an isolated ruled line candidate, and integrating the isolated ruled line candidate also with the black and white inversion candidate region when the black and white inversion candidate region exists around the isolated ruled line candidate. The black-and-white reversal area identification device according to claim 1 or 2, further comprising:
領域と罫線領域を区別する手段を備え、罫線抽出処理後
に白黒反転領域を抽出することを特徴とする請求項10
記載の白黒反転領域識別装置。11. The extraction of the isolated ruled line candidate is provided with a means for distinguishing a character region and a ruled line region, and a black and white inverted region is extracted after the ruled line extraction processing.
The black and white reversal area identification device described.
グメント列が白黒反転領域であることを示す属性が付加
されていることを特徴とする請求項1記載の白黒反転領
域識別装置。12. The white / black inverted area identifying device according to claim 1, wherein an attribute indicating that the line segment segment string is a black / white inverted area is added to the line segment segment string.
領域に対する前記線分セグメント列の位置が、上下又は
左右の辺の位置情報として付加されていることを特徴と
する請求項12記載の白黒反転領域識別装置。13. The monochrome according to claim 12, wherein the position of the line segment segment with respect to the black-and-white reversal region is added to the line segment segment sequence as position information of upper and lower sides or left and right sides. Inversion area identification device.
置情報が、前記線分セグメント列に付加された上下又は
左右の辺の位置情報と同じ場合には白黒反転セル領域と
判断し、異なる場合には通常のセル領域と判断すること
を特徴とする請求項13記載の白黒反転領域識別装置。14. When analyzing the cell structure of the table, if the position information of the cell is the same as the position information of the upper and lower sides or the left and right sides added to the line segment sequence, it is determined to be a black and white inverted cell region. 14. The black-and-white reversal area identification device according to claim 13, wherein if it is different, it is determined as a normal cell area.
り成る場合、前記白黒反転領域に接続する罫線を延長し
て白黒反転領域内の前記セル領域を抽出することを特徴
とする請求項1又は2記載の白黒反転領域識別装置。15. The cell area in the black / white inversion area is extracted by extending a ruled line connected to the black / white inversion area when the black / white inversion area includes a plurality of cell areas. Alternatively, the black-and-white reversal area identification device described in item 2.
際、白黒反転領域に接続する罫線を延長した領域を細分
割して黒画素密度を求める手段を有することを特徴とす
る請求項15記載の白黒反転領域識別装置。16. The method according to claim 15, further comprising means for obtaining a black pixel density by subdividing an area in which a ruled line connected to the black-and-white inversion area is extended when the cells in the black-and-white inversion area are divided. Black and white inversion area identification device.
水平方向に長い線分抽出マスクを用いて水平方向に走査
し、垂直方向に長い線分抽出マスクを用いて垂直方向に
走査し、黒画素密度が所定の閾値より高い領域をそれぞ
れ抽出する領域抽出手段と、該領域抽出手段で抽出した
前記黒画素密度の高い領域をそれぞれのマスク走査方向
に直交する方向で統合する第1の統合手段と、該第1の
統合手段で統合した領域の線幅が所定の閾値以上であれ
ば白黒反転候補領域であるとし、該白黒反転候補領域を
それぞれのマスク走査方向に統合する第2の統合手段
と、該第2の統合手段で統合した白黒反転候補領域の輪
郭に対し、水平方向及び垂直方向の線分セグメント列を
作成する線分セグメント列作成手段と、該線分セグメン
ト列作成手段で作成した水平方向の線分セグメント列と
垂直方向の線分セグメント列で囲まれた領域を白黒反転
領域に設定する白黒反転領域設定手段とを備えた白黒反
転領域識別部と、 該白黒反転領域認識部により識別された白黒反転領域に
対し、白黒反転処理を施す白黒反転処理手段と、 該白黒反転処理手段によって反転処理された領域に位置
する文字列に対して認識処理を行う認識手段と、 を有することを特徴とする表認識装置。17. A binary image data in a tabular format,
Region extraction that scans in the horizontal direction using a line segment extraction mask that is long in the horizontal direction and in the vertical direction using a line segment extraction mask that is long in the vertical direction, and that extracts regions in which the black pixel density is higher than a predetermined threshold. Means, first integrating means for integrating the areas with high black pixel density extracted by the area extracting means in a direction orthogonal to each mask scanning direction, and line width of the areas integrated by the first integrating means Is greater than or equal to a predetermined threshold value, it is determined to be a black-and-white inversion candidate area, and the black-and-white inversion candidate area is integrated in each mask scanning direction, and the black-and-white inversion candidate area integrated by the second integration means. Line segment segment creating means for creating line segment segments in the horizontal and vertical directions with respect to the contour of the line segment, and a line segment segment in the horizontal direction and vertical line segment segment created by the line segment segment creating means. The black-and-white inversion area identifying section having a black-and-white inversion area setting means for setting the area surrounded by the column and the black-and-white inversion area, and the black-and-white inversion area for the black-and-white inversion area identified by the black-and-white inversion area recognition section. A table recognition device comprising: a black-and-white inversion processing means for performing the recognition processing; and a recognition means for performing a recognition processing for a character string located in the area subjected to the inversion processing by the black-and-white inversion processing means.
水平方向に長い線分抽出マスクを用いて水平方向に走査
し、垂直方向に長い線分抽出マスクを用いて垂直方向に
走査し、黒画素密度が所定の閾値より高い領域をそれぞ
れ抽出する領域抽出手段と、該領域抽出手段で抽出した
前記黒画素密度の高い領域をそれぞれのマスク走査方向
に直交する方向で統合する第1の統合手段と、該第1の
統合手段で統合した領域の線幅が所定の閾値以上であれ
ば白黒反転候補領域であるとし、該白黒反転候補領域を
それぞれのマスク走査方向に統合する第2の統合手段
と、該第2の統合手段で統合した水平方向の白黒反転候
補領域と垂直方向の白黒反転候補領域の重なり状態によ
り白黒反転領域を設定する白黒反転領域設定手段とを備
えた白黒反転領域識別部と、 該白黒反転領域認識部により識別された白黒反転領域に
対し、白黒反転処理を行う白黒反転処理手段と、 該白黒反転処理手段によって反転処理された領域に位置
する文字列に対して認識処理を行う認識手段と、 を有することを特徴とする表認識装置。18. A table format binary image data,
Region extraction that scans in the horizontal direction using a line segment extraction mask that is long in the horizontal direction and in the vertical direction using a line segment extraction mask that is long in the vertical direction, and that extracts regions in which the black pixel density is higher than a predetermined threshold. Means, first integrating means for integrating the areas with high black pixel density extracted by the area extracting means in a direction orthogonal to each mask scanning direction, and line width of the areas integrated by the first integrating means Is greater than or equal to a predetermined threshold value, it is determined to be a black-and-white inversion candidate area, and the black-and-white inversion candidate area is integrated in each mask scanning direction, and the horizontal black and white integrated by the second integration means. A black-and-white inversion area identifying section having a black-and-white inversion area setting means for setting the black-and-white inversion area according to the overlapping state of the inversion candidate area and the black-and-white inversion candidate area in the vertical direction, and the black-and-white inversion area identification section identified by the black-and-white inversion area identifying section. A white area inversion processing means for performing a black and white inversion processing on the transposed area, and a recognition means for performing a recognition processing for a character string located in the area inverted by the black and white inversion processing means. Table recognizer.
転領域の輪郭セグメントを塗りつぶす塗りつぶし手段
と、前記輪郭セグメント列以外の白黒反転領域を白黒反
転する処理手段を具備することを特徴とする請求項17
記載の表認識装置。19. The black-and-white reversal processing means comprises: a filling means for filling a contour segment of the black-and-white reversal area, and a processing means for black-and-white reversal of a black-and-white reversal area other than the contour segment string. 17
The described table recognition device.
て分割された領域を塗りつぶすセル領域塗りつぶし手段
を有することを特徴とする請求項19記載の表認識装
置。20. The table recognition device according to claim 19, wherein the black and white reversal processing means has a cell area filling means for filling an area divided by cells.
理された白黒反転領域に位置する文字列の線幅を算出
し、該算出した線幅に従って前記文字列を膨張又は収縮
処理し、前記文字列を整形することを特徴とする請求項
17又は18記載の表認識装置。21. A line width of a character string located in a black and white reversal region subjected to the reversal process by the black and white reversal processing means is calculated, and the character string is expanded or contracted according to the calculated line width to obtain the character string. 19. The table recognition device according to claim 17, which is shaped.
分数が所定の閾値以下である場合、白黒反転領域の設定
を行うことを特徴とする請求項17又は18記載の表認
識装置。22. The table recognition device according to claim 17, wherein the black / white inversion area setting means sets the black / white inversion area when the number of connected components is equal to or less than a predetermined threshold value.
を抽出し、該孤立した罫線候補の周辺に前記白黒反転候
補領域が存在する時、前記孤立した罫線候補も白黒反転
候補領域に統合する孤立罫線統合手段を有することを特
徴とする請求項17又は18記載の表認識装置。23. The area extracting means extracts an isolated ruled line candidate, and when the black / white inversion candidate area exists around the isolated ruled line candidate, the isolated ruled line candidate is also integrated into the black / white inversion candidate area. 19. The table recognition device according to claim 17, further comprising ruled line integrating means.
グメント列が白黒反転領域であることを示す属性が付加
されていることを特徴とする請求項17記載の表認識装
置。24. The table recognizing apparatus according to claim 17, wherein an attribute indicating that the line segment segment string is a black-and-white inverted area is added to the line segment segment string.
り成る場合、前記白黒反転領域に接続する罫線を延長し
て白黒反転領域内の前記セル領域を抽出することを特徴
とする請求項17又は18記載の表認識装置。25. When the black-and-white inversion area is composed of a plurality of cell areas, the ruled line connecting to the black-and-white inversion area is extended to extract the cell area in the black-and-white inversion area. Alternatively, the table recognition device according to item 18.
際、白黒反転領域に接続する罫線を延長した領域を細分
割して黒画素密度を求める手段を有することを特徴とす
る請求項25記載の表認識装置。26. When dividing cells in the black-and-white inversion area, there is provided means for obtaining a black pixel density by subdividing an area in which a ruled line connected to the black-and-white inversion area is extended. Table recognition device.
水平方向に長い線分抽出マスクを用いて水平方向に走査
し、垂直方向に長い線分抽出マスクを用いて垂直方向に
走査し、黒画素密度が所定の閾値より高い領域をそれぞ
れ抽出する機能と、 該機能で抽出した前記黒画素密度の高い領域をそれぞれ
のマスク走査方向に直交する方向で統合する機能と、 該機能で統合した領域の線幅が所定の閾値以上であれば
白黒反転候補領域であるとし、該白黒反転候補領域をそ
れぞれのマスク走査方向に統合する機能と、 該機能で統合した白黒反転候補領域の輪郭に対し、水平
方向及び垂直方向の線分セグメント列を作成する機能
と、 該機能で作成された水平方向の線分セグメント列と垂直
方向の線分セグメント列で囲まれた領域を白黒反転領域
に設定する機能と、 をコンピュータに実行させる命令を含むプログラムを格
納した前記コンピュータが読み取り可能な記憶媒体。27. For binary image data in tabular form,
With a function to scan in the horizontal direction using a long line segment extraction mask in the horizontal direction, and to scan in the vertical direction using a long line segment extraction mask in the vertical direction, and to extract each area in which the black pixel density is higher than a predetermined threshold value. A function of integrating the areas with high black pixel density extracted by the function in a direction orthogonal to each mask scanning direction, and a black-and-white reversal candidate area if the line width of the area integrated by the function is a predetermined threshold or more And a function of integrating the black-and-white inversion candidate area in each mask scanning direction, and a function of creating horizontal and vertical line segment segments for the outline of the black-and-white inversion candidate area integrated by the function. , A function of setting an area surrounded by the horizontal line segment segment row and the vertical line segment segment row created by the function as a black / white inversion area, and an instruction for causing a computer to execute The computer-readable storage medium storing the program.
水平方向に長い線分抽出マスクを用いて水平方向に走査
し、垂直方向に長い線分抽出マスクを用いて垂直方向に
走査し、黒画素密度が所定の閾値より高い領域をそれぞ
れ抽出する機能と、 該機能で抽出した前記黒画素密度の高い領域をそれぞれ
のマスク走査方向に直交する方向で統合する機能と、 該機能で統合した領域の線幅が所定の閾値以上であれば
白黒反転候補領域であるとし、該白黒反転候補領域をそ
れぞれのマスク走査方向に統合する機能と、 該機能で統合した水平方向の白黒反転候補領域と垂直方
向の白黒反転候補領域の重なり状態により白黒反転領域
を設定する機能と、 をコンピュータに実行させる命令を含むプログラムを格
納した前記コンピュータが読み取り可能な記憶媒体。28. For binary image data in tabular form,
With a function to scan in the horizontal direction using a long line segment extraction mask in the horizontal direction, and to scan in the vertical direction using a long line segment extraction mask in the vertical direction, and to extract each area in which the black pixel density is higher than a predetermined threshold value. A function of integrating the areas with high black pixel density extracted by the function in a direction orthogonal to each mask scanning direction, and a black-and-white reversal candidate area if the line width of the area integrated by the function is a predetermined threshold or more Then, the black and white inversion candidate area is set in each mask scanning direction, and the black and white inversion candidate area is set by the overlapping state of the horizontal direction black and white inversion candidate area and the vertical direction black and white inversion candidate area integrated by the function. And a computer-readable storage medium that stores a program including instructions for causing a computer to execute the function.
要素によって作成される任意の2色を含むことを特徴と
する請求項1又は2記載の白黒反転領域識別装置。29. The black-and-white inverted area identifying device according to claim 1, wherein the black-and-white inverted area includes two arbitrary colors created by three color elements.
要素によって作成される任意の2色を含むことを特徴と
する請求項17又は18記載の表認識装置。30. The table recognition device according to claim 17, wherein the black and white shown in the black-and-white inversion area includes any two colors created by three elements of color.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP14270897A JP3409992B2 (en) | 1997-05-30 | 1997-05-30 | Black and white reversal area identification device and table recognition device using the device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP14270897A JP3409992B2 (en) | 1997-05-30 | 1997-05-30 | Black and white reversal area identification device and table recognition device using the device |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH10334183A JPH10334183A (en) | 1998-12-18 |
| JP3409992B2 true JP3409992B2 (en) | 2003-05-26 |
Family
ID=15321729
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP14270897A Expired - Fee Related JP3409992B2 (en) | 1997-05-30 | 1997-05-30 | Black and white reversal area identification device and table recognition device using the device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3409992B2 (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN106295486A (en) * | 2015-06-12 | 2017-01-04 | 富士通株式会社 | The processing method of file and picture and processing means |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4702244B2 (en) * | 2006-09-26 | 2011-06-15 | 沖電気工業株式会社 | Form reader |
-
1997
- 1997-05-30 JP JP14270897A patent/JP3409992B2/en not_active Expired - Fee Related
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN106295486A (en) * | 2015-06-12 | 2017-01-04 | 富士通株式会社 | The processing method of file and picture and processing means |
| CN106295486B (en) * | 2015-06-12 | 2019-11-05 | 富士通株式会社 | The processing method and processing unit of file and picture |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH10334183A (en) | 1998-12-18 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5778103A (en) | OCR image pre-processor | |
| KR100525692B1 (en) | Color image processing apparatus and pattern extracting apparatus | |
| JP2951814B2 (en) | Image extraction method | |
| JP3308032B2 (en) | Skew correction method, skew angle detection method, skew correction device, and skew angle detection device | |
| US7283683B1 (en) | Image processing device and image processing method | |
| EP0389988B1 (en) | Detecting line segments and predetermined patterns in an optically scanned document | |
| EP0843276A1 (en) | HTML generator | |
| JP2002133426A (en) | Ruled line extraction device for extracting ruled lines from multi-valued images | |
| JP2001297303A (en) | Document image recognition method and apparatus, and computer-readable recording medium | |
| GB2354925A (en) | Image filling method, apparatus and computer readable medium for reducing filling process in producing animation | |
| EP1017011A2 (en) | Block selection of table features | |
| CN111126266A (en) | Text processing method, text processing system, apparatus and medium | |
| JPH07184040A (en) | Detection device of region encircled by marker by means of singe optical path scanning for photograph copying machine and its method | |
| JP3409992B2 (en) | Black and white reversal area identification device and table recognition device using the device | |
| EP1296283A2 (en) | Half-tone dot elimination method and system thereof | |
| JPH0950527A (en) | Frame extraction device and rectangle extraction device | |
| JP2022090469A (en) | Format definition device, format definition method, and program | |
| US20040105583A1 (en) | Segmenting a composite image via minimum areas | |
| JPH06208625A (en) | Image processing method and apparatus | |
| JP3476595B2 (en) | Image area division method and image binarization method | |
| JP3019897B2 (en) | Line segmentation method | |
| KR100516681B1 (en) | Enlarging and smoothing textual characters | |
| JPH07182459A (en) | Table structure extracting device | |
| JP2003271973A (en) | Image processing method and image processing program | |
| JPH0388085A (en) | Optical character reader |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20030304 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080320 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090320 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100320 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100320 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110320 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110320 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120320 Year of fee payment: 9 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130320 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130320 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140320 Year of fee payment: 11 |
|
| LAPS | Cancellation because of no payment of annual fees |