JPH01270183A - Character recognition device - Google Patents
Character recognition deviceInfo
- Publication number
- JPH01270183A JPH01270183A JP63099445A JP9944588A JPH01270183A JP H01270183 A JPH01270183 A JP H01270183A JP 63099445 A JP63099445 A JP 63099445A JP 9944588 A JP9944588 A JP 9944588A JP H01270183 A JPH01270183 A JP H01270183A
- Authority
- JP
- Japan
- Prior art keywords
- character
- image
- format
- recognition device
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000009826 distribution Methods 0.000 claims description 25
- 230000002093 peripheral effect Effects 0.000 claims description 21
- 230000003287 optical effect Effects 0.000 claims description 2
- 238000000605 extraction Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- RRLHMJHRFMHVNM-BQVXCWBNSA-N [(2s,3r,6r)-6-[5-[5-hydroxy-3-(4-hydroxyphenyl)-4-oxochromen-7-yl]oxypentoxy]-2-methyl-3,6-dihydro-2h-pyran-3-yl] acetate Chemical compound C1=C[C@@H](OC(C)=O)[C@H](C)O[C@H]1OCCCCCOC1=CC(O)=C2C(=O)C(C=3C=CC(O)=CC=3)=COC2=C1 RRLHMJHRFMHVNM-BQVXCWBNSA-N 0.000 description 3
- 239000013256 coordination polymer Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000034 method Methods 0.000 description 1
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、紙面上に書かれた文字を画像として入力する
ことにより、文字画像から文字領域を捜し出し、コード
番号に変換する文字認識装置に関する。[Detailed Description of the Invention] [Field of Industrial Application] The present invention relates to a character recognition device that searches for a character area from a character image by inputting characters written on paper as an image, and converts it into a code number. .
近年、文字認識装置の急激なる進歩により、さまざまな
文書画像から文字を認識し、自動的に文書ファイル等の
作成ができるようになってきており、文書画像が活字で
あっても、手書き文字であっても文字を正確に認識でき
る様になっている。In recent years, rapid advances in character recognition devices have made it possible to recognize characters from various document images and automatically create document files. It is now possible to accurately recognize characters.
文書画像には、例えば日本語のように縦書きの文書もあ
れば、英語のように横画きの文書もある。Document images include, for example, vertically written documents such as Japanese, and horizontally written documents such as English.
これらの文書を認識するにあたっては、前もって使用者
が、文書の情報を与えるが、認識対象文書の書式が限定
されているがのどちらであった。In order to recognize these documents, the user provides document information in advance, but the format of the document to be recognized is limited.
しかしながら、このように使用者が使用の都度文書画像
の書式情報を文字認識装置に与えたり、また認識書式が
限定されていたのでは、実際に認識装置に使用するにあ
たり、非常に操作性が悪い。However, if the user has to provide the format information of the document image to the character recognition device each time it is used, or if the recognition formats are limited, the operability is very poor when actually using the recognition device. .
そこで本発明は、このような課題を解決するもので、そ
の目的とするところは、書式不明の文書画像から書式を
自動的に判断し文書を認識する文字認識装置を提供する
ことにある。SUMMARY OF THE INVENTION The present invention is intended to solve these problems, and an object of the present invention is to provide a character recognition device that automatically determines the format from a document image of unknown format and recognizes the document.
本発明は、(1)光学的画像入力手段により、紙面等に
書かれた文字画像を読み取り、紙面上に書かれた文字を
認識し、コード番号に置きIQえる文字認識装置におい
て、書式判断手段を有することを特徴とする6
また該書式判断手段は、入力画像の水平方向及び垂直方
向の周辺分布をとり入力画像の書式を判断することを特
徴とする。The present invention provides (1) a format determining means in a character recognition device that reads a character image written on a paper surface etc. using an optical image input means, recognizes the written character on the paper surface, places it in a code number, and calculates the IQ; Further, the format determining means is characterized in that the format determination means determines the format of the input image by determining the horizontal and vertical peripheral distribution of the input image.
また文字画1象の複数の周辺分布の空白部分の有無及び
大きさを判断の手段に用いることを特徴とする。It is also characterized in that the existence and size of blank areas in a plurality of peripheral distributions of one character image are used as a means of judgment.
以下本発明について実施例に基づいて詳細に説明する。 The present invention will be described in detail below based on examples.
本発明の文字認識装置は、第1図のブロック図に示す櫟
に、CP tJ 1 、画像入力装置2、J2識文字表
示装置3、ROM4、RAM5により構成されている。The character recognition device of the present invention includes a CP tJ 1 , an image input device 2, a J2 character display device 3, a ROM 4, and a RAM 5, as shown in the block diagram of FIG.
また本発明の文字認識装置の動作は第2図のブロック図
に示す様に、画像入力手段6、入力された画像が、縦書
きか横書きかを判断する書式判断手段7、画1象中から
文字列を抽出する文字列抽出手段8、文字列から文字を
抽出する文字抽出手段9、抽出された文字を認識する文
字認識手段10、該認識文字を表示する認識結果表示手
段11とからなっている。The operation of the character recognition device of the present invention is as shown in the block diagram of FIG. It consists of a character string extraction means 8 for extracting a character string, a character extraction means 9 for extracting characters from the character string, a character recognition means 10 for recognizing the extracted characters, and a recognition result display means 11 for displaying the recognized characters. There is.
以下、入力画像から書式と判断する一連の動作を第4図
に示すフローチャートに基づいて詳細に説明する。Hereinafter, a series of operations for determining a format from an input image will be explained in detail based on the flowchart shown in FIG.
画像入力手段6においては、画像入力装置2によって、
文字画像12・13がRA M 5に読み込まれる。該
RAM5に読み込まれたデータは、日本語等の縦書き文
書12なのか、英語等の横書き文書13なのか分かつて
いない、このまま、文字列抽出手段8において文字列の
抽出を行うのは不可能である0本発明はここで、書式判
断手段7(18)を設けである。該書式判断手段7 (
18)においては、入力された文字画像12・13の水
平方向の周辺分布14・15及び垂直方向の周辺分布1
6・17の計算を行う、もしも入力された文字画像か第
3図(b)に示す12であった場合、水平方向の周辺分
布14及び垂直方向の周辺分布16は第3図(C)及び
第3図(a)に示す様になる。ここで、垂直方向の周辺
分布16をみる。In the image input means 6, the image input device 2
Character images 12 and 13 are read into RAM 5. It is unclear whether the data read into the RAM 5 is a vertically written document 12 such as Japanese or a horizontally written document 13 such as English, and it is impossible for the character string extraction means 8 to extract the character string as it is. Here, the present invention provides a format determining means 7 (18). The format judgment means 7 (
In 18), the horizontal peripheral distributions 14 and 15 and the vertical peripheral distribution 1 of the input character images 12 and 13 are
If the input character image is 12 shown in Figure 3(b), the horizontal peripheral distribution 14 and the vertical peripheral distribution 16 are calculated as shown in Figure 3(C) and 6.17. The result is as shown in FIG. 3(a). Here, we will look at the vertical peripheral distribution 16.
もしも、入力された文字画像が樅書き文書であれば、必
ず垂直方向の周辺分布16に空白部分(行間に相当する
)が存在するはずであり、該空白部分が無ければ、横書
き文書と見なすことができる。If the input character image is a letter-writing document, there must be a blank area (corresponding to the space between lines) in the vertical peripheral distribution 16, and if there is no such blank area, it should be regarded as a horizontally-written document. I can do it.
周辺分布16には、行間かもしれない空白部分が存在し
ている。従って、入力された文字画像12は、樅書き文
書である可能性がある。しかし、これだけでは、入力さ
れた文字画@12がf7書き文書とみなすことは不可能
である。次に、水平方向の周辺分布14をみる。もしも
、水平方向の周辺分布14に空白部分が存在しなければ
、入力された文字画像は縦書き文書であると判断でき、
また、周辺分布14に空白部分が存在すれば、入力され
た文字画像が横書き文書である可能性があると判断でき
る。第3図(b)においては、垂直方向の周辺分布16
、水平方向の周辺分布14の両方とも空白部分が存在し
ている。従って、両方の可能性がある。そこで、該空白
部分の大きさを比べる。The marginal distribution 16 includes blank areas that may be between lines. Therefore, there is a possibility that the input character image 12 is a fir writing document. However, with this alone, it is impossible to regard the input character stroke @12 as an f7 writing document. Next, look at the horizontal peripheral distribution 14. If there is no blank space in the horizontal peripheral distribution 14, it can be determined that the input character image is a vertically written document,
Further, if a blank portion exists in the peripheral distribution 14, it can be determined that there is a possibility that the input character image is a horizontally written document. In FIG. 3(b), the vertical peripheral distribution 16
, a blank portion exists in both of the horizontal peripheral distributions 14. Therefore, both possibilities exist. Therefore, the sizes of the blank areas are compared.
一般的な文書においては、水平方向及び垂直方向の両方
の周辺分布に空白部分が存在する場合、行方向の空白部
分の方が他の方向の空白部分よりも大きいという性質を
もっている。第3図(b)の周辺分布14・16の空白
部分の大きさを比べると、垂直方向の周辺分布の空白部
分の方が垂直方向の周辺分布の空白部分よりも大きい、
従って、入力された文字画像12は、樅書き文書である
と判断できる。In a typical document, when blank areas exist in both the horizontal and vertical peripheral distributions, the blank areas in the row direction are larger than the blank areas in other directions. Comparing the sizes of the blank parts of marginal distributions 14 and 16 in Figure 3(b), the blank part of the vertical marginal distribution is larger than the blank part of the vertical marginal distribution.
Therefore, it can be determined that the input character image 12 is a fir writing document.
また、入力された画像が、第3図(e)に示ず13であ
った場合も同様な方法にて書式を判断すれば良い。幸い
、第3図(d)に示す入力された画像13の垂直方向の
周辺分布17には空白部分が無い。もしも、縦書き文書
であれば必ず空白部分が存在するはずであるから、該入
力された文字画像13は横書き文書であると判断できる
。Furthermore, even if the input image is 13, which is not shown in FIG. 3(e), the format may be determined in the same manner. Fortunately, there is no blank area in the vertical peripheral distribution 17 of the input image 13 shown in FIG. 3(d). If it is a vertically written document, there will definitely be a blank space, so it can be determined that the input character image 13 is a horizontally written document.
以上の様に、入力画像の水平方向と垂直方向の周辺分布
を計ユし、空白部分に着目して判断するので、簡単にか
つ確実に入力画像め書式を判断することが可能となる。As described above, since the peripheral distribution of the input image in the horizontal and vertical directions is calculated and the judgment is made by focusing on the blank areas, it is possible to easily and reliably judge the format of the input image.
また、入力された文字画像から自動的に書式を判断する
ので、画像入力時における書式指定の手間か省け、操作
性が向上する。Furthermore, since the format is automatically determined from the input character image, the trouble of specifying the format when inputting the image is eliminated, and operability is improved.
また本発明は、文字画像の書式が、水平方向と垂直方向
の場合について述べたが、該方法は、水平方向と垂直方
向に限ったものではなく、平行に書かれた文字ならば斜
め方向の文字でも良く、あらゆる方向(180度の範囲
において)の周辺分布を求めれば、書式を判断すること
が可能である。Furthermore, although the present invention has described the case where the format of the character image is horizontal and vertical, the method is not limited to horizontal and vertical formats, and if characters are written in parallel, the format is diagonal. It is possible to judge the format by finding the peripheral distribution of characters in all directions (within a range of 180 degrees).
以上述べた様に本発明によれは、文字認識装置において
、入力された文字画像が、横書き文書なのか、樅書き文
書なのかの書式判断をする書式判断手段を有しているの
で、画像入力前後に書式を指定する必要のない、また、
書式判断の手段として、水平方向、垂直方向の周辺分布
をとり、空白部分に着目して判断するので、簡単にかつ
確実に入力画像の書式を判断することが可能となる。As described above, according to the present invention, the character recognition device includes a format determination means for determining whether the input character image is a horizontally written document or a Japanese-style document. There is no need to specify format before or after, and
As a format determination means, the peripheral distribution in the horizontal and vertical directions is taken, and the determination is made by focusing on blank areas, making it possible to easily and reliably determine the format of the input image.
第1図に本発明の文字認識装置のブロック図。
第2図に本発明の認識手段のブロック図。
第3図(a)(b)(c)(d)(e)(f)に本発明
の書式判断手段を示し7た図。
第4図に本発明の書式判断のフローチャートを示す。
1・・・・・CPU
2・・・・・画像入力装置
3・・・・・認識結果表示装置
4・・・・・ROM
5・・・・・RA M
6・・・・・画像入力手段
7・・・・・書式判断手段
8・・・・・文字列抽出手段
9・・・・・文字抽出手段
10・・・・・文字認識手段
11・・・・・認識文字表示手段
12.13・・文字画像
■・1.15・・水平方向周辺分布
16.17・・垂直方向周辺分布
18・・・・・書式判断手段
以上
出願人 セイコーエプソン株式会社
代理人 弁理士 上 柳 雅 誉(他1名)第3図(I
l)
第3図(j)FIG. 1 is a block diagram of a character recognition device of the present invention. FIG. 2 is a block diagram of the recognition means of the present invention. FIGS. 3(a), 3(b), 3(c), 3(d), 3(e), and 3(f) are views showing the format determining means of the present invention. FIG. 4 shows a flowchart of format determination according to the present invention. 1... CPU 2... Image input device 3... Recognition result display device 4... ROM 5... RAM 6... Image input means 7...Format determination means 8...Character string extraction means 9...Character extraction means 10...Character recognition means 11...Recognized character display means 12.13・・Character image■・1.15・・Horizontal peripheral distribution 16.17・・Vertical peripheral distribution 18・・・Format judgment means and above Applicant Seiko Epson Corporation Representative Patent attorney Masayoshi Kamiyanagi (and others) 1 person) Figure 3 (I
l) Figure 3 (j)
Claims (2)
字画像を読み取り、紙面上に書かれた文字を認識し、コ
ード番号に置き換える文字認識装置において、書式判断
手段を有することを特徴とする文字認識装置。(1) A character recognition device that reads a character image written on paper etc. using an optical image input means, recognizes the written character on the paper, and replaces it with a code number, characterized by having a format judgment means. character recognition device.
大きさを判断の手段に用いることを特徴とする請求項1
記載の文字認識装置。(2) Claim 1 characterized in that the presence or absence and size of blank areas in a plurality of peripheral distributions of a character image are used as a means of determination.
The character recognition device described.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63099445A JPH01270183A (en) | 1988-04-22 | 1988-04-22 | Character recognition device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63099445A JPH01270183A (en) | 1988-04-22 | 1988-04-22 | Character recognition device |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH01270183A true JPH01270183A (en) | 1989-10-27 |
Family
ID=14247572
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63099445A Pending JPH01270183A (en) | 1988-04-22 | 1988-04-22 | Character recognition device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH01270183A (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH03204791A (en) * | 1990-01-05 | 1991-09-06 | Nippon Steel Corp | Method and device for detecting marking |
-
1988
- 1988-04-22 JP JP63099445A patent/JPH01270183A/en active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH03204791A (en) * | 1990-01-05 | 1991-09-06 | Nippon Steel Corp | Method and device for detecting marking |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2713622B2 (en) | Tabular document reader | |
| US5854860A (en) | Image filing apparatus having a character recognition function | |
| JPH0430070B2 (en) | ||
| JPH01270183A (en) | Character recognition device | |
| JP2008108114A (en) | Document processing apparatus and document processing method | |
| JP3197441B2 (en) | Character recognition device | |
| JPS6254380A (en) | character recognition device | |
| JP3006294B2 (en) | Optical character reader | |
| JP3086277B2 (en) | Document image processing device | |
| JPH04324577A (en) | Broken-line graph recognizing device | |
| ANTONACOPOULOS | Automatic reading of Braille documents | |
| KR100234028B1 (en) | Character Area Classification Method of Character Recognition System | |
| JPH02230484A (en) | Character recognizing device | |
| JPH11242716A (en) | Image processing method and recording medium | |
| JP2917396B2 (en) | Character recognition method | |
| JP2823350B2 (en) | Multimedia input device | |
| JP2002189984A (en) | Document reader | |
| JPH02128292A (en) | Optical character reader | |
| JPH01284991A (en) | Character recognizing method | |
| JPH1049602A (en) | Form recognition method | |
| JPH04109381A (en) | Character reader | |
| JPH01180687A (en) | Mark sheet and mark sheet character recognizing method | |
| JPH0443476A (en) | character recognition device | |
| JPH03142694A (en) | Document reader | |
| JPH0365781A (en) | Pattern normalization method |