Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JPH01270183A - Character recognition device - Google Patents
[go: Go Back, main page]

JPH01270183A - Character recognition device - Google Patents

Character recognition device

Info

Publication number
JPH01270183A
JPH01270183A JP63099445A JP9944588A JPH01270183A JP H01270183 A JPH01270183 A JP H01270183A JP 63099445 A JP63099445 A JP 63099445A JP 9944588 A JP9944588 A JP 9944588A JP H01270183 A JPH01270183 A JP H01270183A
Authority
JP
Japan
Prior art keywords
character
image
format
recognition device
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63099445A
Other languages
Japanese (ja)
Inventor
Mikio Aoki
三喜男 青木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP63099445A priority Critical patent/JPH01270183A/en
Publication of JPH01270183A publication Critical patent/JPH01270183A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、紙面上に書かれた文字を画像として入力する
ことにより、文字画像から文字領域を捜し出し、コード
番号に変換する文字認識装置に関する。
[Detailed Description of the Invention] [Field of Industrial Application] The present invention relates to a character recognition device that searches for a character area from a character image by inputting characters written on paper as an image, and converts it into a code number. .

〔従来の技術〕[Conventional technology]

近年、文字認識装置の急激なる進歩により、さまざまな
文書画像から文字を認識し、自動的に文書ファイル等の
作成ができるようになってきており、文書画像が活字で
あっても、手書き文字であっても文字を正確に認識でき
る様になっている。
In recent years, rapid advances in character recognition devices have made it possible to recognize characters from various document images and automatically create document files. It is now possible to accurately recognize characters.

文書画像には、例えば日本語のように縦書きの文書もあ
れば、英語のように横画きの文書もある。
Document images include, for example, vertically written documents such as Japanese, and horizontally written documents such as English.

これらの文書を認識するにあたっては、前もって使用者
が、文書の情報を与えるが、認識対象文書の書式が限定
されているがのどちらであった。
In order to recognize these documents, the user provides document information in advance, but the format of the document to be recognized is limited.

〔発明が解決しようとする課題〕[Problem to be solved by the invention]

しかしながら、このように使用者が使用の都度文書画像
の書式情報を文字認識装置に与えたり、また認識書式が
限定されていたのでは、実際に認識装置に使用するにあ
たり、非常に操作性が悪い。
However, if the user has to provide the format information of the document image to the character recognition device each time it is used, or if the recognition formats are limited, the operability is very poor when actually using the recognition device. .

そこで本発明は、このような課題を解決するもので、そ
の目的とするところは、書式不明の文書画像から書式を
自動的に判断し文書を認識する文字認識装置を提供する
ことにある。
SUMMARY OF THE INVENTION The present invention is intended to solve these problems, and an object of the present invention is to provide a character recognition device that automatically determines the format from a document image of unknown format and recognizes the document.

〔課題を解決するための手段〕[Means to solve the problem]

本発明は、(1)光学的画像入力手段により、紙面等に
書かれた文字画像を読み取り、紙面上に書かれた文字を
認識し、コード番号に置きIQえる文字認識装置におい
て、書式判断手段を有することを特徴とする6 また該書式判断手段は、入力画像の水平方向及び垂直方
向の周辺分布をとり入力画像の書式を判断することを特
徴とする。
The present invention provides (1) a format determining means in a character recognition device that reads a character image written on a paper surface etc. using an optical image input means, recognizes the written character on the paper surface, places it in a code number, and calculates the IQ; Further, the format determining means is characterized in that the format determination means determines the format of the input image by determining the horizontal and vertical peripheral distribution of the input image.

また文字画1象の複数の周辺分布の空白部分の有無及び
大きさを判断の手段に用いることを特徴とする。
It is also characterized in that the existence and size of blank areas in a plurality of peripheral distributions of one character image are used as a means of judgment.

〔実 施 例〕〔Example〕

以下本発明について実施例に基づいて詳細に説明する。 The present invention will be described in detail below based on examples.

本発明の文字認識装置は、第1図のブロック図に示す櫟
に、CP tJ 1 、画像入力装置2、J2識文字表
示装置3、ROM4、RAM5により構成されている。
The character recognition device of the present invention includes a CP tJ 1 , an image input device 2, a J2 character display device 3, a ROM 4, and a RAM 5, as shown in the block diagram of FIG.

また本発明の文字認識装置の動作は第2図のブロック図
に示す様に、画像入力手段6、入力された画像が、縦書
きか横書きかを判断する書式判断手段7、画1象中から
文字列を抽出する文字列抽出手段8、文字列から文字を
抽出する文字抽出手段9、抽出された文字を認識する文
字認識手段10、該認識文字を表示する認識結果表示手
段11とからなっている。
The operation of the character recognition device of the present invention is as shown in the block diagram of FIG. It consists of a character string extraction means 8 for extracting a character string, a character extraction means 9 for extracting characters from the character string, a character recognition means 10 for recognizing the extracted characters, and a recognition result display means 11 for displaying the recognized characters. There is.

以下、入力画像から書式と判断する一連の動作を第4図
に示すフローチャートに基づいて詳細に説明する。
Hereinafter, a series of operations for determining a format from an input image will be explained in detail based on the flowchart shown in FIG.

画像入力手段6においては、画像入力装置2によって、
文字画像12・13がRA M 5に読み込まれる。該
RAM5に読み込まれたデータは、日本語等の縦書き文
書12なのか、英語等の横書き文書13なのか分かつて
いない、このまま、文字列抽出手段8において文字列の
抽出を行うのは不可能である0本発明はここで、書式判
断手段7(18)を設けである。該書式判断手段7 (
18)においては、入力された文字画像12・13の水
平方向の周辺分布14・15及び垂直方向の周辺分布1
6・17の計算を行う、もしも入力された文字画像か第
3図(b)に示す12であった場合、水平方向の周辺分
布14及び垂直方向の周辺分布16は第3図(C)及び
第3図(a)に示す様になる。ここで、垂直方向の周辺
分布16をみる。
In the image input means 6, the image input device 2
Character images 12 and 13 are read into RAM 5. It is unclear whether the data read into the RAM 5 is a vertically written document 12 such as Japanese or a horizontally written document 13 such as English, and it is impossible for the character string extraction means 8 to extract the character string as it is. Here, the present invention provides a format determining means 7 (18). The format judgment means 7 (
In 18), the horizontal peripheral distributions 14 and 15 and the vertical peripheral distribution 1 of the input character images 12 and 13 are
If the input character image is 12 shown in Figure 3(b), the horizontal peripheral distribution 14 and the vertical peripheral distribution 16 are calculated as shown in Figure 3(C) and 6.17. The result is as shown in FIG. 3(a). Here, we will look at the vertical peripheral distribution 16.

もしも、入力された文字画像が樅書き文書であれば、必
ず垂直方向の周辺分布16に空白部分(行間に相当する
)が存在するはずであり、該空白部分が無ければ、横書
き文書と見なすことができる。
If the input character image is a letter-writing document, there must be a blank area (corresponding to the space between lines) in the vertical peripheral distribution 16, and if there is no such blank area, it should be regarded as a horizontally-written document. I can do it.

周辺分布16には、行間かもしれない空白部分が存在し
ている。従って、入力された文字画像12は、樅書き文
書である可能性がある。しかし、これだけでは、入力さ
れた文字画@12がf7書き文書とみなすことは不可能
である。次に、水平方向の周辺分布14をみる。もしも
、水平方向の周辺分布14に空白部分が存在しなければ
、入力された文字画像は縦書き文書であると判断でき、
また、周辺分布14に空白部分が存在すれば、入力され
た文字画像が横書き文書である可能性があると判断でき
る。第3図(b)においては、垂直方向の周辺分布16
、水平方向の周辺分布14の両方とも空白部分が存在し
ている。従って、両方の可能性がある。そこで、該空白
部分の大きさを比べる。
The marginal distribution 16 includes blank areas that may be between lines. Therefore, there is a possibility that the input character image 12 is a fir writing document. However, with this alone, it is impossible to regard the input character stroke @12 as an f7 writing document. Next, look at the horizontal peripheral distribution 14. If there is no blank space in the horizontal peripheral distribution 14, it can be determined that the input character image is a vertically written document,
Further, if a blank portion exists in the peripheral distribution 14, it can be determined that there is a possibility that the input character image is a horizontally written document. In FIG. 3(b), the vertical peripheral distribution 16
, a blank portion exists in both of the horizontal peripheral distributions 14. Therefore, both possibilities exist. Therefore, the sizes of the blank areas are compared.

一般的な文書においては、水平方向及び垂直方向の両方
の周辺分布に空白部分が存在する場合、行方向の空白部
分の方が他の方向の空白部分よりも大きいという性質を
もっている。第3図(b)の周辺分布14・16の空白
部分の大きさを比べると、垂直方向の周辺分布の空白部
分の方が垂直方向の周辺分布の空白部分よりも大きい、
従って、入力された文字画像12は、樅書き文書である
と判断できる。
In a typical document, when blank areas exist in both the horizontal and vertical peripheral distributions, the blank areas in the row direction are larger than the blank areas in other directions. Comparing the sizes of the blank parts of marginal distributions 14 and 16 in Figure 3(b), the blank part of the vertical marginal distribution is larger than the blank part of the vertical marginal distribution.
Therefore, it can be determined that the input character image 12 is a fir writing document.

また、入力された画像が、第3図(e)に示ず13であ
った場合も同様な方法にて書式を判断すれば良い。幸い
、第3図(d)に示す入力された画像13の垂直方向の
周辺分布17には空白部分が無い。もしも、縦書き文書
であれば必ず空白部分が存在するはずであるから、該入
力された文字画像13は横書き文書であると判断できる
Furthermore, even if the input image is 13, which is not shown in FIG. 3(e), the format may be determined in the same manner. Fortunately, there is no blank area in the vertical peripheral distribution 17 of the input image 13 shown in FIG. 3(d). If it is a vertically written document, there will definitely be a blank space, so it can be determined that the input character image 13 is a horizontally written document.

以上の様に、入力画像の水平方向と垂直方向の周辺分布
を計ユし、空白部分に着目して判断するので、簡単にか
つ確実に入力画像め書式を判断することが可能となる。
As described above, since the peripheral distribution of the input image in the horizontal and vertical directions is calculated and the judgment is made by focusing on the blank areas, it is possible to easily and reliably judge the format of the input image.

また、入力された文字画像から自動的に書式を判断する
ので、画像入力時における書式指定の手間か省け、操作
性が向上する。
Furthermore, since the format is automatically determined from the input character image, the trouble of specifying the format when inputting the image is eliminated, and operability is improved.

また本発明は、文字画像の書式が、水平方向と垂直方向
の場合について述べたが、該方法は、水平方向と垂直方
向に限ったものではなく、平行に書かれた文字ならば斜
め方向の文字でも良く、あらゆる方向(180度の範囲
において)の周辺分布を求めれば、書式を判断すること
が可能である。
Furthermore, although the present invention has described the case where the format of the character image is horizontal and vertical, the method is not limited to horizontal and vertical formats, and if characters are written in parallel, the format is diagonal. It is possible to judge the format by finding the peripheral distribution of characters in all directions (within a range of 180 degrees).

〔発明の効果〕〔Effect of the invention〕

以上述べた様に本発明によれは、文字認識装置において
、入力された文字画像が、横書き文書なのか、樅書き文
書なのかの書式判断をする書式判断手段を有しているの
で、画像入力前後に書式を指定する必要のない、また、
書式判断の手段として、水平方向、垂直方向の周辺分布
をとり、空白部分に着目して判断するので、簡単にかつ
確実に入力画像の書式を判断することが可能となる。
As described above, according to the present invention, the character recognition device includes a format determination means for determining whether the input character image is a horizontally written document or a Japanese-style document. There is no need to specify format before or after, and
As a format determination means, the peripheral distribution in the horizontal and vertical directions is taken, and the determination is made by focusing on blank areas, making it possible to easily and reliably determine the format of the input image.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図に本発明の文字認識装置のブロック図。 第2図に本発明の認識手段のブロック図。 第3図(a)(b)(c)(d)(e)(f)に本発明
の書式判断手段を示し7た図。 第4図に本発明の書式判断のフローチャートを示す。 1・・・・・CPU 2・・・・・画像入力装置 3・・・・・認識結果表示装置 4・・・・・ROM 5・・・・・RA M 6・・・・・画像入力手段 7・・・・・書式判断手段 8・・・・・文字列抽出手段 9・・・・・文字抽出手段 10・・・・・文字認識手段 11・・・・・認識文字表示手段 12.13・・文字画像 ■・1.15・・水平方向周辺分布 16.17・・垂直方向周辺分布 18・・・・・書式判断手段 以上 出願人 セイコーエプソン株式会社 代理人 弁理士 上 柳 雅 誉(他1名)第3図(I
l) 第3図(j)
FIG. 1 is a block diagram of a character recognition device of the present invention. FIG. 2 is a block diagram of the recognition means of the present invention. FIGS. 3(a), 3(b), 3(c), 3(d), 3(e), and 3(f) are views showing the format determining means of the present invention. FIG. 4 shows a flowchart of format determination according to the present invention. 1... CPU 2... Image input device 3... Recognition result display device 4... ROM 5... RAM 6... Image input means 7...Format determination means 8...Character string extraction means 9...Character extraction means 10...Character recognition means 11...Recognized character display means 12.13・・Character image■・1.15・・Horizontal peripheral distribution 16.17・・Vertical peripheral distribution 18・・・Format judgment means and above Applicant Seiko Epson Corporation Representative Patent attorney Masayoshi Kamiyanagi (and others) 1 person) Figure 3 (I
l) Figure 3 (j)

Claims (2)

【特許請求の範囲】[Claims] (1)光学的画像入力手段により、紙面等に書かれた文
字画像を読み取り、紙面上に書かれた文字を認識し、コ
ード番号に置き換える文字認識装置において、書式判断
手段を有することを特徴とする文字認識装置。
(1) A character recognition device that reads a character image written on paper etc. using an optical image input means, recognizes the written character on the paper, and replaces it with a code number, characterized by having a format judgment means. character recognition device.
(2)文字画像の複数の周辺分布の空白部分の有無及び
大きさを判断の手段に用いることを特徴とする請求項1
記載の文字認識装置。
(2) Claim 1 characterized in that the presence or absence and size of blank areas in a plurality of peripheral distributions of a character image are used as a means of determination.
The character recognition device described.
JP63099445A 1988-04-22 1988-04-22 Character recognition device Pending JPH01270183A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63099445A JPH01270183A (en) 1988-04-22 1988-04-22 Character recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63099445A JPH01270183A (en) 1988-04-22 1988-04-22 Character recognition device

Publications (1)

Publication Number Publication Date
JPH01270183A true JPH01270183A (en) 1989-10-27

Family

ID=14247572

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63099445A Pending JPH01270183A (en) 1988-04-22 1988-04-22 Character recognition device

Country Status (1)

Country Link
JP (1) JPH01270183A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03204791A (en) * 1990-01-05 1991-09-06 Nippon Steel Corp Method and device for detecting marking

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03204791A (en) * 1990-01-05 1991-09-06 Nippon Steel Corp Method and device for detecting marking

Similar Documents

Publication Publication Date Title
JP2713622B2 (en) Tabular document reader
US5854860A (en) Image filing apparatus having a character recognition function
JPH0430070B2 (en)
JPH01270183A (en) Character recognition device
JP2008108114A (en) Document processing apparatus and document processing method
JP3197441B2 (en) Character recognition device
JPS6254380A (en) character recognition device
JP3006294B2 (en) Optical character reader
JP3086277B2 (en) Document image processing device
JPH04324577A (en) Broken-line graph recognizing device
ANTONACOPOULOS Automatic reading of Braille documents
KR100234028B1 (en) Character Area Classification Method of Character Recognition System
JPH02230484A (en) Character recognizing device
JPH11242716A (en) Image processing method and recording medium
JP2917396B2 (en) Character recognition method
JP2823350B2 (en) Multimedia input device
JP2002189984A (en) Document reader
JPH02128292A (en) Optical character reader
JPH01284991A (en) Character recognizing method
JPH1049602A (en) Form recognition method
JPH04109381A (en) Character reader
JPH01180687A (en) Mark sheet and mark sheet character recognizing method
JPH0443476A (en) character recognition device
JPH03142694A (en) Document reader
JPH0365781A (en) Pattern normalization method