Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JPH0252315B2 - - Google Patents
[go: Go Back, main page]

JPH0252315B2 - - Google Patents

Info

Publication number
JPH0252315B2
JPH0252315B2 JP56177719A JP17771981A JPH0252315B2 JP H0252315 B2 JPH0252315 B2 JP H0252315B2 JP 56177719 A JP56177719 A JP 56177719A JP 17771981 A JP17771981 A JP 17771981A JP H0252315 B2 JPH0252315 B2 JP H0252315B2
Authority
JP
Japan
Prior art keywords
dictionary
font
characters
accumulator
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP56177719A
Other languages
Japanese (ja)
Other versions
JPS5878276A (en
Inventor
Masaki Komya
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP56177719A priority Critical patent/JPS5878276A/en
Publication of JPS5878276A publication Critical patent/JPS5878276A/en
Publication of JPH0252315B2 publication Critical patent/JPH0252315B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 この発明は特に辞書の選択方式を改良した光学
的文字読取装置に関する。
DETAILED DESCRIPTION OF THE INVENTION The present invention particularly relates to an optical character reading device with an improved dictionary selection method.

現在、英文ワードプロセツサの入力用の光学的
文字読取装置(以下OCRという)が普及しつつ
ある。しかしながら、従来、上記のようなOCR
で読取れる文字種は、ほとんどの場合OCR用字
体に限られており、通常用いられオフイスフオン
トを使用できるものは少なかつた。また、各種フ
オントを読取れるマルチフオント用OCRは価格
がワードプロセツサに比べて非常に高いためバラ
ンスがとれず、ワードプロセツサの入力用の
OCRとしては不向きであつた。さらに、マルチ
フオント用のOCRを用いた場合、プログラム又
はスイツチによつてフオントを選択する必要があ
つた。
Currently, optical character reading devices (hereinafter referred to as OCR) for input into English word processors are becoming popular. However, conventionally, the above OCR
In most cases, the types of characters that can be read are limited to OCR fonts, and there are only a few that can be used with commonly used office fonts. In addition, multi-font OCR that can read various fonts is very expensive compared to word processors, so it is difficult to maintain a good balance.
It was unsuitable for OCR. Furthermore, when using OCR for multiple fonts, it was necessary to select the font using a program or a switch.

この発明は上記のような事情に鑑みてなされた
もので、予め定められた帳票上の文字に基づき読
取用の辞書の切換えを行ない、複数種のフオント
を読取ることができる光学的文字読取装置を提供
することを目的とする。
This invention was made in view of the above circumstances, and provides an optical character reading device that can read multiple types of fonts by switching the reading dictionary based on predetermined characters on a form. The purpose is to provide.

以下、図面を参照してこの発明の一実施例を説
明する。第1図はこの発明の一実施例の概略構成
図である。図中、符号1は光電変換部を示してい
る。この光電変換部1は、帳票上の文字を光電変
換し、光電変換された文字パターンとして出力す
る機能を持つている。符号2は認識部を示してい
る。この認識部2は、上記光電変換された文字パ
ターンの認識を行なう機能を持つている。符号3
は辞書インデツクステーブルを示している。この
辞書インデツクステーブル3は、各種フオントに
対応する辞書の対応格納領域の先頭番地を記憶し
ている。符号4はマルチフオント辞書を示してい
る。このマルチフオント辞書4は、複数の各フオ
ント毎に独立した辞書から構成されている。符号
5はアキユムレータを示している。このアキユム
レータ5は、帳票における第1行目の文字につい
て、マルチフオント辞書4における各フオント毎
の辞書における標準パターンとマツチング結果の
類似度値が記憶されるようになつている。
Hereinafter, one embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a schematic diagram of an embodiment of the present invention. In the figure, reference numeral 1 indicates a photoelectric conversion section. The photoelectric conversion unit 1 has a function of photoelectrically converting characters on a form and outputting the photoelectrically converted character pattern. Reference numeral 2 indicates a recognition section. This recognition section 2 has a function of recognizing the photoelectrically converted character pattern. code 3
indicates a dictionary index table. This dictionary index table 3 stores the starting addresses of corresponding storage areas of dictionaries corresponding to various fonts. Reference numeral 4 indicates a multi-font dictionary. This multi-font dictionary 4 is composed of independent dictionaries for each of a plurality of fonts. Reference numeral 5 indicates an accumulator. The accumulator 5 is configured to store the similarity value between the standard pattern in the dictionary for each font in the multi-font dictionary 4 and the matching result for the character in the first line of the document.

次に、上記実施例の動作を説明する。まず、こ
のOCRで使用される帳票には、第2図に示すよ
うに、帳票の第1行目に、その帳票で使用される
フオントで予め定められた特定の文字配列、この
場合文字列ABCを印字しておく。なお文字のフ
オントの種類には、Courier12,Courier72,
Prestige Elite72,Prestige Pica等がある。そし
て第2行目以下は、同一フオントで自由にデータ
や文章を印字するようにする。
Next, the operation of the above embodiment will be explained. First, as shown in Figure 2, the form used in this OCR has a specific character arrangement predetermined in the font used in the form, in this case the character string ABC, in the first line of the form. Print it out. The font types include Courier12, Courier72,
There are Prestige Elite72, Prestige Pica, etc. From the second line onwards, data and text can be freely printed in the same font.

このような帳票における文字は、光電変換部1
で光電変換される。このとき、まず帳票における
第1行目に印字された特定の文字が光電変換され
る。認識部2は、辞書インデツクステーブル3の
内容を参照して、マルムフオント辞書4内の1つ
の辞書から、上記第1行目に印字された文字に対
応する標準パターンを読み出し、この読み出され
た標準パターンと、上記第1行目の光電変換され
た文字パターンとのマツチングを行なう。そし
て、このマツチングの結果であるこの場合第1行
目の3文字の類似度値の和が、アキユムレータ5
に記憶される。さらに、上記同様な動作が、マル
チフオント辞書4における各辞書毎にくり返して
行なわれ、各辞書毎のマツチング結果である上記
3文字の類似度値の和が順次アキユムレータ5に
記憶される。このようにして、アキユムレータ5
に記憶されたマルチフオント辞書4における各辞
書毎の類似度値の和について比較が認識部2で行
なわれる。この際、最も類似度値の和の大きかつ
た辞書がマルチフオント辞書4から選択される。
The characters in such a form are written in the photoelectric conversion unit 1.
is photoelectrically converted. At this time, first, specific characters printed on the first line of the form are photoelectrically converted. The recognition unit 2 refers to the contents of the dictionary index table 3, reads out the standard pattern corresponding to the character printed in the first line from one dictionary in the Malmfont dictionary 4, and Matching is performed between the standard pattern and the photoelectrically converted character pattern in the first line. Then, the sum of the similarity values of the three characters in the first row, which is the result of this matching, is calculated by the accumulator 5.
is memorized. Further, the same operation as described above is repeated for each dictionary in the multi-font dictionary 4, and the sum of the similarity values of the three characters, which is the matching result for each dictionary, is sequentially stored in the accumulator 5. In this way, the accumulator 5
The recognition unit 2 compares the sum of similarity values for each dictionary in the multi-font dictionary 4 stored in the multi-font dictionary 4 . At this time, the dictionary with the largest sum of similarity values is selected from the multi-font dictionary 4.

そして、2行目以降は、選択された辞書により
認識を行なつていく。この場合、途中の行で、認
識不能文字が多発した場合には、その行について
再度辞書の選択を行なう。これは、認識不能文字
数の数、その行における各文字の類似度値に基づ
き辞書の選択を行なうものである。
From the second line onward, recognition is performed using the selected dictionary. In this case, if unrecognized characters occur frequently in a line in the middle, dictionary selection is performed again for that line. This selects a dictionary based on the number of unrecognizable characters and the similarity value of each character in the line.

したがつて、このようなOCRでは次のような
効果を奏する。
Therefore, such OCR has the following effects.

(1) 辞書を選択するために必要とする文字が決め
られており、各辞書から読み出してくる標準文
字パターンが限定されているので、辞書の選択
に要する時間が少なくて済む。
(1) Since the characters required to select a dictionary are determined and the standard character patterns read from each dictionary are limited, the time required for dictionary selection can be reduced.

(2) 各種フオントのミツクスマルチ辞書を作るの
に比べ、辞書の作成が、各フオント毎の単独の
辞書を寄せ集めたものでよく、また類似文字の
発生も考慮しなくてよいので容易である。
(2) Compared to creating a mix multi-dictionary for various fonts, it is easier to create a dictionary because it only requires a collection of individual dictionaries for each font, and there is no need to consider the occurrence of similar characters.

(3) ミツクスマルチ辞書に比較して、高精度の読
取りが可能であり、同時に認識時間の高速化が
可能である。
(3) Compared to MIX multi-dictionaries, it is possible to read with high accuracy and at the same time, it is possible to speed up the recognition time.

(4) オペレータは、帳標の第1行目にその時に使
用するタイプヘツドで予め定められた該当する
文字列を印字するだけでよいので負担がかから
ない。
(4) The operator only needs to print the corresponding character string predetermined in the type head being used at that time on the first line of the ledger, so there is no burden on the operator.

(5) マルチフオント辞書4には、必要なフオント
の辞書のみを組み合わせて構成できるのでオプ
シヨン化が容易に行なえる。
(5) Since the multi-font dictionary 4 can be configured by combining only necessary font dictionaries, it can be easily made optional.

以上述べたようにこの発明によれば、予め定め
られた帳票上の文字に基づき読取用の辞書の切換
えを行ない、複数種のフオントを読取ることがで
きる光学的文字読取装置を提供することができ
る。
As described above, according to the present invention, it is possible to provide an optical character reading device that can read multiple types of fonts by switching the reading dictionary based on predetermined characters on a form. .

【図面の簡単な説明】[Brief explanation of the drawing]

第1図はこの発明の一実施例の概略構成図、第
2図は同実施例に使用される帳票を示す図であ
る。 1……光電変換部、2……認識部、3……辞書
インデツクステーブル、4……マルチフオント辞
書、5……アキユムレータ。
FIG. 1 is a schematic diagram of an embodiment of the present invention, and FIG. 2 is a diagram showing a form used in the embodiment. 1... Photoelectric conversion unit, 2... Recognition unit, 3... Dictionary index table, 4... Multifont dictionary, 5... Accumulator.

Claims (1)

【特許請求の範囲】[Claims] 1 帳票上の文字を光電変換する光電変換部と、
各フオントに対応した複数の辞書から構成さるる
マルチフオント辞書と、上記帳票上の特定位置に
おける特定文字の光電変換された文字パターンに
ついて上記複数の辞書各々を参照して求められた
類似度値が各辞書毎に記憶されるアキユムレータ
と、上記類似度値を求めると共に上記アキユムレ
ータに記憶された最も高い類似度値に相当する辞
書を上記マルチフオント辞書から選択し、選択さ
れた辞書を参照して光電変換された文字パターン
の認識を行なう認識手段とを具備したことを特徴
とする光学的文字読取装置。
1. A photoelectric conversion unit that photoelectrically converts characters on a form;
A multi-font dictionary consisting of a plurality of dictionaries corresponding to each font, and a similarity value obtained by referring to each of the plurality of dictionaries for the photoelectrically converted character pattern of a specific character at a specific position on the form. The accumulator stored for each dictionary and the similarity value are determined, and the dictionary corresponding to the highest similarity value stored in the accumulator is selected from the multi-font dictionary, and the selected dictionary is referred to for photoelectric conversion. 1. An optical character reading device comprising: recognition means for recognizing a converted character pattern.
JP56177719A 1981-11-05 1981-11-05 Optical character reader Granted JPS5878276A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56177719A JPS5878276A (en) 1981-11-05 1981-11-05 Optical character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56177719A JPS5878276A (en) 1981-11-05 1981-11-05 Optical character reader

Publications (2)

Publication Number Publication Date
JPS5878276A JPS5878276A (en) 1983-05-11
JPH0252315B2 true JPH0252315B2 (en) 1990-11-13

Family

ID=16035908

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56177719A Granted JPS5878276A (en) 1981-11-05 1981-11-05 Optical character reader

Country Status (1)

Country Link
JP (1) JPS5878276A (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2574776B2 (en) * 1986-10-24 1997-01-22 株式会社日立製作所 Character recognition method

Also Published As

Publication number Publication date
JPS5878276A (en) 1983-05-11

Similar Documents

Publication Publication Date Title
US4669901A (en) Keyboard device for inputting oriental characters by touch
JP3139521B2 (en) Automatic language determination device
US5438657A (en) Document processing apparatus for extracting a format from one document and using the extracted format to automatically edit another document
US4228507A (en) Methods and means for reproducing non-alphabetic characters
US4597056A (en) Language translator having circuitry for retrieving full words after single letter input
GB2033633A (en) Ideographic coding
JP2740335B2 (en) Table reader with automatic cell attribute determination function
JPH0252315B2 (en)
JPS60254366A (en) Word processor
JPS5822767B2 (en) Japanese typewriter
JPS63219061A (en) Character processing device
JP3025382B2 (en) Document processing device
JPS6120887B2 (en)
JP2907947B2 (en) Optical character reading system
JP2819612B2 (en) Character converter
JPH0346857B2 (en)
JP2634926B2 (en) Kana-Kanji conversion device
JPS63136253A (en) Input system for kana/kanji conversion
JPS5951015B2 (en) document creation device
JPH0514952B2 (en)
JP3217442B2 (en) Optical character reader
JP2506714B2 (en) Handwritten Japanese document output device
KR940009451B1 (en) How to convert Korean code
JPH03110563U (en)
JPS6019236A (en) Recorder