Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JPH0258663B2 - - Google Patents
[go: Go Back, main page]

JPH0258663B2 - - Google Patents

Info

Publication number
JPH0258663B2
JPH0258663B2 JP58003000A JP300083A JPH0258663B2 JP H0258663 B2 JPH0258663 B2 JP H0258663B2 JP 58003000 A JP58003000 A JP 58003000A JP 300083 A JP300083 A JP 300083A JP H0258663 B2 JPH0258663 B2 JP H0258663B2
Authority
JP
Japan
Prior art keywords
character
pattern
character string
output
integration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP58003000A
Other languages
Japanese (ja)
Other versions
JPS59128676A (en
Inventor
Yoji Maeda
Masataka Yamamoto
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Computer Basic Technology Research Association Corp
Original Assignee
Computer Basic Technology Research Association Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Computer Basic Technology Research Association Corp filed Critical Computer Basic Technology Research Association Corp
Priority to JP58003000A priority Critical patent/JPS59128676A/en
Publication of JPS59128676A publication Critical patent/JPS59128676A/en
Publication of JPH0258663B2 publication Critical patent/JPH0258663B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 〔発明の技術分野〕 この発明は、帳票などに記入された漢字等の文
字列を読み取る装置において、特に文字パターン
の切り出しの誤り(ミス)に対処することができ
る文字読取り装置に関するものである。
[Detailed Description of the Invention] [Technical Field of the Invention] The present invention provides a character string that is particularly capable of dealing with errors in cutting out character patterns, in a device that reads character strings such as kanji characters written on forms, etc. It concerns a reading device.

〔従来技術〕[Prior art]

従来この種の文字読取り装置において、帳票な
どに記入された漢字等の文字列を、光学的に走査
することによつて得られる文字列パターンから1
文字分の文字パターンを切り出す際に、この切り
出しの誤りに対処する有効な手段がなく、それゆ
え、例えばあらかじめ文字数が分つている場合に
は、この文字数と読み取り文字数とを比較し、過
不足があればデイスプレイ等の表示装置にその読
み取り結果を表示して、人間が修正をするという
方式を採用していた。このため、従来のもので
は、人間の介在なくしては文字パターンの切り出
しの誤りを修正することができないという欠点が
あつた。
Conventionally, in this type of character reading device, a character string pattern obtained by optically scanning a character string such as kanji written on a form etc.
When cutting out a character pattern for characters, there is no effective way to deal with this cutting error. Therefore, for example, if the number of characters is known in advance, this number of characters is compared with the number of read characters, and the number of characters is compared to determine the excess or deficiency. If necessary, the reading results were displayed on a display or other display device, and a person made corrections. For this reason, the conventional method has the disadvantage that errors in character pattern extraction cannot be corrected without human intervention.

〔発明の概要〕[Summary of the invention]

この発明は、上記のような従来のものの欠点を
除去する目的でなされたもので、帳票などに記入
された漢字等の文字列に制限を与え、この制限外
の文字は文字パターンの切り出しの誤りによるも
のとして判断し、その文字の直前又は直後の文字
とを統合して1個の文字として出力し、これによ
り文字パターンの切り出しの誤りを自動的に修正
し、正しい文字列の漢字を出力することができる
ようにした文字読取り装置を提供するものであ
る。
This invention was made for the purpose of eliminating the above-mentioned drawbacks of the conventional ones. It places restrictions on the character strings such as kanji written on forms, etc., and characters outside of these restrictions are caused by errors in cutting out the character pattern. , the character immediately before or after that character is integrated and output as a single character, thereby automatically correcting the error in cutting out the character pattern and outputting the correct character string of kanji. The present invention provides a character reading device capable of reading text.

〔発明の実施例〕[Embodiments of the invention]

以下、この発明の実施例について説明する。第
1図はこの発明の一実施例である文字読取り装置
の内部構成要素を示すブロツク図である。図にお
いて、1は文字列パターン記憶装置、2は文字パ
ターン切り出し装置、3は文字名決定装置、4は
整合パターン記憶装置、5は出力検査装置、6は
制限情報記憶装置、7は文字統合処理装置、8は
文字統合条件記憶装置である。
Examples of the present invention will be described below. FIG. 1 is a block diagram showing the internal components of a character reading device which is an embodiment of the present invention. In the figure, 1 is a character string pattern storage device, 2 is a character pattern extraction device, 3 is a character name determination device, 4 is a matching pattern storage device, 5 is an output inspection device, 6 is a restriction information storage device, and 7 is a character integration process. The device 8 is a character integration condition storage device.

第2図は第1図の文字読取り装置の各段階にお
ける処理結果を示す説明図である。図において、
9は帳票などに記入された文字列パターン、1
0,11,12は文字列パターン9からそれぞれ
切り出した後の文字パターン、13,14,15
は各文字パターン10,11,12にそれぞれ対
応する、第1図に示す文字名決定装置5により決
定された文字名、16,17は最終的に出力され
る読み取り結果の文字を示している。
FIG. 2 is an explanatory diagram showing the processing results at each stage of the character reading device of FIG. 1. In the figure,
9 is a character string pattern written on a form, etc., 1
0, 11, 12 are character patterns cut out from character string pattern 9, 13, 14, 15
denote character names determined by the character name determination device 5 shown in FIG. 1, corresponding to the character patterns 10, 11, and 12, respectively, and 16 and 17 denote the characters of the reading results finally output.

次に、上記第1図に示されているように構成さ
れた文字読取り装置の動作について説明する。ま
ず、帳票などに記入された、例えば第2図に示す
「下位」の文字列パターン9の走査装置(図示し
ない)で走査して、この文字列パターン9を文字
列パターン記憶装置1に記憶する。次いで、文字
列パターン記憶装置1に記憶された文字列パター
ン9を文字パターン切り出し装置2を用いて切り
出しを行ない、切り出した「下」、「イ」、「立」の
各文字パターン10,11,12を検出する。各
文字パターン10,11,12を切り出した後、
文字名決定装置3において、上記各文字パターン
10,11,12と整合パターン記憶装置4に記
憶されている整合パターンとの整合を取り、
「下」、「イ」、「立」の各文字名13,14,15
を決定する。決定された各文字名13,14,1
5のうち、「下」の文字名13と「立」の文字名
15は漢字であり、「イ」の文字名14は片仮名
である。文字列の中で、両側に漢字がある片仮名
はないという制限情報が制限情報記憶装置6に記
憶されており、このため、文字名14は出力検査
装置5で上記制限情報によつて検出される。そこ
で、文字統合処理装置7において、2個の文字を
統合して1個の文字となる統合条件を記憶した文
字統合条件記憶装置8の内容を調べることによ
り、「イ」の文字名14と「立」の文字名15と
を統合して、正しい「位」の文字17に変換す
る。
Next, the operation of the character reading device configured as shown in FIG. 1 will be explained. First, a scanning device (not shown) scans a "lower" character string pattern 9 written on a form, for example, shown in FIG. 2, and stores this character string pattern 9 in the character string pattern storage device 1. . Next, the character string pattern 9 stored in the character string pattern storage device 1 is cut out using the character pattern cutting device 2, and the cut out character patterns 10, 11, 12 is detected. After cutting out each character pattern 10, 11, 12,
In the character name determining device 3, each of the character patterns 10, 11, 12 is matched with the matching pattern stored in the matching pattern storage device 4,
Character names 13, 14, 15 for "Down", "I", and "Tate"
Determine. Each determined character name 13, 14, 1
5, the character name 13 for "shita" and the character name 15 for "stand" are kanji, and the character name 14 for "i" is katakana. Restriction information that there is no katakana with kanji on both sides in the character string is stored in the restriction information storage device 6, and therefore, the character name 14 is detected by the output inspection device 5 based on the restriction information. . Therefore, in the character integration processing device 7, by checking the contents of the character integration condition storage device 8 that stores the integration conditions for integrating two characters into one character, the character name 14 of "i" and " The character name 15 for ``tate'' is integrated with the character name 15 for ``place'' and converted into the correct character 17 for ``place''.

上記したように、この発明の文字読取り装置で
は、帳票などに記入された漢字等の文字列に制限
を与え、この制限について検査し、漢字の偏、つ
くりの各々が文字として見なせる場合、各々の文
字と元の漢字との関係を示した統合条件に基づ
き、文字パターンの切り出しの誤りにより、漢字
の偏、つくりを分離して2文字として読んでいな
いかを検査し、このような場合には、その文字の
直前又は直後の文字とを統合し、正しい漢字を出
力することができる。このため、文字パターンの
切り出しの誤りを自動的に検出し、かつ修正する
ことが可能となる。
As described above, in the character reading device of the present invention, restrictions are placed on character strings such as kanji written on forms, etc., and the restrictions are inspected. Based on the integration conditions that show the relationship between characters and the original kanji, we check whether the kanji is read as two characters by separating the bias or structure of the kanji due to an error in cutting out the character pattern. , it is possible to integrate the characters immediately before or after that character and output the correct kanji. Therefore, it becomes possible to automatically detect and correct errors in cutting out character patterns.

なお、上記実施例では制限情報として片仮名と
漢字の混在する場合について説明したが、この発
明はこれに限定されることなく、文法、文脈など
の自然言語処理技術を用いた各種制限情報を用い
てもよく、上記実施例と同様の効果がある。
In addition, in the above embodiment, the case where katakana and kanji are mixed as the restriction information was explained, but the present invention is not limited to this, and the present invention is not limited to this. This embodiment has the same effect as the above embodiment.

〔発明の効果〕〔Effect of the invention〕

この発明は以上説明したように、帳票などに記
入された漢字等の文字列に制限を与え、文字列パ
ターンから1文字分の文字パターンを切り出す時
に、その文字パターンの切り出しの誤りが発生し
た場合、制限情報により文字パターンの切り出し
の誤りを検出して、これを修正することができる
ように構成されているので、文字パターンの切り
出しの誤りを自動的に、かつ確実に修正すること
ができる文字読取り装置が得られるという優れた
効果を奏するものである。
As explained above, this invention places restrictions on character strings such as kanji written on forms, etc., and when cutting out a character pattern for one character from a character string pattern, if an error occurs in cutting out the character pattern. , is configured to be able to detect and correct errors in cutting out character patterns using restriction information, so that errors in cutting out character patterns can be corrected automatically and reliably. This has the excellent effect of providing a reading device.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図はこの発明の一実施例である文字読取り
装置の内部構成要素を示すブロツク図、第2図は
第1図の文字読取り装置の各段階における処理結
果を示す説明図である。 図において、1…文字列パターン記憶装置、2
…文字パターン切り出し装置、3…文字名決定装
置、4…整合パターン記憶装置、5…出力検査装
置、6…制限情報記憶装置、7…文字統合処理装
置、8…文字統合条件記憶装置、9…文字列パタ
ーン、10,11,12…文字パターン、13,
14,15…文字名、16,17…読み取り結果
の文字である。
FIG. 1 is a block diagram showing internal components of a character reading device according to an embodiment of the present invention, and FIG. 2 is an explanatory diagram showing processing results at each stage of the character reading device of FIG. In the figure, 1...Character string pattern storage device, 2
...Character pattern cutting device, 3...Character name determining device, 4...Consistent pattern storage device, 5...Output inspection device, 6...Restriction information storage device, 7...Character integration processing device, 8...Character integration condition storage device, 9... Character string pattern, 10, 11, 12...Character pattern, 13,
14, 15... Character names, 16, 17... Characters resulting from reading.

Claims (1)

【特許請求の範囲】[Claims] 1 帳票上に記入された文字列を認識して読み取
る文字読取り装置において、文字列を走査し、こ
れによつて得られる文字列パターンを記憶する文
字列パターン記憶手段と、この記憶された文字列
パターンから1文字分の文字パターンを切り出す
文字パターン切り出し手段と、この切り出した各
文字パターンの文字名を決定する文字名決定手段
と、前記文字列の並びに制限を与える情報を記憶
する制限情報記憶手段と、該制限情報記憶手段を
用いて前記文字名決定手段から出力された出力文
字列を検査する検査手段と、2個の文字を統合条
件に基づき統合して1個の文字に変換する文字統
合処理手段と、この統合条件を記憶する文字統合
条件記憶手段とから成り、前記文字名決定手段か
ら出力された出力文字列について、前記検査手段
により前記制限をはずれた文字を検出した場合、
前記文字統合処理手段を用いて前記文字とこの文
字の直前又は直後の文字とを統合し、新たな文字
列を出力するようにしてなることを特徴とする文
字読取り装置。
1. In a character reading device that recognizes and reads a character string written on a form, a character string pattern storage means that scans a character string and stores a character string pattern obtained thereby, and the stored character string. character pattern cutting means for cutting out a character pattern for one character from the pattern; character name determining means for determining the character name of each character pattern cut out; and restriction information storage means for storing information that limits the arrangement of the character strings. , inspection means for inspecting the output character string output from the character name determination means using the restriction information storage means, and character integration for integrating two characters and converting them into one character based on an integration condition. It consists of a processing means and a character integration condition storage means for storing this integration condition, and when the inspection means detects a character outside the limits in the output character string output from the character name determination means,
A character reading device characterized in that the character is integrated with a character immediately before or after the character using the character integration processing means, and a new character string is output.
JP58003000A 1983-01-12 1983-01-12 Character reader Granted JPS59128676A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58003000A JPS59128676A (en) 1983-01-12 1983-01-12 Character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58003000A JPS59128676A (en) 1983-01-12 1983-01-12 Character reader

Publications (2)

Publication Number Publication Date
JPS59128676A JPS59128676A (en) 1984-07-24
JPH0258663B2 true JPH0258663B2 (en) 1990-12-10

Family

ID=11545098

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58003000A Granted JPS59128676A (en) 1983-01-12 1983-01-12 Character reader

Country Status (1)

Country Link
JP (1) JPS59128676A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0464056U (en) * 1990-10-14 1992-06-01

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0464056U (en) * 1990-10-14 1992-06-01

Also Published As

Publication number Publication date
JPS59128676A (en) 1984-07-24

Similar Documents

Publication Publication Date Title
JPH0258663B2 (en)
JP2738383B2 (en) Address reading device
JPS63254548A (en) Inspection of memory cell contents of program memory
JPS6343789B2 (en)
JPS61296481A (en) Document reader
JPH0485673A (en) Cad drawing check supporting system
JPS5658197A (en) Memory data checking method
JPS5919388B2 (en) character reader
JPS60160487A (en) Optical character reader
JPH0728935A (en) Document image processor
JPS61208584A (en) Character reader
Baldwin A «lost Manuscript» of Nonnus' Dionysiaca
JP2784004B2 (en) Character recognition device
KR900008376A (en) Programming support method and system
JPS59158476A (en) Character reader
JPH02724B2 (en)
JP2001344235A (en) Method and device for automatically proofreading characters
JPH11120260A (en) Form image processing method and apparatus, and storage medium storing form image processing program
JPH0375844A (en) Automatic analysis system for fault
JPS55121581A (en) Postal code detector
JPH03164885A (en) Optical character reader
JPS6327945A (en) Documentation device
Milazzo Findings on the Use of LANDSAT-3 Return Beam Vidicon Imagery for Detecting Land Use and Land Cover Changes.
JPH0715702B2 (en) Character pattern cutting device
KR970049528A (en) Error correction method