Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JPS6136874A - 光学文字読取装置における訂正文字処理方法 - Google Patents
[go: Go Back, main page]

JPS6136874A - 光学文字読取装置における訂正文字処理方法 - Google Patents

光学文字読取装置における訂正文字処理方法

Info

Publication number
JPS6136874A
JPS6136874A JP15760584A JP15760584A JPS6136874A JP S6136874 A JPS6136874 A JP S6136874A JP 15760584 A JP15760584 A JP 15760584A JP 15760584 A JP15760584 A JP 15760584A JP S6136874 A JPS6136874 A JP S6136874A
Authority
JP
Japan
Prior art keywords
character
pattern
line
corrected
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP15760584A
Other languages
English (en)
Other versions
JPH051510B2 (ja
Inventor
Masao Michino
道野 正雄
Kiyomichi Kurino
栗野 清道
Kenichi Takagi
賢一 高木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP15760584A priority Critical patent/JPS6136874A/ja
Publication of JPS6136874A publication Critical patent/JPS6136874A/ja
Publication of JPH051510B2 publication Critical patent/JPH051510B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は、光学文字読取装置(以下OCRという)に関
し、特に、訂正部分の読取りに関する。
〔発明の背景〕
一般に、帳票等に記入された文字を訂正する場合、旧記
載を消去することが困難であれば、第2図に示すように
、訂正すべき文字C1〜c4上に重ねて文字行方向の線
分b1とb2(以下抹消線という)を記入して1文字0
1〜C4を一括して抹消する趣旨を表示するとともに、
その上方の余白に訂正後の文字n1〜n4を記入すると
いう方法が、最も普通である。ところが、OCRにおい
ては、第2図のような形式で訂正された文字を正しく読
取ることは、従来困難であった。その原因の一つは、文
字切出し方式にある。すなわち、従来の文字切出し方式
の下では、抹消線b1及びb2の検出が困難なため、そ
れらを検出してそれらとそれらによって抹消された文字
のパターンを除去することができないのである。
第3図は、従来のOCRにおける文字切出し処理のフロ
ーチャートを示す。第3図を参照して、まずステップS
10において、読取るべき領域Fの位置を算出し、領域
F内に存在するパターンを第3図(a)のように切出す
。次にステップSllにおいて、文字パターンと文字枠
の対応を取るため、領域Fに対し縦投影処理を行ない、
第3図(b)の投影成分v1〜v4を求め、得られた投
影成分v1〜V4に対し、予め決められた文字枠G1〜
G7の対応付けを行なう。つまり、vlに対し枠G1〜
G4が、V 2 ニ対しG5が、■3に対しG6が、v
4に対しG7がそれぞれ対応付けされる。続いてステッ
プS12にて、複数の文字枠にまたがって対応付けられ
た投影成分の有無をチェックし、もしあれば、ステップ
S13で、その投影成分をおのおδ文字枠に強制分割す
る処理を行なう。したがって、投影成分■1は■11゜
V12.V13.V14に分割され、それぞれ文字枠G
l、G2.G3.G4に対応付けがなされる。
このように各文字枠に対する投影成分の割付けが終了す
ると、ステップS14にて各投影成分の位置情報をもと
に、文字枠ごとに文字パターンが抽出されて、切出し処
理を終了する。第4図は、各文字枠に対応して切出され
た文字パターンを示す。第4図において、文字枠Gl、
G3.G4に対応する文字パターンには、除去されるべ
き文字パターンと抹消線bl、b2が除去されずに残る
ため、読取り結果は不読文字(?)として出力され、文
字枠G2に対応する大文字パターンは、カナ文字のパ二
″あるいはEQUAL記号として読取られて、誤読とな
る。
前記のような事情により、従来におけるOCR用帳票で
は、正規の文字記入領域と、訂正の有無を表示する領域
と、訂正後の文字を記入する領域とを、それぞれ別個に
設けており、そのため、帳票上で余分な領域を必要とし
、また、訂正方法としても、面倒で、一般になじみ難い
ものとなっていた。
〔発明の目的〕
本発明の目的は、第2図に例示したような、訂正すべき
文字をその上に引いた抹消線で抹消するとともに、余白
に正しい文字を記入するという形式で訂正された文字を
、OCRで読取れるようにすることにある。
〔発明の概要〕
本発明は、従来のように縦投影成分の文字枠分割をせず
に、又はそれを行なう前に、読取られたパターン群中に
存在する分離したパターンのそれぞれを抽出し、抽出し
た各パターンが所定条件を満たす抹消線を含むか否かを
判定して、抹消線を含むと判定されたパターンを削除す
ることを特徴とする。この処理により、抹消線及びそ九
によって抹消された文字のパターンは除去され、余白に
記入された正しい文字のパターンが残るから、第2図の
ような訂正形式を許容することができる。
〔発明の実施例〕
第1図は、本発明が適用されたOCRの一例を示す。文
字記録媒体、例えば帳票101上のパターンは、光電変
換部103により読取られ、2値パターンとして記憶部
104に格納される。なお、記憶部104には多値パタ
ーンとして格納しておき、以下の処理の開始にあたって
二値パターンに量子化してもよい。読取領域切出し部1
05は、記憶部104に格納されているパターンから読
取領域102を切出して、文字パターン振分は部106
に送る。この切出し処理は、例えば、予め与えられた読
取領域102の媒体10]、上における位置情報に基づ
いて行なわれる0文字パターン振分は部106は、受取
った読取領域102のパターンを輪郭追跡部107に送
り、輪郭追跡部107は、読取領域102内のパターン
の輪郭追跡を行なうことにより、各文字について、輪郭
コードを生成するとともに、幅、高さ、輪郭周囲長など
の寸法データを算出して、これらを訂正文字判定部10
8に送る。輪郭コードは、例えば、輪郭を形成する各線
分の長さと方向を表わすコートの集合である。
訂正文字判定部108は、軸郭追跡部107から送られ
た前記輪郭情報に基づいて、訂正文字候補、すなわち、
抹消線で抹消された文字である可能性のあるパターンを
探索し、発見されなければ輪郭情報をそのまま文字パタ
ーン振分は部106に回送するが、もし発見されれば、
その輪郭情報を直線検出部109に渡す。直線検出部1
09は、訂正文字候補のパターンが文字行方向の2本の
直線、すなわち抹消線を含むか否かを判定して、その判
定結果を訂正文字判定部108に返す。訂正文字判定部
108は、抹消線が存在しないことが判明すれば輪郭情
報を文字パターン振分は部108に送るが、抹消線の存
在することが判明すれば、訂正文字削除部110に、訂
正文字パターンを含む全パターンの輪郭情報を、前記判
定結果と共に送る。訂正文字削除部110は、前記判定
結果に基づいて、全パターンから訂正文字パターンを削
除して、残ったパターンの輪郭情報を文字パターン振分
は部106に送る。文字パターン振分は部106は、公
知の適当な方法により、1文字ずつ文字パターンを切出
して、認識部111に送り、認識部111は、切出され
た各文字パターンを公知の適当な方法により認識して、
該当する文字コードを出力する。
第6図は、第1図の装置による文字切出し処理のフロー
チャートである。以下、第4図(a)のパターンを読取
る場合を例にして説明する。まずステップ850におい
て、読取るべき領域Fの位置を算出して、記憶部104
中のデータから第4図(a)のような領域Fのパターン
を抽出する。ステップS51では、領域F内で各文字パ
ターンの輪郭を第7図に示すように追跡して、第8図に
示す各文字パターンP1〜P7を抽出する。第7図は例
として数字412 I+の輪郭を示す。領域Fの左上端
からスキャンを開始して、最初に検出した白黒変化点を
開始点Sとし、そこから白黒変化点を矢印のように再び
Sに戻るまで追跡する。この時、同時に各パターンの幅
、高さ等の寸法データも算出する。全パターンの抽出が
終ると、P1〜P7のそれぞれについて、訂正文字候補
たりつるか否かをチェックする。このチェックは、例え
ば、パターン幅>1.5x(文字枠幅〕 の条件を満たすか否かを調べればよい(ステップ552
)。判定(ステップ553)の結果、P4が訂正文字候
補に挙げられ、抹消線検出処理の対象となる。まず、ス
テップS54において、直線(抹消線)パターンbl、
b2と抹消された文字のパターンdi−d3を分離する
ため、第9図に示すように、各位置における文字行方向
のランレングス値を求める。この処理は、輪郭コードか
ら2値パターンを再生するか、あるいは記憶部104か
ら改めて2値パターンを読出して、それに対して行なう
のが簡明である。次に、ステップS55において、ラン
レングス値の分布を調べる。まず。
ランレングス値Ω、が予め決められた閾値に、よりも小
さい成分を消去することにより、第10図(a)のよう
に、抹消された文字のパターンd1〜d3を消去する。
閾値に、は、例えば文字線の太第10図(b)のように
求める。次のステップS56では、前記のようにして求
めたランレングス値の分布を調べて、直線か否かを判定
するとともに、その本数を調べて、抹消線であるか否か
を決定する。直線か否かの判定は、例えば、ランレング
ス値分布のピーク値り、及びその前後一定幅内の面積S
Pが、それぞれ予め決められた閾値に、及びに、よりも
大きいという条件による。直線の本数は、前記条件を満
たすピークの個数によって決まるが、ピーク間の距離d
、が所定値よりも小さい場合は1本の線とみなす。なお
、この例では、抹消線は2本の直線とすることが予め規
定されているものとするが、他の本数を採用してもよい
以上のようにして抹消線と判定されると、ステップS5
7において、抹消線を含むパターンすなわち抹消線及び
それによって抹消された文字とみなされるパターンを、
読取り対象から除外する。
その結果、第8図のパターンP4が削除され、P1〜P
3及びP5〜P7が有効文字パターンとして残る。そこ
で、ステップ858において、これら有効文字パターン
と文字枠G1〜G7の対応付けを行ない、各文字枠に文
字パターンを第11図のように振分ける。このように振
分けられた文字パターンは、順次認識部(第1図111
)に送られて、判読される。
〔発明の効果〕
本発明によれば、訂正すべき文字を抹消線で消して余白
に正しい文字を記入するという、一般になじみやすい形
式で訂正された文字を、OCRで読取ることができる。
その結果、帳票設計上の制約は緩和され、また、記入者
の負担も軽減する。
【図面の簡単な説明】
第1図は本発明が適用されたOCRの一例のブロックダ
イヤフラム、第2図は文字訂正形式を例示する文字群の
図、第3図は従来の文字切出し処理のフローチャート、
第4図は第3図の処理内容の模式図、第5図は第3図の
処理結果の模式図、第6図は本発明による処理の一例の
フローチャート、第7図は輪郭追跡の模式図、第8図は
第6図の処理における輪郭追跡の結果の模式図、第9図
は同じくランレングス値測定処理の模式図、第10図は
同じくランレングス分布調査処理の模式図、第11図は
第6図の処理結果の模式図である。 106・・・文字パターン振分は部、107・・・輪郭
追跡部、108・・・訂正文字判定部、109・・・直
線検出部、110・・・訂正文字削除部。

Claims (1)

    【特許請求の範囲】
  1. 1、光学文字読取装置において、記入された1又は複数
    の文字をその上に重ねて記入した文字行方向の所定数の
    線分で抹消して余白に新たに文字を記入することにより
    訂正が行なわれる記録媒体の読取りのために、読取られ
    たパターン群中の各分離したパターンを抽出する過程と
    、抽出された各パターンが前記文字行方向の所定数の線
    分を含むか否かを判定する過程と、前記文字行方向の所
    定数の線分を含むと判定されたパターンを削除する過程
    とを有することを特徴とする訂正文字処理方法。
JP15760584A 1984-07-30 1984-07-30 光学文字読取装置における訂正文字処理方法 Granted JPS6136874A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP15760584A JPS6136874A (ja) 1984-07-30 1984-07-30 光学文字読取装置における訂正文字処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP15760584A JPS6136874A (ja) 1984-07-30 1984-07-30 光学文字読取装置における訂正文字処理方法

Publications (2)

Publication Number Publication Date
JPS6136874A true JPS6136874A (ja) 1986-02-21
JPH051510B2 JPH051510B2 (ja) 1993-01-08

Family

ID=15653375

Family Applications (1)

Application Number Title Priority Date Filing Date
JP15760584A Granted JPS6136874A (ja) 1984-07-30 1984-07-30 光学文字読取装置における訂正文字処理方法

Country Status (1)

Country Link
JP (1) JPS6136874A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6364183A (ja) * 1986-09-04 1988-03-22 Hitachi Ltd 光学文字読取装置
JPH01310494A (ja) * 1988-06-08 1989-12-14 Nec Corp 光学式文字読取装置
JP2009070088A (ja) * 2007-09-12 2009-04-02 Toshiba Corp 情報処理装置およびプログラム
JP2023044206A (ja) * 2021-09-17 2023-03-30 株式会社東芝 文字認識装置、文字認識方法、および文字認識プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5616277A (en) * 1979-07-17 1981-02-17 Mitsubishi Electric Corp Character reader
JPS56101272A (en) * 1980-01-16 1981-08-13 Mitsubishi Electric Corp Character reader
JPS6027083A (ja) * 1983-07-22 1985-02-12 Toshiba Corp 光学的文字読取装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5616277A (en) * 1979-07-17 1981-02-17 Mitsubishi Electric Corp Character reader
JPS56101272A (en) * 1980-01-16 1981-08-13 Mitsubishi Electric Corp Character reader
JPS6027083A (ja) * 1983-07-22 1985-02-12 Toshiba Corp 光学的文字読取装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6364183A (ja) * 1986-09-04 1988-03-22 Hitachi Ltd 光学文字読取装置
JPH01310494A (ja) * 1988-06-08 1989-12-14 Nec Corp 光学式文字読取装置
JP2009070088A (ja) * 2007-09-12 2009-04-02 Toshiba Corp 情報処理装置およびプログラム
JP2023044206A (ja) * 2021-09-17 2023-03-30 株式会社東芝 文字認識装置、文字認識方法、および文字認識プログラム

Also Published As

Publication number Publication date
JPH051510B2 (ja) 1993-01-08

Similar Documents

Publication Publication Date Title
US6909805B2 (en) Detecting and utilizing add-on information from a scanned document image
US5410611A (en) Method for identifying word bounding boxes in text
JPH05242298A (ja) 記号列の認識方法
JPH05242292A (ja) 分離方法
JPS6077279A (ja) 文字イメ−ジ切出し方法
JPS6136874A (ja) 光学文字読取装置における訂正文字処理方法
CN112541505B (zh) 文本识别方法、装置以及计算机可读存储介质
EP0042968B1 (en) Multi-registration in optical character recognition
JP3090070B2 (ja) 帳票識別方法及び装置
JPH0410087A (ja) 基本ライン抽出方法
JPH07230525A (ja) 罫線認識方法及び表処理方法
JPS63196990A (ja) バ−コ−ド読取装置
JP2902694B2 (ja) 光学式文字読取装置
JP2975720B2 (ja) 光学的文字読取装置
JPS58106665A (ja) 文字行切出し方法
CN115937867B (zh) 基于字精度的歌词时间提取方法及计算机可读存储介质
CN114359567B (zh) 一种特征数据抽取方法及装置
JP3157530B2 (ja) 文字切り出し方法
JP3196755B2 (ja) 文字の傾き検出補正方法ならびに装置
JPS6111886A (ja) 文字認識方式
KR940001386B1 (ko) 문자행 잘라내는 방법
JP3190794B2 (ja) 文字切り出し装置
JP4544691B2 (ja) 文字読取装置
JP3220226B2 (ja) 文字列方向判別方法
JP2003030585A (ja) 画像処理装置、方法、プログラム及び記憶媒体

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term