JP4092768B2 - Character recognition device and character recognition method - Google Patents
Character recognition device and character recognition method Download PDFInfo
- Publication number
- JP4092768B2 JP4092768B2 JP10890498A JP10890498A JP4092768B2 JP 4092768 B2 JP4092768 B2 JP 4092768B2 JP 10890498 A JP10890498 A JP 10890498A JP 10890498 A JP10890498 A JP 10890498A JP 4092768 B2 JP4092768 B2 JP 4092768B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- characters
- erroneous
- correct
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、文字認識装置および文字認識方法に関し、さらに詳しくは、手書きの文字列中の誤認識しやすい文字を容易に修正できる文字認識装置および文字認識方法に関する。
【0002】
【従来の技術】
従来の文字認識装置では、帳票上の手書き文字(氏名,住所など)を読み取り、文字認識を行ってその結果をオペレータに対して表示させる。そして、オペレータは、元の手書き文字と比較しながらまたは経験に基づいて、誤認識されている文字を見つけて手動で修正する。
【0003】
【発明が解決しようとする課題】
しかしながら、誤認識されている文字を手動で修正すると、作業に時間がかかり、作業の効率が低下する問題がある。また、誤認識されている文字の字形が元の文字の字形に似ている場合が多いため、オペレータが誤認識されている文字を見落としてしまうことがあり、文字認識の信頼性が劣化する。
【0004】
これを解決するために、従来、氏名,地名,単語,熟語など(以下、単語と言う)を登録した単語辞書を用意し、文字認識の結果をその単語辞書中の単語と照合し、文字認識の結果が単語辞書中の単語と一致しないときに誤認識と判断してオペレータによる修正を行うようなことが行われている。
ところが、誤認識の文字が単語辞書にある場合は正認識とされてしまうので、文字認識の信頼性が劣化する。
【0005】
【課題を解決するための手段】
本発明の発明者が研究を行った結果、文字認識装置で文字認識するときに、例えば「士」と「土」,「未」と「末」,「治」と「冶」,「日」と「目」,「大」と「犬」,「見」と「貝」,「A」と「D」のように誤認識しやすい類似する文字があることが分かった。
【0006】
そこで、本発明は、文字を記入するための枠が設けられている一般フィールドと該一般フィールドに誤認識し易い文字がある場合に正しい文字である正文字を記入する枠および間違いの文字である誤文字を記入するための枠と設けられている要注意文字指定フィールドとを備えた帳票を読み取る読取手段と、前記一般フィールド中の文字と前記要注意文字指定フィールド中の正文字を記入する枠内に記入された文字および誤文字を記入するための枠内に記入された文字を認識する文字認識手段と、前記一般フィールド中に前記誤認識しやすい誤文字が存在する場合にその文字を前記誤認識しやすい正文字に置き換える文字置換手段とを具備したことを特徴とする文字認識装置を提供する。
【0007】
上記文字認識装置では、帳票の一般フィールドに内容を記入すると共に要注意文字指定フィールドに誤認識しやすい正文字(例えば「士」)と誤文字(例えば「土」)を記入し、一般フィールドと要注意文字指定フィールドの誤認識しやすい正文字と誤文字を文字認識し、一般フィールド内に誤認識しやすい誤文字がある場合にその文字を誤認識しやすい正文字に置き換える。このため、一般フィールド内の誤認識しやすい誤文字を誤認識しやすい正文字に自動的に置き換えることが可能となるので、誤認識されている文字を手動で修正する必要がなくなり、作業の効率と文字認識の信頼性が向上する。
【0008】
また、本発明は、上記構成の文字読取装において、認識を行って得た前記誤認識しやすい正文字と誤文字を表示する表示手段と、前記誤認識しやすい正文字または誤文字が誤認識されている場合にその誤認識しやすい正文字または誤文字を修正するための入力手段とを具備したことを特徴とする文字認識装置を提供する。
【0009】
上記文字認識装置では、文字認識した要注意文字指定フィールドの誤認識しやすい正文字と誤文字をオペレータに対して表示し、誤認識しやすい正文字または誤文字が誤認識されている場合にオペレータがそれらの文字を修正する。このため、一般フィールド内の文字が誤認識されている文字に置換えられてしまうことを防止でき、作業の効率と文字認識の信頼性が向上する。
【0010】
また、本発明は、上記構成の文字読取装置において、前記表示手段は、前記一般フィールドの文字列中に前記誤認識しやすい誤文字が存在する場合にその文字列を表示し、前記文字置換手段は、前記入力手段から指摘されたときにのみ、前記文字列中の前記誤認識しやすい誤文字を前記誤認識しやすい正文字に置き換えることを特徴とする文字認識装置を提供する。
【0011】
上記文字認識装置では、一般フィールドの誤認識しやすい誤文字が存在する文字列を、誤認識しやすい誤文字を誤認識しやすい正文字に置き換える前にオペレータに対して表示し、オペレータが文字を置き換えるか否かを判断する。このため、置き換えてはいけない文字もが置き換えられてしまうことを防止でき、作業の効率と文字認識の信頼性が向上する。
【0012】
また、本発明は、文字を記入するための枠が設けられている一般フィールドと該一般フィールドに誤認識し易い文字がある場合に正しい文字である正文字を記入する枠および間違いの文字である誤文字を記入するための枠と設けられている要注意文字指定フィールドとを備えた帳票を読取手段で読み取り、前記一般フィールド中の文字と前記要注意文字指定フィールド中の正文字を記入する枠内に記入された文字および誤文字を記入するための枠内に記入された文字を文字認識手段で認識し、前記誤認識しやすい正文字と誤文字を表示手段でオペレータに対して表示し、前記誤認識しやすい正文字または誤文字が誤認識されている場合にその誤認識しやすい正文字または誤文字の修正を入力手段で入力させ、前記一般フィールド中に前記誤認識しやすい誤文字が存在する場合にその誤認識しやすい誤文字を他の文字と異なる表示態様で前記表示手段に表示し、前記一般フィールド中の前記誤認識しやすい誤文字を前記誤認識しやすい正文字に文字置換手段で置き換えることを特徴とする文字認識方法を提供する。
【0013】
上記文字認識方法では、誤認識しやすい正文字または誤文字が誤認識されている場合にオペレータがそれらの文字を修正できることと、誤認識しやすい誤文字を誤認識しやすい正文字に置き換える前にオペレータに文字を置き換えるか否かを判断させることと、オペレータが文字の置き換えを指示したときに一般フィールド内の誤認識しやすい誤文字を誤認識しやすい正文字に自動的に置き換えることが可能となり、作業の効率と文字認識の信頼性が向上する。
【0014】
【発明の実施の形態】
以下、図に示す実施の形態により本発明をさらに詳細に説明する。なお、これにより本発明が限定されるものではない。
−第1実施形態−
図1は、本発明の第1実施形態の文字認識装置を機能的に示すブロック図である。
【0015】
この文字認識装置100は、帳票Cを読み取って文書画像を得る帳票読取装置10と、文書画像を文字,表,罫線,図および写真の領域に分割するレイアウト解析部20と、文書画像中の文字領域および表領域について文字認識を行う文字認識部30と、後術するように誤認識しやすい誤文字を誤認識しやすい正文字に置き換える文字置換部40と、文字置換部40に対して指示を与えたり,文字を修正するための入力部41と、文字認識の結果を単語辞書51中の単語と照合すると共に出力すべき文字を決定する単語照合部50と、出力すべき文字を画像データに変換する出力形成部70と、前記画像データを表示する表示部70とを具備している。
【0016】
図2は、文字認識装置100をハードウェア的に示すブロック図である。
この文字認識装置100は、装置全体をROM82やハードディスク84に記憶されているプログラムに基いて制御するCPU81と、オペレーティングシステムやプログラムやデータなどを記憶するROM82と、CPU81のワークエリアとして使用されるRAM83と、データやプログラムや前記単語辞書51などを記憶するハードディスク84と、文字認識の結果または出力すべき文字などを表示するディスプレイ85と、操作の指示を与えたり,文字(数字,記号を含む)を入力するためのキーを有するキーボード86と、操作の指示を与えたり,ディスプレイ85上の場所を指摘するためのマウス87と、通信回線を介して装置を他のコンピュータと接続するためのモデム88と、帳票を読み取って文書画像を得るスキャナ89と、上記各部をそれぞれ接続するためのバス80とを有する。
【0017】
なお、スキャナ89は、図1中の帳票読取装置10としての機能を持っている。また、CPU81は、図1中のレイアウト解析部20と文字認識部30と文字置換部40と単語照合部50と出力形成部60としての機能を持っている。
図3に、本発明で用いる帳票Cの例示を示す。なお、ここでは、本発明を説明するために帳票の代表として「家族登録カード」を用いるが、この限りではなく、本発明はどの帳票にも適用できる。
【0018】
この帳票Cには、一般フィールドF1と要注意文字指定フィールドF2とがある。前記一般フィールドF1には、家族全員の氏名,年齢,職業コードを手書きで記入するための枠が設けられてある。前記要注意文字指定フィールドF2には、一般フィールドF1に誤認識しやすい文字がある場合に正しい文字(以下、誤認識しやすい正文字と言う)を手書きで記入するための枠W1と間違い文字(以下、誤認識しやすい誤文字と言う)を手書きで記入するための枠W2とが設けられてある。
【0019】
一般フィールドF1に誤認識しやすい文字がある場合は、記入者本人または前記スキャン89を操作して帳票Cを読み取らせる係員が、前記枠W1,W2それぞれに誤認識しやすい正文字と誤文字を記入する。例えば、図3の例では、名字の「士方」の文字「士」が「土」に誤認識しやすいので、誤認識しやすい正文字として枠W1に「士」を記入し、誤認識しやすい誤文字として枠W2に「土」を記入する。
【0020】
次に、図4のフローチャートを用いて、上記文字認識装置における文字認識処理を説明する。
ステップS1では、スキャナ89により、帳票Cの一般フィールドF1と要注意文字指定フィールドF2を読み取って文書画像を得る。
ステップS2では、CPU81は、要注意文字指定フィールドF2中の枠W1,W2に記入されている誤認識しやすい正文字と誤文字を認識する。ここで、例えば、誤認識しやすい正文字としては「土」を、誤認識しやすい誤文字としては「士」を認識したと仮定する。
【0021】
ステップS3では、CPU81は、認識した誤認識しやすい正文字と誤文字を図5に示すように、オペレータに対して、ディスプレイ85の画面Gに表示する。
ステップS4では、オペレータが、誤認識しやすい正文字と誤文字は正しく認識されたか否かを確認する。なお、この確認は、元の帳票Cを見ながらを行うかまたは文書画像を見ながら行う。誤認識しやすい正文字と誤文字は正しく認識されているならばステップS6に進み、誤認識しやすい正文字と誤文字は正しく認識されていないならばステップS5に進む。
【0022】
ステップS5では、オペレータが、キーボード86を用いて、図6に示すように、誤認識しやすい正文字と誤文字を修正する。なお、図3の帳票Cの枠W1,W2それぞれに「士」と「土」が記入されているため、オペレータが誤認識しやすい正文字を「士」と修正し、誤認識しやすい誤文字を「土」と修正する。
ステップS6では、CPU81が、一般フィールドF1中の文字を認識し、図7に示すように、オペレータに対して、ディスプレイ85の画面Gに表示する。ここで、名字の「士方」の「士」が「土」に誤認識されたと仮定する。
【0023】
ステップS7では、CPU81は、一般フィールドF1の認識した文字列中に誤認識しやすい誤文字があるか否かを判定する。一般フィールドF1の認識した文字列中に誤認識しやすい誤文字があるならステップS8に進み、一般フィールドF1の認識した文字列中に誤認識しやすい誤文字がないならステップS9に進む。なお、誤認識しやすい誤文字は「土」であり、図7に示すように、一般フィールドF1の認識した文字列中に「土方 太郎」,「土方 花子」があるので、CPU81は、一般フィールドF1の認識した文字列中に誤認識しやすい誤文字があると判断する。
【0024】
ステップS8では、CPU81は、一般フィールドF1の認識した文字列中の誤認識しやすい誤文字を誤認識しやすい正文字に置き換える。これにより、図8に示すように、「土方 太郎」,「土方 花子」は、「土」の文字が「士」に置き換えられるので、自動的に「士方 太郎」,「士方 花子」に修正される。
ステップS9では、CPU81は、一般フィールドF1の認識した文字列をハードディスク84中の単語辞書中の単語と照合する。そして、単語辞書中に同一の単語がある場合は、認識した文字列を出力すべき文字として決定する。なお、単語辞書中に同一の単語がない場合は、オペレータに対して手動修正を行うようにメッセージを表示する。なお、単語照合については、従来と同様なのでその説明は省略する。
【0025】
上記文字認識装置100では、帳票Cの要注意文字指定フィールドF2中の誤認識しやすい正文字と誤認識しやすい誤文字を認識し、帳票Cの一般フィールドF1を文字認識し、一般フィールドF1内に誤認識しやすい誤文字があればその文字を誤認識しやすい正文字に置き換える。このため、一般フィールド内の誤認識しやすい誤文字を誤認識しやすい正文字に自動的に置き換えることができるので、誤認識されている文字を手動で修正する必要がなくなり、作業の効率と文字認識の信頼性が向上する。
−第2実施形態−
本発明の第2実施形態の文字認識装置は上記文字認識装置100と同様の構成をしているため、その説明は省略する。
【0026】
上記第1実施形態では、オペレータが誤認識しやすい正文字と誤文字を文字認識の結果を確認して文字認識が間違っていれば誤認識しやすい正文字と誤文字を修正するが、本発明の第2実施形態では、図9のフローチャートに示すように、オペレータは誤認識しやすい正文字と誤文字の文字認識を確認しないようにした。
【0027】
なお、図9のフローチャートのステップS1,S2とステップS6〜ステップS9は、図4のフローチャートのステップS1,S2とステップS6〜ステップS9と同様であるのでその説明は省略する。
上記第2実施形態の文字認識装置では、オペレータの介入なしで処理を進めることができるから、作業の効率が向上する。また、例えば大量の帳票を読み取るときに、帳票をスキャナに全てセットし、読み取りをスタートさせれば、オペレータがディスプレイの前を離れて別の作業を行うことが可能となる。なお、この場合は、全ての帳票を読み取ったのち、オペレータが誤認識しやすい正文字と誤文字を文字認識の結果を確認して文字認識が間違っていればまとめて修正作業を行えばよい。
−第3実施形態−
上記第1および第2実施形態では一般フィールド内の全ての誤認識しやすい誤文字を誤認識しやすい正文字に置き換えるが、以下に説明する第3実施形態ではオペレータが文字を置き換えるように指示をしたときにのみ文字を置き換える。
【0028】
本発明の第3実施形態の文字認識装置は上記文字認識装置100と同様の構成をしているため、その説明は省略する。
第3実施形態の文字認識装置は、図4または図9のフローチャートのステップS8の代りに図10に示すステップS81〜ステップ85を用いて文字認識を行う。なお、ステップS1〜ステップS7とステップS9の説明は省略する。
【0029】
ステップS81では、一般フィールドF1の誤認識しやすい誤文字の表示態様を、図11に示すように、変更すると共にその文字にカーソルを移動する。図11の例では、「土方 太郎」の「土」の文字を中抜で表示しているが、文字のフォントや色を変えたり、グレーアウト表示したり、点滅させることもが考えられる。
【0030】
ステップS82では、オペレータから誤認識しやすい誤文字を誤認識しやすい正文字に置き換える指示があったか否かを判断する。オペレータから文字を置き換える指示があったならばステップS83に進み、オペレータから文字を置き換える指示がないならステップS84に進む。
ステップS83では、カーソルが位置する文字を誤認識しやすい正文字に置き換える。なお、上記ステップS82でオペレータが「土方 太郎」の「土」の文字を置き換えるように指示したなら、このステップS83において「土方 太郎」は「士方 太郎」に修正される。
【0031】
ステップS84では、一般フィールドF1の全ての誤認識しやすい誤文字に対して置き換えるか否かの確認を行ったかをチェックする。全ての誤認識しやすい誤文字に対して確認を行ったなら図4または図9のステップS9に進み、全ての誤認識しやすい誤文字に対して確認を行っていないならステップS85に進む。ステップS85では、一般フィールドF1の次の誤認識しやすい誤文字の表示態様を変更すると共にその文字にカーソルを移動する。例えば、図11の例では、「土方 花子」の「土」の文字を中抜で表示させると共にその文字にカーソルを移動する。そして、ステップS82〜ステップS84を繰り返す。
【0032】
上記第3実施形態の文字認識装置では、一般フィールド内の誤認識しやすい誤文字を誤認識しやすい正文字に置き換えるときに文字を置き換えるか否かをオペレータに確認させる。このため、置き換えてはいけない文字もが置き換えられてしまうことを防止できるので、作業の効率と文字認識の信頼性が向上する。
【0033】
【発明の効果】
以上説明したように、本発明では、帳票に設けてある一般フィールドと要注意文字指定フィールドを読み取る読取手段と、前記一般フィールド中の文字および前記要注意文字指定フィールド中の誤認識しやすい正文字と誤文字を認識する文字認識手段と、前記一般フィールドの文字列中に前記誤認識しやすい誤文字が存在する場合にその文字を前記誤認識しやすい正文字に置き換える文字置換手段とを具備したことを特徴とする文字認識装置を提供する。このため、一般フィールド内の誤認識しやすい誤文字を誤認識しやすい正文字に自動的に置き換えることができるので、誤認識されている文字を手動で修正する必要がなくなり、作業の効率と文字認識の信頼性が向上する。
【図面の簡単な説明】
【図1】本発明の第1実施形態の文字認識装置を機能的に示すブロック図である。
【図2】図1の文字認識装置をハードウェア的に示すブロック図である。
【図3】本発明で用いる帳票の例示図である。
【図4】図1の文字認識装置における文字読取処理のフローチャートである。
【図5】要注意指定文字の認識確認の説明図である。
【図6】要注意指定文字の修正の説明図である。
【図7】修正画面の例示図である。
【図8】誤認識しやすい文字の修正の説明図である。
【図9】第2実施形態の文字認識装置における文字読取処理のフローチャートである。
【図10】第3実施形態の文字認識装置における文字読取処理のフローチャートである。
【図11】文字の表示態様の変更の説明図である。
【符号の説明】
100 文字認識装置
10 帳票読取装置
20 レイアウト解析部
30 文字認識部
40 文字置換部
41 入力装置
50 単語照合部
51 単語辞書
60 出力形成部
70 表示部[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a character recognition device and a character recognition method, and more particularly to a character recognition device and a character recognition method that can easily correct a character that is easily misrecognized in a handwritten character string.
[0002]
[Prior art]
In a conventional character recognition device, handwritten characters (name, address, etc.) on a form are read, character recognition is performed, and the result is displayed to the operator. The operator then finds and corrects the misrecognized character manually while comparing it with the original handwritten character or based on experience.
[0003]
[Problems to be solved by the invention]
However, manually correcting a misrecognized character has a problem that it takes time to work and lowers work efficiency. In addition, since the character shape of the erroneously recognized character is often similar to the character shape of the original character, the operator may miss the character that has been erroneously recognized, thereby degrading the reliability of character recognition.
[0004]
In order to solve this problem, a word dictionary in which names, place names, words, idioms (hereinafter referred to as words) are registered, and character recognition results are collated with words in the word dictionary to recognize characters. When the result does not match the word in the word dictionary, it is determined that the recognition is incorrect and the operator makes corrections.
However, when a misrecognized character is in the word dictionary, it is regarded as a correct recognition, so that the reliability of character recognition deteriorates.
[0005]
[Means for Solving the Problems]
As a result of research conducted by the inventor of the present invention, when characters are recognized by a character recognition device, for example, “shi” and “sat”, “un” and “end”, “ji” and “ji”, “day” And “eyes”, “large” and “dog”, “see” and “shellfish”, “A” and “D”, and similar characters that are easily misrecognized.
[0006]
Therefore, the present invention provides a general field in which a frame for entering characters is provided, a frame for entering a correct character that is a correct character when there is a character that is easily misrecognized, and an erroneous character. Reading means for reading a form provided with a frame for entering erroneous characters and a caution character designation field provided, and a frame for entering characters in the general field and correct characters in the caution character designation field A character recognizing means for recognizing characters entered in a frame for entering a character and an erroneous character entered therein, and when the erroneous character that is easily misrecognized exists in the general field, the character is There is provided a character recognition device comprising character replacement means for replacing with a positive character that is easily misrecognized.
[0007]
In the above character recognition device, contents are entered in the general field of the form, and correct characters (for example, “shi”) and erroneous characters (for example, “sat”) that are easily misrecognized are entered in the required character designation field. Characters that are easily misrecognized and erroneous characters in the character designation field needing attention are recognized, and if there is an erroneous character that is easily misrecognized in the general field, the character is replaced with an easily recognizable positive character. This makes it possible to automatically replace misrecognized erroneous characters in general fields with easily misrecognized positive characters, eliminating the need to manually correct misrecognized characters and improving work efficiency. And the reliability of character recognition is improved.
[0008]
According to the present invention, in the character reader configured as described above, the correct character that is easily misrecognized and the display unit that displays the erroneous character obtained by performing recognition, and the correct character or erroneous character that is easily misrecognized are erroneously recognized. A character recognition apparatus comprising: a correct character that is easy to be erroneously recognized in the case where it is recognized, or an input means for correcting the erroneous character.
[0009]
In the above character recognition device, correct characters that are easily misrecognized and erroneous characters in the character-required character designation field that has been recognized are displayed to the operator, and if the correct or misrecognized correct characters are erroneously recognized, the operator Will correct those characters. For this reason, it is possible to prevent characters in the general field from being replaced with characters that have been misrecognized, thereby improving work efficiency and character recognition reliability.
[0010]
Further, the present invention provides the character reader of the above configuration, wherein the display means displays a character string when the erroneous character that is easily misrecognized exists in the character string of the general field, and the character replacement means Provides a character recognizing device that replaces the erroneously easily misrecognized character in the character string with the easily misrecognized normal character only when pointed out by the input means.
[0011]
In the above character recognition device, a character string that contains erroneous characters that are easily misrecognized in the general field is displayed to the operator before replacing the erroneous characters that are easily misrecognized with the correct characters that are easily misrecognized. Determine whether to replace. For this reason, it is possible to prevent characters that should not be replaced from being replaced, and work efficiency and reliability of character recognition are improved.
[0012]
In addition, the present invention provides a general field in which a frame for entering characters is provided, a frame for entering a correct character that is a correct character when there is a character that is easily misrecognized, and an erroneous character. A frame in which a form having a frame for entering erroneous characters and a required character designation field provided is read by reading means, and a character in the general field and a correct character in the special character designation field are entered. Recognize characters entered in the frame for entering characters and wrong characters in the character recognition means, and display the correct characters and erroneous characters that are easy to misrecognize to the operator by display means , is input by the input means when the correction of the erroneous recognition easily positive character or erroneous character which the erroneously recognized easily positive character or erroneous characters are misrecognized, the misidentification in the general field Its erroneously recognized easily erroneous character displayed on said display means in a display mode different from the other characters, the erroneous easily easily erroneous character erroneously recognized the recognition in the general field when is likely erroneous character exists Provided is a character recognition method characterized by replacing a normal character with a character replacement means .
[0013]
In the above character recognition method, correct characters that are easily misrecognized or erroneous characters are recognized by the operator, and before replacing misrecognized characters that are easily misrecognized with correct characters that are easy to misrecognize. It is possible to let the operator determine whether or not to replace characters, and to automatically replace erroneous characters in the general field that are easy to be mistakenly recognized with positive characters that are easy to misrecognize when the operator instructs to replace characters. , Work efficiency and character recognition reliability will improve.
[0014]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, the present invention will be described in more detail with reference to embodiments shown in the drawings. Note that the present invention is not limited thereby.
-First embodiment-
FIG. 1 is a block diagram functionally showing the character recognition apparatus according to the first embodiment of the present invention.
[0015]
The
[0016]
FIG. 2 is a block diagram showing the
The
[0017]
The
FIG. 3 shows an example of a form C used in the present invention. Here, in order to explain the present invention, a “family registration card” is used as a representative form, but the present invention is not limited to this, and the present invention can be applied to any form.
[0018]
This form C includes a general field F1 and a cautionary character designation field F2. The general field F1 is provided with a frame for handwriting the name, age, and occupation code of the whole family. In the caution character designation field F2, when there is a character that is easily misrecognized in the general field F1, a frame W1 for entering a correct character (hereinafter referred to as a correct character that is easily misrecognized) and an erroneous character ( Hereinafter, a frame W2 for handwritten entry of an erroneous character that is easily misrecognized) is provided.
[0019]
If there is a character that is easily misrecognized in the general field F1, the writer himself or a staff member who operates the
[0020]
Next, character recognition processing in the character recognition device will be described with reference to the flowchart of FIG.
In step S1, the
In step S2, the
[0021]
In step S3, the
In step S4, the operator confirms whether or not correct characters and erroneous characters that are easily erroneously recognized are correctly recognized. This confirmation is performed while looking at the original form C or while looking at the document image. If the correct character and the erroneous character that are easily misrecognized are correctly recognized, the process proceeds to step S6. If the correct character that is easily misrecognized and the erroneous character is not correctly recognized, the process proceeds to step S5.
[0022]
In step S <b> 5, the operator corrects correct characters and erroneous characters that are easily misrecognized as shown in FIG. 6 using the
In step S6, the
[0023]
In step S7, the
[0024]
In step S8, the
In step S <b> 9, the
[0025]
The
-Second Embodiment-
Since the character recognition device according to the second embodiment of the present invention has the same configuration as the
[0026]
In the first embodiment, correct characters and erroneous characters that are easy to be erroneously recognized by the operator are confirmed, and if the character recognition is incorrect, correct characters and erroneous characters that are erroneously recognized are corrected. In the second embodiment, as shown in the flowchart of FIG. 9, the operator does not confirm the recognition of the correct character and the erroneous character that are easily erroneously recognized.
[0027]
Note that steps S1 and S2 and steps S6 to S9 in the flowchart of FIG. 9 are the same as steps S1 and S2 and steps S6 to S9 in the flowchart of FIG.
In the character recognition device of the second embodiment, the process can proceed without operator intervention, so the work efficiency is improved. For example, when reading a large amount of forms, if all forms are set in the scanner and reading is started, the operator can leave the display and perform another work. In this case, after all the forms have been read, the correct character that is easily misrecognized by the operator and the erroneous character are confirmed, and if the character recognition is incorrect, the correction work may be performed collectively.
-Third embodiment-
In the first and second embodiments, all erroneous characters that are easily misrecognized in the general field are replaced with easy-to-recognize correct characters. In the third embodiment described below, the operator instructs to replace the characters. Replace characters only when
[0028]
Since the character recognition device according to the third embodiment of the present invention has the same configuration as that of the
The character recognition apparatus according to the third embodiment performs character recognition using steps S81 to 85 shown in FIG. 10 instead of step S8 in the flowchart of FIG. 4 or FIG. In addition, description of step S1-step S7 and step S9 is abbreviate | omitted.
[0029]
In step S81, the display mode of erroneous characters that are easily misrecognized in the general field F1 is changed as shown in FIG. 11, and the cursor is moved to the characters. In the example of FIG. 11, the character “Sat” of “Taro Hijikata” is displayed in the middle, but it is also possible to change the font and color of the character, display it in gray out, or blink it.
[0030]
In step S82, it is determined whether or not there has been an instruction from the operator to replace erroneous characters that are easily misrecognized with correct characters that are easily misrecognized. If there is an instruction to replace the character from the operator, the process proceeds to step S83, and if there is no instruction to replace the character from the operator, the process proceeds to step S84.
In step S83, the character at which the cursor is positioned is replaced with a correct character that is easily misrecognized. If the operator instructs to replace the character “Sat” of “Taro Hijikata” in step S82, “Taro Hijikata” is corrected to “Taro Shikata” in step S83.
[0031]
In step S84, it is checked whether or not it has been confirmed whether or not to replace all erroneous characters that are easily misrecognized in the general field F1. If confirmation has been performed for all erroneous characters that are likely to be erroneously recognized, the process proceeds to step S9 in FIG. 4 or FIG. 9. If confirmation has not been performed for all erroneous characters that are likely to be erroneously recognized, the process proceeds to step S85. In step S85, the display mode of the erroneous character that is likely to be erroneously recognized next in the general field F1 is changed and the cursor is moved to the character. For example, in the example of FIG. 11, the characters “Sat” of “Hanakata Hanako” are displayed in a hollow shape and the cursor is moved to the characters. Then, Step S82 to Step S84 are repeated.
[0032]
In the character recognition device of the third embodiment, the operator confirms whether or not to replace characters when replacing erroneous characters that are easily misrecognized in the general field with correct characters that are easily misrecognized. For this reason, it is possible to prevent characters that should not be replaced from being replaced, so that the work efficiency and the reliability of character recognition are improved.
[0033]
【The invention's effect】
As described above, in the present invention, the reading means for reading the general field and the caution character designation field provided in the form, the characters in the general field, and the correct characters that are easily misrecognized in the caution character designation field. A character recognizing means for recognizing an erroneous character, and a character replacement means for replacing the character with the correct easy-to-recognize character when the erroneous character easily misrecognized exists in the character string of the general field. A character recognition device is provided. For this reason, misrecognized erroneous characters in general fields can be automatically replaced with easy-to-recognize correct characters, eliminating the need to manually correct misrecognized characters and improving work efficiency and characters. Recognition reliability is improved.
[Brief description of the drawings]
FIG. 1 is a block diagram functionally showing a character recognition device according to a first embodiment of the present invention.
FIG. 2 is a block diagram showing the character recognition apparatus of FIG. 1 in hardware.
FIG. 3 is a view showing an example of a form used in the present invention.
4 is a flowchart of character reading processing in the character recognition device of FIG. 1; FIG.
FIG. 5 is an explanatory diagram of confirmation of recognition of a character requiring special attention.
FIG. 6 is an explanatory diagram of correction of a caution designation character.
FIG. 7 is a view showing an example of a correction screen.
FIG. 8 is an explanatory diagram of correction of characters that are easily misrecognized.
FIG. 9 is a flowchart of a character reading process in the character recognition device of the second embodiment.
FIG. 10 is a flowchart of a character reading process in the character recognition device according to the third embodiment.
FIG. 11 is an explanatory diagram of changing the display mode of characters.
[Explanation of symbols]
DESCRIPTION OF
Claims (5)
前記一般フィールド中の文字と前記要注意文字指定フィールド中の正文字を記入する枠内に記入された文字および誤文字を記入するための枠内に記入された文字を認識する文字認識手段と、
前記一般フィールド中に前記誤認識しやすい誤文字が存在する場合にその文字を前記誤認識しやすい正文字に置き換える文字置換手段とを具備したことを特徴とする文字認識装置。 To fill in a general field provided with a frame for entering characters and a frame for entering correct characters as correct characters and incorrect characters as incorrect characters when there are easily misrecognized characters in the general field. A reading means for reading a form having a frame and a required character designation field provided ,
Character recognition means for recognizing characters entered in a frame for entering a character in the general field and a character for entering a correct character in the required character designation field and a character for entering an erroneous character ;
A character recognition device comprising: character replacement means for replacing an erroneous character that is easily misrecognized with the correct character that is easily misrecognized in the general field.
認識を行って得た前記誤認識しやすい正文字と誤文字を表示する表示手段と、
前記誤認識しやすい正文字または誤文字が誤認識されている場合にその誤認識しやすい正文字または誤文字を修正するための入力手段とを具備したことを特徴とする文字認識装置。In claim 1,
Display means for displaying the positive characters and the erroneous characters that are easily misrecognized, obtained by performing recognition,
A character recognition apparatus comprising: an input unit for correcting a correct character or an erroneous character that is easily misrecognized when the correct character or erroneous character that is easily recognized is erroneously recognized.
前記表示手段は、前記一般フィールド中に前記誤認識しやすい誤文字が存在する場合にその誤認識しやすい誤文字を他の文字と異なる表示態様で表示し、
前記文字置換手段は、前記入力手段から指摘されたときにのみ、前記誤認識しやすい誤文字を前記誤認識しやすい正文字に置き換えることを特徴とする文字認識装置。In claim 2,
The display means displays the erroneous character that is easily misrecognized in a display mode different from other characters when the erroneous character that is easily misrecognized exists in the general field,
The character recognition device, wherein the character replacement means replaces the erroneous character that is easy to be erroneously recognized with the correct character that is easily erroneously recognized only when pointed out by the input means.
前記一般フィールド中の文字と前記要注意文字指定フィールド中の正文字を記入する枠内に記入された文字および誤文字を記入するための枠内に記入された文字を文字認識手段で認識し、
前記誤認識しやすい正文字と誤文字を表示手段でオペレータに対して表示し、
前記誤認識しやすい正文字または誤文字が誤認識されている場合にその誤認識しやすい正文字または誤文字の修正を入力手段で入力させ、
前記一般フィールド中に前記誤認識しやすい誤文字が存在する場合にその誤認識しやすい誤文字を他の文字と異なる表示態様で前記表示手段に表示し、
前記一般フィールド中の前記誤認識しやすい誤文字を前記誤認識しやすい正文字に文字置換手段で置き換えることを特徴とする文字認識方法。 To fill in a general field provided with a frame for entering characters and a frame for entering correct characters as correct characters and incorrect characters as incorrect characters when there are easily misrecognized characters in the general field. Read the form with the frame and the required character designation field provided by the reading means ,
Recognize the characters entered in the frame for entering the characters in the general field and the correct characters in the required character designation field and the characters entered in the frame for entering erroneous characters by the character recognition means ,
Displaying the correct characters and erroneous characters that are easily misrecognized to the operator by display means ,
When correct characters that are easily misrecognized or incorrect characters are misrecognized, correct characters that are easily misrecognized or correction of erroneous characters are input by the input means ,
Displayed on the display unit at the erroneous recognition easily erroneous character different from the other character display mode when the erroneously recognized easily erroneous characters in the general field is present,
Character recognition method characterized by replacing the character substitution means to the erroneously recognized easily positive characters recognizable erroneous character erroneously said in the general field.
前記一般フィールド中の文字と前記要注意文字指定フィールド中の正文字を記入する枠内に記入された文字および誤文字を記入するための枠内に記入された文字を文字認識手段で認識し、
前記一般フィールド中の前記誤認識しやすい誤文字を前記誤認識しやすい正文字に文字置換手段で置き換えることを特徴とする文字認識方法。 To fill in a general field provided with a frame for entering characters and a frame for entering correct characters as correct characters and incorrect characters as incorrect characters when there are easily misrecognized characters in the general field. Read the form with the frame and the required character designation field provided by the reading means ,
Recognize the characters entered in the frame for entering the characters in the general field and the correct characters in the required character designation field and the characters entered in the frame for entering erroneous characters by the character recognition means ,
Character recognition method characterized by replacing the character substitution means to the erroneously recognized easily positive characters recognizable erroneous character erroneously said in the general field.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP10890498A JP4092768B2 (en) | 1998-04-20 | 1998-04-20 | Character recognition device and character recognition method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP10890498A JP4092768B2 (en) | 1998-04-20 | 1998-04-20 | Character recognition device and character recognition method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH11306279A JPH11306279A (en) | 1999-11-05 |
| JP4092768B2 true JP4092768B2 (en) | 2008-05-28 |
Family
ID=14496587
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP10890498A Expired - Fee Related JP4092768B2 (en) | 1998-04-20 | 1998-04-20 | Character recognition device and character recognition method |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4092768B2 (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7176566B2 (en) * | 2018-08-27 | 2022-11-22 | 京セラドキュメントソリューションズ株式会社 | OCR system |
-
1998
- 1998-04-20 JP JP10890498A patent/JP4092768B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JPH11306279A (en) | 1999-11-05 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR100570224B1 (en) | Form definition data creation method and form handling machines | |
| JP2835178B2 (en) | Document reading device | |
| US6958755B1 (en) | Personalized computer fonts | |
| JP4092768B2 (en) | Character recognition device and character recognition method | |
| WO2002003240A1 (en) | Proofreading system of chinese characters by means of one-to-one comparison | |
| JP3159087B2 (en) | Document collation device and method | |
| JP6994727B1 (en) | Reading system, reading program and reading method | |
| JPH064717A (en) | Kanji address correction processing method | |
| JP3928739B2 (en) | Document filing system | |
| JP3484446B2 (en) | Optical character recognition device | |
| JPS63146187A (en) | Character recognizing device | |
| JPH11213087A (en) | Character recognition device | |
| JP3083171B2 (en) | Character recognition apparatus and method | |
| US7668407B1 (en) | Contextual resolution of character assignments | |
| JP4081074B2 (en) | Form processing apparatus, form processing method, and form processing program | |
| JPH01292586A (en) | Back-up device for recognition of character | |
| JP2731394B2 (en) | Character input device | |
| JP2825523B2 (en) | Character recognition device | |
| JPH0696272A (en) | Business form format definition body generating device | |
| JPH0713991A (en) | Mistaken character corrector | |
| JPH09138835A (en) | Character recognition device | |
| JPH11120294A (en) | Character recognition device and medium | |
| JPH02195488A (en) | Character recognizing device | |
| JP2006163445A (en) | Business form reader and reading system, and reading method using them | |
| JP2829186B2 (en) | Optical character reader |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040824 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071218 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080121 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080212 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080225 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110314 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| LAPS | Cancellation because of no payment of annual fees |