JP3221968B2 - Character recognition device - Google Patents
Character recognition deviceInfo
- Publication number
- JP3221968B2 JP3221968B2 JP07660193A JP7660193A JP3221968B2 JP 3221968 B2 JP3221968 B2 JP 3221968B2 JP 07660193 A JP07660193 A JP 07660193A JP 7660193 A JP7660193 A JP 7660193A JP 3221968 B2 JP3221968 B2 JP 3221968B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- candidate
- unit
- character
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012545 processing Methods 0.000 claims description 28
- 238000012805 post-processing Methods 0.000 claims description 10
- 238000000034 method Methods 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000012937 correction Methods 0.000 description 4
- 238000012790 confirmation Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000004397 blinking Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 235000019557 luminance Nutrition 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Description
【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION
【0001】[0001]
【産業上の利用分野】この発明は、迅速かつ正確に帳票
または文書を処理できるようにした操作性の良い文字認
識装置に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an easy-to-operate character recognition device capable of processing a form or document quickly and accurately.
【0002】[0002]
【従来の技術】従来より、手書き文字の認識率を向上さ
せるために、知識辞書が用いられている。知識辞書が保
持する情報は、認識対象とする単語の情報、文脈情報、
およびその他の情報である。文字認識装置の利用者は新
たにこれらの情報を登録することも可能である。以下、
知識辞書の単語情報を利用した従来の文字認識技術とし
て、例えば文献1:昭和57年電子通信学会総合全国大
会講演論文集 分冊5ー326頁に開示されている技術
につき説明する。2. Description of the Related Art Conventionally, knowledge dictionaries have been used to improve the recognition rate of handwritten characters. The information held by the knowledge dictionary includes information on words to be recognized, context information,
And other information. The user of the character recognition device can newly register such information. Less than,
As a conventional character recognition technology using the word information of the knowledge dictionary, for example, a technology disclosed in Reference 1: A Collection of 1982 IEEJ General National Convention Lectures, Volume 5-326 will be described.
【0003】まず帳票または文書の所定領域を光学的に
走査し紙面からの光信号を光電変換して帳票または文書
の画像データを得る。そして画像データから認識対象と
なる文字のパタンを切り出す。この切り出した文字パタ
ンに基づき認識対象となる文字の認識を行ない、認識結
果として一つまたは複数個の候補文字を得る。そして知
識処理一単位分の文字に関して、各文字毎に得た1つま
たは複数個の候補文字を組み合わせて文字列を作り、文
字列の各候補文字毎に付された候補順位または類似度を
用いて文字列および単語情報の単語の間の類似度を算出
し、この類似度が最大となる文字列を選択する。そして
この文字列に対応する単語情報の単語を表示する。但
し、当該文字列の類似度が所定の閾値以下となる場合に
は、候補順位が1位となる候補文字を組み合わせてでき
る文字列を表示する。First, a predetermined area of a form or document is optically scanned, and an optical signal from a sheet is photoelectrically converted to obtain image data of the form or document. Then, a pattern of a character to be recognized is cut out from the image data. Characters to be recognized are recognized based on the extracted character pattern, and one or more candidate characters are obtained as a recognition result. Then, for one unit of knowledge processing characters, one or more candidate characters obtained for each character are combined to form a character string, and the candidate rank or similarity assigned to each candidate character in the character string is used. Then, the similarity between the character string and the word of the word information is calculated, and the character string having the maximum similarity is selected. Then, the word of the word information corresponding to this character string is displayed. However, when the similarity of the character string is equal to or smaller than a predetermined threshold, a character string formed by combining candidate characters having the first candidate rank is displayed.
【0004】知識処理結果を訂正する際には、当該文字
列との類似度が所定の閾値以上になった単語情報の単語
群を候補単語として表示し、その中に正しい単語が含ま
れていればそれを選択することにより訂正を行なう。When correcting the knowledge processing result, a word group of word information whose similarity with the character string is equal to or more than a predetermined threshold is displayed as a candidate word, and a correct word is included in the word group. Correction is made by selecting it.
【0005】[0005]
【発明が解決しようとする課題】上記文字認識技術で
は、候補単語を表示する際に、(1)最初から存在した
単語情報の単語が候補単語として出力される場合と、
(2)利用者が登録した単語情報の単語が候補単語とし
て出力される場合が考えられるが、利用者は目的に応じ
て必要性の高い単語情報を登録するのであるから(2)
の場合の単語は(1)の場合の単語より正解である可能
性が高い。それにもかかわらず(1)、(2)のケース
の単語の表示を同一としていた。従って、オペレーター
は候補単語の表示を一瞥しただけでは正解である可能性
が高い単語を発見することはできないので、表示されて
いる全ての単語を注意深く観察して正解単語を選択する
必要があり、このため訂正、確認等の編集作業に多くの
時間を要し、単位時間当たりに処理できる帳票または文
書の枚数が少なくなるという問題があった。In the above character recognition technology, when displaying a candidate word, (1) a case where the word of the word information that originally existed is output as a candidate word;
(2) It is conceivable that the word of the word information registered by the user is output as a candidate word, but the user registers word information having high necessity according to the purpose (2)
The word in case (1) is more likely to be correct than the word in case (1). Nevertheless, the display of words in cases (1) and (2) is the same. Therefore, since the operator cannot find a word that is likely to be correct only by glance at the display of candidate words, it is necessary to carefully observe all displayed words and select a correct word, For this reason, there has been a problem that editing work such as correction and confirmation requires much time, and the number of forms or documents that can be processed per unit time is reduced.
【0006】この発明の目的は上述した従来の問題点を
解決し、表示された候補単語の中から正解単語を選択す
る作業を従来よりも行ない易くして操作性を改良した文
字認識装置を提供することにある。SUMMARY OF THE INVENTION It is an object of the present invention to provide a character recognition device which solves the above-mentioned conventional problems and makes it easier to select a correct word from displayed candidate words, thereby improving operability. Is to do.
【0007】[0007]
【課題を解決するための手段】本発明は前記課題を解決
するために、量子化された帳票または文書の画像データ
から切り出した文字パタンの認識結果を出力する認識部
と、単語情報を知識辞書へ登録するための単語登録部
と、前記知識辞書を用いて前記認識結果に基づく知識処
理結果及び候補単語を出力する後処理部と、前記後処理
結果を編集する結果編集部と、前記候補単語を表示する
表示部と、正解単語を入力する入力部を備えて成る文字
認識装置において、前記表示部を、当該候補単語が当該
知識辞書に最初から存在した単語情報の単語である場合
と、前記単語登録部で登録された単語情報の単語である
場合とでその単語の表示方法を変化させるようにしたこ
とを特徴とする。According to the present invention, there is provided a recognition section for outputting a recognition result of a character pattern cut out from image data of a quantized form or document, and a word dictionary for storing word information. A word registering unit for registering the word, a post-processing unit that outputs a knowledge processing result and a candidate word based on the recognition result using the knowledge dictionary, a result editing unit that edits the post-processing result, and the candidate word And a display unit for displaying a word, and an input unit for inputting a correct word, the character recognition device, the display unit, when the candidate word is a word of the word information originally existed in the knowledge dictionary, It is characterized in that the display method of the word is changed depending on whether the word is a word of the word information registered in the word registration unit.
【0008】[0008]
【作用】この発明によれば、候補単語から正解を選択す
る際の表示部の表示は、知識辞書に最初から存在した単
語情報の単語が候補単語として出力された場合と、単語
登録部で登録された単語情報の単語が候補単語として出
力された場合とで変化し、候補単語を選択する作業にお
いて最初から知識辞書に存在した単語情報の単語と、利
用者が登録した単語情報の単語とを簡単に見分けること
ができるので、オペレーターは正解の可能性の高い候補
単語を瞬時に発見し訂正、確認等の作業を行える。従っ
て前記課題が解決されるのである。According to the present invention, the display of the display unit when selecting the correct answer from the candidate words is performed when the word of the word information existing from the beginning in the knowledge dictionary is output as the candidate word and when the word is registered in the word registration unit. When the word of the word information is output as a candidate word, the word of the word information existing in the knowledge dictionary from the beginning in the operation of selecting the candidate word and the word of the word information registered by the user are changed. Since the operator can easily identify the candidate word, the operator can instantly find a candidate word having a high possibility of correct answer, and perform operations such as correction and confirmation. Therefore, the above problem is solved.
【0009】[0009]
【実施例】以下、図面を参照しこの発明の実施例につき
説明する。尚、図面はこの発明が理解できる程度に概略
的に示されているにすぎず、従って各構成成分の形状、
配設位置、寸法、入出力信号および接続関係を図示例に
限定するものではない。Embodiments of the present invention will be described below with reference to the drawings. It should be noted that the drawings are only schematically shown to an extent that the present invention can be understood.
The arrangement positions, dimensions, input / output signals, and connection relationships are not limited to the illustrated examples.
【0010】図1はこの発明の一実施例の説明に供する
機能ブロック図である。この実施例の文字認識装置10
は、量子化された帳票または文書の画像データから文字
パタンを切り出し、この切り出した文字パタンの認識結
果を出力する認識部12と、文字認識装置の利用者が希
望する単語情報を登録する単語登録部14と、知識辞書
に基づき認識結果の知識処理結果及び候補単語を出力す
る後処理部16と、知識処理結果を訂正、確認する結果
編集部18と、知識処理結果及び候補単語を表示する表
示部20と、正解単語を入力する入力部22を備え、さ
らにこれら単語登録部14、結果編集部18、表示部2
0、及び入力部22の動作を制御する制御部24を備え
て成る。また図1において26は帳票または文書の量子
化された画像データを出力する光電変換部であり、28
は光電変換部26からの画像データを格納する画像メモ
リである。FIG. 1 is a functional block diagram for explaining one embodiment of the present invention. Character recognition device 10 of this embodiment
Is a recognition unit 12 that cuts out a character pattern from image data of a quantized form or document, and outputs a recognition result of the cut out character pattern, and a word registration that registers word information desired by a user of the character recognition device. Unit 14, a post-processing unit 16 that outputs knowledge processing results and candidate words of recognition results based on the knowledge dictionary, a result editing unit 18 that corrects and confirms the knowledge processing results, and a display that displays the knowledge processing results and candidate words. Unit 20, an input unit 22 for inputting correct words, and further includes a word registration unit 14, a result editing unit 18, and a display unit 2.
0 and a control unit 24 for controlling the operation of the input unit 22. In FIG. 1, reference numeral 26 denotes a photoelectric conversion unit that outputs quantized image data of a form or document.
Reference numeral denotes an image memory for storing image data from the photoelectric conversion unit 26.
【0011】図2は帳票の一例を示す図であり、同図に
おいて30は住所が記載される帳票の例、及び32は文
字記載領域を指定する記入枠である。FIG. 2 is a diagram showing an example of a form, in which 30 is an example of a form in which an address is described, and 32 is an entry frame for designating a character description area.
【0012】図3は候補単語の選択の一例を示す図であ
り、同図において34は表示画面、36は帳票、38は
訂正する文字列領域、40はカーソル位置、42は候補
単語表示枠、44は表示方法が変化している利用者登録
単語を示す。FIG. 3 is a diagram showing an example of selection of candidate words. In FIG. 3, reference numeral 34 denotes a display screen, 36 denotes a form, 38 denotes a character string area to be corrected, 40 denotes a cursor position, 42 denotes a candidate word display frame, Reference numeral 44 denotes a user registration word whose display method has changed.
【0013】以下、図1、図2、及び図3を参照し、本
実施例につきより詳細に説明する。光電変換部26は帳
票または文書上の所定の読取り範囲を光学的に走査し、
帳票または文書からの光信号Lを光電変換して白黒2値
に量子化された画像データを出力し、画像メモリ28は
この画像データを格納する。Hereinafter, the present embodiment will be described in more detail with reference to FIGS. 1, 2, and 3. FIG. The photoelectric conversion unit 26 optically scans a predetermined reading range on a form or document,
The optical signal L from the form or document is photoelectrically converted to output image data quantized to black and white binary, and the image memory 28 stores the image data.
【0014】認識部12は画像メモリ28の画像データ
から文字パタンを切り出し、この切り出した文字パタン
から認識対象となる文字に関する各種特徴を抽出する。
そして切り出した文字パタンの特徴を標準文字パタンの
特徴と照合し、文字認識結果及び候補順位を出力する。
ひとつの文字に関して1個または複数個の候補文字が認
識結果として得られ、候補文字が1個の場合には候補順
位1を当該候補文字に付して出力し、また候補文字が複
数個の場合には各候補文字毎に定めた候補順位を候補文
字に付して出力する。The recognizing unit 12 extracts a character pattern from the image data in the image memory 28, and extracts various features relating to a character to be recognized from the extracted character pattern.
Then, the feature of the extracted character pattern is compared with the feature of the standard character pattern, and the character recognition result and the candidate ranking are output.
One or more candidate characters are obtained as a recognition result for one character. If there is only one candidate character, candidate rank 1 is added to the candidate character and output. If there is more than one candidate character, Outputs the candidate rank determined for each candidate character to the candidate character.
【0015】単語登録部14は文字認識装置の利用者が
希望する単語情報を知識辞書へ追加登録する。知識辞書
の単語情報には単語登録部で登録された単語情報と、最
初から用意されている一般の単語情報とを区別できるよ
うな情報を付加しておく。以後この情報を単語登録情報
と呼ぶ。The word registration unit 14 additionally registers word information desired by the user of the character recognition device in the knowledge dictionary. The word information of the knowledge dictionary is added with information that can distinguish the word information registered by the word registration unit from general word information prepared from the beginning. Hereinafter, this information is referred to as word registration information.
【0016】後処理部16は認識部12からの認識結果
に基づき単語情報を用いた知識処理を行う。後処理部1
6は知識処理一単位文の文字の認識結果(例えば図2に
示す帳票30において都道府県名の記載領域の認識結
果)を入力すると、知識処理一単位分の各文字の候補文
字を組み合わせてできる文字列を単語情報の単語と照合
し、候補文字から成る文字列に対応する単語が単語情報
の中に存在するか否か調べる。そして組み合わせてでき
た文字列の中から単語情報の単語と合致する文字列Aを
検出したら、文字列Aの評価値Jを算出する。ここでS
は文字列の各候補文字に付された候補順位の和及びNは
文字列を構成する文字の総個数を示すものとすれば、評
価値Jを例えば、J=S÷Nと表わすことができる。The post-processing unit 16 performs knowledge processing using word information based on the recognition result from the recognition unit 12. Post-processing unit 1
When a recognition result of a character of a knowledge processing one unit sentence (for example, a recognition result of a description area of a prefecture name in the form 30 shown in FIG. 2) is input, candidate characters of each character for one unit of the knowledge processing can be combined. The character string is collated with the word of the word information, and it is checked whether a word corresponding to the character string including the candidate character exists in the word information. Then, when a character string A that matches the word of the word information is detected from the character strings formed in combination, the evaluation value J of the character string A is calculated. Where S
Is the sum of the candidate ranks assigned to each candidate character of the character string and N represents the total number of characters constituting the character string, and the evaluation value J can be expressed as, for example, J = S ÷ N. .
【0017】単語及び文字列Aが合致するか否かの判定
は、例えば、単語及び文字列Aの対応する位置の文字の
文字コードが全部一致するか否かによって行なう。そし
て知識処理一単位分についてできた文字列の全てを単語
情報と照合し終えたときに文字列Aの中から評価値Jが
最小となる文字列Aを知識処理結果として選択する。ま
た所定の評価値以下の単語情報を文字列Aの候補単語と
して選択する。この文字列Aを候補単語と共に結果編集
部18へ送出する。The determination as to whether or not the word and the character string A match is performed, for example, based on whether or not all the character codes of the characters at the corresponding positions of the word and the character string A match. Then, when all the character strings formed for one unit of the knowledge processing have been collated with the word information, the character string A with the smallest evaluation value J is selected from the character strings A as the knowledge processing result. Further, word information having a predetermined evaluation value or less is selected as a candidate word of the character string A. This character string A is sent to the result editing unit 18 together with the candidate words.
【0018】また知識処理一単位文の文字列全てを単語
情報の単語と照合し終えたときに文字列Aを1個だけ検
出していたら、当該文字列Aを知識処理結果として選択
し、選択した文字列Aを結果編集部18へ送出する。Further, if only one character string A is detected when all the character strings of the knowledge processing one unit sentence have been collated with the words of the word information, the character string A is selected as a knowledge processing result and selected. The resulting character string A is sent to the result editing unit 18.
【0019】また知識処理一単位分の文字列全てを単語
情報の単語と照合し終えたときに文字列Aを1個も検出
していなければ、知識処理一単位分の各文字の候補順位
が1位の候補文字を組み合わせてできる文字列Aを知識
処理結果として選択し、選択した文字列Aを結果編集部
18へ送出する。If all character strings for one unit of knowledge processing have not been detected when all the character strings for one unit of knowledge processing have been collated with the words of the word information, the candidate rank of each character for one unit of knowledge processing is changed. A character string A formed by combining the first-place candidate character is selected as a knowledge processing result, and the selected character string A is sent to the result editing unit 18.
【0020】結果編集部18は後処理部16から送出さ
れた文字列Aの候補単語が存在する場合は、文字列A及
び候補単語を制御部24へ送出する。そして制御部24
は文字列A、候補単語及び単語登録情報に応じた候補単
語の表示指示を表示部20へ送出する。このとき当該候
補単語が単語登録部で登録された単語情報の単語でない
場合は、第一の色で表示する指示を、単語登録部で登録
された単語情報の単語である場合は第一の色と異なる第
二の色で表示する指示を送出する。さらに表示部20は
表示指示で指定された方法で文字列A及び候補単語を表
示する(例えば図3に示す表示画面34)。ここで、オ
ペレータは表示画面中の文字列Aが誤りか否かを判断
し、誤りであれば候補単語の中から正解単語を選択す
る。もし候補単語中に正解単語が存在しない場合は、キ
ーボード等により正解単語を入力する。If there is a candidate word for the character string A sent from the post-processing unit 16, the result editing unit 18 sends the character string A and the candidate word to the control unit 24. And the control unit 24
Sends a display instruction of the character string A, the candidate word, and the candidate word according to the word registration information to the display unit 20. At this time, if the candidate word is not the word of the word information registered in the word registration unit, the instruction to display in the first color is given. If the candidate word is the word of the word information registered in the word registration unit, the first color is displayed. And an instruction to display in a second color different from. Further, the display unit 20 displays the character string A and the candidate words by the method specified by the display instruction (for example, the display screen 34 shown in FIG. 3). Here, the operator determines whether or not the character string A in the display screen is erroneous, and if it is erroneous, selects the correct word from the candidate words. If there is no correct word in the candidate words, the correct word is input using a keyboard or the like.
【0021】また結果編集部18は文字列Aの候補単語
が存在しない場合は、文字列Aを制御部24を介して表
示部20へ送出し、表示部20はこの文字列Aを表示す
る。ここでオペレータは表示画面中の文字列Aが誤りか
否かを判断し、誤りであればキーボード等により正解単
語を入力する。そして結果編集部18は入力部22及び
制御部24を介して上述の正解単語を受取り、誤った文
字列と交換する。また、表示部20に表示された文字列
Aがオペレータによって正解であると判断された場合
は、結果編集部18は文字列Aをそのまま出力する。When there is no candidate word for the character string A, the result editing unit 18 sends the character string A to the display unit 20 via the control unit 24, and the display unit 20 displays the character string A. Here, the operator determines whether or not the character string A in the display screen is incorrect, and if so, inputs the correct word using a keyboard or the like. Then, the result editing unit 18 receives the above-described correct word via the input unit 22 and the control unit 24, and replaces the correct word with an incorrect character string. When the character string A displayed on the display unit 20 is determined to be correct by the operator, the result editing unit 18 outputs the character string A as it is.
【0022】この発明は上述した実施例にのみ限定され
るものではなく、従って各構成成分の構成、動作、処理
内容、入出力信号及び数値的条件を任意好適に変更して
よい。例えば上述した実施例では単語登録部において利
用者は一般知識辞書に単語情報を追加登録したが、もう
1つの利用者専用の知識辞書を用意してそこに必要な単
語情報を登録するようにしてもよい。The present invention is not limited only to the above-described embodiment, and accordingly, the configuration, operation, processing contents, input / output signals and numerical conditions of each component may be arbitrarily and suitably changed. For example, in the above-described embodiment, the user additionally registers word information in the general knowledge dictionary in the word registration unit, but prepares another user-specific knowledge dictionary and registers necessary word information there. Is also good.
【0023】さらに上述した実施例では評価値Jとし
て、文字列の各候補文字に付された候補順位の和Sを文
字列を構成する文字の総個数Nで割った値を用いたが、
候補順位の和Sにかえて各候補順位に対して対応した得
点(例えば候補順位1に対して100点、候補順位2に
対して90点を対応付けるというように候補順位が下が
るにつれて低くなる得点を対応付ける)の和を用いるよ
うにしてもよい。或いは候補順位の和Sにかえて文字列
の各候補文字の出現頻度(この場合出現頻度はあらかじ
め認識部が保有する)の和を用いるようにしてもよい。
或いは候補順位の和Sにかえて、候補文字と当該候補文
字に対応する文字パタンとの間の類似度を求め文字列の
各候補文字の前記類似度の和を用いてもよい。或いは候
補文字の和Sにかえて候補文字の辞書マトリクスと当該
候補文字に対応する文字パタンの特徴量との間の距離を
求め文字列の各候補文字の前記距離の和を用いるように
してもよい。或いは候補順位の和Sにかえて、文字列の
各候補文字の出現頻度の和と候補順位の和を用いるよう
にしてもよい。Further, in the above-described embodiment, the value obtained by dividing the sum S of the candidate ranks assigned to each candidate character of the character string by the total number N of characters constituting the character string is used as the evaluation value J.
The score corresponding to each candidate rank in place of the sum S of the candidate ranks (for example, a score that becomes lower as the candidate rank decreases, such as associating 100 points for candidate rank 1 and 90 points for candidate rank 2). May be used. Alternatively, the sum of the frequency of appearance of each candidate character of the character string (in this case, the frequency of appearance is held in advance by the recognition unit) may be used instead of the sum S of the candidate ranks.
Alternatively, a similarity between a candidate character and a character pattern corresponding to the candidate character may be determined in place of the candidate sum S, and the sum of the similarities of the candidate characters in the character string may be used. Alternatively, instead of the sum S of the candidate characters, the distance between the dictionary matrix of the candidate characters and the characteristic amount of the character pattern corresponding to the candidate characters is obtained, and the sum of the distances of the candidate characters of the character string may be used. Good. Alternatively, instead of the sum S of the candidate ranks, the sum of the appearance frequencies of the candidate characters of the character string and the sum of the candidate ranks may be used.
【0024】また表示部の表示方法を上述のもののほ
か、例えば異なる色、異なる輝度、ブリンキング及びア
ンダーラインのうちのいずれか一つまたは複数を用い
て、表示を変化させるようにしてもよい。The display method of the display unit may be changed by using one or more of different colors, different luminances, blinking, and underlining, for example, in addition to the above-described method.
【0025】また後処理部は、単語情報を用いた知識処
理を上述のほかつぎに述べるように行ってもよい。候補
文字から成る文字列に対応する単語が単語情報の中に存
在するか否か調べるため、知識処理一単位文の文字列を
単語情報の単語と照合し、これら文字列及び単語の間の
類似度或いは不一致度を算出する。文字列に対応する単
語として例えば文字列との類似度が所定の閾値を越える
単語或いは文字列との不一致度が所定の閾値を越えない
単語を検出する。そして、 (1)類似度が所定の閾値を越える文字列或いは不一致
度が所定の閾値を越えない文字列を検出した場合には、
この検出した文字列のうち最大の類似度或いは最小の不
一致度を検出し、この最大の類似度或いは最小の不一致
度の文字列に対応する単語情報の単語を知識処理結果、
及びこの最大の類似度或いは最小の不一致度を知識処理
の評価値として出力する。 (2)知識処理一単位分の文字列のすべてを単語情報の
単語と照合し終えても類似度が所定の閾値を越える文字
列、或いは不一致度が所定の閾値を越えない文字列を1
個も検出できなっかた場合には、候補順位が1位となる
候補文字の組み合わせの文字列を知識処理結果、及び類
似度のあらかじめ定めた下限値或いは不一致度のあらか
じめ定めた上限値を評価値として出力する。 これら類似度の下限値及び不一致度の上限値は候補文字
から成る文字列に対応する単語が単語情報のなかに存在
しなかったことを表わす。The post-processing unit may perform the knowledge processing using the word information as described below in addition to the above. In order to check whether a word corresponding to a character string composed of candidate characters exists in the word information, the character string of the knowledge processing unit sentence is compared with the word of the word information, and the similarity between these character strings and words is determined. The degree or the degree of inconsistency is calculated. As a word corresponding to the character string, for example, a word whose similarity with the character string exceeds a predetermined threshold value or a word whose degree of mismatch with the character string does not exceed a predetermined threshold value is detected. (1) When a character string whose similarity exceeds a predetermined threshold value or a character string whose inconsistency degree does not exceed a predetermined threshold value is detected,
The maximum similarity or the minimum dissimilarity is detected from the detected character strings, and the word of the word information corresponding to the character string having the maximum similarity or the minimum dissimilarity is subjected to the knowledge processing result.
And the maximum similarity or the minimum dissimilarity is output as an evaluation value of the knowledge processing. (2) A character string whose similarity exceeds a predetermined threshold or a character string whose dissimilarity does not exceed a predetermined threshold even if all character strings for one unit of knowledge processing have been collated with words in word information.
If none of them can be detected, the result of the knowledge processing of the character string of the combination of the candidate characters having the first candidate rank and the predetermined lower limit of the similarity or the predetermined upper limit of the degree of inconsistency are evaluated. Output as a value. The lower limit of the degree of similarity and the upper limit of the degree of inconsistency indicate that the word corresponding to the character string composed of the candidate characters did not exist in the word information.
【0026】さらに上述した実施例では単語情報を用い
た知識処理の例につき説明したが文脈情報そのほかの知
識情報を用いた知識処理を行なう文字認識装置にこの発
明を適用してもよい。Further, in the above-described embodiment, an example of knowledge processing using word information has been described. However, the present invention may be applied to a character recognition device that performs knowledge processing using context information and other knowledge information.
【0027】[0027]
【発明の効果】上述したようにこの発明によれば、候補
単語から正解を選択する際の表示部の表示は、知識辞書
に最初から存在した単語情報の単語が候補単語として出
力された場合と、単語登録部で登録された単語情報の単
語が候補単語として出力された場合とで変化し、候補単
語を選択する作業において最初から知識辞書に存在した
単語情報の単語と、利用者が登録した単語情報の単語と
を簡単に見分けることができるので、オペレーターは正
解の可能性の高い候補単語を瞬時に発見し訂正、確認等
の作業を行える。その結果、帳票または文書の訂正、確
認の処理に要する時間が短縮される。従って、高速かつ
迅速に帳票または文書を処理できる操作性の良い文字認
識装置を提供できる。As described above, according to the present invention, when a correct answer is selected from candidate words, the display on the display unit is performed when the word of the word information originally existing in the knowledge dictionary is output as the candidate word. The case where the word of the word information registered in the word registration unit is output as a candidate word changes, and in the operation of selecting the candidate word, the word of the word information that originally existed in the knowledge dictionary and the user registered Since the word of the word information can be easily distinguished from the word information, the operator can instantly find a candidate word having a high possibility of a correct answer, and perform operations such as correction and confirmation. As a result, the time required for correcting or confirming the form or document is reduced. Therefore, it is possible to provide a character recognition device with good operability that can process a form or a document quickly and quickly.
【図1】本発明の実施例の構成を示す機能ブロック図で
ある。FIG. 1 is a functional block diagram showing a configuration of an embodiment of the present invention.
【図2】帳票の一例を示す図である。FIG. 2 is a diagram illustrating an example of a form.
【図3】候補単語選択の一例を示す図である。FIG. 3 is a diagram showing an example of candidate word selection.
10 文字認識装置 12 認識部 14 単語登録部 16 後処理部 18 結果編集部 20 表示部 22 入力部 24 制御部 26 光電変換部 28 画像メモリ Reference Signs List 10 character recognition device 12 recognition unit 14 word registration unit 16 post-processing unit 18 result editing unit 20 display unit 22 input unit 24 control unit 26 photoelectric conversion unit 28 image memory
フロントページの続き (56)参考文献 特開 平3−58182(JP,A) 特開 平3−99386(JP,A) 特開 昭63−143685(JP,A) 特開 平1−145789(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/72 G06K 9/03 Continuation of the front page (56) References JP-A-3-58182 (JP, A) JP-A-3-99386 (JP, A) JP-A-63-143685 (JP, A) JP-A-1-145789 (JP) , A) (58) Field surveyed (Int. Cl. 7 , DB name) G06K 9/72 G06K 9/03
Claims (1)
タから切り出した文字パタンの認識結果を出力する認識
部と、単語情報を知識辞書へ登録するための単語登録部
と、前記知識辞書を用いて前記認識結果に基づく知識処
理結果及び候補単語を出力する後処理部と、前記後処理
結果を編集する結果編集部と、前記候補単語を表示する
表示部と、正解単語を入力する入力部を備えて成る文字
認識装置において、 前記表示部を、当該候補単語が当該知識辞書に最初から
存在した単語情報の単語である場合と、前記単語登録部
で登録された単語情報の単語である場合とでその単語の
表示方法を変化させるようにしたことを特徴とする文字
認識装置。1. A recognition unit for outputting a recognition result of a character pattern cut out from image data of a quantized form or document, a word registration unit for registering word information in a knowledge dictionary, and using the knowledge dictionary. A post-processing unit that outputs a knowledge processing result and a candidate word based on the recognition result, a result editing unit that edits the post-processing result, a display unit that displays the candidate word, and an input unit that inputs a correct word. In the character recognition device provided, the display unit may display the candidate word when the candidate word is a word of the word information originally existing in the knowledge dictionary, and when the candidate word is the word of the word information registered by the word registration unit. Wherein the display method of the word is changed.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP07660193A JP3221968B2 (en) | 1993-04-02 | 1993-04-02 | Character recognition device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP07660193A JP3221968B2 (en) | 1993-04-02 | 1993-04-02 | Character recognition device |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH06290308A JPH06290308A (en) | 1994-10-18 |
| JP3221968B2 true JP3221968B2 (en) | 2001-10-22 |
Family
ID=13609852
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP07660193A Expired - Fee Related JP3221968B2 (en) | 1993-04-02 | 1993-04-02 | Character recognition device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3221968B2 (en) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP5107157B2 (en) * | 2008-06-30 | 2012-12-26 | 富士通フロンテック株式会社 | Character recognition program, character recognition device, and character recognition method |
| JP4661924B2 (en) * | 2008-09-12 | 2011-03-30 | カシオ計算機株式会社 | Electronic device and program with dictionary function |
| JP7421384B2 (en) * | 2020-03-19 | 2024-01-24 | 株式会社Pfu | Information processing device, correction candidate display method, and program |
-
1993
- 1993-04-02 JP JP07660193A patent/JP3221968B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JPH06290308A (en) | 1994-10-18 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3427692B2 (en) | Character recognition method and character recognition device | |
| JP3221968B2 (en) | Character recognition device | |
| US5233672A (en) | Character reader and recognizer with a specialized editing function | |
| JP2003242441A (en) | Document processing method, apparatus and program | |
| JP3190603B2 (en) | Character reading device, its reading method and recording medium | |
| JP3455643B2 (en) | Method of updating learning dictionary in character recognition device and character recognition device | |
| JP3930466B2 (en) | Character recognition device, character recognition program | |
| JP3221969B2 (en) | Character recognition device | |
| KR950001061B1 (en) | Document Recognition Correction Device | |
| JP2954968B2 (en) | Optical character reader and method of adding subset information in optical reader | |
| JPH07182441A (en) | Character recognition device | |
| JP2687902B2 (en) | Document image recognition device | |
| JP2002207960A (en) | Method and program for recognized character correction | |
| JPH07239901A (en) | Character correction method in optical reader | |
| JPH01134584A (en) | Device for recognizing character | |
| JPH05120471A (en) | Character recognizing device | |
| JPH05120472A (en) | Character recognition device | |
| JPS58125183A (en) | Method for displaying unrecognizable character in optical character reader | |
| JPH06282690A (en) | Character recognition device | |
| JPH06333083A (en) | Optical character reader | |
| JPH0636067A (en) | Character reader | |
| JPH06274702A (en) | Character recognizing device | |
| JPH05298495A (en) | Character recognizing device, erroneous recognition character correcting method and occidental document processor | |
| JP2006330780A (en) | Character recognition device and character recognition program | |
| JPH01189788A (en) | Character reader |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20010724 |
|
| LAPS | Cancellation because of no payment of annual fees |