JP6885449B2 - Information identification program, information identification method, and image reader - Google Patents
Information identification program, information identification method, and image reader Download PDFInfo
- Publication number
- JP6885449B2 JP6885449B2 JP2019226976A JP2019226976A JP6885449B2 JP 6885449 B2 JP6885449 B2 JP 6885449B2 JP 2019226976 A JP2019226976 A JP 2019226976A JP 2019226976 A JP2019226976 A JP 2019226976A JP 6885449 B2 JP6885449 B2 JP 6885449B2
- Authority
- JP
- Japan
- Prior art keywords
- area
- data
- image
- character string
- entry
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 258
- 230000008569 process Effects 0.000 claims description 243
- 238000012545 processing Methods 0.000 claims description 38
- 230000004044 response Effects 0.000 claims description 9
- 230000008859 change Effects 0.000 description 22
- 238000004891 communication Methods 0.000 description 18
- 230000006870 function Effects 0.000 description 13
- 239000000284 extract Substances 0.000 description 6
- 230000002093 peripheral effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 239000003086 colorant Substances 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000007688 edging Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Landscapes
- Character Input (AREA)
Description
本発明は、情報識別プログラム、情報識別方法、及び画像読取装置に関する。 The present invention relates to an information identification program, an information identification method, and an image reader.
従来、紙媒体の帳票のデータを収集するプログラムが知られている。特許文献1に開示されたプログラムは、複数の帳票の画像情報から、帳票に予め記載されている固定文字とユーザが帳票に記入した記入文字とを識別するステップを備える。固定文字と記入文字との識別は、同種の複数の帳票に亘って同じ位置から抽出される文字列を比較した比較結果、固定文字及び記入文字であることを評価する情報を蓄積した学習結果、及び作業者によって入力された補足データ等に基づいて行われている。また、固定文字と記入文字との識別結果に応じて、固定文字に基づく非記入領域と、記入文字に基づく記入領域とが識別されるステップを備える。また、非記入領域と記入領域との識別結果に応じて帳票を電子データ化した帳票テンプレートを生成するステップを備える。
Conventionally, a program for collecting data on paper forms has been known. The program disclosed in
しかしながら、帳票によっては、常にユーザによって文字が記入される領域に加えて、ユーザによって文字が記入される場合と記入されない場合とがある領域を含むものもある。このようなユーザの任意で記入される領域を有する帳票については、上記のプログラムを用いても、領域の種類を正確に識別できない可能性がある。 However, some forms include, in addition to the area where characters are always entered by the user, an area where characters may or may not be entered by the user. For a form having such an area to be arbitrarily filled in by the user, there is a possibility that the type of the area cannot be accurately identified even by using the above program.
本発明は、帳票に設けられている領域の種類を適切に識別し、領域の種類に応じた処理を実行できる情報識別プログラム、情報識別方法、及び画像読取装置を提供することを目的とする。 An object of the present invention is to provide an information identification program, an information identification method, and an image reading device capable of appropriately identifying the type of an area provided on a form and executing processing according to the type of the area.
第一の実施態様に係る情報識別プログラムは、情報識別装置を構成するコンピュータによって実行される情報識別プログラムであって、前記コンピュータに、手書き文字を含む文字の記入された帳票である記入帳票を読み取った画像を示す読取データを取得する第一取得ステップと、前記読取データに基づいて前記記入帳票に応じた帳票であって、手書き文字が記入されていない帳票の画像を示す帳票画像データを取得する第二取得ステップと、前記読取データにおいて第一画素値に対応する輪郭で囲まれた第一領域を特定する第一領域特定ステップと、前記第一領域の画像を示す第一領域データを前記読取データから取得する第三取得ステップと、前記帳票画像データにおいて前記第一領域に対応する帳票第一領域を特定する帳票第一領域特定ステップと、前記帳票第一領域の画像を示す帳票第一データを前記帳票画像データから取得する第四取得ステップと、前記第一領域データと、前記帳票第一データとが異なるかを判断する第一判断ステップと、前記第一領域データと前記帳票第一データとが異なると判断された場合、前記第一領域に含まれる第一文字列を少なくとも含む文字列を示す文字列データを文字認識処理に基づいて取得する一方、前記第一領域データと前記帳票第一データとが異ならないと判断された場合、前記文字列データを取得しない第一実行ステップとを実行させる。 The information identification program according to the first embodiment is an information identification program executed by a computer constituting the information identification device, and the computer reads an entry form which is a form in which characters including handwritten characters are entered. The first acquisition step of acquiring the read data indicating the image, and the form image data indicating the image of the form according to the entry form based on the read data and in which the handwritten characters are not entered are acquired. The second acquisition step, the first region specifying step for specifying the first region surrounded by the contour corresponding to the first pixel value in the read data, and the first region data showing the image of the first region are read. The third acquisition step to be acquired from the data, the form first area specifying step for specifying the form first area corresponding to the first area in the form image data, and the form first data showing the image of the form first area. The fourth acquisition step of acquiring the data from the form image data, the first determination step of determining whether the first area data and the first form data are different, and the first area data and the first form data. When it is determined that the data is different from the above, the character string data indicating the character string including at least the first character string included in the first area is acquired based on the character recognition process, while the first area data and the form first When it is determined that the data does not differ from the data, the first execution step of not acquiring the character string data is executed.
第一の実施態様に係る情報識別プログラムによれば、読取データに基づいて判定された帳票の種別に応じた帳票画像データが取得される。また、読取データから第一画素値に対応する輪郭で囲まれた第一領域が特定され、第一領域データが取得される。第一領域データと、帳票画像データのうち第一領域に対応する帳票第一データとが異なる場合には、第一領域データに対応する第一文字列データを含む文字列データが読取データから取得される。一方、第一領域データと帳票第一データとが異ならない場合には、文字列データが取得されず、第一領域データを表示する指示が出力される。例えば、帳票において必ず記入することが求められる領域を、第一の実施態様に係る第一領域に適用すると、第一領域に手書き文字等が記入され、第一領域データと帳票第一データとが異なる場合には、読取データから第一文字列データを含む文字列データが取得される。一方、第一領域に手書き文字等が記入されず、第一領域データと帳票第一データとが異ならない場合には、読取データから文字列データが取得されない。従って、第一の実施態様に係る情報識別プログラムは、帳票に設けられている領域の種類を適切に識別し、領域の種類に応じた処理を実行できる。 According to the information identification program according to a first embodiment, the voucher image data corresponding to the type of document that has been determined on the basis of the read data is acquired. Further, the first region surrounded by the contour corresponding to the first pixel value is specified from the read data, and the first region data is acquired. When the first area data and the first form data corresponding to the first area of the form image data are different, the character string data including the first character string data corresponding to the first area data is acquired from the read data. To. On the other hand, if the first area data and the first form data are not different, the character string data is not acquired and an instruction to display the first area data is output. For example, the space that is required to always fill in the form, when applied to a first region according to the first embodiment, the handwritten character or the like is filled in the first region, and a first region data and the form first data If they are different, the character string data including the first character string data is acquired from the read data. On the other hand, if handwritten characters or the like are not entered in the first area and the first area data and the first form data do not differ, the character string data is not acquired from the read data. Therefore, the information identification program according to the first embodiment can appropriately identify the type of the area provided in the form and execute the process according to the type of the area.
第二の実施態様に係る情報識別方法は、情報識別装置を構成するコンピュータが実行可能な方法であって、手書き文字を含む文字の記入された帳票である記入帳票を読み取った画像を示す読取データを取得する第一取得ステップと、前記読取データに基づいて前記記入帳票に応じた帳票であって、手書き文字が記入されていない帳票の画像を示す帳票画像データを取得する第二取得ステップと、前記読取データにおいて第一画素値に対応する輪郭で囲まれた第一領域を特定する第一領域特定ステップと、前記第一領域の画像を示す第一領域データを前記読取データから取得する第三取得ステップと、前記帳票画像データにおいて前記第一領域に対応する帳票第一領域を特定する帳票第一領域特定ステップと、前記帳票第一領域の画像を示す帳票第一データを前記帳票画像データから取得する第四取得ステップと、前記第一領域データと、前記帳票第一データとが異なるかを判断する第一判断ステップと、前記第一領域データと前記帳票第一データとが異なると判断された場合、前記第一領域に含まれる第一文字列を少なくとも含む文字列を示す文字列データを文字認識処理に基づいて取得する一方、前記第一領域データと前記帳票第一データとが異ならないと判断された場合、前記文字列データを取得しない第一実行ステップとを備えている。 The information identification method according to the second embodiment is a method that can be executed by a computer constituting the information identification device, and is read data indicating an image obtained by reading an entry form, which is a form in which characters including handwritten characters are entered. The first acquisition step of acquiring the form image data indicating the image of the form according to the entry form based on the read data and in which the handwritten characters are not entered, and the second acquisition step. A first region identification step for specifying a first region surrounded by a contour corresponding to the first pixel value in the read data, and a third region data indicating an image of the first region are acquired from the read data. From the form image data, the acquisition step, the form first area specifying step for specifying the form first area corresponding to the first area in the form image data, and the form first data showing the image of the form first area are obtained from the form image data. It is determined that the fourth acquisition step to be acquired, the first determination step for determining whether the first area data and the first form data are different, and the first area data and the first form data are different. In this case, the character string data indicating the character string including at least the first character string included in the first area is acquired based on the character recognition process, while the first area data and the form first data are not different from each other. If it is determined, it includes a first execution step that does not acquire the character string data.
第二の実施態様に係る情報識別方法に倣って、情報識別装置のコンピュータが情報を識別することで、第一態様と同様の効果を奏することができる。 Following the information identification method according to the second embodiment, the computer of the information identification apparatus to identify the information, it is possible to achieve the same effect as the first embodiment.
第三の実施態様に係る画像読取装置は、帳票の画像を読み取る読取部と、前記読取部によって読み取られた、手書き文字を含む文字の記入された帳票である記入帳票を読み取った画像を示す読取データを取得する第一取得手段と、前記読取データに基づいて前記記入帳票に応じた帳票であって、手書き文字が記入されていない帳票の画像を示す帳票画像データを取得する第二取得手段と、前記読取データにおいて第一画素値に対応する輪郭で囲まれた第一領域を特定する第一領域特定手段と、前記第一領域の画像を示す第一領域データを前記読取データから取得する第三取得手段と、前記帳票画像データにおいて前記第一領域に対応する帳票第一領域を特定する帳票第一領域特定手段と、前記帳票第一領域の画像を示す帳票第一データを前記帳票画像データから取得する第四取得手段と、前記第一領域データと、前記帳票第一データとが異なるかを判断する第一判断手段と、前記第一領域データと前記帳票第一データとが異なると判断された場合、前記第一領域に含まれる第一文字列を少なくとも含む文字列を示す文字列データを文字認識処理に基づいて取得する一方、前記第一領域データと前記帳票第一データとが異ならないと判断された場合、前記文字列データを取得しない第一実行手段とを備えている。 The image reading device according to the third embodiment has a reading unit that reads an image of the form, and a reading unit that indicates an image that is read by the reading unit and is a form in which characters including handwritten characters are written. A first acquisition means for acquiring data, and a second acquisition means for acquiring form image data indicating an image of a form in which handwritten characters are not entered, which is a form corresponding to the entry form based on the read data. The first region specifying means for specifying the first region surrounded by the contour corresponding to the first pixel value in the read data, and the first region data indicating the image of the first region are acquired from the read data. (Iii) The form image data includes the acquisition means, the form first area specifying means for specifying the form first area corresponding to the first area in the form image data, and the form first data indicating the image of the form first area. The fourth acquisition means acquired from, the first determination means for determining whether the first area data and the first form data are different, and the first determination means for determining whether the first area data and the first form data are different. If this is done, the character string data indicating the character string including at least the first character string included in the first area is acquired based on the character recognition process, while the first area data and the form first data are not different from each other. When it is determined that the character string data is not acquired, the first execution means is provided.
第三の実施態様に係る画像読取装置を用いることで、第一態様と同様の効果を奏することができる。 By using the image reading apparatus according to the third embodiment, it is possible to achieve the same effect as the first embodiment.
本明細書に例示する実施形態について、図面を参照して説明する。まず、図1を参照して、情報識別システム4のシステム構成を説明する。情報識別システム4は、情報識別装置1、画像読取装置(以下、「スキャナ」という)2、及び管理サーバ3を含む。情報識別装置1は、インターネット、LAN、その他の専用回線等を含むネットワーク9を介して、管理サーバ3とデータ及びコマンドを送受信可能である。
The embodiments illustrated in the present specification will be described with reference to the drawings. First, the system configuration of the
情報識別装置1の構成について説明する。情報識別装置1には、手書き文字を含む文字の記入された帳票に記載された内容に対応する画像データが入力される。情報識別装置1は、入力された画像データから、帳票に設けられている各種の記入欄の種類を識別する。情報識別装置1は、識別結果に応じた処理を実行する。帳票は、例えば紙媒体であり、各種の保険の契約申込書、携帯電話の契約申込書、行政手続きにおける各種の申請書等である。本実施形態において、帳票は各種の保険の契約申込書である。情報識別装置1は、情報識別専用の装置であってもよいし、所謂パーソナルコンピュータ(PC)等の汎用型の装置に、専用のアプリケーションをインストールしたものであってもよい。本実施形態では、汎用型のPCによる情報識別装置1を例示する。図1に示すように、情報識別装置1は、情報識別装置1の制御を司るコントローラであるCPU10を備えている。CPU10は、ROM11、RAM12、ハードディスクドライブ(以下、「HDD」という。)13、及び入出力インターフェース(以下、「入出力I/F」という。)14と、データバスを介して電気的に接続する。ROM11は、情報識別装置1を動作させるためのBIOS等のプログラム、及び初期値等を記憶している。RAM12は、CPU10による演算処理で得られた演算結果等、各種のデータを一時的に記憶する。
The configuration of the
HDD13は、不揮発性の記憶装置である。本実施形態において、HDD13は、CPU10に後述の情報識別処理(図6参照)を実行させるプログラムを記憶する。HDD13は、非一時的な記憶媒体の一例である。非一時的な記憶媒体は、情報を記憶する期間に関わらず、情報を記憶可能な記憶媒体であればよい。非一時的な記憶媒体は、一時的な記憶媒体(例えば、伝送される信号)を含まなくてもよい。本実施形態における記憶装置はHDD13であるが、記憶装置は、情報を記憶する時間の長さに関わらずデータを保持できる、他の非一時的な記憶媒体、例えば、フラッシュメモリ、RAM等で構成されてもよい。
入出力I/F14は、データの受け渡しの仲介を行う。入出力I/F14には、外部通信インターフェース(以下、「外部通信I/F」という。)15と、画像を表示する表示部16と、キーボード及びマウス等の操作部17と、汎用の画像読取装置であるスキャナ2とが電気的に接続されている。外部通信I/F15は、情報識別装置1をネットワーク9に接続する。外部通信I/F15は、例えば、イーサネット(登録商標)等の標準規格に適合する、インターフェース回路である。なお、外部通信I/F15には、情報識別装置1の外部において画像を表示する外部表示部19が接続可能である。外部表示部19は、ネットワーク9を介した接続が可能なモニタであってもよいし、ネットワーク9及び外部通信I/F15を介して情報識別装置1に接続するスマートフォンやタブレットPCのディスプレイであってもよい。
The input / output I /
情報認識処理(図6参照)は、各種保険の申込書から読み取られた読取データに基づいて、申込書に設けられている記入領域の種類に応じて、申込書に記入された文字列のデータの管理を行うソフトウェアの処理の一部である。入出力I/F14は、情報識別装置1とスキャナ2等の外部機器とを接続するための、所定の規格(例えば、Universal Serial Bus (USB))に適合したインターフェース素子である。CPU10は、入出力I/F14を介して、スキャナ2等の外部機器とのデータの送受信を行う。
The information recognition process (see Fig. 6) is based on the read data read from various insurance application forms, and is the data of the character string entered in the application form according to the type of entry area provided in the application form. It is a part of the processing of the software that manages. The input / output I /
スキャナ2の構成について説明する。スキャナ2は、シートフィードスキャナ、又は、フラットベッドスキャナである。スキャナ2は、後述する記入帳票101等の画像を撮像する読取動作を行い、画像データを形成して、情報識別装置1に送信する。なお、スキャナ2は、記入帳票101の読取専用のスキャナであってもよいし、汎用のスキャナであってもよい。
The configuration of the
スキャナ2は、スキャナ2の制御を司るコントローラであるCPU20を備えている。CPU20は、ROM21、RAM22、入出力インターフェース(以下、「入出力I/F」という。)24、読取部26、表示部27及び操作部28と、データバスを介して電気的に接続する。ROM21は、スキャナ2を動作させるためのOS等のプログラム、及び初期値等を記憶している。RAM22は、CPU20による演算処理で得られた演算結果等、各種のデータを一時的に記憶する。特に、RAM22は、記入帳票101の画像の画像データを記憶する記憶領域を少なくとも確保している。入出力I/F24は、データの受け渡しの仲介を行う。入出力I/F24には、外部通信I/F25が電気的に接続されている。外部通信I/F25は、スキャナ2をネットワーク9に接続する。スキャナ2は、ネットワーク9及び外部通信I/F25を介して情報識別装置1と接続してもよい。なお、外部通信I/F25には、スキャナ2の外部において画像を表示する外部表示部29が接続可能である。外部表示部29は、例えば、ネットワーク9及び外部通信I/F25を介してスキャナ2に接続するスマートフォンやタブレットPCのディスプレイである。
The
読取部26は、周知の接触型イメージセンサを備える。読取部26は、記入帳票101の画像を読み取る。読取部26は、読み取ったアナログの画像をデジタルの画像データに変換する。画像データは情報識別装置1の転送指令に応じて、入出力I/F24又は外部通信I/F25を介して情報識別装置1に転送される。表示部27は、スキャナ2に備えられた画像を表示する表示画面である。操作部28はスキャナ2の各種動作の操作を行うための操作ボタン等である。スキャナ2は、操作部28を介して、又は情報識別装置1から記入帳票101の画像の読み取り指示が入力されることに応じて、記入帳票101の画像の読取動作を行う。
The
管理サーバ3の構成について説明する。管理サーバ3は、ハードウェアとしては汎用のサーバであってもよい。管理サーバ3は、管理サーバ3の制御を司るCPU30を備えている。CPU30は、ROM31、RAM32、HDD33、及び入出力I/F34と、データバスを介して電気的に接続する。ROM11は、管理サーバ3を動作させるためのBIOS等のプログラム、及び初期値等を記憶している。RAM32は、CPU30による演算処理で得られた演算結果等、各種のデータを一時的に記憶する。本実施形態において、HDD33は、各種情報を管理するためのデータベース(以下、「DB」という。)として、登録帳票DB及び帳票種別設定テーブルを記憶する。登録帳票DBは、例えば、後述の医療保険用登録帳票DB60(図4参照)である。帳票種別設定テーブルは、例えば、後述の医療保険用設定テーブル70(図5参照)である。入出力I/F34には、外部通信I/F35が接続されている。外部通信I/F35は、管理サーバ3をネットワーク9に接続する。外部通信I/F35は、例えば、イーサネット(登録商標)等の標準規格に適合する、インターフェース回路である。
The configuration of the
図2及び図3を参照して、未記入帳票100及び記入帳票101について説明する。未記入帳票100は、保険会社等から保険契約申込者(以下、ユーザと言う。)に対して配布される各種の保険の契約申込書である。未記入帳票100には、ユーザによって手書き文字等が未だ記入されていない。記入帳票101は、未記入帳票100に対してユーザが必要事項を記入した後の状態の帳票である。なお、未記入帳票100及び記入帳票101を特に区別しない場合、又は総称する場合、単に「帳票」という。
The
帳票は、帳票種別表示欄110、日付記入欄120、ユーザID欄130、事前記入欄140、第一任意記入欄150および第二任意記入欄160を主に備える。帳票は、これら以外の各種の記入欄を備えてよいが、本実施形態では説明を省略する。帳票種別表示欄110は、印刷等によって、予め文字列が記載されている欄である。予め記載された文字列は、各種の保険契約申込書のうち、帳票がいずれの種別の保険契約を申し込むためのものであるかを示す。例えば、保険契約の種別は、医療保険、自動車保険、火災保険、地震保険等が例示される。保険契約種類毎の帳票の種別を、以下では帳票種別という。即ち、帳票種別表示欄110は、帳票がいずれの帳票種別であるのかを示す欄である。図3に示す未記入帳票100の帳票種別表示欄110には、医療保険の契約申込書であることを示す「医療保険契約申込書」の文字が、帳票種別として印刷されている。帳票種別表示欄110は、帳票において左上部に設けられている。本実施形態において、帳票に帳票種別表示欄110が設けられる位置は、帳票の種別を問わず同じ位置とされている。
The form mainly includes a form
日付記入欄120は、帳票において帳票種別表示欄110の下方に設けられている。日付記入欄120は、保険契約の申し込みにあたり、ユーザが申込年月日を記入する欄である。図2に示すように、未記入帳票100において日付記入欄120には日付が記入されておらず、空欄となっている。本実施形態において、日付記入欄120に申込年月日の記入がない場合には、帳票の他の欄に記入がされていても、保険契約が締結されないこととなっている。即ち、日付記入欄120は、帳票においてユーザが必ず記載すべき欄である。このため、以下では、日付記入欄120のことを「必須記入欄」ともいう。図3に示すように、記入帳票101の日付記入欄120には、ユーザによって、手書きで「2015」年「8」月「2」日と記入されている。日付記入欄120の外周部が太目の赤色の直線で縁取られることで、帳票に日付記入欄120の輪郭を示す赤色の矩形が形成されている。この矩形を第一矩形121という。
The
ユーザID欄130は、帳票において日付記入欄120の右方に設けられている。ユーザID欄130は、ユーザIDが、保険会社等の帳票の管理者の用いるプリンター等によって印字される欄である。ユーザIDは、保険契約をしようとするユーザを示す契約者コード等であり、本実施形態では、帳票の管理者が帳票のユーザを特定するためにユーザ毎に付している文字列である。本実施形態の一例では、ユーザIDは図3及び図4に示す「AABBCC1234」である。
The
事前記入欄140は、帳票において日付記入欄120及びユーザID欄130の下方に設けられている。事前記入欄140は、ユーザ固有の情報のうち管理者が把握している情報を、ユーザに帳票が配布されるよりも前に管理者が記入するための欄である。ユーザに配布された時点の未記入帳票100において、事前記入欄140には既にユーザ自身の本人情報が記入されている。本実施形態の例では、ユーザである「山田太郎」が「AABBCC1234」のユーザIDに関連付けて、予め医療保険用登録帳票DBに登録がなされている。管理者は、管理者の用いるプリンター等によって、医療保険用登録帳票DB60に登録されているユーザの情報を事前記入欄140に予め印字した未記入帳票100を作成する。管理者は、作成した未記入帳票100をユーザに配布する。具体的には、図2に示すように、事前記入欄140のうち、医療保険用登録帳票DB60に登録されているユーザの情報であるユーザの氏名を示す「ヤマダ タロウ」、「山田 太郎」、ユーザの性別、生年月日、住所及び電話番号が予め印字された未記入帳票100が、ユーザに配布される。事前記入欄140の外周部が太目の緑色の直線で縁取られることで、帳票に事前記入欄140の輪郭を示す緑色の矩形が形成されている。この矩形を第二矩形141という。
The
事前記入欄140には、契約の申し込みに必要な申込印を押印するための領域、住所及び電話番号に変更が生じている場合にチェックを記入するためのチェックボックス領域、また、変更後の住所及び電話番号を記入するための領域が設けられている。ユーザは、配布された未記入帳票100のこれらの領域に対して、押印し、また、必要に応じた事項を記入する。図3に示す記入帳票101は、事前記入欄140に申込印が押印され、事前記入欄140に予め印字されていた住所に変更が生じているとしてチェックボックス領域にチェックがなされ、変更後の住所がユーザによって手書きで記入された状態を示している。
In the
第一任意記入欄150は、帳票において事前記入欄140の下方に設けられている。第一任意記入欄150は、ユーザの配偶者についての氏名等の情報を記入するために設けられている。例えば、ユーザに配偶者があり、配偶者についても同じ帳票を用いて保険の契約を行う場合、ユーザは、第一任意記入欄150に契約に必要な配偶者の情報を手書きで記入する。一方、ユーザに配偶者がない場合、又は配偶者があるが配偶者について保険の契約申込を行わない場合には、ユーザは第一任意記入欄150に記入する必要がない。このように、第一任意記入欄150には、ユーザの必要に応じて、手書き文字が記入される場合と記入されない場合とがある。このため、図2に示すように、未記入帳票100においては、第一任意記入欄150は空欄にされている。また、図3は、ユーザの配偶者の氏名、性別を示す囲み及び生年月日が手書きで記入され、申込印の押印された記入帳票101を示している。第一任意記入欄150の外周部が太目の青色の直線で縁取られることで、帳票に第一任意記入欄150の輪郭を示す青色の矩形が形成されている。この矩形を第三矩形151という。
The first
第二任意記入欄160は、帳票において第一任意記入欄150の下方に設けられている。第二任意記入欄160は、ユーザの子についての氏名等の情報を記入するために設けられている。例えば、ユーザに子があり、子についても同じ帳票を用いて保険の契約を行う場合、ユーザは、第二任意記入欄160に契約に必要な子の情報を手書きで記入する。一方、ユーザに子がない場合、又は子があるが子について保険の契約申込を行わない場合には、ユーザは第二任意記入欄160に記入する必要がない。このように、第二任意記入欄160は、第一任意記入欄150と同様に、ユーザの必要に応じて、手書き文字が記入される場合と記入されない場合とがある。このため、図2に示すように、未記入帳票100においては、第二任意記入欄160は空欄にされている。図3は、ユーザの子についての保険契約を行わないため、子についての情報が記入されず第二任意記入欄160が空欄になっている記入帳票101を示している。第二任意記入欄160の外周部が太目の水色(淡い青色)の直線で縁取られることで、帳票に第二任意記入欄160の輪郭を示す水色の矩形が形成されている。この矩形を第四矩形161という。なお、以下では、第一任意記入欄150及び第二任意記入欄160を総称する場合、単に「任意記入欄」ともいう。
The second
このように、各種の帳票には、本実施形態の必須記入欄のようにユーザによって必ず記入されるべき記入欄と、任意記入欄のように、ユーザによって記入される場合とされない場合とがある記入欄とが混在することがある。また、本実施形態の事前記入欄140のように、ユーザに配布される帳票に予め記入事項のある記入欄が帳票に含まれることもある。このような記入の必要度の異なる複数種類の記入欄を含む帳票において、記入欄の種類毎に異なる色を用いた矩形で記入欄の輪郭を囲むことで、帳票に記入態様の必要度の異なる記入欄が複数含まれていることがユーザに視覚的に伝わりやすくなる。
In this way, various forms may or may not be filled in by the user, such as the required entry field of the present embodiment and the optional entry field. There may be a mixture of entry fields. Further, the form may include an entry field in which the form to be distributed to the user has a pre-filled item, such as the
HDD33に記憶されている登録帳票DBについて説明する。登録帳票DBには、複数の契約申込者の本人情報である氏名、性別、住所、電話番号等の情報が、契約申込者のそれぞれに対して付与されているユーザIDに関連付けられて、帳票種別毎に登録されている。
The registration form DB stored in the
図4に示すは、登録帳票DBに登録されている各種の保険契約の種別のうち、医療保険の帳票種別についての契約申込者についての情報及び契約申込書である帳票の情報を管理するDBである。なお、図4では、医療保険用登録帳票DB60全体のうち、ユーザID「AABBCC1234」に関連付けて登録されている最小単位のデータについて例示している。 FIG. 4 shows a DB that manages information about a contract applicant for a medical insurance form type and information on a form that is a contract application form among various types of insurance contracts registered in the registration form DB. is there. Note that FIG. 4 illustrates the data of the smallest unit registered in association with the user ID "AABBCC1234" in the entire medical insurance registration form DB60.
医療保険用登録帳票DB60は、「帳票管理情報」欄、「本人情報」欄、「配偶者情報」欄及び「お子様情報」欄の各欄に登録項目を分類して情報を管理している。帳票管理情報欄には、「ユーザID」「登録日」「申込日」「登録帳票画像データ」の登録項目が含まれる。「登録日」には、管理者によってユーザID及びユーザIDに関連付けられている情報が医療保険用登録帳票DB60に登録された日付が登録される。「申込日」には、記入帳票101の日付記入欄120に記入された日付を示す文字列が、後述の情報識別処理の実行によって取得された場合に、取得された文字列に基づく日付が「申込日」として登録される。「登録帳票画像データ」には、ユーザIDに対応する未記入帳票100全体の画像を示す画像データが登録される。本実施形態では、画像データはJPEG形式であるが、画像データの形式はGIF形式等の他の形式であってもよい。
The medical insurance registration form DB60 manages information by classifying registration items into each of the "form management information" column, the "personal information" column, the "spouse information" column, and the "child information" column. The form management information column includes registration items of "user ID", "registration date", "application date", and "registration form image data". In the "registration date", the date on which the user ID and the information associated with the user ID are registered in the medical insurance
本人情報欄に含まれる各登録項目には、契約申込者の氏名、性別、住所、電話番号を示す情報が、ユーザIDに対応づけられて予め登録される。本人情報欄の登録内容は、未記入帳票100の事前記入欄140に予め印字される内容である。
In each registration item included in the personal information column, information indicating the contract applicant's name, gender, address, and telephone number is pre-registered in association with the user ID. The registered content in the personal information column is the content pre-printed in the
配偶者情報欄に含まれる各登録項目には、記入帳票101の第一任意記入欄150に記入された内容を示す文字列等が後述の情報識別処理の実行によって取得された場合に、取得された文字列等に基づく各内容が登録される。お子様情報欄には、記入帳票101の第二任意記入欄160に記入された内容を示す文字列等が後述の情報識別処理の実行によって取得された場合に、取得された文字列等に基づく各内容が登録される。従って、配偶者情報欄及びお子様情報欄は、医療保険用登録帳票DB60の登録日において、また、医療保険用登録帳票DB60に基づいて未記入帳票100が作成される時点においては登録内容が存在しないので、空欄にされている。図4において、登録項目に対応する登録内容が存在しないことを、「−」と示している。
Each registration item included in the spouse information column is acquired when a character string or the like indicating the content entered in the first
図5を参照して、HDD33に記憶されている医療保険用設定テーブル70について説明する。医療保険用設定テーブル70は、管理者が取り扱う複数種別の保険契約申込書に対応する帳票のうち、医療保険契約申込書についての設定情報を格納している。図示しないが、HDD33には、医療保険用設定テーブル70以外の様々な帳票種別に対応する帳票の設定情報を格納する設定テーブルが複数記憶されている。設定情報とは、帳票種別表示欄110、日付記入欄120、事前記入欄140、第一任意記入欄150および第二任意記入欄160のそれぞれの帳票における配置等を示す情報である。
The medical insurance setting table 70 stored in the
医療保険用設定テーブル70は、「種別領域」欄、「ID領域」欄、「事前記入領域」欄、「必須記入領域」欄、「第一任意領域」欄、「第二任意領域」の各欄に設定情報を分類して格納している。種別領域欄は、帳票における帳票種別表示欄110について、「座標位置」、「領域範囲」及び「種別領域データ」の各情報を格納している。座標位置である(x0,y0)は、帳票を読み取った読取データにおいて帳票種別表示欄110の最も左上の部分が帳票において配置される位置を、帳票の左上角の位置をx−y座標の原点(0,0)として座標表示したものである。領域範囲は、後述の帳票種別判定処理(図7参照)において、読取データから帳票種別表示欄110に対応する画像データを抽出するために用いられる情報である。領域範囲は、(x0,y0)を原点とした抽出領域の幅及び高さをドット数(画素数)で表示したものである。座標位置(x0,y0)に基づく領域範囲「25×80」は、帳票において帳票種別表示欄110が占める位置及び領域よりもひとまわり広くなるように設定されている。登録種別領域データは、未記入帳票100に事前記入欄140に対応する内容が印字される前の状態の帳票における帳票種別表示欄110を示す画像データを、パターンマッチングのためのテンプレートとして記憶する。登録種別領域データのデータ形式はJPEG形式をはじめ、パターンマッチングが可能ないずれの形式であってもよい。図5では登録種別領域データとして「iryohoken.jpg」のファイル名による一つの画像データが示されている。「iryohoken.jpg」は、医療保険の契約申込書を示す帳票種別に対応付けられた画像データである。登録種別領域データは、この他、様々な帳票種別に対応する帳票種別表示欄110を示す画像データを含む。また、他の帳票種別についての設定テーブルのそれぞれにも、上記の「種別領域」欄と同様の欄が設けられている。
The medical insurance setting table 70 has each of "type area" column, "ID area" column, "pre-entry area" column, "required entry area" column, "first optional area" column, and "second optional area". The setting information is classified and stored in the column. The type area column stores each information of "coordinate position", "area range", and "type area data" for the form
「ID領域」欄は、帳票におけるユーザID欄130について、「座標位置」及び「領域範囲」の各情報を格納している。座標位置である(x1,y1)は、読取データにおいてユーザID欄130の最も左上の部分が帳票において配置される位置を、前述の原点(0,0)に対して表示したものである。領域範囲は、後述のユーザID判定処理(図8参照)において、読取データからユーザIDを判定するために用いられる情報である。領域範囲は、(x1,y1)を原点とした領域の高さ及び幅をドット数で表示したものである。
The "ID area" column stores each information of "coordinate position" and "area range" for the
事前記入領域欄は、帳票における事前記入欄140について、「座標位置」、「領域範囲」、「第一画素値」及び「第一閾値」の各情報を格納している。座標位置である(x2,y2)は、読取データにおいて事前記入欄140の最も左上の部分が帳票において配置される位置を、前述の原点(0,0)に対して表示したものである。領域範囲は、後述の領域判定処理(図12参照)において、読取データから事前記入欄140に対応する第二矩形141を特定するために用いられる情報である。領域範囲は、(x2,y2)を原点とした領域の高さ及び幅をドット数で表示したものである。座標位置(x2,y2)に基づく領域範囲「100×200」は、帳票において第二矩形141が占める位置及び領域よりもひとまわり広くなるように設定されている。第一画素値は、帳票に設けられている第二矩形141の緑色を示す値を各色256階調のRGB形式で示したものである。第一閾値は、領域判定処理において第二矩形141を特定する際に、第一画素値とみなす範囲を定義するものである。本実施形態において、第一閾値の「±5」は、第一画素値に定義されている画素値に対して前後5段階の範囲に含まれる画素値の色を第一画素値の色と同一色とみなすことを定義している。
The pre-filled area column stores information of "coordinate position", "area range", "first pixel value", and "first threshold value" for the
必須記入領域欄は、事前記入領域欄と同様に、帳票における日付記入欄120について、「座標位置」、「領域範囲」、「第二画素値」及び「第二閾値」の各情報を格納している。座標位置(x3,y3)に基づく領域範囲「30×130」は、帳票において第一矩形121が占める位置及び領域よりもひとまわり広くなるように設定されている。第二画素値は、帳票に設けられている第一矩形121の赤色を示す値を各色256階調のRGB形式で示したものである。
Similar to the pre-entry area column, the required entry area column stores each information of "coordinate position", "area range", "second pixel value" and "second threshold value" for the
第一任意領域欄も同様に、帳票における第一任意記入欄150について、「座標位置」、「領域範囲」、「第三画素値」及び「第三閾値」の各情報を格納している。第二任意領域欄も同様に、帳票における第二任意記入欄160について、「座標位置」、「領域範囲」、「第四画素値」及び「第四閾値」の各情報を格納している。座標位置(x4,y4)に基づく領域範囲「50×200」は、帳票において第三矩形151が占める位置及び領域よりもひとまわり広くなるように設定されている。座標位置(x5,y5)に基づく領域範囲「150×200」は、帳票において第四矩形161が占める位置及び領域よりもひとまわり広くなるように設定されている。なお、第三画素値は、第一画素値及び第二画素値とは異なる色を示す画素値であり、帳票に設けられている第三矩形151の青色を示す値を各色256階調のRGB形式で示したものである。第四画素値は、第一画素値、第二画素値及び第三画素値とは異なる色を示す画素値であり、帳票に設けられている第四矩形161の水色を示す値を各色256階調のRGB形式で示したものである。第二閾値、第三閾値及び第四閾値も、第一閾値と同様に対応する画素値に対して前後5段階の範囲に含まれる画素値の色を同一色とみなすことを定義している。なお、第一画素値、第二画素値、第三画素値及び第四画素値は、RGB形式以外の色空間(例えば、輝度と色差を用いたYCbCr形式、色相、彩度及び明度を用いたHSV形式等)で定義されてもよい。
Similarly, the first optional area column also stores information on the "coordinate position", "area range", "third pixel value", and "third threshold value" for the first
図6から図16を参照して、本実施形態における情報識別処理について説明する。情報識別処理は、記入帳票101の画像がスキャナ2によって読み取られた読取データに基づいて、帳票に設けられている各領域を識別し、識別結果に応じた読取結果データを取得する処理である。
The information identification process in the present embodiment will be described with reference to FIGS. 6 to 16. The information identification process is a process of identifying each area provided on the form based on the read data read by the
情報識別処理の開始に先立って、管理者は、保険契約の種別毎に、医療保険用登録帳票DB60を含む登録帳票DBを準備する。また管理者は、ユーザが契約を所望する種別の保険契約に対応する登録帳票DBに、ユーザIDと本人情報等を関連付けて登録する。そして管理者は、登録帳票DBに登録された登録内容に基づいて、ユーザID欄130にユーザIDが、事前記入欄140に本人情報が、それぞれ印字された未記入帳票100を作成する。なお、未記入帳票100は、プリンター等によって紙媒体等に印刷されることで作成されるのに限られない。例えば、登録帳票DBに登録された登録内容がファイルに出力されることで、画像ファイルとして未記入帳票100が生成されてもよい。管理者は、作成した未記入帳票100の画像を示す画像データを、スキャナ2等を用いることで得て、得た画像データを帳票種別及びユーザIDに対応付けて、登録帳票DBに登録帳票画像データとして登録する。以下では、医療保険の契約を所望するユーザに管理者が未記入帳票100を配布したとする。ユーザは、配布された未記入帳票100に必要事項を記入した記入帳票101を管理者に提出したとする。情報識別処理において、この記入帳票101に関する処理が行われるとする。
Prior to the start of the information identification process, the administrator prepares a registration form DB including a medical insurance
図6に示すように、情報識別処理が開始されると、CPU10は、記入帳票101の画像を読み取る指示を、入出力I/F14を介してスキャナ2に送信する(S11)。指示を受信したスキャナ2は、記入帳票101を読取部26において読み取り、読み取った画像のデータである読取データを生成し、情報識別装置1に送信する。CPU10は、スキャナ2から送信された読取データを、入出力I/F14を介して取得する(S12)。なお、未記入帳票100が画像ファイルとして生成されている場合には、CPU10は、S11の処理を行わなくてもよい。この場合、CPU10は、S12の処理において未記入帳票100に基づく画像ファイルを取得してもよい。その後CPU10は、帳票種別判定処理(S13)、ユーザ判定処理(S14)、事前記入領域判定処理(S15)、必須記入領域判定処理(S16)、任意記入領域判定処理(S18)を順に実行する。
As shown in FIG. 6, when the information identification process is started, the
図7を参照して、帳票種別判定処理(S13、図6参照)について説明する。帳票種別判定処理は、記入帳票101の帳票種別を、読取データに基づいて判定するための処理である。帳票種別判定処理が開始されると、CPU10は、読取データがカラー画像データであるか否かを判断する(S31)。この判断には、読取画像データの示す彩度の大きさ及び分布等を用いた周知の判断手法を用いてよい。本実施形態において、管理者がユーザに配布する正規の帳票は、赤色の矩形で囲まれた日付記入欄120、緑色の矩形で囲まれた事前記入欄140、青色の矩形で囲まれた第一任意記入欄150及び水色の矩形で囲まれた第二任意記入欄160等を含む。読取画像データがカラー画像データでない場合、ユーザは、管理者から正規に配布された帳票以外の帳票を用いていることがあるので、これを排除するためにS31の処理が設けられている。
The form type determination process (see S13 and FIG. 6) will be described with reference to FIG. 7. The form type determination process is a process for determining the form type of the
CPU10は、読取データがカラー画像データの場合(S31:YES)、読取データから帳票種別領域データを抽出する(S32)。帳票種別領域データは、読取データにおいて記入帳票101の帳票種別表示欄110に対応する部分の画像データである。本実施形態では、管理者の取り扱う帳票において、帳票に帳票種別表示欄110の設けられる位置及び領域範囲が、帳票種別を通じて同じくされている。CPU10は、HDD33に記憶されている医療保険用設定テーブル70をはじめとするいずれかの設定テーブルを参照する。CPU10は、読取データから、参照した設定テーブルの種別領域欄に定義されている座標位置及び座標範囲に該当する部分の画像データを、帳票種別領域データとして抽出する。
When the read data is color image data (S31: YES), the
CPU10は、抽出された帳票種別領域データと、前述の設定テーブル種別領域欄に格納されている登録種別領域データとを比較する(S33)。この処理において、CPU10は、HDD33に記憶されている設定テーブルを参照して登録種別領域データを取得し、取得した登録種別領域データに対して、抽出した帳票種別領域データのテンプレートマッチングを行う。
The
CPU10は、登録種別領域データに帳票種別領域データと一致するものがあるかを判断する(S34)。登録種別領域データに帳票種別領域データと一致するものがある場合(S34:YES)、CPU10は、一致した登録種別領域データに対応付けられている帳票種別を、記入帳票101の帳票種別と判定する(S35)。CPU10は、帳票種別の判定結果を、RAM12に記憶する。本実施形態の例では、「医療保険用」の帳票種別と判定した旨がRAM12に記憶されたとする。CPU10は、処理を情報識別処理(図6参照)へ戻す
The
一方、読取データがカラー画像データでない場合(S31:NO)、又は登録種別領域データに帳票種別領域データと一致するものがない場合(S34:NO)、CPU10は、該当種別なしエラー表示81(図13参照)を出力する指示を、入出力I/F14を介して表示部16に送信する(S36)。該当種別なしエラー表示81は、記入帳票101が正規の帳票でないこと、また記入帳票101に設けられている帳票種別表示欄110に示される帳票種別が情報識別処理に対応するものでないことを作業者に示すために表示される画像である。該当種別なしエラー表示81を示す画像データは、HDD33に記憶されている。表示部16は、S36の処理による指示に応じて該当種別なしエラー表示81を表示する。CPU10は、処理をS29(図6参照)の判断へ移行する。
On the other hand, when the read data is not color image data (S31: NO), or when there is no registered type area data that matches the form type area data (S34: NO), the
図8を参照して、ユーザ判定処理(S14、図6参照)について説明する。ユーザ判定処理は、読取データに基づいて記入帳票101のユーザを判定するための処理である。ユーザ判定処理が開始されると、CPU10は、読取データからユーザID領域データを抽出する(S41)。ユーザID領域データは、読取データにおいて記入帳票101のユーザID欄130に対応する部分の画像データである。この処理において、CPU10は、RAM12に記憶されている帳票種別の判定結果を参照して、読取データの帳票種別が「医療保険用」であること示す情報を取得する。CPU10は、HDD33に記憶されている設定テーブルのうち、取得した帳票種別に対応する医療保険用設定テーブルを参照する。CPU10は、読取データから、医療保険用設定テーブル70のID領域欄に定義されている座標位置及び座標範囲に該当する部分の画像データを、ユーザID領域データとして抽出する。CPU10は、抽出したユーザID領域データをRAM12に記憶する。
The user determination process (see S14 and FIG. 6) will be described with reference to FIG. The user determination process is a process for determining the user of the
CPU10は、抽出されたユーザID領域データに対して文字認識処理を実行する(S42)。本実施形態では、文字認識処理として、文字の輪郭に対応する特徴を画像から抽出し、文字の標準パターンとの比較を行う公知のOCR処理が採用される。CPU10は、OCR処理を実行することによって、RAM12に記憶されたユーザID領域データから文字を抽出する。OCR処理においては、周知のエッジ検出技術等の特徴抽出ステップと、抽出した特徴を文字のテンプレートと比較するマッチングステップとを含む、周知のライブラリを利用可能である。CPU10は、抽出された文字を分析して、ユーザID欄130に印字されている文字を特定する。CPU10は、特定したユーザID欄130に印字されている文字列を示す文字列データであるID文字列データを生成し、RAM12に記憶する。
The
CPU10は、HDD33に記憶されている登録帳票DBのうち、S35(図7参照)の処理で判定した帳票種別の登録帳票DBを参照する(S43)。本実施形態の例では、RAM12に「医療保険用」の帳票種別が記憶されているので、CPU10はこれに応じて医療保険用登録帳票DB60を参照したとする。CPU10は、参照した登録帳票DBに登録されている複数のユーザIDである登録ユーザIDと、RAM12に記憶されているID文字列データとを比較する(S45)。
The
CPU10は、登録ユーザIDにID文字列データの示す文字列と一致する文字列があるかを判断する(S46)。登録ユーザIDにID文字列データの示す文字列と一致する文字列がない場合(S46:NO)、CPU10は、ID文字列データの示す文字列に該当する登録ユーザIDがないことを示す該当IDなしエラー表示(図示せず)を出力する指示を、入出力I/F14を介して表示部16に送信する(S47)。該当IDなしエラー表示は、例えば、「該当する登録ユーザIDが存在しません」等のメッセージを表記する画像である。表示部16は、S47の指示に応じて該当IDなしエラー表示を表示する。
The
CPU10は、直接入力表示(図示せず)を出力する指示を、入出力I/F14を介して表示部16に送信する(S48)。直接入力表示は、例えば作業者に操作部17を用いて記入帳票101のユーザID欄130に記載されているユーザIDを入力することを促すための画面である。この処理は、記入帳票101印字されているユーザIDの印字濃度が低い等、読取データからID文字列データが正しく生成されていないときに、ID文字列データを取得するために行われる。表示部16は、S48の指示に応じて直接入力表示を表示する。
The
CPU10は、操作部17を介して入力されたID文字列データを取得する(S49)。その後、CPU10は、登録ユーザIDにID文字列データの示す文字列と一致する文字列があると判断されるまで(S46:YES)、S43からS47の処理を繰り返す。なお、S43からS47の処理が所定回数以上繰り返された場合に、CPU10は、処理をS29(図6参照)の判断へ移行させてもよい。
The
登録ユーザIDにID文字列データの示す文字列と一致する文字列があった場合(S46:YES)、CPU10は、ID文字列データの示す文字列と一致する登録ユーザIDを、読取データに対応するユーザIDとして取得する(S50)。CPU10は、取得したユーザIDを示すデータをRAM12に記憶する。CPU10は、処理を情報識別処理(図6参照)へ戻す。本実施形態の例では、記入帳票101のユーザID欄130に印字されている「AABBCC1234」文字列を示すユーザIDがRAM12に記憶されたとする。
When the registered user ID has a character string that matches the character string indicated by the ID character string data (S46: YES), the
図9を参照して、事前記入判定処理(S15、図6参照)について説明する。事前記入判定処理では、読取データに事前記入欄140に相当する第一領域が含まれるかが判定される。また、読取データに第一領域が含まれる場合には、第一領域の画像を示す第一領域データを取得し、取得した第一領域データの内容に応じた処理が行われる。図9に示すように、事前記入領域判定処理が開始されると、CPU10は、HDD33に記憶されている設定テーブルのうち、S35(図7参照)の処理で判定した帳票種別の設定テーブルを参照する(S51)。本実施形態の例では、S35の処理によって、RAM12に帳票種別が「医療保険用」である旨が記憶されているので、CPU10はこれに応じて医療保険用設定テーブル70を参照したとする。CPU10は、設定テーブルの事前記入領域欄から第一画素値及び第一閾値を取得する(S52)。ここで取得した第一画素値及び第一閾値を、事前記入領域判定処理における設定画素値及び設定閾値ともいう。
The pre-filled determination process (see S15 and FIG. 6) will be described with reference to FIG. In the pre-filling determination process, it is determined whether the read data includes the first area corresponding to the
CPU10は、領域判定処理を実行する(S53)。図12を参照して、領域判定処理(S53、図9参照)について説明する。領域判定処理は、事前記入領域判定処理における設定画素値及び設定閾値に基づいて、読取データに設定画素値に対応する色で囲まれた領域が含まれているかを判定する処理である。なお、領域判定処理は、後述する必須記入領域判定処理(図10参照)及び任意記入領域判定処理(図11参照)においても実行される。この場合、必須記入領域判定処理における設定画素値及び設定閾値、又は任意記入領域判定処理における設定画素値及び設定閾値に基づいて、設定画素値に対応する色で囲まれた領域が含まれているかが判定される。
The
図12に示すように、領域判定処理が開始されると、CPU10は、検索領域範囲を設定する(S111)。検索領域範囲は、前述したように、設定画素値に対応する画素値を有する画素の座標位置を、読取データにおいて検索する領域の範囲である。具体的には、CPU10は、HDD33に記憶されている設定テーブルのうち、S35(図7参照)の処理で判定した帳票種別の設定テーブルを参照し、設定画素値に対応する座標位置及び領域範囲を取得する。本実施形態の例では、医療保険用設定テーブル70が参照され、医療保険用設定テーブル70の事前記入領域欄において設定画素値である第一画素値に対応付けられている座標位置(x2,y2)、及び座標位置を原点とした領域範囲「100×200」が取得されたとする。CPU10は、取得された座標位置に基づく領域範囲を検索領域範囲に設定する。
As shown in FIG. 12, when the area determination process is started, the
CPU10は、読取データのうち検索領域範囲にある座標位置を示す画素のそれぞれについて、設定画素値に対応する画素値を有するかを判定する。設定画素値に対応する画素値とは、設定画素値に対して設定閾値の範囲内の画素値である。ここでは、0≦R≦5,250≦G≦255,0≦B≦5の各範囲内にある画素値が、設定画素値に対応する。本実施形態では、読取データのうち検索領域範囲にある座標位置を示す画素のそれぞれについて、第一画素値に対して第一閾値の範囲内の画素値を有するかが繰り返し判定される。そして、CPU10は、設定画素値に対応する画素値を有すると判定された画素について、各画素の座標位置を取得する(S112)。CPU10は、取得された座標位置をRAM12に記憶する。
The
CPU10は、S112の処理において取得された複数の座標位置を、最小二乗法等の周知の直線近似法を用いて近似することで、近似直線を算出する(S113)。本実施形態の例では、読取データの検索領域範囲において、記入帳票101に設けられている事前記入欄140を縁取る緑色の第二矩形141の各辺に対応する近似直線が算出される。この処理において、例えば、CPU10は、K平均法を用いて、S112で取得された画素をクラスタにそれぞれ割り当てる。矩形の四辺に対応する近似直線の算出を想定しているので、クラスタ数は「4」に設定される。各クラスタに対して直線近似法を用いて近似することで、第二矩形141の各辺に対応する近似直線が算出される。なお、設定されるクラスタ数は、事前記入領域の数に応じて、適宜調整されてもよい。
The
CPU10は、HDD33に記憶されている登録帳票DBから、帳票種別及びユーザIDに応じた登録帳票画像データを取得する(S115)。具体的には、CPU10は、HDD33に記憶されている登録帳票DBのうち、S35(図7参照)の処理で判定した帳票種別の登録帳票DBを参照し、参照した種別の登録帳票DBから、S50(図8参照)の処理で取得したユーザIDに対応する登録帳票画像データを取得する。本実施形態の例では、S35の処理によって、RAM12に「医療保険用」の帳票種別が記憶されており、S50の処理によって、RAM12に「AABBCC1234」の文字列を示すユーザIDが記憶されている。従って、登録帳票DBのうち図4に示す医療保険用登録帳票DB60が参照され、ユーザID「AABBCC1234」に対応付けられている登録帳票画像データ「AABBCC1234_0.jpg」が取得されたとする。
The
CPU10は、S113の処理において算出された近似直線のなす形状と、S115の処理で取得された登録帳票画像データにおいて、設定画素値に対応する画素値を有する画素によって構成される矩形の形状とを比較する(S116)。事前記入領域判定処理(図9参照)において領域判定処理が実行される場合、設定画素値は設定テーブルの事前記入領域に定義されている第一画素値である。本実施形態において、医療保険用設定テーブル70の事前記入領域に定義されている第一画素値は、記入帳票101に設けられている第二矩形141が示す色に対応する緑色を示す画素値である。CPU10は、登録帳票画像データに含まれている、設定画素値である第一画素値の画素の集合によって示される図形の形状を特定する。第一画素値の画素の集合によって示される図形の形状の特定において、CPU10は、登録帳票画像データに、S111の処理と同様に所定の検索領域を設定する。CPU10は、S112の処理と同様に、検索領域における設定画素値に対応する画素値を有すると判定された画素について、各画素の座標位置を取得する。そして、CPU10は、S113の処理と同様に、取得された複数の座標位置に基づいて、近似直線を算出する。この場合、登録帳票画像データに含まれている第二矩形141の形状が特定される。そして、CPU10は、特定された第二矩形141の形状と、読取データに基づく近似直線のなす形状とを比較する。
The
CPU10は、特定された第二矩形141の形状と、読取データに基づく近似直線のなす形状とが所定の同一範囲内であるか否かを判断する(S117)。特定された第二矩形141の形状と、読取データに基づく近似直線のなす形状とが所定の同一範囲内でない場合(S117:NO)、CPU10は、処理を事前記入領域判定処理(図9参照)に戻す。一方、特定された第二矩形141の形状と、読取データに基づく近似直線のなす形状とが所定の同一範囲内である場合(S117:YES)、CPU10は、読取データに基づく近似直線のなす形状で囲まれている領域を設定画素値に対応する領域と特定する(S118)。この場合、設定画素値を第一画素値として特定された領域を、以下、第一領域とする。CPU10は、第一領域の読取データにおける位置及び大きさを示す座標値等の情報をRAM12に記憶する。CPU10は、処理を事前記入領域判定処理(図9参照)に戻す。なお、領域判定処理が必須記入領域判定処理又は任意記入領域判定処理において実行されていた場合には、CPU10は、処理を必須記入領域判定処理又は任意記入領域判定処理に戻す。
The
図9の説明に戻る。CPU10は、領域判定処理において第一画素値に対応する第一領域が特定されているかを判断する(S54)。この処理において、CPU10は、第一領域の読取データにおける位置及び大きさを示す座標値等の情報がRAM12に記憶されている場合に、領域判定処理において第一領域が特定されていると判断する。領域判定処理において第一領域が特定されていない場合(S54:NO)、CPU10は処理を情報識別処理(図6参照)へ戻す。なお、この処理は、帳票に事前記入欄140が設けられず、第一領域が特定されないことがあることを考慮したものである。
Returning to the description of FIG. The
領域判定処理において第一領域が特定されている場合(S54:YES)、CPU10は、第一領域の画像を示す第一領域データを、RAM12に記憶されている第一領域の座標値等の情報に基づいて読取データから取得する(S55)。第一領域データは、記入帳票101における事前記入欄140の画像に対応する。
When the first area is specified in the area determination process (S54: YES), the
CPU10は、登録帳票画像データにおいて、設定画素値である第一画素値の画素の集合によって示される図形で囲まれている領域の位置及び大きさを特定する(S56)。この場合、CPU10は、第一画素値に対応する第二矩形141によって囲まれる領域の登録帳票画像データにおける位置及び大きさを示す座標値等の情報をRAM12に記憶する。CPU10は、第二矩形141によって囲まれる領域の画像を示す登録第一領域データを、RAM12に記憶されている座標値等の情報に基づいて登録帳票画像データから取得する(S58)。登録第一領域データは、未記入帳票100における事前記入欄140の画像に対応する。
The
CPU10は、第一領域データと登録第一領域データとを比較する(S59)。この比較において、CPU10は、例えば、第一領域データを構成する各画素について色の要素(階調、色相)を分析する。そして、CPU10は、各画素について分析した結果である、第一領域データの色の要素を横軸とするヒストグラムを取得する。また、CPU10は、登録第一領域データについても、登録第一領域データの色の要素を横軸とするヒストグラムを取得する。CPU10は、取得した各ヒストグラムを比較する。第一領域データのヒストグラムは、未記入帳票100の事前記入欄140に印刷及び印字されている内容に対応する。登録第一領域データのヒストグラムは、記入帳票101の事前記入欄140印刷及び印字されている内容に加え、ユーザによって手書き文字等が記入されている場合には、記入されている手書き文字等の内容が加味された内容に対応する。
The
CPU10は、第一領域データと登録第一領域データとに差分があるかを判断する(S61)。この判断は、例えば、第一領域データのヒストグラムと登録第一領域データのヒストグラムとを対比した結果、各ヒストグラム間に差分があるかによって判断される。即ち、S61の処理によって、未記入帳票100の事前記入欄140に対して、記入帳票101の事前記入欄140においてユーザによって手書き文字等が記入されたかが判断される。本実施形態の例では、図2に示す未記入帳票100の事前記入欄140には、予め管理者によって医療保険用登録帳票DB60におけるユーザID「AABBCC1234」に関連付けられて登録されている内容に応じて印字された内容が示されている。図3に示す記入帳票101の事前記入欄140には、事前記入欄140に予め印字されている内容に加えて、住所変更内容が手書きで記入され、ユーザの申込印が押印されている。この場合、第一領域データのヒストグラムと登録第一領域データのヒストグラムとの間には差分が生ずる。
The
第一領域データと登録第一領域データとに差分がある場合(S61:YES)、CPU10は、第一領域データを、後述するS21(図6参照)の処理における文字認識処理の実行対象とすることを決定する(S62)。CPU10は、第一領域データを文字認識処理の実行対象とする旨をRAM12に記憶する。CPU10は、処理を情報識別処理(図6参照)に戻す。
When there is a difference between the first area data and the registered first area data (S61: YES), the
一方、第一領域データと登録第一領域データとに差分がない場合(S61:NO)、CPU10は、第一領域を輝度変更表示対象に決定する(S63)。CPU10は、第一領域データの全体が示す輝度値の平均値を第一領域データから取得する。CPU10は、取得した輝度値の平均値を、第一領域を輝度変更表示対象に決定した旨に関連付けてRAM12に記憶する。CPU10は、処理を情報識別処理(図6参照)に戻す。
On the other hand, when there is no difference between the first region data and the registered first region data (S61: NO), the
図10を参照して、必須記入判定処理(S16、図6参照)について説明する。必須記入判定処理では、読取データに日付記入欄120に相当する第二領域が含まれるかが判定される。また、読取データに第二領域が含まれる場合には、第二領域の画像を示す第二領域データを取得し、取得した第二領域データの内容に応じた処理が行われる。図10に示すように、必須記入領域判定処理が開始されると、CPU10は、HDD33に記憶されている設定テーブルのうち、S35(図7参照)の処理で判定した帳票種別の設定テーブルを参照する(S71)。CPU10は、設定テーブルの必須記入領域欄から第二画素値及び第二閾値を取得する(S72)。本実施形態の例では、医療保険用設定テーブル70の参照に応じて、赤色を示す第二画素値及び第二閾値が取得されたとする。ここで取得した第二画素値及び第二閾値を、必須記入領域判定処理における設定画素値及び設定閾値ともいう。
The required entry determination process (see S16 and FIG. 6) will be described with reference to FIG. In the mandatory entry determination process, it is determined whether the read data includes the second area corresponding to the
CPU10は、必須記入領域判定処理における設定画素値及び設定閾値に基づいて、前述の領域判定処理(図12参照)を実行する(S73)。領域判定処理では、第二画素値に対応する画素値を有する画素の座標位置を、読取データにおいて検索する検索領域範囲が、設定テーブルに基づいて設定される(S111)。そして、検索領域範囲にある第二画素値に対応する画素値を有する画素の座標位置が取得される(S112)。取得された座標位置から近似直線が算出される(S113)。登録帳票DBから、帳票種別及びユーザIDに応じた登録帳票画像データが取得される(S115)。近似直線のなす形状と、登録帳票画像データにおいて第二画素値に対応する画素値を有する画素によって構成される矩形の形状とが比較される(S116)。登録帳票画像データにおいて第二画素値に対応する画素値を有する画素によって構成される矩形は、帳票に設けられている第一矩形121の形状に対応する。登録帳票画像データにおける第二矩形141の形状と、読取データに基づく近似直線のなす形状とが所定の同一範囲内であるか否かが判断される(S117)。登録帳票画像データにおける第二矩形141の形状と、読取データに基づく近似直線のなす形状とが所定の同一範囲内である場合には(S117:YES)、近似直線のなす形状で囲まれている領域が第二画素値に対応する第二領域と特定される(S118)。
The
CPU10は、領域判定処理において第二領域が特定されているかを判断する(S74)。CPU10は、第二領域の読取データにおける位置及び大きさを示す座標値等の情報がRAM12に記憶されている場合に、第二領域が特定されていると判断する。
The
領域判定処理において第二画素値に対応する領域が特定されていない場合(S74:NO)、CPU10は、記入帳票読取エラー表示82(図14参照)を出力する指示を、入出力I/F14を介して表示部16に送信する(S84)。日付記入欄120は帳票において必須記入欄であることから、帳票に必ず存在することが想定される。しかし、読取データが適切に取得できていないことによって、領域判定処理において日付記入欄120に対応する第二領域が特定されていない場合がある。記入帳票読取エラー表示82は、記入帳票101を読取部26において再度読み取らせ、読取データを新たに取得することを作業者に促すために表示される画像である。本実施形態の例では、記入帳票読取エラー表示82は、「帳票をもう一度スキャンしてください」のメッセージを表示することで、作業者に記入帳票101の読取作業を促す。記入帳票読取エラー表示82を示す画像データは、HDD33に記憶されている。表示部16は、S74の処理による指示に応じて該当種別なしエラー表示81を表示する。
When the area corresponding to the second pixel value is not specified in the area determination process (S74: NO), the
CPU10は、操作部17を介して、記入帳票101を読取部26において読み取らせるための指示が入力されたかを判断する(S85)。記入帳票101を読取部26において読み取らせるための指示が入力された場合(S85:YES)、CPU10は、処理をS11(図6参照)へ戻す。記入帳票101を読取部26において読み取らせるための指示が入力されない場合(S85:NO)、CPU10は、処理をS29(図6参照)の判断へ移行する。
The
領域判定処理において第二画素値に対応する領域が特定されている場合(S74:YES)、CPU10は、第二領域の画像を示す第二領域データを、RAM12に記憶されている第二領域の座標値等の情報に基づいて読取データから取得する(S75)。第二領域データは、記入帳票101における日付記入欄120の画像に対応する。
When the area corresponding to the second pixel value is specified in the area determination process (S74: YES), the
CPU10は、登録帳票画像データにおいて、設定画素値である第二画素値の画素の集合によって示される図形で囲まれている領域の位置及び大きさを特定する(S76)。この場合、CPU10は、登録帳票画像データにおいて、第一矩形121によって囲まれる領域の登録帳票画像データにおける位置及び大きさを示す座標値等の情報をRAM12に記憶する。CPU10は、第一矩形121によって囲まれる領域の画像を示す登録第二領域データを、RAM12に記憶されている座標値等の情報に基づいて登録帳票画像データから取得する(S78)。登録第一領域データは、未記入帳票100における日付記入欄120の画像に対応する。
The
CPU10は、第二領域データと登録第二領域データとを比較する(S79)。この処理において、CPU10は、例えば、第二領域データ及び登録第二領域データの色の要素に関するヒストグラムをそれぞれ取得する。CPU10は、各ヒストグラムを比較する。
The
CPU10は、第一領域データと登録第一領域データとに差分があるかを判断する(S81)。この判断は、例えば、各ヒストグラム間に差分があるかによって判断される。即ち、S81の処理によって、未記入帳票100の日付記入欄120に対して、記入帳票101の日付記入欄120においてユーザによって手書き文字等が記入されたかが判断される。本実施形態の例では、図2に示す未記入帳票100の日付記入欄120は空欄であるが、図3に示す記入帳票101の日付記入欄120には「2015」「8」「2」の数字に基づく日付が、手書きで記入されている。この場合、第二領域データのヒストグラムと登録第二領域データのヒストグラムとの間には差分が生ずる。
The
第二領域データと登録第二領域データとに差分がある場合(S81:YES)、CPU10は、第二領域データを、後述するS21(図6参照)の処理における文字認識処理の実行対象とすることを決定する(S82)。CPU10は、第二領域データを文字認識処理の実行対象とする旨をRAM12に記憶する。CPU10は、処理を情報識別処理(図6参照)に戻す。
When there is a difference between the second area data and the registered second area data (S81: YES), the
一方、第二領域データと登録第二領域データとに差分がない場合(S81:NO)、CPU10は、必須記入欄未記入エラー表示83(図16参照)を出力する指示を、RAM12に記憶する(S83)。必須記入欄未記入エラー表示83は、後述する読取結果表示において、第二領域データと登録第二領域データとに差分がなかったこと、即ち、日付記入欄120に必要な記入がされていないことを、第二領域に関連付けて作業者に示すために表示される画像である。CPU10は、処理を情報識別処理(図6参照)に戻す。
On the other hand, when there is no difference between the second area data and the registered second area data (S81: NO), the
図11を参照して、任意記入判定処理(S18、図6参照)について説明する。任意記入判定処理では、読取データに任意記入欄に相当する領域が含まれるかが判定される。また、読取データに任意記入欄に相当する領域が含まれる場合には、任意記入欄に相当する領域の画像を示す対応領域データを取得し、取得した対応領域データの内容に応じた処理が行われる。図11に示すように、任意記入領域判定処理が開始されると、CPU10は、HDD33に記憶されている設定テーブルのうち、S35(図7参照)の処理で判定した帳票種別の設定テーブルを参照する(S91)。CPU10は、設定テーブルの任意記入欄に対応する第一任意領域欄及び第二任意領域欄のうち、上位の欄に設定されている第一任意領域欄から、設定画素値及び設定閾値として第三画素値及び第三閾値を取得する(S92)。本実施形態の例では、医療保険用設定テーブル70の参照に応じて、青色を示す第三画素値及び第三閾値が取得されたとする。
The optional entry determination process (see S18 and FIG. 6) will be described with reference to FIG. In the optional entry determination process, it is determined whether the read data includes an area corresponding to the optional entry column. If the read data includes an area corresponding to the optional entry field, the corresponding area data showing the image of the area corresponding to the optional entry field is acquired, and processing is performed according to the content of the acquired corresponding area data. Will be. As shown in FIG. 11, when the arbitrary entry area determination process is started, the
CPU10は、設定画素値及び設定閾値に基づいて、前述の領域判定処理(図12参照)を実行する(S93)。領域判定処理では、第三画素値に対応する画素値を有する画素の座標位置を、読取データにおいて検索する検索領域範囲が、設定テーブルに基づいて設定される(S111)。そして、検索領域範囲にある第三画素値に対応する画素値を有する画素の座標位置が取得される(S112)。取得された座標位置から近似直線が算出される(S113)。登録帳票DBから、帳票種別及びユーザIDに応じた登録帳票画像データが取得される(S115)。近似直線のなす形状と、登録帳票画像データにおいて第三画素値に対応する画素値を有する画素によって構成される矩形の形状とが比較される(S116)。登録帳票画像データにおいて第三画素値に対応する画素値を有する画素によって構成される矩形は、帳票に設けられている第三矩形151の形状に対応する。登録帳票画像データにおける第三矩形151の形状と、読取データに基づく近似直線のなす形状とが所定の同一範囲内であるか否かが判断される(S117)。登録帳票画像データにおける第三矩形151の形状と、読取データに基づく近似直線のなす形状とが所定の同一範囲内である場合には(S117:YES)、近似直線のなす形状で囲まれている領域が第三画素値に対応する第三領域と特定される(S118)。
The
CPU10は、領域判定処理において第三領域が特定されているかを判断する(S94)。CPU10は、第三領域の読取データにおける位置及び大きさを示す座標値等の情報がRAM12に記憶されている場合に、第三領域が特定されていると判断する。領域判定処理において第三画素値に対応する領域が特定されていない場合(S94:NO)、CPU10は処理を情報識別処理(図6参照)へ戻す。なお、この処理は、帳票に任意記入が設けられず、第三領域が特定されないことがあることを考慮したものである。
The
領域判定処理において第三画素値に対応する領域が特定されている場合(S94:YES)、CPU10は、第三領域の画像を示す第三領域データを、RAM12に記憶されている第三領域の座標値等の情報に基づいて読取データから取得する(S95)。第三領域データは、記入帳票101における第一任意記入欄150の画像に対応する。
When the area corresponding to the third pixel value is specified in the area determination process (S94: YES), the
CPU10は、第三画素値に基づいて、登録帳票画像データにおいて、設定画素値である第三画素値の画素の集合によって示される図形で囲まれている領域の位置及び大きさを特定する(S96)。この場合、CPU10は、第三画素値に対応する第三矩形151によって囲まれる領域の登録帳票画像データにおける位置及び大きさを示す座標値等の情報をRAM12に記憶する。CPU10は、第三矩形151によって囲まれる領域の画像を示す登録第三領域データを、RAM12に記憶されている座標値等の情報に基づいて登録帳票画像データから取得する(S98)。登録第三領域データは、未記入帳票100における第一任意記入欄150の画像に対応する。
Based on the third pixel value, the
CPU10は、第三領域データと登録第三領域データとを比較する(S99)。この処理において、CPU10は、例えば、第三領域データ及び登録第三領域データの色の要素に関するヒストグラムをそれぞれ取得する。CPU10は、各ヒストグラムを比較する。
The
CPU10は、第三領域データと登録第三領域データとに差分があるかを判断する(S101)。この判断は、例えば、各ヒストグラム間に差分があるかによって判断される。即ち、S101の処理によって、未記入帳票100の第一任意記入欄150に対して、記入帳票101の第一任意記入欄150においてユーザによって手書き文字等が記入されたかが判断される。本実施形態の例では、図2に示す未記入帳票100の第一任意記入欄150は空欄であるが、図3に示す記入帳票101の第一任意記入欄150には、ユーザの配偶者についての氏名等を示す文字列が、手書きで記入されている。この場合、第三領域データのヒストグラムと登録第三領域データのヒストグラムとの間には差分が生ずる。
The
第三領域データと登録第三領域データとに差分がある場合(S101:YES)、CPU10は、第三領域データを、後述するS21(図6参照)の処理における文字認識処理の実行対象とすることを決定する(S102)。CPU10は、第三領域データを文字認識処理の実行対象とする旨をRAM12に記憶する。一方、第三領域データと登録第三領域データとに差分がない場合(S101:NO)、CPU10は、第三領域を輝度変更表示対象に決定する(S103)。CPU10は、第三領域データの全体が示す輝度値の平均値を第三領域データから取得する。CPU10は、取得した輝度値の平均値を、第三領域を輝度変更表示対象に決定した旨に関連付けてRAM12に記憶する。
When there is a difference between the third area data and the registered third area data (S101: YES), the
本実施形態において、帳票の任意記入欄に含まれる欄として、帳票において輪郭の色の異なる第一任意記入欄150及び第二任意記入欄160の二つの欄があるので、任意記入領域判定処理で扱う設定画素値及び設定閾値も二種類となる。CPU10は、領域判定処理(S93)をまだ行っていない他の設定画素値があるかを判断する(S104)。CPU10は、HDD33に記憶されている設定テーブルの任意記入欄に対応する欄を参照し、第三画素値及び第三閾値に対応する欄よりも下位の欄に設定されている欄がある場合に、領域判定処理をまだ行っていない他の設定画素値があると判断する。本実施形態の例では、医療保険用設定テーブル70において第一任意領域欄の下位に第二任意領域欄が設定されているので、領域判定処理をまだ行っていない他の設定画素値があると判断されたとする。
In the present embodiment, there are two columns included in the optional entry column of the form, the first
領域判定処理をまだ行っていない他の設定画素値があると判断された場合(S104:YES)、CPU10は、他の設定画素値及び他の設定閾値を設定テーブルから取得する(S105)。本実施形態の例では、医療保険用設定テーブル70の第二任意領域欄から、設定画素値及び設定閾値として第四画素値及び第四閾値が取得される。以降、CPU10は、第四画素値及び第四閾値に基づいて、S93からS104の処理を実行する。本実施形態の例では、図2に示す未記入帳票100の第二任意記入欄160及び図3に示す記入帳票101の第二任意記入欄160の双方が空欄とされているので、S103の処理によって、第四画素値に対応する第四領域が、輝度変更表示対象に決定されたとする。
When it is determined that there is another set pixel value for which the area determination process has not yet been performed (S104: YES), the
その後、領域判定処理をまだ行っていない他の設定画素値があると判断された場合(S104:NO)、CPU10は、処理を情報識別処理(図6参照)へ戻す。
After that, when it is determined that there is another set pixel value for which the area determination process has not yet been performed (S104: NO), the
図6の説明に戻る。CPU10は、記入帳票101の必須記入欄が未記入であるかを判断する(S19)。本実施形態では、S83(図10参照)の処理によって必須記入欄未記入エラー表示83(図16参照)を出力する指示がRAM12に記憶されている場合に、日付記入欄120が未記入であると判断される。CPU10は、必須記入欄が未記入でない場合(S19:YES)、S62(図9参照)、S82(図10参照)及びS102(図11参照)の各処理において文字認識処理の実行対象とされた第一領域データ、第二領域データ及び第三領域データのそれぞれについて、文字認識処理を実行する(S21)。本実施形態では、文字認識処理は、前述のOCR処理である。CPU10は、文字認識処理の実行対象とされた第一領域データ、第二領域データ及び第三領域データから、文字認識処理の実行結果である第一文字列データ、第二文字列データ及び第三文字列データを取得する(S22)。これらの文字列データは、後述のS26の処理において、登録帳票DBに登録するために取得される。このため、これらの文字列データを、登録文字列データともいう。S22の処理は、必須記入欄が未記入でないことに応じて行われることから、登録文字列データは、少なくとも第二文字列データを含む。なお、第一文字列データ、第二文字列データ及び第三文字列データのそれぞれは、記入帳票101の事前記入欄140、日付記入欄120及び任意記入欄のそれぞれに含まれる文字列を示す文字列データに相当する。CPU10は、取得された登録文字列データをRAM12に記憶する。
Returning to the description of FIG. The
CPU10は、記入帳票101がスキャナ2の読取部26において読み取られた結果を示す、読取結果表示を示す読取結果データを生成する(S23)。読取結果表示は、記入帳票101がスキャナ2の読取部26において正しく読み取られたかを作業者に確認させるために表示部16に表示される画像である。読取結果データは、S12で取得された読取データに基づいて生成される。
The
読取データにおける事前記入欄140に相当する第一領域及び任意記入欄に相当する第三領域及び第四領域は、S63(図9参照)及びS103(図11参照)の処理によって、輝度変更表示対象に決定されていることがある。CPU10は、読取結果データを生成する際にRAM12に記憶されている情報を参照する。RAM12にいずれかの領域が輝度変更表示対象に決定されている旨の情報が記憶されていれば、CPU10は、輝度変更表示対象に決定されている領域が、輝度変更表示対象に決定されている旨を示す情報に関連付けられた輝度値よりも低い輝度値で表示されるように、読取データを加工する。これにより、例えば、輝度変更対象に決定されている領域については、読取結果表示においてグレー色で表示されるグレーアウト表示がされる。本実施形態の例では、第四領域が輝度変更対象に決定されているとする。第一領域、第三領域及び第四領域が輝度変更対象に決定されるのは、第一領域、第三領域及び第四領域に相当する記入帳票101の事前記入欄140及び任意記入欄に手書き文字等の記入がされなかった場合である。このような場合に、輝度変更対象に決定されている領域をグレーアウト表示によって作業者に視認し難くすることで、グレーアウト表示がされている領域については注視する必要のないことが作業者に示される。この他、CPU10は、読取結果表示の確認を促すための表示202(図15参照)を付して、読取結果データを生成する。
The first area corresponding to the
CPU10は、S23の処理で生成された読取結果データに基づく読取結果表示を出力する指示を、入出力I/F14を介して表示部16に送信する(S24)。図15は、本実施形態の例による読取結果表示200を示す。読取結果表示200は、読取データに基づく画像の表示される結果表示201と、前述の表示202とを含む。結果表示201のうち、読取データの第一領域、第二領域及び第三領域に相当する事前記入欄140、日付記入欄120及び第一任意記入欄150については、読取結果を作業者が視認できる態様で表示される。結果表示201のうち、読取データの第四領域に対応する第二任意記入欄160については、輝度変更対象に決定されているので、輝度が低減されてグレーアウト表示される。
The
読取結果表示を表示部16にて確認した作業者は、操作部17を介してCPU10に指示を入力できる。CPU10は、S22の処理で取得された第一文字列データ、第二文字列データ及び第三文字列データのそれぞれを、登録帳票DBに登録する指示が操作部17を介して入力されたかを判断する(S25)。
The operator who confirmed the reading result display on the
登録帳票DBに登録する旨の所定の指示が入力されている場合(S25:YES)、CPU10は、S22の処理で取得した登録文字列データを、登録帳票DBのうちS13の処理で判定された帳票種別に対応する登録帳票DBに、S14の処理で判定されたユーザIDに対応付けて登録する(S26)。本実施形態の例では、第一文字列データは、医療保険用登録帳票DB70の本人情報欄の各項目に登録される。第二文字列データは、医療保険用登録帳票DB70の帳票管理情報欄における申込日の項目に登録される。第三文字列データは、医療保険用登録帳票DB70の配偶者情報の各項目に登録される。このとき、第一文字列データに、手書き文字によって追記された、変更後の住所等を示す文字列に対応する文字列データが含まれる場合、本人情報欄に登録されている情報が、追記された文字列に対応する文字列データに更新されて登録されてもよい。CPU10は、処理をS29の判断へ移行する。
When a predetermined instruction to register in the registration form DB is input (S25: YES), the
一方、CPU10は、必須記入欄が未記入である場合(S19:NO)、読取結果データを生成する(S27)。この処理で生成される読取結果データは、S23の処理で生成される読取結果データと同様に、読取データに基づいて、また、表示202の付されたものとして生成される。また、輝度変更表示対象に決定されている領域があれば、CPU10は、輝度変更表示対象に決定されている領域が、輝度変更表示対象に決定されている旨を示す情報に関連付けられた輝度値よりも低い輝度値で表示されるように、読取データを加工する。また、CPU10は、読取結果データを生成する際にRAM12に記憶されている情報をさらに参照する。RAM12に必須記入欄未記入エラー表示83(図16参照)を出力する指示が記憶されていれば、必須記入欄未記入エラー表示83の付された読取結果表示となるように、読取結果データを生成する。
On the other hand, the
CPU10は、S27の処理で生成された読取結果データに基づく読取結果表示を出力する指示を、入出力I/F14を介して表示部16に送信する(S28)。図16は、必須記入欄未記入エラー表示83の付された読取結果表示300を示す。読取結果表示300は、読取データに基づく画像の表示される結果表示301と、前述の表示202とを含む。本実施形態において、図3に示す記入帳票101の日付記入欄120が空欄のままにされた場合に、このような読取結果表示300が表示部16に表示される。本実施形態の必須記入欄未記入エラー表示83は、日付記入欄120から引き出された吹き出しを有する図形枠に所定のメッセージが表記されており、結果表示301よりも前面に表示される、所謂ポップアップ表示として設けられている。これにより、必須記入欄未記入エラー表示83は、日付記入欄120に必要な記入がされていないことを作業者にわかりやすく示すことができる。
The
この場合、日付記入欄120に必要事項が記入されていないので、S21のような文字認識処理は行われず、S26のような文字列データの登録投票DBへの登録処理も行われない。CPU10は、処理をS29の判断へ移行する。
In this case, since the necessary items are not entered in the
CPU10は、情報識別処理を終了するかを判断する(S29)。例えば、操作部17を介して情報識別処理を終了する指示が入力されている場合、CPU10は、情報識別処理を終了すると判断し(S29:YES)、情報識別処理を終了する。例えば、操作部17を介して、次の帳票について情報識別処理を実行するための指示が操作部17を介して入力されている場合、CPU10は、情報識別処理を終了せず(S29:NO)、処理をS11へ戻す。
The
以上説明したように、CPU10は、S11の処理によって記入帳票101の画像を読み取った読取データに基づいて、記入帳票の帳票種別を判定する(S13)。CPU10は、S13の処理によって判定された帳票種別に応じた登録帳票DBから、ユーザIDに応じた登録帳票画像データを取得する(S115)。また、CPU10は、必須記入領域判定処理(S16)において実行される領域判定処理(S73)において、読取データにおいて第二画素値に対応する画素値を有する画素の座標位置に基づく近似直線のなす形状で囲まれている領域を、日付記入欄120に対応する第二領域と特定する(S118)。CPU10は、第二領域の画像を示す第二領域データを、読取データから取得する(S75)。第二領域データは、記入帳票101における日付記入欄120の画像に対応する。CPU10は、日付記入欄120の輪郭を示す第一矩形121の色に対応する第二画素値に基づいて、登録帳票画像データにおいて、第一矩形121で囲まれている領域の位置及び大きさを特定する(S76)。CPU10は、特定された領域の画像を示す登録第二領域データを、登録帳票画像データから取得する(S78)。登録第一領域データは、未記入帳票100における日付記入欄120の画像に対応する。CPU10は、第二領域データと登録第二領域データとを比較し(S79)、第二領域データと登録第二領域データとに差分がある場合(S81:YES)、第二領域データに対する文字認識処理の実行結果である第二文字列データを含む登録文字列データを取得する(S22)。一方、第二領域データと登録第二領域データとに差分がない場合(S81:NO)、文字認識処理を行うことなく、読取結果データを生成し(S27)、生成された読取結果データに基づく読取結果表示を出力する指示を表示部16に送信する(S28)。即ち、記入帳票101において、必須記入欄である日付記入欄120に手書き文字等で記入されている場合には、日付記入欄120に記入された文字列に対応する第二文字列データを少なくとも含む登録文字列データが取得される。一方、日付記入欄120に記入がない場合には、登録文字列データが取得されない。例えば、日付記入欄120の位置を登録帳票画像データに関連付けて予め記憶することで、色に基づいて第一矩形121を特定すること無く、登録文字列データを取得する構成が考えられる。この場合、例えば、読取データから日付記入欄120の位置を特定するためには、原稿のエッジや角等の、基準となる位置を特定することが必要となる。しかし、原稿のエッジや角は、例えば、原稿の背景色と、読取部26に設けられた背景部材の色とが類似している場合、検出精度が落ちる可能性がある。本実施形態では、色に基づいて第一矩形121を特定することで、原稿の背景色や背景部材の色に左右されること無く、精度良く登録文字列データを取得することができる。このように、CPU10は、帳票に設けられている複数の記入欄の種類を識別し、記入欄の種類に応じた処理を実行できる。
As described above, the
S22の処理で第二文字列データを含む登録文字列データが取得された場合、CPU10は、読取結果データを生成する(S23)。CPU10は、生成された読取結果データに基づく読取結果表示を出力する指示を、表示部16に送信する(S24)。このため、作業者は、記入帳票101がスキャナ2の読取部26において正しく読み取られたかを、読取結果表示によって確認できる。また、読取結果表示が表示部16に表示されることに応じて、登録帳票DBに登録する指示が操作部17を介して入力された場合(S25:YES)、CPU10は、S22の処理で取得した登録文字列データを、登録帳票DBのうちS13の処理で判定された帳票種別に対応する登録帳票DBに登録する(S26)。これにより、登録文字列データの管理が登録帳票DBにおいて適切に行われる。
When the registered character string data including the second character string data is acquired in the process of S22, the
CPU10は、第二領域データと登録第二領域データとに差分がない場合(S81:NO)、CPU10は、必須記入欄未記入エラー表示83を出力する指示を、RAM12に記憶する(S83)。CPU10は、この指示の記憶に応じて、必須記入欄未記入エラー表示83の付された読取結果表示を示す読取結果データを生成する(S27)。CPU10は、必須記入欄未記入エラー表示83の付された読取結果表示を出力する指示を表示部16に送信する(S28)。従って、必須記入欄未記入エラー表示83の付された読取結果表示が表示部16に表示されることで、記入帳票101の必須記入欄に手書き文字が記入されていないことが、作業者に喚起される。
When there is no difference between the second area data and the registered second area data (S81: NO), the
CPU10は、任意記入領域判定処理(S18)において実行される領域判定処理(S93)において、読取データにおいて第三画素値に対応する画素値を有する画素の座標位置に基づく近似直線のなす形状で囲まれている領域を、任意記入欄に対応する第三領域と特定する(S118)。CPU10は、第三領域の画像を示す第三領域データを、読取データから取得する(S95)。第三領域データは、記入帳票101における第一任意記入欄150の画像に対応する。CPU10は、第一任意記入欄150の輪郭を示す第三矩形151の色に対応する第三画素値に基づいて、登録帳票画像データにおいて、第三矩形151で囲まれている領域の位置及び大きさを特定する(S96)。CPU10は、特定された領域の画像を示す登録第三領域データを、登録帳票画像データから取得する(S98)。登録第三領域データは、未記入帳票100における第一任意記入欄150の画像に対応する。CPU10は、第三領域データと登録第三領域データとを比較し(S99)、第三領域データと登録第三領域データとに差分がある場合(S101:YES)、第三領域データに対する文字認識処理の実行結果である第三文字列データを含む登録文字列データを取得する(S22)。一方、第三領域データと登録第三領域データとに差分がない場合(S101:NO)、CPU10は、第三領域を輝度変更表示対象に決定する(S103)。即ち、記入帳票101において、任意記入欄に手書き文字等が記入されている場合には、任意記入欄に記入された文字列に対応する文字列データを含む登録文字列データが取得される。一方、任意記入欄に記入がない場合には、任意記入欄に対応する領域がグレーアウト表示されるように生成された読取結果データに基づく読取結果表示を出力する指示が表示部16に送信される。この場合、任意記入欄に対応する領域がグレーアウト表示されている場合には、任意記入欄に手書き文字等が記入されておらず、読取結果表示における詳細な確認が不要である旨が作業者に示される。このように、CPU10は、帳票に設けられている複数の記入欄の種類を識別し、記入欄の種類に応じた処理を実行できる。
In the area determination process (S93) executed in the arbitrary entry area determination process (S18), the
CPU10は、記入帳票101のユーザID欄130に対応するユーザID領域データを、読取データから抽出する(S41)。CPU10は、ユーザID領域データからID文字列データを生成し、ID文字列データと登録帳票DBに登録されている登録ユーザIDとを比較する(S45)。CPU10は、ID文字列データの示す文字列と一致する登録ユーザIDを、読取データに対応するユーザIDとして取得する(S50)。CPU10は、このようにして取得されたユーザIDに関連付けて、帳票種別に対応する登録帳票DBに登録文字列データを登録する(S26)。従って、登録文字列データが、帳票種別及びユーザIDに関連付けられて適切に管理される。
The
CPU10は、領域判定処理において第二画素値に対応する領域が特定されていない場合(S74:NO)、記入帳票読取エラー表示82を出力する指示を表示部16に送信する(S84)。この場合、記入帳票読取エラー表示82が表示部16に表示され、領域判定処理において日付記入欄120に対応する第二領域が特定されていないことが作業者に報知される。
When the area corresponding to the second pixel value is not specified in the area determination process (S74: NO), the
上記実施形態において、S12の処理が、第一及び第二の実施形態の「第一取得ステップ」に相当する。必須記入領域判定処理において実行される領域判定処理におけるS118の処理が、第一及び第二の実施形態の「第一領域特定ステップ」に相当する。S81、S22及びS28の処理が、第一及び第二の実施形態の「第一実行ステップ」に相当する。任意記入領域判定処理において実行される領域判定処理におけるS118の処理が、第一及び第二の実施形態の「第二領域特定ステップ」に相当する。S95の処理が、第一及び第二の実施形態の「第二取得ステップ」に相当する。S101、S11、S24、S28及びS103の処理が、第一及び第二の実施形態の「第二実行ステップ」に相当する。
In the above embodiment, the process of S12 corresponds to the "first acquisition step" of the first and second embodiments . Processing S118 in the area determination process performed in mandatory entry region determination process corresponds to "first region specifying step" in the first and second embodiments. The processing of
S23及びS27の処理が、第一の実施形態の「生成ステップ」に相当する。S24の処理が、第一の実施形態の「第一出力ステップ」に相当する。S26の処理が、第一の実施形態の「記憶ステップ」に相当する。HDD33が、第一の実施形態の「記憶手段」に相当する。S46の処理が、第一の実施形態の「判定ステップ」に相当する。S50の処理が、第一の実施形態の「第三取得ステップ」に相当する。S84の処理が、第一の実施形態の「第二出力ステップ」に相当する。
The processing of S23 and S27 corresponds to the "generation step" of the first embodiment. The process of S24 corresponds to the "first output step" of the first embodiment. The process of S26 corresponds to the "memory step" of the first embodiment. The
読取部26が、第三の実施形態の「読取部」に相当する。S12の処理を実行するCPU10が、第三の実施形態の「第一取得手段」として機能する。必須記入領域判定処理において実行される領域判定処理におけるS118の処理を実行するCPU10が、第三の実施形態の「第一領域特定手段」として機能する。S81、S22及びS28の処理を実行するCPU10が、第三の実施形態の「第一実行手段」として機能する。任意記入領域判定処理において実行される領域判定処理におけるS118の処理を実行するCPU10が、第三の実施形態の「第二領域特定手段」として機能する。S95の処理を実行するCPU10が、第三の実施形態の「第二取得手段」として機能する。S101、S11、S24、S28及びS103の処理を実行するCPU10が、第三の実施形態の「第二実行手段」として機能する。
The
なお、本明細書に例示する実施形態は上記に限定されるものではなく、種々の変更が可能である。上記実施形態では、S24、S28、S36、S47、S48、S83、S84の各処理において、CPU10は、各処理に応じたデータに基づく表示等の画像を出力する指示を表示部16に送信している。CPU10は、これらの一部又は全部の出力指示を、外部表示部19に送信してもよい。また、CPU10が送信したこれらの一部又は全部の出力指示がスキャナ2に送信されてもよい。この場合、出力指示を受信したスキャナ2のCPU20が、入出力I/F24を介して、表示部27又は外部表示部29に各処理に応じたデータに基づく表示等の画像を出力する指示を送信してもよい。
The embodiments illustrated herein are not limited to the above reporting, various modifications are possible. In the above embodiment, in each process of S24, S28, S36, S47, S48, S83, and S84, the
また、スキャナ2が情報識別装置1として機能し、スキャナ2のCPU20が情報識別処理を実行する構成であってもよい。この場合、S24、S28、S36、S47、S48、S83、S84の各処理における出力指示が、CPU20によって表示部27、又は外部通信I/F25を介して外部表示部29に送信されてもよい。この場合、スキャナ2が、第三の実施形態の「画像読取装置」に相当する。S23及びS27の処理を実行するCPU10が、第三の実施形態の「生成手段」として機能する。外部通信I/F25が、第三の実施形態の「通信部」に相当する。この他、管理サーバ3が情報識別装置1として機能してもよい。
Further, the
S63、S103の処理で輝度変更対象に決定された各領域については、S23及びS27の処理において、各領域データの取得時の輝度よりも低い輝度で表示されるように読み取り結果データが生成されるが、これに限られない。例えば、輝度変更対象に決定された各領域が、各領域データの取得時の輝度よりも高い輝度で表示されるように読み取り結果データが生成されてもよい。この場合であっても、輝度変更対象に決定されている領域を作業者に視認し難くなり、対応する領域を注視する必要のないことが作業者に示される。 For each area determined to be the brightness change target in the processing of S63 and S103, the reading result data is generated so as to be displayed with a brightness lower than the brightness at the time of acquisition of each area data in the processing of S23 and S27. However, it is not limited to this. For example, the reading result data may be generated so that each region determined to be the brightness change target is displayed with a brightness higher than the brightness at the time of acquiring each region data. Even in this case, it becomes difficult for the operator to visually recognize the area determined to be the brightness change target, and the operator is shown that it is not necessary to pay attention to the corresponding area.
S84の処理が行われる場合において、読取データが適切に取得できていない理由は様々である。記入帳票読取エラー表示82は、日付記入欄120に対応する領域が特定されていないことを端的に表示する「日付記入欄を認識できません」等の表示内容であってもよい。また、記入帳票読取エラー表示82は、読取データが適切に取得できていない理由を作業者に具体的に報知する「帳票のスキャンエラーです」、「スキャナとPCとの接続状態を確認してください」等のメッセージを表示するものであってもよい。このように、記入帳票読取エラー表示82は、日付記入欄120に対応する領域が特定されていないことを報知する様々なメッセージ表示を含んでもよい。
When the processing of S84 is performed, there are various reasons why the read data cannot be properly acquired. The entry form
上記実施形態において、必須記入欄未記入エラー表示83は所定のポップアップ表示によって構成されているが、これに限られない。必須記入欄未記入エラー表示83は、読取結果表示300において、必須記入欄に対応する第二領域に関連付けて表示され、作業者に必須記入欄に必要な記入がされていないことを報知する様々な態様の表示を含んでもよい。
In the above embodiment, the mandatory entry field
上記実施形態では、S21、S42の処理において文字認識処理が実行されるが、文字認識処理は必ずしも情報識別装置1において行われなくてもよい。例えば、情報識別装置1にネットワークを介して接続する管理サーバ3及びその他の外部装置において、文字認識対象について文字認識処理が実行されて情報識別装置1が文字認識結果を受信して、以降の情報識別処理を行う構成であってもよい。
In the above embodiment, the character recognition process is executed in the processes of S21 and S42, but the character recognition process does not necessarily have to be performed in the
CPU10は、HDD13に記憶されたプログラムをRAM12上で展開することで、情報識別処理を実行するプロセッサとして機能する。CPU10として、汎用的なプロセッサが用いられてもよい。マイクロコンピュータ、ASIC、FPGA等が、CPU10の代わりにプロセッサとして用いられてもよい。スキャナ2が情報識別装置1として機能する場合には、CPU20は、ROM21に記憶されたプログラムをRAM22上で展開することで、情報識別処理を実行するプロセッサとして機能する。管理サーバ3が情報識別装置1として機能する場合には、CPU30は、HDD33に記憶されたプログラムをRAM32上で展開することで、情報識別処理を実行するプロセッサとして機能する。上記と同様に、マイクロコンピュータ、ASIC、FPGA等が、CPU30の代わりにプロセッサとして用いられてもよい。
The
情報特定処理は、複数の電子機器(つまり、複数のCPU)によって分散処理されてもよい。例えば、情報特定処理の一部が、ネットワーク9に接続した管理サーバ3等の他のサーバで実行されてもよい。プログラムは、例えば、ネットワーク9に接続した管理サーバ3等の他のサーバからダウンロードされて、情報識別装置1のHDD13に記憶されてもよい。
The information identification process may be distributed by a plurality of electronic devices (that is, a plurality of CPUs). For example, a part of the information identification process may be executed by another server such as the
1 情報識別装置
2 スキャナ
3 管理サーバ
9 ネットワーク
10,20,30 CPU
13,33 HDD
16,27 表示部
19,29 外部表示部
21 ROM
26 読取部
82 記入帳票読取エラー表示
83 必須記入欄未記入エラー表示
101 記入帳票
200,300 読取結果表示
1
13,33 HDD
16,27
26
Claims (7)
前記コンピュータに、
手書き文字を含む文字の記入された帳票である記入帳票を読み取った画像を示す読取データを取得する第一取得ステップと、
前記読取データにおいて第一画素値に対応する輪郭で囲まれた第一領域を、文字認識処理の対象とする領域として特定する第一領域特定ステップと、
前記第一領域の画像を示す第一領域データと、前記記入帳票に応じた帳票であって、手書き文字が記入されていない帳票の画像を示す帳票画像データにおける前記第一領域に対応する帳票第一領域の画像を示す帳票第一データとに基づいて、前記第一領域に含まれる第一文字列を少なくとも含む文字列を示す第一文字列データを文字認識処理に基づいて取得する第一実行ステップと、
前記読取データにおいて前記第一画素値とは異なる第二画素値に対応する輪郭で囲まれた第二領域を、文字認識処理の対象とする領域として特定する第二領域特定ステップと、
前記第二領域の画像を示す第二領域データを前記読取データから取得する第二取得ステップと、
前記第二領域データと、前記帳票画像データにおける前記第二領域に対応する帳票第二領域の画像を示す帳票第二データとを比較し、前記第二領域データと前記帳票第二データとが異なる場合、前記第二領域に含まれる第二文字列を少なくとも含む文字列を示す第二文字列データを文字認識処理に基づいて取得する一方、前記第二領域データと前記帳票第二データとが異ならない場合は、前記第二取得ステップにおいて取得された前記第二領域データの示す態様とは異なる態様で前記第二領域データを表示する指示を出力する第二実行ステップと
を実行させることを特徴とする情報識別プログラム。 An information identification program executed by the computers that make up the information identification device.
On the computer
The first acquisition step of acquiring the reading data showing the image of reading the entry form, which is a form in which characters including handwritten characters are entered, and
A first area identification step for specifying the first area surrounded by the outline corresponding to the first pixel value in the read data as a target area for character recognition processing, and
The first area data showing the image of the first area and the form number corresponding to the first area in the form image data showing the image of the form in which the handwritten characters are not entered, which is the form corresponding to the entry form. Based on the first data of the form showing the image of one area, the first execution step of acquiring the first character string data indicating the character string including at least the first character string included in the first area based on the character recognition process. ,
A second area specifying step for specifying a second area surrounded by a contour corresponding to a second pixel value different from the first pixel value in the read data as a target area for character recognition processing, and a second area specifying step.
A second acquisition step of acquiring second region data showing an image of the second region from the read data, and
The second area data is compared with the second form data showing the image of the second form area corresponding to the second area in the form image data, and the second area data and the second form data are different from each other. In this case , if the second character string data indicating the character string including at least the second character string included in the second area is acquired based on the character recognition process, while the second area data and the form second data are different. If not, the feature is that the second execution step of outputting the instruction to display the second area data is executed in a mode different from the mode indicated by the second area data acquired in the second acquisition step. Information identification program.
前記記入帳票の読取結果を示すデータであって、少なくとも前記第一領域データを含む読取結果データを生成する生成ステップと、
前記第一実行ステップにおいて前記第一文字列データが取得された場合、前記読取結果データを表示する指示を出力する第一出力ステップと、
前記読取結果データを表示する指示が出力されたことに応じて所定の指示を受信した場合、前記第一文字列データを記憶手段に記憶させる記憶ステップと
を実行させることを特徴とする請求項1に記載の情報識別プログラム。 On the computer
A generation step of generating reading result data including at least the first area data, which is data indicating the reading result of the entry form, and
When the first character string data is acquired in the first execution step, the first output step for outputting an instruction to display the reading result data and the first output step.
The first aspect of claim 1, wherein when a predetermined instruction is received in response to the output of the instruction for displaying the reading result data, the storage step of storing the first character string data in the storage means is executed. Described information identification program.
前記第一領域データと前記帳票第一データとが異ならないと判断された場合、前記第一領域に関する所定の通知を行う情報を前記第一領域データに対応付けた前記読取結果データを生成することを特徴とする請求項2に記載の情報識別プログラム。 The generation step
When it is determined that the first area data and the first form data are not different, the reading result data in which the information for giving a predetermined notification regarding the first area is associated with the first area data is generated. The information identification program according to claim 2.
前記読取データに基づいて前記記入帳票のユーザを判定する判定ステップと、
前記判定ステップにおける判定結果に応じたユーザを特定するユーザ特定情報を取得する第三取得ステップを実行させ、
前記記憶ステップは、
前記第一文字列データを前記ユーザ特定情報に関連付けて前記記憶手段に記憶させることを特徴とする請求項2に記載の情報識別プログラム。 On the computer
A determination step for determining the user of the entry form based on the read data, and
The third acquisition step of acquiring the user identification information that identifies the user according to the determination result in the determination step is executed.
The memory step
The information identification program according to claim 2, wherein the first character string data is associated with the user-specific information and stored in the storage means.
前記第一領域特定ステップにおいて前記第一領域が特定されない場合、前記第一領域が特定されていないことに基づく報知を実行する指示を出力する第二出力ステップを実行させることを特徴とする請求項1から4のいずれかに記載の情報識別プログラム。 On the computer
The claim is characterized in that when the first region is not specified in the first region specifying step, a second output step for outputting an instruction to execute a notification based on the fact that the first region is not specified is executed. The information identification program according to any one of 1 to 4.
手書き文字を含む文字の記入された帳票である記入帳票を読み取った画像を示す読取データを取得する第一取得ステップと、
前記読取データにおいて第一画素値に対応する輪郭で囲まれた第一領域を、文字認識処理の対象とする領域として特定する第一領域特定ステップと、
前記第一領域の画像を示す第一領域データと、前記記入帳票に応じた帳票であって、手書き文字が記入されていない帳票の画像を示す帳票画像データにおける前記第一領域に対応する帳票第一領域の画像を示す帳票第一データとに基づいて、前記第一領域に含まれる第一文字列を少なくとも含む文字列を示す第一文字列データを文字認識処理に基づいて取得する第一実行ステップと、
前記読取データにおいて前記第一画素値とは異なる第二画素値に対応する輪郭で囲まれた第二領域を、文字認識処理の対象とする領域として特定する第二領域特定ステップと、
前記第二領域の画像を示す第二領域データを前記読取データから取得する第二取得ステップと、
前記第二領域データと、前記帳票画像データにおける前記第二領域に対応する帳票第二領域の画像を示す帳票第二データとを比較し、前記第二領域データと前記帳票第二データとが異なる場合、前記第二領域に含まれる第二文字列を少なくとも含む文字列を示す第二文字列データを文字認識処理に基づいて取得する一方、前記第二領域データと前記帳票第二データとが異ならない場合は、前記第二取得ステップにおいて取得された前記第二領域データの示す態様とは異なる態様で前記第二領域データを表示する指示を出力する第二実行ステップと
を備えたことを特徴とする情報識別方法。 It is a method that can be executed by the computers that make up the information identification device.
The first acquisition step of acquiring the reading data showing the image of reading the entry form, which is a form in which characters including handwritten characters are entered, and
A first area identification step for specifying the first area surrounded by the outline corresponding to the first pixel value in the read data as a target area for character recognition processing, and
The first area data showing the image of the first area and the form number corresponding to the first area in the form image data showing the image of the form in which the handwritten characters are not entered, which is the form corresponding to the entry form. Based on the first data of the form showing the image of one area, the first execution step of acquiring the first character string data indicating the character string including at least the first character string included in the first area based on the character recognition process. ,
A second area specifying step for specifying a second area surrounded by a contour corresponding to a second pixel value different from the first pixel value in the read data as a target area for character recognition processing, and a second area specifying step.
A second acquisition step of acquiring second region data showing an image of the second region from the read data, and
The second area data is compared with the second form data showing the image of the second form area corresponding to the second area in the form image data, and the second area data and the second form data are different from each other. In this case , if the second character string data indicating the character string including at least the second character string included in the second area is acquired based on the character recognition process, while the second area data and the form second data are different. If not, it is characterized by including a second execution step that outputs an instruction to display the second area data in a mode different from the mode indicated by the second area data acquired in the second acquisition step. Information identification method to be performed.
前記読取部によって読み取られた、手書き文字を含む文字の記入された帳票である記入帳票を読み取った画像を示す読取データを取得する第一取得手段と、
前記読取データにおいて第一画素値に対応する輪郭で囲まれた第一領域を、文字認識処理の対象とする領域として特定する第一領域特定手段と、
前記第一領域の画像を示す第一領域データと、前記記入帳票に応じた帳票であって、手書き文字が記入されていない帳票の画像を示す帳票画像データにおける前記第一領域に対応する帳票第一領域の画像を示す帳票第一データとに基づいて、前記第一領域に含まれる第一文字列を少なくとも含む文字列を示す第一文字列データを文字認識処理に基づいて取得する第一実行手段と、
前記読取データにおいて前記第一画素値とは異なる第二画素値に対応する輪郭で囲まれた第二領域を文字認識処理の対象とする領域として特定する第二領域特定手段と、
前記第二領域の画像を示す第二領域データを前記読取データから取得する第二取得手段と、
前記第二領域データと、前記帳票画像データにおける前記第二領域に対応する帳票第二領域の画像を示す帳票第二データとを比較し、前記第二領域データと前記帳票第二データとが異なる場合、前記第二領域に含まれる第二文字列を少なくとも含む文字列を示す第二文字列データを文字認識処理に基づいて取得する一方、前記第二領域データと前記帳票第二データとが異ならない場合は、前記第二取得手段によって取得された前記第二領域データの示す態様とは異なる態様で前記第二領域データを表示する指示を出力する第二実行手段と
を備えたことを特徴とする画像読取装置。 A reader that reads the image of the form and
A first acquisition means for acquiring read data indicating an image obtained by reading an entry form, which is a form in which characters including handwritten characters are entered, which is read by the reading unit.
A first area specifying means for specifying a first area surrounded by a contour corresponding to the first pixel value in the read data as a target area for character recognition processing, and
The first area data showing the image of the first area and the form number corresponding to the first area in the form image data showing the image of the form in which the handwritten characters are not entered, which is the form corresponding to the entry form. Based on the first data of the form showing the image of one area, the first execution means for acquiring the first character string data indicating the character string including at least the first character string included in the first area based on the character recognition process. ,
A second area specifying means for specifying a second area surrounded by a contour corresponding to a second pixel value different from the first pixel value in the read data as a target area for character recognition processing, and
A second acquisition means for acquiring second region data indicating an image of the second region from the read data, and
The second area data is compared with the second form data showing the image of the second form area corresponding to the second area in the form image data, and the second area data and the second form data are different from each other. In this case , if the second character string data indicating the character string including at least the second character string included in the second area is acquired based on the character recognition process, while the second area data and the form second data are different. If not, it is characterized by providing a second execution means for outputting an instruction to display the second area data in a mode different from the mode indicated by the second area data acquired by the second acquisition means. Image reader.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2019226976A JP6885449B2 (en) | 2019-12-17 | 2019-12-17 | Information identification program, information identification method, and image reader |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2019226976A JP6885449B2 (en) | 2019-12-17 | 2019-12-17 | Information identification program, information identification method, and image reader |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2015192165A Division JP6634764B2 (en) | 2015-09-29 | 2015-09-29 | Information identification program, information identification method, and image reading device |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2020038736A JP2020038736A (en) | 2020-03-12 |
| JP6885449B2 true JP6885449B2 (en) | 2021-06-16 |
Family
ID=69738165
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2019226976A Active JP6885449B2 (en) | 2019-12-17 | 2019-12-17 | Information identification program, information identification method, and image reader |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6885449B2 (en) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN111931664B (en) * | 2020-08-12 | 2024-01-12 | 腾讯科技(深圳)有限公司 | Mixed-pasting bill image processing method and device, computer equipment and storage medium |
| CN114169302B (en) * | 2021-12-10 | 2025-03-18 | 金蝶软件(中国)有限公司 | A document processing method and device |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4110495B2 (en) * | 1998-10-27 | 2008-07-02 | 沖電気工業株式会社 | Unmanned contract system and customer terminal |
| JP4618244B2 (en) * | 2006-12-20 | 2011-01-26 | パナソニック電工株式会社 | Foam detergent dispenser |
| JP5227720B2 (en) * | 2008-09-30 | 2013-07-03 | トッパン・フォームズ株式会社 | Information collection system and information entry sheet used therefor |
| JP2014238642A (en) * | 2013-06-06 | 2014-12-18 | 沖電気工業株式会社 | Personal information protection apparatus, personal information protection system, personal information protection method, and program |
-
2019
- 2019-12-17 JP JP2019226976A patent/JP6885449B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| JP2020038736A (en) | 2020-03-12 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11574489B2 (en) | Image processing system, image processing method, and storage medium | |
| JP5616308B2 (en) | Document modification detection method by character comparison using character shape feature | |
| US11418658B2 (en) | Image processing apparatus, image processing system, image processing method, and storage medium | |
| CN105320933A (en) | Electronic document generation system and electronic document generation apparatus | |
| JP6808330B2 (en) | Information processing equipment, information processing methods, and programs | |
| US9558433B2 (en) | Image processing apparatus generating partially erased image data and supplementary data supplementing partially erased image data | |
| JP6885449B2 (en) | Information identification program, information identification method, and image reader | |
| JP2007279828A (en) | Form processing device, form creation device, form, program for form processing, program for form creation | |
| JP2019159633A (en) | Image processing apparatus, image processing method, and image processing program | |
| US11360715B2 (en) | Printer and non-transitory computer readable storage medium with shared review function | |
| US9338310B2 (en) | Image processing apparatus and computer-readable medium for determining pixel value of a target area and converting the pixel value to a specified value of a target image data | |
| US8320027B2 (en) | Image processing apparatus, data processing method executed by image processing apparatus, and computer-readable storage medium storing program for causing computer to execute data processing method | |
| JP2019046225A (en) | Recognition device, recognition program, and recognition method | |
| JP2022090469A (en) | Format definition device, format definition method, and program | |
| JP6634764B2 (en) | Information identification program, information identification method, and image reading device | |
| JP4741363B2 (en) | Image processing apparatus, image processing method, and image processing program | |
| JP4958868B2 (en) | Document feature extraction apparatus and method | |
| US11972197B2 (en) | OCR system | |
| JP2017021654A (en) | Document management server and system | |
| JP7689698B1 (en) | Drawing processing device and drawing processing method | |
| US20110135162A1 (en) | Image processing apparatus, image processing method and recording medium | |
| US20110157658A1 (en) | Imaging processing apparatus, method for controlling the same, and program | |
| JP6980167B1 (en) | Printing methods, electronic devices, programs, servers and image forming devices | |
| JP2003308478A (en) | Form recognizing device, storage medium and program | |
| JP4984590B2 (en) | Electronic pen form manufacturing system and program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191223 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191226 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210115 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210126 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210325 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210413 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210426 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6885449 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |