JP7447482B2 - Image processing device, system, method, and program - Google Patents
Image processing device, system, method, and program Download PDFInfo
- Publication number
- JP7447482B2 JP7447482B2 JP2019232975A JP2019232975A JP7447482B2 JP 7447482 B2 JP7447482 B2 JP 7447482B2 JP 2019232975 A JP2019232975 A JP 2019232975A JP 2019232975 A JP2019232975 A JP 2019232975A JP 7447482 B2 JP7447482 B2 JP 7447482B2
- Authority
- JP
- Japan
- Prior art keywords
- feature
- individual
- document form
- feature amount
- recorded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 88
- 238000000034 method Methods 0.000 title description 11
- 238000000605 extraction Methods 0.000 claims description 34
- 239000000284 extract Substances 0.000 claims description 14
- 238000010586 diagram Methods 0.000 description 11
- 238000012015 optical character recognition Methods 0.000 description 11
- 238000012790 confirmation Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Description
本開示は、画像処理装置、システム、方法、及びプログラムに関し、特に、記録対象ではない文字列が少ない文書帳票やエンブレム画像がない文書帳票であっても、文書帳票の書式を判別することが可能な画像処理装置、システム、方法、及びプログラムに関する。 The present disclosure relates to an image processing device, a system, a method, and a program, and in particular, it is possible to determine the format of a document form even if the document form has few character strings that are not to be recorded or the document form does not have an emblem image. The present invention relates to an image processing device, system, method, and program.
スキャナ等を用いて取得した文書帳票の画像データをOCR(Optical Character Recognition)処理して文書を読み取る画像処理装置がある。特許文献1の画像処理装置は、ОCR処理の結果を記録し、記録したОCR処理の結果から、文書帳票の書式ごとに学習データを生成する。そして、特許文献1の画像処理装置は、記録対象ではない文字列(非記録文字列)の一致度、エンブレム画像の一致度、記録対象ではない文字列の座標範囲の一致度などを使用して、新たな文書帳票の書式を判別(判定)する。しかしながら、記録対象ではない文字列がない、あるいは少ない文書帳票やエンブレム画像がない文書帳票など(表形式の帳票)の書式を判別することが難しいという課題があった。
2. Description of the Related Art There is an image processing apparatus that performs OCR (Optical Character Recognition) processing on image data of a document form obtained using a scanner or the like to read a document. The image processing device disclosed in
上記のとおり、記録対象ではない文字列がない、あるいは少ない文書帳票やエンブレム画像がない文書帳票などの書式を判別することが難しいという課題があった。 As mentioned above, there is a problem in that it is difficult to distinguish the formats of document forms that do not have or have few character strings that are not to be recorded, or document forms that do not have an emblem image.
本開示の目的は、上述した課題を解決する画像処理装置、システム、方法、及びプログラムを提供することにある。 An object of the present disclosure is to provide an image processing device, system, method, and program that solve the above-mentioned problems.
本開示に係る画像処理装置は、
文書帳票に含まれる記録文字列の特徴を示す個別第一特徴量と、前記文書帳票に含まれる非記録文字列の認識情報を示す個別第二特徴量と、を抽出する特徴量抽出生成部と、
前記文書帳票を、複数の前記個別第一特徴量を含むグループ第一特徴量と、複数の前記個別第二特徴量を含むグループ第二特徴量と、にグループ分けするグループ分類部と、
新たな文書帳票の前記個別第二特徴量が予め記録された前記グループ第二特徴量内のいずれにも一致しない場合、予め記録された前記グループ第一特徴量内から、前記新たな文書帳票の前記個別第一特徴量と一致する特定第一特徴量を特定し、前記特定第一特徴量が示す書式を前記新たな文書帳票の書式とする制御部と、
を備える。
The image processing device according to the present disclosure includes:
a feature quantity extraction generation unit that extracts an individual first feature quantity indicating a feature of a recorded character string included in a document form, and an individual second feature quantity indicating recognition information of a non-recorded character string included in the document form; ,
a group classification unit that groups the document form into a group first feature including a plurality of the individual first features and a group second feature including the plurality of the individual second features;
If the individual second feature of the new document form does not match any of the group second features recorded in advance, the new document form's individual second feature is selected from among the group first features recorded in advance. a control unit that identifies a specific first feature amount that matches the individual first feature amount, and sets a format indicated by the specific first feature amount as a format of the new document form;
Equipped with
本開示に係るシステムは、
画像処理装置と画像読取装置と記録装置とデータベースとを備え、
前記画像読取装置は、
光学的に文書帳票の画像データを取得し、前記画像データを前記画像処理装置へ出力する読取出力部を有し、
前記画像処理装置は、
前記文書帳票の前記画像データを文字認識し、前記文書帳票に含まれる記録文字列の特徴を示す個別第一特徴量と、前記文書帳票に含まれる非記録文字列の認識情報を示す個別第二特徴量と、を抽出する特徴量抽出部と、
前記文字認識した文字認識結果を前記記録装置に出力する処理出力部と、
前記文書帳票を、複数の前記個別第一特徴量を含むグループ第一特徴量と、複数の前記個別第二特徴量を含むグループ第二特徴量と、にグループ分けするグループ分類部と、
新たな文書帳票の前記個別第二特徴量が予め記録された前記グループ第二特徴量内のいずれにも一致しない場合、予め記録された前記グループ第一特徴量内から、前記新たな文書帳票の前記個別第一特徴量と一致する特定第一特徴量を特定し、前記特定第一特徴量が示す書式を前記新たな文書帳票の書式とする制御部と、を有し、
前記記録装置は、
前記画像処理装置から前記文字認識結果を取得する文字認識取得部と、
前記文字認識結果を前記データベースに記録する文字認識記録部と、を有し、
前記データベースは、
前記記録装置から取得した前記文字認識結果を記録する記録テーブルを有する。
The system according to the present disclosure is
Equipped with an image processing device, an image reading device, a recording device, and a database,
The image reading device includes:
a reading output unit that optically acquires image data of a document form and outputs the image data to the image processing device;
The image processing device includes:
The image data of the document form is character-recognized, and an individual first feature amount indicating a feature of a recorded character string included in the document form and an individual second feature amount indicating recognition information of a non-recorded character string included in the document form are provided. a feature amount extraction unit that extracts the feature amount;
a processing output unit that outputs the character recognition result of the character recognition to the recording device;
a group classification unit that groups the document form into a group first feature amount including a plurality of the individual first feature amounts and a group second feature amount including a plurality of the individual second feature amounts;
If the individual second feature of the new document form does not match any of the pre-recorded group second features, the new document form is selected from among the pre-recorded group first features. a control unit that specifies a specific first feature amount that matches the individual first feature amount, and sets a format indicated by the specific first feature amount as a format of the new document form;
The recording device includes:
a character recognition acquisition unit that acquires the character recognition result from the image processing device;
a character recognition recording unit that records the character recognition results in the database;
The database is
It has a recording table that records the character recognition results obtained from the recording device.
本開示に係る方法は、
文書帳票に含まれる記録文字列の特徴を示す個別第一特徴量と、前記文書帳票に含まれる非記録文字列の認識情報を示す個別第二特徴量と、を抽出することと、
前記文書帳票を、複数の前記個別第一特徴量を含むグループ第一特徴量と、複数の前記個別第二特徴量を含むグループ第二特徴量と、にグループ分けすることと、
新たな文書帳票の前記個別第二特徴量が予め記録された前記グループ第二特徴量内のいずれにも一致しない場合、予め記録された前記グループ第一特徴量内から、前記新たな文書帳票の前記個別第一特徴量と一致する特定第一特徴量を特定し、前記特定第一特徴量が示す書式を前記新たな文書帳票の書式とすることと、
を備える。
The method according to the present disclosure includes:
extracting an individual first feature amount indicating a feature of a recorded character string included in a document form, and an individual second feature amount indicating recognition information of a non-recorded character string included in the document form;
Grouping the document form into a group first feature amount including a plurality of the individual first feature amounts and a group second feature amount including a plurality of the individual second feature amounts;
If the individual second feature of the new document form does not match any of the group second features recorded in advance, the new document form's individual second feature is selected from among the group first features recorded in advance. identifying a specific first feature amount that matches the individual first feature amount, and setting a format indicated by the specific first feature amount as a format of the new document form;
Equipped with
本開示に係るプログラムは、
文書帳票に含まれる記録文字列の特徴を示す個別第一特徴量と、前記文書帳票に含まれる非記録文字列の認識情報を示す個別第二特徴量と、を抽出することと、
前記文書帳票を、複数の前記個別第一特徴量を含むグループ第一特徴量と、複数の前記個別第二特徴量を含むグループ第二特徴量と、にグループ分けすることと、
新たな文書帳票の前記個別第二特徴量が予め記録された前記グループ第二特徴量内のいずれにも一致しない場合、予め記録された前記グループ第一特徴量内から、前記新たな文書帳票の前記個別第一特徴量と一致する特定第一特徴量を特定し、前記特定第一特徴量が示す書式を前記新たな文書帳票の書式とすることと、
をコンピュータに実行させる。
The program related to this disclosure is
extracting an individual first feature amount indicating a feature of a recorded character string included in a document form, and an individual second feature amount indicating recognition information of a non-recorded character string included in the document form;
Grouping the document form into a group first feature amount including a plurality of the individual first feature amounts and a group second feature amount including a plurality of the individual second feature amounts;
If the individual second feature of the new document form does not match any of the group second features recorded in advance, the new document form's individual second feature is selected from among the group first features recorded in advance. identifying a specific first feature amount that matches the individual first feature amount, and setting a format indicated by the specific first feature amount as a format of the new document form;
have the computer execute it.
本開示によれば、記録対象ではない文字列が少ない文書帳票やエンブレム画像がない文書帳票であっても、文書帳票の書式を判別することが可能な画像処理装置、システム、方法、及びプログラムを提供することができる。 According to the present disclosure, there is provided an image processing device, a system, a method, and a program capable of determining the format of a document form even if the document form has few character strings that are not to be recorded or the document form does not have an emblem image. can be provided.
以下、図面を参照して本発明の実施の形態について説明する。各図面において、同一又は対応する要素には同一の符号が付されており、説明の明確化のため、必要に応じて重複説明を省略する。 Embodiments of the present invention will be described below with reference to the drawings. In each drawing, the same or corresponding elements are denoted by the same reference numerals, and for clarity of explanation, redundant explanation will be omitted as necessary.
[実施の形態]
<システム>
実施の形態に係るシステムを説明する。
図1は、実施の形態に係るシステムを例示するブロック図である。
[Embodiment]
<System>
A system according to an embodiment will be described.
FIG. 1 is a block diagram illustrating a system according to an embodiment.
図1に示すように、システム10は、画像処理装置1、画像読取装置2、記録装置3、及びデータベース4を備える。画像処理装置1は、画像読取装置2と通信ケーブルにより接続される。画像処理装置1は、記録装置3と接続される。画像読取装置2は、記録装置3と接続される。データベース4は、画像処理装置1と記録装置3とに接続される。
As shown in FIG. 1, the
画像読取装置2は、光学的に文書帳票などの画像データを取得して画像処理装置1へ出力する読取出力部(図示せず)を有する。
The
画像処理装置1は、文書帳票の画像データをOCR処理し文字認識する特徴量抽出生成部と、文字認識した文字認識結果を記録装置3に出力する処理出力部(図示せず)と、を有する。画像処理装置1の詳細については、後述する。
The
記録装置3は、文字認識取得部(図示せず)と、文字認識記録部(図示せず)とを有する。文字認識取得部は、画像処理装置1から文字認識結果を取得する。文字認識記録部は、取得した文字認識結果をデータベース4に記録する。
The
データベース4は、記録テーブル(図示せず)を有する。記録テーブルは、記録装置3から取得した文字認識結果を記録する。具体的には、データベース4は、記録装置3から過去に登録された複数の文書帳票の画像データとその画像データに含まれる文字列のうち、記録対象となる文字列を示す記録文字列の対応関係を記録する。記録文字列が示す文字列は、文書帳票に記載される文字列のうちデータベース4に記録、保存しておくべき重要な文字列である。すなわち、記録文字列とは、記録対象となる文字列を示す。なお、非記録文字列とは、表形式の書式帳票などの、記録対称とならない文字列を示す。
システム10を使用する作業者は、予め、記録装置3を用いて過去に登録された複数の文書帳票の画像データと、その画像データに含まれる文字列のうちの記録文字列と、をデータベース4の記録テーブルに登録する。記録装置3には、文書帳票の画像データと、その画像データに含まれる文字列の情報のうち記録対象となる文字列を示す記録文字列の情報と、の対応関係が、複数の文書帳票について十分に記録されているものとする。記録テーブルについては、後述する。
An operator using the
<画像処理装置>
実施の形態に係る画像処理装置を説明する。
図2は、実施の形態に係る画像処理装置を例示するブロック図である。
図2は、実施の形態に係る画像処理装置の最小構成を例示するブロック図である。
図3は、実施の形態に係る画像処理装置を例示するブロック図である。
<Image processing device>
An image processing device according to an embodiment will be described.
FIG. 2 is a block diagram illustrating an image processing apparatus according to an embodiment.
FIG. 2 is a block diagram illustrating the minimum configuration of the image processing device according to the embodiment.
FIG. 3 is a block diagram illustrating an image processing apparatus according to an embodiment.
図2に示すように、実施の形態に係る画像処理装置1は、制御部101、特徴量抽出生成部100、読取対象特徴量生成部104、及びグループ分類部106を備える。特徴量抽出生成部100は、特徴量抽出部103と、読取対象特徴量生成部104と、を有する。また、図3に示すように、実施の形態に係る画像処理装置1は、取得部102、記録部105、及びグループ特定部107をさらに備える。
As shown in FIG. 2, the
制御部101は、取得部102、特徴量抽出部103、読取対象特徴量生成部104、記録部105、グループ分類部106、及びグループ特定部107を制御する。
The
取得部102は、文書帳票の画像データと、文書帳票に含まれる記録文字列と、をデータベース4から取得する。また、取得部102は、新たな文書帳票の画像データを画像読取装置2から取得する。
The
特徴量抽出部103は、文書帳票に含まれる文字列の特徴を示す特徴量を抽出する。読取対象特徴量生成部104は、特徴量抽出部103が抽出した特徴量に基づいて、文書帳票に含まれる記録文字列の特徴を示す個別第一特徴量と、非記録文字列の特徴を示す個別第二特徴量と、を生成する。
The feature
すなわち、特徴量抽出生成部100は、文書帳票の画像データをOCR処理し、文書帳票の画像データの文字認識処理結果(OCR処理結果)に基づいて、文書帳票に含まれる記録文字列の特徴を示す個別第一特徴量を抽出する。特徴量抽出生成部100は、文書帳票に含まれる非記録文字列の認識情報を示す個別第二特徴量を抽出する。
That is, the feature amount
また、特徴量抽出生成部100は、複数の文書帳票の画像データに対応する個別第一特徴量と、個別第二特徴量と、を文書帳票毎かつ文字列毎に抽出する。特徴量抽出生成部100による個別第一特徴量と個別第二特徴量の具体的な抽出方法は、後述する。
Further, the feature quantity
グループ分類部106は、文書帳票を、複数の個別第一特徴量を含むグループ第一特徴量と、複数の個別第二特徴量を含むグループ第二特徴量と、にグループ分けする。
The
制御部101は、取得部102が取得した新たな文書帳票の個別第二特徴量が予め記録されたグループ第二特徴量内の複数の個別第二特徴量のいずれかに一致するかを確認する。制御部101は、確認した結果、いずれにも一致しない場合、予め記録されたグループ第一特徴量内の複数の個別第一特徴量から、新たな文書帳票の個別第一特徴量と一致する特定第一特徴量を特定する。制御部101は、特定した特定第一特徴量が示す書式を新たな文書帳票の書式とする。
The
グループ特定部107は、新たな文書帳票の個別第一特徴量が含まれるグループを特定する。グループ特定部107は、新たな文書帳票の個別第二特徴量が含まれるグループを特定する。
The
記録部105は、文書帳票と、文書帳票の個別第一特徴量と、を対応付けて記録し、文書帳票と、文書帳票の個別第二特徴量と、を対応付けて記録する。記録部105は、新たな文書帳票についても同様に、新たな文書帳票とその個別第一特徴量とを対応付けて記録し、新たな文書帳票とその個別第二特徴量とを対応付けて記録する。
The
実施の形態に係る画像処理装置1は、新たな文書帳票の個別第二特徴量が予め記録されたグループ第二特徴量内のいずれにも一致しない場合、予め記録されたグループ第一特徴量内から、新たな文書帳票の個別第一特徴量と一致する特定第一特徴量を特定し、特定第一特徴量が示す書式を新たな文書帳票の書式とする。
If the individual second feature of a new document form does not match any of the pre-recorded group second features, the
これにより、実施の形態によれば、記録対象ではない文字列が少ない文書帳票やエンブレム画像がない文書帳票であっても、文書帳票の書式を判別することが可能な画像処理装置、システム、方法、及びプログラムを提供することができる。 As a result, according to the embodiment, an image processing device, system, and method are capable of determining the format of a document form even if the document form has only a few character strings that are not to be recorded or the document form does not have an emblem image. , and programs can be provided.
<文書帳票とデータベース>
文書帳票とデータベースとの関係を説明する。
図4は、文書帳票を例示する模式図である。
図5は、データベースが記録する記録テーブルの概要を例示する図である。
<Document forms and database>
The relationship between document forms and databases will be explained.
FIG. 4 is a schematic diagram illustrating a document form.
FIG. 5 is a diagram illustrating an outline of a record table recorded by the database.
図4に示すように、文書帳票5には、その文書を作成した企業のマーク、作成日、作成担当者、文書内容が、その文書帳票5に特有のフォーマットで記載されている。文書帳票5に記載された文書内容は、例えば、文書帳票5が発注票であれば、1つまたは複数の発注した商品名やその発注個数などの情報の組である。記録文字列(記録対象である文字列)とは、例えば、図4に示す日付51、発注先52、商品名53、数量54、金額55である。非記録文字列(記録対象ではない文字列)とは、例えば、図4に示す発注者の名称501、発注者のエンブレム画像502、文書帳票のタイトル503、挨拶文504である。
As shown in FIG. 4, the
図5に示すように、データベース4の記録テーブルには、異なる複数の文書帳票についての画像データと、各文書帳票に記載されている特定の記録文字列の対応関係(組み合わせ)が、その文書帳票ごとに予め多数記録されている。具体的には、データベース4の記録テーブルには、異なる複数の文書帳票のそれぞれについての特定の記録文字列情報が複数枚分記録されている。データベース4の記録テーブルには、文書帳票を識別する帳票IDと、文書帳票の画像データと、その文書帳票に記載されている文字列のうち記録すべき特定の記録文字列と、が対応付けられて記録されている。1つの文書帳票に対応する記録文字列は、複数個あってもよい。このように、記録テーブルには、文書帳票に対応する帳票IDと、文書帳票に対応する画像データと、文書帳票に対応する1つ以上の記録文字列と、が、文書帳票ごとに記録されている。
As shown in FIG. 5, in the record table of the
<画像処理装置の動作>
実施の形態に係る画像処理装置の動作を説明する。
図6は、実施の形態に係る画像処理装置の動作を例示するフローチャートである。
図7Aは、実施の形態に係る画像処理装置の動作を例示するフローチャートである。
図7Bは、実施の形態に係る画像処理装置の動作を例示するフローチャートである。
<Operation of image processing device>
The operation of the image processing device according to the embodiment will be described.
FIG. 6 is a flowchart illustrating the operation of the image processing apparatus according to the embodiment.
FIG. 7A is a flowchart illustrating the operation of the image processing apparatus according to the embodiment.
FIG. 7B is a flowchart illustrating the operation of the image processing apparatus according to the embodiment.
作業者は、データベース4に予め文書帳票(図4参照)ごとに、画像データ及び記録文字列等が記録された状態で(図5参照)、画像処理装置1を起動し、画像処理装置1へ処理開始を指示する。
The operator starts up the
作業者が処理開始を指示すると、図6に示すように、画像処理装置1の取得部102は、データベース4から文書帳票5の画像データと、その画像データに対応する記録文字列の情報と、を全て読み込んだかを判定する(ステップS101)。
When the operator instructs to start processing, as shown in FIG. 6, the
ステップS101においてNOの場合、取得部102は、データベース4から文書帳票5の画像データと、その画像データに対応する記録文字列の情報と、を読み取る(ステップS102)。取得部102は、画像データと記録文字列とを特徴量抽出部103へ出力する。
If NO in step S101, the
特徴量抽出部103は、画像データをOCR処理して画像データ中の全ての文字列と、当該文字列の範囲を示す画像データ内の座標を検出する(ステップS103)。なお、文字列とは、複数の文字によって構成される文字の纏まりのことである。特徴量抽出部103は、他の文字との間隔などによって、その1つの纏まりの範囲を解析し、その範囲に含まれる1つまたは複数の文字を文字列として抽出すると共に、その画像データ内の文字列の範囲を示す座標を検出する。文字列に含まれる文字には、表意文字、表音文字などの記号、マーク、アイコン画像などを含んでよい。
The
特徴量抽出部103は、OCR処理により画像データから抽出した文字列と、画像データと共にデータベース4から読み取った記録文字列と、を比較する。特徴量抽出部103は、OCR処理により画像データから抽出した文字列のうち、記録文字列の文字情報と一致した画像データ中の文字列と、その文字列に含まれる文字の属性と、その範囲の座標とを特定する(ステップS104)。
The
文字の属性は、数字、アルファベット、ひらがな、漢字、文字数、文字高さ、フォントなどにより表される情報である。また、文字列の範囲の座標は、文字列に含まれる先頭文字の座標、終了文字の座標などを示す情報である。文字の属性を記録文字列の属性情報と称し、文字列の範囲の座標を記録文字列の座標情報と称することもある。 Character attributes are information expressed by numbers, alphabets, hiragana, kanji, number of characters, character height, font, etc. Further, the coordinates of the range of a character string are information indicating the coordinates of the first character, the coordinates of the end character, etc. included in the character string. The attributes of a character may be referred to as attribute information of a recorded character string, and the coordinates of the range of a character string may be referred to as coordinate information of a recorded character string.
特徴量抽出部103は、それら特定した情報を含む特徴量を1つの文書帳票5について生成する(ステップS105)。特徴量は、特徴量抽出部103によって、文書帳票5における記録文字列ごとに生成される。すなわち、特徴量抽出部103は、文書帳票毎かつ記録文字列毎に特徴量を生成する。この文書帳票毎かつ記録文字列毎の特徴量を、個別第一特徴量と称する。個別第一特徴量は、文字の属性、文字列の範囲を示す座標の何れか一方または両方を含んでいてもよい。
The feature
特徴量抽出部103は、個々の文書帳票5における1つ又は複数の記録文字列それぞれの個別第一特徴量を、文書帳票5の識別子(帳票ID)および記録文字列の識別子に対応付けてデータベース4に記録する(ステップS106)。
The feature
記録文字列の識別子として、例えば、その記録文字列の位置を示す座標値を用いることができる。特徴量抽出部103は、図4に示す文書帳票5に含まれる記録文字列である日付51、発注先52、商品名53、数量54、金額55それぞれの、文字属性、文字列の範囲を示す座標などを示す各個別第一特徴量を、文書帳票5の識別子および記録文字列の識別子に対応付けてデータベース4に記録する。
As the identifier of the recorded character string, for example, coordinate values indicating the position of the recorded character string can be used. The
また、特徴量抽出部103は、記録文字列に含まれる文字情報と一致しない画像データ中の非記録文字列と、その非記録文字列に含まれる文字の属性と、その範囲の座標と、を特定する(ステップS107)。
In addition, the
特徴量抽出部103は、それら特定した情報を含む特徴量を1つの文書帳票5について生成する(ステップS108)。特徴量は、特徴量抽出部103によって、文書帳票5における非記録文字列ごとに生成される。すなわち、特徴量抽出部103は、文書帳票毎かつ非記録文字列毎に特徴量を生成する。この文書帳票毎かつ非記録文字列毎の特徴量を、個別第二特徴量と称する。個別第二特徴量は、文字の属性、文字列の範囲を示す座標の何れか一方または両方を含んでいてもよい。
The feature
特徴量抽出部103は、個々の文書帳票5における1つ又は複数の非記録文字列それぞれの個別第二特徴量を、文書帳票5の識別子および非記録文字列の識別子に対応付けてデータベース4に記録する(ステップS109)。
The feature
非記録文字列の識別子として、例えば、その非記録文字列の位置を示す座標値を用いることができる。特徴量抽出部103は、図4に示す文書帳票5に含まれる非記録文字列である発注者の名称501、発注者のエンブレム画像502、文書帳票のタイトル503、挨拶文504などを示す各個別第二特徴量を、文書帳票5の識別子および非記録文字列の識別子に対応付けてデータベース4に記録する。
As the identifier of the non-recorded character string, for example, coordinate values indicating the position of the non-recorded character string can be used. The feature
データベース4には、異なる複数の文書帳票5の画像データと、その画像データに対応する記録文字列の情報と、が記録されている。画像処理装置1の取得部102は、全ての文書帳票5についての画像データと記録文字列の情報を読み込むまでステップS101からステップS109の処理を繰り返す。
The
ステップS101において、取得部102が文書帳票5についての画像データと記録文字列の情報を全て読み込んだと判定した場合(ステップS101:YES)、グループ分類部106は、文書帳票5の画像データに含まれる個別第二特徴量と個別第一特徴量に基づいて、文書帳票5をグループ分けする(ステップS112)。
In step S101, if the
グループ分類部106は、例えば、各文書帳票5を、個別第二特徴量が示す非記録文字列の一致度や、エンブレム画像の一致度、非記録文字列の座標範囲の一致度などに基づいてグループ分けする。また、グループ分類部106は、個別第一特徴量が示す記録文字列の特徴(文字の属性、文字数、文字高さ、フォント)の類似度などに基づいて、グループ分けをする。このように、グループ分類部106は、個別第二特徴量だけでなく、個別第一特徴量にも基づいて、文書帳票5をグループ分けする。グループ分類部106は、このグループ分けの処理において文書帳票5のグループ識別子を決定する。
For example, the
グループ分類部106は、全ての文書帳票5についてグループ分けが終了したかを判定する(ステップS113)。グループ分類部106は、全ての文書帳票5のグループ分けが完了していない場合には(ステップS113:NО)、ステップS112の処理を繰り返す。
The
グループ分類部106は、全ての文書帳票5のグループ分けが完了した場合には(ステップS113:YES)、文書帳票5の識別子とその文書帳票5に付与されたグループ識別子とを対応付けてデータベース4の記録テーブルに記録する(ステップS114)。
When the grouping of all the document forms 5 is completed (step S113: YES), the
読取対象特徴量生成部104は、あるグループに属する1つまたは複数の文書帳票5の各個別第一特徴量および各個別第二特徴量をデータベース4から読み取る。読取対象特徴量生成部104は、グループに属する文書帳票5の各個別第一特徴量および各個別第二特徴量に対応する各グループ第一特徴量、各グループ第二特徴量を生成する(ステップS115)。
The reading target
読取対象特徴量生成部104は、グループそれぞれについて各グループ第一特徴量、各グループ第二特徴量を算出し、グループの識別子に対応付けてデータベース4に記録する(ステップS116)。
The reading target feature
次に、図7Aに示すように、作業者は、新たな文書帳票を画像読取装置2に読み取らせる操作を行う。これにより、画像読取装置2は、新たな文書帳票の画像データを生成して画像処理装置1へ出力する。画像処理装置1の取得部102は、新たな文書帳票の画像データを画像読取装置2から取得する(ステップS201)。
Next, as shown in FIG. 7A, the operator performs an operation to cause the
取得部102は、新たな文書帳票の画像データを特徴量抽出部103へ出力する。特徴量抽出部103は、新たな文書帳票の画像データをOCR処理して、文字列と、文字列に含まれる文字の特徴と、その文字列の範囲の画像データ中の座標と、を検出する(ステップS202)。
The
特徴量抽出部103は、それら検出した情報を含む第三特徴量を、新たな文書帳票の画像データ中の文字列ごとに生成する(ステップS203)。新たに読み込んだ画像データの文書帳票に含まれる文字列の特徴を示す情報を、第三特徴量と称する。
The
グループ特定部107は、データベース4から、ある複数のグループ第二特徴量のうち、新たな文書帳票のグループを特定するために使用するグループ第二特徴量を読み取る(ステップS2031)。当該グループ第二特徴量は、例えば、文書帳票の画像データに表示される発注者のエンブレム画像502(図4参照)に対応する個別第二特徴量であってよい。
The
グループ特定部107は、グループ第二特徴量に示す情報が、ステップS201で取得した新たな文書帳票の画像データから特定できるかどうかを判定する(ステップS2032)。グループ特定部107は、全てのグループについてのグループ第二特徴量を用いて同様の処理を行う。
The
グループ特定部107は、データベース4から読み取ったグループ第二特徴量に一致する情報が、新たに読み込んだ文書帳票の画像データから特定できた場合(ステップS2032:YES)、そのグループ第二特徴量を有するグループを、新たに読み込んだ文書帳票の画像データのグループと特定する(ステップS2033)。特定したグループの第二特徴量が示す書式を新たな文書帳票の書式とする。
If information matching the group second feature read from the
しかしながら、非記録文字列の情報から作成される第二特徴量のグループを示すグループ第二特徴量については、表形式の書式帳票などの非記録文字列がない、あるいは、少ない場合に、正しくグループを判定することができない。 However, for the group second feature indicating a group of second features created from information on non-recorded character strings, if there are no or few non-recorded character strings such as in a tabular format form, the group cannot be correctly grouped. cannot be determined.
そこで、実施の形態に係る画像処理装置1は、全てのグループについてのグループ第二特徴量について、一致する情報が新たに読み込んだ文書帳票から特定できなかった場合(ステップS2032:NО)、グループ第一特徴量を用いてグループの特定を行う。
Therefore, in the
具体的には、第二特徴量と同様に、あるグループの全ての記録文字列に関する第一特徴量の示す情報が、ステップS201で取得した新たな文書帳票の画像データから特定できるかどうかを判定する(ステップS2034)。 Specifically, similarly to the second feature amount, it is determined whether the information indicated by the first feature amount regarding all recorded character strings in a certain group can be specified from the image data of the new document form acquired in step S201. (Step S2034).
記録文字列の全ての種類でグループ第一特徴量と第三特徴量が一致する場合に(ステップS2034:YES)、同一のグループとして判定する。そして、そのグループ第一特徴量を有するグループを、新たに読み込んだ文書帳票の画像データのグループと特定する(ステップS204)。 If the group first feature amount and third feature amount match for all types of recorded character strings (step S2034: YES), it is determined that they are the same group. Then, the group having the first group feature amount is identified as the group of image data of the newly read document form (step S204).
一致する条件として、グループ第一特徴量のy座標(縦方向)の値は含まないようにする。すなわち、一致する条件として、y座標(縦方向)の値は比較せず、x座標(横方向)の値だけを比較する。これにより、表形式の文書帳票のように、y方向に表の長さが変化する場合でも、表の長さに影響されることなく判定することができる。 As a matching condition, the value of the y-coordinate (vertical direction) of the group first feature quantity is not included. That is, as a matching condition, only the x-coordinate (horizontal direction) value is compared without comparing the y-coordinate (vertical direction) value. Thereby, even if the length of the table changes in the y direction, such as in a tabular document form, determination can be made without being affected by the length of the table.
図4を用いて判定方法を説明すると、日付51から金額55までの記録文字列の全てと一致するグループ第一特徴量を、同一のグループとして判定する。そして、商品名53のように複数の候補がある場合、1つでも一致する候補があれば良いとする。
The determination method will be explained using FIG. 4. Group first feature amounts that match all of the recorded character strings from
また、文書帳票の画像データと一致するグループ第一特徴量が、複数個存在する場合、一致する文字列が多いグループを、同一のグループとして判定する。 Furthermore, if there are a plurality of group first feature amounts that match the image data of the document form, the group that has the most matching character strings is determined to be the same group.
すなわち、画像処理装置1は、新たな文書帳票の個別第二特徴量が予め記録されたグループ第二特徴量内のいずれにも一致しない場合、予め記録されたグループ第一特徴量内から、新たな文書帳票の個別第一特徴量と一致する記録文字列の数が最も多い第一特徴量を、特定第一特徴量として特定してもよい。
That is, if the individual second feature of a new document form does not match any of the group second features recorded in advance, the
ステップS204の後、図7Bに示すように、グループ特定部107は、データベース4からそのグループについての1つまたは複数のグループ第一特徴量を読み出す(ステップS205)。グループ特定部107は、記録部105へ第三特徴量と1つまたは複数のグループ第一特徴量を出力する。グループ第一特徴量は、そのグループに属する文書帳票内の1つまたは複数の記録文字列を特定するための特徴量である。
After step S204, as shown in FIG. 7B, the
記録部105は、画像データ中の1つまたは複数の文字列についての第三特徴量と、1つまたは複数のグループ第一特徴量とを取得する。記録部105は各グループ第一特徴量に含まれる文字列の範囲を示す座標を用いて、各グループ第一特徴量が示す当該座標に対応する座標を有する第三特徴量が全て存在するかを判定する(ステップS206)。
The
各グループ第一特徴量の座標に対応する座標を有する第三特徴量が全て存在する場合には、記録文字列に対応する文書帳票内の全ての記載事項に文字の記載が存在する。一方、各グループ第一特徴量の座標に対応する座標を有する第三特徴量が全て存在しない場合には、文書帳票内の何れかの記載事項に文字の記載が無い状態である。 If all the third feature amounts having coordinates corresponding to the coordinates of the first feature amount of each group are present, there are descriptions of characters in all entries in the document form corresponding to the recorded character string. On the other hand, if all the third feature amounts having coordinates corresponding to the coordinates of the first feature amount of each group do not exist, there is no character entry in any entry in the document form.
ステップS206でYESの場合、記録部105は、グループ第一特徴量に含まれる文字属性と、座標に基づいて特定された対応する第三特徴量に含まれる文字属性がそれぞれ一致するかどうかを判定する(ステップS207)。
If YES in step S206, the
記録部105は、ステップS207の判定結果がYESとなり文字属性が一致する場合、現在処理している画像データにおいて1つまたは複数の第三特徴量が示す座標に基づく記録文字列の範囲に矩形枠を表示した確認画面を生成する。記録部105は、その確認画面をモニタに出力する(ステップS208)。
If the determination result in step S207 is YES and the character attributes match, the
作業者は、この確認画面に表示された矩形領域を確認して、画像処理装置1が記録しようとする記録文字列を確認することができる。これにより、作業者は、記録文字列に不足が無いかを確認することができる。確認画面にはOKまたはNGの何れかのボタンのアイコン画像が表示されている。このボタンのアイコン画像のうちOKのボタンを選択することにより、作業者は、記録文字列としての選択に不足がないことを指示することができる。
The operator can check the rectangular area displayed on this confirmation screen and check the recording character string that the
他方、ボタンのアイコン画像のうちNGのボタンを選択することにより、作業者は、記録文字列としての選択に不足があることを指示することができる。記録部105は、作業者のボタンのアイコン画像の押下に応じて、記録文字列の選択に不足が無いかを判定する(ステップS209)。
On the other hand, by selecting an NG button from among the button icon images, the operator can indicate that the selection as a recorded character string is insufficient. The
記録部105は、不足が無い場合には、第三特徴量に含まれる文字列を、文書帳票の識別情報に対応付けて記録テーブルに記録する(ステップS210)。
If there is no shortage, the
ステップS206でNOの場合、ステップS207でNOの場合、ステップS209でNOの場合、記録部105は、画像データ中の対応する座標の第三特徴量が存在しなかったグループ第一特徴量の座標の範囲に入力欄を設けた帳票画像の入力用画像データを生成してモニタに出力する(ステップS211)。
In the case of NO in step S206, in the case of NO in step S207, in the case of NO in step S209, the
作業者は、この入力用画像データを見ながら、画像処理装置1のキーボード等の入力装置を操作して、モニタに表示されている入力用画像データ内の入力欄に記録文字列を入力する。当該入力用画像データには保存ボタン(記録ボタン)が表示されており、保存ボタンの押下操作をすると、記録部105は、既に文書帳票について取得した第三特徴量の他、新たに入力用画像データの入力欄に入力された文字列を含む第三特徴量を生成する(ステップS212)。記録部105は、帳票画像データの識別子と入力欄に入力された文字列とを対応付けてデータベース4に記録する。
While looking at this input image data, the operator operates an input device such as a keyboard of the
画像処理装置1は、図6で示した処理フローを再度実施することにより、グループ第一特徴量およびグループ第二特徴量を更新し、記録できる文字列の範囲を拡張する。これにより、次に同じ文書帳票を処理したときには、自動的に文字列を記録でき、作業者が文字列を入力する手間を省くことができる。記録部105は、全ての第三特徴量それぞれに含まれる文字列を、文書帳票の記録テーブルに記録する(ステップS213)。
The
画像処理装置1は、ステップS2031からステップS204に示したように、グループ分類部106に、グループ第一特徴量を用いた判定を加えることで、第二特徴量(非記録文字列)がない、あるいは、少ない表形式の文書帳票のような場合でも、文書帳票の書式を正しく判別することが可能になる。
As shown in steps S2031 to S204, the
また、画像処理装置1は、予め作業者が記録しておいた複数の異なる文書帳票の画像データと記録文字列によって、新たに入力した文書帳票の種別によらずにその文書帳票の画像データにおける記録文字列を記録することができる。これにより、画像処理装置1は、文書帳票における記録文字列の記録の作業者の労力を軽減することができる。
In addition, the
<特徴>
以下に、実施の形態の特徴を記載する。
画像処理装置1は、文書帳票の書式の特定(判別)において、非記録文字列がない、あるいは、少ない表形式の文書帳票のような場合でも、記録文字列の属性(数字、アルファベット、ひらがな、漢字、文字数、文字高さ、フォントなど)、記録文字列の座標(文字列に含まれる先頭文字の座標、終了文字の座標など)に基づいて文書帳票毎に生成されたグループ個別第一特徴量を利用することで、文書帳票の書式を判別する。
<Features>
Features of the embodiment will be described below.
When specifying (discriminating) the format of a document form, the
尚、上記の実施の形態では、本発明をハードウェアの構成として説明したが、本発明はこれに限定されるものではない。本発明は、各構成要素の処理を、CPU(Central Processing Unit)にコンピュータプログラムを実行させることにより実現することも可能である。 Although the present invention has been described as a hardware configuration in the above embodiment, the present invention is not limited to this. The present invention can also be realized by causing a CPU (Central Processing Unit) to execute a computer program to execute the processing of each component.
上記の実施の形態において、プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実態のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(具体的にはフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(具体的には光磁気ディスク)、CD-ROM(Read Only Memory)、CD-R、CD-R/W、半導体メモリ(具体的には、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM))、フラッシュROM、RAM(Random Access Memory)を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。 In the embodiments described above, the program can be stored and delivered to the computer using various types of non-transitory computer readable media. Non-transitory computer-readable media includes various types of tangible storage media. Examples of non-transitory computer-readable media include magnetic recording media (specifically, flexible disks, magnetic tapes, hard disk drives), magneto-optical recording media (specifically, magneto-optical disks), and CD-ROMs (Read Only Memory ), CD-R, CD-R/W, semiconductor memory (specifically, mask ROM, PROM (Programmable ROM), EPROM (Erasable PROM)), flash ROM, and RAM (Random Access Memory). The program may also be provided to the computer on various types of transitory computer readable media. Examples of transitory computer-readable media include electrical signals, optical signals, and electromagnetic waves. The temporary computer-readable medium can provide the program to the computer via wired communication channels, such as electrical wires and fiber optics, or wireless communication channels.
なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。 Note that the present invention is not limited to the above embodiments, and can be modified as appropriate without departing from the spirit.
1…画像処理装置
2…画像読取装置
3…記録装置
4…データベース
5…文書帳票
10…システム
100…特徴量抽出生成部
101…制御部
102…取得部
103…特徴量抽出部
104…読取対象特徴量生成部
105…記録部
106…グループ分類部
107…グループ特定部
1...
Claims (9)
前記文書帳票を、前記個別第一特徴量と前記個別第二特徴量に基づいてグループ分けし、複数の前記個別第一特徴量を含むグループ第一特徴量と、複数の前記個別第二特徴量を含むグループ第二特徴量と、を生成するグループ分類部と、
新たな文書帳票の前記個別第二特徴量が予め記録された前記グループ第二特徴量内のいずれにも一致しない場合、予め記録された前記グループ第一特徴量内から、前記新たな文書帳票の前記個別第一特徴量と一致する特定第一特徴量を特定し、前記特定第一特徴量が示す書式を前記新たな文書帳票の書式とする制御部と、
を備え、
前記制御部は、前記新たな文書帳票の前記個別第二特徴量が前記予め記録された前記グループ第二特徴量内のいずれにも一致しない場合、前記予め記録された前記グループ第一特徴量内から、前記新たな文書帳票の前記個別第一特徴量と一致する前記記録文字列の数が最も多い第一特徴量を、前記特定第一特徴量として特定する、
画像処理装置。 a feature quantity extraction generation unit that extracts an individual first feature quantity indicating a feature of a recorded character string included in a document form, and an individual second feature quantity indicating recognition information of a non-recorded character string included in the document form; ,
The document form is divided into groups based on the individual first feature amount and the individual second feature amount, and a group first feature amount includes a plurality of the individual first feature amounts, and a plurality of the individual second feature amounts. a group second feature quantity including; a group classification unit that generates ;
If the individual second feature of the new document form does not match any of the group second features recorded in advance, the new document form's individual second feature is selected from among the group first features recorded in advance. a control unit that identifies a specific first feature amount that matches the individual first feature amount, and sets a format indicated by the specific first feature amount as a format of the new document form;
Equipped with
When the individual second feature of the new document form does not match any of the pre-recorded group second feature, the control unit may match the individual second feature of the new document form to any of the pre-recorded group first feature. from, specifying the first feature amount having the largest number of recorded character strings that match the individual first feature amount of the new document form as the specific first feature amount;
Image processing device.
請求項1に記載の画像処理装置。 The group classification unit classifies the document form according to at least one of the degree of correspondence of the non-recorded character string, the degree of correspondence of the emblem image, and the degree of correspondence of the coordinate range of the non-recorded character string indicated by the individual second feature amount. , and performing the grouping based on the similarity of the features of the recorded character strings indicated by the individual first feature amounts.
The image processing device according to claim 1.
請求項1又は2に記載の画像処理装置。 further comprising a group identifying unit that identifies the group in which the individual first feature of the new document form is included, and identifies the group in which the individual second feature of the new document form is included;
The image processing device according to claim 1 or 2.
請求項1から3のいずれか1つに記載の画像処理装置。 a storage unit that records the document form and the individual first feature amount of the document form in association with each other, and records the document form and the individual second feature amount of the document form in association with each other; Further prepare,
The image processing device according to any one of claims 1 to 3.
請求項1から4のいずれか1つに記載の画像処理装置。 further comprising an acquisition unit that acquires the document form and the recorded character string included in the document form from a database, and acquires the new document form from an image reading device;
The image processing device according to any one of claims 1 to 4.
前記記録文字列の前記属性情報は、数字、アルファベット、ひらがな、漢字、文字数、文字高さ、フォントの情報のうち少なくとも1つを含み、
前記記録文字列の座標情報は、前記記録文字列の先頭文字の座標及び終了文字の座標の少なくともいずれかを含む、
請求項1から5のいずれか1つに記載の画像処理装置。 The individual first feature amount of the document form includes at least one of attribute information of the recorded character string and coordinate information of the recorded character string,
The attribute information of the recorded character string includes at least one of numbers, alphabets, hiragana, kanji, number of characters, character height, and font information,
The coordinate information of the recorded character string includes at least one of the coordinates of the first character and the coordinate of the end character of the recorded character string.
The image processing device according to any one of claims 1 to 5.
前記画像読取装置は、
光学的に文書帳票の画像データを取得し、前記画像データを前記画像処理装置へ出力する読取出力部を有し、
前記画像処理装置は、
前記文書帳票の前記画像データを文字認識し、前記文書帳票に含まれる記録文字列の特徴を示す個別第一特徴量と、前記文書帳票に含まれる非記録文字列の認識情報を示す個別第二特徴量と、を抽出する特徴量抽出部と、
前記文字認識した文字認識結果を前記記録装置に出力する処理出力部と、
前記文書帳票を、前記個別第一特徴量と前記個別第二特徴量に基づいてグループ分けし、複数の前記個別第一特徴量を含むグループ第一特徴量と、複数の前記個別第二特徴量を含むグループ第二特徴量と、を生成するグループ分類部と、
新たな文書帳票の前記個別第二特徴量が予め記録された前記グループ第二特徴量内のいずれにも一致しない場合、予め記録された前記グループ第一特徴量内から、前記新たな文書帳票の前記個別第一特徴量と一致する特定第一特徴量を特定し、前記特定第一特徴量が示す書式を前記新たな文書帳票の書式とする制御部と、を有し、
前記制御部は、前記新たな文書帳票の前記個別第二特徴量が前記予め記録された前記グループ第二特徴量内のいずれにも一致しない場合、前記予め記録された前記グループ第一特徴量内から、前記新たな文書帳票の前記個別第一特徴量と一致する前記記録文字列の数が最も多い第一特徴量を、前記特定第一特徴量として特定し、
前記記録装置は、
前記画像処理装置から前記文字認識結果を取得する文字認識取得部と、
前記文字認識結果を前記データベースに記録する文字認識記録部と、を有し、
前記データベースは、
前記記録装置から取得した前記文字認識結果を記録する記録テーブルを有する、
システム。 Equipped with an image processing device, an image reading device, a recording device, and a database,
The image reading device includes:
a reading output unit that optically acquires image data of a document form and outputs the image data to the image processing device;
The image processing device includes:
The image data of the document form is character-recognized, and an individual first feature amount indicating a feature of a recorded character string included in the document form and an individual second feature amount indicating recognition information of a non-recorded character string included in the document form are provided. a feature amount extraction unit that extracts the feature amount;
a processing output unit that outputs the character recognition result of the character recognition to the recording device;
The document form is divided into groups based on the individual first feature amount and the individual second feature amount, and a group first feature amount includes a plurality of the individual first feature amounts, and a plurality of the individual second feature amounts. a group second feature quantity including; a group classification unit that generates ;
If the individual second feature of the new document form does not match any of the pre-recorded group second features, the new document form is selected from among the pre-recorded group first features. a control unit that specifies a specific first feature amount that matches the individual first feature amount, and sets a format indicated by the specific first feature amount as a format of the new document form;
If the individual second feature of the new document form does not match any of the pre-recorded group second feature, the control unit may match the individual second feature of the new document form to any of the pre-recorded group first feature. from, specifying the first feature amount having the largest number of recorded character strings that match the individual first feature amount of the new document form as the specific first feature amount;
The recording device includes:
a character recognition acquisition unit that acquires the character recognition result from the image processing device;
a character recognition recording unit that records the character recognition results in the database;
The database includes:
comprising a recording table for recording the character recognition results obtained from the recording device;
system.
前記文書帳票を、前記個別第一特徴量と前記個別第二特徴量に基づいてグループ分けし、複数の前記個別第一特徴量を含むグループ第一特徴量と、複数の前記個別第二特徴量を含むグループ第二特徴量と、を生成することと、
新たな文書帳票の前記個別第二特徴量が予め記録された前記グループ第二特徴量内のいずれにも一致しない場合、予め記録された前記グループ第一特徴量内から、前記新たな文書帳票の前記個別第一特徴量と一致する特定第一特徴量を特定し、前記特定第一特徴量が示す書式を前記新たな文書帳票の書式とすることと、
前記新たな文書帳票の前記個別第二特徴量が前記予め記録された前記グループ第二特徴量内のいずれにも一致しない場合、前記予め記録された前記グループ第一特徴量内から、前記新たな文書帳票の前記個別第一特徴量と一致する前記記録文字列の数が最も多い第一特徴量を、前記特定第一特徴量として特定することと、
を備える方法。 extracting an individual first feature amount indicating a feature of a recorded character string included in a document form, and an individual second feature amount indicating recognition information of a non-recorded character string included in the document form;
The document form is divided into groups based on the individual first feature amount and the individual second feature amount, and a group first feature amount includes a plurality of the individual first feature amounts, and a plurality of the individual second feature amounts. and generating a group second feature including;
If the individual second feature of the new document form does not match any of the group second features recorded in advance, the new document form's individual second feature is selected from among the group first features recorded in advance. identifying a specific first feature amount that matches the individual first feature amount, and setting a format indicated by the specific first feature amount as a format of the new document form;
If the individual second feature of the new document form does not match any of the group second features recorded in advance, the new specifying a first feature amount having the largest number of recorded character strings that match the individual first feature amount of the document form as the specific first feature amount;
How to prepare.
前記文書帳票を、前記個別第一特徴量と前記個別第二特徴量に基づいてグループ分けし、複数の前記個別第一特徴量を含むグループ第一特徴量と、複数の前記個別第二特徴量を含むグループ第二特徴量と、を生成することと、
新たな文書帳票の前記個別第二特徴量が予め記録された前記グループ第二特徴量内のいずれにも一致しない場合、予め記録された前記グループ第一特徴量内から、前記新たな文書帳票の前記個別第一特徴量と一致する特定第一特徴量を特定し、前記特定第一特徴量が示す書式を前記新たな文書帳票の書式とすることと、
前記新たな文書帳票の前記個別第二特徴量が前記予め記録された前記グループ第二特徴量内のいずれにも一致しない場合、前記予め記録された前記グループ第一特徴量内から、前記新たな文書帳票の前記個別第一特徴量と一致する前記記録文字列の数が最も多い第一特徴量を、前記特定第一特徴量として特定することと、
をコンピュータに実行させるプログラム。 extracting an individual first feature amount indicating a feature of a recorded character string included in a document form, and an individual second feature amount indicating recognition information of a non-recorded character string included in the document form;
The document form is divided into groups based on the individual first feature amount and the individual second feature amount, and a group first feature amount includes a plurality of the individual first feature amounts, and a plurality of the individual second feature amounts. and generating a group second feature including;
If the individual second feature of the new document form does not match any of the group second features recorded in advance, the new document form's individual second feature is selected from among the group first features recorded in advance. identifying a specific first feature amount that matches the individual first feature amount, and setting a format indicated by the specific first feature amount as a format of the new document form;
If the individual second feature of the new document form does not match any of the group second features recorded in advance, the new specifying a first feature amount having the largest number of recorded character strings that match the individual first feature amount of the document form as the specific first feature amount;
A program that causes a computer to execute.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2019232975A JP7447482B2 (en) | 2019-12-24 | 2019-12-24 | Image processing device, system, method, and program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2019232975A JP7447482B2 (en) | 2019-12-24 | 2019-12-24 | Image processing device, system, method, and program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2021101304A JP2021101304A (en) | 2021-07-08 |
| JP7447482B2 true JP7447482B2 (en) | 2024-03-12 |
Family
ID=76651332
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2019232975A Active JP7447482B2 (en) | 2019-12-24 | 2019-12-24 | Image processing device, system, method, and program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7447482B2 (en) |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2018055255A (en) | 2016-09-27 | 2018-04-05 | キヤノン株式会社 | Information processing apparatus, information processing method, and program |
| JP2019008775A (en) | 2017-06-22 | 2019-01-17 | 日本電気株式会社 | Image processing device, image processing system, image processing method, program |
-
2019
- 2019-12-24 JP JP2019232975A patent/JP7447482B2/en active Active
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2018055255A (en) | 2016-09-27 | 2018-04-05 | キヤノン株式会社 | Information processing apparatus, information processing method, and program |
| JP2019008775A (en) | 2017-06-22 | 2019-01-17 | 日本電気株式会社 | Image processing device, image processing system, image processing method, program |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2021101304A (en) | 2021-07-08 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4347677B2 (en) | Form OCR program, method and apparatus | |
| JP6859977B2 (en) | Image processing equipment, image processing systems, image processing methods and programs | |
| JP6874729B2 (en) | Image processing equipment, image processing methods and programs | |
| WO2000052645A1 (en) | Document image processor, method for extracting document title, and method for imparting document tag information | |
| US11514700B2 (en) | Image-processing device, image-processing method, and storage medium on which program is stored | |
| JP6100532B2 (en) | Receipt definition data creation device and program thereof | |
| JP2000067065A (en) | Document image identification method and recording medium | |
| US11315351B2 (en) | Information processing device, information processing method, and information processing program | |
| JP6784273B2 (en) | Image processing equipment, image processing methods and programs | |
| JP7111143B2 (en) | Image processing device, image processing method and program | |
| JP2012190434A (en) | Form defining device, form defining method, program and recording medium | |
| JP6856916B1 (en) | Information processing equipment, information processing methods and information processing programs | |
| JP7447482B2 (en) | Image processing device, system, method, and program | |
| JP6784274B2 (en) | Image processing equipment, image processing methods and programs | |
| JP7160432B2 (en) | Image processing device, image processing method, program | |
| JP4347675B2 (en) | Form OCR program, method and apparatus | |
| JPH08221510A (en) | Form document processing apparatus and form document processing method | |
| JP7377565B2 (en) | Drawing search device, drawing database construction device, drawing search system, drawing search method, and program | |
| JP7699773B2 (en) | Document image processing system, document image processing method, and document image processing program | |
| CN110727820B (en) | Method and system for obtaining label for picture | |
| JP4517822B2 (en) | Image processing apparatus and program | |
| JP2009223391A (en) | Image processor and image processing program | |
| US20250061265A1 (en) | Information processing apparatus, layout assistance method, and recording medium | |
| JP2020144754A (en) | Information processing device and program | |
| JP2019204341A (en) | Data analysis system and data analysis method |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221109 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230912 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230926 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231116 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240130 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240212 |
|
| R151 | Written notification of patent or utility model registration |
Ref document number: 7447482 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |