JP7703902B2 - DATA OUTPUT SYSTEM, INFORMATION PROCESSING SYSTEM, INFORMATION PROCESSING METHOD, AND PROGRAM - Google Patents
DATA OUTPUT SYSTEM, INFORMATION PROCESSING SYSTEM, INFORMATION PROCESSING METHOD, AND PROGRAM Download PDFInfo
- Publication number
- JP7703902B2 JP7703902B2 JP2021090252A JP2021090252A JP7703902B2 JP 7703902 B2 JP7703902 B2 JP 7703902B2 JP 2021090252 A JP2021090252 A JP 2021090252A JP 2021090252 A JP2021090252 A JP 2021090252A JP 7703902 B2 JP7703902 B2 JP 7703902B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- area
- processing
- file
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Character Input (AREA)
- Facsimiles In General (AREA)
Description
本発明は、データ出力システム、情報処理システム、情報処理方法、及び、プログラムに関する。 The present invention relates to a data output system, an information processing system, an information processing method, and a program.
企業や団体など組織の日常業務では、経費精算書、請求書又は注文書などの帳票の処理が発生する場合が多い。組織内の担当者は、帳票から、取り扱い日付、案件番号、又は金額などを抽出したり、集計したりする業務を日々行っている。 In the daily work of organizations such as companies and groups, the processing of documents such as expense reports, invoices, and purchase orders is often required. Personnel within the organization perform daily tasks such as extracting and tallying transaction dates, case numbers, and amounts from documents.
このような帳票の電子化に関する技術が考案されている(例えば、特許文献1参照。)。特許文献1には、原稿の読取画像において有彩色で塗りつぶされた領域を含む塗りつぶし領域と有彩色で囲まれた領域を含む囲み領域とを検出し、塗りつぶし領域を第1の処理用の領域とし、囲み領域を第2の処理用の領域として分類する技術が開示されている。
Technology has been devised for digitizing such forms (see, for example, Patent Document 1).
しかしながら、従来の技術では、印と処理とをユーザーが対応付けることができないという問題があった。例えば、ユーザーがマーカーペンなどで所定の用紙に印を付けて印と処理の対応を登録できないと、担当者が印と処理の対応をファイル等に設定するという作業が必要になる。 However, conventional technology has the problem that users cannot associate marks with processes. For example, if a user cannot register the correspondence between marks and processes by making marks on a designated piece of paper with a marker pen or the like, a person in charge will have to enter the correspondence between marks and processes in a file, etc.
本発明は、上記課題に鑑み、ユーザーが所定の用紙に付加する識別情報と、処理とを対応付けることができる技術を提供することを目的とする。
In view of the above-mentioned problems, an object of the present invention is to provide a technique that enables identification information that a user adds to a specific paper sheet to be associated with a process.
上記課題に鑑み、本発明は、1以上の装置と通信可能に接続された、所定の処理を実行する情報処理システムであって、第1の装置におけるユーザーの操作に基づいて、前記処理の内容を識別する印と前記所定の処理とを対応付けた設定情報を保存するデータ保存部と、 前記第1の装置から、ユーザーが付加した前記印を含む所定の原稿の第二の画像データを受信する通信部と、前記第二の画像データから前記印が含まれる領域を検出する領域検出部と、検出した領域の位置情報と、領域に含まれる前記印に対応する所定の処理と、前記第1の装置におけるユーザーが選択したアプリケーションと、を対応付けて記憶する管理部と、第2の装置から受信した第三の画像データに対して、前記第2の装置で選択されたアプリケーションに対応付けられた、位置情報と所定の処理とに基づいて、所定の処理を実行する処理部と、を有する。
In view of the above problems, the present invention provides an information processing system that is communicatively connected to one or more devices and executes a specified process, and includes a data storage unit that stores setting information that associates a mark that identifies the content of the process with the specified process based on a user's operation on a first device, a communication unit that receives second image data of a specified document including the mark added by the user from the first device, an area detection unit that detects an area including the mark from the second image data, a management unit that associates and stores position information of the detected area, a specified process corresponding to the mark included in the area, and an application selected by the user on the first device, and a processing unit that executes the specified process for third image data received from the second device based on the position information and the specified process associated with the application selected on the second device .
ユーザーが所定の用紙に付加する識別情報と、処理とを対応付けることができる情報処理システムを提供することができる。 It is possible to provide an information processing system that can associate identification information that a user adds to a specific piece of paper with a process.
以下、本発明を実施するための形態の一例として、データ出力システムと、データ出力システムが行う処理方法について説明する。 Below, a data output system and a processing method performed by the data output system will be described as an example of a form for implementing the present invention.
<処理又は動作の概略>
企業や団体などの組織では、経費精算書、請求書又は注文書などの帳票の処理が発生する場合が多い。組織内の担当者は、帳票から日付、案件番号又は金額などを抽出したり、集計したりする業務を日々行っている。処理された帳票はファイリングの後、保管されるが、その保管スペースにもコストがかかる。徐々に帳票の電子化が進められているが、帳票のファイルに自動で付与されたファイル名を担当者がリネームする作業などにも手間がかかる。
<Outline of Processing or Operation>
Organizations such as companies and groups often process documents such as expense reports, invoices, and purchase orders. Personnel within the organization extract and tally up dates, case numbers, amounts, and other information from documents on a daily basis. Processed documents are filed and then stored, but the storage space also incurs costs. While the digitization of documents is gradually progressing, it is time-consuming for personnel to rename the file names that are automatically assigned to document files.
請求処理や受発注を自動化するシステムやサービスは存在するが、高価なものが多いため、これらに投資できる中小企業は多くない。使用される帳票は組織によって様々だし、同じ帳票だとしても処理に使用される項目は組織によって異なる場合がある。このため、やむを得ず人手を介してこの帳票の処理を行っているという現状がある。 Although there are systems and services that automate billing and order processing, many of them are expensive, and not many small and medium-sized enterprises can afford to invest in them. Different organizations use different forms, and even if the same form is used, the items used for processing may differ from organization to organization. For this reason, the current situation is that these forms are inevitably processed manually.
本実施形態では、情報処理システムが、予め決められた印(マーカーの色や形状等)とその印に対応する処理が対応付けられている画像データを機器から受信する。これにより、ユーザー側が印と処理を対応付けられる。更に、情報処理システムが、印が形成された帳票の画像データを機器から受信する。情報処理システムは印と処理と帳票内の領域情報を設定ファイルに対応付ける。帳票が機器でスキャンされた場合、情報処理システムは、領域情報で特定される帳票の領域に対応付けられている処理を実行する。 In this embodiment, the information processing system receives image data from the device that associates a predetermined mark (such as the color or shape of a marker) with a process that corresponds to that mark. This allows the user to associate the mark with the process. Furthermore, the information processing system receives image data of a form on which the mark is formed from the device. The information processing system associates the mark, the process, and area information within the form with a setting file. When the form is scanned by the device, the information processing system executes the process that is associated with the area of the form identified by the area information.
これにより、情報処理システムは、原稿上の特定の領域のみにユーザーが指定した各種処理を行うことが可能となる。 This allows the information processing system to perform various processes specified by the user only on specific areas of the document.
図1、図2を参照して、データ出力システムが行う処理又は動作の概略を説明する。図1は、データ出力システムが印と処理を対応付ける処理又は動作を説明する図である。図2は、データ出力システム100が帳票から取得した取得データでファイルを作成する処理又は動作を説明する図である。
The process or operation performed by the data output system will be outlined with reference to Figures 1 and 2. Figure 1 is a diagram explaining the process or operation performed by the data output system to associate marks with processes. Figure 2 is a diagram explaining the process or operation performed by the
(1) データ出力システム100は外部サービスシステム40と連携することができる。データ出力システム100はアプリを介して外部サービスシステム40と連携する。データ出力システム100で動作するアプリを単に「アプリ」、外部サービスシステム40で動作するアプリを連携先アプリと呼ばれてもよく、この場合、アプリと連携先アプリの互いのアプリIDを対応付け、対応関係をデータ出力システム100は記憶する。
(1) The
(2) データ出力システム100の管理者8は、機器20で情報処理システム10に登録されている登録用紙を印刷して、処理に対応させたい色をマーカーペンで着色する。例えば、OCRが緑、OMRが青、トリミングが赤、など、管理者8は任意の色を処理と対応付けておくことができる。機器20が登録用紙をスキャンして画像データ(第一の画像データ)を生成し、情報処理システム10に送信する。
(2) The
(3) 情報処理システム10は色と処理の対応を画像データから検出し、色と処理を対応付けて設定ファイルに登録する。情報処理システム10は設定ファイルを外部サービスシステム40に保存する。
(3) The
続いて、図2を参照して説明する。図2(a)は帳票における領域情報の設定を、図2(b)は領域情報を使用した帳票からのデータの取得を、それぞれ説明する図である。 Next, we will explain with reference to Figure 2. Figure 2(a) is a diagram explaining how to set area information in a form, and Figure 2(b) is a diagram explaining how to obtain data from a form using area information.
(4) 管理者8は、組織内のユーザーが日常的に使う帳票7を使用して、帳票7のどの領域にどの処理(OCR:Optical Character Reader、OMR:Optical Mark Reader、トリミング)を行うかをマーカーペンで指定する。管理者8は、例えば、マーカーペンで帳票7の領域を塗り潰したり、囲んだりすればよい。機器20は領域がマーキングされた帳票7を読み取って生成した画像データ(第二の画像データ)を情報処理システム10へ送信する。なお、マーキングされる帳票7には項目に対し文字などが記入されていてもよいし、項目のみでもよいし、白紙でもよい。
(4) The
(5) 情報処理システム10は、外部サービスシステム40から取得した設定ファイルに登録されている色と同じ色が着色している領域を帳票の画像データから特定し、該領域の領域情報を設定ファイルの色と処理に対応づけて設定ファイルに保存する。領域情報は、画像データにおける例えば矩形の領域の対角頂点の座標である。情報処理システム10は設定ファイルを外部サービスシステム40に保存する。
(5) The
(6)-1 管理者8は、端末装置30を外部サービスシステム40に接続させ、設定ファイルをダウンロードし、設定ファイルに帳票の言語や日時等を入力し、設定ファイルを補完する。
(6)-1 The
(6)-2 また、管理者8は端末装置30を情報処理システム10に接続させ、アプリのアプリIDと設定ファイルを対応づける操作を行う。管理者8は任意の数のアプリIDと設定ファイルとを対応付けることができる。これにより、アプリの選択を受け付けるアイコンと画像処理が行われる領域情報が対応づけられる。
(6)-2 In addition, the
(7) 組織内のユーザー6が費用の精算などのために帳票7を組織に提出する場合、この帳票7に対応したアプリのアイコンを機器20で押下する。ユーザーが、複数の帳票名などからアプリを簡単に選べるようになっている。ユーザーは必要事項を手書きした帳票、又は、プリントアウトした帳票を機器20に読み取らせる。機器20はアプリのアプリIDと帳票を読み取って生成した画像データ(第三の画像データ。例えばPDFファイル)を情報処理システム10へ送信する。
(7) When a
(8) 情報処理システム10はアプリIDで設定ファイルを特定し、外部サービスシステム40から取得する。情報処理システム10は、取得した設定ファイルが有する領域情報の領域を処理ごとに画像データから取得する(例えば切り出す)。したがって、管理者8が登録した帳票の領域が取得される。
(8) The
(9) 情報処理システム10は領域に対応付けられている処理を各領域に行う。したがって、領域ごとに文字などの文字コード、チェックの有無、又は、画像データ等が得られる。以下、これらを単に、取得データという。
(9) The
(10) 情報処理システム10は取得データを電子的なファイル(例えばCSV(Comma Separated Value)ファイル)に出力して、ファイルと帳票の画像データを、外部サービスシステム40に送信する。なお、情報処理システム10が連携先アプリのアプリIDを指定した場合は、連携先アプリを指定してファイルと画像データを送信できる。
(10) The
(11) 外部サービスシステム40は管理者8が指定したフォルダ(又はディレクトリ)に画像データとファイルを登録する。ファイルには精算に必要な情報が含まれているので、担当者は精算処理することができる。
(11) The
以上説明したように、本実施形態のデータ出力システムは、印(色)と処理の内容とを管理者8が登録することができる。領域がマーキングされた帳票を機器20が読み取り、その画像データを情報処理システム10が取得するので、帳票の領域ごとに処理を対応付けて保持できる。そして、情報処理システム10は機器20から送信された帳票の画像データから領域のみを取得して領域に対応した処理を行うことができる。これによって、任意の数のアプリそれぞれに画像処理の領域と処理を対応付けることが可能となり、ユーザーは例えば帳票の種類に応じてアプリを選択するだけで、スキャンで生成された画像データの所望の領域に所望の処理(例えば、OCR処理等)を行わせることができる。
As described above, the data output system of this embodiment allows the
<色と処理の対応に関する補足>
図1、図2で説明した、一連の処理について作業1~3に分けて補足する。図3は、登録用紙を用いた色と処理の対応(作業1)の登録を説明する図である。
<Additional information regarding color and processing>
The series of processes explained in Figures 1 and 2 will be supplemented by dividing them into
図3(a)は着色前の登録用紙である。 Figure 3 (a) shows the registration form before coloring.
図3(b)は着色後の登録用紙である。図3(b)の登録用紙を機器20がスキャンする。
Figure 3(b) shows the registration form after coloring. The registration form in Figure 3(b) is scanned by
図3(c)は色と処理が対応付けられた設定ファイルの一部である。色と処理の対応付けには、2つの方法が考えられる。 Figure 3 (c) shows a part of a configuration file in which colors and processes are associated. There are two possible ways to associate colors and processes.
1:色を取得してくる座標(登録用紙内の)とその座標からとってきた処理とを紐づけるか情報を情報処理システム側が事前にもっておく。
事前パラメータ例
・座標(X座標:100, 200 Y座標:1, 50)で抽出した色はOCR
・座標(X座標:100, 200 Y座標:51, 100)で抽出した色はマスキング(表4ではOMR)
・座標(X座標:100, 200 Y座標:101, 150)で抽出した色はトリミング
2:管理者が管理サイト上で色と処理を紐づけする。
図4は、色と処理を対応付けるための管理サイト150の一例である。管理サイト150はWebページ又はWebアプリとして情報処理システム10が端末装置に提供する。管理者はラジオボタン151で処理の色を登録できる。この場合、ユーザーが使用するマーカーペンの色が3つに限られる。
1: The information processing system has in advance information on how to link the coordinates (within the registration form) from which the color is obtained with the processing obtained from those coordinates.
Example of pre-defined parameters: The color extracted at coordinates (X coordinate: 100, 200 Y coordinate: 1, 50) is OCR
・The color extracted at coordinates (X coordinate: 100, 200 Y coordinate: 51, 100) is masked (OMR in Table 4).
- The color extracted at coordinates (X coordinates: 100, 200 Y coordinates: 101, 150) is trimmed. 2: The administrator links the color and processing on the management site.
4 shows an example of an
いずれの方法でも、図1(c)に示すように、マーカー色(緑)を識別する数値とOCRが対応付けられる。マーカー色(青)を識別する数値とOMRが対応付けられている。マーカー色(赤)を識別する数値とトリミングが対応付けられている。 In either method, as shown in Figure 1(c), a number identifying the marker color (green) is associated with OCR. A number identifying the marker color (blue) is associated with OMR. A number identifying the marker color (red) is associated with trimming.
図5は、帳票の原紙を用いた、領域情報と処理の対応(作業2)を説明する図である。 Figure 5 is a diagram explaining the correspondence between area information and processing (task 2) using the original form paper.
図5(a)は帳票の原紙である。 Figure 5 (a) is the original form.
図5(b)は着色後の帳票である。図5(b)の帳票を機器20がスキャンする。
Figure 5(b) shows the form after coloring. The form in Figure 5(b) is scanned by
図5(c)は領域情報と処理が対応付けられた設定ファイルの一部である。 Figure 5 (c) shows a portion of a configuration file in which area information and processing are associated.
図5(d)に示すように、設定ファイルには色と処理が対応付けられているので、情報処理システム10は、登録用紙の色(設定ファイルに登録済み)を帳票から検出し、この色が検出された領域の座標を領域情報として設定ファイルの処理に対応付ける。
As shown in FIG. 5(d), since the setting file associates colors with processes, the
したがって、本実施形態では、管理者が帳票の領域に着色した色で、領域に対する処理を変えられる。
Ex1:青で着色→OCR、赤で着色→マスキング
Ex2:青で着色→ファイル名先頭、赤で着色→ファイル名末尾
Therefore, in this embodiment, the administrator can change the processing for an area on a form by changing the color with which the area is colored.
Ex1: Color in blue → OCR, Color in red → Masking
Ex2: Colored in blue → beginning of file name, colored in red → end of file name
図6は、帳票を用いた、帳票内の領域への処理(作業3)を説明する図である。 Figure 6 is a diagram explaining processing of an area within a form using the form (task 3).
図6(a)はユーザーが必要事項を記入した原紙である。 Figure 6 (a) shows the original paper on which the user has filled out the necessary information.
図6(b)は帳票の各領域に行われる処理を示す。帳票のタイトルの領域140にはOCRとファイル名付与が処理として登録されているので、タイトルがファイル名となる。帳票の事前申請の領域141にはマスキングが処理として登録されているので、事前申請の領域はマスキングされる。帳票の備考の領域142にはトリミングが処理として登録されているので、備考の領域は画像データとして取得される。
Figure 6 (b) shows the processing performed on each area of the form. In the
<用語について>
印とは他との見分けをつける手段としてのかた(型)である。本実施形態では、色が印の一例であるが、文字、アルファベット、記号などが印でもよい。
<Terminology>
A mark is a shape used as a means for distinguishing something from others. In this embodiment, a color is an example of a mark, but letters, alphabets, symbols, etc. may also be used as marks.
第1の装置は、機器又は管理者の端末装置である。第2の装置は、例えば機器である。 The first device is a device or an administrator's terminal device. The second device is, for example, a device.
「ユーザーの操作に基づいて」とは、ユーザーが登録用紙を使って設定する場合と、管理画面を使って設定する場合を含む。 "Based on user operation" includes cases where the user sets the settings using a registration form and cases where the user sets the settings using the administration screen.
設定情報とは、例えば色と処理の内容を対応付ける情報である(例えば表4参照)。 The setting information is, for example, information that associates colors with the contents of processing (see Table 4, for example).
管理者8とはデータ出力システムの顧客側のシステム管理者等であり、一般ユーザーのためにデータ出力システムに関する設定を行う者である。ユーザーとは、顧客側の一般ユーザーである。一般ユーザーが管理者8の作業を行ってもよいので、両者を区別しなくてもよい。
The
帳票とは帳簿や伝票などの総称である。ユーザーが記入するための空欄を設けた事務用紙ともいう。本実施形態では主に帳票について説明するが、機器20が読み取り可能な原稿であればその名称は問わない。例えば、帳票は、文書、書類、書面、レポート、新聞、雑誌などでもよい。なお、帳票は紙媒体にプリントアウトされない場合もある(機器20が帳票を読み取る必要がない場合がある)。
A form is a general term for ledgers, slips, etc. It is also called office paper with blank spaces for the user to fill in. In this embodiment, forms are mainly described, but the name of the document is not important as long as it is a document that can be read by
処理の対象となる画像データの種類はどのようなものでもよいが、PDF、JPEG、PNG、TIFF、BMP、などがある。 The type of image data to be processed can be any type, including PDF, JPEG, PNG, TIFF, BMP, etc.
本実施形態では「設定ファイル」は処理と領域情報が設定されるファイルであり、「ファイル」は取得データが出力されたファイルである。ファイルとは、コンピュータで管理されるデータの基本単位となる、データのまとまりである。 In this embodiment, a "settings file" is a file in which processing and area information is set, and a "file" is a file to which acquired data is output. A file is a collection of data that is the basic unit of data managed by a computer.
データを出力するとは、ユーザーがデータを視覚で確認できるようにすることをいう。本実施形態では、データは例えばファイルに出力される。 Outputting data means allowing the user to visually check the data. In this embodiment, the data is output to a file, for example.
Webアプリとは、ブラウザ上で動作するプログラミング言語(例えば、JavaScript(登録商標))によるプログラムとWebサーバ側のプログラムが協調することによって動作し、ブラウザ上で実行されるソフトウェア又はその仕組みを言う。 A web app is software or a mechanism that runs on a browser and operates through the cooperation of a program written in a programming language (e.g. JavaScript (registered trademark)) that runs on a browser and a program on the web server side.
<システム構成例>
まず、本実施形態に係るデータ出力システム100のシステム構成について、図7を参照しながら説明する。図7は、本実施形態に係るデータ出力システム100の一例のシステム構成を示す図である。
<System configuration example>
First, the system configuration of the
図7に示すデータ出力システム100は、情報処理システム10と、機器20と、を含み、インターネット等の広域的なネットワークN1を介して通信可能に接続されている。データ出力システム100は外部システムである外部サービスシステム40と通信する。また、任意の端末装置30がネットワークN1,N2を介して、情報処理システム10と通信できる。
The
情報処理システム10は、一台以上の情報処理装置で実現され、ネットワークN1を介して、クラウドサービス等の外部サービスシステム40と連携した一連の処理により実現される各種のサービスを提供する。本実施形態に係る情報処理システム10が提供するサービスの具体例については後述する。情報処理システム10は、クラウドコンピューティングにより実現されてもよいし、単一の情報処理装置によって実現されてもよい。クラウドコンピューティングとは、特定ハードウェア資源が意識されずにネットワーク上のリソースが利用される利用形態をいう。情報処理システム10は、インターネット上に存在しても、オンプレミスに存在してもよい。なお、一連の処理は1つのアプリにより提供され、一連の処理を「処理フロー」「ワークフロー」ともいう。
The
機器20は、ユーザーが使用する各種の電子機器である。機器20は、例えば、MFP(Multifunction Peripheral)等の画像処理装置、画像形成装置、PC(パーソナルコンピュータ)、プロジェクタ、電子黒板、デジタルカメラ等である。機器20はネットワークN2に接続されている。ユーザーは、機器20を用いて、情報処理システム10又は外部サービスシステム40の少なくとも一方が提供する各種のサービスを利用することができる。
The
なお、以降では、複数の機器20について、各々を区別するときは、「機器201」、「機器202」等と添え字を用いて記載する。
In the following description, when the
端末装置30は、例えば、管理者8又はユーザーが使用するデスクトップPC(パーソナルコンピュータ)、ノート型PC、スマートフォン、タブレット端末等である。この他、端末装置30はWebブラウザが動作可能な装置であればよい。端末装置30はネットワークN2に接続されている。管理者8又はユーザーは端末装置30を操作して、情報処理システム10又は外部サービスシステム40が提供する各種のサービスを利用することができ、更に、連携先アプリ又はアプリの設定を行うことができる。
The
なお、説明の便宜上機器20と端末装置30を分けて説明するが、機器20及び端末装置30がまとめて機器と呼ばれてもよい。
For ease of explanation, the
また、以降では、複数の端末装置30について、各々を区別するときは、「端末装置301」、「端末装置302」等と添え字を用いて記載する。
In addition, hereinafter, when the multiple
外部サービスシステム40は、ネットワークN1を介して連携先アプリの実行によるサービスを提供する一台以上の情報処理装置である。連携先アプリの実行によりデータの管理又は処理が行われ、データそのものや処理結果がサービスとなる。
The
外部サービスシステム40の一例には、例えば、クラウドサービス、ASP(Application Service Provider)等があり、ネットワークを介して提供される各種の外部サービスが含まれてよい。本実施形態ではサービスの一例としてストレージサービスについて説明する。外部サービスシステム40は、インターネット上に存在しても、オンプレミスに存在してもよい。
Examples of the
なお、以降では、複数の外部サービスシステム40について、各々を区別するときは、図示されている「外部サービスシステム401」を外部サービスシステム40A、「外部サービスシステム402」を外部サービスシステム40B等と、記載する。
In the following description, when distinguishing between the multiple
<ハードウェア構成例>
図8を参照して、本実施形態に係るデータ出力システム100に含まれる情報処理システム10及び端末装置30のハードウェア構成について説明する。
<Hardware configuration example>
The hardware configuration of the
<<情報処理システム及び端末装置>>
図8は、本実施形態に係る情報処理システム10及び端末装置30の一例のハードウェア構成を示す図である。図8に示されているように、情報処理システム10及び端末装置30はコンピュータによって構築されており、CPU501、ROM502、RAM503、HD504、HDD(Hard Disk Drive)コントローラ505、ディスプレイ506、外部機器接続I/F(Interface)508、ネットワークI/F509、バスライン510、キーボード511、ポインティングデバイス512、DVD-RW(Digital Versatile Disk Rewritable)ドライブ514、メディアI/F516を備えている。
<<Information Processing System and Terminal Device>>
Fig. 8 is a diagram showing an example of a hardware configuration of the
これらのうち、CPU501は、情報処理システム10及び端末装置30全体の動作を制御する。ROM502は、IPL等のCPU501の駆動に用いられるプログラムを記憶する。RAM503は、CPU501のワークエリアとして使用される。HD504は、プログラム等の各種データを記憶する。HDDコントローラ505は、CPU501の制御にしたがってHD504に対する各種データの読み出し又は書き込みを制御する。ディスプレイ506は、カーソル、メニュー、ウィンドウ、文字、又は画像などの各種情報を表示する。外部機器接続I/F508は、各種の外部機器を接続するためのインターフェースである。この場合の外部機器は、例えば、USB(Universal Serial Bus)メモリやプリンタ等である。ネットワークI/F509は、ネットワークN2を利用してデータ通信をするためのインターフェースである。バスライン510は、図8に示されているCPU501等の各構成要素を電気的に接続するためのアドレスバスやデータバス等である。
Of these, the
また、キーボード511は、文字、数値、各種指示などの入力のための複数のキーを備えた入力手段の一種である。ポインティングデバイス512は、各種指示の選択や実行、処理対象の選択、カーソルの移動などを行う入力手段の一種である。DVD-RWドライブ514は、着脱可能な記録媒体の一例としてのDVD-RW513に対する各種データの読み出し又は書き込みを制御する。なお、DVD-RWは、DVD-R等であってもよい。メディアI/F516は、フラッシュメモリ等の記録メディア515に対するデータの読み出し又は書き込み(記憶)を制御する。
The
<<機器>>
図9は、機器20の一例である画像形成装置のハードウェア構成図である。図9に示されているように、画像形成装置は、コントローラ910、近距離通信回路920、エンジン制御部930、操作パネル940、ネットワークI/F950を備えている。
<<Equipment>>
9 is a hardware configuration diagram of an image forming apparatus, which is an example of the
これらのうち、コントローラ910は、コンピュータの主要部であるCPU901、システムメモリ(MEM-P)902、ノースブリッジ(NB)903、サウスブリッジ(SB)904、ASIC(Application Specific Integrated Circuit)906、記憶部であるローカルメモリ(MEM-C)907、HDDコントローラ908、及び、記憶部であるHD909を有し、NB903とASIC906との間をAGP(Accelerated Graphics Port)バス921で接続した構成となっている。
Of these, the controller 910 has a
これらのうち、CPU901は、画像形成装置の全体制御を行う制御部である。NB903は、CPU901と、MEM-P902、SB904、及びAGPバス921とを接続するためのブリッジであり、MEM-P902に対する読み書きなどを制御するメモリコントローラと、PCI(Peripheral Component Interconnect)マスタ及びAGPターゲットとを有する。
Of these, the
MEM-P902は、コントローラ910の各機能を実現させるプログラムやデータの格納用メモリであるROM902a、プログラムやデータの展開、及びメモリ印刷時の描画用メモリなどとして用いるRAM902bとからなる。なお、RAM902bに記憶されているプログラムは、インストール可能な形式又は実行可能な形式のファイルでCD-ROM、CD-R、DVD等のコンピュータで読み取り可能な記録媒体に記録して提供するように構成してもよい。
The MEM-
SB904は、NB903とPCIデバイス、周辺デバイスとを接続するためのブリッジである。ASIC906は、画像処理用のハードウェア要素を有する画像処理用途向けのIC(Integrated Circuit)であり、AGPバス921、PCIバス922、HDDコントローラ908及びMEM-C907をそれぞれ接続するブリッジの役割を有する。このASIC906は、PCIターゲット及びAGPマスタ、ASIC906の中核をなすアービタ(ARB)、MEM-C907を制御するメモリコントローラ、ハードウェアロジックなどにより画像データの回転などを行う複数のDMAC(Direct Memory Access Controller)、並びに、スキャナ部931、プリンタ部932、及びファクシミリ部との間でPCIバス922を介したデータ転送を行うPCIユニットとからなる。なお、ASIC906は、USB(Universal Serial Bus)のインターフェースや、IEEE1394(Institute of Electrical and Electronics Engineers 1394)のインターフェースを有し、これらと接続されてもよい。
SB904 is a bridge for connecting NB903 with PCI devices and peripheral devices. ASIC906 is an IC (Integrated Circuit) for image processing applications that has hardware elements for image processing, and acts as a bridge connecting AGP bus921, PCI bus922, HDD controller908, and MEM-C907. This ASIC906 is composed of a PCI target and AGP master, an arbiter (ARB) that is the core of ASIC906, a memory controller that controls MEM-C907, multiple DMACs (Direct Memory Access Controllers) that rotate image data using hardware logic, and a PCI unit that transfers data between scanner unit931, printer unit932, and facsimile unit via PCI bus922. In addition,
MEM-C907は、コピー用画像バッファ及び符号バッファとして用いるローカルメモリである。HD909は、画像データの蓄積、印刷時に用いるフォントデータの蓄積、フォームの蓄積を行うためのストレージである。HD909は、CPU901の制御にしたがってHD909に対するデータの読出又は書込を制御する。AGPバス921は、グラフィック処理を高速化するために提案されたグラフィックスアクセラレータカード用のバスインタフェースであり、MEM-P902に高スループットで直接アクセスすることにより、グラフィックスアクセラレータカードを高速にすることができる。 MEM-C907 is a local memory used as an image buffer for copying and a code buffer. HD909 is a storage for storing image data, font data used during printing, and forms. HD909 controls the reading and writing of data from and to HD909 under the control of CPU901. AGP bus921 is a bus interface for a graphics accelerator card proposed to speed up graphic processing, and by directly accessing MEM-P902 with high throughput, the graphics accelerator card can be made faster.
また、近距離通信回路920には、近距離通信回路のアンテナ920aが備わっている。近距離通信回路920は、NFC、Bluetooth(登録商標)等の通信回路である。
The short-
更に、エンジン制御部930は、スキャナ部931、プリンタ部932及びファクシミリ部933を有している。また、操作パネル940は、現在の設定値や選択画面等を表示させ、操作者からの入力を受け付けるタッチパネル等のパネル表示部940a、並びに、濃度の設定条件などの画像形成に関する条件の設定値を受け付けるテンキー及びコピー開始指示を受け付けるスタートキー等からなるハードキー940bを備えている。コントローラ910は、画像形成装置全体の制御を行い、例えば、描画、通信、操作パネル940からの入力等を制御する。スキャナ部931又はプリンタ部932には、誤差拡散やガンマ変換などの画像処理部分が含まれている。
The
なお、画像形成装置は、操作パネル940のアプリケーション切り替えキーにより、ドキュメントボックス機能、コピー機能、プリンタ機能、及びファクシミリ機能を順次に切り替えて選択することが可能となる。画像形成装置は、ドキュメントボックス機能の選択時にはドキュメントボックスモードとなり、コピー機能の選択時にはコピーモードとなり、プリンタ機能の選択時にはプリンタモードとなり、ファクシミリモードの選択時にはファクシミリモードとなる。
The image forming device can sequentially switch between the document box function, copy function, printer function, and facsimile function using the application switching key on the
また、ネットワークI/F950は、ネットワークN2を利用してデータ通信をするためのインターフェースである。近距離通信回路920及びネットワークI/F950は、PCIバス922を介して、ASIC906に電気的に接続されている。
The network I/
<機能について>
次に、本実施形態に係るデータ出力システム100の機能構成について、図10を参照しながら説明する。図10は、本実施形態に係る機器20、端末装置30、及び、情報処理システム10の一例の機能構成を示す図である。
<About the function>
Next, the functional configuration of the
<<機器>>
まず、機器20は、第二通信部21と、表示制御部22と、操作受付部23と、画像データ生成部24と、ファクシミリ処理部25と、電子メール処理部26と、出力部27と、を有する。これら各機能部は、機器20にインストールされた1以上のプログラムに含まれる命令をCPU901が実行することで実現される機能又は手段である。例えば、第二通信部21、表示制御部22及び操作受付部23はWebブラウザにより実現され、その他は個別のアプリケーション(ネイティブアプリ)により実現される。
<<Equipment>>
First, the
第二通信部21は、情報処理システム10との間で各種の情報を送受信する。本実施形態では、第二通信部21は、アプリ一覧画面の画面情報等を情報処理システム10から受信し、帳票の画像データやアプリID等を情報処理システム10に送信する。
The
表示制御部22は各種の画面の画面情報を解釈してパネル表示部940aに表示する。操作受付部23は、パネル表示部940aに表示された各種画面における管理者8又はユーザーの各種操作を受け付ける。
The
画像データ生成部24は、操作受付部23が選択を受け付けたアプリが画像データを生成するものである場合、スキャナ部931で原稿をスキャンして画像データを生成する。画像データ生成部24はスキャン機能である。画像データ生成部24は、画像データをPDFファイルに変換する。画像データ生成部24は変換せずに、画像データ(JPEG、TIFF、PNGなど)は元の形式のままでもよい。ファクシミリ処理部25は、ファクシミリ部933によるファクシミリの受信及び送信に関する処理を行い、ファクシミリを受信した場合に予め対応付けられているアプリの実行を情報処理システム10に要求する。なお、画像データ生成部24は、ファクシミリの送信元(FAX番号)に対応したアプリを要求してもよい。
When the application selected by the
電子メール処理部26は電子メールの送受信に関する処理を行い、電子メールを受信した場合に予め対応付けられているアプリの実行を情報処理システム10に要求する。なお、電子メール処理部26は、電子メールの送信元(メールアドレス)に対応したアプリを要求してもよい。
The
出力部27は、画像形成処理を行うことで、画像が形成された用紙を出力する。画像形成の方式は電子写真方式でもインクジェット方式でもよい。
The
<<端末装置>>
端末装置30は、第一通信部31と、表示制御部32と、操作受付部33とを有する。これら各機能部は、端末装置30にインストールされた1以上のプログラムに含まれる命令をCPU501が実行することで実現される機能又は手段である。なお、このプログラムはWebブラウザでもよいし、情報処理システム10と通信するための専用のソフトウェアでもよい。
<<Terminal Device>>
The
第一通信部31は、情報処理システム10又は外部サービスシステム40との間で各種の情報を送受信する。本実施形態では各種の画面情報等を情報処理システム10又は外部サービスシステム40から受信し、管理者8又はユーザーが設定した情報を情報処理システム10又は外部サービスシステム40に送信する。
The
表示制御部32は各種の画面の画面情報を解釈してディスプレイ506に表示する。操作受付部33は、ディスプレイ506に表示された各種画面における管理者8又はユーザーの各種操作を受け付ける。
The
<<情報処理システム>>
情報処理システム10は、アプリデータサービス部11、設定受付部12、認証サービス部14、Webサービス処理部15、入出力サービス部16、コンポーネント18、及び、通信部19を有する。これら各機能部は、情報処理システム10にインストールされた1以上のプログラムに含まれる命令をCPU501が実行することで実現される機能又は手段である。なお、図10では作図の都合上、1つの情報処理システム10が各機能部を有しているが、各機能部は複数の情報処理装置に分散して配置されてもよい。
<<Information Processing System>>
The
通信部19は、端末装置30及び機器20との間で各種の情報を送受信する。設定受付部12は、端末装置30に設定サイトを提供し、設定サイトに対する設定を受け付ける。サイトとは、WebページやWebアプリをいう場合もあるし、端末装置30にWebページやWebアプリを提供するサーバ側のシステムをいう場合もある。設定受付部12は端末画面提供部42を有しており、端末画面提供部42はアプリの実行に必要な情報を管理者8に設定させる初期画面、アプリ一覧画面、及び、対応付け画面等を提供する。なお、端末画面提供部42は、端末装置30からのHTTPリクエストに対しHTML、XML、CSS(Cascade Style Sheet)、及びJavaScript(登録商標)等により記述された画面情報を生成し、画面情報をHTTPレスポンスとして端末装置30に送信する。
The
アプリデータサービス部11はアプリデータ管理部41を有している。アプリデータ管理部41は、企業などの顧客により購入されたアプリのアプリデータ43を顧客ごとに管理する。アプリデータ43は、例えば、アプリと上記の設定ファイルを対応付ける。アプリデータ43はアプリデータ記憶部13に記憶される。なお、データ出力システム100から見た顧客などの組織をテナントという。
The application
Webサービス処理部15は機器20に対し画面情報を提供したり、機器20からアプリの実行を受け付けたりする。Webサービス処理部15はアプリ実行部46と機器画面提供部47を有している。アプリ実行部46は機器20からのアプリの実行を受け付け、入出力処理部48に対しアプリの実行を要求する。機器画面提供部47は画面情報54を使って、アプリ一覧画面やアプリ画面の画面情報を機器20に提供する。
The web
入出力サービス部16は認証サービス部14、アプリ処理情報記憶部17及びコンポーネント18を使用してデータの入出力を行う。入出力サービス部16は入出力処理部48とアプリ管理部49を有している。入出力処理部48はアプリ実行部46から要求されたアプリを実行する。実行時に入出力処理部48は、アプリ処理情報53を参照しアプリに含まれる各処理をコンポーネント18に要求する。
The input/
アプリ管理部49は、アプリ処理情報記憶部17に記憶されている、アプリのアプリ処理情報53や画面情報54を管理する。アプリ処理情報53にはアプリがどの処理をどの順番で行うか(例えば、OCRの後に外部サービスシステム40に処理要求する等)が設定されている。画面情報54は各アプリのアイコン、アプリ一覧画面、及び各アプリ画面など、機器20が表示する画面の情報である。アプリ処理情報記憶部17にはアプリごとにアプリ処理情報53及び画面情報54が記憶されている。
The
認証サービス部14はユーザー(管理者8を含む)、及び、機器20の認証に関する処理を行う。認証サービス部14はユーザー管理部44とデバイス管理部45を有している。ユーザー管理部44はユーザーに関する情報を管理する。認証サービス部14は、例えば、ユーザー名やパスワード等の認証情報を保持する。また、認証情報には情報処理システム10のものと外部サービスシステム40のものとがある。デバイス管理部45は、テナントに対応付けられている機器20を管理する。つまり、テナントの識別情報と機器20を対応付けて管理しており、機器20が特定されるとテナントも特定される。
The
コンポーネント18は各処理を実際に行う個別の機能の総称である。コンポーネント18内の1つのブロックが1つの処理に対応する。コンポーネント18は例えば、認証処理部61、外部サービス処理部62、判断部63、PDF処理部64、領域検出部65、データ保存部66、領域特定部67、OCR処理部68、OCR補正部69、OMR処理部71、トリミング処理部72、及び、色検出部73を有している。
認証処理部61は認証サービス部14に対して認証に関する処理を依頼するコンポーネント18である。
The
外部サービス処理部62は、外部サービスシステム40に対して処理要求を依頼するコンポーネント18である。つまり、外部サービス処理部62は外部サービスシステム40と連携するための機能である。外部サービス処理部62は外部サービスシステム40の種類ごとに用意される。
The external
判断部63は各種の判断を行い、処理フローの分岐を制御する。PDF処理部64はPDFファイルに関する処理を行うものであり、例えばPDFファイルから画像データを取り出したり、透明テキスト付きのPDFファイルを作成したりする。機器20がPDFファイルの形式で画像データを送信するためである。
The
領域検出部65は、登録用紙の画像データから処理に対応付けられている印を検出する。また、領域検出部65は、帳票の画像データからマーカーペンなどでマーキングされた矩形領域を検出し、矩形領域の座標(領域情報)を作成する。 The area detection unit 65 detects marks associated with a process from the image data of the registration form. The area detection unit 65 also detects rectangular areas marked with a marker pen or the like from the image data of the form, and creates the coordinates of the rectangular areas (area information).
領域特定部67は領域情報に基づいて、帳票の画像データから処理対象領域を特定する。領域特定部67は特定した処理対象領域を取得する(例えば切り出してよい)。OCR処理部68は、領域のみ及び画像データの全体にOCR処理を行う。OCR補正部69はOCR処理結果を補正する。OMR処理部71は、領域にOMR処理を行う。トリミング処理部72は、領域にトリミング処理を行う。なお、コンポーネント18は、図示する以外に、翻訳等のコンポーネントを有していてよい。
The area identification unit 67 identifies the area to be processed from the image data of the form based on the area information. The area identification unit 67 acquires the identified area to be processed (for example, it may cut it out). The
データ保存部66は、色と処理を対応付け、更に、処理と領域情報を対応づけて設定ファイルに登録する。また、データ保存部66は、OCR処理部68、OMR処理部71、及び、トリミング処理部72が処理により生成した取得データ(帳票の領域から取得されたデータ)を含むファイルを出力する。
The data storage unit 66 associates colors with processes, and further associates processes with area information and registers them in a setting file. The data storage unit 66 also outputs a file including the acquired data (data acquired from areas of the form) generated by the
色検出部73は登録用紙に管理者8がマーカーペンで着色した色を検出する。
The
<外部サービスシステム>
外部サービスシステムは登録用紙5と設定ファイル9とを保持している。このうち、登録用紙5は予め登録されている。設定ファイル9は管理者8により登録される。
<External service system>
The external service system holds a
アプリ管理部49は、管理者8又はユーザーがログインすると、管理者8又はユーザーに利用権限が認められているアプリの一覧をアプリ処理情報記憶部17から取得して機器20に提供する。また、アプリ管理部49は、アプリの一覧からアプリが指定されると、アプリに対応付けられている画面情報とアプリ処理情報を特定する。
When the
なお、連携設定済みとは、ユーザーが外部サービスシステム40との連携を希望し、外部サービスシステム40の認証情報でログインできることが確認できたことをいう。ユーザーは設定サイトから外部サービスシステム40の認証情報を入力し、ログインできた場合に、表2(a)の外部サービスシステム情報に外部サービスシステムの識別情報が設定される。また、表2(b)に外部サービスシステム40の認証情報が登録される。
Note that "linkage setup completed" means that the user wishes to link with the
表2(b)は、各ユーザーの外部サービスシステムに関する情報であり、ユーザーID、外部サービスシステム40、ユーザーID、及び、パスワードの各項目を有している。表2(b)にはユーザーが連携設定した外部サービスシステム40の認証情報が登録される。外部サービスシステム40の認証情報はユーザーが外部サービスシステム40にログインするための認証情報である。U002のユーザーのように、外部サービスシステム40ごとに認証情報が異なっている場合もある。このため、データ出力システム100のユーザーごとに、外部サービスシステム40の認証情報が関連付けられている。情報処理システム10は、機器20から取得した情報処理システム10のユーザーID、パスワード等の認証情報に応じて、連携先の外部サービスシステム40の認証情報を特定する。
Table 2(b) is information about the external service system for each user, and has the following fields: user ID,
また、認証情報は外部サービスシステム40の認証情報、又は、外部サービスシステム40と連携するために必要な認証情報であればよく、ユーザーIDやパスワード以外に、外部サービスシステム40との連携設定時に外部サービスシステム40から取得したトークン等でも良い。
The authentication information may be authentication information of the
表2(c)は、共有アプリ用の認証情報である。共有アプリの識別情報に外部サービスシステム40と認証情報が対応づけられている。共有アプリの認証情報は管理者8のものが使用されるので、管理者8の識別情報が登録されている。
Table 2 (c) shows authentication information for a shared app. The identification information of the shared app is associated with the
・applicationIdは、連携元のアプリIDである。
・applicationNameは、アプリのアプリ名である。
・fileIdは、情報処理システム10が作成した設定ファイルの識別情報である。
・fileNameは、情報処理システム10が作成した設定ファイルのファイル名である。設定ファイルは外部サービスシステム40に保存されるが、そのフォルダと共にファイル名が設定される。保存先は例えばURLで特定されてよい。
・アップロード先フォルダは、設定ファイルが保存される外部サービスシステム40とそのフォルダである。アップロード先フォルダは、例えばURLでよい。管理者8がアップロード先フォルダを設定する。
・applicationId is the application ID of the link source.
・applicationName is the app name of the app.
fileId is identification information of the setting file created by the
fileName is the file name of the setting file created by the
The upload destination folder is the
・IDは、領域情報の識別情報である。自動的に採番され、管理者8やユーザーが意識する必要はない。
- The ID is identification information for the area information. It is assigned automatically and the
・マーカー色は、登録用紙から読み取られたセル(図13に示す)の色である(処理の内容を識別する識別情報の一例)。セルの色は例えばHSV色空間で登録される。HSV色空間の「H」(hue)は色相と呼ばれ「色合い」を示す。「H」の範囲は0-360度である。「S」(saturation)は彩度で「鮮やかさ」を示す。「S」の範囲は0-100%である。「V」(Value)は明度で「明るさ」を示す。「V」の範囲は0-100%である。なお、マーカー色を表す色空間はHSB、RGB、Lab、XYZ等でもよい。 The marker color is the color of the cell (shown in Figure 13) read from the registration form (an example of identification information that identifies the contents of the process). The cell color is registered, for example, in the HSV color space. "H" (hue) in the HSV color space is called hue and indicates "color tone." The range of "H" is 0-360 degrees. "S" (saturation) is saturation and indicates "vividness." The range of "S" is 0-100%. "V" (Value) is luminosity and indicates "brightness." The range of "V" is 0-100%. The color space representing the marker color may be HSB, RGB, Lab, XYZ, etc.
・処理は、登録用紙でセルに対応付けられていた処理の内容である。処理は、例えば、OCR,OMR、及び、トリミングであるが、翻訳、マスキング(ベタ塗り)、暗号化、など種々の処理があってよい。 The process is the content of the process that was associated with the cell on the registration form. Examples of processes are OCR, OMR, and trimming, but various other processes such as translation, masking (filling in), and encryption may also be included.
・始点X座標、始点Y座標、終点X座標、終点Y座標は、領域情報である。これらは、マーキングされた帳票の矩形領域の対角頂点を表す。1点の座標と幅と高さが指定されてもよい。座標の単位は例えばcm、ピクセルなどでよい。 The start point X coordinate, start point Y coordinate, end point X coordinate, and end point Y coordinate are area information. These represent the diagonal vertices of the rectangular area of the marked document. The coordinates of one point, the width, and the height may be specified. The coordinate units may be, for example, cm or pixels.
以上の情報が、情報処理システム10が自動的に設定する情報となる。以下の情報は、管理者8が入力する。
The above information is automatically set by the
・フォーマットは、領域のデータ形式である。例えば、テキスト、Y/N、イメージの他、日付(YYYY/MM/DD)、数値(NUMERIC)などがある。データのフォーマットがわかるので、OCR処理部68がより高精度にOCR処理することができる。フォーマットはプルダウンメニューになっている。このように領域ごとにデータの種類が設定される。
- The format is the data format of the area. Examples include text, Y/N, image, date (YYYY/MM/DD), and numeric values (NUMERIC). By knowing the data format, the
・CSV列名は、領域に付与された名称である。帳票の場合は、矩形枠のタイトルなどが入力されるが、管理者8が任意の値を入力できる。CSV列名(CSV位置が指定されている場合)はデータと共にファイルに出力される。
- The CSV column name is the name given to the area. In the case of a report, a rectangular frame title or the like is entered, but the
・CSV位置(列)は、領域から抽出されたデータを情報処理システム10がファイルのどの列に書き込むかを指定する。
- CSV position (column) specifies which column of the file the
・CSV位置(開始行)は、領域から抽出されたデータを情報処理システム10がファイルのどの行に書き込むかを指定する。行番号は帳票の読み取りのたびに大きくなるため、ファイルに1つもデータが記載されていない場合の「開始行」が設定される。例えば、最初の帳票から取得されたデータは2行目に設定されるが、2枚目の帳票から取得されたデータは3行目に設定される。これに対し列位置は固定でよい。
- The CSV position (start row) specifies which row of the file the
・OCR言語は、領域がどの言語で記述されているかが設定される。言語がわかるので、OCR処理部68がより高精度にOCR処理することができる。OCR言語はプルダウンメニューになっている。このように領域ごとにデータの種類が設定される。
- The OCR language is set to the language in which the area is written. Since the language is known, the
・ファイル名に使う順序は、本実施形態では領域から取得されたデータが出力されるファイルのファイル名に使用される。ファイル名に使う順序は、情報処理システム10が出力するファイルのファイル名に使用されるデータの順番である。例えば、「書類名」が1番の場合、ファイル名は書類名の領域から取得されたデータ(経費精算書)により、「経費精算書.csv」となる。
- In this embodiment, the order used in the file name is used in the file name of the file in which the data obtained from the area is output. The order used in the file name is the order in which the data is used in the file name of the file output by the
<アプリ処理情報>
次に、図11を用いて、アプリ処理情報の詳細について説明する。図11は、アプリ処理情報記憶部17に記憶されているアプリ処理情報53の一例を示す図である。
<Application processing information>
Next, details of the application processing information will be described with reference to Fig. 11. Fig. 11 is a diagram showing an example of the
図11に示すアプリ処理情報53は、機器20でスキャンして生成された画像データを「外部サービスシステムB」に処理要求するサービスを実現するための一連の処理に関する情報である。
The
アプリ処理情報53には、当該アプリ処理情報53の識別情報を示すフローID1201Aと、当該アプリ処理情報53の名称を示すフロー名1202Aと、一連の処理の処理内容を示すフロー詳細1203Aとが含まれる。フロー名1202Aはアプリの名称を兼ねている。
The
また、フロー詳細1203Aには、「外部サービスシステムB」に処理要求することを示す処理内容1223Aが含まれる。
Furthermore, flow
処理内容1223Aでは、「外部サービスシステムB」と連携した処理を実行するコンポーネント18のコンポーネントID「ExService_B」、及び、パラメータ「AppId」「Folder」が指定されている。「ExService_B」は外部サービスシステムBのための外部サービス処理部62に相当する。「AppId」には連携先アプリIDが格納され(アプリと連携先アプリの対応は予め決まっている)、「Folder」にはファイルの保存先のフォルダ(アップロード先フォルダ)が格納される(管理者8が設定したアップロード先フォルダが設定される)。これにより、情報処理システム10はスキャンされた画像データを「外部サービスシステムB」に保存することができる。
In the
なお、また、連携先アプリと連携しないアプリの場合、「AppId」が省略される。図示したパラメータは一部であって、アプリ処理情報はより多くのパラメータを含みうる。 Note that for apps that do not link with a linked app, "AppId" is omitted. The parameters shown in the figure are only a partial list, and the app processing information may include many more parameters.
図11では、説明を簡単にするため、1つのコンポーネントのみ指定されているが、アプリ処理情報53には、アプリが行う一連の処理内容1223Aが処理(コンポーネント)の数だけ登録されている。
In FIG. 11, for simplicity, only one component is specified, but the
図12は、アプリが行う一連の処理を模式的に示す図である。図12(a)は設定ファイルにマーカー色と処理の対応を登録するアプリ(後述する色登録ボタン112に対応するアプリ)の一連の処理を示す。1つのブロックが処理内容1223Aに対応する。各処理の詳細は図15にて説明する。
Figure 12 is a diagram showing a schematic of a series of processes performed by an app. Figure 12(a) shows a series of processes of an app that registers the correspondence between marker colors and processes in a settings file (an app corresponding to
図12(b)は設定ファイルのマーカー色と処理に領域情報を登録するアプリ(後述する帳票登録ボタン113に対応するアプリ)の一連の処理を示す。各処理の詳細は図25にて説明する。
Figure 12(b) shows a series of processes in an application that registers area information in the marker color and processing of the setting file (the application that corresponds to the
図12(c)は帳票の領域からデータを出力するアプリ(例えば、経費精算書アプリ)の一連の処理を示す。各処理の詳細は図37にて説明する。 Figure 12(c) shows a series of processes in an application that outputs data from a form area (e.g., an expense report application). Details of each process are explained in Figure 37.
<色と処理の対応の設定ファイルへの登録>
次に、図13~図20を参照して、管理者8による色と処理の対応の設定、及び、設定ファイルの作成について説明する。
<Registering the correspondence between colors and processing in the configuration file>
Next, the setting of the correspondence between colors and processes by the
図13は、登録用紙を用いた色と処理の対応の設定方法を説明する図である。図13(a)は管理者8がマーカーペンで着色する前の登録用紙である。登録用紙の原紙は外部サービスシステム40に登録されている。
Figure 13 is a diagram explaining how to set the correspondence between colors and processes using a registration form. Figure 13 (a) shows the registration form before the
登録用紙の1行目には各列の項目(1列目:マーカー色、2列目:処理)が記載されている。なお、本実施例では「処理」は3種類(OCR・OMR・トリミング)あり、登録用紙には、2行目:OCR、3行目:OMR、4行目:トリミングの順に予め処理が設定されている。原始の状態の登録用紙のマーカー色のセル130は空欄である。
The first line of the registration form lists the items for each column (first column: marker color, second column: processing). In this embodiment, there are three types of "processing" (OCR, OMR, trimming), and the registration form is preset with the following processing in the order of second line: OCR, third line: OMR, fourth line: trimming. The
図13(b)は各処理に対し、管理者8がセル130にマーカーペンで着色した図である。管理者8は、所有しているマーカーペンのうち、例えば、緑、青、赤のマーカーペンを使用することとする。管理者8が、OCR処理には緑、OMR処理には青、トリミング処理には赤を割り当てる。登録用紙の原紙の行間には、各色が滲むことで混色を起こさないように、所定の間隔が設けられている。
Figure 13(b) shows the
管理者8は、自ら決定した所望のマーカー色と各処理との割り当てにしたがって、所有しているマーカーペンで登録用紙のセル130を着色する。登録用紙を機器20がスキャンすることで、マーカー色と処理の対応が情報処理システム10に登録される。
The
また、図13ではセル130が塗り潰されているが、セル130には何らかの印が設定されていればよい。例えば、三角形や丸などの記号、アルファベット、囲い線等がセル130に形成されている場合、情報処理システム10はこれらの印と処理を設定ファイルに登録する。この場合、情報処理システム10は印の色を考慮してもしなくてもよい。
In addition, in FIG. 13, the
なお、管理者8はマーカーペンでセル130を塗り潰すのでなく、「緑又はG」「青又はB」「赤又はR」など、文字や記号でマーカー色を指示してもよい。この場合、情報処理システムは文字認識により、マーカー色と処理の内容とを対応付ける。
In addition, instead of filling in the
また、端末装置30を情報処理システム10に接続させ、端末装置30が表示したWebページに対し、管理者8が文字等で色を入力してもよい。
In addition, the
更に、登録用紙そのものを管理者8が登録できてよい。端末装置30を情報処理システム10に接続させ、端末装置30が表示したWebページに対し、管理者8が処理の内容を登録し図13(a)のような登録用紙を作成する。
Furthermore, the
<機器の画面例>
図14は、管理者8が機器20にログインすることで表示される管理者画面110の一例である。管理者画面110は、管理者メニュー118と一般ユーザーメニュー119を有している。管理者メニュー118は、管理者8が設定ファイルを登録するためのメニューである。一般メニューは管理者8がユーザーとして使用できるアプリのリストである。
<Device screen example>
14 is an example of an
管理者メニュー118の登録用紙ボタン111は、管理者8が登録用紙を印刷するためのボタンである。色登録ボタン112は管理者8が機器20に登録用紙をスキャンさせ、マーカー色と処理の対応を設定ファイルに登録するためのボタンである。帳票登録ボタン113は管理者8がマーキングされた帳票を機器20にスキャンさせ、処理と領域情報の対応を設定ファイルに登録するためのボタンである。
The
なお、登録用紙ボタン111、色登録ボタン112、及び、帳票登録ボタン113はそれぞれWebアプリであり、管理者8はWebアプリにしたがって作業することで、設定ファイルを登録できる。
Note that the
管理者メニュー118の登録用紙ボタン111を押下すると、機器20が登録用紙を表示する。管理者8は登録用紙を印刷しマーカーペンで着色する。次に、管理者8が管理者メニュー118の色登録ボタン112を押下し、マーカーペンで着色した登録用紙のスキャンを実行すると、登録用紙の画像データが情報処理システム10に送信される。情報処理システム10は設定ファイルにマーカー色と処理の対応を登録する。
When the
次に、管理者8が、管理者メニュー118の帳票登録ボタン113を押下し、マーカーペンで着色した帳票の原紙を機器20でスキャンする。帳票の画像データが情報処理システム10に送信され、情報処理システム10は処理と領域情報の対応を設定ファイルに登録する。
Next, the
なお、帳票登録ボタン113の押下により、機器20が情報処理システム10から受信したマーカー色と処理の対応を表示するとよい。例えば、機器20は、図13(b)のような情報を操作パネルに表示する。色と処理の対応付けを変更したい場合、管理者8は、操作パネル上の上下ボタン114を押下する。機器20は上下ボタン114が押下されるごとに処理の列を1行ずつずらす。こうすることで、管理者8が色と処理の対応付けを変更できる。
When the
ユーザーとしての管理者8が一般ユーザーメニュー119のアプリを押下すると、アプリが起動する。ユーザーが記入済み帳票を機器20でスキャンすると、設定ファイルの領域情報で特定される領域に対応付けられている処理を、情報処理システムが各領域に実行する。
When the
図15は、管理者8が登録用紙を使って、色と処理の対応を設定ファイルに登録する手順を示すシーケンス図の一例である。
Figure 15 is an example of a sequence diagram showing the procedure for an
S1:管理者8は機器20を操作して情報処理システム10にログインし、管理者メニュー118から登録用紙ボタン111を押下する。
S1: The
S2:機器20の第二通信部21は、登録用紙ボタン111に対応するアプリの実行要求を情報処理システム10に送信する。
S2: The
S3:情報処理システム10の通信部19はアプリの実行要求を受信する。アプリ実行部46は登録用紙ボタン111に対応するアプリのアプリIDを指定して実行を入出力処理部48に要求する。入出力処理部48は登録用紙ボタン111に対応するアプリのアプリIDに対応づけられているアプリ処理情報53を参照して、アプリを実行する。まず、入出力処理部48は登録用紙のリストを外部サービス処理部62に要求する。
S3: The
S4:外部サービス処理部62は、管理者8の認証情報を使用して外部サービスシステム40と通信し、管理者8が使用できる登録用紙のリストを要求する。
S4: The external
S5:機器20の第二通信部21は登録用紙のリストを受信するので、表示制御部22が登録用紙のリストを表示する。管理者8は実行したい処理が登録されている登録用紙を選択する。操作受付部23が登録用紙の選択を受け付ける。登録用紙が1種類しかない場合、ユーザーは選択でなく印刷を指示すればよい。
S5: The
S6:機器20の出力部27は管理者8が選択した登録用紙を印刷する。なお、シーケンス図では、機器20が登録用紙を外部サービスシステム40から取得する処理は省略した。この登録用紙には、登録用紙の識別情報又は着色されるセル130の位置情報がバーコードなどで形成されているとよい。詳細は図16にて説明する。
S6: The
S7:管理者8は印刷された登録用紙の処理に対応付けられているセル130をマーカーペンで着色する。そして、管理者8は管理者メニュー118から色登録ボタン112を押下する。
S7: The
S8:機器20の操作受付部23が色登録ボタン112の実行を受け付け、画像データ生成部24が登録用紙をスキャンしてPDFファイルを生成する。
S8: The
S9:機器20の第二通信部21は、PDFファイルと色登録ボタン112に対応するアプリの実行要求を情報処理システム10に送信する。
S9: The
S10:情報処理システム10の通信部19はPDFファイルを受信する。アプリ実行部46は色登録ボタン112に対応するアプリのアプリIDを指定して実行を入出力処理部48に要求する。入出力処理部48は色登録ボタン112に対応するアプリのアプリIDに対応づけられているアプリ処理情報53を参照して、アプリを実行する。まず、入出力処理部48はPDFファイルを指定してPDF処理部64に画像データの抽出を要求する。PDF処理部64はPDFファイルから登録用紙の画像データを抽出する。
S10: The
S11:次に、入出力処理部48は画像データを色検出部73に送信し、色と処理の対応の検出を要求する。
S11: Next, the input/output processing unit 48 sends the image data to the
S12:色検出部73は、画像データの予め決まっているセル130から色情報を検出する。
S12: The
図16は、色情報の検出を模式的に示す。登録用紙には向きを示すバーコード101が左上などの角に形成されており、色検出部73はバーコード101が左上に来るように画像データを回転する。その上で、色検出部73は処理ごとに予め決まっているセル130(位置が決まっている)から色情報を検出する。
Figure 16 shows a schematic diagram of the detection of color information. A
図16(a)に示すように、OCRの処理は対角を示す2つの位置座標AB(位置情報の一例)の矩形内の色により決定され、OMRの処理は同じく位置座標CDの矩形内の色により決定され、トリミングの処理は位置座標EFの矩形内の色により決定される。このような位置座標AB、CD,EFと処理の対応は、バーコード101に保存しておく方法と、アプリデータ管理部41が保持しておく方法(この場合もバーコード101には少なくとも登録用紙の識別情報が含まれているとよいが、登録用紙の1種類しかない場合、識別情報はなくてもよい)がある。
As shown in FIG. 16(a), OCR processing is determined by the colors within a rectangle at two diagonal position coordinates AB (an example of position information), OMR processing is determined by the colors within a rectangle at position coordinate CD, and trimming processing is determined by the colors within a rectangle at position coordinate EF. The correspondence between such position coordinates AB, CD, and EF and processing can be stored in the
図16(b)に示すように、バーコード101又はアプリデータ管理部41は処理と着色されるセル130の位置座標を対応付けて保持している。色検出部73はHSVのHの値を図16(b)の位置座標に基づいて、各セル130からそれぞれ取得する。トリミングに対応付けられているセル130から赤に対応する色(H=(0~60°,301~360°))が検出された場合、色検出部73はHSVでH=(0~60°,301~360°)をトリミングと対応付けて設定ファイルに登録する。OCRに対応付けられているセル130から緑に対応する色(H=(61~180°))が検出された場合、色検出部73はH=(61~180°)をOCRと対応付けて設定ファイルに登録する。OMRに対応付けられているセル130から青に対応する色(H=(181~300°))が検出された場合、色検出部73はH=(181~300°)をOMRと対応付けて設定ファイルに登録する。このように赤、青、緑のH値の全域を登録するのでなく、検出されたH値に±10%などのマージンを設けた色(Hの値)を色検出部73が設定ファイルに登録してもよい。
As shown in FIG. 16B, the
なお、色と処理を対応付ける方法には、図4で説明した管理サイト150を管理者が使用する方法もある。管理サイト150を使用した設定のシーケンスは以下のようになる。通信部19は端末装置30に、管理サイト150の画面情報を送信し、端末装置30が受け付けた印と処理の対応を受信する。データ保存部66は、処理と印を対応付けて設定ファイルに保存する。
Associating colors with processes also involves an administrator using the
S13:図15に戻って説明する。アプリ実行部46は色と処理の対応を色検出部73から取得する。アプリ実行部46は色と処理の対応をデータ保存部66に送信し、設定ファイルの生成を要求する。データ保存部66はIDを採番し、マーカー色と処理が対応付けられた設定ファイルを作成する。データ保存部66は設定ファイルをアプリ実行部46に送信する。この時点では表4のA~C列に情報が入った状態となる。なお、マーカー色と処理の対応は設定ファイルでなく別の独立したファイルに保存されてよい。
S13: Returning to FIG. 15, the explanation will be given. The
S14,S15:アプリ実行部46は外部サービス処理部62を介して設定ファイルを外部サービスシステム40に送信する。外部サービス処理部62は、管理者8の外部サービスシステム40における認証情報をユーザー管理部44から取得する。これにより、外部サービス処理部62は外部サービスシステム40にログインし、管理者8のトップフォルダ(又は、管理者8が指定したフォルダ)に設定ファイルを保存する。管理者8が設定ファイルのファイル名を指定した場合、外部サービス処理部62はこのファイル名を設定ファイルのファイルに付与する。ファイル名が設定されていない場合、現在の日時などがファイル名となる。
S14, S15: The
以上で、マーカー色と処理が対応付けられている設定ファイルが外部サービスシステム40に登録された。
With this, the configuration file in which the marker color and the process are associated has been registered in the
<<処理によるファイル名の指定>>
本実施形態では、取得データが格納されるCSVファイルのファイル名を、管理者8が設定するとして説明するが、登録用紙への着色により管理者8がCSVファイルのファイル名を設定できる。
<<Specifying file name by process>>
In this embodiment, the file name of the CSV file in which the acquired data is stored is set by the
図17は、処理をファイル名の設定に応用した登録用紙の使用例を示す。図17では処理をOCRに限定し、複数の個所の取得データをデータ保存部66がファイル名に使用することを可能にする。管理者8は、ファイル名に指定するマーカーペンの色で登録用紙に着色する。図17(a)の登録用紙は処理としてOCRと、ファイル名に使用する順番「ファイル名1」「ファイル名2」が設定されている。
Figure 17 shows an example of the use of a registration form where processing is applied to setting file names. In Figure 17, processing is limited to OCR, making it possible for the data storage unit 66 to use acquired data from multiple locations for the file name. The
図17(b)に示すように、管理者8はファイル名1に使用するマーカーペンの色(例えば緑)、ファイル名2に使用するマーカーペンの色(例えば青)をマーカーペンで指定する。
As shown in FIG. 17(b), the
図17(c)に示すように、色を示す数値と処理(ファイル名に使用)が設定ファイルに対応付けられる。色と処理の対応付けには、2つの方法が考えられる。 As shown in Figure 17 (c), a numerical value indicating a color and a process (used in the file name) are associated with a configuration file. There are two possible ways to associate a color with a process.
1:色を取得してくる座標(登録用紙内の)とその座標からとってきた処理とを紐づけるか情報を情報処理システム側が事前にもっておく。
・座標(X座標:100, 200 Y座標:1, 50)で抽出した色はファイル名1
・座標(X座標:100, 200 Y座標:51, 100)で抽出した色はファイル名2
1: The information processing system has in advance information on how to link the coordinates (within the registration form) from which the color is obtained with the processing obtained from those coordinates.
・The color extracted at coordinates (X coordinates: 100, 200 Y coordinates: 1, 50) is
・The color extracted at coordinates (X coordinates: 100, 200 Y coordinates: 51, 100) is
2:管理者が管理サイト上で色と処理を紐づけする。
図18は、色と処理を対応付けるための管理サイト152の一例である。管理者はラジオボタン153でファイル名の指定に使用する色を登録できる。この場合、ユーザーが使用するマーカーペンの色が3つに限られる。
2: The administrator links colors and processes on the management site.
18 shows an example of an
いずれの方法でも、図17(c)に示すように、マーカー色(緑)を識別する数値とファイル名1が対応付けられる。マーカー色(青)を識別する数値とファイル名2が対応付けられている。なお、ファイル名1,2はファイル名に使用される順番である。
In either method, as shown in FIG. 17(c), the numeric value identifying the marker color (green) is associated with
図19は、管理者8がマーカーペンで2か所に領域指定した帳票の一例である。図19(a)は帳票の原紙を、図19(b)はマーカーペンで着色された帳票である。機器20が図19(b)の帳票をスキャンすることで、情報処理システム10が帳票における着色領域を特定し、設定ファイルに領域情報を登録する。
Figure 19 shows an example of a form on which the
図19(b)では、帳票のタイトルである「経費精算書」の領域が緑のマーカーペンで領域指定され、申請日の領域が青のマーカーペンで領域指定されている。例えば、申請日が「2020/10/10」だとすると、図19(b)の帳票を機器がスキャンした場合のCSVファイルのファイル名は「経費精算書20201010.csv」となる。なお、ファイル名に指定されるマーカーペンの色は3つ以上でもよい。 In Figure 19 (b), the area for the report title, "Expense Report," is marked with a green marker pen, and the area for the application date is marked with a blue marker pen. For example, if the application date is "2020/10/10," the file name of the CSV file when the device scans the report in Figure 19 (b) will be "Expense Report 20201010.csv." Note that three or more marker pen colors may be specified in the file name.
また、必ずしもファイル名に使用する領域の順番(ファイル1,2)までは登録しなくてもよい。この場合、データ保存部66は設定ファイルにおける色の登録順にファイル名を設定すればよい。したがって、登録用紙のセルごとにマーカーペンの色を変えなくてもよい。
Also, it is not necessary to register the order of the areas used in the file names (
<<登録用紙の変形例>>
図20に示すように登録用紙に予めCSV位置が登録されていてもよい。図20は、登録用紙の変形例を示す図である。図20(a)は着色前の登録用紙である。この登録用紙にはCSV列名154とCSV位置155の列があるので、管理者が設定ファイルに手でCSV位置を設定する必要がない。
<<Modifications of the registration form>>
The CSV location may be registered in advance in the registration form as shown in Fig. 20. Fig. 20 shows a modified example of the registration form. Fig. 20(a) shows the registration form before coloring. This registration form has columns for
図20(b)は着色後の登録用紙である。図20(b)の登録用紙を機器20がスキャンする。
Figure 20(b) shows the registration form after coloring. The registration form in Figure 20(b) is scanned by
図20(c)は色と処理と領域情報が対応付けられた設定ファイルの一部である。 Figure 20 (c) shows a portion of a settings file in which color, processing, and area information are associated.
<領域情報の登録>
続いて、図21等を参照し、領域情報の登録について説明する。図21は、帳票における領域のマーキング方法を説明する図である。まず、図21(a)は、マーカーペンで領域指定する前の帳票(原紙)である。帳票の原紙に対し、管理者8は、登録用紙で登録した処理を実行させたい領域に登録した色のマーカーペンで領域指定を行う。例えば、管理者8は、タイトルの領域140をOCRに、事前申請の領域141をOMRに、備考の領域142をトリミングに設定したいとする。
<Registration of area information>
Next, the registration of area information will be described with reference to FIG. 21 and the like. FIG. 21 is a diagram for explaining a method of marking an area on a form. First, FIG. 21(a) shows a form (original paper) before an area is designated with a marker pen. On the original paper of the form, the
図21(b)はマーカーペンで領域に着色された帳票用紙である。帳票のタイトルである「経費精算書」の領域140が緑のマーカーペンで着色されている。「事前申請」の領域141が青のマーカーペンで着色されている。帳票下部の「備考」の領域142が赤のマーカーペンで着色されている。この帳票用紙を機器20がスキャンすることで、帳票に対する領域と処理の関連が、設定ファイルに登録される。
Figure 21 (b) shows a form with areas colored with a marker pen.
表4の設定ファイルによれば、OCR処理部68は帳票のタイトルである「経費精算書」の領域140をOCR処理して、取得データを生成する。また、OMR処理部71は、「事前申請」の領域141にOMR処理を行い、取得データを生成する。トリミング処理部72は備考の領域142にトリミングを行い、取得データ(例えば「申請が遅れて申し訳ありません。」)を生成する。トリミングされた取得データは画像データ(JPEG、GIF、PNG、TIFF、BMPなど)である。
According to the configuration file in Table 4, the
図21(c)は、ユーザーが必要事項を記入した帳票の一例である。図21(b)の着色状態から、「経費精算書」、「事前申請すること」、及び「申請が遅れて申し訳ございません。」が取得データとなる。 Figure 21 (c) is an example of a form on which the user has filled in the necessary information. From the colored state in Figure 21 (b), the acquired data are "Expense report," "Please apply in advance," and "Sorry for the late application."
また、図22(a)に示すように領域が塗り潰されなくてもよい。図22(a)ではマーカーペンで領域を囲む枠線602が形成されている。領域検出部65は白黒以外の画素を検出し、白黒以外の画素(枠線602)の外接矩形を検出する。
Also, the area does not have to be filled in as shown in FIG. 22(a). In FIG. 22(a), a
なお、領域のマーキング方法は図21又は図22に示す方法には限られない。例えば、二重線で領域が指定されてもよいし、所定の記号(%、$、#、△等)で囲まれた範囲で領域が指定されてもよい。 The method of marking an area is not limited to the method shown in FIG. 21 or FIG. 22. For example, an area may be designated by a double line, or an area may be designated by a range surrounded by a predetermined symbol (%, $, #, △, etc.).
また、図22(b)に示すように、1つの帳票に同じ色で着色された複数の領域があってもよい。例えば、図22(b)のように管理者8が帳票へのデータの領域143を緑のマーカーペンで領域指定すると、全ての領域143がOCR処理の対象となる。
Also, as shown in FIG. 22(b), a single form may have multiple areas colored with the same color. For example, as shown in FIG. 22(b), when the
次に、管理者8が図14の帳票登録ボタン113を押下したものとする。管理者8は機器20から情報処理システム10にログインして帳票登録ボタン113を選択する。
Next, it is assumed that the
図23を参照して、管理者が領域を塗り潰すことで領域を指定することの効果について説明する。図23は、帳票における領域の指定方法の比較例を示す。 The effect of an administrator specifying an area by filling it in will be described with reference to Figure 23. Figure 23 shows a comparative example of a method for specifying an area on a form.
図23(a)は、管理者がマーカーペンで領域を着色し、同じ領域の中に△マーク161を手書きする指定方法である。しかし、この方法は二度手間となる。
Figure 23(a) shows a method of designating an area in which the administrator colors the area with a marker pen and then handwrites a
図23(b)は、管理者がマーカーペンで領域を囲むように△マーク162を手書きする指定方法である。しかし、この方法は、領域が完全には定まらないため、情報処理システム10が△マーク162を認識した後に、領域の矩形を認識する必要があるなど、領域の認識処理が複雑になる。
Figure 23 (b) shows a method of designation in which the administrator handwrites a
これに対し、マーキングペンで領域を着色する(塗り潰す)ことで、管理者は「領域の指定」と「処理の指定」を一度に簡単にできる。
・領域の指定 → 形・・・主に矩形
・処理の指定 → 形以外・・・色
In contrast, by coloring (filling in) an area with a marking pen, the administrator can easily "designate the area" and "designate the process" at the same time.
・Area specification → Shape... Mainly rectangle ・Processing specification → Other than shape... Color
<領域登録画面>
図24は、領域情報の登録時に機器20が表示する領域登録画面610の一例である。領域登録画面610は、「処理したい領域を着色した帳票をセットして「スタート」を押してください」というメッセージ611、読み取り設定欄612、及び、スタートボタン613を有している。ユーザーは原稿(帳票)をコンタクトガラスにセットして、スタートボタン613を押下する。ユーザーは、必要に応じて読み取り設定欄612で読み取り条件(カラー/白黒、片面/両面、向き、解像度等)を設定してもよい。なお、カラー/白黒に関してはユーザーが誤って白黒に設定しないように、カラーに固定されているとよい。
<Area registration screen>
24 is an example of an
なお、図24の領域登録画面610から管理者8が設定ファイルのファイル名を指定できるとよい。これは、外部サービスシステム40から設定ファイルを探しやすくするためである。また、設定ファイルの保存先のフォルダを管理者8が設定できるとよい。
It is preferable that the
図25は、管理者8が領域をマーキングした帳票から情報処理システム10が領域情報を取得して、設定ファイルを作成する手順を示すシーケンス図の一例である。
Figure 25 is an example of a sequence diagram showing the procedure in which the
S101:管理者8は機器20を操作して情報処理システム10にログインし、管理者メニュー118から帳票登録ボタン113を押下する。これにより、機器20の表示制御部22は領域登録画面610を表示する。管理者8は領域をマーキングした帳票をコンタクトガラスに設置してスタートボタン613を押下する。画像データ生成部24は帳票の画像データを生成し、PDFファイルに変換する。
S101: The
S102:機器20の第二通信部21は、帳票登録ボタン113に対応するアプリの実行要求と共にPDFファイルを情報処理システム10に送信する。
S102: The
S103:情報処理システム10の通信部19はPDFファイルを受信する。アプリ実行部46は帳票登録ボタン113に対応するアプリのアプリIDを指定して実行を入出力処理部48に要求する。入出力処理部48は帳票登録ボタン113に対応するアプリのアプリIDに対応づけられているアプリ処理情報53を参照して、アプリを実行する。まず、入出力処理部48はPDFファイルを指定してPDF処理部64に画像データの抽出を要求する。PDF処理部64はPDFファイルから帳票の画像データを抽出する。
S103: The
S104:アプリ実行部46は画像データから抽出すべき色を決定するため、設定ファイルを外部サービス処理部62に要求する。
S104: The
S105:外部サービス処理部62は管理者8の認証情報で取得できる設定ファイルを外部サービスシステム40から取得する。なお、管理者8が設定ファイルのリストから所望の設定ファイルを選択してもよい。
S105: The external
S106:次に、入出力処理部48は画像データと設定ファイルに登録されているマーカー色を指定して、領域の取得を領域検出部65に要求する。領域検出部65は、画像データの色に基づいて画像データから領域を取得する。 S106: Next, the input/output processing unit 48 requests the area detection unit 65 to acquire an area by specifying the image data and the marker color registered in the setting file. The area detection unit 65 acquires an area from the image data based on the color of the image data.
図26は画像データからの領域の検出を説明する図である。図26(a)に示すように、マーカーペンで指定された色付着部601は、マーカーペンに応じた色を有している。例えば、HSV色空間で赤の範囲はH=(0~60°,301~360°)、緑の範囲はH=(61~180°)、青の範囲はH=(181~300°)である。
Figure 26 is a diagram explaining the detection of an area from image data. As shown in Figure 26 (a), a color-applied
領域検出部65は、例えば、設定ファイルのマーカー色のHの範囲に含まれる色を画像データから探す。なお、領域検出部65は、着色された領域が一定面積以上連続している領域のみを検出する。これによりユーザーが間違って着色した部分を検出しないですむ。 The area detection unit 65 searches the image data for colors that are included in the range of the marker color H in the setting file, for example. Note that the area detection unit 65 only detects areas where the colored area is continuous and has a certain area or more. This prevents the detection of parts that have been colored by the user by mistake.
図26(b)は検出された色付着部601を示す。領域検出部65は検出した色付着部601の外接矩形620を設定する。そして、領域検出部65は、外接矩形620の上下左右にマージンを設定し、マージンを含む領域621を決定する。図26(b)では、左右にa〔mm〕、上下にb〔mm〕が設定されている。マージンを設定するのは、機器20が帳票を読み取る場合に位置ずれなどを起こすためである。図26(b)の左上コーナー622の座標が領域情報の始点X座標と始点Y座標であり、右下コーナー623の座標が領域情報の終点X座標と終点Y座標(領域情報)である。
Figure 26(b) shows the detected
また、図26(c)に示すように、領域検出部65はHSVのHに基づいて検出された色付着部601の外側の枠線625を検出してもよい。領域検出部65は、色付着部601(外接矩形620)の垂直方向外側に向けて黒画素を探索し、黒画素が見つかった場合は黒画素をたどり、元の位置に戻った場合に、外側の枠線625を検出したと判断する。こうすることで、データが記入される最大の領域を検出でき、機器20が帳票を読み取る場合に位置ずれなどを起こしても領域特定部67がデータを特定しやすくなる。
Also, as shown in FIG. 26(c), the area detection unit 65 may detect the
なお、マーカーペンで特定される領域に対し領域検出部65がどのくらいマージンを設けるか等を、管理者8が設定しておくことができる。詳細は図31の対応付け画面640-2にて説明する。領域検出部65は対応付け画面640-2の設定に基づいて領域情報を設定する。
The
S107:図25に戻って説明する。次に、入出力処理部48は、マーカーペンで領域が指定された画像データを指定して外部サービス処理部62に外部サービスシステム40へのアップロードを要求する。
S107: Let's go back to Figure 25. Next, the input/output processing unit 48 specifies the image data in which the area is designated with the marker pen, and requests the external
S108:外部サービス処理部62は、管理者8の外部サービスシステム40における認証情報をユーザー管理部44から取得する。これにより、外部サービス処理部62は外部サービスシステム40にログインし、管理者8のトップフォルダ(又は、管理者8が指定したフォルダ)に画像データを保存する。領域登録画面610で管理者8が設定ファイルのファイル名を指定した場合、外部サービス処理部62は同じファイル名を画像データのファイルに付与する。ファイル名が設定されていない場合、現在の日時などがファイル名となる。
S108: The external
S109:次に、入出力処理部48は、領域検出部65が検出した領域情報を指定し、データ保存部66に設定ファイルの作成を要求する。データ保存部66は、領域情報をCSVファイルの決まった列に配置して、設定ファイルを生成する。この時点では表4のA~G列に情報が入った状態となる。 S109: Next, the input/output processing unit 48 specifies the area information detected by the area detection unit 65, and requests the data storage unit 66 to create a setting file. The data storage unit 66 places the area information in a specific column of the CSV file and generates the setting file. At this point, information is entered in columns A to G of Table 4.
S110:次に、入出力処理部48は、設定ファイルを指定して外部サービス処理部62に外部サービスシステム40へのアップロードを要求する。
S110: Next, the input/output processing unit 48 specifies the configuration file and requests the external
S111:外部サービス処理部62は、外部サービスシステム40にログイン済みなので、管理者8のトップフォルダ(又は、管理者8が指定したフォルダ)に設定ファイルを保存する(上書き保存)。画像データと設定ファイルのファイル名が同じなので、管理者8は設定ファイルがどの画像データにより生成されたのかを容易に判断できる。
S111: The external
<設定ファイルへのその他の情報の登録>
図27、図28を参照して、設定ファイルへのH~M列への設定について説明する。図27は、管理者8が設定ファイルのH~M列へ情報を設定する手順を示すシーケンス図の一例である。
<Registering other information in the configuration file>
Setting of columns H to M in the setting file will be described with reference to Figures 27 and 28. Figure 27 is an example of a sequence diagram showing the procedure in which the
S31:外部サービスシステム40に設定ファイルを登録した後、管理者8は端末装置30を操作して端末装置30を外部サービスシステム40に接続させる。管理者8は自分の認証情報を入力して、外部サービスシステム40にログインする。
S31: After registering the setting file in the
S32:外部サービスシステム40はストレージサービスなので、管理者8が登録したファイルの一覧を端末装置30に送信する。例えばトップフォルダにあるファイルの一覧が送信される。トップフォルダにない場合は、管理者8が階層を指定する。ファイルの一覧の中に、管理者8が機器20から登録した設定ファイルと画像データのファイルも含まれる。
S32: Since the
S33:管理者8は設定ファイルの内容を確認したり、H~M列への情報を設定したりするため、設定ファイルを選択する。端末装置30の操作受付部33は選択を受け付け、第一通信部31が設定ファイルのファイルIDを指定して設定ファイルを外部サービスシステム40に要求する。
S33: The
S34:外部サービスシステム40の通信部19は設定ファイルの要求を受信し、設定ファイルを端末装置30に送信する。
S34: The
S35:管理者8は設定ファイルの内容を確認し、H~M列への情報を設定する。端末装置30の操作受付部33は設定を受け付ける。
S35: The
S36:管理者8が例えば、設定ファイルをアップロードする操作を行うと、第一通信部31はH~M列へ情報が設定された設定ファイルを情報処理システム10に送信する。
S36: When the
以上のようにして、外部サービスシステム40には設定ファイルが登録される。
In this way, the configuration file is registered in the
図28は、設定ファイルと帳票の対応を説明する図である。表4にて説明したように、管理者8は、フォーマット、CSV列名、CSV位置(列)、CSV位置(行)、OCR言語、及び、ファイル名に使う順序、を設定する。なお、管理者8は、必ずしも全ての列を設定しなくてもよい。またC列の処理内容によってはH~Mの指定は無視される。
Figure 28 is a diagram explaining the correspondence between the configuration file and the report. As explained in Table 4, the
図28の例では、ID=1の領域情報から取得されたデータはCSV列名の「書類名」と対応することが設定されている。「書類名」はファイル名の一番目に使用される。ID=2の領域情報から取得されたデータはCSV列名の「事前申請」と対応することが設定されている。また、事前申請のCSV位置が3列2行と設定されているので、ID=2の領域情報から取得されたデータはファイルの3列2行目に書き出される。ID=3の領域情報から取得されたデータはCSV列名の「備考」と対応することが設定されている。また、備考のCSV位置が4列2行と設定されているので、ID=3の領域情報から取得されたデータはファイルの4列2行目に書き出される。
In the example of Figure 28, the data obtained from the area information with ID=1 is set to correspond to the CSV column name "Document Name". "Document Name" is used as the first character in the file name. The data obtained from the area information with ID=2 is set to correspond to the CSV column name "Advance Application". In addition, since the CSV position of Advance Application is set to 3 columns,
<アプリと設定ファイルの対応付け>
次に、図29、図30を参照して、アプリと設定ファイルの対応付けについて説明する。図29は、アプリと設定ファイルの対応付けに関して端末装置30が表示する画面の一例である。管理者8は端末装置30を操作して、端末装置30を情報処理システム10と通信させる。
<Associating apps with configuration files>
Next, the association between an application and a setting file will be described with reference to Fig. 29 and Fig. 30. Fig. 29 is an example of a screen displayed by the
まず、図29(a)は管理者8が情報処理システム10にログインすると表示される初期画面630である。管理者8に認められている操作メニューが表示される。設定ファイルにアプリを対応づけるため、管理者8がアプリ一覧を表示させるアイコン631を選択する。
First, FIG. 29(a) shows an
表2に示したように、ユーザー管理部44ではユーザーごとに利用できるアプリと外部サービスシステム情報が登録されているので、情報処理システム10は外部サービスシステム40ごとに管理者8が利用できるアプリの一覧を端末装置30に提供できる。
As shown in Table 2, the
図29(b)はアプリ一覧画面632の一例を示す。アプリ一覧画面632には管理者8が利用できるアプリの一覧が表示される。管理者8はアプリ一覧画面632から、外部サービスシステム40に登録した設定ファイルと対応付けるためのアプリ633(例えば、経費精算書アプリ)を選択する。操作受付部33がアプリ633の選択を受け付けることで、図29(c)に示す対応付け画面640が表示される。対応付け画面640は、外部サービスシステム選択欄641、アップロード先フォルダ欄642、及び、設定ファイル欄643を有している。
Figure 29 (b) shows an example of an
・外部サービスシステム選択欄641は、領域から取得されたデータを書き出すファイルの保存先の外部サービスシステム40を管理者8が設定するための欄である。したがって、管理者8はアプリに予め対応付けられている外部サービスシステム40を変更したり、新規に設定したりできる。
- The external service
・アップロード先フォルダ欄642は、外部サービスシステム40において、領域から取得されたデータを書き出すファイルの保存先のフォルダを管理者8が設定するための欄である。管理者8がフォルダ選択ボタン642aを押下すると、外部サービスシステム40における管理者8の認証情報で情報処理システム10が外部サービスシステム40にログインし、外部サービスシステム40においての管理者8がアクセスできるトップフォルダが端末装置30に表示される。管理者8は任意のフォルダを選択できる。
- The upload
・設定ファイル欄643は、アプリと対応付ける設定ファイルを管理者8が選択するための欄である。管理者8がファイルを選択ボタン644、を押下すると、外部サービスシステム40における管理者8の認証情報で情報処理システム10が外部サービスシステム40にログインし、外部サービスシステム40においての管理者8がアクセスできるトップフォルダが端末装置30に表示される。トップフォルダ(又は管理者8が設定したフォルダ)には、情報処理システム10が登録し、管理者8が更新した設定ファイルが含まれる。トップフォルダに設定ファイルがない場合、管理者8はトップフォルダの下位のフォルダから設定ファイルを探すことができる。
- The
図30は、図29の画面を介して管理者8がアプリと設定ファイルを対応づける処理を説明するシーケンス図の一例である。図30の処理は図29(a)の画面が表示された状態からスタートする。
Figure 30 is an example of a sequence diagram explaining the process in which the
S41:管理者8は情報処理システム10にログインして、初期画面630からアプリ一覧を表示する操作を端末装置30に入力する。端末装置30の操作受付部33は操作を受け付け、第一通信部31がアプリ一覧を情報処理システム10に要求する。
S41: The
S42:情報処理システム10の通信部19がアプリ一覧の要求を受信し、端末画面提供部42が管理者8のユーザーIDに対応づけられているアプリをユーザー管理部44から取得する。端末画面提供部42は、外部サービスシステム40ごとに管理者8が利用できるアプリを含むアプリ一覧画面の画面情報を作成する。通信部19はアプリ一覧画面の画面情報を端末装置30に送信する。
S42: The
S43:管理者8が、設定ファイルを対応付けるアプリを選択する。端末装置30の操作受付部33が選択を受け付ける。この後、上記のように端末装置30は対応付け画面640を表示する。
S43: The
S44:管理者8は、対応付け画面640でファイルを選択ボタン644、を押下する。操作受付部33が押下を受け付け、対応付け画面640で設定されている外部サービスシステム40に保存されているファイル一覧の要求を第一通信部31が情報処理システム10に送信する。
S44: The
S45:情報処理システム10の通信部19はファイル一覧の要求を受信し、アプリ実行部46が入出力処理部48に外部サービスシステム40を指定してファイル一覧を要求する。入出力処理部48は外部サービスシステム40に対応した外部サービス処理部62にファイル一覧を要求する。外部サービス処理部62は管理者8の外部サービスシステム40(アプリに対応づけられているか、又は、対応付け画面でユーザーが設定した)における認証情報をユーザー管理部44から取得し、外部サービスシステム40にファイル一覧の要求を送信する。
S45: The
S46:外部サービスシステム40は管理者8の認証情報に基づいて、管理者8のログインを許可し、管理者8に対応づけられているファイルの一覧を取得する。ファイルの一覧が端末装置30に送信される。なお、図30では、設定ファイルが保存された外部サービスシステム40と、領域から取得されたデータのファイルが保存される外部サービスシステム40が同じという前提だが両者は異なってもよい。この場合、管理者8は設定ファイルを選択後、対応付け画面640で外部サービスシステム40を変更する。
S46: The
S47:端末装置30の表示制御部32はファイルの一覧を表示する。管理者8はアプリと対応づけられる設定ファイルを選択する。端末装置30の操作受付部33は選択を受け付ける。
S47: The
S48:端末装置30の第一通信部31は設定ファイルの識別情報、アプリの識別情報、外部サービスシステム40、及び、アップロード先フォルダを指定して、設定ファイルとアプリの対応付け要求を情報処理システム10に送信する。
S48: The
S49:情報処理システム10の通信部19は設定ファイルとアプリの対応付け要求を受信し、アプリデータ管理部41がアプリデータ43に設定ファイルとアプリを対応付けて登録する。すなわち、アプリデータ管理部41は、applicationId、applicationName、fileId、fileName、及びアップロード先フォルダを対応づけて登録する(表3参照)。なお、外部サービスシステム40はアプリ処理情報53に登録される。
S49: The
以上により、アプリと設定ファイルが対応づけられた。以降、一般ユーザーが機器20からアイコンを押下するだけで帳票の領域のデータをファイルに出力できる。
The app and the settings file are now associated. From then on, a general user can output the data in the form area to a file simply by pressing the icon on the
なお、図30では、対応付け画面640で管理者8がアプリと領域情報を対応づける方法を説明したが、領域情報の登録時にアプリと領域情報の対応付けを行ってもよい。
Note that in FIG. 30, a method in which the
この場合、例えば図24の領域登録画面610にアプリ名を入力するための欄が表示される。管理者8は設定ファイルと対応づけたいアプリのアプリ名を入力する。情報処理システム10は設定ファイルを作成後、入力されたアプリ名のアプリと設定ファイルを対応づけることができる。つまり、管理者8がアプリ名を設定して帳票を読み取らせれば、設定ファイルが生成され、連携元ファイルと設定ファイルとが対応づけられる。
In this case, for example, a field for inputting the app name is displayed on the
また、図29(c)に示した対応付け画面640において、管理者8は領域の拡張幅を設定できる。図31は対応付け画面640の変形例を示す。なお、図31の説明では、図29(c)との相違を主に説明する。
In addition, in the
図31の対応付け画面640-2は、領域の拡張幅の設定欄645を有する。領域の拡張幅の設定欄645に、マーカーペンで特定された領域よりも領域情報(OCR領域)をどのぐらい拡張するかを管理者8が設定できる。これにより、表4の領域情報はマーカーペンの色が付着した領域よりも広くなり、管理者8がマーカーペンで指定した領域がマークすべき広さよりも狭かったり、ユーザーが帳票の領域からはみ出して記入したりした場合でも、OCR処理部68が領域の文字に対しOCR処理することができる。
The matching screen 640-2 in FIG. 31 has an area expansion
ただし、この例に限られず、対応付け画面640-2において、マーカーで囲われた内側のみとする(例えばOCR領域をマーカーで囲む場合であればマーカー部分は領域に含まない)か、又は、マーカー部分を含んだ領域とするかを管理者8が設定してもよい。
However, this is not a limitation, and the
また、どのような形式で管理者8が領域を指定するかについて、色、ペンの種類、及び形等を対応付け画面640-2で受け付けてもよい。例えば、黄色マーカーで四角く囲む、赤ペンで丸く囲む、又は、緑色マーカーで塗りつぶす等を管理者8が設定できる。
In addition, the correspondence screen 640-2 may accept information such as color, pen type, and shape regarding the format in which the
<アプリの複製>
帳票の形状は様々であるため、ユーザーによりデータが記入される領域の場所も帳票によって様々である。そこで、本実施形態では、各帳票それぞれの形状に合わせて管理者8が領域情報を登録することができる。各帳票ごとに領域情報を登録する方法の1つとして、管理者8がアプリを複製する方法を説明する。
<App duplication>
Since forms have various shapes, the location of the area where the user writes data also varies depending on the form. Therefore, in this embodiment, the
図32は、いくつかのアプリの選択画面650を示す。一例として、明細書アプリ、納付書アプリ、及び、OCR指定領域アプリがある場合、明細書アプリに対しては明細書の領域情報が、納付書アプリに対しては納付書の領域情報が、アプリデータ43においてそれぞれ対応づけられている。ユーザーが、明細書の領域からデータを取得したい場合、明細書アプリを起動して明細書をスキャンすることで期待する領域のデータを出力できる。ユーザーが、納付書の領域からデータを取得したい場合、納付書アプリを起動して納付書をスキャンすることで期待する領域のデータを出力できる。
Figure 32 shows a
各アプリが行う処理はアプリ処理情報53に記載されているが、明細書アプリと納付書アプリが行う処理は、ファイルの保存先、アップロード先フォルダ、及び、設定ファイルが異なるものの、実行されるコンポーネントは同じである。したがって、管理者8が明細書アプリ又は納付書アプリを複製すれば、領域の指定、領域の取得、設定ファイルの作成、及び、設定ファイルと複製したアプリとの対応付け、が行われることで、情報処理システム10が任意の帳票に対応したアプリを作成できる。
The processing performed by each app is described in
図33を参照してアプリの複製について説明する。図33は、アプリの複製に際して管理者8が操作する画面の一例である。図33(a)は管理者8が情報処理システム10にログインすることで端末装置30が表示する初期画面630である。初期画面630には管理者8が各種の設定を行うための設定ボタン651が表示される。
The duplication of an app will be described with reference to Figure 33. Figure 33 is an example of a screen operated by the
図33(b)は設定ボタン651の押下後に表示されるアプリ管理画面652である。アプリ管理画面652にはいくつかのアプリがグループ化されたグループ名653が表示される。なお、画面遷移は説明のための一例であって、図示した画面の省略や、新たな画面の追加が行われてよい。
Figure 33 (b) shows an
グループ名653の右側にはこのグループに所属するアプリの一覧が表示される。アプリの一覧に表示されるアプリは管理者8に利用権限が認められているアプリである。管理者専用のアプリもあるし、他のユーザーが使用するアプリもある。管理者8は複製元となるアプリの設定ボタン654を押下する。設定ボタン654の押下により、メニューが表示され、該メニューの中に複製するボタン655がある。
A list of apps belonging to this group is displayed to the right of the
管理者8が複製するボタン655を押下すると、図33(c)に示す複製アプリ設定画面(ポップアップ画面)660が表示される。複製アプリ設定画面660は、アプリ名設定欄661、アイコンリスト欄662、及び、複製要求ボタン663を有している。アプリ名設定欄661には、複製により作成される新しいアプリに管理者8が任意のアプリ名を入力する。アプリ名は任意でよいが、重複するアプリ名は排除されるか、又は、「~(2)」などのように枝番が付される。アプリ名は、アプリ名以外にアイコン名、設定名と呼ばれてもよい。
When the
アイコンリスト欄662には、アイコンのリストが表示される。管理者8は所望のアイコンを選択できる。参照ボタン664を押下して別のアイコンを表示させることも可能である。管理者8が複製要求ボタン663を押下すると、複製元のアプリのアプリID,アプリ名、及び、アイコンが情報処理システム10に送信される。情報処理システム10はこれらを受信し、アプリ管理部49が複製元のアプリのアプリ処理情報53と画面情報54を使用して、新たにアプリを登録する。アプリ処理情報53のうち、アプリIDは重複しないものが採番され、アプリ名には管理者8が入力したアプリ名が設定される。画面情報は複製元のアプリと同じであるが、このうちアイコンは管理者8が選択したものである。アプリ処理情報、共有アプリ、及び、外部サービスシステム40の項目は複製元のアプリと同じである。例えばアプリ名等でユーザーがアプリを識別可能な場合、すべてのアプリに対して別のアイコンが設定されている必要はない。
The
また、本実施形態ではアプリの複製に伴い、新たな画像処理領域の設定が追加されているが、アプリの複製でなく、設定の追加や、アイコンの追加という形で、新たな画像処理領域の追加と機器で選択を受け付ける識別情報を対応付ける設定を管理者8が行ってもよい。
In addition, in this embodiment, a new image processing area setting is added when the app is duplicated, but instead of duplicating the app, the
図34は、情報処理システム10がアプリの複製を登録する手順を示すシーケンス図の一例である。
Figure 34 is an example sequence diagram showing the procedure by which the
S51:管理者8が情報処理システム10の認証情報を端末装置30に入力する。端末装置30の操作受付部33は認証情報の入力を受け付け、第一通信部31が認証情報を情報処理システム10に送信することで、管理者8が情報処理システム10にログインする。
S51: The
S52:ログインにより情報処理システム10の端末画面提供部42が通信部19を介して初期画面の画面情報を端末装置30に送信する。その後、管理者8の操作に応じて、端末画面提供部42は図33に示した画面の画面情報を端末装置30に送信する。
S52: By logging in, the terminal
S53:管理者8がアプリ名等を端末装置30に入力するので、操作受付部33が入力を受け付ける。
S53: The
S54:端末装置30の第一通信部31は複製元のアプリのアプリID,アプリ名、及び、アイコンを情報処理システム10に送信する。
S54: The
S55:情報処理システム10の通信部19はこれらを受信し、アプリ管理部49が複製元のアプリのアプリ処理情報53と画面情報54を使用して、新たにアプリを登録する。
S55: The
このように、管理者8はアプリを複製することができる。管理者8は複製により生成した新たなアプリに設定ファイルを対応付け、所望の帳票の所定の領域からデータを取得できる。
In this way, the
管理者8は1つの複製元のアプリから複数の新しいアプリを作成でき、情報処理システム10は、複数の新しいアプリに対し、それぞれ別の設定ファイルの選択を受け付けることができる。同じ処理フローに対する何らかの識別情報が付与できれば良いため、アプリの複製は一例であってアイコンの追加、設定の追加という態様で同じ処理フローに識別情報が付与されてもよい。
The
<アプリと設定ファイルの対応付けを利用した帳票からのデータの取得>
アプリと設定ファイルの対応付けが完了した後は、ユーザーが帳票を機器20に読み取らせることで、情報処理システム10が帳票からデータを取得できる。
<Acquisition of data from reports using association between apps and configuration files>
After the application and the configuration file have been associated with each other, the user can have the
図35、図36を参照して、帳票からのデータの取得について説明する。図35は、機器20が表示する画面の遷移例を示す図である。
The acquisition of data from a form will be described with reference to Figures 35 and 36. Figure 35 shows an example of the transition of screens displayed by the
(1) 図35(a)に示すように、ユーザーはアプリ一覧画面を機器20に表示させる。例えば、経費を精算したい場合、ユーザーは経費精算書アプリのアイコンを選択する。どの帳票がどのアプリに対応しているかはユーザーが把握しているが、アプリのアイコン690に表示されるアプリ名と帳票(原稿)の名称が一致しているとよい。このアプリ名はアイコン名や設定名と呼ばれてもよい。すなわち、アイコン690には帳票の名称が含まれるとよい。更に、アイコン690には、帳票のサムネイルが含まれるとよい。ユーザーが帳票に対応していないアイコンを選択することを抑制しやすくなる。あるいは、ユーザーがアイコン690を押下すると帳票のサムネイルが表示されてもよい。ユーザーはサムネイルを拡大表示したり部分表示したりしてアイコン690を確認できる。
(1) As shown in FIG. 35(a), the user causes the
また、アイコン690にはリンクが埋め込まれていてもよい。リンクは、例えばアプリIDを含むURLか、又は、情報処理システム側でアプリIDと対応付けられているURLを有する。アイコン690の押下で、機器20はURLに接続することで、アプリIDを情報処理システム10に通知する。
In addition, a link may be embedded in the
またアイコン690が対応していない帳票をユーザーが選択した場合、機器20がユーザーに警告するとよい。例えば、機器20は読み取った帳票の画像データと、アイコン690に対応づけられている画像データを比較し、両者が異なる場合に、処理を継続するかどうかのメッセージなどを表示することでユーザーに問い合わせる。画像データの比較は情報処理システム10が行ってもよい。なお、比較の方法としては、例えば、アイコン690に対応づけられている画像データで読み取った帳票の画像データを機器20又は情報処理システム10がパターンマッチングする方法がある。また、帳票にバーコードなどでアプリIDが印刷されている場合、このアプリIDとアイコン690に対応づけられているアプリIDを機器20又は情報処理システム10が比較する方法がある。
In addition, if the user selects a form that does not correspond to the
また、ユーザーが選択するものがアイコンで、機器20が情報処理システム10に送信するのがアプリIDや設定番号等の文字列であってもよい。つまり選択される物自体はアプリID(識別情報)ではなくてもよい。
Also, what the user selects may be an icon, and what the
(2) 経費精算書を機器20がスキャンする場合、ユーザーは経費精算書を用意する(図35(b))。経費精算書はユーザーが手書きで用意してもよいし、機器20がプリントアウトしてもよい。ユーザー自身がプリントアウトしたものではなくてもよい(公的に発行される書類や、他社から送られてくる書類等)。
(2) When the
(3) ユーザーが選択したアプリが画面情報54に基づいて図35(c)の画面を表示する。図35(c)の画面は図24と同じである。ユーザーはプリントアウトされた経費精算書をコンタクトガラスにセットし、スタートボタン613を押下することで機器20に読み取らせる。
(3) The app selected by the user displays the screen in FIG. 35(c) based on the
帳票の画像データが情報処理システム10に送信され、次述するような処理によりファイルが出力される。
The image data of the form is sent to the
図36は外部サービスシステム40に保存されたファイルを説明する図である。図36(a)は外部サービスシステム40のアップロード先フォルダの一例を示す。すなわち、管理者8が図29で設定したアップロード先フォルダに情報処理システム10が出力したファイルが保存される。図36(a)の「My Drive>経費精算書置き場」のファイル階層は一例であり、管理者8はアクセス権があるフォルダを指定できる。
Figure 36 is a diagram explaining files stored in the
図36(b)はアップロード先フォルダに保存される2つのファイルを示す。1回の読み取り操作で2つのファイルが生成される。
A.帳票の領域から取得されたデータが保存されるCSVファイル681。
B.帳票の画像データを含むPDFファイル682。
Figure 36(b) shows two files saved in the upload destination folder. Two files are generated by one read operation.
A. A
B. A
同じアプリが作成するCSVファイルは、1回の読み取り操作のたびに別々になる。ファイル名にはシリアル番号や日付が付されるので、ファイルが上書きされることはない。一方、同じアプリで取得されたデータは、読み取り操作のタイミングが異なっても、同一のCSVファイルに追加したい場合がある。この方法については後述する。こうすることで、庶務などの担当者は1つのCSVファイルにアクセスするだけで各社員のデータに対し精算等を行える。 CSV files created by the same app will be separate with each read operation. A serial number and date are added to the file name, so files will not be overwritten. On the other hand, there may be cases where data obtained with the same app will be added to the same CSV file even if the read operation is performed at a different time. This method will be described later. In this way, general affairs staff and other personnel can perform settlements and other procedures for each employee's data simply by accessing a single CSV file.
<<機器が帳票をスキャンしない場合>>
図35の説明では、経費精算書を機器20がスキャンしていたが、情報処理システム10は帳票の画像データを端末装置30等から受信し、画像データの領域からデータを取得できる。この場合は、以下のようにして帳票の画像データを端末装置30が情報処理システム10に送信する。
<<If the device does not scan documents>>
35, the expense report is scanned by the
・ ユーザーが端末装置30で動作するワープロで経費精算書を表示させ、必要事項を入力する。したがって、必要事項は文字コードになっている。ユーザーが端末装置30を情報処理システム10に接続して、ログインして、アプリ一覧を表示させる。端末装置30の画面は図35(a)の画面と同様になるので、ユーザーが所望のアプリを選択する。情報処理システム10の端末画面提供部42は経費精算書を受付可能な画面情報を端末装置30に送信する。ユーザーがこの画面で経費精算書の画像データが含まれるPDFファイル等を選択すると、端末装置30がPDFファイルを情報処理システム10に送信できる。
- The user displays the expense report in a word processor running on the
したがって、ユーザーは帳票をプリントアウトしなくても情報処理システム10が帳票からデータを取得できる。この場合、後述する図37の処理における機器20の処理は端末装置30によって行われる。
Therefore, the
<動作手順>
図37は、情報処理システム10が機器20から帳票の画像データを含むPDFファイルを受信し、領域から取得データを取得するシーケンス図の一例である。
<Operation procedure>
FIG. 37 is an example of a sequence diagram in which the
S61:帳票をプリントアウトしたユーザーは機器20を操作して情報処理システム10における自分の認証情報を入力する。機器20の操作受付部23は認証情報の入力を受け付け、第二通信部21が認証情報を情報処理システム10に送信する。これにより、ユーザーは情報処理システム10にログインする。ログインにより機器20の表示制御部22は、ユーザーに利用権限が認められているアプリの一覧を表示する(図35(a))。ユーザーは例えばプリントアウトした帳票の名称と一致するアプリ名のアプリを選択する。操作受付部23は選択を受け付ける。
S61: The user who printed out the form operates the
S62:機器20の第二通信部21はアプリIDを指定してアプリ画面取得要求を情報処理システム10に送信する。
S62: The
S63:情報処理システム10の通信部19はアプリ画面取得要求を受信し、機器画面提供部47がアプリ管理部49からアプリIDで特定されるアプリの画面情報54を取得する。アプリのアプリ画面の画面情報が機器20に送信される。これにより、機器20の表示制御部22はアプリ画面を表示する(図35(c))。
S63: The
S64:ユーザーはプリントアウトされた帳票をコンタクトガラスにセットし、スタートボタン613を押下する。機器20の操作受付部23は押下を受け付け、画像データ生成部24が帳票の画像データを生成し、この画像データをPDFファイルに変換する。帳票は複数枚でもよい。
S64: The user places the printed form on the contact glass and presses the
S65:機器20の第二通信部21はアプリのアプリIDとPDFファイルを指定して、アプリの実行を情報処理システム10に要求する。
S65: The
S66:情報処理システム10の通信部19はアプリの実行要求を受信し、アプリ実行部46がアプリの実行を開始する。アプリ実行部46はアプリIDを指定して入出力サービス部16にアプリの実行を要求する。入出力サービス部16はアプリ管理部49を介してアプリ処理情報53を取得する。これにより、アプリの処理フローが得られた。また、入出力処理部48はアプリデータ記憶部13からアプリIDに対応づけられたアプリデータ43を取得する。これにより、入出力処理部48は、アプリに対応づけられている設定ファイルを特定できる。
S66: The
入出力処理部48はアプリデータ43とアプリ処理情報53に基づいて、設定ファイルの取得を外部サービス処理部62に要求する。
The input/output processing unit 48 requests the external
S67:外部サービス処理部62はアプリデータ43に登録されているfileNameの項目のURLに接続し、設定ファイルを外部サービスシステム40から取得する。なお、外部サービス処理部62は、実行要求されたアプリが共有アプリでない場合はユーザーの外部サービスシステム40における認証情報で外部サービスシステム40にログインする。外部サービス処理部62は、実行要求されたアプリが共有アプリである場合は管理者8の外部サービスシステム40における認証情報で外部サービスシステム40にログインする。
S67: The external
S68:次に、入出力処理部48はアプリ処理情報53に基づいて、設定ファイルから領域情報を取得することをデータ保存部66に要求する。
S68: Next, the input/output processing unit 48 requests the data storage unit 66 to obtain area information from the setting file based on the
S69:データ保存部66は設定ファイルの予め決まった行と列から全ての領域情報を取得し、入出力処理部48に返す。領域情報は処理ごとに登録されているので、処理の数だけ領域情報が取得される。 S69: The data storage unit 66 acquires all area information from predetermined rows and columns of the configuration file and returns it to the input/output processing unit 48. Since area information is registered for each process, area information is acquired for each process.
S70:次に、入出力処理部48はアプリ処理情報53に基づいて、画像データと領域情報を指定して、画像データからの領域の取得(切り取り)を領域特定部67に要求する。
S70: Next, the input/output processing unit 48 specifies the image data and area information based on the
S71:領域特定部67は画像データから領域情報で指定される処理対象領域を特定して取得し、処理の数だけ、処理対象領域の画像を入出力処理部48に返す。なお、領域特定部67はOCR処理とOMR処理の処理対象領域については、画像データから処理対象領域を取得(切り取り)しなくてもよい。この場合、OCR処理部68とOMR処理部71は領域情報で特定される画像データの処理対象領域にOCR処理又はOMR処理を行えばよい。
S71: The area identification unit 67 identifies and acquires the processing target area specified by the area information from the image data, and returns images of the processing target area to the input/output processing unit 48 for the number of processes. Note that the area identification unit 67 does not need to acquire (cut out) the processing target area for OCR processing and OMR processing from the image data. In this case, the
OCR処理の処理対象領域が複数ある場合、ステップS72、S73は処理対象領域の数だけ繰り返し実行される。 If there are multiple areas to be processed by OCR processing, steps S72 and S73 are repeated as many times as there are areas to be processed.
S72:入出力処理部48はアプリ処理情報53に基づいて、処理対象領域の画像を指定して、処理対象領域のOCR処理をOCR処理部68に要求する。この時、入出力処理部48は設定ファイルから取得したフォーマットとOCR言語を処理対象領域に対応づけて指定するとよい。
S72: Based on the
S73:OCR処理部68はフォーマットとOCR言語に対応した認識エンジンで処理対象領域にOCR処理を行う。OCR処理部68は文字コードに変換されたデータ(OCR処理結果)を入出力処理部48に返す。
S73: The
なお、認識エンジンは、例えば文字の画像と文字コードがセットになった学習データを用いて両者の対応を学習し、画像からOCR処理結果(文字コード)を出力する識別機である。学習データが、日本語のみ、英語のみ、数値のみ、日付のみ、のように単純なほど、識別機の識別精度が向上する。一方、学習データに日本語、英語、数値及び日付の複数が混在すると、種々のデータの認識が可能になるが、識別精度が低下する傾向になる。したがって、OCR処理部68は、フォーマットとOCR言語に対応した認識エンジンを使用することで認識精度を向上できる。
The recognition engine is an identifier that uses training data consisting of a set of character images and character codes to learn the correspondence between the two, and outputs OCR processing results (character codes) from the images. The simpler the training data is, such as Japanese only, English only, numbers only, or dates only, the higher the recognition accuracy of the identifier. On the other hand, if the training data contains a mixture of Japanese, English, numbers, and dates, it becomes possible to recognize a variety of data, but the recognition accuracy tends to decrease. Therefore, the
ここで、機械学習とは、コンピュータに人のような学習能力を獲得させるための技術であり、コンピュータが,データ識別等の判断に必要なアルゴリズムを,事前に取り込まれる学習データから自律的に生成し,新たなデータについてこれを適用して予測を行う技術のことをいう。機械学習のための学習方法は、教師あり学習、教師なし学習、半教師学習、強化学習、深層学習のいずれかの方法でもよく、更に、これらの学習方法を組み合わせた学習方法でもよく、機械学習のための学習方法は問わない。また、認識エンジンは機械学習の学習効果によって生成されたものでなくてもよい。 Here, machine learning is a technology that allows a computer to acquire human-like learning capabilities, and refers to a technology in which a computer autonomously generates algorithms necessary for judgments such as data identification from training data that is previously loaded, and applies these to new data to make predictions. The learning method for machine learning may be any of supervised learning, unsupervised learning, semi-supervised learning, reinforcement learning, and deep learning, or may be a combination of these learning methods; any learning method for machine learning is acceptable. In addition, the recognition engine does not have to be one generated by the learning effect of machine learning.
次に、OMR処理の処理対象領域が複数ある場合、ステップS74、S75は処理対象領域の数だけ繰り返し実行される。 Next, if there are multiple areas to be processed in the OMR process, steps S74 and S75 are repeated the same number of times as there are areas to be processed.
S74:入出力処理部48はアプリ処理情報53に基づいて、処理対象領域の画像を指定して、処理対象領域のOMR処理をOMR処理部71に要求する。
S74: Based on the
S75:OMR処理部71は処理対象領域にOMR処理を行う。OMR処理部71はマークの有無に変換された取得データ(OMR処理結果)を入出力処理部48に返す。 S75: The OMR processing unit 71 performs OMR processing on the processing target area. The OMR processing unit 71 returns the acquired data (OMR processing result) converted to indicate the presence or absence of a mark to the input/output processing unit 48.
次に、トリミング処理の処理対象領域が複数ある場合、ステップS76、S77は処理対象領域の数だけ繰り返し実行される。 Next, if there are multiple areas to be processed for the trimming process, steps S76 and S77 are repeated the same number of times as there are areas to be processed.
S76:入出力処理部48はアプリ処理情報53に基づいて、処理対象領域の画像を指定して、処理対象領域のトリミング処理をトリミング処理部72に要求する。
S76: Based on the
S77:トリミング処理部72は処理対象領域にトリミング処理を行う。トリミング処理部72は処理対象領域から取得した取得データとして画像データ(トリミング処理結果)を入出力処理部48に返す。 S77: The trimming processing unit 72 performs trimming processing on the processing target area. The trimming processing unit 72 returns image data (trimming processing result) to the input/output processing unit 48 as acquired data acquired from the processing target area.
S78:次に、入出力処理部48はアプリ処理情報53に基づいて、各処理対象領域から取得された取得データ、CSV列名、CSV位置、及び、ファイル名(設定ファイルから取得)を指定して、データ保存部66に取得データを有するファイルの出力を要求する。
S78: Next, based on the
S79:データ保存部66は、CSV列名を列の先頭に書き込み、取得データをCSV位置で指定されるCSVファイルのセルに書き込み、CSVファイルを入出力処理部48に返す。CSVファイルには指定されたファイル名が付与されている。なお、出力先のファイルの形式はCSVファイルに限らず、表形式のファイルであればよいし、テキストファイルでもよいし、その他のアプリケーションのファイルでもよい。 S79: The data storage unit 66 writes the CSV column name to the beginning of the column, writes the acquired data to the cell of the CSV file specified by the CSV position, and returns the CSV file to the input/output processing unit 48. The CSV file is given the specified file name. Note that the format of the output file is not limited to a CSV file, and may be any table format file, a text file, or a file of another application.
S80:次に、入出力処理部48はアプリ処理情報53に基づいて、OCR処理結果(CSVファイル)、フォーマット及びOCR言語を指定して、OCR処理結果の補正をOCR補正部69に要求する。このフォーマットは表4に示された設定ファイルから取得されていて、管理者8によって設定されたものである。
S80: Next, the input/output processing unit 48 requests the OCR correction unit 69 to correct the OCR processing result by specifying the OCR processing result (CSV file), format, and OCR language based on the
図38はOCR処理結果の補正を説明する図である。設定ファイルにフォーマットが設定されている場合、OCR補正部69はOCR処理結果を補正できる。OCR補正部69には指定文字列と変換文字のルールが図38に示すように定義されている。図38の変換ルール2201はフォーマットがNUMERICの場合のルールである。例えば、数値にはI,B、Zが含まれないので、それぞれ1,8,2に補正される。図38の変換ルール2202は言語がEnglishの場合のルールである。例えば、Englishには1,2、8が含まれないので、それぞれI,B,Zに補正される。
Figure 38 is a diagram explaining the correction of OCR processing results. If a format is set in the configuration file, the OCR correction unit 69 can correct the OCR processing results. The OCR correction unit 69 defines the rules for specified character strings and conversion characters as shown in Figure 38.
S81:図37Bに戻り、OCR補正部69は、補正したOCR処理結果(CSVファイル)を入出力処理部48に返す。 S81: Returning to FIG. 37B, the OCR correction unit 69 returns the corrected OCR processing result (CSV file) to the input/output processing unit 48.
ステップS82~S85はCSVファイルの数だけ実行される。1回の読み取り操作で作成されるCSVファイルの数は、帳票の数に関係なく1回の場合と、帳票のページ数と同じ場合がある。どちらが採用されるかは、アプリに設定されている。 Steps S82 to S85 are executed as many times as there are CSV files. The number of CSV files created in one read operation may be one regardless of the number of forms, or the same as the number of form pages. Which is used is set in the app.
S82:次に、入出力処理部48はアプリ処理情報53に基づいて、OCR処理結果(CSVファイル)のアップロードを外部サービス処理部62に要求する。アップロード先フォルダはアプリデータ43に設定されている。
S82: Next, the input/output processing unit 48 requests the external
S83:外部サービス処理部62は外部サービスシステム40のアップロード先フォルダにCSVファイルを保存する。
S83: The external
S84:メタデータの設定が可能な場合は、ステップS84が実行される。外部サービスシステム40がメタデータ(外部サービスシステム上でユーザーが設定した項目で、文字列、日付など)の設定に対応している場合、アップロードするCSVファイルに紐付けるメタデータをユーザーが設定できる。ユーザーは機器20が表示する画面からメタデータを入力できる。入出力処理部48はメタデータのアップロードを外部サービス処理部62に要求する。アップロード先フォルダはCSVファイルと同じである。
S84: If it is possible to set metadata, step S84 is executed. If the
S85:外部サービス処理部62は外部サービスシステム40のアップロード先フォルダにメタデータを保存する。
S85: The external
S86:複数の帳票データが読み込まれた場合に、ユーザーとしては個別のファイルに保存したい場合がある。この場合、入出力処理部48はアプリ処理情報53に基づいて、複数ページの画像データと共に、ページ分割をPDF処理部64に要求する。この処理は省略されてもよく、その場合、入出力処理部48は複数のデータを1つのファイルとして保存してよい。
S86: When multiple report data are loaded, the user may wish to save them in individual files. In this case, the input/output processing unit 48 requests the PDF processing unit 64 to split the pages along with the image data of multiple pages based on the
S87:PDF処理部64は1ページずつに分解したPDFファイルを入出力処理部48に返す。 S87: The PDF processing unit 64 returns the PDF file broken down into pages to the input/output processing unit 48.
S88:入出力処理部48はアプリ処理情報53に基づいて、PDFファイルを指定して、OCR処理をOCR処理部68に要求する。
S88: Based on the
S89:OCR処理部68はPDFファイルにOCR処理を行い、OCR処理で生成された文字コードをPDFファイルに透明テキストとして設定する。
S89: The
ステップS90~S93はPDFファイルの数だけ実行される。 Steps S90 to S93 are executed as many times as there are PDF files.
S90:入出力処理部48はアプリ処理情報53に基づいて、テキスト付きPDFファイルのアップロードを外部サービス処理部62に要求する。アップロード先フォルダはアプリデータ43に設定されている。
S90: The input/output processing unit 48 requests the external
S91:外部サービス処理部62は外部サービスシステム40のアップロード先フォルダにテキスト付きPDFファイルを保存する。
S91: The external
S92:外部サービスシステム40が上記メタデータ(外部サービスシステム上でユーザーが設定した項目で、文字列、日付など)に対応している場合、ユーザーは機器20が表示する画面からメタデータを入力できる。入出力処理部48はメタデータのアップロードを外部サービス処理部62に要求する。アップロード先フォルダはPDFファイルと同じである。
S92: If the
S93:外部サービス処理部62は外部サービスシステム40のアップロード先フォルダにメタデータを保存する。
S93: The external
以上により、外部サービスシステム40のアップロード先フォルダに、CSVファイルとCSVファイルとは別のPDFファイルが登録された。
As a result, the CSV file and a separate PDF file from the CSV file have been registered in the upload destination folder of the
なお、図37では処理の対象となる画像データをPDFファイルとしたが、処理の対象となる画像データは、JPEG、PNG、TIFF、BMP等、どのような形式の画像データでもよい。 Note that in Figure 37, the image data to be processed is a PDF file, but the image data to be processed can be image data in any format, such as JPEG, PNG, TIFF, BMP, etc.
本実施形態では、大量の帳票などを機器20がまとめてスキャンして処理することを前提としている。一方、同じフォーマットの帳票をユーザーが使用するのは1度だけの場合もあるし、毎回、処理の領域が変わるような場合、領域情報の設定ファイルへの登録は管理者の手間になってしまうだけである。このため、領域情報の登録の作業を省略して、ユーザーが記入した帳票の領域を直接、着直して、機器20に読み取らせてもよい。情報処理システム10は、設定ファイルに登録された色と処理の対応に応じて、各領域に対して処理を行う。
In this embodiment, it is assumed that the
<外部サービスシステムに登録されたCSVファイルとPDFファイルの表示>
企業の担当者が社員の経費などを計算する場合、端末装置30を操作して外部サービスシステム40に接続させる。担当者にはアップロード先フォルダが通知されているので、端末装置30でCSVファイルとPDFファイルを取得できる。
<Displaying CSV and PDF files registered in an external service system>
When a company employee calculates expenses for employees, the employee operates the
図39は、端末装置30が表示する外部サービスシステム40のファイル一覧画面670の一例である。図39(a)に示すように、アップロード先フォルダにPDFファイル671とCSVファイル672が保存されている。図39(b)は端末装置30が表示させたCSVファイル672の内容を示す。すなわち、図39(b)は帳票から出力されたデータである。図39(b)では2つの領域から取得されたデータが保存されている。各列には設定ファイルに設定されているCSV列名も設定されており、ユーザーは各列が何のデータかを判断できる。
Figure 39 is an example of a
また、図40に示すように、機器20も処理結果を表示することが好ましい。図40は機器20が表示する出力データ表示画面691の一例である。出力データ表示画面691は、実行されたアプリ名692、及び、アプリが出力したファイルのリスト693を表示する。これらは情報処理システム10から機器20に送信される。CSVファイルにはCSVファイルの内容が含まれており、ユーザーがCSVファイルを押下することで、帳票の領域から取得されCSVファイルに保存されたデータ694を機器20が表示することができる。
As shown in FIG. 40, it is also preferable that the
ファイル名やデータを確認したユーザーは帳票が正しく処理されたかどうかを判断できる。 By checking the file name and data, users can determine whether the report was processed correctly.
<複数の帳票が読み取られた場合>
図41を参照して複数の帳票が一度の読み取り操作で読み取られた場合を説明する。図41は、複数の帳票と、出力されたファイルを示す図である。図41(a)に示すように、アプリの実行時に複数の帳票が1回の読み取り操作で読み取られた。1回の読み取り操作とは、スタートボタン613が1回だけ押下された場合をいう。機器20は複数の帳票を順番に読み取り、情報処理システム10は各帳票の画像データの同じ領域から複数のデータを取得する。
<When multiple documents are scanned>
A case where multiple forms are read in one reading operation will be described with reference to Fig. 41. Fig. 41 is a diagram showing multiple forms and output files. As shown in Fig. 41(a), multiple forms are read in one reading operation when the application is executed. One reading operation refers to a case where the
図41(b)は複数の帳票が一度の読み取り操作で読み取られた場合のCSVファイルを示す図である。1行目が1枚目の帳票から取得されたデータであり、2行目が2枚目の帳票から取得されたデータである。このように、複数の帳票の複数のデータが1つのCSVファイルにまとめられるので、担当者は集計やグラフ化がしやすくなる。 Figure 41 (b) shows a CSV file when multiple forms are read in a single reading operation. The first line is the data obtained from the first form, and the second line is the data obtained from the second form. In this way, multiple data from multiple forms are compiled into a single CSV file, making it easier for the person in charge to tally and graph the data.
なお、複数の帳票が一度の読み取り操作で読み取られた場合、データ保存部66は設定ファイルのCSV位置(開始行)を1つずつインクリメントする。つまり、データ保存部66は、帳票ごとに下の行にデータを書き込めばよい。 When multiple forms are read in a single read operation, the data storage unit 66 increments the CSV position (start row) of the configuration file by one. In other words, the data storage unit 66 writes data in the row below for each form.
複数の帳票が一度の読み取り操作で読み取られた場合、情報処理システム10が帳票の数だけのCSVファイルを出力することも可能である。
When multiple forms are read in a single reading operation, the
また、複数の帳票が複数回の読み取り操作で読み取られた場合(異なるタイミングで読み取られた場合)、情報処理システム10が1つの同じCSVファイルにデータを出力することも可能である。外部サービスシステム40がマージする場合と、情報処理システム10がマージする場合がある。
In addition, when multiple documents are read in multiple reading operations (when read at different times), it is also possible for the
・外部サービスシステム40がマージする場合、外部サービス処理部62はCSVファイルのマージを外部サービスシステム40に要求する。アプリが同じであればCSVファイルのファイル名に同じ文字列(例えば経費精算書)が含まれるので、外部サービス処理部62はファイル名を指定してCSVファイルのマージを要求できる。外部サービスシステム40はすでに保存済みのCSVファイルの同じ列番号に、マージが要求されたCSVファイルの同じ列番号のデータを追加する。
- When the
・情報処理システム10がマージする場合、外部サービス処理部62はファイル名を指定してCSVファイルを外部サービスシステム40からダウンロードする。外部サービス処理部62は取得したCSVファイルの同じ列番号に、新たに作成したCSVファイルの同じ列番号のデータを追加する。外部サービス処理部62はマージしたCSVファイルを外部サービスシステム40にアップロードする。
- When the
このように、情報処理システム10は受信した複数の画像データから同一の領域を取得し、OCR処理部68は、複数の画像データで同一の領域にOCR処理を行い、データ保存部66は、複数の画像データで同一の領域から生成された複数のデータを1つのファイルに出力することができる。
In this way, the
<主な効果>
以上説明したように、本実施形態のデータ出力システム100は、管理者8が登録用紙にマーカーペンで印と処理を対応づけることができる。また、領域がマーキングされた帳票を機器20が読み取り、情報処理システム10が帳票ごとに処理と領域情報を記憶する。そして、機器20から送信された帳票の画像データから領域を取得して、情報処理システム10が領域に設定されている処理を行う。これによって、同じ種類の複数の帳票において特定の領域のみを抜き出したファイルを簡単に作成することが可能になる。
<Major Effects>
As described above, the
本実施例では、領域の色に応じて異なる認識対象をOCRで認識する情報処理システム10について説明する。
In this embodiment, we will explain an
図42、図43を参照して、データ出力システム100が行う処理又は動作の概略を説明する。なお、図42,図43の説明では主に図1,2との相違を説明する。
The process or operation performed by the
図42の処理では(2)の処理が図1と異なっている。 In the process of Figure 42, process (2) is different from that of Figure 1.
(2) データ出力システム100の管理者8は、機器20で情報処理システム10に登録されている登録用紙を印刷して、処理に対応させたい色をマーカーペンで着色する。例えば、「漢字をOCR」が緑、「日付をOCR」が青、「英数字をOCR」が赤、など、管理者8は任意の色を処理と対応付けておくことができる。機器20が登録用紙をスキャンして画像データ(第一の画像データ)を生成し、情報処理システム10に送信する。
(2) The
続いて、図43を参照して説明する。図43(a)は帳票における領域情報の設定を、図43(b)は領域情報を使用した帳票からのデータの取得を、それぞれ説明する図である。図43の処理は図2と同様であるので、主な相違点を説明する。 Next, we will refer to Figure 43 for further explanation. Figure 43(a) is a diagram for explaining how to set area information in a form, and Figure 43(b) is a diagram for explaining how to obtain data from a form using area information. The process in Figure 43 is similar to that in Figure 2, so we will explain the main differences.
(4) 管理者8は、組織内のユーザーが日常的に使う帳票7を使用して、帳票7のどの領域にどの処理(漢字をOCR、日付をOCR、英数字をOCR)を行うかをマーカーペンで指定する。
(4) The
以降の(5)~(11)の処理は図2と同様でよい。 The subsequent steps (5) to (11) can be the same as in Figure 2.
本実施例のデータ出力システム100は、実施例1の効果に加え、より詳細な処理の内容と印(色)とを管理者8が登録することができる。OCRでは、認識対象を制限するかどうかで認識率が大きく変動することが知られている。例えば、OCR処理部68が郵便番号「〒」をOCRする場合、認識対象が郵便番号であることを事前に知らないと、「T」と誤認識する場合が多い。本実施例では、領域ごとにOCRの認識対象が設定されるので、OCRの認識精度を向上できる。
In addition to the effects of the first embodiment, the
また、管理者がWebサイトを使用して、帳票の領域に何が記入されるかを設定する方法も採用しうるが、本実施例では登録用紙に管理者がマーキングするという簡単な方法で領域ごとにOCRの認識対象を設定できる。 Another option is for the administrator to use a website to set what is to be written in each area of the form, but in this embodiment, the administrator can set the OCR recognition target for each area by simply marking the registration form.
<色と処理の対応に関する補足>
図42、図43で説明した、一連の処理について作業1~3に分けて補足する。図44は、登録用紙を用いた色と処理の対応(作業1)の登録を説明する図である。
<Additional information regarding color and processing>
The series of processes explained in Figures 42 and 43 will be supplemented by dividing them into
図44(a)は着色前の登録用紙である。 Figure 44 (a) shows the registration form before coloring.
図44(b)は着色後の登録用紙である。図44(b)の登録用紙を機器20がスキャンする。
Figure 44(b) shows the registration form after coloring. The registration form in Figure 44(b) is scanned by
図44(c)は色と処理が対応付けられた設定ファイルの一部である。色と処理の対応付けには、2つの方法が考えられる。 Figure 44 (c) shows a part of a configuration file in which colors and processes are associated. There are two possible ways to associate colors and processes.
1:色を取得してくる座標(登録用紙内の)とその座標からとってきた処理とを紐づけるか情報を情報処理システム側が事前にもっておく。
事前パラメータ例
・座標(X座標:100, 200 Y座標:1, 50)で抽出した色は漢字をOCR
・座標(X座標:100, 200 Y座標:51, 100)で抽出した色は日時をOCR
・座標(X座標:100, 200 Y座標:101, 150)で抽出した色は英数字をOCR
2:管理者が管理サイト上で色と処理を紐づけする。
図45は、色と処理を対応付けるための管理サイト150の一例である。管理サイト150はWebページ又はWebアプリとして情報処理システム10が端末装置に提供する。管理者はラジオボタン171で処理の色を登録できる。この場合、ユーザーが使用するマーカーペンの色が3つに限られる。
1: The information processing system has in advance information on how to link the coordinates (within the registration form) from which the color is obtained with the processing obtained from those coordinates.
Example of pre-defined parameters: The color extracted at coordinates (X coordinate: 100, 200 Y coordinate: 1, 50) is used to OCR kanji characters.
・The color extracted at coordinates (X coordinate: 100, 200 Y coordinate: 51, 100) is the date and time OCR
・The color extracted at coordinates (X coordinates: 100, 200 Y coordinates: 101, 150) is OCR alphanumeric characters
2: The administrator links colors and processes on the management site.
45 shows an example of the
いずれの方法でも、図44(c)に示すように、マーカー色(緑)を識別する数値と漢字をOCRする旨が対応付けられる。マーカー色(青)を識別する数値と日付をOCRする旨が対応付けられる。マーカー色(赤)を識別する数値と英数字をOCRする旨が対応付けられる。 In either method, as shown in FIG. 44(c), a number identifying the marker color (green) is associated with the OCR of kanji characters. A number identifying the marker color (blue) is associated with the OCR of dates. A number identifying the marker color (red) is associated with the OCR of alphanumeric characters.
図46は、帳票の原紙を用いた、領域情報と処理の対応(作業2)を説明する図である。図46(a)は帳票の原紙である。 Figure 46 is a diagram explaining the correspondence between area information and processing (task 2) using a form base. Figure 46 (a) shows the form base.
図46(b)は着色後の帳票である。図46(b)の帳票を機器20がスキャンする。図46(c)は領域情報と処理が対応付けられた設定ファイルの一部である。
Figure 46(b) shows the form after coloring. The form in Figure 46(b) is scanned by
図46(d)に示すように、設定ファイルには色と処理が対応付けられているので、情報処理システム10は、登録用紙の色(設定ファイルに登録済み)を帳票から検出し、この色が検出された領域の座標を領域情報として設定ファイルの処理に対応付ける。
As shown in FIG. 46(d), since the setting file associates colors with processes, the
したがって、本実施例では、管理者が帳票の領域に着色した色で、領域に対するOCR処理の内容を変えられる。
Ex1:青で着色→漢字をOCR、赤で着色→日付をOCR
Ex2:青で着色→郵便番号をOCR、赤で着色→URLをOCR
図47は、帳票を用いた、帳票内の領域への処理(作業3)を説明する図である。図47(a)はユーザーが必要事項を記入した原紙である。
Therefore, in this embodiment, the administrator can change the content of the OCR processing for an area by changing the color with which the area is colored on the form.
Ex1: Color in blue → OCR kanji, color in red → OCR date
Ex2: Color in blue → OCR the postal code, color in red → OCR the URL
47A and 47B are diagrams for explaining processing of an area in a form (operation 3) using the form. Fig. 47A shows an original sheet on which the user has filled in the necessary information.
図47(b)は帳票の各領域に行われる処理を示す。帳票の氏名の領域172にはOCR1として漢字でOCRする処理が登録されているので、氏名は漢字(カタカナ、ひらがなも含まれる)とみなしてOCRされる。帳票の申請日の領域173にはOCR2として日時をOCRする処理が登録されているので、申請日は日時とみなしてOCRされる。社員番号の領域174にはOCR3として英数字をOCRする処理が登録されているので、社員番号は英数字とみなしてOCRされる。
Figure 47 (b) shows the processing performed in each area of the form. In the form's
<機能について>
本実施例においては、上記の実施例にて説明した図8,図9のハードウェア構成図、及び、図10に示した機能構成図を援用できるものとして説明する。
<About the function>
In this embodiment, the hardware configuration diagrams of FIG. 8 and FIG. 9 and the functional configuration diagram shown in FIG. 10 described in the above embodiment can be used.
図48は、本実施例におけるOCR処理部68の機能構成を示す図である。OCR処理部68は第一OCR処理部68a、第二OCR処理部68b、及び、第三OCR処理部68cを有している。
Figure 48 is a diagram showing the functional configuration of the
第一OCR処理部68aは、漢字の文字認識を行う。第二OCR処理部68bは日付の文字認識を行う。第三OCR処理部68cは、英数字の文字認識を行う。第一OCR処理部68a~第三OCR処理部68cは、それぞれ機械学習により、漢字、日付、又は、英数字の画像と文字コードの対応を学習した識別装置である。
The first
機械学習とは、コンピュータに人のような学習能力を獲得させるための技術であり、コンピュータが,データ識別等の判断に必要なアルゴリズムを、事前に取り込まれる学習データから自律的に生成し、新たなデータについてこれを適用して予測を行う技術のことをいう。機械学習のための学習方法は、教師あり学習、教師なし学習、半教師学習、強化学習、深層学習のいずれかの方法でもよく、さらに、これらの学習方法を組み合わせた学習方法でもよく、機械学習のための学習方法は問わない。 Machine learning is a technology that allows computers to acquire human-like learning capabilities, in which the computer autonomously generates algorithms necessary for judgments such as data identification from training data that is previously loaded, and applies these to new data to make predictions. The learning method for machine learning may be any of supervised learning, unsupervised learning, semi-supervised learning, reinforcement learning, and deep learning, or a combination of these learning methods. Any learning method for machine learning is acceptable.
また、表5に示すように、本実施例では設定ファイルに、領域の色とOCR言語が対応付けられている。 Also, as shown in Table 5, in this embodiment, the configuration file associates area colors with OCR languages.
第一OCR処理部68aは、領域が緑色の場合、漢字を文字認識する。第二OCR処理部68bは、領域が青色の場合、日付を文字認識する。第三OCR処理部68cは、領域が赤色の場合、英数字を文字認識する。
The
したがって、本実施例では、領域に記載される漢字、日付、及び、英数字に応じて認識対象が制限されるので、認識精度を向上できる。 Therefore, in this embodiment, the recognition targets are limited according to the kanji characters, dates, and alphanumeric characters written in the area, improving recognition accuracy.
なお、OCRの種類(認識対象)は、これらに限らず、郵便番号、メールアドレス、半角英数、数字(電話番号や郵便番号等、数字と数字の間にハイフンがない形式)、数字(電話番号や郵便番号等、数字と数字の間にハイフンがある形式)、又は、URL等でもよい。また、本実施例で漢字という場合、ひらがなとカタカナの文字列を含む。また、各種の言語(英語、フランス語、ドイツ語、中国語、アラビア語等)が認識対象でもよい。 Note that the types of OCR (recognition targets) are not limited to these, and may include postal codes, email addresses, half-width alphanumeric characters, numbers (telephone numbers, postal codes, etc., in a format without hyphens between numbers), numbers (telephone numbers, postal codes, etc., in a format with hyphens between numbers), or URLs. In this embodiment, kanji includes strings of hiragana and katakana. Various languages (English, French, German, Chinese, Arabic, etc.) may also be recognized.
<アプリ処理情報>
次に、アプリ処理情報の詳細について説明する。図11については本実施例でも同様である。
<Application processing information>
Next, the application processing information will be described in detail. The same applies to the present embodiment with respect to FIG.
図49は、アプリが行う一連の処理を模式的に示す図である。図49の説明においては、主に図12との相違を説明する。図49(c)は帳票の領域からデータを出力するアプリ(例えば、経費精算書アプリ)の一連の処理を示す。本実施例では、設定ファイルに設定されたOCR言語(認識対象)に応じて漢字、日時、及び、英数字のOCRが行われる。 Figure 49 is a diagram that shows a schematic of a series of processes performed by an app. In explaining Figure 49, differences from Figure 12 will be mainly explained. Figure 49 (c) shows a series of processes of an app that outputs data from an area of a form (e.g., an expense report app). In this embodiment, OCR of kanji, date and time, and alphanumeric characters is performed according to the OCR language (recognition target) set in the configuration file.
<色と処理の対応の設定ファイルへの登録>
次に、図50を参照して、管理者8による色と処理の対応の設定、及び、設定ファイルの作成について説明する。
<Registering the correspondence between colors and processing in the configuration file>
Next, the setting of the correspondence between colors and processes by the
図50は、登録用紙を用いた色と処理の対応の設定方法を説明する図である。図50の説明では主に図13との相違を説明する。図50(a)は管理者8がマーカーペンで着色する前の登録用紙である。登録用紙の原紙は外部サービスシステム40に登録されている。
Figure 50 is a diagram explaining how to set the correspondence between colors and processes using a registration form. The explanation of Figure 50 will mainly focus on the differences from Figure 13. Figure 50 (a) shows the registration form before the
登録用紙の1行目には各列の項目(1列目:マーカー色、2列目:処理)が記載されている。なお、本実施例では「処理」は3種類(漢字をOCR・日時をOCR・英数字をOCR)あり、登録用紙には、2行目:漢字をOCR、3行目:日時をOCR、4行目:英数字をOCRという処理が予め設定されている。原始の状態の登録用紙のマーカー色のセル130は空欄である。
The first line of the registration form lists the items for each column (first column: marker color, second column: process). In this embodiment, there are three types of "processing" (OCR kanji, OCR date and time, and OCR alphanumeric characters), and the registration form has the following pre-set processes: second line: OCR kanji, third line: OCR date and time, and fourth line: OCR alphanumeric characters. The
図50(b)は各処理に対し、管理者8がセル130にマーカーペンで着色した図である。管理者8は、所有しているマーカーペンのうち、例えば、緑、青、赤のマーカーペンを使用することとする。管理者8が、漢字をOCRには緑、日時をOCRには青、英数字をOCRには赤を割り当てる。登録用紙の原紙の行間には、各色が滲むことで混色を起こさないように、所定の間隔が設けられている。
Figure 50 (b) shows the
管理者8は、自ら決定した所望のマーカー色と各処理との割り当てにしたがって、所有しているマーカーペンで登録用紙のセル130を着色する。登録用紙を機器20がスキャンすることで、マーカー色と処理の対応が情報処理システム10に登録される。
The
<機器の画面例>
機器20の画面例は図14と同様でよい。管理者8が登録用紙を使って、色と処理の対応を設定ファイルに登録する手順を示すシーケンス図は図15と同様でよい。ただし、ステップS12の処理が異なっている。
<Device screen example>
An example of the screen of the
S12:色検出部73は、画像データの予め決まっているセル130から色情報を検出する。
S12: The
図51は、色情報の検出を模式的に示す図である。図51の説明では主に図16との相違を説明する。図51(a)に示すように、漢字をOCRの処理は対角を示す2つの位置座標AB(位置情報の一例)の矩形内の色により決定され、日時をOCRの処理は同じく位置座標CDの矩形内の色により決定され、英数字をOCRの処理は位置座標EFの矩形内の色により決定される。 Figure 51 is a diagram that shows a schematic diagram of detection of color information. The explanation of Figure 51 will mainly focus on the differences from Figure 16. As shown in Figure 51 (a), the OCR processing of kanji characters is determined by the color within a rectangle at two diagonal position coordinates AB (an example of position information), the OCR processing of date and time is similarly determined by the color within a rectangle at position coordinates CD, and the OCR processing of alphanumeric characters is determined by the color within a rectangle at position coordinates EF.
図51(b)に示すように、バーコード101又はアプリデータ管理部41は処理と着色されるセル130の位置座標を対応付けて保持している。色検出部73はHSVのHの値を図51(b)の位置座標に基づいて、各セル130からそれぞれ取得する。英数字をOCRに対応付けられているセル130から赤に対応する色(H=(0~60°,301~360°))が検出された場合、色検出部73はHSVでH=(0~60°,301~360°)を、英数字をOCRと対応付けて設定ファイルに登録する。漢字をOCRに対応付けられているセル130から緑に対応する色(H=(61~180°))が検出された場合、色検出部73はH=(61~180°)を、漢字をOCRと対応付けて設定ファイルに登録する。日時をOCRに対応付けられているセル130から青に対応する色(H=(181~300°))が検出された場合、色検出部73はH=(181~300°)を、日時をOCRと対応付けて設定ファイルに登録する。
As shown in FIG. 51(b), the
なお、色と処理を対応付ける方法には、図45で説明した管理サイト150を管理者が使用する方法もある。
Associating colors with processes can also be done by an administrator using the
<<処理によるファイル名の指定>>
本実施例においても、登録用紙への着色により管理者8がCSVファイルのファイル名を設定できる。
<<Specifying file name by process>>
In this embodiment as well, the
図52は、処理をファイル名の設定に応用した登録用紙の使用例を示す。図52の説明では主に図17との相違を説明する。処理がOCRに限定されているのは図17と同様である。図52(a)の登録用紙は処理としてOCR1,OCR2と、ファイル名に使用する順番「ファイル名1」「ファイル名2」が設定されている。
Figure 52 shows an example of the use of a registration form where processing is applied to setting file names. The explanation of Figure 52 will mainly focus on the differences from Figure 17. As with Figure 17, processing is limited to OCR. The registration form in Figure 52(a) has OCR1 and OCR2 set as processing, and the order to be used for file names, "
図52(b)に示すように、管理者8はファイル名1に使用するマーカーペンの色(例えば緑)、ファイル名2に使用するマーカーペンの色(例えば青)をマーカーペンで指定する。
As shown in FIG. 52(b), the
図52(c)に示すように、色を示す数値と処理(ファイル名に使用)が設定ファイルに対応付けられる。色と処理の対応付ける2つの方法は図17と同様でよい。 As shown in FIG. 52(c), a numerical value indicating a color and a process (used in the file name) are associated with a setting file. The two methods for associating a color with a process can be the same as those shown in FIG. 17.
図53は、色と処理を対応付けるための管理サイト152の一例である。管理者8はラジオボタン153でファイル名の指定に使用する色を登録できる。この場合、ユーザーが使用するマーカーペンの色が3つに限られる。
Figure 53 is an example of a
図52(c)に示すように、マーカー色(緑)を識別する数値とファイル名1が対応付けられる。マーカー色(青)を識別する数値とファイル名2が対応付けられている。なお、ファイル名1,2はファイル名に使用される順番である。
As shown in FIG. 52(c), the numeric value identifying the marker color (green) is associated with
図54は、管理者8がマーカーペンで2か所に領域指定した帳票の一例である。図54(a)は帳票の原紙を、図54(b)はマーカーペンで着色された帳票である。機器20が図54(b)の帳票をスキャンすることで、情報処理システム10が帳票における着色領域を特定し、設定ファイルに領域情報を登録する。
Figure 54 is an example of a form on which the
図54(b)では、「氏名」の領域172が緑のマーカーペンで領域指定され、申請日の領域173が青のマーカーペンで領域指定されている。例えば、氏名が「理工太郎」、申請日が「2020/10/10」だとすると、図54(b)の帳票を機器20がスキャンした場合のCSVファイルのファイル名は「理工太郎20201010.csv」となる。なお、ファイル名に指定されるマーカーペンの色は3つ以上でもよい。
In FIG. 54(b), the "Name"
また、必ずしもファイル名に使用する領域の順番(ファイル1,2)までは登録しなくてもよい。この場合、データ保存部66は設定ファイルにおける色の登録順にファイル名を設定すればよい。したがって、登録用紙のセルごとにマーカーペンの色を変えなくてもよい。
Also, it is not necessary to register the order of the areas used in the file names (
<<登録用紙の変形例>>
図55に示すように登録用紙に予めCSV位置が登録されていてもよい。図55の説明においては主に図20との相違を説明する。図55(a)は着色前の登録用紙である。この登録用紙にはCSV列名154とCSV位置155の列があるので、管理者が設定ファイルに手でCSV位置を設定する必要がない。
<<Modifications of the registration form>>
As shown in Figure 55, the CSV location may be registered in advance on the registration form. In the explanation of Figure 55, the differences from Figure 20 will be mainly explained. Figure 55(a) shows the registration form before coloring. This registration form has columns for
図55(b)は着色後の登録用紙である。図55(b)の登録用紙を機器20がスキャンする。図55(c)は色と処理と領域情報が対応付けられた設定ファイルの一部である。
Figure 55(b) shows the registration form after coloring. The registration form in Figure 55(b) is scanned by
<領域情報の登録>
続いて、図56等を参照し、領域情報の登録について説明する。図56は、帳票における領域のマーキング方法を説明する図である。まず、図56(a)は、マーカーペンで領域指定する前の帳票(原紙)である。帳票の原紙に対し、管理者8は、登録用紙で登録した処理を実行させたい領域に登録した色のマーカーペンで領域指定を行う。例えば、管理者8は、氏名の領域172を、漢字をOCRする領域に、申請日の領域173を、日時をOCRする領域に、社員番号の領域174を、英数字をOCRする領域に、設定したいとする。
<Registration of area information>
Next, the registration of area information will be described with reference to FIG. 56 and the like. FIG. 56 is a diagram for explaining a method of marking an area on a form. First, FIG. 56(a) shows a form (original paper) before the area is designated with a marker pen. On the original paper of the form, the
図56(b)はマーカーペンで領域に着色された帳票用紙である。社員の領域172が緑のマーカーペンで着色されている。申請日の領域173が青のマーカーペンで着色されている。社員番号の領域174が赤のマーカーペンで着色されている。この帳票用紙を機器20がスキャンすることで、帳票に対する領域と処理の関連が、設定ファイルに登録される。
Figure 56 (b) shows a form with areas colored with a marker pen. The
表5の設定ファイルによれば、第一OCR処理部68aは、氏名の領域172を、漢字を認識対象としてOCR処理して、取得データを生成する。第二OCR処理部68bは、英数の領域173を、日時を認識対象としてOCR処理して、取得データを生成する。第三OCR処理部68cは、社員番号の領域174を、英数字を認識対象としてOCR処理して、取得データを生成する。
According to the configuration file in Table 5, the first
図56(c)は、ユーザーが必要事項を記入した帳票の一例である。図56(b)の着色状態から、「理工 太郎」、「2020/10/10」、及び、「50412」が取得データとなる。 Figure 56 (c) is an example of a form on which the user has filled in the necessary information. From the colored state in Figure 56 (b), "Riko Taro", "2020/10/10", and "50412" are the acquired data.
<領域登録画面>
図57は、領域情報の登録時に機器20が表示する領域登録画面610の一例である。図57の説明では主に図24との相違を説明する。図57では、帳票でマーキングされている領域が図24とは異なっている。
<Area registration screen>
Fig. 57 is an example of an
なお、管理者8が領域をマーキングした帳票から情報処理システム10が領域情報を取得して、設定ファイルを作成する手順は図25と同様でよい。図26、図27についても実施例1と同様でよい。
The procedure in which the
図58は、設定ファイルと帳票の対応を説明する図である。図58の例では、ID=1の領域情報から取得されたデータはCSV列名の「氏名」と対応することが設定されている。「氏名」はファイル名の一番目に使用される。ID=2の領域情報から取得されたデータはCSV列名の「申請日」と対応することが設定されている。また、申請日のCSV位置が3列2行と設定されているので、ID=2の領域情報から取得されたデータはファイルの3列2行目に書き出される。ID=3の領域情報から取得されたデータはCSV列名の「社員番号」と対応することが設定されている。また、備考のCSV位置が4列2行と設定されているので、ID=3の領域情報から取得されたデータはファイルの4列2行目に書き出される。
Figure 58 is a diagram explaining the correspondence between configuration files and reports. In the example of Figure 58, the data obtained from the area information with ID=1 is set to correspond to the CSV column name "Name". "Name" is used as the first character in the file name. The data obtained from the area information with ID=2 is set to correspond to the CSV column name "Application Date". In addition, since the CSV position of the application date is set to
この後、図29~図36について実施例1と同様でよい。 After this, Figures 29 to 36 can be the same as in Example 1.
<動作手順>
図59は、情報処理システム10が機器20から帳票の画像データを含むPDFファイルを受信し、領域から取得データを取得するシーケンス図の一例である。図59の説明では主に図37との相違を説明する。
<Operation procedure>
Fig. 59 is an example of a sequence diagram in which the
まず、ステップS61~S71の処理は図37と同様でよい。 First, the processing of steps S61 to S71 can be the same as that shown in FIG. 37.
OCR処理の処理対象領域が複数ある場合、ステップS72、S73は処理対象領域の数だけ繰り返し実行される。 If there are multiple areas to be processed by OCR processing, steps S72 and S73 are repeated as many times as there are areas to be processed.
S72:入出力処理部48はアプリ処理情報53に基づいて、処理対象領域の画像を指定して、処理対象領域のOCR処理をOCR処理部68に要求する。本実施例では、入出力処理部48は設定ファイルから取得したフォーマットとOCR言語(漢字、日時、英数字)を処理対象領域に対応づけて指定する。
S72: Based on the
S73:OCR処理部68はフォーマットとOCR言語に対応した認識エンジンで処理対象領域にOCR処理を行う。すなわち、第一OCR処理部68aが漢字を認識し、第二OCR処理部68bは日付を認識し、第三OCR処理部68cは英数字を認識する。OCR処理部68は文字コードに変換されたデータ(OCR処理結果)を入出力処理部48に返す。
S73: The
S78,S79:次に、入出力処理部48はアプリ処理情報53に基づいて、各処理対象領域から取得された取得データ、CSV列名、CSV位置、及び、ファイル名(設定ファイルから取得)を指定して、データ保存部66に取得データを有するファイルの出力を要求する。
S78, S79: Next, the input/output processing unit 48, based on the
以降、ステップS80~S93の処理は図37と同様でよい。 The process from step S80 to S93 can be the same as in Figure 37.
以上で、外部サービスシステムに登録されたCSVファイルとPDFファイルの表示が可能になるが、これらの表示方法は実施例1と同様でよい。 This makes it possible to display CSV files and PDF files registered in the external service system, but the method for displaying these can be the same as in Example 1.
<主な効果>
以上説明したように、本実施例のデータ出力システム100は、実施例1の効果に加え、より詳細な処理の内容と印(色)とを管理者8が登録することができる。領域ごとにOCRの認識対象が設定されるので、OCRの認識精度を向上できる。また、本実施例では登録用紙に管理者がマーキングするという簡単な方法で領域ごとにOCRの認識対象を設定できる。
<Major Effects>
As described above, in addition to the effects of the first embodiment, the
<その他の適用例>
以上、本発明を実施するための最良の形態について実施例を用いて説明したが、本発明はこうした実施例に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
<Other application examples>
The above describes the best mode for carrying out the present invention using examples, but the present invention is not limited to these examples in any way, and various modifications and substitutions can be made within the scope that does not deviate from the gist of the present invention.
例えば、本実施形態では、情報処理システム10が帳票の領域から取得されたデータをファイルに出力したが、ファイル化するのでなくメールで送信してもよいし、機器20に表示させてもよい。
For example, in this embodiment, the
また、図10などの構成例は、端末装置30、機器20、及び情報処理システム10による処理の理解を容易にするために、主な機能に応じて分割したものである。処理単位の分割の仕方や名称によって本願発明が制限されることはない。端末装置30、機器20、及び情報処理システム10の処理は、処理内容に応じて更に多くの処理単位に分割することもできる。また、1つの処理単位が更に多くの処理を含むように分割することもできる。
The configuration examples in FIG. 10 and the like are divided according to main functions to facilitate understanding of the processing by the
また、実施例に記載された装置群は、本明細書に開示された実施形態を実施するための複数のコンピューティング環境のうちの1つを示すものにすぎない。ある実施形態では、情報処理システム10は、サーバクラスタといった複数のコンピューティングデバイスを含む。複数のコンピューティングデバイスは、ネットワークや共有メモリなどを含む任意のタイプの通信リンクを介して互いに通信するように構成されており、本明細書に開示された処理を実施する。
Furthermore, the devices described in the examples are merely illustrative of one of several computing environments for implementing the embodiments disclosed herein. In one embodiment, the
更に、情報処理システム10は、本実施形態で開示された処理ステップ、例えば図37等を様々な組み合わせで共有するように構成できる。例えば、所定のユニットによって実行されるプロセスは、情報処理システム10が有する複数の情報処理装置によって実行され得る。また、情報処理システム10は、1つのサーバ装置にまとめられていても良いし、複数の装置に分けられていても良い。
Furthermore, the
上記で説明した実施形態の各機能は、一又は複数の処理回路によって実現することが可能である。ここで、本明細書における「処理回路」とは、電子回路により実装されるプロセッサのようにソフトウェアによって各機能を実行するようプログラミングされたプロセッサや、上記で説明した各機能を実行するよう設計されたASIC(Application Specific Integrated Circuit)、DSP(Digital Signal Processor)、FPGA(Field Programmable Gate Array)や従来の回路モジュール等のデバイスを含むものとする。 Each function of the embodiments described above can be realized by one or more processing circuits. Here, the term "processing circuit" in this specification includes a processor programmed to execute each function by software, such as a processor implemented by an electronic circuit, and devices such as an ASIC (Application Specific Integrated Circuit), DSP (Digital Signal Processor), FPGA (Field Programmable Gate Array), and conventional circuit modules designed to execute each function described above.
10 情報処理システム
20 機器
30 端末装置
100 データ出力システム
10
Claims (17)
第1の装置におけるユーザーの操作に基づいて、前記処理の内容を識別する印と前記所定の処理とを対応付けた設定情報を保存するデータ保存部と、
前記第1の装置から、ユーザーが付加した前記印を含む所定の原稿の第二の画像データを受信する通信部と、
前記第二の画像データから前記印が含まれる領域を検出する領域検出部と、
検出した領域の位置情報と、領域に含まれる前記印に対応する所定の処理と、前記第1の装置におけるユーザーが選択したアプリケーションと、を対応付けて記憶する管理部と、
第2の装置から受信した第三の画像データに対して、前記第2の装置で選択されたアプリケーションに対応付けられた、位置情報と所定の処理とに基づいて、所定の処理を実行する処理部と、
を有することを特徴とする情報処理システム。 An information processing system that is communicatively connected to one or more devices and executes a predetermined process,
a data storage unit that stores setting information in which a mark for identifying the content of the process is associated with the predetermined process based on an operation by a user of a first device;
a communication unit that receives second image data of a predetermined document including the mark added by a user from the first device;
an area detection unit that detects an area including the mark from the second image data;
a management unit that stores location information of the detected area, a predetermined process corresponding to the mark included in the area, and an application selected by a user of the first device in association with each other;
a processing unit that executes a predetermined process on the third image data received from the second device based on location information and a predetermined process associated with an application selected on the second device;
An information processing system comprising:
前記位置情報の前記領域に形成されている前記印と、前記位置情報の前記領域に対応する前記処理の内容に基づいて、前記データ保存部が前記処理と前記印を対応付けて保存する請求項4または5に記載の情報処理システム。 the first image data includes position information of an area corresponding to the content of the processing;
An information processing system as described in claim 4 or 5, wherein the data storage unit stores the mark formed in the area of the location information and the content of the processing corresponding to the area of the location information in association with the processing .
前記位置情報の前記領域に形成されている前記印と、前記位置情報の前記領域に対応する前記処理の内容に基づいて、前記データ保存部が前記処理と前記印を対応付けて保存する請求項4~6のいずれか1項に記載の情報処理システム。 the information processing system holds position information of an area corresponding to the content of the processing in association with identification information of the first image data;
An information processing system as described in any one of claims 4 to 6, wherein the data storage unit stores the mark formed in the area of the location information and the content of the processing corresponding to the area of the location information in association with the processing.
前記第二の画像データから、前記処理と対応付けられている前記印が形成された領域を検出する領域検出部と、を有し、
前記データ保存部は、前記処理に前記領域の位置情報を対応付けて保存する請求項1~10のいずれか1項に記載の情報処理システム。 a communication unit that receives second image data of a predetermined document from the first device;
an area detection unit that detects an area in which the mark associated with the process is formed from the second image data;
11. The information processing system according to claim 1, wherein the data storage unit stores location information of the area in association with the process.
前記第三の画像データから、前記領域の位置情報により処理対象領域を特定する領域特定部を有し、
前記処理部は、前記処理対象領域に、前記領域の位置情報に対応付けられている前記処理を実行し、
前記データ保存部は、前記処理部が前記処理対象領域を処理することで取得した取得データを出力することを特徴とする請求項11に記載の情報処理システム。 the communication unit receives the third image data of the predetermined document from the second device;
a region specifying unit that specifies a processing target region from the third image data based on position information of the region;
The processing unit executes the processing associated with position information of the processing target area,
The information processing system according to claim 11 , wherein the data storage unit outputs acquired data acquired by the processing unit processing the processing target region.
前記ファイルを外部サービスシステムに保存する外部サービス処理部を有することを特徴とする請求項12に記載の情報処理システム。 The data storage unit outputs a file including the acquired data;
13. The information processing system according to claim 12, further comprising an external service processing unit that stores the file in an external service system.
前記データ保存部は、前記処理部が前記処理対象領域を処理することで取得した取得データを前記ファイルのファイル名に設定することを特徴とする請求項13に記載の情報処理システム。 The process specifies one or more file names;
The information processing system according to claim 13 , wherein the data storage unit sets acquired data acquired by the processing unit processing the processing target region as a file name of the file.
データ保存部が、第1の装置におけるユーザーの操作に基づいて、前記処理の内容を識別する印と前記所定の処理とを対応付けた設定情報を保存するステップと、
通信部が、第1の装置から、ユーザーが付加した前記印を含む所定の原稿の第二の画像データを受信するステップと、
領域検出部が、前記第二の画像データから前記印が含まれる領域を検出するステップと、
管理部が、検出した領域の位置情報と、領域に含まれる前記印に対応する所定の処理と、前記第1の装置におけるユーザーが選択したアプリケーションと、を対応付けて記憶するステップと、
処理部が、第2の装置から受信した第三の画像データに対して、前記第2の装置で選択されたアプリケーションに対応付けられた、位置情報と所定の処理とに基づいて、所定の処理を実行するステップと、
を有することを特徴とする情報処理方法。 An information processing method performed by an information processing system that is communicatively connected to one or more devices and executes a predetermined process, comprising:
a data storage unit storing setting information in which a mark for identifying the content of the process is associated with the predetermined process based on an operation by a user of the first device;
receiving, from a first device, second image data of a predetermined document including the mark added by a user, by a communication unit;
A step of detecting an area including the mark from the second image data by an area detection unit;
a step of storing, by a management unit, position information of the detected area, a predetermined process corresponding to the mark included in the area, and an application selected by a user of the first device in association with each other;
A step of executing a predetermined process on the third image data received from the second device, based on location information and a predetermined process associated with the application selected on the second device, by a processing unit;
13. An information processing method comprising:
第1の装置におけるユーザーの操作に基づいて、前記処理の内容を識別する印と前記所定の処理とを対応付けた設定情報を保存するデータ保存部と、
前記第1の装置から、ユーザーが付加した前記印を含む所定の原稿の第二の画像データを受信する通信部と、
前記第二の画像データから前記印が含まれる領域を検出する領域検出部と、
検出した領域の位置情報と、領域に含まれる前記印に対応する所定の処理と、前記第1の装置におけるユーザーが選択したアプリケーションと、を対応付けて記憶する管理部と、
第2の装置から受信した第三の画像データに対して、前記第2の装置で選択されたアプリケーションに対応付けられた、位置情報と所定の処理とに基づいて、所定の処理を実行する処理部、
として機能させるためのプログラム。 An information processing system that is communicatively connected to one or more devices and executes a predetermined process,
a data storage unit that stores setting information in which a mark for identifying the content of the process is associated with the predetermined process based on an operation by a user of a first device;
a communication unit that receives second image data of a predetermined document including the mark added by a user from the first device;
an area detection unit that detects an area including the mark from the second image data;
a management unit that stores location information of the detected area, a predetermined process corresponding to the mark included in the area, and an application selected by a user of the first device in association with each other;
a processing unit that executes a predetermined process on the third image data received from the second device based on location information and a predetermined process associated with the application selected on the second device;
A program to function as a
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PCT/IB2022/051819 WO2022189899A1 (en) | 2021-03-12 | 2022-03-02 | Information processing system, processing method, and recording medium |
| EP22714534.9A EP4305606A1 (en) | 2021-03-12 | 2022-03-02 | Information processing system, processing method, and recording medium |
| US18/281,310 US20240161451A1 (en) | 2021-03-12 | 2022-03-02 | Information processing system, processing method, and recording medium |
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021040561 | 2021-03-12 | ||
| JP2021040561 | 2021-03-12 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2022140208A JP2022140208A (en) | 2022-09-26 |
| JP7703902B2 true JP7703902B2 (en) | 2025-07-08 |
Family
ID=83400056
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021090252A Active JP7703902B2 (en) | 2021-03-12 | 2021-05-28 | DATA OUTPUT SYSTEM, INFORMATION PROCESSING SYSTEM, INFORMATION PROCESSING METHOD, AND PROGRAM |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7703902B2 (en) |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010211465A (en) | 2009-03-10 | 2010-09-24 | Canon Inc | Apparatus, method and program for processing image |
| JP2019040250A (en) | 2017-08-22 | 2019-03-14 | キヤノン株式会社 | Device for setting a file name or the like in a scanned image, its control method and program |
-
2021
- 2021-05-28 JP JP2021090252A patent/JP7703902B2/en active Active
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010211465A (en) | 2009-03-10 | 2010-09-24 | Canon Inc | Apparatus, method and program for processing image |
| JP2019040250A (en) | 2017-08-22 | 2019-03-14 | キヤノン株式会社 | Device for setting a file name or the like in a scanned image, its control method and program |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2022140208A (en) | 2022-09-26 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US9454696B2 (en) | Dynamically generating table of contents for printable or scanned content | |
| JP7731634B2 (en) | Information processing device, and control method and program thereof | |
| US11887391B2 (en) | Information processing system, data output system, image processing method, and recording medium | |
| JP7196600B2 (en) | Information processing system, server device, information processing method, and program | |
| US20240161451A1 (en) | Information processing system, processing method, and recording medium | |
| JP7476572B2 (en) | Service providing system, information processing system, information processing method, and program | |
| US11310372B2 (en) | Service providing system, information processing system, and information processing method for transmitting data to application with authority to store in external service system | |
| JP7703902B2 (en) | DATA OUTPUT SYSTEM, INFORMATION PROCESSING SYSTEM, INFORMATION PROCESSING METHOD, AND PROGRAM | |
| US20240193975A1 (en) | Image processing apparatus, image processing method, and storage medium | |
| JP7677490B2 (en) | Image processing system, information processing system, image processing method, and program | |
| JP7666451B2 (en) | Data output system, data output method, and program | |
| CN107770399A (en) | Image processing apparatus and control method | |
| US20220086287A1 (en) | Process executing system, information processing system, information processing method, and recording medium | |
| JP7124859B2 (en) | data output system, information processing system, data output method, program | |
| JP7540214B2 (en) | Printing system, program and client terminal | |
| JP7388411B2 (en) | Information processing system, communication system, information processing method | |
| CN108540685A (en) | Electronic-seal device and electronic-seal method | |
| US20240323306A1 (en) | Information processing apparatus, control method for information processing apparatus, and storage medium | |
| JP7622803B2 (en) | Information processing system, service providing system, information processing method, and program | |
| US20250014375A1 (en) | Information processing apparatus, control method for information processing apparatus, and storage medium | |
| JP7342472B2 (en) | Information processing system, information processing method | |
| JP2024034740A (en) | Image processing device, image processing system, image processing method, and program | |
| JP2024134885A (en) | Information processing system, presentation method, and program | |
| JP2023035045A (en) | Information processing apparatus and program | |
| WO2022162867A1 (en) | Printing method, electronic apparatus, program, server, and image-forming device |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240227 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20241219 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250121 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250319 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250527 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250609 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7703902 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |