Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7790482B2 - Image Processing Device - Google Patents
[go: Go Back, main page]

JP7790482B2 - Image Processing Device - Google Patents

Image Processing Device

Info

Publication number
JP7790482B2
JP7790482B2 JP2024110775A JP2024110775A JP7790482B2 JP 7790482 B2 JP7790482 B2 JP 7790482B2 JP 2024110775 A JP2024110775 A JP 2024110775A JP 2024110775 A JP2024110775 A JP 2024110775A JP 7790482 B2 JP7790482 B2 JP 7790482B2
Authority
JP
Japan
Prior art keywords
item
area
control unit
unit
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2024110775A
Other languages
Japanese (ja)
Other versions
JP2025056712A (en
Inventor
加奈子 森本
浩介 滝
舟寧 杜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2024110775A priority Critical patent/JP7790482B2/en
Publication of JP2025056712A publication Critical patent/JP2025056712A/en
Application granted granted Critical
Publication of JP7790482B2 publication Critical patent/JP7790482B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Facsimiles In General (AREA)

Description

本発明は、画像処理装置に関する。 The present invention relates to an image processing device.

従来、原稿としての身分証を読み取り、その読み取りで得られる画像データのうち個人情報の領域をマスキングする画像処理装置が知られている。このような画像処理装置は、たとえば、特許文献1に開示されている。 Conventionally, image processing devices are known that scan an identification card as a document and mask areas containing personal information from the image data obtained by the scan. Such an image processing device is disclosed, for example, in Patent Document 1.

特開2021-197682号公報Japanese Patent Application Laid-Open No. 2021-197682

たとえば、身分証に記載の個人情報は複数の項目に分類される。項目としては、名前および住所などがある。このような身分証では、読み取りで得られる画像データのうち指定項目に対応する領域だけをマスキングしたい場合がある。なお、マスキングしたい領域はユーザーによって異なる。 For example, the personal information written on an ID card is categorized into several items. These items include name and address. With such an ID card, it may be desirable to mask only the areas of the image data obtained by scanning that correspond to specified items. Note that the areas that need to be masked will vary depending on the user.

ここで、所定種類の身分証だけを対象とする場合には、マスキングすべき領域(言い換えると、身分証の画像データ内での位置)を予め設定しておけばよい。これにより、読み取った身分証が所定種類である場合には、身分証の画像データのうち指定項目に対応する領域だけがマスキングされる。 Here, if you are only targeting a specific type of ID, you can set the area to be masked (in other words, the position within the image data of the ID) in advance. This means that if the scanned ID is of the specified type, only the area of the image data of the ID that corresponds to the specified item will be masked.

しかし、所定種類とは異なる種類の身分証を読み取ってマスキングする場合には、その都度、マスキングすべき領域を設定する必要がある。このため、ユーザーにとっては、煩わしく利便性が悪い。 However, when scanning and masking a type of ID card that is different from the specified type, it is necessary to set the area to be masked each time. This is cumbersome and inconvenient for users.

本発明は、上記課題を解決するためになされたものであり、原稿の読み取りで得られる画像データのうちユーザー指定の項目に対応する領域だけを容易にマスキングすることが可能な画像処理装置を提供することを目的とする。 The present invention has been made to solve the above problem, and aims to provide an image processing device that can easily mask only the areas of image data obtained by scanning a document that correspond to items specified by the user.

上記目的を達成するため、本発明の一局面による画像処理装置は、個人情報に関する項目の項目名および項目値のセットが複数記載された原稿を読み取る画像読取部と、マスキング対象の項目である対象項目を認識し、画像読取部による原稿の読み取りで得られる画像データに対してマスキング処理を行うことにより、画像データ内に存在する対象項目の領域のうち少なくとも一部がマスキングされたマスキング済みデータを生成する制御部と、情報を表示し、操作を受け付ける操作表示部と、を備える。操作表示部は、いずれかの項目を指定する項目指定操作を受け付ける。制御部は、項目指定操作で指定された項目を対象項目と認識し、画像データ内に存在する対象項目の領域のうち少なくとも項目値の領域をマスキングしてマスキング済みデータを生成する処理をマスキング処理として行う。 To achieve the above object, an image processing device according to one aspect of the present invention includes an image reading unit that reads a document containing multiple sets of item names and item values for personal information items; a control unit that recognizes target items that are to be masked and performs a masking process on image data obtained by reading the document with the image reading unit, thereby generating masked data in which at least a portion of the area of the target item present in the image data is masked; and an operation display unit that displays information and accepts operations. The operation display unit accepts an item designation operation to designate one of the items. The control unit recognizes the item designated in the item designation operation as the target item, and performs the masking process by masking at least the item value area of the area of the target item present in the image data to generate masked data.

本発明の構成では、原稿の読み取りで得られる画像データのうちユーザー指定の項目に対応する領域だけを容易にマスキングすることができる。 The configuration of the present invention makes it easy to mask only the areas of the image data obtained by scanning a document that correspond to user-specified items.

一実施形態の複合機の概略図である。FIG. 1 is a schematic diagram of a multifunction peripheral according to an embodiment. 一実施形態の複合機のブロック図である。FIG. 1 is a block diagram of a multifunction peripheral according to an embodiment. 一実施形態の複合機で読取対象となり得る身分証の一例を模式的に示す図である。1 is a diagram illustrating an example of an identification card that can be read by a multifunction peripheral according to an embodiment; 一実施形態の複合機で実行されるマスキングジョブの流れを示すフローチャートである。10 is a flowchart illustrating the flow of a masking job executed by the multifunction peripheral of an embodiment. 一実施形態の複合機による身分証の読み取りで得られる画像データ内の第1領域を示す図である。1 is a diagram showing a first area in image data obtained by reading an identification card using a multifunction peripheral according to an embodiment; 一実施形態の複合機による身分証の読み取りで得られる画像データ内の第2領域を示す図である。10 is a diagram showing a second area in image data obtained by reading an identification card using the multifunction peripheral of the embodiment; 一実施形態の複合機によるマスキングジョブで生成されるマスキング済みデータを示す図である。FIG. 10 is a diagram illustrating masked data generated by a masking job performed by the multifunction peripheral of the embodiment. 一実施形態の複合機によるマスキングジョブで使用される辞書データの概念図である。FIG. 10 is a conceptual diagram of dictionary data used in a masking job by the multifunction peripheral of an embodiment. 一実施形態の複合機で行われる領域判定処理の流れを示すフローチャートである。10 is a flowchart illustrating a flow of an area determination process performed in the multifunction peripheral according to an embodiment. 一実施形態の複合機で行われる第1異常対策処理の流れを示すフローチャートである。10 is a flowchart illustrating a flow of a first abnormality countermeasure process performed in the multifunction peripheral according to an embodiment. 一実施形態の複合機で行われる第2および第3異常対策処理の流れを示すフローチャートである。10 is a flowchart illustrating a flow of second and third abnormality countermeasure processes performed in the multifunction peripheral of an embodiment. 一実施形態の複合機で行われる第2異常対策処理の流れを示すフローチャートである。10 is a flowchart illustrating a flow of a second abnormality countermeasure process performed in the multifunction peripheral according to an embodiment. 一実施形態の複合機で行われる第3異常対策処理の流れを示すフローチャートである。10 is a flowchart illustrating a flow of a third abnormality countermeasure process performed in the multifunction peripheral according to an embodiment. 一実施形態の複合機によるマスキングジョブの設定受付時に行われる処理の流れを示すフローチャートである。10 is a flowchart illustrating a process flow performed when a masking job setting is accepted by the multifunction peripheral of an embodiment. 一実施形態の複合機が表示する受付画面を示す図である。FIG. 10 illustrates a reception screen displayed by the multifunction peripheral according to an embodiment. 一実施形態の複合機が表示する登録画面を示す図である。FIG. 10 illustrates a registration screen displayed by the multifunction peripheral according to an embodiment.

<複合機の構成>
以下、図1~図16を参照し、本発明の一実施形態による画像処理装置について、スキャン機能、印刷機能および送信機能など複数種の機能を有する複合機100を例にとって説明する。
<Configuration of the multifunction device>
An image processing apparatus according to an embodiment of the present invention will be described below with reference to FIGS. 1 to 16, taking as an example a multifunction peripheral 100 having multiple functions such as a scanning function, a printing function, and a transmission function.

図1に示すように、複合機100(「画像処理装置」に相当)は、印刷部1を備える。印刷部1は、複合機100の本体を構成する。印刷部1は、シートSに画像を印刷する。印刷部1の印刷方式は、電子写真方式である。ただし、これに限定されない。印刷部1の印刷方式は、インクジェット方式であってもよい。 As shown in FIG. 1, the multifunction device 100 (corresponding to an "image processing device") includes a printing unit 1. The printing unit 1 constitutes the main body of the multifunction device 100. The printing unit 1 prints an image on a sheet S. The printing method of the printing unit 1 is an electrophotographic method. However, this is not limited to this. The printing method of the printing unit 1 may also be an inkjet method.

印刷部1は、複合機100に入力された画像データに基づく画像を形成する。また、印刷部1は、シート搬送路に沿ってシートSを搬送する。印刷部1は、搬送中のシートSに画像を印刷する。図1では、シート搬送路を破線で示す。 The printing unit 1 forms an image based on image data input to the multifunction device 100. The printing unit 1 also transports a sheet S along a sheet transport path. The printing unit 1 prints an image on the sheet S as it is being transported. In Figure 1, the sheet transport path is indicated by a dashed line.

印刷部1は、給紙ローラー11を備える。給紙ローラー11は、シートカセットCAに収容されたシートSに当接し、その状態で回転する。これにより、給紙ローラー11は、シートカセットCAからシート搬送路にシートSを給紙する。 The printing unit 1 is equipped with a paper feed roller 11. The paper feed roller 11 contacts the sheet S stored in the sheet cassette CA and rotates in this state. As a result, the paper feed roller 11 feeds the sheet S from the sheet cassette CA into the sheet transport path.

印刷部1は、画像形成部12を備える。画像形成部12は、感光体ドラム12aおよび転写ローラー12bを含む。感光体ドラム12aは、その周面上にトナー像を担持する。転写ローラー12bは、感光体ドラム12aに圧接し、感光体ドラム12aとの間で転写ニップを形成する。転写ローラー12bは、感光体ドラム12aと共に回転する。画像形成部12は、転写ニップに進入したシートSを搬送しつつ、シートSにトナー像を転写する。 The printing unit 1 includes an image forming unit 12. The image forming unit 12 includes a photosensitive drum 12a and a transfer roller 12b. The photosensitive drum 12a carries a toner image on its peripheral surface. The transfer roller 12b is pressed against the photosensitive drum 12a, forming a transfer nip between itself and the photosensitive drum 12a. The transfer roller 12b rotates together with the photosensitive drum 12a. The image forming unit 12 transfers the toner image onto the sheet S while transporting the sheet S that has entered the transfer nip.

画像形成部12は、図示しないが、帯電装置、露光装置および現像装置をさらに含む。帯電装置は、感光体ドラム12aの周面を帯電させる。露光装置は、感光体ドラム12aの周面上に静電潜像を形成する。現像装置は、感光体ドラム12aの周面上の静電潜像をトナー像に現像する。 Although not shown, the image forming unit 12 further includes a charging device, an exposure device, and a developing device. The charging device charges the circumferential surface of the photosensitive drum 12a. The exposure device forms an electrostatic latent image on the circumferential surface of the photosensitive drum 12a. The developing device develops the electrostatic latent image on the circumferential surface of the photosensitive drum 12a into a toner image.

印刷部1は、定着部13を備える。定着部13は、加熱ローラー13aおよび加圧ローラー13bを含む。加熱ローラー13aは、ヒーター(図示せず)を内蔵する。加圧ローラー13bは、加熱ローラー13aに圧接し、加熱ローラー13aとの間で定着ニップを形成する。加圧ローラー13bは、加熱ローラー13aと共に回転する。定着部13は、定着ニップに進入したシートSを搬送しつつ、シートSに転写されたトナー像をシートSに定着させる。定着ニップを抜けたシートSは排出トレイETに排出される。 The printing unit 1 includes a fixing unit 13. The fixing unit 13 includes a heating roller 13a and a pressure roller 13b. The heating roller 13a has a built-in heater (not shown). The pressure roller 13b presses against the heating roller 13a, forming a fixing nip between the heating roller 13a and the pressure roller 13b. The pressure roller 13b rotates together with the heating roller 13a. The fixing unit 13 fixes the toner image transferred onto the sheet S to the sheet S while transporting the sheet S that has entered the fixing nip. The sheet S that has exited the fixing nip is discharged onto the discharge tray ET.

また、複合機100は、画像読取部2を備える。画像読取部2は、複合機100の本体上部に配置される。原稿Dの読み取りを伴うジョブでは、画像読取部2に原稿Dがセットされる。画像読取部2は、画像読取部2にセットされた原稿Dを読み取り、読み取った原稿Dの画像データを生成する。 The multifunction device 100 also includes an image reading unit 2. The image reading unit 2 is located on top of the main body of the multifunction device 100. For a job that involves reading an original document D, the original document D is set in the image reading unit 2. The image reading unit 2 reads the original document D set in the image reading unit 2 and generates image data of the read original document D.

画像読取部2は、コンタクトガラスG1およびG2を備える。コンタクトガラスG1およびG2は、画像読取部2の筐体RHに設置される。筐体RHは、上面に開口を有する。コンタクトガラスG1およびG2は、筐体RHの上面の開口に取り付けられる。 The image reading unit 2 includes contact glasses G1 and G2. The contact glasses G1 and G2 are installed in the housing RH of the image reading unit 2. The housing RH has an opening on its top surface. The contact glasses G1 and G2 are attached to the opening on the top surface of the housing RH.

画像読取部2は、原稿搬送装置DPを備える。原稿搬送装置DPは、筐体RHに取り付けられる。原稿搬送装置DPは、複合機100の正面から見て、後側部分を支点とし、前側部分を上下に振るように回動する。原稿搬送装置DPは、筐体RHの上面に対して開閉する。 The image reading unit 2 includes a document transport device DP. The document transport device DP is attached to the housing RH. When viewed from the front of the multifunction device 100, the document transport device DP pivots around its rear portion as a fulcrum, swinging its front portion up and down. The document transport device DP opens and closes relative to the top surface of the housing RH.

原稿搬送装置DPは、原稿DがセットされるセットトレイSTを有する。原稿搬送装置DPは、セットトレイSTにセットされた原稿DをコンタクトガラスG1上に搬送する。 The document transport device DP has a set tray ST on which the document D is set. The document transport device DP transports the document D set on the set tray ST onto the contact glass G1.

搬送読取モードでは、ユーザーによってセットトレイSTに原稿Dがセットされる。そして、原稿搬送装置DPによってコンタクトガラスG1上に自動搬送される原稿D(言い換えると、コンタクトガラスG1上を通過する原稿D)の読み取りが行われる。一方で、載置読取モードでは、ユーザーによってコンタクトガラスG2上に原稿Dがセットされ、コンタクトガラスG2上の原稿Dの読み取りが行われる。 In the transport reading mode, the user places the document D on the set tray ST. The document D is then automatically transported onto the contact glass G1 by the document transport device DP (in other words, the document D passing over the contact glass G1) and read. In the placement reading mode, the user places the document D on the contact glass G2, and the document D on the contact glass G2 is read.

画像読取部2は、光源21、イメージセンサー22、ミラー23およびレンズ24を備える。光源21、イメージセンサー22、ミラー23およびレンズ24は、筐体RHの内部に設置される。画像読取部2は、光源21からコンタクトガラスG1またはG2に向けて光を照射し、イメージセンサー22で光電変換するスキャン動作を行う。 The image reading unit 2 includes a light source 21, an image sensor 22, a mirror 23, and a lens 24. The light source 21, the image sensor 22, the mirror 23, and the lens 24 are installed inside the housing RH. The image reading unit 2 performs a scanning operation in which light is irradiated from the light source 21 toward the contact glass G1 or G2 and photoelectrically converted by the image sensor 22.

光源21は、複数のLED素子を有する。複数のLED素子は、主走査方向(図1の紙面に垂直な方向)にライン状に配列される。イメージセンサー22は、主走査方向に並ぶ複数の光電変換素子を有する。ミラー23は、レンズ24に向けて光を反射する。レンズ24は、ミラー23で反射された光を集光し、イメージセンサー22に導く。 The light source 21 has multiple LED elements. The multiple LED elements are arranged in a line in the main scanning direction (the direction perpendicular to the paper surface of Figure 1). The image sensor 22 has multiple photoelectric conversion elements lined up in the main scanning direction. The mirror 23 reflects light toward the lens 24. The lens 24 collects the light reflected by the mirror 23 and guides it to the image sensor 22.

光源21よびミラー23は、主走査方向と直交する副走査方向(図1の左右方向)に移動可能なキャリッジ25に設置される。キャリッジ25が副走査方向に移動することにより、画像読取部2による読取ラインが副走査方向に移動する。 The light source 21 and mirror 23 are mounted on a carriage 25 that can move in a sub-scanning direction (left and right in Figure 1) that is perpendicular to the main scanning direction. As the carriage 25 moves in the sub-scanning direction, the reading line of the image reading unit 2 moves in the sub-scanning direction.

また、図2に示すように、複合機100は、操作表示部3を備える。操作表示部3は、タッチスクリーンを有する操作パネルである。操作表示部3は、ソフトウェアボタンおよびメッセージなどをタッチスクリーンに表示する。操作表示部3には、複数のハードウェアボタンも設けられる。操作表示部3は、ユーザーから操作を受け付ける。ユーザーは、操作表示部3を介して、複合機100に対し、後述するマスキングジョブなど種々のジョブに関して設定を行える。 As shown in FIG. 2, the multifunction device 100 also includes an operation display unit 3. The operation display unit 3 is an operation panel with a touch screen. The operation display unit 3 displays software buttons, messages, and the like on the touch screen. The operation display unit 3 also has a plurality of hardware buttons. The operation display unit 3 accepts operations from the user. The user can use the operation display unit 3 to configure the multifunction device 100 for various jobs, such as a masking job, which will be described later.

複合機100は、制御部10を備える。制御部10は、CPU、ASICおよびメモリーなどを含む。制御部10は、画像処理回路を含む。制御部10は、画像データに対して種々の画像処理を行う。また、制御部10は、印刷部1によるシートSへの画像の印刷を制御するとともに、画像読取部2による原稿Dの読み取りを制御する。 The multifunction device 100 includes a control unit 10. The control unit 10 includes a CPU, an ASIC, a memory, and the like. The control unit 10 also includes an image processing circuit. The control unit 10 performs various image processing operations on image data. The control unit 10 also controls the printing of an image onto a sheet S by the printing unit 1, and the reading of an original D by the image reading unit 2.

また、制御部10は、操作表示部3を制御する。具体的には、制御部10は、タッチスクリーンの表示動作を制御する。制御部10は、ソフトウェアボタンおよびハードウェアボタンに対する操作を検知する。制御部10は、操作表示部3がユーザーから受け付けた操作に基づき、ジョブの設定を行う。 The control unit 10 also controls the operation and display unit 3. Specifically, the control unit 10 controls the display operation of the touch screen. The control unit 10 detects operations on the software buttons and hardware buttons. The control unit 10 sets jobs based on operations received from the user by the operation and display unit 3.

複合機100は、記憶部101を備える。記憶部101は、不揮発性の記憶デバイスである。記憶部101として、HDDおよびSSDなどを用いてもよい。記憶部101は、制御部10に接続される。制御部10は、記憶部101への情報の書き込みおよび記憶部101からの情報の読み出しを行う。 The multifunction device 100 includes a storage unit 101. The storage unit 101 is a non-volatile storage device. An HDD, SSD, or the like may be used as the storage unit 101. The storage unit 101 is connected to the control unit 10. The control unit 10 writes information to the storage unit 101 and reads information from the storage unit 101.

記憶部101は、所定の情報を予め記憶する。たとえば、記憶部101は、文字認識プログラムを予め記憶する。制御部10は、文字認識プログラムに基づき、OCR(Optical Character Recognition)処理のような文字認識処理を行う。制御部10は、画像読取部2による原稿Dの読み取りで得られた画像データを文字認識処理の3.対象とする。 The memory unit 101 stores predetermined information in advance. For example, the memory unit 101 stores a character recognition program in advance. The control unit 10 performs character recognition processing such as OCR (Optical Character Recognition) processing based on the character recognition program. The control unit 10 subjects the image data obtained by reading the document D with the image reading unit 2 to character recognition processing.

複合機100は、通信部102を備える。通信部102は、複合機100に外部機器を通信可能に接続するためのインターフェースである。通信部102は、通信用回路、通信用メモリーおよび通信用コネクターなどを含む。通信部102は、制御部10に接続される。制御部10は、通信部102を用いて、外部機器との間でデータを送受信する。 The multifunction device 100 includes a communication unit 102. The communication unit 102 is an interface for communicatively connecting an external device to the multifunction device 100. The communication unit 102 includes a communication circuit, communication memory, and communication connector. The communication unit 102 is connected to the control unit 10. The control unit 10 uses the communication unit 102 to send and receive data to and from the external device.

通信部102は、LANおよびインターネットなどのネットワークNTを介して、外部機器と通信可能に接続される。通信部102は、図示しないが、通信ケーブルを介して、外部機器と直接接続されてもよい。通信部102に接続される外部機器は、たとえば、複合機100のユーザーにより使用されるパーソナルコンピューター1000(以下、PC1000と称する)である。PC1000とは別の外部機器が複合機100に通信可能に接続されてもよい。複合機100にPC1000を接続することにより、画像読取部2による原稿Dの読み取りで得られる原稿Dの画像データをPC1000に送信できる。これにより、原稿Dの画像データをPC1000に保存できる。 The communication unit 102 is communicatively connected to external devices via a network NT such as a LAN or the Internet. Although not shown, the communication unit 102 may also be directly connected to external devices via a communication cable. An external device connected to the communication unit 102 is, for example, a personal computer 1000 (hereinafter referred to as PC 1000) used by a user of the multifunction device 100. An external device other than PC 1000 may also be communicatively connected to the multifunction device 100. By connecting the PC 1000 to the multifunction device 100, image data of the original D obtained by scanning the original D with the image reading unit 2 can be sent to the PC 1000. This allows the image data of the original D to be saved in the PC 1000.

<マスキングジョブの概要>
商品およびサービスなどの契約に際し、契約希望者に対して個人情報の登録を要求する場合がある。これは一例であり、個人情報の登録が必要なケースは他にも種々ある。個人情報としては、名前、住所および生年月日などが挙げられる。
<Masking job overview>
When entering into a contract for goods or services, the person wishing to enter into the contract may be required to register personal information. This is just one example, and there are various other cases where registration of personal information is required. Examples of personal information include name, address, and date of birth.

複合機100のユーザーによって個人情報の登録業務が行われる。個人情報を登録するとき、ユーザーは、複合機100のスキャン機能を用いて身分証を読み取る。対象となる身分証の種類は様々であり、国および分野などによって異なる。身分証としては、運転免許証、保険証、学生証およびパスポートなどが挙げられる。 The user of the multifunction device 100 registers personal information. When registering personal information, the user uses the scanning function of the multifunction device 100 to scan their identification card. There are various types of identification cards that can be used, and these vary depending on the country and field. Examples of identification cards include driver's licenses, insurance cards, student ID cards, and passports.

身分証の一例を図3に模式的に示す。身分証には、個人情報が複数の項目に分類されて記載される。すなわち、身分証には、個人情報に関する項目の項目名および項目値のセットが複数記載される。図3に示す例では、「Name」という文字列が項目名に相当し、「aaaa」という文字列が項目名「Name」に対応する項目の項目値に相当する。「Address」という文字列が項目名に相当し、「bbbb」という文字列が項目名「Address」に対応する項目の項目値に相当する。「Date of Birth」という文字列が項目名に相当し、「cccc」という文字列が項目名「Date of Birth」に対応する項目の項目値に相当する。 An example of an ID card is shown schematically in Figure 3. Personal information is classified into multiple items and written on the ID card. That is, the ID card lists multiple sets of item names and item values for items related to personal information. In the example shown in Figure 3, the character string "Name" corresponds to the item name, and the character string "aaaa" corresponds to the item value of the item corresponding to the item name "Name". The character string "Address" corresponds to the item name, and the character string "bbbb" corresponds to the item value of the item corresponding to the item name "Address". The character string "Date of Birth" corresponds to the item name, and the character string "cccc" corresponds to the item value of the item corresponding to the item name "Date of Birth".

図3に示す身分証の読み取りが行われた場合、身分証の読み取りで得られる画像データには、項目名を示す文字列「Name」を含む文字領域と項目値を示す文字列「aaaa」を含む文字領域とが出現する。項目名を示す文字列「Address」を含む文字領域と項目値を示す文字列「bbbb」を含む文字領域とが出現する。項目名を示す文字列「Date of Birth」を含む文字領域と項目値を示す文字列「cccc」を含む文字列とが出現する。 When the ID card shown in Figure 3 is read, the image data obtained by reading the ID card will contain a character area containing the string "Name" indicating the item name and a character area containing the string "aaaa" indicating the item value. A character area containing the string "Address" indicating the item name and a character area containing the string "bbbb" indicating the item value will also appear. A character area containing the string "Date of Birth" indicating the item name and a character area containing the string "cccc" indicating the item value will also appear.

以下の説明では、複数の文字領域を区別する必要がある場合、項目名「Name」の文字領域に符号C11を付し、項目値「aaaa」の文字領域に符号C12を付す。項目名「Address」の文字領域に符号C21を付し、項目値「bbbb」の文字領域に符号C22を付す。項目名「Date of Birth」の文字領域に符号C31を付し、項目値「cccc」の文字領域に符号C32を付す。 In the following explanation, when it is necessary to distinguish between multiple character areas, the character area for the item name "Name" is assigned the code C11, and the character area for the item value "aaaa" is assigned the code C12. The character area for the item name "Address" is assigned the code C21, and the character area for the item value "bbbb" is assigned the code C22. The character area for the item name "Date of Birth" is assigned the code C31, and the character area for the item value "cccc" is assigned the code C32.

複合機100での身分証の読み取り後、その読み取りで得られる身分証の画像データに基づく画像(すなわち、身分証に記載されている個人情報)がシートSに印刷される。そして、個人情報が印刷されたシートSが保管される。このようにして、個人情報の登録が行われる。なお、身分証の画像データ(すなわち、電子データ)そのものが保管されてもよい。 After the ID card is read by the multifunction device 100, an image based on the image data of the ID card obtained by the scan (i.e., the personal information written on the ID card) is printed on a sheet S. The sheet S with the printed personal information is then stored. In this manner, the personal information is registered. Note that the image data (i.e., electronic data) of the ID card itself may also be stored.

ここで、場合によっては、一部の個人情報をマスキングする必要がある。たとえば、身分証に生年月日欄がある一方で、商品およびサービスなどの契約においては生年月日が不要であるとする。この例では、生年月日に関する個人情報をマスキングしなければならない場合がある。また、たとえば、国によっては、身分証に宗教欄があるが、宗教に関する個人情報は記録してはいけないと定められている。この例では、宗教に関する個人情報をマスキングしなければならない場合がある。 In some cases, it may be necessary to mask some personal information. For example, suppose an ID card has a field for date of birth, but the date of birth is not required in contracts for goods and services. In this example, it may be necessary to mask personal information related to the date of birth. Also, for example, in some countries, ID cards have a field for religion, but it is stipulated that personal information related to religion should not be recorded. In this example, it may be necessary to mask personal information related to religion.

たとえば、マスキングすべき個人情報を手作業で黒く塗りつぶすことによって当該個人情報を隠匿することが従来から一般的に行われている。しかし、ユーザーにとっては、一部の個人情報を手作業でマスキングすることは煩わしい。 For example, it has traditionally been common to manually black out personal information to conceal it. However, manually masking some personal information can be a hassle for users.

そこで、複合機100には、マスキング機能が搭載される。言い換えると、複合機100は、マスキング機能に関するジョブ(以下、単に「マスキングジョブ」と称する)の実行が可能である。 For this reason, the multifunction device 100 is equipped with a masking function. In other words, the multifunction device 100 is capable of executing jobs related to the masking function (hereinafter simply referred to as "masking jobs").

マスキング機能を利用することにより、身分証のうち一部の個人情報がマスキングされた画像データであるマスキング済みデータを取得できる。マスキング済みデータに基づく画像をシートSに印刷することもできるし、マスキング済みデータをPC1000に送信してPC1000に保存することもできる。 By using the masking function, it is possible to obtain masked data, which is image data in which some of the personal information on an identification card has been masked. An image based on the masked data can be printed on sheet S, or the masked data can be sent to PC 1000 and saved on PC 1000.

マスキングジョブの実行に際し、マスキングジョブの設定が行われる。マスキングジョブの設定では、マスキングすべき個人情報を任意に指定できる。マスキングジョブの設定については、後に詳細に説明する。 When executing a masking job, masking job settings are made. When configuring a masking job, you can specify any personal information to be masked. Masking job settings will be explained in detail later.

マスキングジョブの設定後、ユーザーは、原稿Dとしての身分証を画像読取部2にセットする。その状態で、ユーザーは、操作表示部3に対して、マスキングジョブのスタート操作を行う。操作表示部3に対してスタート操作が行われたことを検知すると、制御部10は、マスキングジョブを開始する。 After setting up the masking job, the user places the ID card as document D into the image reading unit 2. In this state, the user performs a start operation for the masking job on the operation display unit 3. When the control unit 10 detects that a start operation has been performed on the operation display unit 3, it starts the masking job.

以下に、図4に示すフローチャートを参照し、マスキングジョブの流れを説明する。図4に示すフローのスタートは、操作表示部3に対するマスキングジョブのスタート操作を制御部10が検知したときである。 The flow of a masking job will be explained below with reference to the flowchart shown in Figure 4. The flow shown in Figure 4 starts when the control unit 10 detects a start operation for a masking job on the operation display unit 3.

なお、マスキングジョブのスタート操作を行う前、ユーザーは、マスキングジョブの設定を行う。マスキングジョブの設定では、マスキング対象の項目値に対応する項目である対象項目が指定される。制御部10は、マスキングジョブの実行に際し、ユーザーにより指定された対象項目を認識する。 Before starting a masking job, the user configures the masking job. When configuring the masking job, target items are specified, which are items that correspond to the item values to be masked. When executing the masking job, the control unit 10 recognizes the target items specified by the user.

ステップ#1において、制御部10は、原稿Dとしての身分証の読み取りを画像読取部2に行わせる。画像読取部2は、身分証を読み取り、読み取った身分証の画像データ(すなわち、身分証のスキャンデータ)を生成する。制御部10は、画像読取部2による身分証の読み取りで得られた身分証の画像データを取得する。 In step #1, the control unit 10 causes the image reading unit 2 to read an identification card as document D. The image reading unit 2 reads the identification card and generates image data of the read identification card (i.e., scanned data of the identification card). The control unit 10 acquires the image data of the identification card obtained by the image reading unit 2 reading the identification card.

ステップ#2において、制御部10は、機械学習により得られる第1学習モデルを用いて、第1領域検出処理を行う。制御部10は、身分証の画像データから、項目名の領域および項目値の領域のいずれかを個別に含むと予測される第1領域を検出する処理を第1領域検出処理として行う。 In step #2, the control unit 10 performs a first region detection process using a first learning model obtained by machine learning. The control unit 10 performs the first region detection process by detecting a first region that is predicted to individually include either an item name region or an item value region from the image data of the identification card.

第1領域検出処理用の第1学習モデルは、画像読取部2による身分証の読み取りで得られる画像データから第1領域を検出するよう学習された学習モデルである。第1学習モデルは、学習済みモデルであり、記憶部101に予め記憶される。 The first learning model for the first area detection process is a learning model trained to detect the first area from image data obtained by reading an identification card using the image reading unit 2. The first learning model is a trained model and is pre-stored in the memory unit 101.

身分証には、通常、項目名と項目値とのペアが複数記載されている。したがって、第1領域検出処理では、複数の第1領域が検出される。このことから、第1領域検出処理の結果、第1領域が検出されなかった場合、または、第1領域が1つしか検出されなかった場合には、マスキングジョブを停止して、画像読取部2にセットされている原稿Dの確認を促すメッセージを操作表示部3に表示してもよい。 Identification cards typically contain multiple pairs of item names and item values. Therefore, multiple first areas are detected in the first area detection process. For this reason, if no first areas are detected as a result of the first area detection process, or if only one first area is detected, the masking job may be stopped and a message may be displayed on the operation display unit 3 prompting the user to check the document D set in the image reading unit 2.

図3に示す身分証では、項目名「Name」の文字領域C11、項目値「aaaa」の文字領域C12、項目名「Address」の文字領域C21、項目値「bbbb」の文字領域C22、項目名「Date of Birth」の文字領域C31、および、項目値「cccc」の文字領域C32がそれぞれ第1領域として個別に検出される。第1領域を図5に明確に示す。 In the ID card shown in Figure 3, the character area C11 for the item name "Name," the character area C12 for the item value "aaaa," the character area C21 for the item name "Address," the character area C22 for the item value "bbbb," the character area C31 for the item name "Date of Birth," and the character area C32 for the item value "cccc" are each individually detected as first areas. The first areas are clearly shown in Figure 5.

ステップ#3において、制御部10は、機械学習により得られる第2学習モデルを用いて、第2領域検出処理を行う。制御部10は、身分証の画像データから、同一の項目に対応する項目名および項目値の両方の領域を包含すると予測される第2領域を検出する処理を第2領域検出処理として行う。 In step #3, the control unit 10 performs a second region detection process using a second learning model obtained by machine learning. The control unit 10 performs the second region detection process by detecting a second region from the image data of the identification card that is predicted to include both the area of the item name and the area of the item value that correspond to the same item.

第2領域検出処理用の第2学習モデルは、画像読取部2による身分証の読み取りで得られる画像データから第2領域を検出するよう学習された学習モデルである。第2学習モデルは、学習済みモデルであり、記憶部101に予め記憶される。 The second learning model for the second area detection process is a learning model trained to detect the second area from image data obtained by reading an identification card using the image reading unit 2. The second learning model is a trained model and is pre-stored in the memory unit 101.

身分証の読み取りが行われていた場合には、第2領域検出処理の結果として、少なくとも1つの第2領域が検出される。第2領域検出処理で第2領域が検出されなかった場合には、身分証とは別物の読み取りが行われていた可能性がある。したがって、第2領域検出処理で第2領域が検出されなかった場合には、マスキングジョブを停止して、画像読取部2にセットされている原稿Dの確認を促すメッセージを操作表示部3に表示してもよい。 If an identification card has been read, at least one second area will be detected as a result of the second area detection process. If no second area is detected in the second area detection process, it is possible that something other than an identification card has been read. Therefore, if no second area is detected in the second area detection process, the masking job may be stopped, and a message may be displayed on the operation display unit 3 prompting the user to check the document D set in the image reading unit 2.

図5に示す例では、図6に示す領域C10、C20およびC30は第2領域として検出される。具体的には、項目名「Name」の文字領域C11および項目値「aaaa」の文字領域C12を包含する単一の領域C10が第2領域として検出される。項目名「Address」の文字領域C21および項目値「bbbb」の文字領域C22を包含する単一の領域C20が第2領域として検出される。項目名「Date of Birth」の文字領域C31および項目値「cccc」の文字領域C32を包含する単一の領域C30が第2領域として検出される。 In the example shown in Figure 5, areas C10, C20, and C30 shown in Figure 6 are detected as second areas. Specifically, the single area C10 that includes the character area C11 of the item name "Name" and the character area C12 of the item value "aaaa" is detected as the second area. The single area C20 that includes the character area C21 of the item name "Address" and the character area C22 of the item value "bbbb" is detected as the second area. The single area C30 that includes the character area C31 of the item name "Date of Birth" and the character area C32 of the item value "cccc" is detected as the second area.

ステップ#4において、制御部10は、第1領域検出処理で検出した複数の第1領域のそれぞれごとに包含領域検出処理を行う。複数の第1領域がそれぞれ1回ずつ、包含領域検出処理の対象となる。制御部10は、いずれか1つの第1領域を処理対象として包含領域検出処理を行い、その包含領域検出処理が完了すると、未だ処理対象としていない別の1つの第1領域を新たな処理対象として包含領域検出処理を行う。 In step #4, the control unit 10 performs inclusion area detection processing for each of the multiple first areas detected in the first area detection processing. Each of the multiple first areas is subjected to the inclusion area detection processing once. The control unit 10 performs the inclusion area detection processing on one of the first areas as the processing target, and when that inclusion area detection processing is complete, it performs the inclusion area detection processing on another first area that has not yet been processed as the new processing target.

制御部10は、処理対象の第1領域を包含する第2領域を検出する処理を包含領域検出処理として行う。制御部10は、処理対象の第1領域との画像類似度が包含領域検出処理用の閾値以上となる画像部分を有する第2領域を検出することにより、処理対象の第1領域を包含する第2領域を検出する。制御部10は、処理対象の第1領域との画像類似度が包含領域検出処理用の閾値以上となる画像部分を有する第2領域に処理対象の第1領域が包含されていると判断する。なお、この時点では、文字認識処理は行われていない。すなわち、画像類似度とは、画像データ同士の類似度であり、文字列同士(すなわち、テキストデータ同士)の類似度ではない。制御部10は、たとえば、公知のパターンマッチング技術を用いて、包含領域検出処理を行う。包含領域検出処理用の閾値は、特に限定されないが、70%以上である。 The control unit 10 performs inclusion region detection processing to detect a second region that encompasses the first region being processed. The control unit 10 detects a second region that encompasses the first region being processed by detecting a second region that has an image portion whose image similarity with the first region being processed is equal to or greater than the threshold for inclusion region detection processing. The control unit 10 determines that the first region being processed is encompassed by a second region that has an image portion whose image similarity with the first region being processed is equal to or greater than the threshold for inclusion region detection processing. Note that character recognition processing has not been performed at this point. In other words, image similarity refers to the similarity between image data, not the similarity between character strings (i.e., between text data). The control unit 10 performs inclusion region detection processing using, for example, known pattern matching technology. The threshold for inclusion region detection processing is not particularly limited, but is typically 70% or greater.

図5および図6に示す例では、第2領域C10は、第1領域C11(項目名「Name」の領域)との画像類似度が閾値以上となる画像部分を有し、かつ、第1領域C12(項目値「aaaa」の領域)との画像類似度が閾値以上となる画像部分を有する。第2領域C20は、第1領域C21(項目名「Address」の領域)との画像類似度が閾値以上となる画像部分を有し、かつ、第1領域C22(項目値「bbbb」の領域)との画像類似度が閾値以上となる画像部分を有する。第2領域C30は、第1領域C31(項目名「Date of Birth」の領域)との画像類似度が閾値以上となる画像部分を有し、かつ、第1領域C32(項目値「cccc」の領域)との画像類似度が閾値以上となる部分を有する。これにより、第1領域C11およびC12が第2領域C10に包含されていると判断され、第1領域C21およびC22が第2領域C20に包含されていると判断され、第1領域C31およびC32が第2領域C30に包含されていると判断される。 In the examples shown in Figures 5 and 6, the second region C10 has an image portion where the image similarity with the first region C11 (the region with the item name "Name") is equal to or greater than a threshold, and also has an image portion where the image similarity with the first region C12 (the region with the item value "aaaa") is equal to or greater than a threshold. The second region C20 has an image portion where the image similarity with the first region C21 (the region with the item name "Address") is equal to or greater than a threshold, and also has an image portion where the image similarity with the first region C22 (the region with the item value "bbbb") is equal to or greater than a threshold. The second region C30 has an image portion where the image similarity with the first region C31 (the region with the item name "Date of Birth") is equal to or greater than a threshold, and also has a portion where the image similarity with the first region C32 (the region with the item value "cccc") is equal to or greater than a threshold. As a result, it is determined that the first regions C11 and C12 are included in the second region C10, the first regions C21 and C22 are included in the second region C20, and the first regions C31 and C32 are included in the second region C30.

ステップ#5において、制御部10は、領域紐付け処理を行う。具体的には、制御部10は、同一の第2領域に包含される複数の第1領域を互いに紐付ける。 In step #5, the control unit 10 performs a region linking process. Specifically, the control unit 10 links multiple first regions contained in the same second region to each other.

図5および図6に示す例では、第2領域C10に包含される第1領域C11およびC12が互いに紐付けられる。第2領域C20に包含される第1領域C21およびC22が互いに紐付けられる。第2領域C30に包含される第1領域C31およびC32が互いに紐付けられる。 In the examples shown in Figures 5 and 6, first regions C11 and C12 contained in second region C10 are linked to each other. First regions C21 and C22 contained in second region C20 are linked to each other. First regions C31 and C32 contained in second region C30 are linked to each other.

ステップ#6において、制御部10は、領域判定処理を行う。制御部10は、領域判定処理を行うことにより、互いに紐付けられた複数の第1領域のうち、どちらが項目名の領域であり、どちらが項目値の領域であるかを認識する。言い換えると、制御部10は、領域判定処理を行うことにより、項目名の領域と項目値の領域とを区別する。 In step #6, the control unit 10 performs area determination processing. By performing area determination processing, the control unit 10 recognizes which of the multiple first areas linked to each other is an item name area and which is an item value area. In other words, by performing area determination processing, the control unit 10 distinguishes between item name areas and item value areas.

図5および図6に示す例では、第2領域C10のうち、第1領域C11が項目名の領域と判定され、第1領域C12が項目値の領域と判定される。第2領域C20のうち、第1領域C21が項目名の領域と判定され、第1領域C22が項目値の領域と判定される。第2領域C30のうち、第1領域C31が項目名の領域と判定され、第1領域C32が項目値の領域と判定される。 In the examples shown in Figures 5 and 6, of the second area C10, the first area C11 is determined to be the area for the item name, and the first area C12 is determined to be the area for the item value. Of the second area C20, the first area C21 is determined to be the area for the item name, and the first area C22 is determined to be the area for the item value. Of the second area C30, the first area C31 is determined to be the area for the item name, and the first area C32 is determined to be the area for the item value.

制御部10は、領域判定処理を行うことにより、対象項目の領域を認識する。対象項目の領域は、対象項目の項目名に対応する第1領域および対象項目の項目値に対応する第1領域の両方を包含する第2領域である。領域判定処理については、後に詳細に説明する。なお、他の手法を用いて、対象項目の領域を認識するようにしてもよい。 The control unit 10 recognizes the area of the target item by performing area determination processing. The area of the target item is a second area that encompasses both the first area corresponding to the item name of the target item and the first area corresponding to the item value of the target item. The area determination processing will be explained in detail later. Note that other methods may also be used to recognize the area of the target item.

ステップ#7において、制御部10は、身分証の画像データ内に存在する対象項目の領域のうち少なくとも一部をマスキングするマスキング処理を行う。制御部10は、マスキング処理を行うことにより、身分証の画像データ内に存在する対象項目の領域のうち少なくとも一部がマスキングされたマスキング済みデータを生成する。 In step #7, the control unit 10 performs a masking process to mask at least a portion of the area of the target item present in the image data of the identification card. By performing the masking process, the control unit 10 generates masked data in which at least a portion of the area of the target item present in the image data of the identification card is masked.

制御部10は、対象項目の項目名の領域に紐付けられた第1領域(すなわち、対象項目の項目値の領域)をマスキングする。または、制御部10は、対象項目の項目名および項目値の両方の領域をマスキングする。対象項目に対応する第2領域の略全領域がマスキングされてもよい。 The control unit 10 masks the first area associated with the area of the item name of the target item (i.e., the area of the item value of the target item). Alternatively, the control unit 10 masks both the area of the item name and the area of the item value of the target item. Alternatively, substantially the entire area of the second area corresponding to the target item may be masked.

マスキング済みデータの一例を図7に示す。図7に示すマスキング済みデータは、対象項目が生年月日である場合に生成される。すなわち、少なくとも、項目名「Date of Birth」に対応する項目値「cccc」がマスキングされる。図示しないが、項目名「Date of Birth」および項目値「cccc」の両方がマスキングされてもよい。 An example of masked data is shown in Figure 7. The masked data shown in Figure 7 is generated when the target item is date of birth. That is, at least the item value "cccc" corresponding to the item name "Date of Birth" is masked. Although not shown, both the item name "Date of Birth" and the item value "cccc" may be masked.

ステップ#8において、制御部10は、マスキング済みデータの出力処理を出力部に行わせる。たとえば、マスキングジョブの設定では、マスキング済みデータの出力方法を選択できる。出力方法としては、印刷と送信とがある。 In step #8, the control unit 10 causes the output unit to perform output processing of the masked data. For example, in the masking job settings, the output method of the masked data can be selected. Output methods include printing and transmission.

出力方法として印刷が選択されている場合、制御部10は、マスキング済みデータに基づく画像のシートSへの印刷(言い換えると、出力)を印刷部1に行わせる。この場合、印刷部1が「出力部」に相当し、出力先はシートSである。 When printing is selected as the output method, the control unit 10 causes the printing unit 1 to print (in other words, output) an image based on the masked data onto a sheet S. In this case, the printing unit 1 corresponds to the "output unit," and the output destination is the sheet S.

出力方法として送信が選択されている場合、制御部10は、マスキング済みデータのPC1000への送信(言い換えると、出力)を通信部102に行わせる。マスキング済みデータがPDFデータに変換されてPC1000に送信されてもよい。マスキング済みデータをPC1000に送信することにより、マスキング済みデータをPC1000に保存できる。この場合、通信部102が「出力部」に相当し、出力先はPC1000である。 If transmission is selected as the output method, the control unit 10 causes the communication unit 102 to transmit (in other words, output) the masked data to the PC 1000. The masked data may be converted into PDF data and transmitted to the PC 1000. By transmitting the masked data to the PC 1000, the masked data can be saved on the PC 1000. In this case, the communication unit 102 corresponds to the "output unit," and the output destination is the PC 1000.

本実施形態では、第1領域検出処理と、第2領域検出処理と、包含領域検出処理と、領域紐付け処理とが行われる。これにより、身分証の画像データのうち同一の項目に対応する項目名および項目値の各領域を精度良く互いに紐付けることができる。 In this embodiment, a first area detection process, a second area detection process, an inclusion area detection process, and an area linking process are performed. This allows each area of the item name and item value corresponding to the same item in the image data of the identification card to be linked to each other with high accuracy.

身分証の画像データのうち同一の項目に対応する項目名および項目値の各領域が互いに紐付けられることにより、容易に、対象項目の少なくとも一部をマスキングできる。具体的には、対象項目の項目名の領域に紐付けられた領域をマスキングすればよい。これにより、対象項目の項目値がマスキングされた状態にできる。この構成では、クラウド上の処理装置に対して身分証の画像データを転送することなく容易に、原稿D(身分証)の読み取りで得られる画像データのうちユーザー指定の項目に対応する領域だけをマスキングできる。 By linking the fields of the item name and item value corresponding to the same item in the image data of the ID card to each other, it is possible to easily mask at least a portion of the target item. Specifically, it is sufficient to mask the field linked to the field of the item name of the target item. This allows the field value of the target item to be masked. With this configuration, it is possible to easily mask only the fields corresponding to the user-specified items in the image data obtained by scanning the document D (ID card) without transferring the image data of the ID card to a processing device on the cloud.

身分証の画像データのうち項目値の領域をマスキングできれば、個人情報の漏洩を抑制できる。仮に、対象項目の項目名の領域がマスキングされても、対象項目の項目値の領域がマスキングされていなければ、個人情報が漏洩する。したがって、身分証の画像データのうち同一の項目に対応する項目名および項目値の各領域を互いに紐付ける処理を精度良く行うことは重要である。 Masking the field of item values in the image data of an ID card can prevent the leakage of personal information. Even if the field of item names for target items is masked, personal information will be leaked if the field of item values for target items is not masked. Therefore, it is important to accurately link the field of item names and field values corresponding to the same item in the image data of an ID card.

また、本実施形態では、第1学習モデルを用いて第1領域検出処理が行われ、第2学習モデルを用いて第2領域検出処理が行われる。ここで、機械学習には膨大な演算量が必要であり、膨大なメモリー容量が必要である。このため、機械学習に関する処理をクラウド上の処理装置に行わせることが多々ある。しかし、それでは、身分証の画像データをクラウド上の処理装置に転送する必要があり、個人情報が漏洩する可能性があるので、好ましくない。 Furthermore, in this embodiment, the first area detection process is performed using the first learning model, and the second area detection process is performed using the second learning model. Here, machine learning requires a huge amount of calculation and a huge amount of memory capacity. For this reason, machine learning processes are often performed by a processing device on the cloud. However, this requires transferring image data of the ID card to the processing device on the cloud, which is not desirable as it could result in the leakage of personal information.

そこで、本実施形態では、学習済みの第1学習モデルが用いられ、学習済みの第2学習モデルが用いられる。第1学習モデルおよび第2学習モデルはそれぞれ記憶部101に予め記憶される。これにより、複合機100内のメモリー容量を増大させなくても、第1領域検出処理および第2領域検出処理を複合機100内で行うことができる。すなわち、クラウド上の処理装置に身分証の画像データを転送しなくてもよい。その結果、個人情報の漏洩を抑制できる。 In this embodiment, therefore, a trained first learning model and a trained second learning model are used. The first learning model and the second learning model are each pre-stored in the memory unit 101. This allows the first area detection process and the second area detection process to be performed within the multifunction device 100 without increasing the memory capacity within the multifunction device 100. In other words, there is no need to transfer image data of the identification card to a processing device on the cloud. As a result, the leakage of personal information can be suppressed.

<領域判定処理>
制御部10は、身分証の画像データ内に存在する複数の第1領域(すなわち、文字列を含む文字領域)のそれぞれにいて、項目名の領域であるか項目値の領域であるかを判定する領域判定処理を行う。領域判定処理では、辞書データDDが使用される。辞書データDDは、記憶部101に予め記憶される(図2参照)。
<Area Determination Processing>
The control unit 10 performs a region determination process to determine whether each of a plurality of first regions (i.e., character regions containing character strings) present in the image data of the identification card is an area for an item name or an area for an item value. The region determination process uses dictionary data DD. The dictionary data DD is pre-stored in the storage unit 101 (see FIG. 2).

辞書データDDの概念図を図8に示す。辞書データDDは、1種類の項目に対して複数の異なる類似項目名を予め定義したデータである。辞書データDDは、複数種の項目のそれぞれごとに予め作成される。記憶部101は、複数種の項目にそれぞれ対応する複数の辞書データDDを予め記憶する。複数の辞書データDDは、複合機100のメーカーによって予め作成され、記憶部101に予め記憶される。図8では、項目をA、B・・・で示す。項目Aに対応する類似項目名をa1、a2、a3・・・で示す。項目Bに対応する類似項目名をb1、b2、b3・・・で示す。 A conceptual diagram of dictionary data DD is shown in Figure 8. Dictionary data DD is data in which multiple different similar item names are predefined for one type of item. Dictionary data DD is created in advance for each of multiple types of items. The storage unit 101 pre-stores multiple pieces of dictionary data DD corresponding to multiple types of items. The multiple pieces of dictionary data DD are created in advance by the manufacturer of the multifunction device 100 and pre-stored in the storage unit 101. In Figure 8, items are indicated by A, B, etc. Similar item names corresponding to item A are indicated by a1, a2, a3, etc. Similar item names corresponding to item B are indicated by b1, b2, b3, etc.

項目としての識別番号を例にとると、或る身分証では、項目名として文字列「ID」が使用され、別の身分証では、項目名として文字列「Number」が使用され、さらに別の身分証では、項目名として文字列「Num」が使用され得る。ここで挙げた文字列は互いに異なるが、全て同じ項目に対応する。そこで、項目としての識別番号に対応する辞書データDDでは、類似項目名として、文字列「ID」、文字列「Number」および文字列「Num」などが予め定義される。 Taking an identification number as an example of an item, one ID card might use the string "ID" as the item name, another might use the string "Number" as the item name, and yet another might use the string "Num" as the item name. Although the strings listed here are different from one another, they all correspond to the same item. Therefore, in the dictionary data DD corresponding to the identification number as an item, the string "ID," the string "Number," and the string "Num" are predefined as similar item names.

以下に、図9に示すフローチャートを参照し、領域判定処理の流れを説明する。図9に示すフローのスタートは、制御部10による領域紐付け処理が完了したときである。 The flow of the area determination process will be explained below with reference to the flowchart shown in Figure 9. The flow shown in Figure 9 starts when the area linking process by the control unit 10 is completed.

ステップ#11において、制御部10は、画像読取部2による身分証の読み取り(すなわち、図4に示すステップ#1の処理)で得られた身分証の画像データに対して文字認識処理を行う。制御部10は、身分証の画像データに対してOCR処理を行う。これにより、制御部10は、身分証の画像データ内に存在する複数の第1領域のそれぞれから文字列を抽出する。制御部10は、複数の第1領域のそれぞれの文字列を認識する。なお、第1領域には、項目名を示す文字列または項目値を示す文字列が存在する。 In step #11, the control unit 10 performs character recognition processing on the image data of the ID card obtained by the image reading unit 2 reading the ID card (i.e., the processing of step #1 shown in Figure 4). The control unit 10 performs OCR processing on the image data of the ID card. As a result, the control unit 10 extracts character strings from each of the multiple first areas present in the image data of the ID card. The control unit 10 recognizes the character strings in each of the multiple first areas. Note that the first areas contain character strings indicating item names or item values.

ステップ#12において、制御部10は、文字認識処理で抽出した複数の文字列に対して前処理を行う。前処理として行う処理は特に限定されない。たとえば、制御部10は、前処理として、文字列の大文字と小文字とを統一する処理を行う。この処理により、文字列の大文字と小文字とが区別されなくなる。また、たとえば、制御部10は、前処理として、スペースおよび所定符号を除去する処理を行う。 In step #12, the control unit 10 performs preprocessing on the multiple character strings extracted by the character recognition process. There are no particular restrictions on the type of preprocessing performed. For example, the control unit 10 performs preprocessing by standardizing the case of the character strings. This process results in the character strings being indistinguishable from uppercase and lowercase letters. Furthermore, for example, the control unit 10 performs preprocessing by removing spaces and specified symbols.

ステップ#12の処理後、制御部10は、項目名領域判定処理を行う。制御部10は、項目名領域判定処理を行うのに際し、第1領域検出処理で検出した複数の第1領域のいずれか1つを処理対象として設定する。 After processing step #12, the control unit 10 performs item name area determination processing. When performing the item name area determination processing, the control unit 10 sets one of the multiple first areas detected in the first area detection processing as the processing target.

そして、制御部10は、項目名領域判定処理の一処理として、類似度算出処理(ステップ#13の処理)を行う。ステップ#13において、制御部10は、複数の辞書データDDに定義されている全ての類似項目名の各文字列と処理対象の第1領域の文字列との類似度を求める。以下、文字列同士の類似度を文字列類似度と称し、画像類似度と区別する。 The control unit 10 then performs a similarity calculation process (step #13) as part of the item name region determination process. In step #13, the control unit 10 calculates the similarity between each character string of all similar item names defined in multiple dictionary data DD and the character string in the first region being processed. Hereinafter, the similarity between character strings will be referred to as character string similarity, to distinguish it from image similarity.

類似度算出処理を行うとき、制御部10は、複数の辞書データDDのいずれか1つを選択する(ここでは、選択された辞書データDDを対象辞書データDDと称する)。また、制御部10は、対象辞書データDDで定義されている複数の類似項目名のいずれか1つを選択する(ここでは、選択された類似項目名を対象類似項目名と称する)。 When performing the similarity calculation process, the control unit 10 selects one of the multiple dictionary data DD (here, the selected dictionary data DD is referred to as the target dictionary data DD). The control unit 10 also selects one of the multiple similar item names defined in the target dictionary data DD (here, the selected similar item name is referred to as the target similar item name).

そして、制御部10は、処理対象の第1領域の文字列と対象類似項目名の文字列との類似度を求める。たとえば、以下の式(1)を用いることにより、処理対象の第1領域の文字列と対象類似項目名の文字列との類似度を求めることができる。
The control unit 10 then calculates the similarity between the character string in the first region to be processed and the character string of the target similar item name. For example, the control unit 10 can calculate the similarity between the character string in the first region to be processed and the character string of the target similar item name by using the following formula (1):

式(1)において、S1は、一方の文字列であり、S2は、他方の文字列である。たとえば、辞書データDDで定義されている類似項目名の文字列がS1となり、身分証の画像データから抽出された第1領域の文字列がS2となる。len(S1)は、文字列S1の文字数であり、len(S2)は、文字列S2の文字数である。Mは、文字列S1と文字列S2との間でマッチした文字数である。 In formula (1), S1 is one character string and S2 is the other character string. For example, S1 is the character string of the similar item name defined in dictionary data DD, and S2 is the character string of the first region extracted from the image data of an identification card. len(S1) is the number of characters in character string S1, and len(S2) is the number of characters in character string S2. M is the number of characters that match between character string S1 and character string S2.

たとえば、文字列S1が「Number」であり、文字列S2が「Nombern」であるとする。身分証には「Number」と記載されていても、文字認識処理の誤認識によって「Nombern」と認識される場合がある。 For example, suppose character string S1 is "Number" and character string S2 is "Numbern." Even if "Number" is written on the ID card, it may be recognized as "Numbern" due to a misrecognition in the character recognition process.

この例では、len(S1)=6であり、len(S2)=7である。また、文字列S1と文字列S2との間では、先頭文字から数えて、1番目の文字「N」、3番目の文字「m」、4番目の文字「b」、5番目の文字「e」および6番目の文字「r」が互いに一致する。これにより、M=5となる。 In this example, len(S1) = 6 and len(S2) = 7. Furthermore, between strings S1 and S2, counting from the first character, the first character "N", the third character "m", the fourth character "b", the fifth character "e", and the sixth character "r" match each other. This results in M = 5.

この例では、類似度の値が0.76923となる。仮に、文字列S1と文字列S2とが全く違う文字である場合(すなわち、M=0となる場合)には、類似度の値が0となり、文字列S1と文字列S2とが完全に同じ文字である場合(すなわち、M=len(S1)=len(S2)とば場合)には、類似度の値が1となる。すなわち、処理対象の第1領域の文字列と対象類似項目名の文字列との類似度の算出では、類似度が高いほど、類似度の値が大きくなり、類似度が低いほど、類似度の値が小さくなる。 In this example, the similarity value is 0.76923. If string S1 and string S2 contain completely different characters (i.e., M = 0), the similarity value will be 0, and if string S1 and string S2 contain exactly the same characters (i.e., M = len(S1) = len(S2)), the similarity value will be 1. In other words, when calculating the similarity between the string in the first region to be processed and the string of the target similar item name, the higher the similarity, the larger the similarity value, and the lower the similarity, the smaller the similarity value.

制御部10は、処理対象の第1領域の文字列と対象類似項目名の文字列との文字列類似度を求めた後、対象辞書データDDで定義されている複数の類似項目名のうち、未選択の類似項目名を新たに選択する。制御部10は、対象類似項目名を切り替え、処理対象の第1領域の文字列と新たな対象類似項目名の文字列との文字列類似度を求める。制御部10は、対象辞書データDDで定義されている複数の類似項目名の全てについて、処理対象の第1領域の文字列との文字列類似度を求める。そして、制御部10は、対象辞書データDDで定義されている複数の類似項目名のうち、処理対象の第1領域の文字列との文字列類似度が最も高かった類似項目名をその文字列類似度の値と対応付けて記憶する。 After determining the string similarity between the string in the first region to be processed and the string of the target similar item name, the control unit 10 newly selects an unselected similar item name from among the multiple similar item names defined in the target dictionary data DD. The control unit 10 switches the target similar item name and determines the string similarity between the string in the first region to be processed and the string of the new target similar item name. The control unit 10 determines the string similarity with the string in the first region to be processed for all of the multiple similar item names defined in the target dictionary data DD. The control unit 10 then stores the similar item name from the multiple similar item names defined in the target dictionary data DD that has the highest string similarity with the string in the first region to be processed, in association with its string similarity value.

また、制御部10は、複数の辞書データDDに定義されている全ての類似項目名について、処理対象の第1領域の文字列との文字列類似度を求める。すなわち、制御部10は、複数の辞書データDDのうち、未選択の辞書データDDを新たに選択する。制御部10は、対象辞書データDDを切り替え、新たな対象辞書データDDで定義されている複数の類似項目名の全てについて、処理対象の第1領域の文字列との文字列類似度を求める。そして、制御部10は、対象辞書データDDで定義されている複数の類似項目名のうち、処理対象の第1領域の文字列との文字列類似度が最も高かった類似項目名をその文字列類似度の値と対応付けて記憶する。これにより、複数種の項目にそれぞれ対応する複数の類似項目名が1つずつ、文字列類似度の値と対応付けて記憶される。言い換えると、複数種の項目にそれぞれ対応する複数の類似値(類似値は文字列類似度の値である)が記憶される。 The control unit 10 also calculates the string similarity between all similar item names defined in the multiple dictionary data DD and the string in the first region being processed. That is, the control unit 10 newly selects an unselected dictionary data DD from the multiple dictionary data DD. The control unit 10 switches the target dictionary data DD and calculates the string similarity between all of the multiple similar item names defined in the new target dictionary data DD and the string in the first region being processed. The control unit 10 then stores the similar item name, of the multiple similar item names defined in the target dictionary data DD, that has the highest string similarity with the string in the first region being processed, in association with its string similarity value. As a result, multiple similar item names corresponding to each of the multiple types of items are stored in association with a string similarity value. In other words, multiple similarity values (similarity values are string similarity values) corresponding to each of the multiple types of items are stored.

制御部10は、項目名領域判定処理の一処理として、最高値検出処理(ステップ#14の処理)を行う。ステップ#14において、制御部10は、類似度算出処理で求め記憶した複数の類似値(類似値は文字列類似度の値である)を互いに比較する。言い換えると、制御部10は、複数種の項目にそれぞれ対応する複数の類似値を互いに比較する。 The control unit 10 performs a maximum value detection process (step #14) as part of the item name area determination process. In step #14, the control unit 10 compares the multiple similarity values (the similarity values are string similarity values) calculated and stored in the similarity calculation process. In other words, the control unit 10 compares the multiple similarity values corresponding to the multiple types of items.

そして、制御部10は、文字列類似度の最高値(すなわち、最も高い類似値)を検出する。すなわち、制御部10は、処理対象の第1領域の文字列と全ての類似項目名の各文字列との文字列類似度を求め、求めた複数の類似値のうち最高値を検出する。 The control unit 10 then detects the highest value of string similarity (i.e., the highest similarity value). That is, the control unit 10 calculates the string similarity between the string in the first region being processed and each string in all similar item names, and detects the highest value among the multiple similarity values thus calculated.

制御部10は、項目名領域判定処理の一処理として、閾値比較処理(ステップ#15の処理)を行う。ステップ#15において、制御部10は、予め定められた項目名領域判定処理用の閾値と文字列類似度の最高値とを比較する。 The control unit 10 performs a threshold comparison process (step #15) as part of the item name area determination process. In step #15, the control unit 10 compares a predetermined threshold value for the item name area determination process with the highest string similarity value.

たとえば、項目名領域判定処理用の閾値を設定するため、複合機100で実際に身分証の読み取りが行われ、その読み取りで得られた画像データのうち項目名の領域に存在する文字列に対する類似度算出処理の結果(ここでは、当該結果としての値を項目名領域の類似値と称する)が取得される。また、当該画像データのうち項目名の領域とは異なる領域に存在する文字列に対する類似度算出処理の結果(ここでは、当該結果としての値を他領域の類似値と称する)が取得される。なお、項目名領域の類似値は複数取得され、他領域の類似値も複数取得される。 For example, to set a threshold value for the item name area determination process, an identification card is actually read by the multifunction device 100, and the results of a similarity calculation process for character strings present in the item name area of the image data obtained from the read (here, the resulting value is referred to as the similarity value of the item name area) are obtained. In addition, the results of a similarity calculation process for character strings present in areas of the image data other than the item name area (here, the resulting value is referred to as the similarity value of other areas) are obtained. Note that multiple similarity values are obtained for the item name area, and multiple similarity values for other areas are also obtained.

また、複数の項目名領域の類似値の平均値である第1平均値が求められ、複数の他領域の平均値である第2平均値が求められる。そして、第1平均値と第2平均値との平均値が項目名領域判定処理用の閾値に設定される。 In addition, a first average value, which is the average value of the similarity values of multiple item name regions, is calculated, and a second average value, which is the average value of multiple other regions, is calculated. The average value of the first average value and the second average value is then set as the threshold value for the item name region determination process.

ステップ#16において、制御部10は、文字列類似度の最高値が項目名領域判定処理用の閾値以上であるか否かを判断する。図9では、目名領域判定処理用の閾値をThと表記する。文字列類似度の最高値が項目名領域判定処理用の閾値以上であると制御部10が判断した場合には、ステップ#17に移行する。 In step #16, the control unit 10 determines whether the highest value of the character string similarity is equal to or greater than the threshold value for the item name area determination process. In Figure 9, the threshold value for the item name area determination process is represented as Th. If the control unit 10 determines that the highest value of the character string similarity is equal to or greater than the threshold value for the item name area determination process, the process proceeds to step #17.

ステップ#17において、制御部10は、処理対象の第1領域を項目名の領域と判定する。また、ステップ#18において、制御部10は、処理対象の第1領域(すなわち、項目名の領域と判定した第1領域)に存在する項目名としての文字列に基づき、処理対象の第1領域に対応する項目を判定する。ここで、処理対象の第1領域の文字列は、いずれかの辞書データDDに類似項目名として定義されている。そこで、制御部10は、処理対象の第1領域の文字列が定義されている辞書データDDに対応する項目を認識し、当該認識した項目が処理対象の第1領域に対応する項目であると判定する。 In step #17, the control unit 10 determines that the first area to be processed is an area for an item name. Furthermore, in step #18, the control unit 10 determines the item corresponding to the first area to be processed based on the character string that serves as the item name present in the first area to be processed (i.e., the first area determined to be an area for an item name). Here, the character string in the first area to be processed is defined as a similar item name in one of the dictionary data DDs. Therefore, the control unit 10 recognizes the item corresponding to the dictionary data DD in which the character string in the first area to be processed is defined, and determines that the recognized item is the item corresponding to the first area to be processed.

ステップ#16において、文字列類似度の最高値が項目名領域判定処理用の閾値未満であると制御部10が判断した場合には、ステップ#19に移行する。ステップ#19に移行した場合、制御部10は、処理対象の第1領域を他の領域(すなわち、項目名の領域とは異なる領域)と判定する。 If the control unit 10 determines in step #16 that the highest string similarity is less than the threshold value for the item name area determination process, the process proceeds to step #19. If the process proceeds to step #19, the control unit 10 determines that the first area to be processed is another area (i.e., an area different from the item name area).

ステップ#13~ステップ#19までの各処理が項目名領域判定処理の一処理として行われる。或る処理対象の第1領域に対する項目名領域判定処理の完了後、制御部10は、項目名領域判定処理を行っていない第1領域(ここでは、未処理の第1領域と称する)が残っているか否かを判断する。未処理の第1領域が残っている場合、制御部10は、未処理の第1領域を新たな処理対象に設定する。すなわち、制御部10は、処理対象を切り替える。そして、制御部10は、新たな処理対象の第1領域に対して項目名領域判定処理(ステップ#13~ステップ#19までの各処理)を行う。 Steps #13 to #19 are each performed as part of the item name area determination process. After completing the item name area determination process for a certain first area of a processing target, the control unit 10 determines whether any first areas remain for which the item name area determination process has not been performed (referred to here as unprocessed first areas). If any unprocessed first areas remain, the control unit 10 sets the unprocessed first area as the new processing target. In other words, the control unit 10 switches the processing target. The control unit 10 then performs the item name area determination process (steps #13 to #19) on the new first area of the processing target.

本実施形態では、1種類の項目に対して複数の異なる類似項目名を予め定義した辞書データDDが複数種の項目のそれぞれごとに記憶部101に予め記憶される。そして、辞書データDDを用いて項目名領域判定処理が行われる。これにより、対応する項目名が複数存在する項目がマスキング対象となっている場合において、複数の項目名のうち、或る項目名が記載されている身分証ではマスキング対象の項目が正常にマスキングされるのに対して、他の項目名が記載されている身分証ではマスキング対象の項目がマスキングされない(言い換えると、マスキング対象の項目が検出されない)という不都合が生じることを抑制できる。 In this embodiment, dictionary data DD, in which multiple different similar item names for one type of item are predefined, is stored in advance in the storage unit 101 for each of multiple types of items. The item name area determination process is then performed using the dictionary data DD. This prevents the problem of an item being properly masked on an ID card that lists one of the multiple item names, while not being masked on an ID card that lists another item name (in other words, not detecting the item to be masked), when an item with multiple corresponding item names is to be masked.

たとえば、項目としての識別番号がマスキング対象であるとする。この場合、本実施形態では、項目名として「ID」と記載されている身分証および項目名として「Num」と記載されている身分証のいずれであってあっても、識別番号が正常にマスキングされる。一方で、従来の構成では、項目名として「ID」と記載されている身分証では識別番号が正常にマスキングされるのに対して、項目名として「Num」と記載されている身分証では識別番号がマスキングされないという不都合が生じ得る。 For example, suppose an identification number is an item to be masked. In this case, in this embodiment, the identification number is masked correctly on both an ID card with "ID" written as the item name and an ID card with "Num" written as the item name. On the other hand, in conventional configurations, the identification number is masked correctly on an ID card with "ID" written as the item name, but the identification number is not masked on an ID card with "Num" written as the item name, which can be an inconvenience.

このような不都合の発生を抑制するには、大規模な辞書が必要となる。また、機械学習モデルによる手法では、モデルサイズが大きくなる。しかし、メモリー容量は限られているため、クラウド上で処理することになる。 To prevent these problems from occurring, a large dictionary is required. Furthermore, when using machine learning models, the model size becomes large. However, because memory capacity is limited, processing is carried out on the cloud.

本実施形態では、辞書データDDを用いることにより、クラウド上での処理は不要となる。すなわち、クラウド上の処理装置に対して身分証の画像データ(すなわち、個人情報)を転送する必要はない。これにより、個人情報の漏洩を抑制できる。言い換えると、本実施形態では、クラウド上の処理装置に対して身分証の画像データを転送することなく容易に、原稿D(身分証)の読み取りで得られる画像データのうちユーザー指定の項目に対応する領域だけをマスキングできる。 In this embodiment, by using dictionary data DD, processing on the cloud is unnecessary. That is, there is no need to transfer image data of the identification card (i.e., personal information) to a processing device on the cloud. This makes it possible to prevent the leakage of personal information. In other words, in this embodiment, it is possible to easily mask only the areas of the image data obtained by scanning the document D (identification card) that correspond to the items specified by the user, without transferring the image data of the identification card to a processing device on the cloud.

また、本実施形態では、処理対象の第1領域の文字列と全ての類似項目名の各文字列との文字列類似度を求め、求めた文字列類似度の最高値が閾値以上であれば処理対象の第1領域を項目名の領域と判定するため、文字認識処理で誤認識が発生しても、精度良く、項目名の領域を検出できる。 In addition, in this embodiment, the string similarity between the string in the first region to be processed and each string in all similar item names is calculated, and if the highest string similarity calculated is equal to or greater than a threshold, the first region to be processed is determined to be an item name region. Therefore, even if misrecognition occurs during character recognition processing, item name regions can be detected with high accuracy.

<異常対策処理>
まず、第1異常対策処理について説明する。
<Anomaly Countermeasure Processing>
First, the first abnormality countermeasure process will be described.

通常では、身分証に記載の個人情報に関する複数の項目は互いに異なる。たとえば、単一の身分証に「名前」という項目が複数存在することは略無い。しかし、身分証の画像データに対する文字認識処理の精度が低い場合には、身分証の画像データから、それぞれが同一の項目に対応する複数の項目名(その文字列)が抽出され得る。身分証の一部に汚れおよび変色などがあったり、身分証を読み取るときの解像度が低かったりした場合、文字認識処理の精度が低下する。 Normally, the multiple items of personal information listed on an ID card are different from each other. For example, it is highly unlikely that a single ID card will have multiple items with the name "Name" in them. However, if the accuracy of the character recognition process on the image data of the ID card is low, multiple item names (character strings thereof) that each correspond to the same item may be extracted from the image data of the ID card. The accuracy of the character recognition process will decrease if there is dirt or discoloration on parts of the ID card, or if the resolution used to read the ID card is low.

このような不都合の発生を抑制するため、制御部10は、第1異常対策処理を行う。具体的には、項目名の領域と判定した複数の第1領域のそれぞれの文字列が同一の項目である第1項目に対応するとき、制御部10は、それら複数の第1領域のうち、最高値が最も高い文字列を含む第1領域を第1項目に対応する領域と判定し、残りの第1領域については第1項目に対応する領域ではないと判定する。言い換えると、制御部10は、項目名領域判定処理の結果を補正する。 To prevent such problems from occurring, the control unit 10 performs a first abnormality countermeasure process. Specifically, when the character strings in multiple first areas determined to be item name areas correspond to the same first item, the control unit 10 determines that the first area containing the character string with the highest maximum value is the area corresponding to the first item, and determines that the remaining first areas do not correspond to the first item. In other words, the control unit 10 corrects the results of the item name area determination process.

以下に、図10に示すフローチャートを参照し、第1異常対策処理の流れを説明する。図10に示すフローのスタートは、制御部10による項目名領域判定処理(すなわち、図9に示すフローに沿った処理)が完了したときである。制御部10は、項目名領域判定処理の完了後、引き続き、処理対象の第1領域に対して第1異常対策処理を行う。 The flow of the first abnormality countermeasure processing will be explained below with reference to the flowchart shown in Figure 10. The flow shown in Figure 10 starts when the item name area determination processing by the control unit 10 (i.e., processing according to the flow shown in Figure 9) is completed. After completing the item name area determination processing, the control unit 10 continues to perform the first abnormality countermeasure processing on the first area being processed.

ステップ#21において、制御部10は、処理対象の第1領域を項目名の領域と判定したか否かを判断する。処理対象の第1領域が項目名の領域であると制御部10が判定した場合には、ステップ#22に移行する。処理対象の第1領域が項目名の領域ではないと制御部10が判定した場合には、本フローは終了する。 In step #21, the control unit 10 determines whether the first area to be processed is determined to be an item name area. If the control unit 10 determines that the first area to be processed is an item name area, the process proceeds to step #22. If the control unit 10 determines that the first area to be processed is not an item name area, the process ends.

ステップ#22において、制御部10は、処理対象の第1領域に対応する項目が他の第1領域に対応する項目と同じであるか否かを判断する。言い換えると、制御部10は、項目名の領域と判定した複数の第1領域のそれぞれの文字列が同一の項目(第1項目)に対応するか否かを判断する。 In step #22, the control unit 10 determines whether the item corresponding to the first area being processed is the same as the item corresponding to another first area. In other words, the control unit 10 determines whether the character strings in each of the multiple first areas determined to be item name areas correspond to the same item (first item).

ステップ#22において、処理対象の第1領域に対応する項目が他の第1領域に対応する項目と同じであると制御部10が判断した場合には、ステップ#23に移行する。言い換えると、項目名の領域と判定した複数の第1領域のそれぞれの文字列が同一の項目(第1項目)に対応すると制御部10が判断した場合には、ステップ#23に移行する。処理対象の第1領域に対応する項目が他の第1領域に対応する項目とは異なると制御部10が判断した場合には、本フローは終了する。以下、処理対象の第1領域との間で対応する項目が同じ他の第1領域を比較対象の第1領域と称する。 If the control unit 10 determines in step #22 that the item corresponding to the first area to be processed is the same as the item corresponding to another first area, the process proceeds to step #23. In other words, if the control unit 10 determines that the character strings in each of the multiple first areas determined to be item name areas correspond to the same item (first item), the process proceeds to step #23. If the control unit 10 determines that the item corresponding to the first area to be processed is different from the item corresponding to another first area, the process ends. Hereinafter, another first area that has the same corresponding item as the first area to be processed will be referred to as the first area to be compared.

ステップ#23において、制御部10は、処理対象の第1領域および比較対象の第1領域のそれぞれについて、最高値検出処理(すなわち、図9に示すステップ#14の処理)で求めた最高値を認識する。そして、制御部10は、処理対象の第1領域および比較対象の第1領域のそれぞれの前記最高値を互いに比較する。その結果、処理対象の第1領域のおよび比較対象の第1領域のそれぞれの前記最高値を互いに比較する。たとえば、制御部10は、処理対象の第1領域の最高値M1が比較対象の第1領域の最高値M2以上であるか否かを判断する。 In step #23, the control unit 10 recognizes the highest value found in the highest value detection process (i.e., the process of step #14 shown in FIG. 9) for each of the first area to be processed and the first area to be compared. The control unit 10 then compares the highest values of the first area to be processed and the first area to be compared. As a result, the highest values of the first area to be processed and the first area to be compared are compared. For example, the control unit 10 determines whether the highest value M1 of the first area to be processed is greater than or equal to the highest value M2 of the first area to be compared.

ステップ#23において、処理対象の第1領域の最高値M1が比較対象の第1領域の最高値M2以上であると制御部10が判断した場合には、ステップ#24に移行する。処理対象の第1領域の最高値M1が比較対象の第1領域の最高値M2未満であると制御部10が判断した場合には、ステップ#25に移行する。 If the control unit 10 determines in step #23 that the highest value M1 of the first region being processed is equal to or greater than the highest value M2 of the first region being compared, the process proceeds to step #24. If the control unit 10 determines that the highest value M1 of the first region being processed is less than the highest value M2 of the first region being compared, the process proceeds to step #25.

ステップ#24に移行した場合、制御部10は、処理対象の第1領域が第1項目に対応する領域であるという判定結果を変更せず、比較対象の第1領域に対する判定結果を変更する。具体的には、制御部10は、比較対象の第1領域の文字列との文字列類似度が2番目に高かった類似項目名に対応する項目である第2項目を認識し、比較対象の第1領域を第2項目に対応する領域と判定する。 When proceeding to step #24, the control unit 10 does not change the determination result that the first region to be processed is the region corresponding to the first item, but changes the determination result for the first region to be compared. Specifically, the control unit 10 recognizes the second item, which is the item corresponding to the similar item name with the second highest string similarity to the string of the first region to be compared, and determines that the first region to be compared is the region corresponding to the second item.

ステップ#25に移行した場合、制御部10は、比較対象の第1領域が第1項目に対応する領域であるという判定結果を変更せず、処理対象の第1領域に対する判定結果を変更する。具体的には、制御部10は、処理対象の第1領域の文字列との文字列類似度が2番目に高かった類似項目名に対応する項目である第2項目を認識し、処理対象の第1領域を第2項目に対応する領域と判定する。 When proceeding to step #25, the control unit 10 does not change the determination result that the first region to be compared is the region corresponding to the first item, but changes the determination result for the first region to be processed. Specifically, the control unit 10 recognizes the second item, which is the item corresponding to the similar item name with the second highest string similarity to the string in the first region to be processed, and determines that the first region to be processed is the region corresponding to the second item.

ステップ#23~#25では、言い換えると、以下の処理が行われる。 In other words, steps #23 to #25 perform the following processing:

項目名の領域と判定した複数の第1領域のそれぞれの文字列が同一の項目である第1項目に対応するとき、制御部10は、それら複数の第1領域のうち、最高値が最も高い文字列を含む第1領域を第1項目に対応する領域と判定する。また、制御部10は、複数の第1領域のうち、第1項目に対応する領域と判定しなかった第1領域の文字列との文字列類似度が2番目に高かった類似項目名に対応する項目である第2項目を認識し、第1項目に対応する領域と判定しなかった第1領域を第2項目に対応する領域と判定する。 When the character strings in multiple first regions determined to be regions of an item name correspond to the same first item, the control unit 10 determines, among the multiple first regions, the first region containing the character string with the highest maximum value as the region corresponding to the first item. The control unit 10 also recognizes, among the multiple first regions, a second item that corresponds to a similar item name with the second highest character string similarity to the character string in a first region not determined to be a region corresponding to the first item, and determines the first region not determined to be a region corresponding to the first item as the region corresponding to the second item.

次に、第2異常対策処理および第3異常対策処理について説明する。 Next, we will explain the second abnormality countermeasure process and the third abnormality countermeasure process.

身分証には、複数の項目欄が存在する。各項目欄に項目名が1つ記載され、1つの項目欄に複数の項目名が記載されることは略無い。すなわち、通常では、同一の第2領域に包含される複数の第1領域のうち2つ以上が項目名の領域として判定されない。また、通常では、同一の第2領域に包含される複数の第1領域のうち1つは項目名の領域として判定される。しかし、身分証の画像データに対する文字認識処理の精度が低い場合には、同一の第2領域に包含される複数の第1領域のうち、2つ以上が項目名の領域として判定されたり、1つも項目名の領域として判定されなかったりする状態になり得る。 Identification cards have multiple item columns. Each item column contains one item name, and it is rare for multiple item names to be written in a single item column. In other words, normally, two or more of the multiple first areas contained in the same second area are not determined to be item name areas. Also, normally, one of the multiple first areas contained in the same second area is determined to be an item name area. However, if the accuracy of the character recognition process for the image data of the identification card is low, it is possible that two or more of the multiple first areas contained in the same second area are determined to be item name areas, or that none of them are determined to be item name areas.

このため、制御部10は、第2異常対策処理および第3異常対策処理を行う。ここで、同一の第2領域に包含される複数の第1領域は互いに紐付けられる。そこで、制御部10は、互いに紐付けられた複数の第1領域に対し、第2異常対策処理または第3異常対策処理を行う。 For this reason, the control unit 10 performs second abnormality countermeasure processing and third abnormality countermeasure processing. Here, multiple first areas contained in the same second area are linked to each other. Therefore, the control unit 10 performs second abnormality countermeasure processing or third abnormality countermeasure processing on multiple first areas that are linked to each other.

以下に、図11~図13に示す各フローチャートを参照し、第2異常対策処理および第3異常対策処理の各流れを説明する。 The following describes the flow of the second abnormality countermeasure processing and the third abnormality countermeasure processing, with reference to the flowcharts shown in Figures 11 to 13.

まず、制御部10は、図11に示すフローに沿った処理を行う。図11に示すフローのスタートは、制御部10による領域判定処理(すなわち、図9に示すフローに沿った処理)が完了したときである。制御部10は、項目名領域判定処理の完了後、引き続き、図11に示すフローに沿った処理を行う。 First, the control unit 10 performs processing according to the flow shown in FIG. 11. The flow shown in FIG. 11 starts when the area determination processing by the control unit 10 (i.e., processing according to the flow shown in FIG. 9) is completed. After completing the item name area determination processing, the control unit 10 continues processing according to the flow shown in FIG. 11.

ステップ#31において、制御部10は、処理対象の第1領域に紐付けられた第1領域の文字列を取得する文字列取得処理を行う。そして、ステップ#32において、制御部10は、文字列取得処理で取得した文字列を含む第1領域に対する領域判定処理を行っているか否か(すなわち、判定済みか否か)を判断する。判定済みと判断した場合、ステップ#33に移行し、判定済みではないと判断した場合、本フローは終了する。 In step #31, the control unit 10 performs a string acquisition process to acquire the string of characters in the first region linked to the first region to be processed. Then, in step #32, the control unit 10 determines whether or not the region determination process has been performed on the first region containing the string acquired in the string acquisition process (i.e., whether or not the region has been determined). If it determines that the region has been determined, the control unit 10 proceeds to step #33; if it determines that the region has not been determined, the control unit 10 ends this flow.

ステップ#33において、制御部10は、処理対象の第1領域および処理対象の第1領域に紐付けられた第1領域を共に項目名の領域と判定しているか否かを判断する。言い換えると、制御部10は、互いに紐付けられた複数の第1領域のうち2つ以上を項目名の領域と判定しているか否かを判断する。 In step #33, the control unit 10 determines whether the first area to be processed and the first area linked to the first area to be processed are both determined to be item name areas. In other words, the control unit 10 determines whether two or more of the multiple first areas linked to each other are determined to be item name areas.

ステップ#33において、互いに紐付けられた複数の第1領域のうち2つ以上を項目名の領域と判定していると制御部10が判断した場合、ステップ#34に移行する。ステップ#34に移行した場合、制御部10は、第2異常対策処理を行う。 If the control unit 10 determines in step #33 that two or more of the multiple first areas linked to each other have been determined to be item name areas, the process proceeds to step #34. If the process proceeds to step #34, the control unit 10 performs second abnormality countermeasure processing.

ステップ#33において、互いに紐付けられた複数の第1領域のうち2つ以上を項目名の領域と判定していないと制御部10が判断した場合、ステップ#35に移行する。ステップ#35において、制御部10は、処理対象の第1領域および処理対象の第1領域に紐付けられた第1領域を共に項目名の領域とは異なる領域と判定しているか否か判断する。言い換えると、制御部10は、互いに紐付けられた複数の第1領域の全てを項目名の領域とは異なる領域と判定しているか否かを判断する。 If the control unit 10 determines in step #33 that two or more of the multiple first areas linked to each other have not been determined to be item name areas, the process proceeds to step #35. In step #35, the control unit 10 determines whether the first area to be processed and the first area linked to the first area to be processed have both been determined to be areas different from item name areas. In other words, the control unit 10 determines whether all of the multiple first areas linked to each other have been determined to be areas different from item name areas.

ステップ#35において、互いに紐付けられた複数の第1領域の全てを項目名の領域とは異なる領域と判定していると制御部10が判断した場合、ステップ#36に移行する。ステップ#36に移行した場合、制御部10は、第3異常対策処理を行う。 If the control unit 10 determines in step #35 that all of the linked first areas are determined to be areas different from the item name area, the process proceeds to step #36. If the process proceeds to step #36, the control unit 10 performs a third abnormality countermeasure process.

ステップ#35において、互いに紐付けられた複数の第1領域の全てが項目名の領域とは異なる領域と制御部10が判定していない場合には、本フローは終了する。すなわち、互いに紐付けられた複数の第1領域のうち1つだけが項目名の領域と判定されている場合には、第2異常対策処理および第3異常対策処理は共に行われない。 In step #35, if the control unit 10 does not determine that all of the multiple first areas linked to each other are areas other than item name areas, this flow ends. In other words, if only one of the multiple first areas linked to each other is determined to be an item name area, neither the second abnormality countermeasure process nor the third abnormality countermeasure process is performed.

第2異常対策処理として、図12に示すフローに沿った処理が行われる。すなわち、互いに紐付けられた複数の第1領域(すなわち、同一の第2領域に包含される複数の第1領域)のうち2つ以上を項目名の領域と制御部10が判定した場合、図12に示すフローに沿った処理が行われる。 The second abnormality countermeasure process is performed according to the flow shown in FIG. 12. That is, if the control unit 10 determines that two or more of the multiple first areas linked to each other (i.e., multiple first areas contained in the same second area) are item name areas, the process is performed according to the flow shown in FIG. 12.

ステップ#41において、制御部10は、互いに紐付けられた複数の第1領域のそれぞれについて、最高値検出処理(すなわち、図9のステップ#14の処理)で求めた最高値を認識する。また、ステップ#42において、制御部10は、最も高い前記最高値を認識する。 In step #41, the control unit 10 recognizes the highest value found in the highest value detection process (i.e., the process of step #14 in Figure 9) for each of the multiple first regions that are linked to each other. In step #42, the control unit 10 recognizes the highest of the highest values.

そして、ステップ#43において、制御部10は、互いに紐付けられた複数の第1領域のうち、前記最高値が最も高い文字列を含む第1領域(ここでは、最高値が最も高い第1領域と称する)を項目名の領域と判定する。また、ステップ#44において、制御部10は、互いに紐付けられた複数の第1領域のうち、最高値が最も高い第1領域以外の残りの第1領域を項目名の領域とは異なる領域と判定する。 Then, in step #43, the control unit 10 determines that, of the multiple first regions linked to each other, the first region containing the character string with the highest maximum value (here referred to as the first region with the highest maximum value) is an item name region. Furthermore, in step #44, the control unit 10 determines that, of the multiple first regions linked to each other, the remaining first regions other than the first region with the highest maximum value are regions other than item name regions.

ここで、身分証の画像データに存在する第1領域を項目名の領域と判定した場合、制御部10は、その第1領域が項目名に対応する領域である旨の情報を記憶する。この構成では、第2異常対策処理が行われた場合、項目名の領域とは異なる領域と再判定された第1領域については、項目名に対応する領域である旨の情報を削除すべきである。そこで、ステップ#45において、制御部10は、最高値が最も高い第1領域以外の残りの第1領域が項目名に対応する領域である旨の情報を削除する。 Here, if a first area present in the image data of the ID card is determined to be an area for an item name, the control unit 10 stores information indicating that the first area corresponds to the item name. In this configuration, when the second abnormality countermeasure process is performed, for first areas that are re-determined to be areas other than the area for an item name, the information indicating that they correspond to the item name should be deleted. Therefore, in step #45, the control unit 10 deletes the information indicating that the remaining first areas, other than the first area with the highest maximum value, correspond to the item name.

第3異常対策処理として、図13に示すフローに沿った処理が行われる。すなわち、互いに紐付けられた複数の第1領域(すなわち、同一の第2領域に包含される複数の第1領域)の全てを項目名の領域とは異なる領域と制御部10が判定した場合、図13に示すフローに沿った処理が行われる。 The third abnormality countermeasure process is performed according to the flow shown in FIG. 13. That is, if the control unit 10 determines that all of the multiple first areas linked to each other (i.e., multiple first areas contained in the same second area) are areas different from the area of the item name, the process is performed according to the flow shown in FIG. 13.

ステップ#51において、制御部10は、互いに紐付けられた複数の第1領域のそれぞれについて、最高値検出処理(すなわち、図9のステップ#14の処理)で求めた最高値を認識する。また、ステップ#52において、制御部10は、最も高い前記最高値を認識する。 In step #51, the control unit 10 recognizes the highest value found in the highest value detection process (i.e., the process of step #14 in Figure 9) for each of the multiple first regions that are linked to each other. In addition, in step #52, the control unit 10 recognizes the highest of the highest values.

そして、ステップ#53において、制御部10は、互いに紐付けられた複数の第1領域のうち、前記最高値が最も高い文字列を含む第1領域(ここでは、最高値が最も高い第1領域と称する)を項目名の領域と判定する。また、ステップ#54において、制御部10は、互いに紐付けられた複数の第1領域のうち、最高値の第1領域以外の残りの第1領域を項目名の領域とは異なる領域と判定する。 Then, in step #53, the control unit 10 determines that, of the multiple first regions linked to each other, the first region containing the character string with the highest maximum value (here referred to as the first region with the highest maximum value) is an item name region. Furthermore, in step #54, the control unit 10 determines that, of the multiple first regions linked to each other, the remaining first regions other than the first region with the highest value are regions other than item name regions.

ここで、身分証の画像データに存在する第1領域を項目名の領域と判定した場合、制御部10は、その第1領域が項目名に対応する領域である旨の情報を記憶する。この構成では、第3異常対策処理が行われた場合、その処理によって項目名の領域と再判定された第1領域については、項目名に対応する領域である旨の情報を追加すべきである。そこで、ステップ#55において、制御部10は、最高値が最も高い第1領域が項目名に対応する領域である旨の情報を追加する。 Here, if a first area present in the image data of the ID card is determined to be an area for an item name, the control unit 10 stores information indicating that the first area is an area corresponding to the item name. In this configuration, when the third abnormality countermeasure process is performed, information indicating that the first area corresponds to the item name should be added to the first area that is re-determined as an area for an item name by that process. Therefore, in step #55, the control unit 10 adds information indicating that the first area with the highest maximum value is an area corresponding to the item name.

本実施形態では、第1~第3異常対策処理を行うことにより、同一の項目に対応する項目名の領域が複数検出されるという不都合の発生を抑制できる。また、項目名の領域が検出されないという不都合の発生を抑制できる。 In this embodiment, by performing the first to third abnormality countermeasure processes, it is possible to prevent the occurrence of the inconvenience of multiple detections of areas with item names corresponding to the same item. It is also possible to prevent the occurrence of the inconvenience of no detection of an item name area.

<マスキングジョブの設定>
マスキングジョブでは、その設定をユーザーが行うことができる。マスキングジョブの設定は、操作表示部3を介して行われる。たとえば、マスキングすべき項目値に対応する項目(すなわち、対象項目)を指定できる。
<Masking job settings>
The masking job can be set by the user via the operation and display unit 3. For example, the user can specify the item corresponding to the item value to be masked (i.e., the target item).

具体的には、操作表示部3は、いずれかの項目を指定する項目指定操作を受け付ける。制御部10は、項目指定操作で指定された項目を対象項目と認識する。そして、制御部10は、マスキング処理として、身分証の画像データ内に存在する対象項目の領域のうち少なくとも項目値の領域をマスキングしてマスキング済みデータを生成する処理を行う。 Specifically, the operation display unit 3 accepts an item designation operation to designate one of the items. The control unit 10 recognizes the item designated by the item designation operation as the target item. Then, as a masking process, the control unit 10 performs a process of masking at least the item value area of the target item present in the image data of the identification card to generate masked data.

以下に、図14に示すフローチャートを参照し、マスキングジョブの設定受付時に制御部10が行う処理の流れを説明する。たとえば、マスキングジョブでは、画像読取部2が身分証を読み取った後、マスキング処理が開始されるまでに、操作表示部3により項目指定操作の受け付けが行われる。すなわち、図4に示すステップ#1の処理後であってステップ#7の処理前、図14に示すフローがスタートする。 The following describes the flow of processing performed by the control unit 10 when accepting settings for a masking job, with reference to the flowchart shown in Figure 14. For example, in a masking job, after the image reading unit 2 reads an ID card, the operation display unit 3 accepts item specification operations before the masking process begins. In other words, the flow shown in Figure 14 starts after the processing of step #1 shown in Figure 4 and before the processing of step #7.

ステップ#61において、操作表示部3は、図15に示すような受付画面31を表示する。受付画面31には、受付ボタンRBが配置される。受付ボタンRBには、基本設定ボタンB1とカスタムボタンB2とがある。操作表示部3は、いずれかの受付ボタンRBに対する操作を項目指定操作として受け付ける。制御部10は、いずれの受付ボタンRBに対して項目指定操作が行われたかに基づき、ユーザー指定の項目(すなわち、対象項目)を判断する。 In step #61, the operation display unit 3 displays a reception screen 31 as shown in FIG. 15. Reception buttons RB are arranged on the reception screen 31. The reception buttons RB include a basic settings button B1 and a custom button B2. The operation display unit 3 accepts an operation on any of the reception buttons RB as an item designation operation. The control unit 10 determines the user-designated item (i.e., the target item) based on which reception button RB the item designation operation was performed on.

具体的には、記憶部101は、少なくとも1つの項目が登録されたマスキングリストを記憶する。受付ボタンRBは、マスキングリストに対応付けられる。マスキングリストが複数存在する場合には、複数(具体的には、マスキングリストと同数)の受付ボタンRBが受付画面31に表示される。複数の受付ボタンRBは、互いに異なるマスキングリストに対応付けれる。 Specifically, the storage unit 101 stores a masking list in which at least one item is registered. The reception button RB is associated with the masking list. If there are multiple masking lists, multiple reception buttons RB (specifically, the same number as the number of masking lists) are displayed on the reception screen 31. The multiple reception buttons RB are associated with different masking lists.

基本設定ボタンB1に対応するマスキングリストは、メーカーにより予め選択された項目が登録される。カスタムボタンB2に対応するマスキングリストには、ユーザーにより任意に選択された項目が登録される。マスキングリストを新規作成することにより、新規作成したマスキングリストに対応するカスタムボタンB2(すなわち、受付ボタンRB)が受付画面31に表示されるようになる。 The masking list corresponding to the basic settings button B1 contains items pre-selected by the manufacturer. The masking list corresponding to the custom button B2 contains items arbitrarily selected by the user. By creating a new masking list, the custom button B2 (i.e., the reception button RB) corresponding to the newly created masking list will be displayed on the reception screen 31.

なお、マスキングリストの新規作成要求をユーザーから受け付けるため、受付画面31には新規作成ボタンNBが表示される。操作表示部3は、新規作成ボタンNBに対する操作をマスキングリストの新規作成要求として受け付ける。 In order to receive a request from the user to create a new masking list, a new creation button NB is displayed on the reception screen 31. The operation display unit 3 receives an operation on the new creation button NB as a request to create a new masking list.

マスキングリストの新規作成要求を受け付けたとき、操作表示部3は、図16に示すような登録画面32を表示し、登録対象の項目を選択する登録操作をユーザーから受け付ける。登録画面32には、複数の項目(その項目名)が選択肢として表示される。 When a request to create a new masking list is received, the operation display unit 3 displays a registration screen 32 as shown in FIG. 16 and receives a registration operation from the user to select an item to be registered. The registration screen 32 displays multiple items (their item names) as options.

操作表示部3は、表示中のいずれかの項目の表示欄に対する操作を登録操作として受け付ける。たとえば、項目「身長」を登録したい場合には、項目「身長」の表示欄を操作することにより、項目「身長」を登録対象として選択できる。登録操作で選択した項目の表示欄にはチェックマークが付される。登録画面32内の決定ボタンDBを操作することにより、登録操作による項目の選択を完了させることができる。 The operation display unit 3 accepts an operation on the display field of any of the displayed items as a registration operation. For example, if you want to register the item "height," you can select the item "height" as the item to be registered by operating the display field for the item "height." A check mark is placed in the display field of the item selected in the registration operation. You can complete the selection of the item through the registration operation by operating the confirm button DB on the registration screen 32.

決定ボタンDBに対する操作が行われたとき、制御部10は、登録操作の受け付けが完了したと判断する。登録操作の受け付け後、制御部10は、登録操作で選択された項目が登録された新たなマスキングリストを生成し、記憶部101に記憶させる。 When an operation is performed on the decision button DB, the control unit 10 determines that acceptance of the registration operation has been completed. After accepting the registration operation, the control unit 10 generates a new masking list in which the items selected in the registration operation are registered, and stores the masking list in the memory unit 101.

マスキングリストを新規作成した場合において、それ以降に操作表示部3が項目指定操作を受け付けるとき、制御部10は、既存のマスキングリストに対応する受付ボタンRBに加え、新規のマスキングリストに対応する受付ボタンRBが配置された受付画面31を操作表示部3に表示させる。 When a new masking list is created and the operation display unit 3 subsequently accepts an item designation operation, the control unit 10 causes the operation display unit 3 to display a reception screen 31 on which an acceptance button RB corresponding to the new masking list is arranged in addition to the acceptance buttons RB corresponding to the existing masking list.

いずれかの受付ボタンRBが操作されたとき、制御部10は、操作表示部3が項目指定操作を受け付けたと判断する。このとき、制御部10は、項目指定操作が行われた受付ボタンRBに対応するマスキングリストが指定されたと判断する。すなわち、項目指定操作は、いずれかのマスキングリストを指定する操作である。 When any of the reception buttons RB is operated, the control unit 10 determines that the operation display unit 3 has accepted an item specification operation. At this time, the control unit 10 determines that the masking list corresponding to the reception button RB for which the item specification operation was performed has been specified. In other words, the item specification operation is an operation for specifying any of the masking lists.

図14に戻り、ステップ#62において、制御部10は、項目指定操作が行われた受付ボタンRB、すなわち、項目指定操作で指定されたマスキングリストを認識する。そして、制御部10は、項目指定操作で指定されたマスキングリストに登録されている項目を対象項目と認識する。 Returning to FIG. 14, in step #62, the control unit 10 recognizes the reception button RB on which the item designation operation was performed, i.e., the masking list designated in the item designation operation. The control unit 10 then recognizes the item registered in the masking list designated in the item designation operation as the target item.

ステップ#63において、制御部10は、マスキング処理を行う。ステップ#63の処理は、図4に示すステップ#7の処理と同じである。なお、制御部10は、図4に示すステップ#2~ステップ#6の各処理を行ってから、マスキング処理を行う。 In step #63, the control unit 10 performs masking processing. The processing in step #63 is the same as the processing in step #7 shown in Figure 4. Note that the control unit 10 performs masking processing after performing each of the processing in steps #2 to #6 shown in Figure 4.

ステップ#64において、制御部10は、マスキング済みデータの内容を示すプレビュー画像(図示せず)の表示を操作表示部3に行わせるとともに、マスキング済みデータを編集する編集操作の受け付けを操作表示部3に行わせる。編集操作は、マスキング対象の項目を変更する操作である。すなわち、編集操作は、いずれかの項目をマスキング対象として新たに追加する操作と、マスキングされている項目をマスキング対象から除外する操作と、を含む。 In step #64, the control unit 10 causes the operation display unit 3 to display a preview image (not shown) showing the contents of the masked data, and also causes the operation display unit 3 to accept editing operations to edit the masked data. Editing operations are operations that change the items to be masked. In other words, editing operations include operations that add a new item to be masked, and operations that remove a masked item from the masking targets.

ステップ#65において、制御部10は、編集操作が行われたか否かを判断する。編集操作操作が行われた場合には、ステップ#61に移行する。この後、ステップ#63に移行すると、制御部10は、編集操作での編集内容を反映したマスキング済みデータを新たに生成する。 In step #65, the control unit 10 determines whether an editing operation has been performed. If an editing operation has been performed, the process proceeds to step #61. After this, the process proceeds to step #63, where the control unit 10 generates new masked data that reflects the edited content of the editing operation.

ステップ#65において、編集操作が行われていない場合には、ステップ#66に移行する。ステップ#66において、制御部10は、マスキング済みデータの出力処理を出力部に行わせる。ステップ#66の処理は、図4に示すステップ#8の処理と同じである。 If no editing operation has been performed in step #65, the process proceeds to step #66. In step #66, the control unit 10 causes the output unit to perform output processing of the masked data. The processing in step #66 is the same as the processing in step #8 shown in Figure 4.

本実施形態では、身分証をスキャンした後、マスキング対象の項目(すなわち、対象項目)を指定する項目指定操作の受け付けが行われる。項目指定操作を行うことにより、身分証の画像データに存在する対象項目の領域のうち少なくとも項目値の領域がマスキングされる。すなわち、原稿D(身分証)の読み取りで得られる画像データのうちユーザー指定の項目に対応する領域だけを容易にマスキングできる。 In this embodiment, after scanning the ID card, an item designation operation is received to specify the items to be masked (i.e., target items). By performing the item designation operation, at least the item value area of the target items present in the image data of the ID card is masked. In other words, it is easy to mask only the areas of the image data obtained by scanning the document D (ID card) that correspond to the items designated by the user.

たとえば、従来の構成では、身分証を事前にスキャンしてマスキング対象の領域(画像データ内での位置)を登録しておく作業が必要となる。言い換えると、身分証の事前登録が必要となる。従来の構成では、身分証の事前登録を行っておけば、身分証の画像データのうち所望の領域をマスキングできる。 For example, with conventional configurations, it is necessary to scan an ID card in advance and register the area to be masked (its position within the image data). In other words, the ID card must be pre-registered. With conventional configurations, if the ID card is pre-registered, it is possible to mask the desired area within the image data of the ID card.

しかし、ユーザーからすると、身分証を事前登録する作業は煩わしい。仮に、対象となる身分証の種類が多数存在する場合には、身分証の事前登録を種類ごとに行わなければならず、作業が増大する。また、マスキング対象をフレキシブルに変更できない。マスキング対象を変更したい場合には、身分証の登録をやり直さなければならず、煩わしい。 However, from the user's perspective, the task of pre-registering ID cards is cumbersome. If there are multiple types of ID cards that can be used, pre-registration of each type of ID card must be performed, which increases the amount of work. Furthermore, the masking target cannot be changed flexibly. If a user wants to change the masking target, they must re-register the ID card, which is cumbersome.

一方で、本実施形態では、項目指定操作を行うことにより、或る身分証を読み取った場合には、その画像データのうち項目指定操作で指定した項目の領域がマスキングされ、その身分証とは種類が異なる他の身分証を読み取った場合にも、その画像データのうち項目指定操作で指定した項目の領域がマスキングされる。また、たとえば、マスキング対象が項目Aである場合において、項目Bをマスキング対象としてさらに追加する必要がある場合(すなわち、マスキング対象を変更する必要がある場合)には、項目指定操作で項目Aおよび項目Bを指定するだけで良い。これらのことにより、身分証の事前登録に相当する作業が不要となり、ユーザーの利便性が向上する。 In contrast, in this embodiment, when a certain ID card is scanned, the area of the image data corresponding to the item specified in the item specification operation is masked by performing an item specification operation. Also, when another ID card of a different type is scanned, the area of the image data corresponding to the item specified in the item specification operation is masked. Furthermore, for example, if the masking target is item A and it is necessary to add item B as a masking target (i.e., it is necessary to change the masking target), it is sufficient to simply specify items A and B in the item specification operation. This eliminates the need for work equivalent to pre-registering an ID card, improving user convenience.

また、本実施形態では、項目指定操作はマスキングリストを指定する操作である。これにより、複数の項目をマスキングしたい場合、マスキングしたい項目を1つずつ指定する必要はない。これにより、ユーザーの利便性がより向上する。 Furthermore, in this embodiment, the item specification operation is an operation for specifying a masking list. As a result, if you want to mask multiple items, you do not need to specify each item you want to mask one by one. This further improves user convenience.

また、本実施形態では、マスキングリストを新規に作成できる。ユーザーからすると、マスキングリストを任意に作成できるので、利便性が良い。 In addition, in this embodiment, new masking lists can be created. This is convenient for users, as they can create masking lists as they wish.

また、本実施形態では、マスキング済みデータを編集できるので、ユーザーの利便性が向上する。ここで、マスキング済みデータを編集するときには、マスキング済みデータの内容を示すプレビュー画像が表示される。これにより、マスキング済みデータをプレビューしながら編集できるので、マスキング済みデータの編集作業を効率的に行える。 In addition, in this embodiment, masked data can be edited, improving user convenience. When editing masked data, a preview image showing the contents of the masked data is displayed. This allows the masked data to be previewed while being edited, making editing the masked data more efficient.

今回開示された実施形態は、すべての点で例示であって、制限的なものではないと考えられるべきである。本発明の範囲は、上記実施形態の説明ではなく特許請求の範囲によって示され、さらに、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれる。 The embodiments disclosed herein should be considered in all respects to be illustrative and not restrictive. The scope of the present invention is indicated by the claims, not by the description of the above embodiments, and further includes all modifications within the meaning and scope of the claims.

1 印刷部(出力部)
2 画像読取部
3 操作表示部
10 制御部
100 複合機(画像処理装置)
102 通信部(出力部)
1000 PC(外部機器)
D 原稿
S シート
1. Printing unit (output unit)
2 Image reading unit 3 Operation display unit 10 Control unit 100 Multifunction device (image processing device)
102 Communication unit (output unit)
1000 PCs (external equipment)
D Manuscript S Sheet

Claims (3)

個人情報に関する項目の項目名および項目値のセットが複数記載された原稿を読み取る画像読取部と、
マスキング対象の前記項目である対象項目を認識し、前記画像読取部による前記原稿の読み取りで得られる画像データに対してマスキング処理を行うことにより、前記画像データ内に存在する前記対象項目の領域のうち少なくとも一部がマスキングされたマスキング済みデータを生成する制御部と、
情報を表示し、操作を受け付ける操作表示部と、を備え、
前記操作表示部は、いずれかの前記項目を指定する項目指定操作を受け付け、
前記制御部は、前記項目指定操作で指定された前記項目を前記対象項目と認識し、前記画像データ内に存在する前記対象項目の領域のうち少なくとも前記項目値の領域をマスキングして前記マスキング済みデータを生成する処理を前記マスキング処理として行い、
前記制御部は、前記画像データから、前記項目名の領域および前記項目値の領域のいずれかを個別に含むと予測される第1領域を検出する第1領域検出処理を行い、
前記原稿が読み取られた場合、前記第1領域検出処理では、複数の前記第1領域が検出され、
前記第1領域検出処理の結果、前記第1領域が1つしか検出されなかった場合、前記制御部は、マスキングに関するジョブを停止し、前記画像読取部にセットされている前記原稿の確認を促すメッセージを前記操作表示部に表示する、画像処理装置。
an image reading unit that reads a document on which a plurality of sets of item names and item values of items related to personal information are written;
a control unit that recognizes a target item that is an item to be masked, and performs a masking process on image data obtained by reading the document by the image reading unit, thereby generating masked data in which at least a portion of an area of the target item present in the image data is masked;
an operation display unit that displays information and accepts operations;
the operation display unit accepts an item designation operation for designating any one of the items;
the control unit recognizes the item specified by the item specifying operation as the target item, and performs, as the masking process, a process of masking at least an area of the item value among areas of the target item present in the image data to generate the masked data;
the control unit performs a first area detection process to detect a first area that is predicted to individually include either an area of the item name or an area of the item value from the image data;
When the document is read, a plurality of first areas are detected in the first area detection process,
If only one first area is detected as a result of the first area detection process, the control unit stops the masking job and displays a message on the operation display unit prompting the user to check the document set in the image reading unit.
前記第1領域検出処理の結果、前記第1領域が検出されなかった場合、前記制御部は、前記ジョブを停止し、前記画像読取部にセットされている前記原稿の確認を促すメッセージを前記操作表示部に表示する、請求項1に記載の画像処理装置。 The image processing device according to claim 1, wherein, if the first area is not detected as a result of the first area detection process, the control unit stops the job and displays a message on the operation display unit prompting the user to check the document set in the image reading unit. 前記マスキング済みデータの出力処理を行う出力部を備え、
前記出力部は、前記マスキング済みデータに基づく画像のシートへの印刷を前記出力処理として行う印刷部、および、前記マスキング済みデータの外部機器への送信を前記出力処理として行う通信部、のうち少なくとも一方である、請求項1または2に記載の画像処理装置。
an output unit that performs output processing of the masked data,
3. The image processing device according to claim 1, wherein the output unit is at least one of a printing unit that performs the output process of printing an image based on the masked data onto a sheet, and a communication unit that performs the output process of transmitting the masked data to an external device.
JP2024110775A 2023-09-26 2024-07-10 Image Processing Device Active JP7790482B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2024110775A JP7790482B2 (en) 2023-09-26 2024-07-10 Image Processing Device

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2023163706A JP7521668B1 (en) 2023-09-26 2023-09-26 Image Processing Device
JP2024110775A JP7790482B2 (en) 2023-09-26 2024-07-10 Image Processing Device

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2023163706A Division JP7521668B1 (en) 2023-09-26 2023-09-26 Image Processing Device

Publications (2)

Publication Number Publication Date
JP2025056712A JP2025056712A (en) 2025-04-08
JP7790482B2 true JP7790482B2 (en) 2025-12-23

Family

ID=91954237

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2023163706A Active JP7521668B1 (en) 2023-09-26 2023-09-26 Image Processing Device
JP2024110775A Active JP7790482B2 (en) 2023-09-26 2024-07-10 Image Processing Device

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2023163706A Active JP7521668B1 (en) 2023-09-26 2023-09-26 Image Processing Device

Country Status (1)

Country Link
JP (2) JP7521668B1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2026020718A (en) * 2024-07-29 2026-02-10 京セラドキュメントソリューションズ株式会社 Image processing device

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009111612A (en) 2007-10-29 2009-05-21 Canon Inc Image processing apparatus and workflow registration method
JP2010045427A (en) 2008-08-08 2010-02-25 Fuji Xerox Co Ltd Image processor and preview image generation device
JP2019097056A (en) 2017-11-24 2019-06-20 キヤノン電子株式会社 Information processing system
JP2021068023A (en) 2019-10-18 2021-04-30 株式会社沖データ Print control system and print control method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009111612A (en) 2007-10-29 2009-05-21 Canon Inc Image processing apparatus and workflow registration method
JP2010045427A (en) 2008-08-08 2010-02-25 Fuji Xerox Co Ltd Image processor and preview image generation device
JP2019097056A (en) 2017-11-24 2019-06-20 キヤノン電子株式会社 Information processing system
JP2021068023A (en) 2019-10-18 2021-04-30 株式会社沖データ Print control system and print control method

Also Published As

Publication number Publication date
JP2025054584A (en) 2025-04-08
JP7521668B1 (en) 2024-07-24
JP2025056712A (en) 2025-04-08

Similar Documents

Publication Publication Date Title
CN102244707A (en) image processing equipment
JP7790482B2 (en) Image Processing Device
US11770489B2 (en) Image processing apparatus, control method for image processing apparatus, and storage medium
JP7639470B2 (en) Information processing device and document management method
CN114302016A (en) Image processing system
JP7077789B2 (en) Image forming device
JP2025185404A (en) Image Processing Device
WO2025070308A1 (en) Image processing device
JP2025054588A (en) Image Processing Device
JP2025054586A (en) Image Processing Device
JP2026020718A (en) Image processing device
JP5634350B2 (en) Information extraction device
JP6269298B2 (en) Image forming apparatus
JP2014030080A (en) Image processing apparatus and image processing method
JP7147353B2 (en) image forming device
US20250356675A1 (en) Image processing apparatus
US20250335633A1 (en) Image processing apparatus
US20240193971A1 (en) Image processing apparatus, image forming apparatus, and image processing method
JP2025166533A (en) Image processing apparatus
JP6493298B2 (en) Image forming apparatus
JP2024151862A (en) Image Processing Device
JP7419942B2 (en) Image processing device and image forming device
JP7151322B2 (en) Image processing device and image processing method
US20220329702A1 (en) Image processing apparatus and control method thereof, and storage medium
US20220256030A1 (en) Communication apparatus that calls terminal device on other end indicated by predetermined destination number, when prespecified gesture is detected, and image forming apparatus

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240710

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240823

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20250624

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20250818

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20251111

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20251124

R150 Certificate of patent or registration of utility model

Ref document number: 7790482

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150