Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7301671B2 - Image processing device, information processing method and program - Google Patents
[go: Go Back, main page]

JP7301671B2 - Image processing device, information processing method and program - Google Patents

Image processing device, information processing method and program Download PDF

Info

Publication number
JP7301671B2
JP7301671B2 JP2019146678A JP2019146678A JP7301671B2 JP 7301671 B2 JP7301671 B2 JP 7301671B2 JP 2019146678 A JP2019146678 A JP 2019146678A JP 2019146678 A JP2019146678 A JP 2019146678A JP 7301671 B2 JP7301671 B2 JP 7301671B2
Authority
JP
Japan
Prior art keywords
folder
information
storage destination
document image
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019146678A
Other languages
Japanese (ja)
Other versions
JP2021027557A (en
Inventor
純也 荒川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2019146678A priority Critical patent/JP7301671B2/en
Publication of JP2021027557A publication Critical patent/JP2021027557A/en
Application granted granted Critical
Publication of JP7301671B2 publication Critical patent/JP7301671B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Control Or Security For Electrophotography (AREA)
  • Facsimiles In General (AREA)

Description

本発明は、画像処理装置、情報処理方法及びプログラムに関する。 The present invention relates to an image processing device, an information processing method, and a program.

帳票等の紙文書を画像読み取り装置でスキャンしてデジタル化する業務フローが存在する。その際には、一般的に、デジタル化した文書画像に、文書の種類又は内容に応じて、所定のフォルダに格納することが行われる。ここで、振り分けフォルダの指定を人手で行うことは、デジタル化する紙原稿の枚数が多くなると大きな負荷となる。
これを解決する手法として、特許文献1の手法がある。この手法では、選択された文書画像を保存する際に、保存先フォルダの強調表示(レコメンド)を行う。このレコメンドは、フォルダ関連度を用いて行われる。フォルダ関連度は、選択された文書画像とフォルダ内の文書画像すべてとの類似度を算出し、その類似度を平均することにより得られる値である。
There is a business flow in which paper documents such as forms are scanned by an image reading device and digitized. At that time, generally, the digitized document images are stored in a predetermined folder according to the type or contents of the document. Here, manually designating a sorting folder becomes a heavy burden when the number of paper documents to be digitized increases.
As a method for solving this problem, there is a method disclosed in Patent Document 1. In this method, when saving a selected document image, a save destination folder is highlighted (recommended). This recommendation is made using the degree of folder relevance. The folder relevance is a value obtained by calculating similarities between the selected document image and all document images in the folder and averaging the similarities.

特開2015-76064号公報JP 2015-76064 A

この手法では、フォルダ内に含まれる文書画像に基づきレコメンドを行うため、レコメンドされるフォルダは、フォルダに含まれるファイルの多くが選択された文書画像と類似している必要がある。そのため、複数の種類の文書画像が保存されているフォルダが保存先フォルダの場合には、適切なレコメンドをすることができない。このような場合は、文書画像を基にした業務処理を行う作業担当者のフォルダに、複数の種類の帳票の文書画像を保存する際等に生じることが予想される。また、文書画像の保存先が文書画像に含まれない情報によって決定される場合は、適切ではないレコメンドをする可能性がある。例えば、同一種類の文書画像について、文書画像のスキャンを行った担当者ごとに、保存先フォルダが異なる場合には、複数の担当者のフォルダがレコメンドされることになる。このような場合、ユーザーの選択ミスにより誤ったフォルダを選択してしまう可能性が高まる。 In this method, recommendations are made based on the document images contained in the folder. Therefore, the recommended folder should have many of the files contained in the folder similar to the selected document image. Therefore, when a folder in which a plurality of types of document images are saved is the save destination folder, appropriate recommendation cannot be made. Such a case is expected to occur, for example, when document images of multiple types of forms are saved in a folder of a worker who performs business processing based on document images. Also, if the storage destination of the document image is determined by information not included in the document image, an inappropriate recommendation may be made. For example, when document images of the same type are stored in different folders for each person in charge of scanning the document images, folders of a plurality of persons in charge are recommended. In such a case, the possibility of selecting the wrong folder due to the user's selection error increases.

本発明は、文書画像の種類と同一種類と判定された登録画像がある場合、前記登録画像の保存先フォルダに関する保存先情報を取得する取得手段と、前記保存先情報に基づいて、前記文書画像の種類と前記保存先フォルダとが紐づくか否かを判定する第1の判定手段と、前記第1の判定手段により前記文書画像の種類と前記保存先フォルダとが紐づくと判定された場合、前記保存先フォルダのレコメンド情報を生成する生成手段と、前記レコメンド情報を含むフォルダ選択画面を表示する表示手段と、を有することを特徴とする。 According to the present invention, when there is a registered image determined to be of the same type as a document image, an acquisition unit acquires storage destination information regarding a storage destination folder of the registered image; a first determination means for determining whether or not the type of the document image and the storage destination folder are linked; and when the first determination means determines that the type of the document image and the storage destination folder are linked , generating means for generating recommendation information of the storage destination folder; and display means for displaying a folder selection screen containing the recommendation information.

本発明によれば、適切なレコメンドをすることができると共に、ユーザーの選択ミスにより誤ったフォルダが選択されてしまう可能性を低減させることができる。 According to the present invention, it is possible to make an appropriate recommendation and reduce the possibility that an incorrect folder is selected due to a user's selection error.

画像処理装置のハードウェア構成の一例を示す図である。It is a figure which shows an example of the hardware constitutions of an image processing apparatus. 実施形態1の情報処理の一例を示すフローチャートである。4 is a flowchart showing an example of information processing according to the first embodiment; 文書画像をオブジェクトブロックに分割した一例を示す図である。FIG. 4 is a diagram showing an example of dividing a document image into object blocks; マッチングの概要の一例を示す図である。It is a figure which shows an example of the outline|summary of matching. データ構造の一例を示す図である。It is a figure which shows an example of a data structure. S207の詳細を示すフローチャートである。It is a flowchart which shows the detail of S207. フォルダ選択画面を示す図である。FIG. 10 is a diagram showing a folder selection screen; FIG. フォルダ選択画面を示す図である。FIG. 10 is a diagram showing a folder selection screen; FIG. 実施形態2の情報処理の一例を示すフローチャートである。10 is a flow chart showing an example of information processing according to the second embodiment; S901の詳細を示すフローチャートである。9 is a flowchart showing details of S901. 画面の一例を示す図である。It is a figure which shows an example of a screen.

以下、本発明の実施形態について図面に基づいて説明する。 BEST MODE FOR CARRYING OUT THE INVENTION An embodiment of the present invention will be described below with reference to the drawings.

<実施形態1>
図1は、画像処理装置100のハードウェア構成の一例を示す図である。
画像処理装置100は、ユーザーインターフェース104、CPU105、RAM106、記憶部107、画像読取部108、画像出力部109、ディスプレイ110を備え、装置制御部102を介して相互に通信可能に接続されている。また、更に画像処理装置100は、画像データを処理するASICから構成される画像処理部103を有する。また、画像処理装置100は、ネットワーク101を介して、非図示の外部の情報処理装置と接続されている。
<Embodiment 1>
FIG. 1 is a diagram showing an example of the hardware configuration of an image processing apparatus 100. As shown in FIG.
The image processing apparatus 100 includes a user interface 104, a CPU 105, a RAM 106, a storage section 107, an image reading section 108, an image output section 109, and a display 110, which are connected via the device control section 102 so as to be able to communicate with each other. Further, the image processing apparatus 100 has an image processing unit 103 configured by an ASIC for processing image data. The image processing apparatus 100 is also connected to an external information processing apparatus (not shown) via a network 101 .

ユーザーインターフェース104は、例えばキーボード、マウス、その他入出力装置によって構成され、各種の設定値又は指定値を入力することができる。
CPU105は、記憶部107内の初期プログラムに従って、メインプログラムを記憶部107より読み出し、RAM106に記憶する。RAM106は、プログラム格納用、ワーク用のメインメモリとして使用される。そして、メインプログラムに従って、CPU105は、装置制御部102を制御する。装置制御部102はコントローラ基盤から構成される。装置制御部102上に、CPU105、RAM106、記憶部107、画像処理部103、ネットワーク101の各デバイスが実装されている。
画像読取部108は、スキャナーデバイスであり、紙文書等を読取ることにより画像データ形式の文書画像を取得することができる。装置制御部102は、画像読取部108から文書画像を取得すると、記憶部107に記憶する。そして、装置制御部102は、スキャンアシスト処理を実行する際に、記憶部107に記憶された文書画像をRAM106に読み出す。ここで、スキャンアシスト処理は、送付先の保存先フォルダをレコメンドする処理である。
The user interface 104 is composed of, for example, a keyboard, mouse, and other input/output devices, and can input various setting values or specified values.
CPU 105 reads the main program from storage unit 107 according to the initial program in storage unit 107 and stores it in RAM 106 . A RAM 106 is used as a main memory for storing programs and for working. Then, the CPU 105 controls the device control section 102 according to the main program. The device control unit 102 is composed of a controller base. Devices such as a CPU 105 , a RAM 106 , a storage unit 107 , an image processing unit 103 and a network 101 are mounted on the device control unit 102 .
The image reading unit 108 is a scanner device, and can acquire a document image in an image data format by reading a paper document or the like. After acquiring the document image from the image reading unit 108 , the device control unit 102 stores it in the storage unit 107 . Then, the device control unit 102 reads the document image stored in the storage unit 107 to the RAM 106 when executing the scan assist processing. Here, the scan assist process is a process of recommending a storage destination folder of a destination.

そして、装置制御部102は、RAM106上の文書画像を解析し、スキャンアシストのための情報を生成する。解析処理は、4つの処理からなる。1つ目は、文書画像内の文字列ブロックを抽出するブロックセレクション処理(BS処理)である。2つ目は、文字列画像から文字列情報を抽出する光学文字認識処理(OCR処理)である。3つ目は、登録されている文書画像と新たにスキャンされた文書画像との間の類似度を求め、文書画像の種類を判定する処理である。4つ目は、判定処理を基にスキャンアシストのための情報を生成する処理である。スキャンアシストのための情報は、保存先フォルダに関連する情報からなる。 Then, the device control unit 102 analyzes the document image on the RAM 106 and generates information for scan assist. The analysis process consists of four processes. The first is block selection processing (BS processing) for extracting character string blocks in the document image. The second is optical character recognition processing (OCR processing) for extracting character string information from character string images. The third is a process of determining the type of the document image by obtaining the degree of similarity between the registered document image and the newly scanned document image. The fourth is a process of generating information for scan assist based on the determination process. The information for Scan Assist consists of information related to the save destination folder.

次に、装置制御部102は、生成されたスキャンアシストのための情報を用いて、スキャンアシストのためのUI画面を生成し、ディスプレイ110上に表示する処理を実行する。そして、装置制御部102は、ユーザーインターフェース104を介したユーザーからの指示に基づき、送信処理を行う。そして、装置制御部102は、ユーザーからのフィードバックを含めたスキャンアシスト処理結果についての情報を記憶部107に記憶する。
また、装置制御部102は、記憶部107に記憶された文書画像を画像出力部109に提供する。画像出力部109は、種々の形式で文書画像を出力する処理を実行する。画像出力部109は、プリンタデバイスである。例えば、画像出力部109は、文書画像に係る画像データを、記憶媒体に出力する処理を実行することができる。又は、画像出力部109は、印刷機能を備え、紙媒体等の出力媒体に文書画像を出力する処理を実行してもよい。
Next, the device control unit 102 generates a UI screen for scan assistance using the generated information for scan assistance, and executes processing for displaying it on the display 110 . Then, the device control unit 102 performs transmission processing based on an instruction from the user via the user interface 104 . Then, the device control unit 102 stores information about the scan assist processing result including feedback from the user in the storage unit 107 .
Further, the device control section 102 provides the document image stored in the storage section 107 to the image output section 109 . The image output unit 109 executes processing for outputting document images in various formats. The image output unit 109 is a printer device. For example, the image output unit 109 can execute processing for outputting image data relating to a document image to a storage medium. Alternatively, the image output unit 109 may have a print function and execute processing for outputting a document image to an output medium such as a paper medium.

以上説明した画像処理装置100は一例であり、画像読取部108及び画像出力部109のうち、画像出力部109を有さない構成の画像処理装置100であってもよい。また、画像処理装置100の一部機能を、ネットワークを介して通信を相互に行うことにより、外部処理装置で実行するようにしてもよい。外部処理装置は、サーバー等のコンピュータ装置で実装してもよいし、インターネット上のクラウドサーバーで実装してもよい。画像処理装置100は、その他必要に応じて、その他の構成を備えるものであってもよい。 The image processing apparatus 100 described above is merely an example, and the image processing apparatus 100 may be configured without the image output unit 109 out of the image reading unit 108 and the image output unit 109 . Also, some functions of the image processing apparatus 100 may be executed by an external processing apparatus by mutual communication via a network. The external processing device may be implemented by a computer device such as a server, or may be implemented by a cloud server on the Internet. The image processing apparatus 100 may have other configurations as required.

次に、本実施形態の情報処理について、図2を用いて説明する。図2は、画像処理装置100における新しくスキャンされた文書画像に対するスキャンアシストフローの全体を示すフローチャートである。図2のフローチャートは、ユーザーインターフェース104を介して、ユーザーから文書画像のスキャン指示を受け付けることにより起動する。その際、起動したユーザー名についての情報を装置制御部102は、RAM106に保持しておく。ユーザー名は、不図示の認証装置等を利用することにより取得可能である。図2に示されるフローチャートによる処理は、記憶部107に記憶されたプログラムコードがRAM106に展開され、CPU105によって装置制御部102が制御されることにより実行される。 Next, information processing according to this embodiment will be described with reference to FIG. FIG. 2 is a flow chart showing the overall scan assist flow for a newly scanned document image in the image processing apparatus 100. As shown in FIG. The flowchart in FIG. 2 is started by receiving a document image scan instruction from the user via the user interface 104 . At that time, the device control unit 102 retains information about the user name that has started up in the RAM 106 . The user name can be acquired by using an authentication device (not shown) or the like. The processing according to the flowchart shown in FIG. 2 is executed by the program code stored in the storage unit 107 being developed in the RAM 106 and the apparatus control unit 102 being controlled by the CPU 105 .

図2のステップS201において、装置制御部102は、画像読取部108で文書をスキャンし、文書画像に変換する。そして、装置制御部102は、画像処理部103で色変換処理及び階調補正等の文書画像用の補正処理を行い、記憶部107に保存する。この文書画像を以後、クエリ文書画像と呼称する。 In step S201 of FIG. 2, the device control unit 102 scans a document with the image reading unit 108 and converts it into a document image. Then, the device control unit 102 performs correction processing for the document image, such as color conversion processing and tone correction, in the image processing unit 103 and stores the result in the storage unit 107 . This document image is hereinafter referred to as a query document image.

次に、ステップS202において、装置制御部102は、記憶部107に保存されているクエリ文書画像をRAM106に読み出し、回転補正処理を行う。装置制御部102は、回転角度を算出し、算出した回転角度を用いて、画像を回転させることにより回転補正処理を行う。装置制御部102は、回転角度の算出を、文書画像内の文字列及び線がデジタル的には水平方向に並んでいることを利用する。例えば、装置制御部102は、様々な方向への射影ヒストグラムを取り、ヒストグラムのピークとボトムとが短い周期で大きく振動するヒストグラムに対応する角度を選択することにより、回転角度を算出することができる。これは、正しい方向への射影であれば、同一ラインの文字列及び同一方向の罫線等の水平の線が、ヒストグラム上の同一のビンに投票され、行間にあたる部分には何も投票されないため、大きな振幅が文字間の周期で生じるためである。ここまでの手法で算出された角度は、文字の向きが考慮されておらず、180度の不確実性が存在する。装置制御部102は、文字の向きについて、簡易的な文字認識処理を行った際の文字の確からしさ情報を用いて、判定することができる。これにより、文字の向きも考慮した角度情報を算出することができる。 Next, in step S202, the device control unit 102 reads the query document image stored in the storage unit 107 to the RAM 106, and performs rotation correction processing. The device control unit 102 performs rotation correction processing by calculating the rotation angle and rotating the image using the calculated rotation angle. The device control unit 102 calculates the rotation angle using the fact that the character strings and lines in the document image are digitally arranged in the horizontal direction. For example, the device control unit 102 can calculate the rotation angle by taking projection histograms in various directions and selecting angles corresponding to histograms in which the peak and bottom of the histogram oscillate greatly in a short period. . This is because, if projected in the correct direction, horizontal lines such as character strings in the same line and ruled lines in the same direction are voted in the same bin on the histogram, and nothing is voted in the space between lines. This is because a large amplitude occurs in the period between characters. The angle calculated by the method up to this point does not consider the orientation of the character, and there is an uncertainty of 180 degrees. The device control unit 102 can determine the orientation of characters by using character likelihood information obtained when a simple character recognition process is performed. As a result, it is possible to calculate the angle information in consideration of the orientation of the characters.

次に、ステップS203において、装置制御部102は、クエリ文書画像に対して、ブロックセレクション処理(BS処理)を実行する。ブロックセレクション処理とは、画像内の領域を分割してオブジェクトブロックにし、それぞれのブロックの属性を判定する処理である。具体例を、図3を用いて説明する。図3(A)はステップS201で読み取った文書画像の一例である。図3(B)は、文書画像をオブジェクトブロックに分割したものである。ブロック各々について、文字(TEXT)/図画(PICTURE)/写真(PHOTO)/線(LINE)/表(TABLE)等の属性が判定され、異なる属性を持つ領域に分割された様子を示している。 Next, in step S203, the device control unit 102 executes block selection processing (BS processing) on the query document image. The block selection process is a process of dividing an area in an image into object blocks and determining attributes of each block. A specific example will be described with reference to FIG. FIG. 3A is an example of the document image read in step S201. FIG. 3B shows the document image divided into object blocks. Attributes such as TEXT/PICTURE/PHOTO/LINE/TABLE are determined for each block, and divided into areas having different attributes.

ここで、ブロックセレクション処理の方法について、以下に説明する。先ず、装置制御部102は、文書画像を白黒に二値化し、輪郭線追跡を行って黒画素輪郭で囲まれる画素の塊を抽出する。面積が所定の面積よりも大きい黒画素の塊については、装置制御部102は、内部にある白画素に対しても輪郭線追跡を行い、白画素の塊を抽出し、更に一定面積以上の白画素の塊の内部から再帰的に黒画素の塊を抽出する。 Here, a method of block selection processing will be described below. First, the apparatus control unit 102 binarizes the document image into black and white, performs contour tracing, and extracts a group of pixels surrounded by black pixel contours. For a mass of black pixels whose area is larger than a predetermined area, the device control unit 102 also performs contour line tracing on white pixels inside, extracts a mass of white pixels, A block of black pixels is recursively extracted from inside the block of pixels.

このようにして得られた黒画素の塊を、装置制御部102は、大きさ及び形状で分類し、異なる属性を持つ領域へ分類していく。装置制御部102は、例えば、縦横比が1に近く、大きさが一定の範囲のものを文字相当の画素塊とする。更に装置制御部102は、近接する文字が整列よくグループ化されうる部分を文字領域(TEXT)とする。装置制御部102は、扁平な画素塊を線領域(LINE)とする。装置制御部102は、一定大きさ以上でかつ四角系の白画素塊を整列よく内包する黒画素塊の占める範囲を表領域(TABLE)とする。装置制御部102は、不定形の画素塊が散在している領域を写真領域(PHOTO)とする。そして、装置制御部102は、それ以外の任意形状の画素塊を図画領域(PICTURE)とする。ブロックセレクション処理で得られた各ブロックに対する属性情報は以降に説明する類似度計算等のための情報として用いられる。ここで、文字領域と判定されたブロックをBSテキストブロックと呼称する。BSテキストブロックの情報は、OCR(光学的文字認識)処理にも利用可能である。装置制御部102は、ステップS203で必要に応じて、OCR処理を行ってもよい。 The apparatus control unit 102 classifies the clusters of black pixels obtained in this way by size and shape, and classifies them into regions having different attributes. For example, the device control unit 102 determines pixel clusters having an aspect ratio close to 1 and a size within a certain range as pixel clusters corresponding to characters. Further, the device control unit 102 sets a portion where adjacent characters can be grouped in good order as a character area (TEXT). The device control unit 102 sets the flat pixel block as a line area (LINE). The device control unit 102 defines a table area (TABLE) as a range occupied by black pixel blocks having a certain size or larger and including rectangular white pixel blocks in a well-aligned manner. The device control unit 102 sets the area where irregular pixel blocks are scattered as a photo area (PHOTO). Then, the device control unit 102 sets the other arbitrary-shaped pixel block as a picture area (PICTURE). The attribute information for each block obtained by the block selection process is used as information for similarity calculation, etc., which will be described later. Here, a block determined as a character area is called a BS text block. Information in BS text blocks is also available for OCR (Optical Character Recognition) processing. The device control unit 102 may perform OCR processing as necessary in step S203.

次に、ステップS204において、装置制御部102は、クエリ文書画像と登録文書画像群との間でマッチング処理を行うことにより、文書画像の種類の判定を行う。ここで、登録文書画像群は、後述するステップS212で登録された過去に処理された文書画像の集まりである。また、マッチング処理とは、クエリ文書画像とすべての登録文書画像との間で類似度を算出し、最大の類似度を持つ登録画像を得る処理である。装置制御部102は、この最大の類似度が所定の閾値以上であった場合に、クエリ文書画像は、この最大の類似度を得た登録文書と同一種類の文書画像である判定する。装置制御部102は、最大の類似度が所定の閾値を上回らなかった場合には、同一種類の登録画像は存在しなかったと判定する。なお、装置制御部102は、この登録文書画像群を記憶部107からRAM106に読み出して利用する。また、登録文書画像群は、文書画像そのものでなく、各文書画像のブロックセレクション処理結果等のマッチング処理に利用可能な特徴量であってもよい。 Next, in step S204, the device control unit 102 performs matching processing between the query document image and the group of registered document images to determine the type of the document image. Here, the registered document image group is a collection of previously processed document images registered in step S212, which will be described later. The matching process is a process of calculating similarities between the query document image and all registered document images and obtaining a registered image having the maximum similarity. When the maximum degree of similarity is equal to or greater than a predetermined threshold, the device control unit 102 determines that the query document image is of the same type as the registered document that has obtained the maximum degree of similarity. If the maximum degree of similarity does not exceed a predetermined threshold, the device control unit 102 determines that there is no registered image of the same type. The device control unit 102 reads out the registered document image group from the storage unit 107 to the RAM 106 and uses it. Also, the registered document image group may not be the document images themselves, but may be feature amounts that can be used for matching processing such as block selection processing results of each document image.

ここで、マッチングの概要について、図4を用いて説明を行う。図4(A)はクエリ文書画像であり、図4(B)及び図4(C)は登録文書画像である。図4(A)と図4(B)はテキストの配置が類似しており、図4(A)と図4(C)はテキストの配置が類似していない。そのため、適切な手法を利用して、図4(A)と図4(B)の類似度と、図4(A)と図4(C)の類似度を算出すると、前者の方の類似度の方が高くなる。そのため、この場合には、マッチングの結果として、図4(B)が選択される。 Here, an overview of matching will be described with reference to FIG. FIG. 4A is a query document image, and FIGS. 4B and 4C are registered document images. 4A and 4B are similar in text placement, and FIGS. 4A and 4C are dissimilar in text placement. Therefore, if the similarity between FIGS. 4A and 4B and the similarity between FIGS. 4A and 4C are calculated using an appropriate method, the similarity of the former is is higher. Therefore, in this case, FIG. 4B is selected as a matching result.

ここで、BSテキストブロックを用いた類似度算出の概念についても説明をしておく。図4(D)は、図4(A)のBSテキストブロックを図示したものである。点線がBSテキストブロックであり、ID000~ID004は各テキストブロックのIDである。図4(A)の文字列がBSテキストブロックになっていることが分かる。同様に、図4(E)は、図4(B)のBSテキストブロックを図示したものであり、図4(F)は、図4(C)のBSテキストブロックを図示したものである。BSテキストブロックを用いた類似度算出は、BSテキストブロックの形状及び配置がどれだけ類似しているかに着目して、類似度を算出する方法である。図4(D)と図4(E)は類似しているBSテキストブロックが多い。具体的には、図4(D)ID000と図4(E)ID004、図4(D)ID001と図4(E)ID003、図4(D)ID002と図4(E)ID000、図4(D)ID003と図4(E)ID001が類似している。更に、図4(D)と図4(E)は、図4(D)ID004と図4(E)ID005が同一の位置になるように位置合わせして考える。そうすると、図4(D)ID004と図4(E)ID005、図4(D)ID003と図4(E)ID002、図4(D)ID002と図4(E)ID001が類似している。図4(D)と図4(F)は、若干オーバーラップしているBSテキストブロックは存在するが、類似度が高いBSテキストブロックは存在しない。そのため、図4(D)と図4(E)の類似度と、図4(D)と図4(F)の類似度を算出すると、前者の方の類似度の方が高くなる。 Here, the concept of similarity calculation using BS text blocks will also be explained. FIG. 4(D) illustrates the BS text block of FIG. 4(A). The dotted lines are BS text blocks, and ID000 to ID004 are the IDs of the respective text blocks. It can be seen that the character string in FIG. 4A is a BS text block. Similarly, FIG. 4(E) illustrates the BS text block of FIG. 4(B), and FIG. 4(F) illustrates the BS text block of FIG. 4(C). Similarity calculation using BS text blocks is a method of calculating similarity by focusing on how similar the shapes and arrangements of BS text blocks are. 4(D) and 4(E) have many similar BS text blocks. Specifically, FIG. 4(D) ID000 and FIG. 4(E) ID004, FIG. 4(D) ID001 and FIG. 4(E) ID003, FIG. 4(D) ID002 and FIG. 4(E) ID000, FIG. D) ID003 and FIG. 4(E) ID001 are similar. Furthermore, FIGS. 4(D) and 4(E) are aligned so that FIG. 4(D) ID004 and FIG. 4(E) ID005 are at the same position. 4(D) ID004 and FIG. 4(E) ID005, FIG. 4(D) ID003 and FIG. 4(E) ID002, and FIG. 4(D) ID002 and FIG. 4(E) ID001 are similar. In FIGS. 4(D) and 4(F), BS text blocks slightly overlapping exist, but BS text blocks with high similarity do not exist. Therefore, when calculating the similarity between FIGS. 4(D) and 4(E) and the similarity between FIGS. 4(D) and 4(F), the former has a higher similarity.

ここでは、帳票レイアウト情報であるBSテキストブロックを利用したマッチングについて説明した。しかし、装置制御部102は、その他の情報も活用してマッチングを行い、文書画像同士の類似度を判定してもよい。例えば、装置制御部102は、ユーザー情報(個人ID、組織ID等)、OCR情報(文書全体のOCR結果、特定のキーワードの有無、人名や会社名やタイトルの情報等)を活用して類似度を判定してもよい。また、装置制御部102は、複数の類似度判定ロジックを利用して、複数の観点で同一種類と判定される登録文書画像を見つけて、それぞれについて、後段のステップで文書画像の種類と保存先フォルダが紐づくかを判定してもよい。 Here, the matching using the BS text block, which is the form layout information, has been described. However, the device control unit 102 may also utilize other information to perform matching and determine the degree of similarity between document images. For example, the device control unit 102 utilizes user information (personal ID, organization ID, etc.), OCR information (OCR result of the entire document, presence/absence of a specific keyword, personal name, company name, title information, etc.) to determine the degree of similarity. may be determined. In addition, the device control unit 102 uses a plurality of similarity determination logics to find registered document images that are determined to be of the same type from a plurality of viewpoints, and determines the type and storage destination of each document image in a later step. It may be determined whether the folders are linked.

続いて、ステップS205において、装置制御部102は、ステップS204で、同一種類と判定した登録文書があったかどうかを判定する。装置制御部102は、同一種類と判定した登録文書があった場合には、ステップS206に進み、同一種類と判定した登録文書がなかった場合にはステップS211に進む。
ステップS205からステップS206に遷移した場合、装置制御部102は、ステップS204で得られた同一種類と判定した登録文書画像に対応する保存先フォルダ情報を取得する処理を行う。この保存先フォルダ情報は、この登録文書画像と同一種類と判定した過去のクエリ文書画像群の保存先に関する情報である。情報としては、保存先フォルダのフォルダパス(URL等も含む)、保存日付、保存した人の情報、レコメンドした保存先のフォルダパス、有効なレコメンドであったかの情報等がある。
Subsequently, in step S205, the device control unit 102 determines whether or not there is a registered document determined to be of the same type in step S204. If there is a registered document determined to be of the same type, the device control unit 102 proceeds to step S206, and if there is no registered document determined to be of the same type, proceeds to step S211.
When the process proceeds from step S205 to step S206, the device control unit 102 performs a process of acquiring storage destination folder information corresponding to registered document images determined to be of the same type obtained in step S204. This storage destination folder information is information relating to the storage destination of the past query document image group determined to be of the same type as this registered document image. The information includes the folder path (including URL etc.) of the storage destination folder, the date of storage, the information of the person who saved, the folder path of the recommended storage destination, information as to whether the recommendation was valid, and the like.

ここで、装置制御部102がRAM106又は記憶部107に保持するデータ構造の一例について、図5を用いて説明する。図5(A)は、クエリ文書画像のBSテキストブロック情報(ステップS203の処理結果)を保持するデータ構造である。1列目は、このデータ構造が持つ変数の情報であり、2列目は、各変数の型についての情報である。ここで、型の列の「short」は整数型を示す。「[ ]」はベクタ型を示す。「floAt」は浮動小数点を示す。「BooleAn」はブール型を示す。「String」は文字列を示す。「DAte」は日付型を示す。これは、図5の図面で共通である。図5(A)においては、クエリ文書画像について、画像幅、画像高さ、BSテキストブロック数の情報に加えて、「BSテキストブロック」のデータ構造をベクタで持つ。「BSテキストブロック」のデータ構造は、図5(B)となる。「BSテキストブロック」は、ブロックID、ブロック幅、ブロック高さ、ブロック左上頂点座標のX座標及びY座標を持つ。 Here, an example of the data structure held in the RAM 106 or the storage unit 107 by the device control unit 102 will be described with reference to FIG. FIG. 5A shows a data structure for holding BS text block information (process result of step S203) of the query document image. The first column is information about the variables that this data structure has, and the second column is information about the type of each variable. Here, "short" in the type column indicates an integer type. "[ ]" indicates a vector type. "floAt" indicates floating point. "BooleanAn" indicates a Boolean type. "String" indicates a character string. "Date" indicates a date type. This is common in the drawing of FIG. In FIG. 5A, the query document image has a vector data structure of "BS text block" in addition to the information of image width, image height, and number of BS text blocks. The data structure of the "BS text block" is shown in FIG. 5(B). A "BS text block" has a block ID, a block width, a block height, and the X and Y coordinates of the upper left corner of the block.

登録文書画像側のデータ構造は、図5(C)となる。これは、後述するステップS212で生成が行われる。具体的には、登録文書画像ID、画像幅、画像高さ、BSテキストブロック数、「BSテキストブロック」のベクタ、「保存先フォルダ情報ID」からなる。ここで、「BSテキストブロック」は、図5(B)のデータ構造を意味する。装置制御部102は、図5(A)及び図5(C)のBSテキストブロックリストの情報を利用して、クエリ文書画像と登録文書画像との間でのマッチング処理を行う。このマッチング処理のマッチング結果を格納するデータ構造は、図5(D)となる。マッチング結果は、マッチングした登録文書のIDと、マッチング処理で算出した類似度を持つ。 FIG. 5C shows the data structure of the registered document image. This is generated in step S212, which will be described later. Specifically, it consists of a registered document image ID, an image width, an image height, the number of BS text blocks, a "BS text block" vector, and a "storage destination folder information ID." Here, "BS text block" means the data structure of FIG. 5(B). The device control unit 102 performs matching processing between the query document image and the registered document image using the information of the BS text block lists of FIGS. 5A and 5C. The data structure for storing the matching result of this matching process is shown in FIG. 5(D). The matching result has the ID of the matched registered document and the degree of similarity calculated by the matching process.

図5(C)の「保存先フォルダ情報ID」は、登録文書画像に対応する保存先フォルダ情報のデータ構造のインスタンスを示すIDである。保存先フォルダ情報の具体的なデータ構造は、図5(E)となる。保存先フォルダ情報は、保存先フォルダ情報IDと、対応登録文書画像IDと、「個別クエリ文書画像保存先情報」のベクタを持つ。対応登録文書画像IDは、保存先フォルダ情報のインスタンスに対応する登録文書画像のIDである。「個別クエリ文書画像保存先情報」のデータ構造は、図5(F)となる。保存先フォルダパスは、保存先のフォルダを一意に表現する文字列である。この文字列は、保存先システムに合わせた文字列でよく、例えば、保存先システムのルートフォルダからの相対パス、又はURL等である。保存日付は、クエリ文書画像が送信されて保存された日付である。保存ユーザー名は、クエリ文書画像の送信を行ったユーザー名である。保存ユーザー名は、RAM106に保持している図2のフローチャートを起動したユーザーに関するユーザー名等から取得することができる。レコメンド成功フラグリストの1つ1つの要素は、後述するステップS210においてレコメンドした保存先フォルダが、ユーザーに利用された場合に「true」となる。利用されなかった場合には「false」となる。複数のフォルダパスをレコメンドする場合があるため、ベクタとなっている。実際にレコメンドしたフォルダパスが、レコメンド先フォルダパスリストの要素となる。複数のフォルダパスをレコメンドする場合があるため、ベクタとなっている。レコメンド先フォルダパスリストのx番目の要素のレコメンドが成功したかの情報が、レコメンド成功フラグリストのx番目の要素となる。 The “storage destination folder information ID” in FIG. 5C is an ID indicating an instance of the data structure of the storage destination folder information corresponding to the registered document image. A specific data structure of the destination folder information is shown in FIG. 5(E). The storage destination folder information has a storage destination folder information ID, a corresponding registered document image ID, and a vector of "individual query document image storage destination information". The corresponding registered document image ID is the ID of the registered document image corresponding to the instance of the destination folder information. The data structure of the “individual query document image storage location information” is shown in FIG. 5(F). The save destination folder path is a character string that uniquely represents the save destination folder. This character string may be a character string suitable for the storage destination system, such as a relative path from the root folder of the storage destination system, or a URL. The save date is the date when the query document image was sent and saved. The saved user name is the name of the user who sent the query document image. The saved user name can be obtained from the user name of the user who started the flowchart of FIG. Each element of the recommendation success flag list becomes "true" when the storage destination folder recommended in step S210, which will be described later, is used by the user. If not used, it becomes "false". It is a vector because it may recommend multiple folder paths. The actually recommended folder path becomes an element of the recommendation destination folder path list. It is a vector because it may recommend multiple folder paths. Information indicating whether the recommendation of the x-th element of the recommendation destination folder path list was successful becomes the x-th element of the recommendation success flag list.

後述するフォルダレコメンド情報で利用されるデータ構造が図5(G)となる。レコメンド先フォルダパスリストの要素は、レコメンドすべき保存先フォルダのパスとなる。レコメンド先フォルダパスリストの0番目の要素が最もレコメンド優先度が高い保存先フォルダのパスとなり、以降、優先度順に保存先フォルダのパスがレコメンド先フォルダパスリストに保持される。
以上のようなデータ構造を前提として、後述するステップを説明していく。
FIG. 5G shows a data structure used in folder recommendation information, which will be described later. The element of the recommendation destination folder path list is the path of the storage destination folder to be recommended. The 0th element of the recommendation destination folder path list becomes the path of the storage destination folder with the highest recommendation priority, and thereafter, the paths of the storage destination folders are held in the recommendation destination folder path list in order of priority.
Assuming the data structure as described above, the steps to be described later will be described.

続いて、ステップS207において、装置制御部102は、取得した保存先フォルダ情報に基づき、同一種類と判定した登録文書画像と保存先フォルダが紐づくかを判定する。ここで、この判定の詳細処理について、図6のフローチャートを用いて説明を行う。図6は、ステップS207の処理の詳細を示すフローチャートである。まず、ステップS501において、装置制御部102は、保存先フォルダ情報から統計量を計算する。ここでの統計量は、登録文書画像と、保存フォルダが紐づいているかを判定するための統計量である。ここでの「紐づいている」とは、ユーザーが文書画像の種類のみに応じて、保存フォルダを選択していることを意味する。「紐づいている」場合には、文書画像の種類に応じて、保存先フォルダをレコメンドする意味があることになる。統計量の例を下記に示す。 Subsequently, in step S207, the device control unit 102 determines whether or not the registered document image determined to be of the same type is associated with the storage destination folder based on the acquired storage destination folder information. Here, the detailed processing of this determination will be described using the flowchart of FIG. FIG. 6 is a flowchart showing the details of the processing in step S207. First, in step S501, the device control unit 102 calculates a statistic from the destination folder information. The statistic here is a statistic for determining whether the registered document image and the save folder are linked. Here, "associated" means that the user selects a storage folder according to only the type of document image. If it is "associated", it means that the storage destination folder is recommended according to the type of the document image. Examples of statistics are shown below.

・最頻フォルダパスの保存回数A
・総保存回数B
・最頻フォルダ保存比率C=A/B
最頻フォルダパスの保存回数Aは、保存先フォルダ情報において、保存回数の多いフォルダパス上位F個の合計保存回数である。文書画像の種類と保存先フォルダが静的に紐づいていることを想定する場合には、Fは1でよい。保存先フォルダが定期的に変更されるような場合に対応するためには、Fを1より大きく設定しておく必要があるが詳細は後述する。総保存回数Bは、保存先フォルダ情報が保持しているクエリ文書画像群に対応した個別の保存情報の数である。これらの統計量は、図5(E)、図5(F)のようなデータ構造を保持していれば、計算することができる。最頻フォルダパスの保存回数Aは、図5(F)保存先フォルダパスを集計することにより算出可能である。総保存回数Bは、図5(E)の個別クエリ文書保存先情報のベクタの個数である。ここで、最頻フォルダパスの保存回数Aと、総保存回数Bを計算する際には、直近に保存されたものほど重視するように重みづけをしたり、一定期間内の保存先フォルダ情報だけを利用するようにしたりしてもよい。このようにすることにより、保存先フォルダが変更された場合への対応力が向上する。例えば、定期的に保存フォルダが変更されるような場合では、時間が経過すると、最頻フォルダ保存比率Cが低下していく。そのような場合に、Fを2として、変更間隔以下の期間に保存された情報だけを収集するようにすれば、常に現在又は1つ前のフォルダの情報だけを利用して、主フォルダ保存比率Cが計算される。そのため、最頻フォルダ保存比率Cを高く保つことができる。但し、Fを1よりも大きく設定する場合には、間違った紐づけを行わないために、後述する判定処理の係数を厳しく設定する必要がある。
・Most frequent folder path save count A
・ Total save count B
・Most frequent folder saving ratio C = A/B
The save count A of the most frequent folder path is the total save count of F folder paths with the highest save counts in the save destination folder information. If it is assumed that the document image type and the save destination folder are statically associated, F may be 1. In order to cope with the case where the save destination folder is periodically changed, it is necessary to set F larger than 1, which will be described in detail later. The total storage count B is the number of pieces of individual storage information corresponding to the query document image group held by the storage destination folder information. These statistics can be calculated if the data structures shown in FIGS. 5(E) and 5(F) are held. The storage count A of the most frequent folder path can be calculated by summing up the storage destination folder paths shown in FIG. 5(F). The total storage count B is the number of vectors of the individual query document storage destination information in FIG. 5(E). Here, when calculating the number of saves A and the total number of saves B of the most frequent folder path, weighting is performed so that the most recent saves are emphasized, or only the save destination folder information within a certain period of time is calculated. may be used. By doing so, it is possible to improve the responsiveness to the case where the save destination folder is changed. For example, in a case where the storage folder is changed periodically, the most frequent folder storage ratio C decreases as time elapses. In such a case, if F is set to 2 and only information saved in a period equal to or shorter than the change interval is collected, only the information of the current or previous folder is always used, and the main folder storage ratio C is calculated. Therefore, the most frequent folder saving ratio C can be kept high. However, if F is set to be greater than 1, it is necessary to strictly set the coefficients of the determination process, which will be described later, in order to avoid wrong linking.

続いて、ステップS502において、装置制御部102は、帳票の種類と保存先フォルダの紐づきを判定する。判定には、ステップS501で計算した統計量を利用する。
例えば、装置制御部102は、下記のような判定を行う。
・条件1:最頻フォルダ保存比率C>N
・条件2:総保存回数B>M
・判定条件:条件1と2の両方を満たす
Nは0.8、Mは2等と設定しておけば、フォルダ保存が3回以上されているレイアウトにおいて、8割以上保存されているフォルダパス群がある場合にのみ、紐づいていると判定されることとなる。なお、条件1のみでNを0.8とすると、2回目に常に紐づいていると判定してしまうことになり、不適切な判定となる。なお、総保存回数Bに応じて、前述したF及びNを切り替えることにより、安定した判定となるようにしてもよい。例えば、総保存回数が小さいうちは統計量の信頼性が低いので、Fを小さく、Nを大きくしておけば、確実に紐づいている際にのみ、紐づき判定を行うことができる。
Subsequently, in step S502, the apparatus control unit 102 determines the link between the type of form and the save destination folder. The statistic calculated in step S501 is used for the determination.
For example, the device control unit 102 makes the following determinations.
・Condition 1: Most frequent folder storage ratio C>N
・Condition 2: Total save count B>M
・Judgment condition: Satisfying both conditions 1 and 2 If N is set to 0.8 and M is set to 2, etc., folder paths that are saved more than 80% of layouts that are saved to folders more than 3 times Only when there is a group, it will be determined that they are linked. Note that if N is set to 0.8 only under condition 1, it will always be determined to be linked at the second time, resulting in an inappropriate determination. It should be noted that the above-described F and N may be switched according to the total number of times B of storage so that the determination can be made stable. For example, when the total number of times of storage is small, the reliability of the statistics is low. Therefore, if F is set small and N is set large, it is possible to determine the link only when the link is definitely linked.

逆に、早めにレコメンドの実施を行うことが望ましい場合もある。例えば、常に文書画像の種類と保存フォルダが対応しているユーザーにとっては、同一種類の文書画像を3回以上利用しないとレコメンドされないことがストレスになる。例えば、登録文書画像群すべてにおいての最頻フォルダ保存比率Cの加重平均(保存回数で重みづけ)が一定の割合を超えていた場合には、常に文書画像の種類と保存フォルダが対応していることが想定される。このような場合には、新規の文書画像についても対応していることが想定される。そのため、装置制御部102は、例えば、N:0.8 M:0等として、2回目からレコメンドがされるようにしてもよい。
また、ユーザーが明示的に指示したときには、装置制御部102は、常に紐づき判定をするようにしてもよい。ユーザーの明示的な指示は、図2のフローチャートを最初に起動する際にユーザーが指示する場合、又は図2のフローチャートに関わる事前設定を行う際にユーザーが指示する場合等がある。
Conversely, there are cases where it is desirable to implement recommendations early. For example, for a user who always has correspondence between document image types and storage folders, it is stressful that the same type of document image cannot be recommended unless the same type of document image is used three or more times. For example, when the weighted average of the most frequent folder storage ratio C (weighted by the number of times of storage) in all registered document image groups exceeds a certain percentage, the type of document image always corresponds to the storage folder. is assumed. In such a case, it is assumed that the new document image is also supported. Therefore, the device control unit 102 may, for example, set N: 0.8, M: 0, etc., so that recommendations are made from the second time.
Further, when the user explicitly instructs, the device control unit 102 may always perform the linking determination. The user's explicit instruction may be the user's instruction when the flowchart of FIG. 2 is first activated, or the user's instruction when performing presetting related to the flowchart of FIG.

以上がステップS207の処理の詳細である。なお、ステップS207における処理は、予め計算することができる。装置制御部102は、処理パフォーマンスを向上させるために、予め計算をしておいた結果を記憶部107に保持しておき、その結果を参照するようにしてもよい。 The above is the details of the processing in step S207. Note that the processing in step S207 can be calculated in advance. In order to improve the processing performance, the device control unit 102 may hold the results of pre-calculations in the storage unit 107 and refer to the results.

続いて、ステップS208において、装置制御部102は、ステップS207における判定結果に基づき処理を分岐させる。装置制御部102は、ステップS207で、文書画像の種類と保存先フォルダが紐づいていると判定した場合には、ステップS209へと進む。装置制御部102は、判定しなかった場合には、ステップS211へと進む。
ステップS209に進んだ場合には、装置制御部102は、フォルダレコメンド情報を生成する。フォルダレコメンド情報は、ユーザーにレコメンドする保存先フォルダについての情報である。具体的なデータ構造の例は、前述した図5(G)である。レコメンドすべきファルダとして、下記のようなフォルダが想定される。
Subsequently, in step S208, the device control unit 102 branches the processing based on the determination result in step S207. If the device control unit 102 determines in step S207 that the document image type and the save destination folder are linked, the process proceeds to step S209. If the device control unit 102 does not make a determination, the process proceeds to step S211.
When proceeding to step S209, the device control unit 102 generates folder recommendation information. The folder recommendation information is information about a destination folder to be recommended to the user. An example of a specific data structure is the aforementioned FIG. 5(G). As a folder to be recommended, the following folders are assumed.

・直近に同一種類の文書画像を保存したフォルダ
・直近R回に同一種類の文書画像を最も多く保存したフォルダ
・同一種類の文書画像を最も多く保存したフォルダ
・フローチャートを実行しているユーザーが直近に同一種類の文書画像を保存したフォルダ
・フローチャートを実行しているユーザーが直近R回に同一種類の文書画像を最も多く保存したフォルダ
・フローチャートを実行しているユーザーが同一種類の文書画像を最も多く保存したフォルダ
・Folder in which document images of the same type were most recently saved ・Folder in which most document images of the same type were saved in the most recent R times ・Folder in which most document images of the same type were saved・The folder in which the user executing the flowchart saved the most document images of the same type in the last R times ・The folder in which the user executing the flowchart saved the most document images of the same type folder with many saves

ここで、Rは予め設定しておく定数である。これらのフォルダは、保存先フォルダ情報を利用して求めることが可能である。具体的には、図5(F)の保存先フォルダパス、保存日付、保存ユーザー名を利用すれば、求めることができる。これらのレコメンド候補のうち、どのフォルダを利用するか、どのような優先順位でレコメンドすべきかは、ユーザーによる想定利用形態に応じた設定、ユーザーによる事前設定、レコメンドの成功履歴に応じた重みづけ等、種々の方法がある。例えば、保存先を決めるルールが処理ユーザーに依存せず、保存先フォルダが定期的に変わる可能性がある場合には、下記のような形でのレコメンドを行えばよい。 Here, R is a preset constant. These folders can be found using the save destination folder information. Specifically, it can be obtained by using the save destination folder path, save date, and save user name in FIG. 5(F). Among these recommendation candidates, which folder should be used and what order of priority should be given are set by the user according to the assumed usage pattern, set in advance by the user, weighted according to the success history of recommendations, etc. , there are various methods. For example, if the rules for determining the storage destination do not depend on the processing user, and the storage destination folder may change periodically, recommendations can be made in the following format.

第一優先順位:直近に同一種類の文書画像を保存したフォルダ
第二優先順位:直近R回に同一種類の文書画像を最も多く保存したフォルダ
#第一優先順位と第二優先順位のフォルダが同一の場合には、第一優先順位のフォルダのみをレコメンドする
このようなレコメンドをするのは、定期に変更される可能性があるため、直近に保存したフォルダが次回以降も利用される可能性が高いためである。しかしながら、ユーザーの誤操作の可能性もあるので、直近R回に最も保存されているフォルダについてもレコメンドを行う。
ステップS207の紐づき判定と、ステップS209のフォルダレコメンド情報生成が分離されているため、紐づき判定とは異なり、保存回数だけではなく、直近に保存されたフォルダの観点でのレコメンドが可能となる。つまり、紐づき判定とは異なる観点で、フォルダレコメンド情報の生成が可能となる。
1st priority: the folder in which the same type of document image was saved most recently 2nd priority: the folder in which the same type of document image was saved the most in the most recent R times In the case of , only the folder with the first priority is recommended. The reason for this recommendation is that there is a possibility that the folder that was saved most recently will be used from the next time onwards, as there is a possibility that it will be changed periodically. Because it is expensive. However, since there is also the possibility of user's erroneous operation, the folder most saved in the most recent R times is also recommended.
Since the link determination in step S207 and the folder recommendation information generation in step S209 are separated, unlike the link determination, recommendations can be made from the perspective of the most recently saved folder in addition to the number of saves. . In other words, it is possible to generate folder recommendation information from a viewpoint different from link determination.

続いて、ステップS210において、装置制御部102は、フォルダレコメンド情報に基づき、ファルダレコメンドありのフォルダ選択画面を生成し、ディスプレイ110に表示する。そして、ユーザーによる操作をユーザーインターフェース104で受け付ける。ファルダレコメンドありのフォルダ選択画面は、フォルダレコメンド情報に含まれるフォルダパスが容易に選択可能になっていればよい。ユーザーが保存先のフォルダの選択を行った場合、装置制御部102は、ステップS213に遷移する。
ここで、UI例について、図7を用いて説明を行う。図7で示す画面は、ディスプレイ110にて表示される。ユーザーによる操作はユーザーインターフェース104を用いて行われる。また、装置制御部102は、ネットワーク101を介して、予め設定された送付先サーバー又はストレージのフォルダ情報を適宜取得することが可能である。
Subsequently, in step S<b>210 , the device control unit 102 generates a folder selection screen with folder recommendation based on the folder recommendation information, and displays it on the display 110 . Then, the user interface 104 receives an operation by the user. The folder selection screen with folder recommendation only needs to be able to easily select the folder path included in the folder recommendation information. If the user selects a destination folder, the device control unit 102 transitions to step S213.
Here, an example of UI will be described with reference to FIG. The screen shown in FIG. 7 is displayed on display 110 . User operations are performed using the user interface 104 . In addition, the device control unit 102 can appropriately acquire the folder information of the preset destination server or storage via the network 101 .

図7(A)は、レコメンドすべき保存先フォルダが1つだけの場合のフォルダ選択画面である。つまり、図5(G)のレコメンド先フォルダパスリストの要素が1つだけの場合のフォルダ選択画面である。図7(A)において、レコメンドすべき保存先フォルダは「階層3_ABD」である。図7(A)においては、このフォルダを選択可能な画面を最初から表示することにより、フォルダのレコメンドを行っている。選択候補フォルダ表示欄601に、「階層1_A/階層2_AB/階層3_ABD」と表示されている。「階層1_A/階層2_AB/」は、上位ファルダも含めたフォルダパスである。「階層3_ABD」は、フォルダ名である。そして、フォルダ内容表示欄602には、「階層3_ABD」の内容が表示される。この例においては、「階層3_ABD」にはフォルダは存在せず、上の階層のフォルダに戻るためのボタン603だけが表示されている。ボタン604は、本UI画面へと遷移する前の画面へ戻るためのボタンである。ボタン605は、フォルダ選択を行うためのボタンであり、選択されると、保存先フォルダとして、「階層3_ABD」が選択される。ユーザーが任意のフォルダを選択したい場合には、フォルダ内容表示欄602を利用して、適切なフォルダに移動し、ボタン605を選択する。本画面においては、まずボタン603を選択し、上位階層のフォルダに移動し、そこを起点に適切なフォルダに移動していく。 FIG. 7A shows a folder selection screen when there is only one save destination folder to be recommended. That is, this is the folder selection screen when there is only one element in the recommendation destination folder path list of FIG. 5(G). In FIG. 7A, the storage destination folder to be recommended is "layer 3_ABD". In FIG. 7A, a folder is recommended by displaying this folder selectable screen from the beginning. In the selection candidate folder display field 601, "hierarchy 1_A/hierarchy 2_AB/hierarchy 3_ABD" is displayed. "Layer 1_A/Layer 2_AB/" is a folder path including upper folders. "Layer 3_ABD" is a folder name. Then, in the folder content display field 602, the content of “hierarchy 3_ABD” is displayed. In this example, there is no folder in "hierarchy 3_ABD", and only a button 603 for returning to the upper hierarchy folder is displayed. A button 604 is a button for returning to the screen before transitioning to this UI screen. A button 605 is a button for selecting a folder, and when selected, "hierarchy 3_ABD" is selected as the save destination folder. When the user wants to select an arbitrary folder, he uses the folder contents display field 602 to move to an appropriate folder and selects a button 605 . On this screen, first, a button 603 is selected to move to a higher-level folder, and from there, move to an appropriate folder.

図7(B)は、レコメンドすべき保存先フォルダが複数ある場合のフォルダ選択画面である。つまり、図5(G)のレコメンド先フォルダパスリストの要素が複数ある場合のフォルダ選択画面である。図7(B)と図7(A)の違いは、ボタン606が存在することである。この例においては、ボタン606を選択すると、図7(C)の画面に遷移する。図7(C)は、レコメンドされる保存先ファルダが「階層3_ABC」となっており、選択候補フォルダ表示欄607の表示も、「階層1_A/階層2_AB/階層3_ABC」へと切り替わっている。ボタン608が選択されると、保存先フォルダとして、「階層3_ABC」が選択される。
ボタン609が選択された場合には、レコメンド先フォルダパスリストの次の要素をレコメンドする画面に遷移する。レコメンド先フォルダパスリストの最後の要素をレコメンドする画面からは、最初の要素をレコメンドする画面に遷移する。
FIG. 7B is a folder selection screen when there are a plurality of storage destination folders to be recommended. In other words, this is the folder selection screen when there are a plurality of elements in the recommendation destination folder path list of FIG. 5(G). The difference between FIG. 7B and FIG. 7A is the presence of button 606 . In this example, when the button 606 is selected, the screen transitions to the screen shown in FIG. 7(C). In FIG. 7C, the recommended storage destination folder is "Layer 3_ABC", and the display of the selection candidate folder display column 607 is also switched to "Layer 1_A/Layer 2_AB/Layer 3_ABC". When the button 608 is selected, "Layer 3_ABC" is selected as the save destination folder.
When the button 609 is selected, the screen transitions to a screen for recommending the next element in the recommendation destination folder path list. The screen for recommending the last element of the recommendation destination folder path list transitions to the screen for recommending the first element.

更に、別のUI例について、図8を用いて説明を行う。図8で示す画面は、ディスプレイ110にて表示され、ユーザーによる操作はユーザーインターフェース104を用いて行われる。また、装置制御部102は、ネットワーク101を介して、予め設定された送付先サーバー又はストレージのフォルダ情報を適宜取得することが可能である。 Furthermore, another UI example will be described with reference to FIG. The screen shown in FIG. 8 is displayed on the display 110 and is operated by the user using the user interface 104 . In addition, the device control unit 102 can appropriately acquire the folder information of the preset destination server or storage via the network 101 .

図8(A)は、レコメンドすべき保存先フォルダが2つの場合のフォルダ選択画面である。つまり、図5(G)のレコメンド先フォルダパスリストの要素が2つの場合のフォルダ選択画面である。図8(A)において、レコメンドすべき保存先フォルダは「階層3_ABD」及び「階層3_ABC」である。これらに対応し、フォルダ選択ボタン701に「階層1_A/階層2_AB/階層3_ABD」と表示され、フォルダ選択ボタン702に「階層1_A/階層2_AB/階層3_ABC」と表示されている。フォルダ選択ボタン701が選択されると、保存先フォルダとして「階層3_ABD」が選択される。フォルダ選択ボタン702が選択されると、保存先フォルダとして「階層3_ABC」が選択される。ボタン703は、本UI画面へと遷移する前の画面へ戻るためのボタンである。ボタン704を選択すると、ユーザーが任意のフォルダを選択するための画面である図8(B)へと遷移する。図8(B)の選択候補フォルダ表示欄705は、現在の選択候補のフォルダ名を表示するものであり、最上位層のフォルダ名である「ルート」が表示されている。フォルダ内容表示欄706には、「ルート」フォルダに含まれるフォルダに移動するためのボタンが表示されている。順次、このボタンを選択していくことにより、ユーザーは任意のフォルダへと移動することができる。ユーザーが選択したいフォルダに移動したあとに、ボタン707を選択することにより、該当するフォルダを選択することができる。 FIG. 8A shows a folder selection screen when there are two storage destination folders to be recommended. That is, this is the folder selection screen when there are two elements in the recommendation destination folder path list of FIG. 5(G). In FIG. 8A, storage destination folders to be recommended are "hierarchy 3_ABD" and "hierarchy 3_ABC". Corresponding to these, the folder selection button 701 displays "layer 1_A/layer 2_AB/layer 3_ABD", and the folder selection button 702 displays "layer 1_A/layer 2_AB/layer 3_ABC". When the folder selection button 701 is selected, "layer 3_ABD" is selected as the save destination folder. When the folder selection button 702 is selected, "layer 3_ABC" is selected as the save destination folder. A button 703 is a button for returning to the screen before transitioning to this UI screen. When a button 704 is selected, the screen transitions to FIG. 8B, which is a screen for the user to select an arbitrary folder. A selection candidate folder display field 705 in FIG. 8B displays the folder name of the current selection candidate, and displays "root" which is the folder name of the highest layer. A folder content display field 706 displays a button for moving to a folder included in the "root" folder. By sequentially selecting this button, the user can move to any folder. By selecting the button 707 after moving to the folder that the user wants to select, the corresponding folder can be selected.

続いて、ステップS205又はステップS208からステップS211に遷移した場合の説明を行う。ステップS211において、装置制御部102は、ファルダレコメンドなしのフォルダ選択画面を生成し、ディスプレイ110に表示する。そして、ユーザーによる操作をユーザーインターフェース104で受け付ける。ファルダレコメンドなしのフォルダ選択画面は、ユーザーが所望するフォルダが容易に選択可能になっていればよい。ユーザーが保存先のフォルダの選択を行うと、装置制御部102は、ステップS212に遷移する。UI例については、図8(B)と同等ものであればよいため、説明を省略する。 Next, a description will be given of the transition from step S205 or step S208 to step S211. In step S<b>211 , the device control unit 102 generates a folder selection screen without folder recommendations and displays it on the display 110 . Then, the user interface 104 receives an operation by the user. The folder selection screen without folder recommendation should allow the user to easily select a desired folder. When the user selects a destination folder, the device control unit 102 transitions to step S212. An example of the UI may be the same as that of FIG. 8B, so description thereof will be omitted.

ステップS212において、装置制御部102は、文書マッチング用の情報の更新を行う。ステップS205からステップS211へと遷移をしてきた場合には、マッチングした文書画像がなかったことになるので、クエリ文書画像の新しい登録文書画像としての登録が必要となる。その場合には、クエリ文書画像を新しい登録文書画像として登録する。登録は、装置制御部102が、登録情報を記憶部107に保存することにより行う。登録する情報は、マッチングに必要な情報である。マッチングに必要な情報は、本実施形態においては、ステップS203で算出したクエリ文書画像のBS処理結果である。BS処理結果の情報は、クエリ文書画像の構造に関する情報が含まれており、マッチングに有用な情報であるためである。なお、装置制御部102は、クエリ文書画像の画像情報そのもの、又は局所特徴量等の別種の公知の特徴量を保存しておき、文書画像のマッチングに利用してもよい。具体的なデータ構造の例は、前述した図5(C)の登録文書画像のデータ構造である。 In step S212, the device control unit 102 updates information for document matching. If there is a transition from step S205 to step S211, it means that there is no matching document image, so it is necessary to register the query document image as a new registered document image. In that case, the query document image is registered as a new registered document image. Registration is performed by device control section 102 storing registration information in storage section 107 . Information to be registered is information necessary for matching. Information required for matching is the BS processing result of the query document image calculated in step S203 in this embodiment. This is because the information on the BS processing result includes information on the structure of the query document image and is useful information for matching. Note that the device control unit 102 may store the image information of the query document image itself, or another type of known feature amount such as a local feature amount, and use it for document image matching. A specific example of the data structure is the data structure of the registered document image shown in FIG. 5C.

ステップS210又はステップS212からステップS213に遷移すると、装置制御部102は、保存先フォルダ情報の更新作業を行う。装置制御部102は、ステップS205でマッチングしたと判定した登録文書画像又は、ステップS212で新規に登録した登録文書画像に対応する保存先フォルダ情報の更新を行う。更新内容は、ステップS210又はステップS211でユーザーが最終的に選択した保存先フォルダについての情報の追加である。情報は、例えば、フォルダパス(URL等も含む)、保存日付、フローチャートの実行ユーザーの情報等である。ステップS210から遷移した場合には、装置制御部102は、レコメンドした保存先のフォルダパス、有効なレコメンドであったかの情報等の追加も行う。有効なレコメンドであったかどうかは、最終的にユーザーが選択したフォルダと、レコメンドした保存先フォルダの比較により判定可能である。具体的なデータ構造の例は、前述した図5(E)の保存先フォルダ情報及び図5(F)の個別クエリ文書保存先情報であり、図5(F)の個別クエリ文書保存先情報が新規に追加されることになる。登録文書画像と保存先フォルダ情報の対応づけは、前述した図5(C)の保存先フォルダ情報IDと、図5(E)の保存先フォルダ情報IDに同一のIDを入れることにより可能である。更に、逆方向の参照も可能とするために、前述した図5(C)の登録文書画像IDと、図5(E)の対応登録文書画像IDに同一のIDを入れておいてもよい。 After transitioning from step S210 or step S212 to step S213, the device control unit 102 updates the destination folder information. The device control unit 102 updates the storage destination folder information corresponding to the registered document image determined to be matched in step S205 or the registered document image newly registered in step S212. The content of the update is the addition of information about the save destination folder finally selected by the user in step S210 or step S211. The information includes, for example, a folder path (including a URL, etc.), a save date, information on a user executing the flowchart, and the like. When transitioning from step S210, the device control unit 102 also adds information such as the folder path of the storage destination of the recommendation and whether or not the recommendation was valid. Whether or not the recommendation is valid can be determined by comparing the folder finally selected by the user and the recommended storage destination folder. An example of a specific data structure is the storage destination folder information in FIG. 5(E) and the individual query document storage destination information in FIG. 5(F). It will be newly added. The correspondence between the registered document image and the storage destination folder information is possible by entering the same ID in the storage destination folder information ID of FIG. 5C and the storage destination folder information ID of FIG. 5E. . Furthermore, in order to enable reference in the opposite direction, the same ID may be entered in the registered document image ID of FIG. 5C and the corresponding registered document image ID of FIG. 5E.

最後に、ステップS214において、装置制御部102は、クエリ文書画像の送信設定を行う。送信設定は、ステップS210又はステップS211で選択された保存先フォルダに関する情報と、予め設定された送付先サーバー又はストレージの情報に基づいて生成される。そして、装置制御部102は、ネットワーク101を介して、送信設定に従い、クエリ文書画像を送信する。 Finally, in step S214, the device control unit 102 sets transmission of the query document image. The transmission settings are generated based on the information on the destination folder selected in step S210 or S211 and the information on the preset destination server or storage. Then, the device control unit 102 transmits the query document image via the network 101 according to the transmission setting.

以上が、画像処理装置100における情報処理のフローチャートになる。なお、ステップS214とステップS213には依存関係がないため、並列に実行したり、順序を入れ替えたりして、実行してもよい。以上説明したとおり、本実施形態における一連の情報処理では、文書画像の種類と、ユーザーが選択した保存先フォルダとの対応を利用しているため、保存先フォルダに既に含まれている文書画像に左右されずにレコメンドを行うことができる。そのため、複数の種類の文書画像が保存されているフォルダが保存先フォルダの場合であっても、適切なレコメンドをすることができる。また、振り分けた後に、作業フローに従い、1次保存先フォルダから文書画像が移動された場合でも適切なレコメンドを行うことができる。 The above is the flow chart of the information processing in the image processing apparatus 100 . Since steps S214 and S213 have no dependency, they may be executed in parallel or their order may be changed. As described above, the series of information processing in this embodiment uses the correspondence between the document image type and the destination folder selected by the user. Recommendations can be made without being influenced. Therefore, even if a folder in which a plurality of types of document images are stored is a storage destination folder, appropriate recommendations can be made. In addition, even if the document image is moved from the primary storage destination folder according to the work flow after sorting, appropriate recommendation can be made.

また、本実施形態における一連の情報処理では、文書画像に含まれる情報のみで、保存先フォルダが決定されているかの判定も行うため、文書画像の保存先が文書画像自身以外の情報によって決定される場合には、レコメンドを行わないことが可能になる。つまり、適切ではないレコメンドを行わないことにより、ユーザーの選択ミスにより誤ったフォルダを選択してしまう可能性を低減させることができる。 In addition, in the series of information processing according to the present embodiment, it is determined whether or not the storage destination folder is determined based only on the information included in the document image. It is possible not to make a recommendation when In other words, by not making inappropriate recommendations, it is possible to reduce the possibility of the user selecting an incorrect folder due to a selection error.

なお、本実施形態において、類似度計算にBSテキストブロックを利用しているが、装置制御部102は、他の類似度計算手法を利用してもよい。例えば、画像の見た目自体を比較するために、装置制御部102は、低解像度にした文書画像同士の画素値自体を利用して類似度を計算してもよい。この際には、装置制御部102は、文書画像同士の輝度値の差の絶対値の和、又は相関係数を類似度として利用する。又は、文章の内容の類似度を見るために、装置制御部102は、OCR結果の文字列を利用して類似度を計算してもよい。この際には、装置制御部102は、文字列同士の距離を計算する尺度であるレーベンシュタイン距離等を利用して、類似度尺度を求めればよい。 In this embodiment, BS text blocks are used for similarity calculation, but the device control unit 102 may use other similarity calculation methods. For example, in order to compare the appearance of the images, the device control unit 102 may calculate the degree of similarity using the pixel values of the low-resolution document images. At this time, the device control unit 102 uses the sum of the absolute values of the differences in the luminance values of the document images or the correlation coefficient as the degree of similarity. Alternatively, the device control unit 102 may calculate the degree of similarity using the character strings of the OCR results in order to see the degree of similarity of the contents of the sentences. In this case, the device control unit 102 may obtain a similarity scale using the Levenshtein distance or the like, which is a scale for calculating the distance between character strings.

<実施形態2>
以下、実施形態2について、実施形態1と異なる部分について説明する。
実施形態2では、文書画像の種類とフォルダが直接的に紐づいていない場合に、ユーザーの手動設定の手間を軽減する方法について説明を行う。
実施形態1との差分は、図2及び図6のフローチャートであるため、図2のフローチャートの代わりに図9のフローチャートを参照し、図6のフローチャートの代わりに図10のフローチャートを参照し、説明する。
<Embodiment 2>
The second embodiment will be described below with respect to portions different from the first embodiment.
In the second embodiment, a method for reducing the user's manual setting work when the type of document image and the folder are not directly linked will be described.
The difference from the first embodiment is the flowcharts of FIGS. 2 and 6, so the flowchart of FIG. 9 is referred to instead of the flowchart of FIG. 2, and the flowchart of FIG. 10 is referred to instead of the flowchart of FIG. do.

まず、本実施形態のフローチャートについて、図9を用いて説明する。図9は、画像処理装置100における新しくスキャンされた文書画像に対するスキャンアシストフローの全体を示すフローチャートである。図9のフローチャートの起動方法、実行方法は、図2のフローチャートと同様である。
ここで、図2と図9のフローチャートの違いは、ステップS207とステップS901、ステップS209とステップS902、ステップS210とステップS903である。そこで、ステップS901、ステップS902、ステップS903についてだけ説明を行う。
First, the flowchart of this embodiment will be described with reference to FIG. FIG. 9 is a flow chart showing the overall scan assist flow for a newly scanned document image in image processing apparatus 100 . The starting method and execution method of the flowchart of FIG. 9 are the same as those of the flowchart of FIG.
2 and 9 are steps S207 and S901, steps S209 and S902, and steps S210 and S903. Therefore, only steps S901, S902, and S903 will be described.

ステップS901において、装置制御部102は、取得した保存先フォルダ情報に基づき、同一種類と判定した登録文書画像と保存先フォルダが紐づくかを判定する。ここで、この判定の詳細処理について、図10のフローチャートを用いて説明を行う。図10は、ステップS901の処理の詳細を示すフローチャートである。まず、ステップS501とステップS502は、図6のステップS501とステップS502と同様であるため、説明を省略する。 In step S<b>901 , the apparatus control unit 102 determines whether the registered document image determined to be of the same type is associated with the storage destination folder based on the acquired storage destination folder information. Here, detailed processing of this determination will be described using the flowchart of FIG. 10 . FIG. 10 is a flowchart showing the details of the processing in step S901. First, since steps S501 and S502 are the same as steps S501 and S502 in FIG. 6, the description thereof is omitted.

ステップS1001において、装置制御部102は、後続するステップで利用する変数Pを1に初期化する。なお、この変数Pは、後段のステップで利用するため、図10のフローチャートが終了したあとも、RAM106に保持しておく。
続いて、ステップS1002において、装置制御部102は、S502又はS1004で、帳票の種類と保存先フォルダが紐づいていると判定されたかにより分岐を行う。装置制御部102は、紐づき判定された場合にはステップS1006に進む。装置制御部102は、紐づき判定されなかった場合には、ステップS1003に進む。
In step S1001, the device control unit 102 initializes to 1 a variable P that is used in subsequent steps. It should be noted that this variable P is retained in the RAM 106 even after the flowchart of FIG. 10 is completed because it will be used in subsequent steps.
Subsequently, in step S1002, the device control unit 102 branches depending on whether it is determined in step S502 or S1004 that the type of form and the save destination folder are linked. The device control unit 102 advances to step S1006 when the connection is determined. The device control unit 102 advances to step S1003 when the connection determination is not made.

ステップS1002からステップS1003に進んだ場合は、装置制御部102は、保存先フォルダ情報に含まれるフォルダパスをP階層上にした上で、統計情報を計算する。
例えば、フォルダ情報に含まれるフォルダパスが
「階層1_A/階層2_AB/階層3_ABD」
「階層1_A/階層2_AB/階層3_ABB」
「階層1_A/階層2_AB/階層3_ABC」
「階層1_A/階層2_AA/階層3_ABA」
であったとする。この場合、Pが1であった場合には、
「階層1_A/階層2_AB」
「階層1_A/階層2_AB」
「階層1_A/階層2_AB」
「階層1_A/階層2_AA」
がP階層上のパスとなる。P階層上にする前はすべて異なるフォルダパスであったが、P階層上にすることにより、3/4のフォルダパスが同一のフォルダパスとなる。ユーザーにとっては、このフォルダパスがレコメンドされれば、最上位フォルダから手動で保存先フォルダを設定するよりも少ない工数で、フォルダを設定することができる。このP階層上のフォルダパスを利用して、装置制御部102は、ステップS502と同様に統計量を計算する。なお、最上位階層までの層がP階層以下のフォルダパスは、最上位階層として扱う。
When the process proceeds from step S1002 to step S1003, the device control unit 102 calculates the statistical information after setting the folder path included in the save destination folder information to the P layer.
For example, if the folder path included in the folder information is "layer 1_A/layer 2_AB/layer 3_ABD"
"Layer 1_A/Layer 2_AB/Layer 3_ABB"
"Layer 1_A/Layer 2_AB/Layer 3_ABC"
"Layer 1_A/Layer 2_AA/Layer 3_ABA"
Suppose it was In this case, if P was 1,
"Layer 1_A/Layer 2_AB"
"Layer 1_A/Layer 2_AB"
"Layer 1_A/Layer 2_AB"
"Layer 1_A/Layer 2_AA"
is a path on the P hierarchy. The folder paths were all different before being placed on the P layer, but by moving to the P layer, 3/4 of the folder paths become the same folder path. For the user, if this folder path is recommended, the folder can be set with fewer man-hours than manually setting the save destination folder from the top folder. Using this folder path on the P hierarchy, the device control unit 102 calculates the statistic in the same manner as in step S502. Note that a folder path whose layers up to the highest layer are P layers or lower is treated as the highest layer.

続いて、ステップS1004において、装置制御部102は、帳票の種類と保存先フォルダの紐づきを判定する。本ステップで利用する統計量がステップS1003で算出した統計量であることを除けば、図6のステップS502と同様である。
そして、ステップS1005において、装置制御部102は、変数Pに1を加算する。これは、P階層上のフォルダパスで紐づき判定がされなかった場合に、更に上位の階層のフォルダパスで紐づき判定がされないかを試行するために行う。
ステップS1002からステップS1006に進んだ場合は、装置制御部102は、紐づき判定された際に、最も保存回数が多かったフォルダパスが最上位階層のフォルダであるかを判定する。Pが大きくなると、最終的にすべてのフォルダパスが最上位階層になり、意味のない紐づき判定となるので、この判定を行う。最上位階層のフォルダであると判定しなかった場合には、装置制御部102は、このままフローチャートの処理を終了する。最上位階層のフォルダであると判定した場合には、装置制御部102は、ステップS1007に進む。
ステップS1006からステップS1007に進んだ場合は、装置制御部102は、紐づき判定を変更し、紐づきしていないことにする。
Subsequently, in step S1004, the device control unit 102 determines the link between the type of form and the destination folder. Except that the statistic used in this step is the statistic calculated in step S1003, the process is the same as step S502 in FIG.
Then, in step S1005, the device control unit 102 adds 1 to the variable P. This is done in order to try whether or not a link determination is made with a folder path of a higher layer when the link determination is not performed with the folder path on the P layer.
When the process proceeds from step S1002 to step S1006, the device control unit 102 determines whether the folder path with the largest number of times of saving is the folder of the highest layer when the association is determined. As P becomes larger, all folder paths eventually become the highest layer, and this determination is made because it becomes meaningless determination of linking. If the device control unit 102 does not determine that the folder is the highest hierarchical folder, the device control unit 102 terminates the processing of the flowchart. If it is determined to be the folder of the highest hierarchy, the device control unit 102 proceeds to step S1007.
When the process proceeds from step S1006 to step S1007, the device control unit 102 changes the linking determination to determine that there is no linking.

以上がステップS901の処理の詳細である。なお、ステップS901における処理は、予め計算が可能である。処理パフォーマンスを向上させるために、装置制御部102は、予め計算をしておいた結果を記憶部107に保持しておき、その結果を参照するようにしてもよい。 The above is the details of the processing in step S901. It should be noted that the processing in step S901 can be calculated in advance. In order to improve the processing performance, the device control unit 102 may hold the results of pre-calculations in the storage unit 107 and refer to the results.

続いて、ステップS902についての説明を行う。ステップS902において、装置制御部102は、フォルダレコメンド情報の生成を行う。フォルダレコメンド情報は、実施形態1と同様の情報である。図10の情報処理で生成された変数Pが1の場合には、装置制御部102は、図2のステップS209と同様の処理を行う。変数Pが1より大きい場合には、装置制御部102は、図10のステップS1003で、最も保存回数が多かったフォルダパスをユーザーにレコメンドする保存先フォルダとする。但し、この保存先フォルダは、ユーザーがこのフォルダをベースに手動で最終的な保存先フォルダを設定することが前提となる。 Next, step S902 will be described. In step S902, the device control unit 102 generates folder recommendation information. Folder recommendation information is the same information as in the first embodiment. When the variable P generated by the information processing in FIG. 10 is 1, the device control unit 102 performs the same processing as in step S209 in FIG. If the variable P is greater than 1, the device control unit 102, in step S1003 of FIG. 10, sets the folder path with the largest number of saves as the save destination folder to be recommended to the user. However, this save destination folder is based on the premise that the user manually sets the final save destination folder based on this folder.

最後にステップS903についての説明を行う。ステップS903において、装置制御部102は、フォルダレコメンド情報に基づき、ファルダレコメンドありのフォルダ選択画面を生成し、ディスプレイ110に表示する。そして、ユーザーによる操作をユーザーインターフェース104で受け付ける。ファルダレコメンドありのフォルダ選択画面は、フォルダレコメンド情報に含まれるフォルダパスが容易に選択可能になっていればよい。ユーザーが保存先のフォルダの選択を行ったら、装置制御部102は、ステップS213に遷移する。 Finally, step S903 will be explained. In step S<b>903 , the device control unit 102 generates a folder selection screen with folder recommendation based on the folder recommendation information, and displays it on the display 110 . Then, the user interface 104 receives an operation by the user. The folder selection screen with folder recommendation only needs to be able to easily select the folder path included in the folder recommendation information. After the user selects a destination folder, the device control unit 102 transitions to step S213.

ここでのUI例は、変数Pが1の場合は、実施形態1と同様である。変数Pが1より大きい場合について、図11を用いて説明を行う。図11で示す画面は、ディスプレイ110にて表示され、ユーザーによる操作はユーザーインターフェース104を用いて行われる。また、装置制御部102は、ネットワーク101を介して、予め設定された送付先サーバー又はストレージのフォルダ情報を適宜取得することができる。 The UI example here is the same as in the first embodiment when the variable P is 1. A case where the variable P is greater than 1 will be described with reference to FIG. The screen shown in FIG. 11 is displayed on the display 110 and the user's operation is performed using the user interface 104 . Further, the device control unit 102 can appropriately acquire folder information of a preset destination server or storage via the network 101 .

図11において、レコメンドすべき保存先フォルダは「階層2_AB」である。図11においては、このフォルダを選択可能な画面を最初から表示することにより、フォルダのレコメンドを行っている。但し、実際には、変数Pが1より大きいため、ユーザーが保存したいフォルダは、このフォルダの下層のフォルダである可能性が高い。選択候補フォルダ表示欄1101に、「階層1_A/階層2_AB」と表示されている。「階層1_A/階層2_AB/」は、上位ファルダも含めたフォルダパスであり、「階層2_AB」がフォルダ名である。そして、フォルダ内容表示欄1102には、「階層2_AB」の内容が表示される。この例においては、「階層2_AB」には複数のフォルダは存在し、各フォルダへ移動するためのボタンが配置されている。ボタン1103は、本UI画面へと遷移する前の画面へ戻るためのボタンである。フォルダ内容表示欄1102を利用して、適切なフォルダに移動し、ボタン1104をユーザーが選択すると、そのフォルダが保存先フォルダとして選択される。 In FIG. 11, the storage destination folder to be recommended is "layer 2_AB". In FIG. 11, a folder is recommended by displaying a screen on which this folder can be selected from the beginning. However, since the variable P is actually greater than 1, there is a high possibility that the folder that the user wants to save is a folder in the lower layer of this folder. In the selection candidate folder display field 1101, "hierarchy 1_A/hierarchy 2_AB" is displayed. "Hierarchy 1_A/hierarchy 2_AB/" is the folder path including the upper folder, and "hierarchy 2_AB" is the folder name. Then, in the folder content display column 1102, the content of “hierarchy 2_AB” is displayed. In this example, there are a plurality of folders in "hierarchy 2_AB", and buttons for moving to each folder are arranged. A button 1103 is a button for returning to the screen before transitioning to this UI screen. When the user moves to an appropriate folder using the folder content display column 1102 and selects a button 1104, that folder is selected as the save destination folder.

以上説明したとおり、本実施形態における一連の情報処理により、実施形態1の効果に加えて、直接的に文書画像の種類と保存先フォルダが紐づかない場合であっても、共通して利用される上位フォルダがレコメンドされる。これにより、ユーザーが手動で最上位階層のフォルダからフォルダを選択していくことに比べて、途中階層のフォルダからの選択で済むようになるため、フォルダ選択の手間を軽減することができる。特にフォルダ階層が深い場合、又はフォルダ数が多い場合に、軽減効果が大きくなる。
なお、実施形態1における図2のステップS211におけるフォルダ選択画面に、「途中階層のレコメンド」等のボタンを用意して、本実施形態の図9のステップS901に遷移を行うようにしてもよい。
As described above, the series of information processing according to the present embodiment has the effect of the first embodiment, and in addition, even when the type of the document image and the storage destination folder are not directly linked, they can be used in common. higher-level folders are recommended. As a result, compared to manually selecting folders from the highest hierarchy folder, the user only needs to select folders in the middle hierarchy, so that it is possible to reduce the trouble of folder selection. Especially when the folder hierarchy is deep, or when the number of folders is large, the reduction effect is large.
Note that a button such as "recommend middle layer" may be provided on the folder selection screen in step S211 of FIG. 2 according to the first embodiment to transition to step S901 of FIG. 9 according to the present embodiment.

<その他の実施形態>
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給する。そして、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読み出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
<Other embodiments>
The present invention supplies a program that implements one or more functions of the above-described embodiments to a system or device via a network or storage medium. It can also be realized by a process in which one or more processors in the computer of the system or device reads and executes the program. It can also be implemented by a circuit (for example, ASIC) that implements one or more functions.

以上、本発明の実施形態の一例について詳述したが、本発明は係る特定の実施形態に限定されるものではない。 Although one example of the embodiment of the present invention has been described in detail above, the present invention is not limited to such a specific embodiment.

以上、上述した各実施形態によれば、ユーザーが指定した文書画像の保存先と、文書画像の種類との関係を利用しているため、フォルダに既に含まれている文書画像の多くが、新しく振り分けを行いたい文書画像と類似している必要がない。そのため、複数の種類の文書画像が保存されているフォルダが保存先フォルダの場合であっても、適切なレコメンドをすることができる。また、振り分け先の保存先フォルダに関する情報を保持しているため、振り分けた後に、作業フローに従い、1次保存先フォルダから文書画像が移動された場合でも適切なレコメンドを行うことができる。
また、文書画像に含まれる情報のみで、保存先フォルダが決定されているかの判定も行うため、文書画像の保存先が文書画像自身以外の情報によって決定される場合には、レコメンドを行わないことができる。つまり、適切ではないレコメンドを行わないことにより、ユーザーの選択ミスにより誤ったフォルダを選択してしまう可能性を低減させることができる。
As described above, according to each of the above-described embodiments, since the relationship between the document image storage destination specified by the user and the type of the document image is used, many of the document images already included in the folder can be replaced with the new folder. It does not have to be similar to the document image to be sorted. Therefore, even if a folder in which a plurality of types of document images are stored is a storage destination folder, appropriate recommendations can be made. In addition, since the information on the storage destination folder of the distribution destination is held, even when the document image is moved from the primary storage destination folder according to the work flow after the distribution, appropriate recommendation can be made.
In addition, since it is also determined whether the save destination folder is determined based only on the information contained in the document image, if the save destination of the document image is determined by information other than the document image itself, no recommendation is made. can be done. In other words, by not making inappropriate recommendations, it is possible to reduce the possibility of the user selecting an incorrect folder due to a selection error.

100 画像処理装置
102 装置制御部
100 image processing device 102 device control unit

Claims (8)

文書画像の種類と同一種類と判定された登録画像がある場合、前記登録画像の保存先フォルダに関する保存先情報を取得する取得手段と、
前記保存先情報に基づいて、前記文書画像の種類と前記保存先フォルダとが紐づくか否かを判定する第1の判定手段と、
前記第1の判定手段により前記文書画像の種類と前記保存先フォルダとが紐づくと判定された場合、前記保存先フォルダのレコメンド情報を生成する生成手段と、
前記レコメンド情報を含むフォルダ選択画面を表示する表示手段と、
を有することを特徴とする画像処理装置。
acquisition means for acquiring storage destination information regarding a storage destination folder of the registered image when there is a registered image determined to be of the same type as the document image;
a first determination means for determining whether or not the type of the document image and the storage destination folder are linked based on the storage destination information;
generating means for generating recommendation information for the storage destination folder when the first determination means determines that the type of the document image and the storage destination folder are linked;
display means for displaying a folder selection screen including the recommendation information;
An image processing device comprising:
前記フォルダ選択画面において選択されたフォルダに関する情報に基づき、前記保存先情報を更新する更新手段を更に有することを特徴とする請求項1に記載の画像処理装置。 2. The image processing apparatus according to claim 1, further comprising updating means for updating said storage location information based on information relating to the folder selected on said folder selection screen. 前記文書画像の種類と同一種類と判定された登録画像がない場合、前記表示手段は、レコメンド情報を含まないフォルダ選択画面を表示することを特徴とする請求項1又は2に記載の画像処理装置。 3. The image processing apparatus according to claim 1, wherein when there is no registered image determined to be of the same type as the document image, the display means displays a folder selection screen that does not include recommendation information. . 前記文書画像の種類と前記保存先情報に関する前記保存先フォルダが紐づかない場合、前記表示手段は、レコメンド情報を含まないフォルダ選択画面を表示することを特徴とする請求項1又は2に記載の画像処理装置。 3. The method according to claim 1, wherein when the type of the document image and the storage destination folder related to the storage destination information are not linked, the display means displays a folder selection screen that does not include recommendation information. Image processing device. 前記文書画像の種類と同一種類と判定された登録画像があるか否かを判定する第2の判定手段を更に有し、
前記第2の判定手段により、前記文書画像の種類と同一種類と判定された登録画像があると判定された場合、前記取得手段は、前記登録画像の保存先フォルダに関する保存先情報を取得することを特徴とする請求項1乃至4の何れか1項に記載の画像処理装置。
further comprising second determination means for determining whether or not there is a registered image determined to be of the same type as the document image;
When the second determining means determines that there is a registered image determined to be of the same type as the document image, the acquiring means acquires storage destination information regarding a storage destination folder of the registered image. 5. The image processing apparatus according to any one of claims 1 to 4, characterized by:
前記第1の判定手段は、前記保存先情報により求められる前記保存先フォルダ保存回数に基づいて、前記文書画像の種類と前記保存先フォルダとが紐づくか否かを判定することを特徴とする請求項1乃至5の何れか1項に記載の画像処理装置。 The first determination means determines whether or not the type of the document image and the storage destination folder are linked based on the number of times of storage to the storage destination folder obtained from the storage destination information. 6. The image processing apparatus according to any one of claims 1 to 5. 画像処理装置が実行する情報処理方法であって、
文書画像の種類と同一種類と判定された登録画像がある場合、前記登録画像の保存先フォルダに関する保存先情報を取得する取得工程と、
前記保存先情報に基づいて、前記文書画像の種類と前記保存先フォルダとが紐づくか否かを判定する第1の判定工程と、
前記第1の判定工程により前記文書画像の種類と前記保存先フォルダとが紐づくと判定された場合、前記保存先フォルダのレコメンド情報を生成する生成工程と、
前記レコメンド情報を含むフォルダ選択画面を表示する表示工程と、
を含むことを特徴とする情報処理方法。
An information processing method executed by an image processing device,
an acquisition step of acquiring storage destination information regarding a storage destination folder of the registered image when there is a registered image determined to be of the same type as the document image;
a first determination step of determining whether the type of the document image and the storage destination folder are linked based on the storage destination information;
a generation step of generating recommendation information for the storage destination folder when the first determination step determines that the type of the document image and the storage destination folder are linked;
a display step of displaying a folder selection screen including the recommended information;
An information processing method comprising:
コンピュータを、請求項1乃至の何れか1項に記載の画像処理装置の各手段として機能させるためのプログラム。 A program for causing a computer to function as each means of the image processing apparatus according to any one of claims 1 to 6 .
JP2019146678A 2019-08-08 2019-08-08 Image processing device, information processing method and program Active JP7301671B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019146678A JP7301671B2 (en) 2019-08-08 2019-08-08 Image processing device, information processing method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019146678A JP7301671B2 (en) 2019-08-08 2019-08-08 Image processing device, information processing method and program

Publications (2)

Publication Number Publication Date
JP2021027557A JP2021027557A (en) 2021-02-22
JP7301671B2 true JP7301671B2 (en) 2023-07-03

Family

ID=74663194

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019146678A Active JP7301671B2 (en) 2019-08-08 2019-08-08 Image processing device, information processing method and program

Country Status (1)

Country Link
JP (1) JP7301671B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022139085A (en) * 2021-03-11 2022-09-26 京セラドキュメントソリューションズ株式会社 image forming device
CN117591485B (en) * 2024-01-17 2024-04-05 深圳市领德创科技有限公司 Solid state disk operation control system and method based on data identification

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016212568A (en) 2015-05-01 2016-12-15 キヤノン株式会社 Document management system, document management method and program

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016212568A (en) 2015-05-01 2016-12-15 キヤノン株式会社 Document management system, document management method and program

Also Published As

Publication number Publication date
JP2021027557A (en) 2021-02-22

Similar Documents

Publication Publication Date Title
JP7013182B2 (en) Information processing equipment, information processing methods and programs
JP4251629B2 (en) Image processing system, information processing apparatus, control method, computer program, and computer-readable storage medium
JP4859025B2 (en) Similar image search device, similar image search processing method, program, and information recording medium
JP4181892B2 (en) Image processing method
CN101751667B (en) Image processing apparatus and image processing method
US20040223197A1 (en) Image processing method
US20090106699A1 (en) Image processing device and image processing method
US7747108B2 (en) Image processing apparatus and its method
JP2018124656A (en) Image processing apparatus, control method thereof and program
JP2004334339A (en) Information processing apparatus, information processing method, storage medium, and program
JP2018128996A (en) Information processing apparatus, control method, and program
JP7699952B2 (en) Image processing device, image processing method, and program
JP4533273B2 (en) Image processing apparatus, image processing method, and program
US7876471B2 (en) Image processing apparatus, control method and program thereof which searches for corresponding original electronic data based on a paper document
JP7301671B2 (en) Image processing device, information processing method and program
JP2019153919A (en) Image processing device, control method thereof, and program
JP4261988B2 (en) Image processing apparatus and method
US8181108B2 (en) Device for editing metadata of divided object
JP2007317034A (en) Image processing apparatus, image processing method, program, and recording medium
US12423350B2 (en) Image processing apparatus deriving condition for estimating text block, image processing method, and storage medium
JP6700705B2 (en) Distribution system, information processing method, and program
US20090290797A1 (en) Image processing for storing objects separated from an image in a storage device
JP7516170B2 (en) Image processing device, image processing method, and program
JP2020047138A (en) Information processing apparatus
JP7570843B2 (en) IMAGE PROCESSING APPARATUS, IMAGE FORMING SYSTEM, IMAGE PROCESSING METHOD, AND PROGRAM

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220729

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230307

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230328

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230510

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230523

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230621

R151 Written notification of patent or utility model registration

Ref document number: 7301671

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151