JP7301671B2 - Image processing device, information processing method and program - Google Patents
Image processing device, information processing method and program Download PDFInfo
- Publication number
- JP7301671B2 JP7301671B2 JP2019146678A JP2019146678A JP7301671B2 JP 7301671 B2 JP7301671 B2 JP 7301671B2 JP 2019146678 A JP2019146678 A JP 2019146678A JP 2019146678 A JP2019146678 A JP 2019146678A JP 7301671 B2 JP7301671 B2 JP 7301671B2
- Authority
- JP
- Japan
- Prior art keywords
- folder
- information
- storage destination
- document image
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Control Or Security For Electrophotography (AREA)
- Facsimiles In General (AREA)
Description
本発明は、画像処理装置、情報処理方法及びプログラムに関する。 The present invention relates to an image processing device, an information processing method, and a program.
帳票等の紙文書を画像読み取り装置でスキャンしてデジタル化する業務フローが存在する。その際には、一般的に、デジタル化した文書画像に、文書の種類又は内容に応じて、所定のフォルダに格納することが行われる。ここで、振り分けフォルダの指定を人手で行うことは、デジタル化する紙原稿の枚数が多くなると大きな負荷となる。
これを解決する手法として、特許文献1の手法がある。この手法では、選択された文書画像を保存する際に、保存先フォルダの強調表示(レコメンド)を行う。このレコメンドは、フォルダ関連度を用いて行われる。フォルダ関連度は、選択された文書画像とフォルダ内の文書画像すべてとの類似度を算出し、その類似度を平均することにより得られる値である。
There is a business flow in which paper documents such as forms are scanned by an image reading device and digitized. At that time, generally, the digitized document images are stored in a predetermined folder according to the type or contents of the document. Here, manually designating a sorting folder becomes a heavy burden when the number of paper documents to be digitized increases.
As a method for solving this problem, there is a method disclosed in
この手法では、フォルダ内に含まれる文書画像に基づきレコメンドを行うため、レコメンドされるフォルダは、フォルダに含まれるファイルの多くが選択された文書画像と類似している必要がある。そのため、複数の種類の文書画像が保存されているフォルダが保存先フォルダの場合には、適切なレコメンドをすることができない。このような場合は、文書画像を基にした業務処理を行う作業担当者のフォルダに、複数の種類の帳票の文書画像を保存する際等に生じることが予想される。また、文書画像の保存先が文書画像に含まれない情報によって決定される場合は、適切ではないレコメンドをする可能性がある。例えば、同一種類の文書画像について、文書画像のスキャンを行った担当者ごとに、保存先フォルダが異なる場合には、複数の担当者のフォルダがレコメンドされることになる。このような場合、ユーザーの選択ミスにより誤ったフォルダを選択してしまう可能性が高まる。 In this method, recommendations are made based on the document images contained in the folder. Therefore, the recommended folder should have many of the files contained in the folder similar to the selected document image. Therefore, when a folder in which a plurality of types of document images are saved is the save destination folder, appropriate recommendation cannot be made. Such a case is expected to occur, for example, when document images of multiple types of forms are saved in a folder of a worker who performs business processing based on document images. Also, if the storage destination of the document image is determined by information not included in the document image, an inappropriate recommendation may be made. For example, when document images of the same type are stored in different folders for each person in charge of scanning the document images, folders of a plurality of persons in charge are recommended. In such a case, the possibility of selecting the wrong folder due to the user's selection error increases.
本発明は、文書画像の種類と同一種類と判定された登録画像がある場合、前記登録画像の保存先フォルダに関する保存先情報を取得する取得手段と、前記保存先情報に基づいて、前記文書画像の種類と前記保存先フォルダとが紐づくか否かを判定する第1の判定手段と、前記第1の判定手段により前記文書画像の種類と前記保存先フォルダとが紐づくと判定された場合、前記保存先フォルダのレコメンド情報を生成する生成手段と、前記レコメンド情報を含むフォルダ選択画面を表示する表示手段と、を有することを特徴とする。 According to the present invention, when there is a registered image determined to be of the same type as a document image, an acquisition unit acquires storage destination information regarding a storage destination folder of the registered image; a first determination means for determining whether or not the type of the document image and the storage destination folder are linked; and when the first determination means determines that the type of the document image and the storage destination folder are linked , generating means for generating recommendation information of the storage destination folder; and display means for displaying a folder selection screen containing the recommendation information.
本発明によれば、適切なレコメンドをすることができると共に、ユーザーの選択ミスにより誤ったフォルダが選択されてしまう可能性を低減させることができる。 According to the present invention, it is possible to make an appropriate recommendation and reduce the possibility that an incorrect folder is selected due to a user's selection error.
以下、本発明の実施形態について図面に基づいて説明する。 BEST MODE FOR CARRYING OUT THE INVENTION An embodiment of the present invention will be described below with reference to the drawings.
<実施形態1>
図1は、画像処理装置100のハードウェア構成の一例を示す図である。
画像処理装置100は、ユーザーインターフェース104、CPU105、RAM106、記憶部107、画像読取部108、画像出力部109、ディスプレイ110を備え、装置制御部102を介して相互に通信可能に接続されている。また、更に画像処理装置100は、画像データを処理するASICから構成される画像処理部103を有する。また、画像処理装置100は、ネットワーク101を介して、非図示の外部の情報処理装置と接続されている。
<
FIG. 1 is a diagram showing an example of the hardware configuration of an
The
ユーザーインターフェース104は、例えばキーボード、マウス、その他入出力装置によって構成され、各種の設定値又は指定値を入力することができる。
CPU105は、記憶部107内の初期プログラムに従って、メインプログラムを記憶部107より読み出し、RAM106に記憶する。RAM106は、プログラム格納用、ワーク用のメインメモリとして使用される。そして、メインプログラムに従って、CPU105は、装置制御部102を制御する。装置制御部102はコントローラ基盤から構成される。装置制御部102上に、CPU105、RAM106、記憶部107、画像処理部103、ネットワーク101の各デバイスが実装されている。
画像読取部108は、スキャナーデバイスであり、紙文書等を読取ることにより画像データ形式の文書画像を取得することができる。装置制御部102は、画像読取部108から文書画像を取得すると、記憶部107に記憶する。そして、装置制御部102は、スキャンアシスト処理を実行する際に、記憶部107に記憶された文書画像をRAM106に読み出す。ここで、スキャンアシスト処理は、送付先の保存先フォルダをレコメンドする処理である。
The
The
そして、装置制御部102は、RAM106上の文書画像を解析し、スキャンアシストのための情報を生成する。解析処理は、4つの処理からなる。1つ目は、文書画像内の文字列ブロックを抽出するブロックセレクション処理(BS処理)である。2つ目は、文字列画像から文字列情報を抽出する光学文字認識処理(OCR処理)である。3つ目は、登録されている文書画像と新たにスキャンされた文書画像との間の類似度を求め、文書画像の種類を判定する処理である。4つ目は、判定処理を基にスキャンアシストのための情報を生成する処理である。スキャンアシストのための情報は、保存先フォルダに関連する情報からなる。
Then, the
次に、装置制御部102は、生成されたスキャンアシストのための情報を用いて、スキャンアシストのためのUI画面を生成し、ディスプレイ110上に表示する処理を実行する。そして、装置制御部102は、ユーザーインターフェース104を介したユーザーからの指示に基づき、送信処理を行う。そして、装置制御部102は、ユーザーからのフィードバックを含めたスキャンアシスト処理結果についての情報を記憶部107に記憶する。
また、装置制御部102は、記憶部107に記憶された文書画像を画像出力部109に提供する。画像出力部109は、種々の形式で文書画像を出力する処理を実行する。画像出力部109は、プリンタデバイスである。例えば、画像出力部109は、文書画像に係る画像データを、記憶媒体に出力する処理を実行することができる。又は、画像出力部109は、印刷機能を備え、紙媒体等の出力媒体に文書画像を出力する処理を実行してもよい。
Next, the
Further, the
以上説明した画像処理装置100は一例であり、画像読取部108及び画像出力部109のうち、画像出力部109を有さない構成の画像処理装置100であってもよい。また、画像処理装置100の一部機能を、ネットワークを介して通信を相互に行うことにより、外部処理装置で実行するようにしてもよい。外部処理装置は、サーバー等のコンピュータ装置で実装してもよいし、インターネット上のクラウドサーバーで実装してもよい。画像処理装置100は、その他必要に応じて、その他の構成を備えるものであってもよい。
The
次に、本実施形態の情報処理について、図2を用いて説明する。図2は、画像処理装置100における新しくスキャンされた文書画像に対するスキャンアシストフローの全体を示すフローチャートである。図2のフローチャートは、ユーザーインターフェース104を介して、ユーザーから文書画像のスキャン指示を受け付けることにより起動する。その際、起動したユーザー名についての情報を装置制御部102は、RAM106に保持しておく。ユーザー名は、不図示の認証装置等を利用することにより取得可能である。図2に示されるフローチャートによる処理は、記憶部107に記憶されたプログラムコードがRAM106に展開され、CPU105によって装置制御部102が制御されることにより実行される。
Next, information processing according to this embodiment will be described with reference to FIG. FIG. 2 is a flow chart showing the overall scan assist flow for a newly scanned document image in the
図2のステップS201において、装置制御部102は、画像読取部108で文書をスキャンし、文書画像に変換する。そして、装置制御部102は、画像処理部103で色変換処理及び階調補正等の文書画像用の補正処理を行い、記憶部107に保存する。この文書画像を以後、クエリ文書画像と呼称する。
In step S201 of FIG. 2, the
次に、ステップS202において、装置制御部102は、記憶部107に保存されているクエリ文書画像をRAM106に読み出し、回転補正処理を行う。装置制御部102は、回転角度を算出し、算出した回転角度を用いて、画像を回転させることにより回転補正処理を行う。装置制御部102は、回転角度の算出を、文書画像内の文字列及び線がデジタル的には水平方向に並んでいることを利用する。例えば、装置制御部102は、様々な方向への射影ヒストグラムを取り、ヒストグラムのピークとボトムとが短い周期で大きく振動するヒストグラムに対応する角度を選択することにより、回転角度を算出することができる。これは、正しい方向への射影であれば、同一ラインの文字列及び同一方向の罫線等の水平の線が、ヒストグラム上の同一のビンに投票され、行間にあたる部分には何も投票されないため、大きな振幅が文字間の周期で生じるためである。ここまでの手法で算出された角度は、文字の向きが考慮されておらず、180度の不確実性が存在する。装置制御部102は、文字の向きについて、簡易的な文字認識処理を行った際の文字の確からしさ情報を用いて、判定することができる。これにより、文字の向きも考慮した角度情報を算出することができる。
Next, in step S202, the
次に、ステップS203において、装置制御部102は、クエリ文書画像に対して、ブロックセレクション処理(BS処理)を実行する。ブロックセレクション処理とは、画像内の領域を分割してオブジェクトブロックにし、それぞれのブロックの属性を判定する処理である。具体例を、図3を用いて説明する。図3(A)はステップS201で読み取った文書画像の一例である。図3(B)は、文書画像をオブジェクトブロックに分割したものである。ブロック各々について、文字(TEXT)/図画(PICTURE)/写真(PHOTO)/線(LINE)/表(TABLE)等の属性が判定され、異なる属性を持つ領域に分割された様子を示している。
Next, in step S203, the
ここで、ブロックセレクション処理の方法について、以下に説明する。先ず、装置制御部102は、文書画像を白黒に二値化し、輪郭線追跡を行って黒画素輪郭で囲まれる画素の塊を抽出する。面積が所定の面積よりも大きい黒画素の塊については、装置制御部102は、内部にある白画素に対しても輪郭線追跡を行い、白画素の塊を抽出し、更に一定面積以上の白画素の塊の内部から再帰的に黒画素の塊を抽出する。
Here, a method of block selection processing will be described below. First, the
このようにして得られた黒画素の塊を、装置制御部102は、大きさ及び形状で分類し、異なる属性を持つ領域へ分類していく。装置制御部102は、例えば、縦横比が1に近く、大きさが一定の範囲のものを文字相当の画素塊とする。更に装置制御部102は、近接する文字が整列よくグループ化されうる部分を文字領域(TEXT)とする。装置制御部102は、扁平な画素塊を線領域(LINE)とする。装置制御部102は、一定大きさ以上でかつ四角系の白画素塊を整列よく内包する黒画素塊の占める範囲を表領域(TABLE)とする。装置制御部102は、不定形の画素塊が散在している領域を写真領域(PHOTO)とする。そして、装置制御部102は、それ以外の任意形状の画素塊を図画領域(PICTURE)とする。ブロックセレクション処理で得られた各ブロックに対する属性情報は以降に説明する類似度計算等のための情報として用いられる。ここで、文字領域と判定されたブロックをBSテキストブロックと呼称する。BSテキストブロックの情報は、OCR(光学的文字認識)処理にも利用可能である。装置制御部102は、ステップS203で必要に応じて、OCR処理を行ってもよい。
The
次に、ステップS204において、装置制御部102は、クエリ文書画像と登録文書画像群との間でマッチング処理を行うことにより、文書画像の種類の判定を行う。ここで、登録文書画像群は、後述するステップS212で登録された過去に処理された文書画像の集まりである。また、マッチング処理とは、クエリ文書画像とすべての登録文書画像との間で類似度を算出し、最大の類似度を持つ登録画像を得る処理である。装置制御部102は、この最大の類似度が所定の閾値以上であった場合に、クエリ文書画像は、この最大の類似度を得た登録文書と同一種類の文書画像である判定する。装置制御部102は、最大の類似度が所定の閾値を上回らなかった場合には、同一種類の登録画像は存在しなかったと判定する。なお、装置制御部102は、この登録文書画像群を記憶部107からRAM106に読み出して利用する。また、登録文書画像群は、文書画像そのものでなく、各文書画像のブロックセレクション処理結果等のマッチング処理に利用可能な特徴量であってもよい。
Next, in step S204, the
ここで、マッチングの概要について、図4を用いて説明を行う。図4(A)はクエリ文書画像であり、図4(B)及び図4(C)は登録文書画像である。図4(A)と図4(B)はテキストの配置が類似しており、図4(A)と図4(C)はテキストの配置が類似していない。そのため、適切な手法を利用して、図4(A)と図4(B)の類似度と、図4(A)と図4(C)の類似度を算出すると、前者の方の類似度の方が高くなる。そのため、この場合には、マッチングの結果として、図4(B)が選択される。 Here, an overview of matching will be described with reference to FIG. FIG. 4A is a query document image, and FIGS. 4B and 4C are registered document images. 4A and 4B are similar in text placement, and FIGS. 4A and 4C are dissimilar in text placement. Therefore, if the similarity between FIGS. 4A and 4B and the similarity between FIGS. 4A and 4C are calculated using an appropriate method, the similarity of the former is is higher. Therefore, in this case, FIG. 4B is selected as a matching result.
ここで、BSテキストブロックを用いた類似度算出の概念についても説明をしておく。図4(D)は、図4(A)のBSテキストブロックを図示したものである。点線がBSテキストブロックであり、ID000~ID004は各テキストブロックのIDである。図4(A)の文字列がBSテキストブロックになっていることが分かる。同様に、図4(E)は、図4(B)のBSテキストブロックを図示したものであり、図4(F)は、図4(C)のBSテキストブロックを図示したものである。BSテキストブロックを用いた類似度算出は、BSテキストブロックの形状及び配置がどれだけ類似しているかに着目して、類似度を算出する方法である。図4(D)と図4(E)は類似しているBSテキストブロックが多い。具体的には、図4(D)ID000と図4(E)ID004、図4(D)ID001と図4(E)ID003、図4(D)ID002と図4(E)ID000、図4(D)ID003と図4(E)ID001が類似している。更に、図4(D)と図4(E)は、図4(D)ID004と図4(E)ID005が同一の位置になるように位置合わせして考える。そうすると、図4(D)ID004と図4(E)ID005、図4(D)ID003と図4(E)ID002、図4(D)ID002と図4(E)ID001が類似している。図4(D)と図4(F)は、若干オーバーラップしているBSテキストブロックは存在するが、類似度が高いBSテキストブロックは存在しない。そのため、図4(D)と図4(E)の類似度と、図4(D)と図4(F)の類似度を算出すると、前者の方の類似度の方が高くなる。 Here, the concept of similarity calculation using BS text blocks will also be explained. FIG. 4(D) illustrates the BS text block of FIG. 4(A). The dotted lines are BS text blocks, and ID000 to ID004 are the IDs of the respective text blocks. It can be seen that the character string in FIG. 4A is a BS text block. Similarly, FIG. 4(E) illustrates the BS text block of FIG. 4(B), and FIG. 4(F) illustrates the BS text block of FIG. 4(C). Similarity calculation using BS text blocks is a method of calculating similarity by focusing on how similar the shapes and arrangements of BS text blocks are. 4(D) and 4(E) have many similar BS text blocks. Specifically, FIG. 4(D) ID000 and FIG. 4(E) ID004, FIG. 4(D) ID001 and FIG. 4(E) ID003, FIG. 4(D) ID002 and FIG. 4(E) ID000, FIG. D) ID003 and FIG. 4(E) ID001 are similar. Furthermore, FIGS. 4(D) and 4(E) are aligned so that FIG. 4(D) ID004 and FIG. 4(E) ID005 are at the same position. 4(D) ID004 and FIG. 4(E) ID005, FIG. 4(D) ID003 and FIG. 4(E) ID002, and FIG. 4(D) ID002 and FIG. 4(E) ID001 are similar. In FIGS. 4(D) and 4(F), BS text blocks slightly overlapping exist, but BS text blocks with high similarity do not exist. Therefore, when calculating the similarity between FIGS. 4(D) and 4(E) and the similarity between FIGS. 4(D) and 4(F), the former has a higher similarity.
ここでは、帳票レイアウト情報であるBSテキストブロックを利用したマッチングについて説明した。しかし、装置制御部102は、その他の情報も活用してマッチングを行い、文書画像同士の類似度を判定してもよい。例えば、装置制御部102は、ユーザー情報(個人ID、組織ID等)、OCR情報(文書全体のOCR結果、特定のキーワードの有無、人名や会社名やタイトルの情報等)を活用して類似度を判定してもよい。また、装置制御部102は、複数の類似度判定ロジックを利用して、複数の観点で同一種類と判定される登録文書画像を見つけて、それぞれについて、後段のステップで文書画像の種類と保存先フォルダが紐づくかを判定してもよい。
Here, the matching using the BS text block, which is the form layout information, has been described. However, the
続いて、ステップS205において、装置制御部102は、ステップS204で、同一種類と判定した登録文書があったかどうかを判定する。装置制御部102は、同一種類と判定した登録文書があった場合には、ステップS206に進み、同一種類と判定した登録文書がなかった場合にはステップS211に進む。
ステップS205からステップS206に遷移した場合、装置制御部102は、ステップS204で得られた同一種類と判定した登録文書画像に対応する保存先フォルダ情報を取得する処理を行う。この保存先フォルダ情報は、この登録文書画像と同一種類と判定した過去のクエリ文書画像群の保存先に関する情報である。情報としては、保存先フォルダのフォルダパス(URL等も含む)、保存日付、保存した人の情報、レコメンドした保存先のフォルダパス、有効なレコメンドであったかの情報等がある。
Subsequently, in step S205, the
When the process proceeds from step S205 to step S206, the
ここで、装置制御部102がRAM106又は記憶部107に保持するデータ構造の一例について、図5を用いて説明する。図5(A)は、クエリ文書画像のBSテキストブロック情報(ステップS203の処理結果)を保持するデータ構造である。1列目は、このデータ構造が持つ変数の情報であり、2列目は、各変数の型についての情報である。ここで、型の列の「short」は整数型を示す。「[ ]」はベクタ型を示す。「floAt」は浮動小数点を示す。「BooleAn」はブール型を示す。「String」は文字列を示す。「DAte」は日付型を示す。これは、図5の図面で共通である。図5(A)においては、クエリ文書画像について、画像幅、画像高さ、BSテキストブロック数の情報に加えて、「BSテキストブロック」のデータ構造をベクタで持つ。「BSテキストブロック」のデータ構造は、図5(B)となる。「BSテキストブロック」は、ブロックID、ブロック幅、ブロック高さ、ブロック左上頂点座標のX座標及びY座標を持つ。
Here, an example of the data structure held in the
登録文書画像側のデータ構造は、図5(C)となる。これは、後述するステップS212で生成が行われる。具体的には、登録文書画像ID、画像幅、画像高さ、BSテキストブロック数、「BSテキストブロック」のベクタ、「保存先フォルダ情報ID」からなる。ここで、「BSテキストブロック」は、図5(B)のデータ構造を意味する。装置制御部102は、図5(A)及び図5(C)のBSテキストブロックリストの情報を利用して、クエリ文書画像と登録文書画像との間でのマッチング処理を行う。このマッチング処理のマッチング結果を格納するデータ構造は、図5(D)となる。マッチング結果は、マッチングした登録文書のIDと、マッチング処理で算出した類似度を持つ。
FIG. 5C shows the data structure of the registered document image. This is generated in step S212, which will be described later. Specifically, it consists of a registered document image ID, an image width, an image height, the number of BS text blocks, a "BS text block" vector, and a "storage destination folder information ID." Here, "BS text block" means the data structure of FIG. 5(B). The
図5(C)の「保存先フォルダ情報ID」は、登録文書画像に対応する保存先フォルダ情報のデータ構造のインスタンスを示すIDである。保存先フォルダ情報の具体的なデータ構造は、図5(E)となる。保存先フォルダ情報は、保存先フォルダ情報IDと、対応登録文書画像IDと、「個別クエリ文書画像保存先情報」のベクタを持つ。対応登録文書画像IDは、保存先フォルダ情報のインスタンスに対応する登録文書画像のIDである。「個別クエリ文書画像保存先情報」のデータ構造は、図5(F)となる。保存先フォルダパスは、保存先のフォルダを一意に表現する文字列である。この文字列は、保存先システムに合わせた文字列でよく、例えば、保存先システムのルートフォルダからの相対パス、又はURL等である。保存日付は、クエリ文書画像が送信されて保存された日付である。保存ユーザー名は、クエリ文書画像の送信を行ったユーザー名である。保存ユーザー名は、RAM106に保持している図2のフローチャートを起動したユーザーに関するユーザー名等から取得することができる。レコメンド成功フラグリストの1つ1つの要素は、後述するステップS210においてレコメンドした保存先フォルダが、ユーザーに利用された場合に「true」となる。利用されなかった場合には「false」となる。複数のフォルダパスをレコメンドする場合があるため、ベクタとなっている。実際にレコメンドしたフォルダパスが、レコメンド先フォルダパスリストの要素となる。複数のフォルダパスをレコメンドする場合があるため、ベクタとなっている。レコメンド先フォルダパスリストのx番目の要素のレコメンドが成功したかの情報が、レコメンド成功フラグリストのx番目の要素となる。 The “storage destination folder information ID” in FIG. 5C is an ID indicating an instance of the data structure of the storage destination folder information corresponding to the registered document image. A specific data structure of the destination folder information is shown in FIG. 5(E). The storage destination folder information has a storage destination folder information ID, a corresponding registered document image ID, and a vector of "individual query document image storage destination information". The corresponding registered document image ID is the ID of the registered document image corresponding to the instance of the destination folder information. The data structure of the “individual query document image storage location information” is shown in FIG. 5(F). The save destination folder path is a character string that uniquely represents the save destination folder. This character string may be a character string suitable for the storage destination system, such as a relative path from the root folder of the storage destination system, or a URL. The save date is the date when the query document image was sent and saved. The saved user name is the name of the user who sent the query document image. The saved user name can be obtained from the user name of the user who started the flowchart of FIG. Each element of the recommendation success flag list becomes "true" when the storage destination folder recommended in step S210, which will be described later, is used by the user. If not used, it becomes "false". It is a vector because it may recommend multiple folder paths. The actually recommended folder path becomes an element of the recommendation destination folder path list. It is a vector because it may recommend multiple folder paths. Information indicating whether the recommendation of the x-th element of the recommendation destination folder path list was successful becomes the x-th element of the recommendation success flag list.
後述するフォルダレコメンド情報で利用されるデータ構造が図5(G)となる。レコメンド先フォルダパスリストの要素は、レコメンドすべき保存先フォルダのパスとなる。レコメンド先フォルダパスリストの0番目の要素が最もレコメンド優先度が高い保存先フォルダのパスとなり、以降、優先度順に保存先フォルダのパスがレコメンド先フォルダパスリストに保持される。
以上のようなデータ構造を前提として、後述するステップを説明していく。
FIG. 5G shows a data structure used in folder recommendation information, which will be described later. The element of the recommendation destination folder path list is the path of the storage destination folder to be recommended. The 0th element of the recommendation destination folder path list becomes the path of the storage destination folder with the highest recommendation priority, and thereafter, the paths of the storage destination folders are held in the recommendation destination folder path list in order of priority.
Assuming the data structure as described above, the steps to be described later will be described.
続いて、ステップS207において、装置制御部102は、取得した保存先フォルダ情報に基づき、同一種類と判定した登録文書画像と保存先フォルダが紐づくかを判定する。ここで、この判定の詳細処理について、図6のフローチャートを用いて説明を行う。図6は、ステップS207の処理の詳細を示すフローチャートである。まず、ステップS501において、装置制御部102は、保存先フォルダ情報から統計量を計算する。ここでの統計量は、登録文書画像と、保存フォルダが紐づいているかを判定するための統計量である。ここでの「紐づいている」とは、ユーザーが文書画像の種類のみに応じて、保存フォルダを選択していることを意味する。「紐づいている」場合には、文書画像の種類に応じて、保存先フォルダをレコメンドする意味があることになる。統計量の例を下記に示す。
Subsequently, in step S207, the
・最頻フォルダパスの保存回数A
・総保存回数B
・最頻フォルダ保存比率C=A/B
最頻フォルダパスの保存回数Aは、保存先フォルダ情報において、保存回数の多いフォルダパス上位F個の合計保存回数である。文書画像の種類と保存先フォルダが静的に紐づいていることを想定する場合には、Fは1でよい。保存先フォルダが定期的に変更されるような場合に対応するためには、Fを1より大きく設定しておく必要があるが詳細は後述する。総保存回数Bは、保存先フォルダ情報が保持しているクエリ文書画像群に対応した個別の保存情報の数である。これらの統計量は、図5(E)、図5(F)のようなデータ構造を保持していれば、計算することができる。最頻フォルダパスの保存回数Aは、図5(F)保存先フォルダパスを集計することにより算出可能である。総保存回数Bは、図5(E)の個別クエリ文書保存先情報のベクタの個数である。ここで、最頻フォルダパスの保存回数Aと、総保存回数Bを計算する際には、直近に保存されたものほど重視するように重みづけをしたり、一定期間内の保存先フォルダ情報だけを利用するようにしたりしてもよい。このようにすることにより、保存先フォルダが変更された場合への対応力が向上する。例えば、定期的に保存フォルダが変更されるような場合では、時間が経過すると、最頻フォルダ保存比率Cが低下していく。そのような場合に、Fを2として、変更間隔以下の期間に保存された情報だけを収集するようにすれば、常に現在又は1つ前のフォルダの情報だけを利用して、主フォルダ保存比率Cが計算される。そのため、最頻フォルダ保存比率Cを高く保つことができる。但し、Fを1よりも大きく設定する場合には、間違った紐づけを行わないために、後述する判定処理の係数を厳しく設定する必要がある。
・Most frequent folder path save count A
・ Total save count B
・Most frequent folder saving ratio C = A/B
The save count A of the most frequent folder path is the total save count of F folder paths with the highest save counts in the save destination folder information. If it is assumed that the document image type and the save destination folder are statically associated, F may be 1. In order to cope with the case where the save destination folder is periodically changed, it is necessary to set F larger than 1, which will be described in detail later. The total storage count B is the number of pieces of individual storage information corresponding to the query document image group held by the storage destination folder information. These statistics can be calculated if the data structures shown in FIGS. 5(E) and 5(F) are held. The storage count A of the most frequent folder path can be calculated by summing up the storage destination folder paths shown in FIG. 5(F). The total storage count B is the number of vectors of the individual query document storage destination information in FIG. 5(E). Here, when calculating the number of saves A and the total number of saves B of the most frequent folder path, weighting is performed so that the most recent saves are emphasized, or only the save destination folder information within a certain period of time is calculated. may be used. By doing so, it is possible to improve the responsiveness to the case where the save destination folder is changed. For example, in a case where the storage folder is changed periodically, the most frequent folder storage ratio C decreases as time elapses. In such a case, if F is set to 2 and only information saved in a period equal to or shorter than the change interval is collected, only the information of the current or previous folder is always used, and the main folder storage ratio C is calculated. Therefore, the most frequent folder saving ratio C can be kept high. However, if F is set to be greater than 1, it is necessary to strictly set the coefficients of the determination process, which will be described later, in order to avoid wrong linking.
続いて、ステップS502において、装置制御部102は、帳票の種類と保存先フォルダの紐づきを判定する。判定には、ステップS501で計算した統計量を利用する。
例えば、装置制御部102は、下記のような判定を行う。
・条件1:最頻フォルダ保存比率C>N
・条件2:総保存回数B>M
・判定条件:条件1と2の両方を満たす
Nは0.8、Mは2等と設定しておけば、フォルダ保存が3回以上されているレイアウトにおいて、8割以上保存されているフォルダパス群がある場合にのみ、紐づいていると判定されることとなる。なお、条件1のみでNを0.8とすると、2回目に常に紐づいていると判定してしまうことになり、不適切な判定となる。なお、総保存回数Bに応じて、前述したF及びNを切り替えることにより、安定した判定となるようにしてもよい。例えば、総保存回数が小さいうちは統計量の信頼性が低いので、Fを小さく、Nを大きくしておけば、確実に紐づいている際にのみ、紐づき判定を行うことができる。
Subsequently, in step S502, the
For example, the
・Condition 1: Most frequent folder storage ratio C>N
・Condition 2: Total save count B>M
・Judgment condition: Satisfying both
逆に、早めにレコメンドの実施を行うことが望ましい場合もある。例えば、常に文書画像の種類と保存フォルダが対応しているユーザーにとっては、同一種類の文書画像を3回以上利用しないとレコメンドされないことがストレスになる。例えば、登録文書画像群すべてにおいての最頻フォルダ保存比率Cの加重平均(保存回数で重みづけ)が一定の割合を超えていた場合には、常に文書画像の種類と保存フォルダが対応していることが想定される。このような場合には、新規の文書画像についても対応していることが想定される。そのため、装置制御部102は、例えば、N:0.8 M:0等として、2回目からレコメンドがされるようにしてもよい。
また、ユーザーが明示的に指示したときには、装置制御部102は、常に紐づき判定をするようにしてもよい。ユーザーの明示的な指示は、図2のフローチャートを最初に起動する際にユーザーが指示する場合、又は図2のフローチャートに関わる事前設定を行う際にユーザーが指示する場合等がある。
Conversely, there are cases where it is desirable to implement recommendations early. For example, for a user who always has correspondence between document image types and storage folders, it is stressful that the same type of document image cannot be recommended unless the same type of document image is used three or more times. For example, when the weighted average of the most frequent folder storage ratio C (weighted by the number of times of storage) in all registered document image groups exceeds a certain percentage, the type of document image always corresponds to the storage folder. is assumed. In such a case, it is assumed that the new document image is also supported. Therefore, the
Further, when the user explicitly instructs, the
以上がステップS207の処理の詳細である。なお、ステップS207における処理は、予め計算することができる。装置制御部102は、処理パフォーマンスを向上させるために、予め計算をしておいた結果を記憶部107に保持しておき、その結果を参照するようにしてもよい。
The above is the details of the processing in step S207. Note that the processing in step S207 can be calculated in advance. In order to improve the processing performance, the
続いて、ステップS208において、装置制御部102は、ステップS207における判定結果に基づき処理を分岐させる。装置制御部102は、ステップS207で、文書画像の種類と保存先フォルダが紐づいていると判定した場合には、ステップS209へと進む。装置制御部102は、判定しなかった場合には、ステップS211へと進む。
ステップS209に進んだ場合には、装置制御部102は、フォルダレコメンド情報を生成する。フォルダレコメンド情報は、ユーザーにレコメンドする保存先フォルダについての情報である。具体的なデータ構造の例は、前述した図5(G)である。レコメンドすべきファルダとして、下記のようなフォルダが想定される。
Subsequently, in step S208, the
When proceeding to step S209, the
・直近に同一種類の文書画像を保存したフォルダ
・直近R回に同一種類の文書画像を最も多く保存したフォルダ
・同一種類の文書画像を最も多く保存したフォルダ
・フローチャートを実行しているユーザーが直近に同一種類の文書画像を保存したフォルダ
・フローチャートを実行しているユーザーが直近R回に同一種類の文書画像を最も多く保存したフォルダ
・フローチャートを実行しているユーザーが同一種類の文書画像を最も多く保存したフォルダ
・Folder in which document images of the same type were most recently saved ・Folder in which most document images of the same type were saved in the most recent R times ・Folder in which most document images of the same type were saved・The folder in which the user executing the flowchart saved the most document images of the same type in the last R times ・The folder in which the user executing the flowchart saved the most document images of the same type folder with many saves
ここで、Rは予め設定しておく定数である。これらのフォルダは、保存先フォルダ情報を利用して求めることが可能である。具体的には、図5(F)の保存先フォルダパス、保存日付、保存ユーザー名を利用すれば、求めることができる。これらのレコメンド候補のうち、どのフォルダを利用するか、どのような優先順位でレコメンドすべきかは、ユーザーによる想定利用形態に応じた設定、ユーザーによる事前設定、レコメンドの成功履歴に応じた重みづけ等、種々の方法がある。例えば、保存先を決めるルールが処理ユーザーに依存せず、保存先フォルダが定期的に変わる可能性がある場合には、下記のような形でのレコメンドを行えばよい。 Here, R is a preset constant. These folders can be found using the save destination folder information. Specifically, it can be obtained by using the save destination folder path, save date, and save user name in FIG. 5(F). Among these recommendation candidates, which folder should be used and what order of priority should be given are set by the user according to the assumed usage pattern, set in advance by the user, weighted according to the success history of recommendations, etc. , there are various methods. For example, if the rules for determining the storage destination do not depend on the processing user, and the storage destination folder may change periodically, recommendations can be made in the following format.
第一優先順位:直近に同一種類の文書画像を保存したフォルダ
第二優先順位:直近R回に同一種類の文書画像を最も多く保存したフォルダ
#第一優先順位と第二優先順位のフォルダが同一の場合には、第一優先順位のフォルダのみをレコメンドする
このようなレコメンドをするのは、定期に変更される可能性があるため、直近に保存したフォルダが次回以降も利用される可能性が高いためである。しかしながら、ユーザーの誤操作の可能性もあるので、直近R回に最も保存されているフォルダについてもレコメンドを行う。
ステップS207の紐づき判定と、ステップS209のフォルダレコメンド情報生成が分離されているため、紐づき判定とは異なり、保存回数だけではなく、直近に保存されたフォルダの観点でのレコメンドが可能となる。つまり、紐づき判定とは異なる観点で、フォルダレコメンド情報の生成が可能となる。
1st priority: the folder in which the same type of document image was saved most recently 2nd priority: the folder in which the same type of document image was saved the most in the most recent R times In the case of , only the folder with the first priority is recommended. The reason for this recommendation is that there is a possibility that the folder that was saved most recently will be used from the next time onwards, as there is a possibility that it will be changed periodically. Because it is expensive. However, since there is also the possibility of user's erroneous operation, the folder most saved in the most recent R times is also recommended.
Since the link determination in step S207 and the folder recommendation information generation in step S209 are separated, unlike the link determination, recommendations can be made from the perspective of the most recently saved folder in addition to the number of saves. . In other words, it is possible to generate folder recommendation information from a viewpoint different from link determination.
続いて、ステップS210において、装置制御部102は、フォルダレコメンド情報に基づき、ファルダレコメンドありのフォルダ選択画面を生成し、ディスプレイ110に表示する。そして、ユーザーによる操作をユーザーインターフェース104で受け付ける。ファルダレコメンドありのフォルダ選択画面は、フォルダレコメンド情報に含まれるフォルダパスが容易に選択可能になっていればよい。ユーザーが保存先のフォルダの選択を行った場合、装置制御部102は、ステップS213に遷移する。
ここで、UI例について、図7を用いて説明を行う。図7で示す画面は、ディスプレイ110にて表示される。ユーザーによる操作はユーザーインターフェース104を用いて行われる。また、装置制御部102は、ネットワーク101を介して、予め設定された送付先サーバー又はストレージのフォルダ情報を適宜取得することが可能である。
Subsequently, in step S<b>210 , the
Here, an example of UI will be described with reference to FIG. The screen shown in FIG. 7 is displayed on
図7(A)は、レコメンドすべき保存先フォルダが1つだけの場合のフォルダ選択画面である。つまり、図5(G)のレコメンド先フォルダパスリストの要素が1つだけの場合のフォルダ選択画面である。図7(A)において、レコメンドすべき保存先フォルダは「階層3_ABD」である。図7(A)においては、このフォルダを選択可能な画面を最初から表示することにより、フォルダのレコメンドを行っている。選択候補フォルダ表示欄601に、「階層1_A/階層2_AB/階層3_ABD」と表示されている。「階層1_A/階層2_AB/」は、上位ファルダも含めたフォルダパスである。「階層3_ABD」は、フォルダ名である。そして、フォルダ内容表示欄602には、「階層3_ABD」の内容が表示される。この例においては、「階層3_ABD」にはフォルダは存在せず、上の階層のフォルダに戻るためのボタン603だけが表示されている。ボタン604は、本UI画面へと遷移する前の画面へ戻るためのボタンである。ボタン605は、フォルダ選択を行うためのボタンであり、選択されると、保存先フォルダとして、「階層3_ABD」が選択される。ユーザーが任意のフォルダを選択したい場合には、フォルダ内容表示欄602を利用して、適切なフォルダに移動し、ボタン605を選択する。本画面においては、まずボタン603を選択し、上位階層のフォルダに移動し、そこを起点に適切なフォルダに移動していく。
FIG. 7A shows a folder selection screen when there is only one save destination folder to be recommended. That is, this is the folder selection screen when there is only one element in the recommendation destination folder path list of FIG. 5(G). In FIG. 7A, the storage destination folder to be recommended is "layer 3_ABD". In FIG. 7A, a folder is recommended by displaying this folder selectable screen from the beginning. In the selection candidate
図7(B)は、レコメンドすべき保存先フォルダが複数ある場合のフォルダ選択画面である。つまり、図5(G)のレコメンド先フォルダパスリストの要素が複数ある場合のフォルダ選択画面である。図7(B)と図7(A)の違いは、ボタン606が存在することである。この例においては、ボタン606を選択すると、図7(C)の画面に遷移する。図7(C)は、レコメンドされる保存先ファルダが「階層3_ABC」となっており、選択候補フォルダ表示欄607の表示も、「階層1_A/階層2_AB/階層3_ABC」へと切り替わっている。ボタン608が選択されると、保存先フォルダとして、「階層3_ABC」が選択される。
ボタン609が選択された場合には、レコメンド先フォルダパスリストの次の要素をレコメンドする画面に遷移する。レコメンド先フォルダパスリストの最後の要素をレコメンドする画面からは、最初の要素をレコメンドする画面に遷移する。
FIG. 7B is a folder selection screen when there are a plurality of storage destination folders to be recommended. In other words, this is the folder selection screen when there are a plurality of elements in the recommendation destination folder path list of FIG. 5(G). The difference between FIG. 7B and FIG. 7A is the presence of button 606 . In this example, when the button 606 is selected, the screen transitions to the screen shown in FIG. 7(C). In FIG. 7C, the recommended storage destination folder is "Layer 3_ABC", and the display of the selection candidate
When the
更に、別のUI例について、図8を用いて説明を行う。図8で示す画面は、ディスプレイ110にて表示され、ユーザーによる操作はユーザーインターフェース104を用いて行われる。また、装置制御部102は、ネットワーク101を介して、予め設定された送付先サーバー又はストレージのフォルダ情報を適宜取得することが可能である。
Furthermore, another UI example will be described with reference to FIG. The screen shown in FIG. 8 is displayed on the
図8(A)は、レコメンドすべき保存先フォルダが2つの場合のフォルダ選択画面である。つまり、図5(G)のレコメンド先フォルダパスリストの要素が2つの場合のフォルダ選択画面である。図8(A)において、レコメンドすべき保存先フォルダは「階層3_ABD」及び「階層3_ABC」である。これらに対応し、フォルダ選択ボタン701に「階層1_A/階層2_AB/階層3_ABD」と表示され、フォルダ選択ボタン702に「階層1_A/階層2_AB/階層3_ABC」と表示されている。フォルダ選択ボタン701が選択されると、保存先フォルダとして「階層3_ABD」が選択される。フォルダ選択ボタン702が選択されると、保存先フォルダとして「階層3_ABC」が選択される。ボタン703は、本UI画面へと遷移する前の画面へ戻るためのボタンである。ボタン704を選択すると、ユーザーが任意のフォルダを選択するための画面である図8(B)へと遷移する。図8(B)の選択候補フォルダ表示欄705は、現在の選択候補のフォルダ名を表示するものであり、最上位層のフォルダ名である「ルート」が表示されている。フォルダ内容表示欄706には、「ルート」フォルダに含まれるフォルダに移動するためのボタンが表示されている。順次、このボタンを選択していくことにより、ユーザーは任意のフォルダへと移動することができる。ユーザーが選択したいフォルダに移動したあとに、ボタン707を選択することにより、該当するフォルダを選択することができる。
FIG. 8A shows a folder selection screen when there are two storage destination folders to be recommended. That is, this is the folder selection screen when there are two elements in the recommendation destination folder path list of FIG. 5(G). In FIG. 8A, storage destination folders to be recommended are "hierarchy 3_ABD" and "hierarchy 3_ABC". Corresponding to these, the
続いて、ステップS205又はステップS208からステップS211に遷移した場合の説明を行う。ステップS211において、装置制御部102は、ファルダレコメンドなしのフォルダ選択画面を生成し、ディスプレイ110に表示する。そして、ユーザーによる操作をユーザーインターフェース104で受け付ける。ファルダレコメンドなしのフォルダ選択画面は、ユーザーが所望するフォルダが容易に選択可能になっていればよい。ユーザーが保存先のフォルダの選択を行うと、装置制御部102は、ステップS212に遷移する。UI例については、図8(B)と同等ものであればよいため、説明を省略する。
Next, a description will be given of the transition from step S205 or step S208 to step S211. In step S<b>211 , the
ステップS212において、装置制御部102は、文書マッチング用の情報の更新を行う。ステップS205からステップS211へと遷移をしてきた場合には、マッチングした文書画像がなかったことになるので、クエリ文書画像の新しい登録文書画像としての登録が必要となる。その場合には、クエリ文書画像を新しい登録文書画像として登録する。登録は、装置制御部102が、登録情報を記憶部107に保存することにより行う。登録する情報は、マッチングに必要な情報である。マッチングに必要な情報は、本実施形態においては、ステップS203で算出したクエリ文書画像のBS処理結果である。BS処理結果の情報は、クエリ文書画像の構造に関する情報が含まれており、マッチングに有用な情報であるためである。なお、装置制御部102は、クエリ文書画像の画像情報そのもの、又は局所特徴量等の別種の公知の特徴量を保存しておき、文書画像のマッチングに利用してもよい。具体的なデータ構造の例は、前述した図5(C)の登録文書画像のデータ構造である。
In step S212, the
ステップS210又はステップS212からステップS213に遷移すると、装置制御部102は、保存先フォルダ情報の更新作業を行う。装置制御部102は、ステップS205でマッチングしたと判定した登録文書画像又は、ステップS212で新規に登録した登録文書画像に対応する保存先フォルダ情報の更新を行う。更新内容は、ステップS210又はステップS211でユーザーが最終的に選択した保存先フォルダについての情報の追加である。情報は、例えば、フォルダパス(URL等も含む)、保存日付、フローチャートの実行ユーザーの情報等である。ステップS210から遷移した場合には、装置制御部102は、レコメンドした保存先のフォルダパス、有効なレコメンドであったかの情報等の追加も行う。有効なレコメンドであったかどうかは、最終的にユーザーが選択したフォルダと、レコメンドした保存先フォルダの比較により判定可能である。具体的なデータ構造の例は、前述した図5(E)の保存先フォルダ情報及び図5(F)の個別クエリ文書保存先情報であり、図5(F)の個別クエリ文書保存先情報が新規に追加されることになる。登録文書画像と保存先フォルダ情報の対応づけは、前述した図5(C)の保存先フォルダ情報IDと、図5(E)の保存先フォルダ情報IDに同一のIDを入れることにより可能である。更に、逆方向の参照も可能とするために、前述した図5(C)の登録文書画像IDと、図5(E)の対応登録文書画像IDに同一のIDを入れておいてもよい。
After transitioning from step S210 or step S212 to step S213, the
最後に、ステップS214において、装置制御部102は、クエリ文書画像の送信設定を行う。送信設定は、ステップS210又はステップS211で選択された保存先フォルダに関する情報と、予め設定された送付先サーバー又はストレージの情報に基づいて生成される。そして、装置制御部102は、ネットワーク101を介して、送信設定に従い、クエリ文書画像を送信する。
Finally, in step S214, the
以上が、画像処理装置100における情報処理のフローチャートになる。なお、ステップS214とステップS213には依存関係がないため、並列に実行したり、順序を入れ替えたりして、実行してもよい。以上説明したとおり、本実施形態における一連の情報処理では、文書画像の種類と、ユーザーが選択した保存先フォルダとの対応を利用しているため、保存先フォルダに既に含まれている文書画像に左右されずにレコメンドを行うことができる。そのため、複数の種類の文書画像が保存されているフォルダが保存先フォルダの場合であっても、適切なレコメンドをすることができる。また、振り分けた後に、作業フローに従い、1次保存先フォルダから文書画像が移動された場合でも適切なレコメンドを行うことができる。
The above is the flow chart of the information processing in the
また、本実施形態における一連の情報処理では、文書画像に含まれる情報のみで、保存先フォルダが決定されているかの判定も行うため、文書画像の保存先が文書画像自身以外の情報によって決定される場合には、レコメンドを行わないことが可能になる。つまり、適切ではないレコメンドを行わないことにより、ユーザーの選択ミスにより誤ったフォルダを選択してしまう可能性を低減させることができる。 In addition, in the series of information processing according to the present embodiment, it is determined whether or not the storage destination folder is determined based only on the information included in the document image. It is possible not to make a recommendation when In other words, by not making inappropriate recommendations, it is possible to reduce the possibility of the user selecting an incorrect folder due to a selection error.
なお、本実施形態において、類似度計算にBSテキストブロックを利用しているが、装置制御部102は、他の類似度計算手法を利用してもよい。例えば、画像の見た目自体を比較するために、装置制御部102は、低解像度にした文書画像同士の画素値自体を利用して類似度を計算してもよい。この際には、装置制御部102は、文書画像同士の輝度値の差の絶対値の和、又は相関係数を類似度として利用する。又は、文章の内容の類似度を見るために、装置制御部102は、OCR結果の文字列を利用して類似度を計算してもよい。この際には、装置制御部102は、文字列同士の距離を計算する尺度であるレーベンシュタイン距離等を利用して、類似度尺度を求めればよい。
In this embodiment, BS text blocks are used for similarity calculation, but the
<実施形態2>
以下、実施形態2について、実施形態1と異なる部分について説明する。
実施形態2では、文書画像の種類とフォルダが直接的に紐づいていない場合に、ユーザーの手動設定の手間を軽減する方法について説明を行う。
実施形態1との差分は、図2及び図6のフローチャートであるため、図2のフローチャートの代わりに図9のフローチャートを参照し、図6のフローチャートの代わりに図10のフローチャートを参照し、説明する。
<Embodiment 2>
The second embodiment will be described below with respect to portions different from the first embodiment.
In the second embodiment, a method for reducing the user's manual setting work when the type of document image and the folder are not directly linked will be described.
The difference from the first embodiment is the flowcharts of FIGS. 2 and 6, so the flowchart of FIG. 9 is referred to instead of the flowchart of FIG. 2, and the flowchart of FIG. 10 is referred to instead of the flowchart of FIG. do.
まず、本実施形態のフローチャートについて、図9を用いて説明する。図9は、画像処理装置100における新しくスキャンされた文書画像に対するスキャンアシストフローの全体を示すフローチャートである。図9のフローチャートの起動方法、実行方法は、図2のフローチャートと同様である。
ここで、図2と図9のフローチャートの違いは、ステップS207とステップS901、ステップS209とステップS902、ステップS210とステップS903である。そこで、ステップS901、ステップS902、ステップS903についてだけ説明を行う。
First, the flowchart of this embodiment will be described with reference to FIG. FIG. 9 is a flow chart showing the overall scan assist flow for a newly scanned document image in
2 and 9 are steps S207 and S901, steps S209 and S902, and steps S210 and S903. Therefore, only steps S901, S902, and S903 will be described.
ステップS901において、装置制御部102は、取得した保存先フォルダ情報に基づき、同一種類と判定した登録文書画像と保存先フォルダが紐づくかを判定する。ここで、この判定の詳細処理について、図10のフローチャートを用いて説明を行う。図10は、ステップS901の処理の詳細を示すフローチャートである。まず、ステップS501とステップS502は、図6のステップS501とステップS502と同様であるため、説明を省略する。
In step S<b>901 , the
ステップS1001において、装置制御部102は、後続するステップで利用する変数Pを1に初期化する。なお、この変数Pは、後段のステップで利用するため、図10のフローチャートが終了したあとも、RAM106に保持しておく。
続いて、ステップS1002において、装置制御部102は、S502又はS1004で、帳票の種類と保存先フォルダが紐づいていると判定されたかにより分岐を行う。装置制御部102は、紐づき判定された場合にはステップS1006に進む。装置制御部102は、紐づき判定されなかった場合には、ステップS1003に進む。
In step S1001, the
Subsequently, in step S1002, the
ステップS1002からステップS1003に進んだ場合は、装置制御部102は、保存先フォルダ情報に含まれるフォルダパスをP階層上にした上で、統計情報を計算する。
例えば、フォルダ情報に含まれるフォルダパスが
「階層1_A/階層2_AB/階層3_ABD」
「階層1_A/階層2_AB/階層3_ABB」
「階層1_A/階層2_AB/階層3_ABC」
「階層1_A/階層2_AA/階層3_ABA」
であったとする。この場合、Pが1であった場合には、
「階層1_A/階層2_AB」
「階層1_A/階層2_AB」
「階層1_A/階層2_AB」
「階層1_A/階層2_AA」
がP階層上のパスとなる。P階層上にする前はすべて異なるフォルダパスであったが、P階層上にすることにより、3/4のフォルダパスが同一のフォルダパスとなる。ユーザーにとっては、このフォルダパスがレコメンドされれば、最上位フォルダから手動で保存先フォルダを設定するよりも少ない工数で、フォルダを設定することができる。このP階層上のフォルダパスを利用して、装置制御部102は、ステップS502と同様に統計量を計算する。なお、最上位階層までの層がP階層以下のフォルダパスは、最上位階層として扱う。
When the process proceeds from step S1002 to step S1003, the
For example, if the folder path included in the folder information is "layer 1_A/layer 2_AB/layer 3_ABD"
"Layer 1_A/Layer 2_AB/Layer 3_ABB"
"Layer 1_A/Layer 2_AB/Layer 3_ABC"
"Layer 1_A/Layer 2_AA/Layer 3_ABA"
Suppose it was In this case, if P was 1,
"Layer 1_A/Layer 2_AB"
"Layer 1_A/Layer 2_AB"
"Layer 1_A/Layer 2_AB"
"Layer 1_A/Layer 2_AA"
is a path on the P hierarchy. The folder paths were all different before being placed on the P layer, but by moving to the P layer, 3/4 of the folder paths become the same folder path. For the user, if this folder path is recommended, the folder can be set with fewer man-hours than manually setting the save destination folder from the top folder. Using this folder path on the P hierarchy, the
続いて、ステップS1004において、装置制御部102は、帳票の種類と保存先フォルダの紐づきを判定する。本ステップで利用する統計量がステップS1003で算出した統計量であることを除けば、図6のステップS502と同様である。
そして、ステップS1005において、装置制御部102は、変数Pに1を加算する。これは、P階層上のフォルダパスで紐づき判定がされなかった場合に、更に上位の階層のフォルダパスで紐づき判定がされないかを試行するために行う。
ステップS1002からステップS1006に進んだ場合は、装置制御部102は、紐づき判定された際に、最も保存回数が多かったフォルダパスが最上位階層のフォルダであるかを判定する。Pが大きくなると、最終的にすべてのフォルダパスが最上位階層になり、意味のない紐づき判定となるので、この判定を行う。最上位階層のフォルダであると判定しなかった場合には、装置制御部102は、このままフローチャートの処理を終了する。最上位階層のフォルダであると判定した場合には、装置制御部102は、ステップS1007に進む。
ステップS1006からステップS1007に進んだ場合は、装置制御部102は、紐づき判定を変更し、紐づきしていないことにする。
Subsequently, in step S1004, the
Then, in step S1005, the
When the process proceeds from step S1002 to step S1006, the
When the process proceeds from step S1006 to step S1007, the
以上がステップS901の処理の詳細である。なお、ステップS901における処理は、予め計算が可能である。処理パフォーマンスを向上させるために、装置制御部102は、予め計算をしておいた結果を記憶部107に保持しておき、その結果を参照するようにしてもよい。
The above is the details of the processing in step S901. It should be noted that the processing in step S901 can be calculated in advance. In order to improve the processing performance, the
続いて、ステップS902についての説明を行う。ステップS902において、装置制御部102は、フォルダレコメンド情報の生成を行う。フォルダレコメンド情報は、実施形態1と同様の情報である。図10の情報処理で生成された変数Pが1の場合には、装置制御部102は、図2のステップS209と同様の処理を行う。変数Pが1より大きい場合には、装置制御部102は、図10のステップS1003で、最も保存回数が多かったフォルダパスをユーザーにレコメンドする保存先フォルダとする。但し、この保存先フォルダは、ユーザーがこのフォルダをベースに手動で最終的な保存先フォルダを設定することが前提となる。
Next, step S902 will be described. In step S902, the
最後にステップS903についての説明を行う。ステップS903において、装置制御部102は、フォルダレコメンド情報に基づき、ファルダレコメンドありのフォルダ選択画面を生成し、ディスプレイ110に表示する。そして、ユーザーによる操作をユーザーインターフェース104で受け付ける。ファルダレコメンドありのフォルダ選択画面は、フォルダレコメンド情報に含まれるフォルダパスが容易に選択可能になっていればよい。ユーザーが保存先のフォルダの選択を行ったら、装置制御部102は、ステップS213に遷移する。
Finally, step S903 will be explained. In step S<b>903 , the
ここでのUI例は、変数Pが1の場合は、実施形態1と同様である。変数Pが1より大きい場合について、図11を用いて説明を行う。図11で示す画面は、ディスプレイ110にて表示され、ユーザーによる操作はユーザーインターフェース104を用いて行われる。また、装置制御部102は、ネットワーク101を介して、予め設定された送付先サーバー又はストレージのフォルダ情報を適宜取得することができる。
The UI example here is the same as in the first embodiment when the variable P is 1. A case where the variable P is greater than 1 will be described with reference to FIG. The screen shown in FIG. 11 is displayed on the
図11において、レコメンドすべき保存先フォルダは「階層2_AB」である。図11においては、このフォルダを選択可能な画面を最初から表示することにより、フォルダのレコメンドを行っている。但し、実際には、変数Pが1より大きいため、ユーザーが保存したいフォルダは、このフォルダの下層のフォルダである可能性が高い。選択候補フォルダ表示欄1101に、「階層1_A/階層2_AB」と表示されている。「階層1_A/階層2_AB/」は、上位ファルダも含めたフォルダパスであり、「階層2_AB」がフォルダ名である。そして、フォルダ内容表示欄1102には、「階層2_AB」の内容が表示される。この例においては、「階層2_AB」には複数のフォルダは存在し、各フォルダへ移動するためのボタンが配置されている。ボタン1103は、本UI画面へと遷移する前の画面へ戻るためのボタンである。フォルダ内容表示欄1102を利用して、適切なフォルダに移動し、ボタン1104をユーザーが選択すると、そのフォルダが保存先フォルダとして選択される。
In FIG. 11, the storage destination folder to be recommended is "layer 2_AB". In FIG. 11, a folder is recommended by displaying a screen on which this folder can be selected from the beginning. However, since the variable P is actually greater than 1, there is a high possibility that the folder that the user wants to save is a folder in the lower layer of this folder. In the selection candidate
以上説明したとおり、本実施形態における一連の情報処理により、実施形態1の効果に加えて、直接的に文書画像の種類と保存先フォルダが紐づかない場合であっても、共通して利用される上位フォルダがレコメンドされる。これにより、ユーザーが手動で最上位階層のフォルダからフォルダを選択していくことに比べて、途中階層のフォルダからの選択で済むようになるため、フォルダ選択の手間を軽減することができる。特にフォルダ階層が深い場合、又はフォルダ数が多い場合に、軽減効果が大きくなる。
なお、実施形態1における図2のステップS211におけるフォルダ選択画面に、「途中階層のレコメンド」等のボタンを用意して、本実施形態の図9のステップS901に遷移を行うようにしてもよい。
As described above, the series of information processing according to the present embodiment has the effect of the first embodiment, and in addition, even when the type of the document image and the storage destination folder are not directly linked, they can be used in common. higher-level folders are recommended. As a result, compared to manually selecting folders from the highest hierarchy folder, the user only needs to select folders in the middle hierarchy, so that it is possible to reduce the trouble of folder selection. Especially when the folder hierarchy is deep, or when the number of folders is large, the reduction effect is large.
Note that a button such as "recommend middle layer" may be provided on the folder selection screen in step S211 of FIG. 2 according to the first embodiment to transition to step S901 of FIG. 9 according to the present embodiment.
<その他の実施形態>
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給する。そして、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読み出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
<Other embodiments>
The present invention supplies a program that implements one or more functions of the above-described embodiments to a system or device via a network or storage medium. It can also be realized by a process in which one or more processors in the computer of the system or device reads and executes the program. It can also be implemented by a circuit (for example, ASIC) that implements one or more functions.
以上、本発明の実施形態の一例について詳述したが、本発明は係る特定の実施形態に限定されるものではない。 Although one example of the embodiment of the present invention has been described in detail above, the present invention is not limited to such a specific embodiment.
以上、上述した各実施形態によれば、ユーザーが指定した文書画像の保存先と、文書画像の種類との関係を利用しているため、フォルダに既に含まれている文書画像の多くが、新しく振り分けを行いたい文書画像と類似している必要がない。そのため、複数の種類の文書画像が保存されているフォルダが保存先フォルダの場合であっても、適切なレコメンドをすることができる。また、振り分け先の保存先フォルダに関する情報を保持しているため、振り分けた後に、作業フローに従い、1次保存先フォルダから文書画像が移動された場合でも適切なレコメンドを行うことができる。
また、文書画像に含まれる情報のみで、保存先フォルダが決定されているかの判定も行うため、文書画像の保存先が文書画像自身以外の情報によって決定される場合には、レコメンドを行わないことができる。つまり、適切ではないレコメンドを行わないことにより、ユーザーの選択ミスにより誤ったフォルダを選択してしまう可能性を低減させることができる。
As described above, according to each of the above-described embodiments, since the relationship between the document image storage destination specified by the user and the type of the document image is used, many of the document images already included in the folder can be replaced with the new folder. It does not have to be similar to the document image to be sorted. Therefore, even if a folder in which a plurality of types of document images are stored is a storage destination folder, appropriate recommendations can be made. In addition, since the information on the storage destination folder of the distribution destination is held, even when the document image is moved from the primary storage destination folder according to the work flow after the distribution, appropriate recommendation can be made.
In addition, since it is also determined whether the save destination folder is determined based only on the information contained in the document image, if the save destination of the document image is determined by information other than the document image itself, no recommendation is made. can be done. In other words, by not making inappropriate recommendations, it is possible to reduce the possibility of the user selecting an incorrect folder due to a selection error.
100 画像処理装置
102 装置制御部
100
Claims (8)
前記保存先情報に基づいて、前記文書画像の種類と前記保存先フォルダとが紐づくか否かを判定する第1の判定手段と、
前記第1の判定手段により前記文書画像の種類と前記保存先フォルダとが紐づくと判定された場合、前記保存先フォルダのレコメンド情報を生成する生成手段と、
前記レコメンド情報を含むフォルダ選択画面を表示する表示手段と、
を有することを特徴とする画像処理装置。 acquisition means for acquiring storage destination information regarding a storage destination folder of the registered image when there is a registered image determined to be of the same type as the document image;
a first determination means for determining whether or not the type of the document image and the storage destination folder are linked based on the storage destination information;
generating means for generating recommendation information for the storage destination folder when the first determination means determines that the type of the document image and the storage destination folder are linked;
display means for displaying a folder selection screen including the recommendation information;
An image processing device comprising:
前記第2の判定手段により、前記文書画像の種類と同一種類と判定された登録画像があると判定された場合、前記取得手段は、前記登録画像の保存先フォルダに関する保存先情報を取得することを特徴とする請求項1乃至4の何れか1項に記載の画像処理装置。 further comprising second determination means for determining whether or not there is a registered image determined to be of the same type as the document image;
When the second determining means determines that there is a registered image determined to be of the same type as the document image, the acquiring means acquires storage destination information regarding a storage destination folder of the registered image. 5. The image processing apparatus according to any one of claims 1 to 4, characterized by:
文書画像の種類と同一種類と判定された登録画像がある場合、前記登録画像の保存先フォルダに関する保存先情報を取得する取得工程と、
前記保存先情報に基づいて、前記文書画像の種類と前記保存先フォルダとが紐づくか否かを判定する第1の判定工程と、
前記第1の判定工程により前記文書画像の種類と前記保存先フォルダとが紐づくと判定された場合、前記保存先フォルダのレコメンド情報を生成する生成工程と、
前記レコメンド情報を含むフォルダ選択画面を表示する表示工程と、
を含むことを特徴とする情報処理方法。 An information processing method executed by an image processing device,
an acquisition step of acquiring storage destination information regarding a storage destination folder of the registered image when there is a registered image determined to be of the same type as the document image;
a first determination step of determining whether the type of the document image and the storage destination folder are linked based on the storage destination information;
a generation step of generating recommendation information for the storage destination folder when the first determination step determines that the type of the document image and the storage destination folder are linked;
a display step of displaying a folder selection screen including the recommended information;
An information processing method comprising:
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2019146678A JP7301671B2 (en) | 2019-08-08 | 2019-08-08 | Image processing device, information processing method and program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2019146678A JP7301671B2 (en) | 2019-08-08 | 2019-08-08 | Image processing device, information processing method and program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2021027557A JP2021027557A (en) | 2021-02-22 |
| JP7301671B2 true JP7301671B2 (en) | 2023-07-03 |
Family
ID=74663194
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2019146678A Active JP7301671B2 (en) | 2019-08-08 | 2019-08-08 | Image processing device, information processing method and program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7301671B2 (en) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2022139085A (en) * | 2021-03-11 | 2022-09-26 | 京セラドキュメントソリューションズ株式会社 | image forming device |
| CN117591485B (en) * | 2024-01-17 | 2024-04-05 | 深圳市领德创科技有限公司 | Solid state disk operation control system and method based on data identification |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2016212568A (en) | 2015-05-01 | 2016-12-15 | キヤノン株式会社 | Document management system, document management method and program |
-
2019
- 2019-08-08 JP JP2019146678A patent/JP7301671B2/en active Active
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2016212568A (en) | 2015-05-01 | 2016-12-15 | キヤノン株式会社 | Document management system, document management method and program |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2021027557A (en) | 2021-02-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7013182B2 (en) | Information processing equipment, information processing methods and programs | |
| JP4251629B2 (en) | Image processing system, information processing apparatus, control method, computer program, and computer-readable storage medium | |
| JP4859025B2 (en) | Similar image search device, similar image search processing method, program, and information recording medium | |
| JP4181892B2 (en) | Image processing method | |
| CN101751667B (en) | Image processing apparatus and image processing method | |
| US20040223197A1 (en) | Image processing method | |
| US20090106699A1 (en) | Image processing device and image processing method | |
| US7747108B2 (en) | Image processing apparatus and its method | |
| JP2018124656A (en) | Image processing apparatus, control method thereof and program | |
| JP2004334339A (en) | Information processing apparatus, information processing method, storage medium, and program | |
| JP2018128996A (en) | Information processing apparatus, control method, and program | |
| JP7699952B2 (en) | Image processing device, image processing method, and program | |
| JP4533273B2 (en) | Image processing apparatus, image processing method, and program | |
| US7876471B2 (en) | Image processing apparatus, control method and program thereof which searches for corresponding original electronic data based on a paper document | |
| JP7301671B2 (en) | Image processing device, information processing method and program | |
| JP2019153919A (en) | Image processing device, control method thereof, and program | |
| JP4261988B2 (en) | Image processing apparatus and method | |
| US8181108B2 (en) | Device for editing metadata of divided object | |
| JP2007317034A (en) | Image processing apparatus, image processing method, program, and recording medium | |
| US12423350B2 (en) | Image processing apparatus deriving condition for estimating text block, image processing method, and storage medium | |
| JP6700705B2 (en) | Distribution system, information processing method, and program | |
| US20090290797A1 (en) | Image processing for storing objects separated from an image in a storage device | |
| JP7516170B2 (en) | Image processing device, image processing method, and program | |
| JP2020047138A (en) | Information processing apparatus | |
| JP7570843B2 (en) | IMAGE PROCESSING APPARATUS, IMAGE FORMING SYSTEM, IMAGE PROCESSING METHOD, AND PROGRAM |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220729 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230307 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230328 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230510 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230523 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230621 |
|
| R151 | Written notification of patent or utility model registration |
Ref document number: 7301671 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |