JP4964080B2 - Image processing system, image processing method, and image processing program - Google Patents
Image processing system, image processing method, and image processing program Download PDFInfo
- Publication number
- JP4964080B2 JP4964080B2 JP2007257287A JP2007257287A JP4964080B2 JP 4964080 B2 JP4964080 B2 JP 4964080B2 JP 2007257287 A JP2007257287 A JP 2007257287A JP 2007257287 A JP2007257287 A JP 2007257287A JP 4964080 B2 JP4964080 B2 JP 4964080B2
- Authority
- JP
- Japan
- Prior art keywords
- meaning
- determined
- image data
- objects
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- User Interface Of Digital Computer (AREA)
Description
本発明は、画像データの画像中に含まれるオブジェクトを抽出し、当該抽出されるオブジェクトの当該画像データのレイアウト中における意味付けを行う技術に関するものである。 The present invention relates to a technique for extracting an object included in an image of image data and giving meaning to the extracted object in the layout of the image data.
従来、紙原稿をスキャンして電子データ化し、その電子化されたドキュメント画像情報に対して領域解析を行って文字領域等のオブジェクトを抽出し、OCR処理により文字領域のテキスト情報を取得し、このテキスト情報に基づいて所定の処理を行う画像処理システムが知られる。 Conventionally, a paper document is scanned into electronic data, an area analysis is performed on the digitized document image information to extract an object such as a character area, and text information of the character area is obtained by OCR processing. An image processing system that performs a predetermined process based on text information is known.
上記従来の画像処理システムでは、ある文字領域のレイアウト中における意味(タイトル、ヘッダ、本文の段落など)の抽出、文字領域中のテキスト情報のテキストの属性(“2006/01/25”という文字列は[日付]である、など)の抽出を行っていた(例えば、特許文献1を参照。)。 In the conventional image processing system described above, the meaning (title, header, body paragraph, etc.) in the layout of a certain character area is extracted, and the text attribute of the text information in the character area (character string “2006/01/25”) [Date], etc.) (for example, see Patent Document 1).
また、画像データの画像中から抽出したオブジェクトに対して判定される意味やテキストに対して判定される属性に対して、例えばGUIなどのインタフェースを用いて修正可能とする技術も知られる(例えば、特許文献2を参照。)。
上記従来の画像処理システムでは、画像中に含まれるオブジェクトに対して最終的に判定された単一の意味のみをユーザに通知可能としている。よって、ユーザは、上記画像処理システムにて自動的に行われた意味判定処理が妥当なものであるか否かを、最終的に判定された単一の意味のみに基づいて判断しなければならなかった。 In the above conventional image processing system, only a single meaning finally determined for an object included in an image can be notified to the user. Therefore, the user must determine whether or not the semantic determination process automatically performed by the image processing system is appropriate based only on the finally determined single meaning. There wasn't.
また、画像中に含まれるオブジェクトに対して自動的に行われた意味判定の結果を修正したいような場合(例えば、ある意味が判定されたオブジェクトが適切でない場合に、適切なオブジェクトに変更する等)においても、ユーザは、自己が適切と考える修正候補を自分で判断しなければならず、操作の負担となっていた。 In addition, when it is desired to correct the result of the semantic determination automatically performed on an object included in the image (for example, when an object whose meaning is determined is not appropriate, it is changed to an appropriate object, etc.) ), The user has to determine a correction candidate that he / she thinks appropriate, which is a burden of operation.
本発明は上述した問題点を解決するためになされたものであり、画像中に含まれるオブジェクトに対して行われる意味判定処理の処理結果の管理を行う場合における、操作負担の軽減に寄与することができる技術を提供することを目的とする。 The present invention has been made to solve the above-described problems, and contributes to reducing the operation burden when managing the processing results of the semantic determination processing performed on the objects included in the image. It aims at providing the technology that can do.
上述した課題を解決するため、本発明の一態様に係る画像処理システムは、画像データを取得する画像データ取得部と、前記画像データ取得部にて取得される画像データの画像中に含まれるオブジェクトを抽出するオブジェクト抽出部と、所定の判定ルールに基づいて、前記オブジェクト抽出部にて抽出されるオブジェクトの前記画像データのレイアウト中における意味を判定する意味判定部と、前記意味判定部にて複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された複数のオブジェクトに関する情報を、該意味に関する情報に関連付けてリスト表示させる通知部と、ユーザの操作入力を受け付ける操作入力部と、前記操作入力部にて受け付けたユーザの操作入力により選択されたオブジェクトを、該オブジェクトについて前記意味判定部にて判定された意味を有するものとして設定する意味設定部と、前記操作入力部によるオブジェクトの選択履歴を取得する履歴情報取得部と、を備え、前記意味設定部は、前記意味判定部にて複数のオブジェクトが同一の意味を有すると判定された場合に、前記履歴情報取得部にて取得される履歴情報に基づいて、前記通知部によりリスト表示されるオブジェクトの内の過去に選択された頻度が最も高いオブジェクトを、該オブジェクトについて前記意味判定部にて判定された意味を有するものとして設定することを特徴とするものである。
In order to solve the above-described problem, an image processing system according to an aspect of the present invention includes an image data acquisition unit that acquires image data, and an object included in an image of the image data acquired by the image data acquisition unit. An object extracting unit for extracting the object, a meaning determining unit for determining the meaning of the object extracted by the object extracting unit in the layout of the image data based on a predetermined determination rule, and a plurality of the meaning determining unit When it is determined that the objects have the same meaning, a notification unit that displays a list of information related to the plurality of objects determined to have the meaning in association with the information related to the meaning, and accepts a user operation input An operation input unit and an object selected by a user operation input received by the operation input unit, It includes a meaning setting unit that sets as having a meaning that is determined by the meaning determining part for an object, and a history information acquisition unit that acquires the selection history of the object by the operation input unit, the means setting section, When it is determined that the plurality of objects have the same meaning in the meaning determination unit, based on the history information acquired by the history information acquisition unit, of the objects displayed as a list by the notification unit The object having the highest frequency selected in the past is set as having the meaning determined by the meaning determination unit for the object .
また、本発明の一態様に係る画像処理方法は、画像データを取得し、前記取得される画像データの画像中に含まれるオブジェクトを抽出し、所定の判定ルールに基づいて、前記抽出されるオブジェクトの前記画像データのレイアウト中における意味を判定し、複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された複数のオブジェクトに関する情報を、該意味に関する情報に関連付けてリスト表示し、ユーザの操作入力を受け付け、受け付けたユーザの操作入力により選択されたオブジェクトを、該オブジェクトについて判定された意味を有するものとして設定し、受け付けたオブジェクトの選択履歴を取得し、複数のオブジェクトが同一の意味を有すると判定された場合に、取得されるオブジェクトの履歴情報に基づいて、リスト表示されるオブジェクトの内の過去に選択された頻度が最も高いオブジェクトを、該オブジェクトについて判定された意味を有するものとして設定することを特徴とすることができる。
The image processing method according to one aspect of the present invention acquires image data, extracts an object included in an image of the acquired image data, and extracts the extracted object based on a predetermined determination rule. When the meaning of the image data in the layout is determined and it is determined that the plurality of objects have the same meaning, the information on the plurality of objects determined to have the meaning is associated with the information on the meaning Display the list, accept the user's operation input, set the object selected by the accepted user's operation input as having the determined meaning for the object, obtain the selection history of the accepted object, If it is determined that the objects have the same meaning, Based on the gravel information, the highest object is selected frequencies in the past of the objects to be listed, it may be characterized by setting as having a meaning that is determined for the object.
また、本発明の一態様に係る画像処理プログラムは、画像データを取得し、前記取得される画像データの画像中に含まれるオブジェクトを抽出し、所定の判定ルールに基づいて、前記抽出されるオブジェクトの前記画像データのレイアウト中における意味を判定し、複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された複数のオブジェクトに関する情報を、該意味に関する情報に関連付けてリスト表示し、ユーザの操作入力により選択されたオブジェクトを、該オブジェクトについて判定された意味を有するものとして設定し、ユーザの操作入力により選択されたオブジェクトの選択履歴を取得し、複数のオブジェクトが同一の意味を有すると判定された場合に、取得されるオブジェクトの履歴情報に基づいて、リスト表示されるオブジェクトの内の過去に選択された頻度が最も高いオブジェクトを、該オブジェクトについて判定された意味を有するものとして設定する処理をコンピュータに実行させることを特徴とすることができる。 An image processing program according to an aspect of the present invention acquires image data, extracts an object included in an image of the acquired image data, and extracts the extracted object based on a predetermined determination rule. When the meaning of the image data in the layout is determined and it is determined that the plurality of objects have the same meaning, the information on the plurality of objects determined to have the meaning is associated with the information on the meaning Display the list, set the object selected by the user's operation input as having the meaning determined for the object, obtain the selection history of the object selected by the user's operation input , a plurality of objects When it is determined that they have the same meaning, the history information of the acquired object Zui, it is possible, characterized in that the highest object selected frequency in the past of the objects to be listed, to execute processing of setting as having a meaning that is determined for the object in the computer .
以上に詳述したように本発明によれば、画像中に含まれるオブジェクトに対して行われる意味判定処理の処理結果の管理を行う場合における、操作負担の軽減に寄与することができる技術を提供することができる。 As described above in detail, according to the present invention, there is provided a technique capable of contributing to the reduction of the operation burden when managing the processing result of the semantic determination process performed on the object included in the image. can do.
以下、本発明の実施の形態について図面を参照しつつ説明する。 Embodiments of the present invention will be described below with reference to the drawings.
(第1の実施の形態)
まず、本発明の第1の実施の形態について説明する。
(First embodiment)
First, a first embodiment of the present invention will be described.
図1は、本発明の第1の実施の形態による画像処理システムS1について説明するための機能ブロック図である。 FIG. 1 is a functional block diagram for explaining an image processing system S1 according to the first embodiment of the present invention.
本実施の形態による画像処理システムS1は、画像データ取得部101、ドキュメント領域解析モジュール102、領域意味解析モジュール104、領域意味提示モジュール108、領域意味設定モジュール110、表示部111、操作入力部112、文字認識モジュール113、意味情報保管モジュール114、テキスト意味解析モジュール115、CPU801およびメモリ802を備えてなる構成となっている。画像処理システムS1は、例えば、これらの構成を備えたMFP(Multi Function Peripheral)により実現することができる。
The image processing system S1 according to the present embodiment includes an image
画像データ取得部101は、画像処理システムS1における処理対象となる画像データを取得する。以下、一例として、原稿からスキャンして得られる画像データを取得する場合を例に挙げるが、これに限られるものではなく、結果として電子化された画像データであれば画像データ取得部101におけるデータ取得の対象となる。また、
The image
ドキュメント領域解析モジュール(オブジェクト抽出部に相当)102は、画像データ取得部101にて取得される画像データの画像中に含まれるオブジェクトを抽出する。具体的には、ドキュメント領域解析モジュール102は、例えば、画像データの画像中における、文字列を囲む矩形領域の位置とサイズ(あるいは、矩形領域の左上の位置座標、および右下の位置座標)の解析を行い、画像データの画像中に含まれる文字領域等のオブジェクトを抽出する。
A document area analysis module (corresponding to an object extraction unit) 102 extracts an object included in an image of image data acquired by the image
領域意味解析モジュール(意味判定部に相当)104は、例えばメモリ802等の記憶領域に格納されている所定の判定ルールに基づいて、オブジェクト抽出部102にて抽出されるオブジェクトの画像データのレイアウト中における意味(例えば、「タイトル」、「ヘッダ」、「フッタ」、「段落」等)を解析(判定)する。領域意味解析モジュール104における解析結果(各オブジェクトの意味)は、各オブジェクトに対応づけられて意味情報保管モジュール114に格納される。
An area semantic analysis module (equivalent to a semantic determination unit) 104 is in the process of laying out image data of an object extracted by the
領域意味提示モジュール(通知部に相当)108は、意味情報保管モジュール114に格納されている各種情報に基づいて、領域意味解析モジュール104にて複数のオブジェクトが同一の意味を有すると判定された場合(例えば、複数のオブジェクトが「タイトル」であると判定された場合等)に、該意味を有すると判定された複数のオブジェクトに関する情報を、該意味に関する情報に関連付けて表示部111にてリスト表示させる。これにより、ユーザは、画像中に含まれるオブジェクトが、どのような意味を有するものとして判定されているか(解析結果)を容易に把握することができる。
When the area meaning presenting module (corresponding to the notification unit) 108 determines that a plurality of objects have the same meaning in the area meaning analyzing
領域意味設定モジュール(候補選択部および意味設定部に相当)110は、ユーザの操作入力部112への操作入力に基づいて、領域意味提示モジュール108からの命令により表示部111にてリスト表示させるオブジェクトの内のいずれかを選択する。そして、領域意味設定モジュール110は、上述のようにして選択されたオブジェクトを、該オブジェクトについて領域意味解析モジュール104にて判定された意味を有するものとして設定する。
The area meaning setting module (corresponding to the candidate selection section and the meaning setting section) 110 is an object that is displayed in a list on the
表示部111は、例えば液晶ディスプレイやCRTディスプレイから構成されており、画像処理システムS1における処理結果等を画面表示する役割を有している。表示部111は、具体的には、例えば、MFPのコントロールパネルのGUI画面や、PCのGUI画面などにより実現することができる。
The
操作入力部112は、例えば、キーボードやマウス等から構成されており、ユーザの操作入力を受け付ける役割を有している。もちろん、表示部111および操作入力部112の機能を例えばタッチパネルディスプレイ等によって一体的に実現してもよい。
The
文字認識モジュール113は、画像データの画像中に含まれる文字画像から文字をテキスト情報として認識する機能を有している。
The
意味情報保管モジュール114は、例えばHDD等の記憶装置から構成されており、ドキュメント領域解析モジュール102、領域意味解析モジュール104および文字認識モジュール113における処理結果を統合して保管する役割を有している。また、以下説明する他の保管モジュールも同様にHDD等の記憶装置から構成されており、データベースとしての役割を有しているものとする。
The semantic
テキスト意味解析モジュール115は、ドキュメント領域解析モジュール102にて抽出された文字領域の中の文字あるいは文字列に対し、文字認識モジュール113にて求めたテキスト情報を基にして、その文字あるいは文字列のテキスト意味(すなわち、「日付」、「社名」、「人名」などの属性)を解析する。
The text
具体的に、テキスト意味解析モジュール115では、画像中から抽出されたある文字領域のテキスト情報に含まれている「2006/01/25」という文字列の属性は「日付」であるというように解析を行う。
Specifically, the text
CPU801は、本実施の形態による画像処理システムにおける各種処理を行う役割を有しており、またメモリ802に格納されているプログラムを実行することにより種々の機能を実現する役割も有している。メモリ802は、例えばROMやRAM等から構成されており、画像処理システムにおいて利用される種々の情報やプログラムを格納する役割を有している。
The
以下、本実施の形態による画像処理システムS1による処理の詳細について説明する。ここでは、一例として、図2に示すようなドキュメントをスキャンして得られる画像データに対して所定の処理を行う場合について説明する。図3は、本発明の第1の実施の形態における処理の流れについて説明するための図である。 Details of the processing by the image processing system S1 according to this embodiment will be described below. Here, as an example, a case where a predetermined process is performed on image data obtained by scanning a document as shown in FIG. 2 will be described. FIG. 3 is a diagram for explaining the flow of processing in the first embodiment of the present invention.
まず、ドキュメント領域解析モジュール102は、図2に示すようなレイアウトで文字列等のオブジェクトが配置されているドキュメント画像における「2006/01/25」という文字領域や、「申し込み案内」といった文字領域を、それぞれ文字領域1、文字領域2として抽出する。
First, the document
具体的に、ドキュメント領域解析モジュール102は、例えば文字領域のようなオブジェクトを抽出する場合、ドキュメント画像の左上を座標の原点として、文字領域1が座標(80,10)から座標(120、20)の矩形領域であると認識する、といった処理を行う。なお、ドキュメント領域解析モジュール102による画像中からのオブジェクトの抽出処理は、そのオブジェクトがドキュメント画像中においてどのような位置にあるかを特定することができればよい。例えば、「文字領域1を包囲する矩形領域の左上の座標が(80,10)であり、矩形の幅が40、高さが10である」といった表現方法を採用することもできる。
Specifically, when extracting an object such as a character area, for example, the document
次に、領域意味解析モジュール104によって、ドキュメント領域解析モジュール102により抽出された文字領域の意味を解析する。
Next, the meaning of the character area extracted by the document
例えば、領域意味解析モジュール104は、文字領域1は「ヘッダ」であり、文字領域2は処理対象となっているドキュメント画像における「タイトル」であるといった解析を行う。
For example, the area
次に、文字認識モジュール113によって、ドキュメント領域解析モジュール102にて抽出された文字領域の画像を解析し、テキスト情報を取得する。例えば、文字認識モジュール113は、文字領域1のテキスト情報は「2006/01/25」であるといった解析を行う。
Next, the
上述のようにして、ドキュメント領域解析モジュール102、領域意味解析モジュール104および文字認識モジュール113により取得される各種情報および解析結果は、意味情報保管モジュール114にて保管される。
As described above, various information and analysis results acquired by the document
ここで、図3で示されるように、文字領域を包囲する矩形領域の位置、領域の意味、テキスト情報の他に、テキスト意味解析モジュール115にて、当該テキスト情報内の文字列からテキスト意味を抽出可能である場合、その文字列の矩形領域の位置、その文字列のテキスト意味およびその文字列のテキスト情報が保持される。なお、意味情報保管モジュール114は、1つの文字領域に含まれるいくつかの文字列が、それぞれ個別にテキスト意味を持っているならば、それらの情報をすべて保持することができる。図4は、意味情報保管モジュール114にて統合的に保管される各種情報それぞれの関わり合いを示す図である。
Here, as shown in FIG. 3, in addition to the position of the rectangular area surrounding the character area, the meaning of the area, and the text information, the text
このようにすることで、ユーザは、ある意味を有するオブジェクトの設定を、リスト表示されるオブジェクトの中から選択することにより行うことができ、オブジェクトの修正候補の入力負担を大幅に軽減することができる。 In this way, the user can set an object having a certain meaning by selecting from among the objects displayed in the list, which can greatly reduce the burden of inputting correction candidates for the object. it can.
また、画像中のオブジェクトへの意味付けの仕方の修正を、あらかじめ所定のアルゴリズムによる意味判定処理を経て行う構成とすることにより、既存の意味判定処理を実行させるためのプログラムに大幅な変更を加えることなく、オブジェクトへの意味付けに対して柔軟な変更を加えることができる。 In addition, by modifying the meaning of an object in an image through a semantic determination process using a predetermined algorithm in advance, a significant change is made to a program for executing an existing semantic determination process. Without any changes, it is possible to make flexible changes to the meaning of objects.
(第2の実施の形態)
次に、本発明の第2の実施の形態について説明する。
(Second Embodiment)
Next, a second embodiment of the present invention will be described.
図5は、本発明の第2の実施の形態による画像処理システムS2について説明するための機能ブロック図である。 FIG. 5 is a functional block diagram for explaining an image processing system S2 according to the second embodiment of the present invention.
本実施の形態は、上述の第1の実施の形態の変形例である。以下、すでに第1の実施の形態にて説明した部分と同様な機能を有する部分には同一符号を付し、説明は割愛する。本実施の形態と第1の実施の形態とは、表示部111におけるオブジェクトと意味の関連付けの表示方法が異なっている。
The present embodiment is a modification of the above-described first embodiment. Hereinafter, parts having the same functions as those already described in the first embodiment are denoted by the same reference numerals, and description thereof is omitted. The present embodiment and the first embodiment are different in the display method of the association between the object and the meaning on the
本実施の形態による画像処理システムS2は、第1の実施の形態による画像処理システムS1に加え、領域意味属性保管モジュール116、領域意味属性提示モジュール117および領域意味属性設定モジュール118を備えている。また、本実施の形態における領域意味解析モジュール104は、第1の実施の形態にて示した機能に加え、領域意味解析モジュール104にて行うオブジェクトの意味解析処理(意味判定処理)の確からしさ(信頼度)を判定する機能(信頼度判定部の機能に相当)を有している。
The image processing system S2 according to this embodiment includes an area meaning
領域意味属性保管モジュール116は、領域意味解析モジュール104にて実行される領域意味判定処理の結果の信頼度等の属性情報を取得し、その情報を保管する役割を有している。
The area semantic
領域意味属性提示モジュール117は、領域意味属性保管モジュール116にて保管されている属性の値に応じて、意味情報保管モジュール114で保管されている情報を提示する。よって、本実施の形態では、領域意味提示モジュール108および領域意味属性提示モジュール117が、通知部に相当する機能を有している。
The area semantic
本実施の形態における領域意味提示モジュール108および領域意味属性提示モジュール117は、互いに協働して、領域意味解析モジュール104にて複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された複数のオブジェクトを、該意味に関連付けて、領域意味解析モジュール104にて判定される信頼度が高い順に表示部111にてリスト表示させる。
The area
領域意味属性設定モジュール118は、領域意味属性保管モジュール116にて保管されている属性の値を手動で設定する手段をユーザに与える。よって、本実施の形態では、領域意味設定モジュール110および領域意味属性設定モジュール118が、候補選択部および意味設定部に相当する機能を有している。
The area semantic
以下、本実施の形態による画像処理システムS2における処理の詳細について説明する。 Details of processing in the image processing system S2 according to the present embodiment will be described below.
ここでは、画像処理システムS2における処理対象となるドキュメントの画像データから、領域意味が「タイトル」である文字領域のテキスト情報を抽出し、当該テキスト情報に基づいて、上記処理対象であるドキュメントの画像データを所定の記憶装置に保存する際のファイル名を生成する処理について説明する。 Here, text information of a character area whose area meaning is “title” is extracted from image data of a document to be processed in the image processing system S2, and the image of the document to be processed is based on the text information. Processing for generating a file name when saving data in a predetermined storage device will be described.
例えば、図2に示したようなドキュメントの画像データが処理対象データとして画像処理システムS2に入力される場合、「タイトル」として抽出されたテキスト情報(例えば、「申し込み案内」や「提出先」といった文字列など)から、「申し込み案内−提出先.pdf」といったファイル名を生成し、ユーザに提示する。そして、ユーザが上述のようにして生成されたファイル名に対する確認を促し、ユーザにより修正が加えられた場合、当該修正されたファイル名を画像データファイルに付与して保存する。図6は、本発明の第2の実施の形態における処理の流れについて説明するためのフローチャートである。 For example, when image data of a document as shown in FIG. 2 is input to the image processing system S2 as processing target data, text information extracted as “title” (for example, “application guide”, “submission destination”, etc.) A file name such as “application guide-submission destination.pdf” is generated from a character string or the like and presented to the user. Then, the user prompts for confirmation on the file name generated as described above, and when the correction is made by the user, the corrected file name is assigned to the image data file and stored. FIG. 6 is a flowchart for explaining the flow of processing in the second embodiment of the present invention.
まず、画像データ取得部101にて、ドキュメント処理システムS2における処理対象となるドキュメントの画像データを取得する(S101)。
First, the image
次に、ドキュメント領域解析モジュール102により、ドキュメント画像中の文字領域を解析し、文字領域を囲む矩形の座標(位置とサイズなど)を取得する。ドキュメント領域解析モジュール102にて取得される情報は、意味情報保管モジュール114に通知され、保管される(S102)。
Next, the document
次に、領域意味解析モジュール104により、例えばメモリ802等の記憶領域に格納されている所定の判定ルールに基づいて、ドキュメント領域解析モジュール102にて抽出された文字領域の領域意味(抽出されるオブジェクトの当該画像データのレイアウト中における意味)を解析する。また、領域意味解析モジュール104は、上記画像データ中に含まれるオブジェクトの意味判定処理と共に、当該意味判定処理の信頼度の判定も行う。
Next, the area meaning of the character area extracted by the document area analysis module 102 (extracted object) based on a predetermined determination rule stored in a storage area such as the
具体的に、領域意味解析モジュール104における意味判定処理の信頼度(確からしさ)の判定処理は、例えば、意味が「タイトル」である文字領域の判定では、ある文字領域がドキュメントのレイアウト中における上側寄りに位置している場合は10点、文字領域が大きい場合には20点というような得点付けを行ない、この得点付けの結果得られる合計点を意味判定処理の確からしさの指標とする。上記得点付けの結果得られる合計点は、意味情報保管モジュール114に格納される。
Specifically, the determination process of the reliability (probability) of the meaning determination process in the area
このようにして領域意味解析モジュール104にて取得された領域意味の情報は、意味情報保管モジュール114に通知され、保管される。このとき、領域意味解析モジュール104は、解析結果が正解である確からしさ(信頼度)に基づいて、各文字領域の候補順位を得て、この候補順位を属性として領域意味属性保管モジュール116に通知し、保管させる(S103)。
Information on the area meaning acquired by the area
図2に例示したドキュメントの画像データについて、領域意味解析モジュール104は、例えば「申し込み案内」というテキスト情報を持つ文字領域2と、「提出先」というテキスト情報を持つ文字領域3の領域意味を「タイトル」として解釈した場合、これら解析結果を意味情報保管モジュール114に通知し保管させる。具体的に、領域意味解析モジュール104は、領域意味を解析する際に得られる、文字領域2が最も「タイトル」である可能性が高く、文字領域3が2番目に「タイトル」である可能性が高い、という解析結果の確からしさの順位を、領域意味属性保管モジュール116に通知し、図7に示すようなデータテーブル等の形式で保管させる(S103)。
For the image data of the document illustrated in FIG. 2, the area
次に、文字認識モジュール113は、ドキュメント領域解析モジュール102で解析された文字領域のテキスト情報を取得する。文字認識モジュール113にて取得されるテキスト情報は、意味情報保管モジュール114に通知され、保管される(S104)。例えば、文字認識モジュール113は、「申し込み案内」という文字領域2のテキスト情報を取得した場合、当該テキスト情報を意味情報保管モジュール114に通知して保管させる。
Next, the
次に、領域意味属性提示モジュール117によって、意味情報保管モジュール114にて保管されている文字領域を、領域意味属性保管モジュール116にて保管されている解析結果の確からしさの順に並べ、表示部111にて画面表示させてユーザに提示させる(S105)。このような領域意味属性提示モジュール117による情報の提示は、例えば、図8に示すようなGUI画面上で行われる。
Next, the area semantic
表示部111に表示されるGUI画面上では、プレビューウィンドウであるウィンドウ201において、入力されたドキュメントの画像に加え、ドキュメント領域解析モジュール102にて抽出された文字領域を囲む矩形が表示される。さらに、領域意味解析モジュール104にて領域意味が「タイトル」であると解析された文字領域を囲む矩形の枠線は、赤色で強調表示されている。リストボックス202には、この「タイトル」と意味をもつと解釈された複数の文字領域のテキスト情報が、領域意味解析モジュール104にて解析された際の確からしさ(信頼度)の順に並べられ、「タイトル」という意味に関連付けてリスト表示されている。具体的に、図8に示す例では、「申し込み案内」という文字領域が1番「タイトル」らしいと解析され、「提出先」という文字領域が2番目に「タイトル」らしいと解析されているため、この順で(信頼度が高い順に)リストボックス202にリスト表示されている。
On the GUI screen displayed on the
次に、ユーザに提示されている領域意味が「タイトル」と解析された文字領域のリストの中に、ユーザが判断して「タイトル」ではないと考える候補が存在する場合(S106,Yes)、領域意味設定モジュール110は操作入力部112へのユーザの操作入力に基づいて、当該「タイトル」でない候補をリストから除外する(S107)。
Next, when there is a candidate that the user determines to be not “title” in the list of character areas analyzed as “title” as the area meaning presented to the user (S106, Yes), The area
このとき、リストから削除された文字領域の領域意味は[タイトル]ではないという情報を、意味情報保管モジュール114に通知する。ユーザに操作インタフェースを与え、その操作の結果を意味情報保管モジュール114に通知する機能は、領域意味設定モジュール110により提供される。例えば、図8に示すGUI画面にてリストボックス202に表示されている文字領域のリストから、領域意味が「タイトル」ではないとユーザが判断する候補があった場合、ユーザは、リストボックス202にてその候補の項目を選択し、削除ボタンであるコマンドボタン205を押下することにより、選択した項目をリストから削除することができる。
At this time, the semantic
次に、表示部111にてユーザに提示されている領域意味が「タイトル」らしい順に並べられている文字領域のリストボックス202において、ユーザが判断して、それら文字領域が「タイトル」らしい順に配列されていないと判断した場合(S108,Yes)、領域意味属性設定モジュール118は、操作入力部112へのユーザの操作入力に基づいて、リストにおける文字領域の候補の順位を修正する(S109)。
Next, in the character
このようにして順位が変更されたリストの変更後の文字領域の配列順位([タイトル]らしい順位)に関する情報は、領域意味属性設定モジュール118によって領域意味属性保管モジュール116に通知される。ユーザに操作インタフェースを与え、その操作の結果を領域意味属性保管モジュール116に通知する機能は、領域意味属性設定モジュール118により提供される。
Information relating to the arrangement order of the character areas after the change of the list whose order has been changed in this way (order that seems to be [title]) is notified to the area meaning
例えば、図8に示すGUI画面上にてリストボックス202に表示されている「タイトル」と判定された文字領域のリスト中からある項目を選択し、コマンドボタン203を押下すると、選択した項目よりも1つ上位の項目と順位が入れ替わり、コマンドボタン204を押下すると、選択した項目よりも1つ下位の項目と順位が入れ替わる。
For example, when an item is selected from the list of character areas determined as “title” displayed in the
また、コマンドボタン205や、コマンドボタン203および204により編集されたリストボックス202は、コマンドボタン206を押下することにより、最初に提示された状態に戻すことができる。
Further, the
次に、「タイトル」らしい順に並べられている文字領域の順に、そのテキスト情報を“‐”(ハイフン)などで連結し、拡張子などを付与してファイル名を生成する(S110)。図8では、一例として、リストボックス1‐2に表示されている項目の順に、そのテキスト情報を“‐”で連結し、拡張子“.pdf”を付与して生成したファイル名がテキストボックス207に表示されている。
Next, in the order of the character areas arranged in the order of “title”, the text information is connected with “-” (hyphen) or the like, and an extension is given to generate a file name (S110). In FIG. 8, as an example, the file name generated by concatenating the text information with “-” in order of the items displayed in the list box 1-2 and giving the extension “.pdf” is the
最後に、処理対象である画像データは、S110で生成されたファイル名を付与されて記憶装置(例えば、メモリ802)に保存される。具体的な動作としては、例えば、コマンドボタン209の保存ボタンを押すと、テキストボックス207に表示されているテキスト情報がファイル名に設定されて画像データが保存される。
Lastly, the image data to be processed is stored in a storage device (for example, the memory 802) with the file name generated in S110. As a specific operation, for example, when the save button of the command button 209 is pressed, the text information displayed in the
なお、図8に示すGUI画面では、テキストボックス207には「タイトル」として抽出された文字領域のテキスト情報が表示されるが、文字認識モジュール113の認識結果が誤っており、表示されるテキスト情報が誤ったものになってしまう場合もあり得る。このような場合、ユーザは、操作入力部112への操作入力により、テキストボックス207に直接テキストを入力することにより、文字認識モジュール113の誤認識を修正することが可能である。
In the GUI screen shown in FIG. 8, text information of the character area extracted as “title” is displayed in the
本実施の形態では、領域意味が「タイトル」である文字領域のテキスト情報のみを利用してファイル名を生成しているが、これに限られるものではなく、領域意味が「ヘッダ」である文字領域のテキスト情報をファイル名に利用する等、その他さまざまな領域意味のテキスト情報を利用することが可能である。また、処理対象である画像データに対する所定の処理として、特定の領域意味のテキスト情報に基づいてファイル名を生成する例を示したが、この他、ユーザによる修正が施された領域意味やテキスト情報を、ドキュメントの画像データの検索のキーワードとして利用することもできる。 In the present embodiment, the file name is generated using only the text information of the character area whose area meaning is “title”. However, the present invention is not limited to this, and the character whose area meaning is “header”. It is possible to use text information of various other meanings, such as using text information of a region as a file name. In addition, as an example of a predetermined process for image data to be processed, a file name is generated based on text information having a specific area meaning. In addition, the area meaning and text information modified by the user are also shown. Can be used as a search keyword for image data of a document.
以上、本実施の形態のような構成とすることにより、ユーザは特定の意味を有すると思われるオブジェクトを、リスト表示されている複数のオブジェクトの中で上位にランキングされているオブジェクト(その意味を有する可能性が高いオブジェクト)から確認してゆくことができる。これにより、ユーザは、ある意味を有する可能性があると判定されたオブジェクト群の中から最もその意味に適合するオブジェクトを探索する作業を少ない負担で行うことができる。 As described above, with the configuration of the present embodiment, the user can select an object that has a specific meaning as an object ranked higher among a plurality of objects displayed in the list (the meaning of the object). It is possible to confirm from an object that is highly likely to have). As a result, the user can perform an operation of searching for an object that most closely matches the meaning among a group of objects determined to have a certain meaning with a small burden.
(第3の実施の形態)
次に、本発明の第3の実施の形態について説明する。
(Third embodiment)
Next, a third embodiment of the present invention will be described.
図9は、本発明の第3の実施の形態による画像処理システムS3について説明するための機能ブロック図である。 FIG. 9 is a functional block diagram for explaining an image processing system S3 according to the third embodiment of the present invention.
本実施の形態は、上述の第1および第2の実施の形態の変形例である。以下、すでに第1および第2の実施の形態にて説明した部分と同様な機能を有する部分には同一符号を付し、説明は割愛する。本実施の形態による画像処理システムS3は、画像データから抽出されるオブジェクト領域に対する意味付けの修正方法が、上述の各実施の形態とは異なる。 This embodiment is a modification of the above-described first and second embodiments. Hereinafter, parts having the same functions as those already described in the first and second embodiments are denoted by the same reference numerals, and description thereof is omitted. The image processing system S3 according to the present embodiment is different from the above-described embodiments in a method for correcting meanings for object regions extracted from image data.
具体的に、本実施の形態による画像処理システムS3は、第2の実施の形態による画像処理システムS2に加え、領域意味設定傾向解析モジュール(履歴情報取得部および識別情報取得部に相当)119、領域意味ドキュメント傾向比較モジュール(画像種別判別部に相当)120、領域意味設定傾向保管モジュール121および領域意味定型設定モジュール(意味設定部、履歴情報取得部および識別情報取得部に相当)122を備えてなる構成となっている。
Specifically, the image processing system S3 according to the present embodiment includes an area meaning setting tendency analysis module (corresponding to a history information acquisition unit and an identification information acquisition unit) 119, in addition to the image processing system S2 according to the second embodiment. An area meaning document tendency comparison module (corresponding to an image type determination unit) 120, an area meaning setting
領域意味設定傾向解析モジュール(履歴情報取得部および識別情報取得部に相当)119は、意味情報保管モジュール114で保管されているドキュメントの情報に対し、領域意味設定モジュール110および領域意味属性設定モジュール118を介して設定されるユーザの修正(オブジェクトの選択)操作に関する情報(選択履歴)を取得し、当該ユーザの修正の仕方に傾向があるかどうかを解析する。ここで、領域意味設定傾向解析モジュール119は、領域意味設定モジュール110および領域意味属性設定モジュール118を介して行なわれる修正操作の内容をユーザ毎に特定するために、新規に処理対象となっているドキュメントに対して、操作入力部112を用いて領域意味設定モジュール110および領域意味属性設定モジュール118を操作するユーザを識別するための情報(パスワード認証の際に入力されるID情報やパスワード、バイオメトリクス認証の際に取得される指紋、瞳孔、声紋等に関する情報など)を取得する。このようにして取得されるユーザ識別情報は、過去に処理対象となったドキュメントについて修正操作を行なった場合を含め、その処理内容(選択、設定、修正など)と対応付けて意味情報保管モジュール114に格納されている。
An area meaning setting trend analysis module (corresponding to a history information acquisition unit and an identification information acquisition unit) 119 performs an area
領域意味設定傾向保管モジュール121は、領域意味設定傾向解析モジュール119にて解析された、あるドキュメントに対して行われるユーザの修正内容を当該ドキュメントと対応づけて保管する。
The area meaning setting
領域意味ドキュメント傾向比較モジュール(画像種別判別部)120は、画像データ取得部101にて取得される処理対象であるドキュメントの画像が、領域意味設定傾向保管モジュール121に保管されているドキュメントの画像に類似しているかどうかを比較することにより、当該処理対象である画像データの種別を判別する。
The area meaning document tendency comparison module (image type determination unit) 120 converts the image of the document to be processed acquired by the image
領域意味定型設定モジュール(意味設定部、履歴情報取得部および識別情報取得部に相当)122は、領域意味ドキュメント傾向比較モジュール120にて、処理対象であるドキュメントの画像データに類似する画像データが領域意味設定傾向保管モジュール121にて保管されている場合、その傾向を持ったドキュメントに対しユーザが行った過去の修正操作(オブジェクトの選択履歴など)に関する情報を、領域意味設定傾向解析モジュール119に取得されるユーザ識別情報に基づいて領域意味設定傾向保管モジュール121から取得し、その修正操作と同様な内容の修正を意味情報保管モジュール114あるいは領域意味属性保管モジュール116に保管されている情報に施す。このように、領域意味定型設定モジュール122は、領域意味ドキュメント傾向比較モジュール120にて判別された種別の画像データに対する領域意味設定モジュール110でのオブジェクトの選択履歴に関する情報を取得する。
An area semantic fixed setting module (equivalent to a meaning setting unit, a history information acquisition unit, and an identification information acquisition unit) 122 uses an area semantic document
このような構成とすることにより、ある種別の画像(例えば、あるフォーマットの文書画像など)中のオブジェクトに対してどのような意味付けがされることが多いかを履歴情報から把握し、その意味付けの傾向をオブジェクトへの意味付けに反映させることができる。 By adopting such a configuration, it is possible to grasp from the history information what kind of meaning is often given to an object in a certain type of image (for example, a document image of a certain format), and its meaning The tendency of attaching can be reflected in the meaning given to the object.
本実施の形態では、入力された画像データに含まれる各オブジェクトの領域意味の解析結果および領域意味の属性の解析結果についての、ユーザの過去の修正操作の傾向を解析し、新たに入力されたドキュメントが過去に入力されたドキュメントに類似していれば、過去にユーザが行った修正操作を、入力されたドキュメントにあらかじめ施した後、結果をユーザに提示する構成となっている。 In the present embodiment, the tendency of the user's past correction operation with respect to the analysis result of the area meaning and the analysis result of the attribute of the area meaning of each object included in the input image data is analyzed and newly input If the document is similar to a document input in the past, a correction operation performed by the user in the past is performed in advance on the input document, and then the result is presented to the user.
本実施の形態による画像処理システムS3において、図2に例示するようなドキュメントの画像データが入力され、領域意味が「タイトル」であると判定される文字領域が2つある場合、当該「タイトル」であると判定された文字領域のテキスト情報が、その確からしさの順に表示部111にリスト表示される。ここでユーザが、表示部111にて提示された結果から、「タイトル」の候補として挙がった文字領域の2番目の候補を、領域意味が「タイトル」ではないと判断し、領域意味設定モジュール110にて候補から削除する操作を行ったとする。
In the image processing system S3 according to this embodiment, when image data of a document as illustrated in FIG. 2 is input and there are two character areas whose area meaning is determined to be “title”, the “title” The text information of the character area determined to be is displayed as a list on the
このとき、入力された画像データの情報とユーザの修正操作を、領域意味設定傾向保管モジュール121にて記録させておく。次に、新たな処理対象としての画像データが入力された場合、過去に処理済の画像データとレイアウト等が類似したものであれば、当該画像データに対して過去に行われたユーザの修正操作を、新たに入力された画像データに対して自動的に施す。つまり、この場合では、「タイトル」の候補として判定された2つの文字領域のうち、2番目の候補を削除する。このようにして、2番目の候補が削除された結果をユーザに提示することで、ユーザは過去に類似する画像データに対して行った、「タイトル」と判定された2番目の文字領域候補を削除するという操作を、新たに入力された類似ドキュメントでは省略することができる。
At this time, the information on the input image data and the user's correction operation are recorded in the area meaning setting
図10は、ドキュメント処理システムS3に入力されたドキュメントの画像データに対し、ユーザが行う修正操作の傾向を取得する処理について説明するためのフローチャートである。 FIG. 10 is a flowchart for explaining a process of acquiring a tendency of a correction operation performed by the user on the document image data input to the document processing system S3.
まず、画像データ取得部101にて、ドキュメント処理システム13に入力されるドキュメントの画像を取得する(S201)。
First, the image
次に、ドキュメントの画像の解析を行う。ドキュメント領域解析モジュール102により、ドキュメント画像中の文字領域を解析し、文字領域を囲む矩形の座標(位置、サイズなど)の情報と、領域意味解析モジュール104により取得される、文字領域の領域意味と、文字認識モジュール113により取得されるテキスト情報と、を意味情報保管モジュール114に通知し、保管させる(S202)。
Next, the document image is analyzed. The document
次に、領域意味解析モジュール104にて解析された領域意味の解析結果の確からしさ(信頼度の高さ)の順位を領域意味属性保管モジュール116に通知し、保管させる(S203)。
Next, the region semantic
次に、意味情報保管モジュール114および領域意味属性保管モジュール116にて保管されている情報を、領域意味属性提示モジュール117により、ユーザに提示する(S204)。
Next, the information stored in the semantic
次に、ユーザは表示部111に提示された解析結果を確認し、必要があれば領域意味の修正、または領域意味属性の修正を、それぞれ、領域意味設定モジュール110、または領域意味属性設定モジュール118により行う(S205)。
Next, the user confirms the analysis result presented on the
S205における処理にて、ユーザが、領域意味設定モジュール110あるいは領域意味属性設定モジュール118を用いて修正を行った場合(S205,Yes)は、領域意味設定傾向解析モジュール119により、領域意味設定モジュール110あるいは領域意味属性設定モジュール118に指示されたユーザの修正操作と、入力されたドキュメントに関する情報(意味情報保管モジュール114にて保管されている情報)と、上記修正操作を行なったユーザを識別するための情報とを関連付け、領域意味設定傾向保管モジュール121に通知し、保管させる(S206)。
If the user makes corrections using the region
例えば、入力されたドキュメントの画像データに関する情報として、ドキュメント領域解析モジュール102にて解析された全文字領域の座標と、その画像データのドキュメントのレイアウトに類似する画像に対してユーザが過去に行った、「タイトル」として判定された文字領域の候補の内の2番目を候補から除外する、という修正作業とを関連付けて領域意味設定傾向保管モジュール121にて保管させる。図11は、ドキュメントの画像データに含まれる各文字領域の座標と、当該ドキュメントと類似するドキュメント画像に対してユーザが過去行った修正操作の内容とが対応付けられて領域意味設定傾向保管モジュール121に保管されている状況を示す図である。
For example, as information related to image data of an input document, a user has performed in the past on an image similar to the document layout of the image data and the coordinates of all character regions analyzed by the document
図12は、本実施の形態による画像処理システムS3における処理の詳細について説明するためのフローチャートである。 FIG. 12 is a flowchart for explaining details of processing in the image processing system S3 according to the present embodiment.
本実施の形態による画像処理システムS3では、入力されたドキュメントの画像データが、領域意味設定傾向保管モジュール121に保管されている(以前、入力された)ドキュメントのレイアウトに類似している場合に、以前のドキュメントに対して行ったユーザの修正操作を、新たに入力されたドキュメントの画像データに対して施しておき、ユーザに提示する。
In the image processing system S3 according to the present embodiment, when the image data of the input document is similar to the layout of the document stored (previously input) in the area meaning setting
まず、画像データ取得部101にて、ドキュメント処理システム13に入力されたドキュメントの画像を取得する(S301)。
First, the image
次に、入力されたドキュメントの画像の解析を行う。ドキュメント領域解析モジュール102によりドキュメント画像中の文字領域を解析して得られる文字領域を囲む矩形の座標(位置、サイズなど)の情報と、領域意味解析モジュール104により取得される文字領域の領域意味と、文字認識モジュール113により取得されるテキスト情報と、を対応づけて意味情報保管モジュール114に通知し、保管させる(S302)。
Next, the input document image is analyzed. Information on the coordinates (position, size, etc.) of the rectangle surrounding the character area obtained by analyzing the character area in the document image by the document
次に、領域意味解析モジュール104にて解析された領域意味の解析結果の確からしさの順位を、領域意味属性保管モジュール116に通知し、保管させる(S303)。
Next, the order of the probability of the analysis result of the area meaning analyzed by the area
次に、入力されたドキュメントに類似するレイアウトを有するドキュメントが、領域意味設定傾向保管モジュール121にて保管されているかどうか、領域意味ドキュメント傾向比較モジュール120により比較、判定を行う(S304)。ドキュメントの比較については、例えば、図11に示すように、領域意味設定傾向保管モジュール121に以前入力されたドキュメントから抽出されるすべての文字領域の座標情報が保管されている場合には、ドキュメント領域解析モジュール102にて新たに取得されたドキュメントの画像データから抽出される文字領域の座標と比較し、その値の差が小さければ、2つのドキュメントは類似していると判断する。
Next, whether or not a document having a layout similar to the input document is stored in the region meaning setting
なお、ここでは、ドキュメント画像中に含まれる文字領域の座標のみを用いてドキュメントの類似を判定する例を示すが、これに限られるものではない。例えば、ドキュメント画像から抽出されるテキスト情報を利用し、2つのドキュメントにおいて共通する単語が多い場合は類似していると判断するなど、意味情報保管モジュール114および領域意味属性保管モジュール116にて保存される種々の情報を用いて、ドキュメントの比較を行うことができる。
Here, an example is shown in which the similarity of a document is determined using only the coordinates of a character area included in the document image, but the present invention is not limited to this. For example, the text information extracted from the document image is used and stored in the semantic
次に、入力されたドキュメントに類似したドキュメントが領域意味設定傾向保管モジュール121に保管されている場合(S304,Yes)、新たに入力されたドキュメントの画像データに対し、領域意味設定傾向保管モジュール121に保管されている、類似したドキュメントに対して過去にユーザが行った修正操作を、領域意味定型設定モジュール122により実行させる(S305)。
Next, when a document similar to the input document is stored in the area meaning setting tendency storage module 121 (Yes in S304), the area meaning setting
例えば、領域意味ドキュメント傾向比較モジュール120が、入力されたドキュメントが、図11に示すように領域意味設定傾向保管モジュール121に情報が保管されているドキュメントAに類似していると判定した場合、領域意味定型設定モジュール122は、領域意味設定傾向保管モジュール121にて保管されている、ドキュメントAに対してユーザが行った修正操作、“2番目の[タイトル]文字領域候補を除外する”という操作を実行する。すなわち、領域意味設定モジュール110に、領域意味が2番目に[タイトル]らしいと解析された文字領域の領域意味を、[タイトル]ではないと修正するよう指示を出す。
For example, if the area-meaning document
次に、S304にて、入力されたドキュメントに類似したドキュメントが領域意味設定傾向保管モジュール121に保管されている場合(S304,Yes)にはS305で修正を施した結果を、類似したドキュメントがない場合(S304,No)にはS302およびS303における解析結果を、領域意味属性提示モジュール117により、ユーザに提示する(S306)。 Next, in S304, when a document similar to the input document is stored in the area meaning setting tendency storage module 121 (S304, Yes), there is no similar document as a result of correction in S305. In the case (S304, No), the analysis results in S302 and S303 are presented to the user by the region meaning attribute presentation module 117 (S306).
次に、提示された内容をユーザが修正した場合(S307,Yes)は、S308にて、図10にて示したS206と同様に、領域意味設定傾向解析モジュール119により、入力されたドキュメントとユーザの修正操作を領域意味設定傾向保管モジュール121に保管した後(S308)、処理を終了する。一方、提示された内容をユーザが修正していなければ(S307,No)処理を終了する。
Next, when the user corrects the presented content (S307, Yes), in S308, similarly to S206 shown in FIG. 10, the input document and user are input by the area meaning setting
なお、本実施の形態では、処理対象の画像データと類似する処理済みの画像データがあった場合に、当該処理済みの画像データに加えたのと同様な修正を加える構成を示したが、これに限られるものではない。例えば、処理対象の画像データとレイアウト等が類似する処理済の画像データが複数あるような場合には、領域意味定型設定モジュール122は、領域意味解析モジュール104にて複数のオブジェクトが同一の意味を有すると判定された場合に、領域意味設定傾向解析モジュール119にて取得される履歴情報に基づいて、領域意味提示モジュール108によりリスト表示されるオブジェクトの内の過去に選択された頻度が最も高いオブジェクトを、該オブジェクトについて領域意味解析モジュール104にて判定された意味を有するものとして設定するようにしてもよい。このように、過去の選択操作の履歴(傾向)を、画像中に含まれるオブジェクトに対する意味設定処理に自動的に反映させることにより、ユーザは類似したドキュメントに対し毎回同じ修正を行う必要がなく、利便性の向上に寄与することができる。
In this embodiment, when there is processed image data similar to the image data to be processed, a configuration in which the same correction as that added to the processed image data is shown. It is not limited to. For example, when there are a plurality of processed image data having a layout similar to that of the image data to be processed, the region semantic
また、本実施の形態では、過去の修正履歴に基づく修正処理を、処理対象の画像データと類似する処理済みの画像データがあるか否かに基づいて行う構成を示したが、これに限られるものではない。例えば、領域意味設定傾向解析モジュール119において、オブジェクトの選択を行うユーザを識別するための識別情報を取得し、当該取得された識別情報に対応するユーザによるオブジェクトの選択履歴に関する情報を取得する構成としてもよい。このような構成とすることにより、あるユーザが画像中のオブジェクトに対してどのような意味付けをしているかを履歴情報から把握し、その意味付けの選択の仕方の傾向をオブジェクトへの意味付けに反映させることができる。
In the present embodiment, the configuration in which the correction processing based on the past correction history is performed based on whether or not there is processed image data similar to the image data to be processed is shown, but the present invention is not limited thereto. It is not a thing. For example, the region meaning setting
また、あるレイアウトを有するドキュメントに対して過去に行なわれた修正内容等を、過去に入力されたドキュメントと類似するレイアウトを有する新規入力ドキュメントに対して自動反映させる構成する場合において、取得する修正操作の履歴情報は、必ずしも1人のユーザのものに限定する必要はなく、所定のグループに属する複数ユーザの操作履歴を取得したり、ユーザに関係なくドキュメントのレイアウトが類似するドキュメントに対して過去に行なわれた修正操作の履歴を全て取得したりすることもできる。 Further, a correction operation to be acquired in the case of a configuration in which correction contents and the like made in the past for a document having a certain layout are automatically reflected to a new input document having a layout similar to a document input in the past. The history information is not necessarily limited to that of a single user, but the operation history of a plurality of users belonging to a predetermined group can be acquired or a document with a similar document layout can be obtained in the past regardless of the user. It is also possible to acquire all the history of corrective operations performed.
(第4の実施の形態)
次に、本発明の第4の実施の形態について説明する。
(Fourth embodiment)
Next, a fourth embodiment of the present invention will be described.
図13は、本発明の第4の実施の形態による画像処理システムS4の構成を示す機能ブロック図である。本実施の形態は、第1の実施の形態の変形例である。本実施の形態による画像処理システムS4は、第1の実施の形態における画像処理システムS1における領域意味提示モジュール108および領域意味設定モジュール110を、テキスト意味提示モジュール123およびテキスト意味設定モジュール124に変更した構成となっている。
FIG. 13 is a functional block diagram showing a configuration of an image processing system S4 according to the fourth embodiment of the present invention. This embodiment is a modification of the first embodiment. In the image processing system S4 according to the present embodiment, the area
テキスト意味提示モジュール123は、意味情報保管モジュール114で保管されているテキスト意味を表示部111に画面表示させることによりユーザに提示する。
The text
テキスト意味設定モジュール124は、意味情報保管モジュール114で保管されているテキスト意味を、操作入力部112への操作入力により手動で設定する手段をユーザに与える。
The text
このような構成により、意味情報保管モジュール114にて保管されているテキスト意味の解析結果を、テキスト意味提示モジュール123によってユーザに提示する。ユーザは提示された解析結果を自身で確認することができ、誤って解析されている箇所を確認することができる。
With such a configuration, the analysis result of the text meaning stored in the semantic
さらに、テキスト意味情報設定モジュール124によって、ユーザはテキスト意味解析モジュール115が出力したテキスト意味の解析結果を設定または修正することができる。
Further, the text semantic
(第5の実施の形態)
次に、本発明の第5の実施の形態について説明する。
(Fifth embodiment)
Next, a fifth embodiment of the present invention will be described.
図14は、本発明の第5の実施の形態による画像処理システムS5の構成を示す機能ブロック図である。本実施の形態は、上述の第4の実施の形態の変形例である。本実施の形態による画像処理システムS5は、第4の実施の形態による画像処理システムS4の構成に加え、テキスト意味属性保管モジュール125、テキスト意味属性提示モジュール126およびテキスト意味属性設定モジュール127を備えてなる構成となっている。
FIG. 14 is a functional block diagram showing a configuration of an image processing system S5 according to the fifth embodiment of the present invention. The present embodiment is a modification of the above-described fourth embodiment. The image processing system S5 according to the present embodiment includes a text semantic
テキスト意味属性保管モジュール125は、テキスト意味解析モジュール(文字属性判定部に相当)115にて解析されるテキスト意味の結果が正解である確からしさなどの属性を取得し、その情報を保管する。テキスト意味解析モジュール115は、ドキュメント領域解析モジュール102にて抽出されるオブジェクトが文字領域である場合に、当該文字領域に含まれる文字の属性を判定する。テキスト意味解析モジュール115にて判定された文字の属性に関する情報は、テキスト意味属性保管モジュール125に格納される。
The text meaning
なお、テキスト意味解析モジュール115におけるテキスト意味の結果が正解である確からしさの判定は、例えば「人名」であるか否かの判定においては、判定対象となるテキスト情報の近隣に「殿」あるいは「様」といった文字があれば10点とする、といった所定のルールによる得点付けを行ない、この得点付けの結果得られる得点が高いもの程「人名」である可能性が高いテキストであると判定する。テキスト意味解析モジュール115におけるテキスト意味判定の結果が正解である確からしさの判定を行なうための所定のルールは、例えばメモリ802に格納される。
The determination of the probability that the text meaning result in the text meaning
テキスト意味属性提示モジュール(入力候補表示部)126は、テキスト意味属性保管モジュール125にて保管されているテキストの属性の値に応じて、意味情報保管モジュール114で保管されている情報を表示部111に画面表示させる。
The text semantic attribute presentation module (input candidate display unit) 126 displays information stored in the semantic
テキスト意味属性設定モジュール127は、操作入力部112への操作入力に基づいて、テキスト意味属性保管モジュール125にて保管されている属性の値を手動で設定する手段をユーザに与える。
The text meaning
本実施の形態では、画像処理システムS5に入力されたドキュメントの画像データから、テキストの意味が「人名」である文字領域のテキスト情報を抽出する。入力されたドキュメントの画像データから複数の「人名」が検出される場合は、ユーザが所望する順序もしくはテキスト意味の判定結果が正解である可能性が高いものほど上位になるような順序で「人名」を並べたリストを生成する。この「人名」リストに挙げられた項目や順序にしたがい、入力されたドキュメント画像を保存する際の送信先が変化する。 In the present embodiment, text information of a character region whose text meaning is “person name” is extracted from the image data of the document input to the image processing system S5. When multiple “person names” are detected from the image data of the input document, the “person names” are ordered in a higher order as the user's desired order or the text meaning determination result is more likely to be correct. ”Is generated. In accordance with the items and order listed in the “person name” list, the transmission destination for saving the input document image changes.
例えば、ドキュメントから“東京太郎”という「人名」のテキスト情報が取得されたら当該ドキュメントを送信先Aに送信し、“東京太郎”、“大阪次郎”の順のリストが取得されたら当該ドキュメントを送信先Bに送信し、“大阪次郎”、“東京太郎”という順であれば当該ドキュメントを送信先Cに送信する、といった処理を行うことができる。 For example, when the text information of “person name” “Tokyo Taro” is acquired from the document, the document is transmitted to the destination A, and when the list of “Tokyo Taro” and “Jiro Osaka” is acquired, the document is transmitted. If the order is “Jiro Osaka” and “Taro Tokyo” in this order, the document can be sent to the destination C.
図15は、本発明の第5の実施の形態による画像処理システムS5の処理の詳細について説明するためのフローチャートである。以下、一例として、自動でドキュメントから取得した結果に対し、ユーザが適切な修正を加え、修正された情報に基づいて生成された「人名」リストにしたがってドキュメントを送信する処理について説明する。ここでの「人名」リストの生成処理では、ユーザが所望する順序で並べられたものを作成するものとする。 FIG. 15 is a flowchart for explaining details of processing of the image processing system S5 according to the fifth embodiment of the present invention. Hereinafter, as an example, a description will be given of a process in which a user appropriately corrects a result obtained automatically from a document and transmits the document according to a “person name” list generated based on the corrected information. In the generation process of the “person name” list here, a list arranged in the order desired by the user is created.
まず、画像データ取得部101にて、画像処理システムS5に入力されるドキュメントの画像データを取得する(S401)。
First, the image
次に、ドキュメント領域解析モジュール102によりドキュメント画像中の文字領域を解析し、文字領域を囲む矩形の座標(位置とサイズなど)を取得する(S402)。このようにして取得した情報は意味情報保管モジュール114に通知され、保管される。
Next, the document
次に、文字認識モジュール113にて、文字領域のテキスト情報を取得する。取得されたテキスト情報は、意味情報保管モジュール114に保管される。例えば、文字領域2について“申し込み案内”というテキスト情報が取得された場合、当該テキスト情報は意味情報保管モジュール114に保管される(S403)。
Next, the
次に、抽出された文字領域内におけるテキスト情報のテキスト意味をテキスト意味解析モジュール115によって取得する。そして、取得されたテキスト意味に関する情報を意味情報保管モジュール114にて保管させる。さらに、このとき、テキスト意味が付与されたすべてのテキスト情報に対し、ユーザが所望しているテキスト情報の順に順位を付与する。この順位を属性としてテキスト意味属性保管モジュール125に通知し、保管させる(S404)。
Next, the text meaning
例えば、図2に例示したようなレイアウトのドキュメントの画像データでは、“東京太郎”や“大阪次郎”というテキスト情報のテキスト意味が「人名」として解析され、この解析結果が意味情報保管モジュール114に保管される。さらに、テキスト意味解析モジュール115にてテキスト意味が付与されたテキスト情報に対し、“東京太郎”が1番ユーザの所望する「人名」であり、“大阪次郎”が2番目に所望する「人名」である、というユーザの所望する順位を属性としてテキスト意味属性保管モジュール125に保管させる。図16は、テキスト意味属性保管モジュール125に保管されるテキスト意味属性を示すデータテーブルの一例である。
For example, in the image data of the document with the layout as illustrated in FIG. 2, the text meaning of the text information “Taro Tokyo” or “Jiro Osaka” is analyzed as “person name”, and the analysis result is sent to the semantic
次に、テキスト意味属性提示モジュール126によって、意味情報保管モジュール114にて保管されているテキスト情報を、テキスト意味属性保管モジュール125にて保管されているユーザの所望する順に並べ、表示部111にて画面表示させる(S405)。図17は、テキスト意味属性提示モジュール126により表示部111にて表示させるGUIの表示例を示す図である。このように、テキスト意味属性提示モジュール126は、抽出されるオブジェクトが文字である場合に、当該文字の属性を判定し、属性が判定された文字を、該文字について判定された属性の文字を入力とすべき所定の処理における入力文字候補として表示させる。
Next, the text semantic
図17に示すGUI画面では、プレビューウィンドウであるウィンドウ301において、入力されたドキュメントの画像に加え、ドキュメント領域解析モジュール102にて抽出された文字領域を囲む矩形が表示されている。さらに、テキスト意味解析モジュール115にてテキスト意味が「人名」と解析された文字領域の矩形の枠線は、赤色で強調表示されている。リストボックス302には、領域意味解析モジュール104にて意味が「タイトル」であると解析されたテキスト情報が、テキスト意味解析モジュール115にて付与されたユーザの所望の順に並べられ、リスト表示されている。
In the GUI screen shown in FIG. 17, in a
例えば、図17に示す例では、“東京太郎”という文字領域がユーザが1番所望する「人名」であると解析され、“大阪次郎”という文字領域がユーザが2番目に所望する「人名」であると解析されたため、この順序でリストボックス302にリスト表示されている。
For example, in the example shown in FIG. 17, the character area “Taro Tokyo” is analyzed as the “person name” desired by the user first, and the character area “Jiro Osaka” is the second “person name” desired by the user. Therefore, the list is displayed in the
次に、表示部111にてユーザに提示しているテキスト意味が「人名」と解析されたテキスト情報のリストの中に、ユーザが判断して所望する「人名」ではないと思われる候補がある場合(S406,Yes)、操作入力部112への操作入力に基づいてテキスト意味設定モジュール124により除外する。
Next, in the list of text information whose text meaning presented to the user on the
このとき、テキスト意味設定モジュール124は、リストから削除されたテキスト情報のテキスト意味は「人名」ではないという情報を、意味情報保管モジュール114に通知する(S407)。
At this time, the text
例えば、GUI画面上にてリストボックス302に表示されているリストから、テキスト意味が「人名」ではないと判断される候補があった場合(S408,Yes)、リストボックス302にてその候補の項目を選択し、削除ボタンであるコマンドボタン305を押下する。これにより、選択した項目がリストから削除される。
For example, if there is a candidate whose text meaning is not “person name” from the list displayed in the
次に、ユーザの所望する順に並べられたテキスト意味が「人名」であるテキスト情報のリストから、ユーザが判断して所望する「人名」順ではないと思われる候補の順位を、操作入力部112への操作入力に基づいて、テキスト意味属性設定モジュール127により修正する操作を行う(S409)。
Next, from the list of text information whose text meaning is “person name” arranged in the order desired by the user, the
このとき、ユーザの所望する「人名」の順位の変更に関する情報を、テキスト意味属性保管モジュール125に通知する。
At this time, the text semantic
例えば、GUI画面上にてリストボックス302に表示されている「人名」のリストから任意の項目を選択し、コマンドボタン303を押下すると、選択した項目よりも1つ上位の項目と順位が入れ替わり、コマンドボタン304を押すと、選択した項目よりも1つ下位の項目と順位が入れ替わる。
For example, when an arbitrary item is selected from the “person name” list displayed in the
また、コマンドボタン305や、コマンドボタン303および304により編集されたリストボックス302は、コマンドボタン306を押すことにより、最初に提示された表示状態に戻すことができる。
Further, the
次に、ユーザの所望する「人名」の順に並べられているリストに基づき、ドキュメントの送信先を決定する(S410)。送信先は事前に定義されており、リストの内容に従って送信先が決定される。 Next, the transmission destination of the document is determined based on the list arranged in the order of “person names” desired by the user (S410). The transmission destination is defined in advance, and the transmission destination is determined according to the contents of the list.
最後に、S410の処理で決定した送信先に、入力されたドキュメントを送信する(S411)。例えば、コマンドボタン307の送信ボタンを押すと、ドキュメントの送信を開始する。
Finally, the input document is transmitted to the transmission destination determined in S410 (S411). For example, when a transmission button of the
なお、図17に示すGUI画面では、テキストボックス302には「人名」として抽出された文字領域のテキスト情報が表示されるが、文字認識モジュール113の認識結果が誤っており、表示されるテキスト情報が誤ったものになってしまう場合もあり得る。このような場合には、テキストボックス302に、操作入力部112を利用してユーザが直接テキストを入力することにより、文字認識モジュール113における認識ミスを修正することができる。
In the GUI screen shown in FIG. 17, the text information of the character area extracted as “person name” is displayed in the
なお、本実施の形態では、テキスト意味が「人名」であるテキスト情報をドキュメントデータの送信先の選定に利用する例を示したが、これに限られるものではない。例えば、テキスト意味が「日付」であるテキスト情報等、さまざまなテキスト意味を有するテキスト情報を利用することも可能である。 In the present embodiment, an example is shown in which text information whose text meaning is “person name” is used to select a transmission destination of document data. However, the present invention is not limited to this. For example, it is possible to use text information having various text meanings such as text information whose text meaning is “date”.
また、取得されたテキスト意味の情報の利用方法についても、送信先の選定に限らず、例えば、取得されたテキスト意味に対してユーザの修正を促し、修正されたテキスト意味情報を、当該テキスト意味が抽出されたドキュメントの検索に利用することもできる。 In addition, the method of using the acquired text meaning information is not limited to the selection of the transmission destination, for example, the user is prompted to correct the acquired text meaning, and the corrected text meaning information is used as the text meaning. It can also be used to search for documents that have been extracted.
このように、本実施の形態におけるテキスト意味属性提示モジュール126は、テキスト意味解析モジュール115により属性が判定された文字を、該文字について判定された属性の文字を入力とすべき所定の処理における入力文字候補として表示させる。このようにすることで、ユーザは、ある属性(例えば、人名、電話番号、住所など)を有する文字を、その属性をもつ文字を入力とする処理における文字入力を、入力文字候補の中から選択することにより行うことができ、文字入力の負担を大幅に軽減することができる。
As described above, the text meaning
(第6の実施の形態)
次に、本発明の第6の実施の形態について説明する。
(Sixth embodiment)
Next, a sixth embodiment of the present invention will be described.
本実施の形態は、上述の第5の実施の形態の変形例である。以下、すでに第5の実施の形態にて説明した部分と同様な機能を有する部分には同一符号を付し、説明は割愛する。本実施の形態による画像処理システムS6は、画像データから抽出されるテキスト情報に付与する属性の修正方法が、上述の第5の実施の形態とは異なる。図18は、本発明の第6の実施の形態による画像処理システムS6の構成を示す機能ブロック図である。 The present embodiment is a modification of the above-described fifth embodiment. Hereinafter, parts having the same functions as those already described in the fifth embodiment are denoted by the same reference numerals, and description thereof is omitted. The image processing system S6 according to the present embodiment differs from the above-described fifth embodiment in a method for correcting an attribute added to text information extracted from image data. FIG. 18 is a functional block diagram showing a configuration of an image processing system S6 according to the sixth embodiment of the present invention.
具体的に、本実施の形態による画像処理システムS6は、第5の実施の形態による画像処理システムS5に加え、テキスト意味設定傾向解析モジュール(履歴情報取得部および識別情報取得部に相当)128、テキスト意味ドキュメント傾向比較モジュール(画像種別判別部に相当)130、テキスト意味設定傾向保管モジュール129およびテキスト意味定型設定モジュール(意味設定部、履歴情報取得部および識別情報取得部に相当)131を備えてなる構成となっている。
Specifically, the image processing system S6 according to this embodiment includes a text meaning setting tendency analysis module (corresponding to a history information acquisition unit and an identification information acquisition unit) 128 in addition to the image processing system S5 according to the fifth embodiment. A text meaning document tendency comparison module (corresponding to an image type determination unit) 130, a text meaning setting
テキスト意味設定傾向解析モジュール128は、意味情報保管モジュール114で保管されているドキュメントの情報に対し、テキスト意味設定モジュール124およびテキスト意味属性設定モジュール127を介して設定されるユーザの修正内容に傾向があるかどうかを解析する。
The text meaning setting
テキスト意味設定傾向保管モジュール129は、テキスト意味設定傾向解析モジュール128によって解析された、あるドキュメントに対して行われるユーザの修正操作の内容と、当該ドキュメントを識別するための情報とを組にして保管する。
The text meaning setting
テキスト意味ドキュメント傾向比較モジュール130は、処理対象となる画像データのドキュメントが、テキスト意味設定傾向保管モジュール129に保管されているドキュメントのレイアウトに類似しているかどうかを比較する。
The text meaning document
テキスト意味定型設定モジュール131は、テキスト意味ドキュメント傾向比較モジュール130にて、処理対象であるドキュメントに類似したドキュメントがテキスト意味設定傾向保管モジュール129にて保管されている場合、テキスト意味設定傾向保管モジュール129より、その傾向を持ったドキュメントに対しユーザが行った過去の修正操作に関する情報を取得し、その操作内容を意味情報保管モジュール114あるいはテキスト意味属性保管モジュール125に格納されている処理対象ドキュメントに関する情報に反映させる。
When the text meaning document setting
本実施の形態では、入力される処理対象であるドキュメントに対するテキスト意味解析結果およびテキスト意味属性解析結果についての、ユーザの修正操作の傾向を解析する。そして、新たに入力されるドキュメントのレイアウト等が過去に処理対象となったドキュメントに類似していれば、当該過去に入力されたドキュメント画像に対してユーザが行った修正操作を、新たに入力されたドキュメントにあらかじめ自動的に施した後、当該自動修正した結果をユーザに提示する構成となっている。 In this embodiment, the tendency of the user's correction operation is analyzed for the text semantic analysis result and the text semantic attribute analysis result for the input document to be processed. If the layout of a newly input document is similar to a document that has been processed in the past, a correction operation performed by the user on the previously input document image is newly input. After the document is automatically applied to the document, the result of the automatic correction is presented to the user.
例えば、本実施の形態による画像処理システムS6では、図2に例示したようなレイアウトで配置されたオブジェクトを含むドキュメント画像を取得すると、テキスト意味が「人名」である2つの文字領域のテキスト情報が、ユーザの所望の順序で表示部111にリスト表示される。ここでは、ユーザが、表示部111にてリスト表示された結果から、「人名」としてリスト表示されている項目の内の2番目の項目を、テキスト意味が「人名」ではないものと判断し、リストから削除する操作を行ったものとする。このとき、入力されたドキュメント画像1の情報と、ユーザの修正操作を履歴情報として記録しておく。次に、新たに処理対象となるドキュメントの画像データが画像処理システムS6に入力された場合、過去に処理対象となったドキュメントの画像データとレイアウト等が類似したものであれば、当該過去に処理したドキュメント画像に対して行ったユーザの修正操作を、新たに入力されたドキュメントの画像データに対してあらかじめ自動的に反映させる。つまり、この場合、新たに入力されたドキュメントの画像データについての解析の結果得られる「人名」リストの項目の内の2番目の項目を自動的に削除する。このようにして2番目の項目が削除された「人名」リストをユーザに提示することで、ユーザは過去に類似するドキュメントの画像データに対して行った修正操作を、新たに処理対象となるドキュメントでは省略することができる。
For example, in the image processing system S6 according to the present embodiment, when a document image including an object arranged in the layout illustrated in FIG. 2 is acquired, text information of two character areas whose text meaning is “person name” is obtained. The list is displayed on the
図19は、本発明の第6の実施の形態による画像処理システムS6における処理の詳細を示すフローチャートである。 FIG. 19 is a flowchart showing details of processing in the image processing system S6 according to the sixth embodiment of the present invention.
まず、画像処理システムS6に入力されたドキュメントに対し、ユーザが行う修正操作の傾向を取得する処理について記述する。 First, a process for obtaining a tendency of a correction operation performed by the user for a document input to the image processing system S6 will be described.
はじめに、画像データ取得部101にて、ドキュメント処理システム23に入力されるドキュメントの画像データを取得する(S501)。
First, the image
次に、ドキュメント領域解析モジュール102により、ドキュメント画像中の文字領域を解析し、文字領域を囲む矩形の座標(位置、サイズなど)の情報を取得する。また、文字認識モジュール113により、ドキュメント領域解析モジュール102にて抽出された文字領域のテキスト情報を認識する。そして、テキスト意味解析モジュール115にて、文字認識モジュール113にて認識されたテキスト情報のテキスト意味を認識する。このようにして、ドキュメント領域解析モジュール102、文字認識モジュール113およびテキスト意味解析モジュール115にて取得される各種情報は、意味情報保管モジュール114に保管される(S502)。
Next, the document
次に、テキスト意味解析モジュール115にて解析されたテキスト意味のリスト表示における、ユーザの所望の表示順序を、属性としてテキスト意味属性保管モジュール125に保管させる(S503)。
Next, the user's desired display order in the text meaning list display analyzed by the text meaning
次に、意味情報保管モジュール114およびテキスト意味属性保管モジュール125にて保管されている情報を、テキスト意味属性提示モジュール126により表示部111に画面表示させ、ユーザに提示する(S504)。
Next, the information stored in the semantic
次に、ユーザが表示部111に提示された解析結果を確認した結果、テキスト意味設定モジュール124またはテキスト意味属性設定モジュール127を用いて、テキスト意味またはテキスト意味属性の修正を行った場合(S505,Yes)、S506の処理を実行させる。具体的には、入力されたドキュメントの画像データに関する情報(つまり、意味情報保管モジュール114にて保管されている情報)と、テキスト意味設定傾向解析モジュール128により、テキスト意味設定モジュールあるいはテキスト意味属性設定モジュール127を介して該ドキュメントについて行われたユーザの修正操作内容を示す情報とを関連付けて、テキスト意味設定傾向保管モジュール129に保管させる(S506)。
Next, as a result of confirming the analysis result presented on the
例えば、入力されたドキュメントの情報として、ドキュメント領域解析モジュール102にて解析された全文字領域の位置(座標など)を示す情報と、そのドキュメントに類似するレイアウトのドキュメントに対して過去にユーザが行った修正作業の内容に関する情報とが、関連付けてテキスト意味設定傾向保管モジュール129に保管される。
For example, as input document information, a user has performed in the past on information indicating the positions (coordinates, etc.) of all character regions analyzed by the document
図20では、ドキュメントの画像データの画像中に含まれる文字領域等のオブジェクトのドキュメント中における座標情報と、これら文字領域について判定された属性情報等に対してユーザが過去に行った修正操作の内容とが組になりテキスト意味設定傾向保管モジュール129に保管されている状況を示す。
In FIG. 20, the contents of the correction operation performed by the user in the past on the coordinate information in the document of the object such as the character area included in the image of the document image data and the attribute information determined on the character area. And shows a situation where the text meaning setting
次に、本実施の形態による画像処理システムS6に処理対象として新たに入力されたドキュメントのレイアウトが、テキスト意味設定傾向保管モジュール129に保管されている(過去に入力された)ドキュメントのレイアウトと類似している場合に、当該過去に入力されたドキュメントに対して行われたユーザの修正操作と同様の内容の修正を上記新たに入力されたドキュメントに対して自動的に施しておき、ユーザに提示する処理について説明する。図21は、本発明の第6の実施の形態における、新規に入力されるドキュメントへの過去の修正操作の反映処理の詳細について説明するためのフローチャートである。 Next, the layout of the document newly input as the processing target in the image processing system S6 according to the present embodiment is similar to the layout of the document stored in the text meaning setting trend storage module 129 (input in the past). If it is, the same correction as the user's correction operation performed on the past input document is automatically applied to the newly input document and presented to the user. Processing to be performed will be described. FIG. 21 is a flowchart for explaining the details of the reflection processing of the past correction operation to the newly input document in the sixth embodiment of the present invention.
まず、画像データ取得部101にて、ドキュメント処理システムS6に入力されるドキュメントの画像データを取得する(S601)。
First, the image
次に、ドキュメント領域解析モジュール102により、ドキュメントの画像データの画像中の文字領域等のオブジェクトを解析し、各文字領域を囲む矩形の座標(位置、サイズなど)に関する情報を取得する。また、文字認識モジュール113により、ドキュメント領域解析モジュール102にて画像中から抽出される文字領域からテキスト情報を認識する。そして、テキスト意味解析モジュール115により、文字認識モジュール113にて認識されたテキスト情報のテキスト意味を認識する。このようにして、ドキュメント領域解析モジュール102、文字認識モジュール113およびテキスト意味解析モジュール115にて取得される各種情報は、意味情報保管モジュール114に保管される(S602)。
Next, the document
次に、テキスト意味解析モジュール115にて解析されたテキスト意味のリスト表示における、ユーザの所望の表示順序を、属性としてテキスト意味属性保管モジュール125に保管させる(S603)。
Next, the user's desired display order in the list display of the text meaning analyzed by the text meaning
次に、処理対象として新たに入力されたドキュメントに類似するレイアウトを有するドキュメントに関する情報が、テキスト意味設定傾向保管モジュール129にて保管されているかどうか、テキスト意味ドキュメント傾向比較モジュール128による比較判定処理を行う(S604)。
Next, whether or not information related to a document having a layout similar to a document newly input as a processing target is stored in the text meaning setting
テキスト意味ドキュメント傾向比較モジュール128におけるドキュメントの比較については、例えば図20に示すように、テキスト意味設定傾向保管モジュール129に過去に入力されたドキュメントから抽出された全ての文字領域の座標値に関する情報が保管されている場合、ドキュメント領域解析モジュール102にて取得された、新たに入力されたドキュメントの画像データから抽出される文字領域の座標値と比較し、その値の差が小さければ、2つのドキュメントは類似していると判断する。
As for comparison of documents in the text meaning document
なお、ここでは、ドキュメント画像中に含まれる文字領域の座標(ドキュメントにおけるオブジェクトのレイアウトに関する情報)のみを用いてドキュメントの類似を判定する構成を例示したが、これに限られるものではない。例えば、ドキュメントの画像中に含まれる文字領域のテキスト情報を利用し、類比の対象となる2つのドキュメント間で共通して含む単語が多い場合には類似するドキュメントであると判断するなど、意味情報保管モジュール114および領域意味属性保管モジュール125にて保存されている種々の情報を用いて、ドキュメントの比較を行うこともできる。
Here, the configuration in which the similarity of the document is determined using only the coordinates of the character area included in the document image (information regarding the layout of the object in the document) is illustrated, but the present invention is not limited to this. For example, using text information of a character area included in a document image, if there are many words included in common between two documents to be compared, the semantic information is determined to be similar. Documents can also be compared using various information stored in the
次に、画像処理システムS6に入力されたドキュメントに類似するレイアウトを有するドキュメントに関する情報がテキスト意味設定傾向保管モジュール129に保管されている場合(S604,Yes)、新たに入力されたドキュメントの画像データに対し、テキスト意味設定傾向保管モジュール129に保管されている、当該新たに入力されたドキュメントに類似するドキュメントに対して過去にユーザが行った修正操作と同様の内容の修正処理を、テキスト意味定型設定モジュール131により自動的に施す。
Next, when information regarding a document having a layout similar to the document input to the image processing system S6 is stored in the text meaning setting trend storage module 129 (S604, Yes), image data of the newly input document On the other hand, the text semantic fixed form is subjected to correction processing having the same content as the correction operation previously performed by the user on the document similar to the newly input document stored in the text meaning setting
具体的には、S604にて、テキスト意味ドキュメント傾向比較モジュール130が、新規に画像処理システムS6に入力されたドキュメントが、図20に示すようにテキスト意味設定傾向保管モジュール129に情報が保管されているドキュメントAに類似していると判定した場合(S604,Yes)、テキスト意味定型設定モジュール131は、テキスト意味設定傾向保管モジュール129にて保管されている、ドキュメントAに対してユーザが行った修正操作と同様の内容の修正処理を当該新規に入力されたドキュメントの画像データに対して実行する。すなわち、ここでは、テキスト意味が「人名」であり、ユーザが所望する順位が2番目のテキスト情報である、と解析されたテキスト情報を、テキスト意味が「人名」ではないと修正するようにテキスト意味設定モジュール124に指示を出す。
Specifically, in S604, the text meaning document
テキスト意味属性提示モジュール126は、新規に画像処理システムS6に入力されたドキュメントとレイアウトが類似するドキュメントに関する情報が、テキスト意味設定傾向保管モジュール129にある場合(S604,Yes)には、S605で修正を施した結果を表示部111にてユーザに提示させ(S605)、類似したドキュメントに関する情報がない場合(S604,No)にはS602およびS603における解析結果を表示部111にてユーザに提示させる(S606)。
The text meaning
次に、表示部111にて提示されたテキスト意味もしくはテキスト意味属性の内容をユーザが修正した場合(S607,Yes)には、テキスト意味設定傾向解析モジュール128により、当該意味および属性の判定内容が修正された新規入力ドキュメントとユーザの修正操作を対応付けて、テキスト意味設定傾向保管モジュール129に保管し(S608)、処理を終了する。一方、表示部111にて提示された内容をユーザが修正していなければ(S607,No)処理を終了する。
Next, when the user corrects the content of the text meaning or the text meaning attribute presented on the display unit 111 (S607, Yes), the text meaning setting
また、上述の各実施の形態では、ドキュメントの画像データの画像中から抽出されるオブジェクトが主に文字領域である例を示したが、これに限られるものではなく、通常のドキュメントに含まれ得る図形や写真画像等のオブジェクトも抽出の対象となり得ることは言うまでもない。 In each of the above-described embodiments, an example in which an object extracted from an image of document image data is mainly a character area has been described. However, the present invention is not limited to this, and can be included in a normal document. Needless to say, objects such as figures and photographic images can also be extracted.
なお、上述の各実施の形態では、オブジェクトと当該オブジェクトについての意味判定結果を画面表示することにより、ユーザへの通知を行う構成を例に挙げたが、これに限られるものではなく、例えば、音声によって上記と同様な内容の通知を行うようにしてもよい。 In each of the above-described embodiments, the configuration in which notification is given to the user by displaying the object and the semantic determination result about the object on the screen is given as an example. However, the present invention is not limited to this. For example, You may make it perform notification of the content similar to the above by an audio | voice.
なお、上述の実施の形態では、スキャンした画像データに対して所定のルールに基づく意味判定処理を施し、当該判定処理の処理結果に対し、候補選択部による選択や、意味設定部によるユーザや文書種別に応じた意味設定を行う構成を例示したが、これに限られるものではなく、例えば、スキャンした画像データに対してユーザや文書種別に応じて予め決定されているルールに基づいて、意味判定処理を行うようにしてもよい。 In the above-described embodiment, the scanned image data is subjected to semantic determination processing based on a predetermined rule, and the processing result of the determination processing is selected by the candidate selection unit or the user or document by the semantic setting unit. The configuration for performing the semantic setting according to the type is illustrated, but the configuration is not limited to this. For example, the semantic determination is performed based on a rule determined in advance according to the user or the document type with respect to the scanned image data. Processing may be performed.
このような処理アルゴリズムとすることにより、上述の実施の形態におけるオブジェクトへの適切な意味付けの選択を行う処理ステップを削減することができる。 By adopting such a processing algorithm, it is possible to reduce processing steps for selecting an appropriate meaning for an object in the above-described embodiment.
上述の画像処理システムでの処理における各ステップは、メモリ802に格納されている画像処理プログラムをCPU801に実行させることにより実現されるものである。
Each step in the processing in the above-described image processing system is realized by causing the
本実施の形態では装置内部に発明を実施する機能が予め記録されている場合で説明をしたが、これに限らず同様の機能をネットワークから装置にダウンロードしても良いし、同様の機能を記録媒体に記憶させたものを装置にインストールしてもよい。記録媒体としては、CD−ROM等プログラムを記憶でき、かつ装置が読み取り可能な記録媒体であれば、その形態は何れの形態であっても良い。またこのように予めインストールやダウンロードにより得る機能は装置内部のOS(オペレーティング・システム)等と共働してその機能を実現させるものであってもよい。 In this embodiment, the function for implementing the invention is recorded in advance in the apparatus. However, the present invention is not limited to this, and the same function may be downloaded from the network to the apparatus, and the same function is recorded. What is stored in the medium may be installed in the apparatus. The recording medium may be any form as long as the recording medium can store the program and can be read by the apparatus, such as a CD-ROM. Further, the function obtained by installing or downloading in advance may be realized in cooperation with an OS (operating system) or the like inside the apparatus.
本発明を特定の態様により詳細に説明したが、本発明の精神および範囲を逸脱しないかぎり、様々な変更および改質がなされ得ることは、当業者には自明であろう。 Although the present invention has been described in detail according to particular embodiments, it will be apparent to those skilled in the art that various changes and modifications can be made without departing from the spirit and scope of the invention.
S1〜S6 画像処理システム、101 画像データ取得部、102 ドキュメント領域解析モジュール、104 領域意味解析モジュール、108 領域意味提示モジュール、110 領域意味設定モジュール、111 表示部、112 操作入力部、113 文字認識モジュール、114 意味情報保管モジュール、115 テキスト意味解析モジュール、116 領域意味属性保管モジュール、117 領域意味属性提示モジュール、118 領域意味属性設定モジュール、119 領域意味設定傾向解析モジュール、120 領域意味ドキュメント傾向比較モジュール、121 領域意味設定傾向保管モジュール、122 領域意味定型設定モジュール、123 テキスト意味提示モジュール、124 テキスト意味設定モジュール、125 テキスト意味属性保管モジュール、126 テキスト意味属性提示モジュール、127 テキスト意味属性設定モジュール、128 テキスト意味設定傾向解析モジュール、130 テキスト意味ドキュメント傾向比較モジュール、129 テキスト意味設定傾向保管モジュール、131 テキスト意味定型設定モジュール、801 CPU、802 メモリ。 S1 to S6 Image processing system, 101 Image data acquisition unit, 102 Document area analysis module, 104 Area meaning analysis module, 108 Area meaning presentation module, 110 Area meaning setting module, 111 Display section, 112 Operation input section, 113 Character recognition module , 114 semantic information storage module, 115 text semantic analysis module, 116 area semantic attribute storage module, 117 area semantic attribute presentation module, 118 area semantic attribute setting module, 119 area semantic setting trend analysis module, 120 area semantic document trend comparison module, 121 area meaning setting tendency storage module, 122 area meaning fixed form setting module, 123 text meaning presentation module, 124 text meaning setting module, 125 text Semantic attribute storage module, 126 text semantic attribute presentation module, 127 text semantic attribute setting module, 128 text semantic setting trend analysis module, 130 text semantic document trend comparison module, 129 text semantic setting trend storage module, 131 text semantic fixed setting module , 801 CPU, 802 memory.
Claims (14)
前記画像データ取得部にて取得される画像データの画像中に含まれるオブジェクトを抽出するオブジェクト抽出部と、
所定の判定ルールに基づいて、前記オブジェクト抽出部にて抽出されるオブジェクトの前記画像データのレイアウト中における意味を判定する意味判定部と、
前記意味判定部にて複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された複数のオブジェクトに関する情報を、該意味に関する情報に関連付けてリスト表示させる通知部と、
ユーザの操作入力を受け付ける操作入力部と、
前記操作入力部にて受け付けたユーザの操作入力により選択されたオブジェクトを、該オブジェクトについて前記意味判定部にて判定された意味を有するものとして設定する意味設定部と、
前記操作入力部によるオブジェクトの選択履歴を取得する履歴情報取得部と、を備え、
前記意味設定部は、前記意味判定部にて複数のオブジェクトが同一の意味を有すると判定された場合に、前記履歴情報取得部にて取得される履歴情報に基づいて、前記通知部によりリスト表示されるオブジェクトの内の過去に選択された頻度が最も高いオブジェクトを、該オブジェクトについて前記意味判定部にて判定された意味を有するものとして設定する画像処理システム。 An image data acquisition unit for acquiring image data;
An object extraction unit that extracts an object included in an image of the image data acquired by the image data acquisition unit;
A semantic determination unit that determines the meaning of the object extracted by the object extraction unit in the layout of the image data based on a predetermined determination rule;
A notification unit configured to display a list of information related to a plurality of objects determined to have the meaning in association with the information related to the meaning when the meaning determination unit determines that the plurality of objects have the same meaning; ,
An operation input unit for receiving user operation inputs;
A meaning setting unit that sets the object selected by the user's operation input received by the operation input unit as having the meaning determined by the meaning determination unit for the object;
A history information acquisition unit that acquires an object selection history by the operation input unit ,
The meaning setting unit displays a list by the notification unit based on history information acquired by the history information acquisition unit when the meaning determination unit determines that a plurality of objects have the same meaning. An image processing system that sets an object having the highest frequency of selection in the past as having the meaning determined by the meaning determination unit for the object .
前記画像データ取得部にて取得される画像データの画像中に含まれるオブジェクトを抽出するオブジェクト抽出部と、An object extraction unit that extracts an object included in an image of the image data acquired by the image data acquisition unit;
所定の判定ルールに基づいて、前記オブジェクト抽出部にて抽出されるオブジェクトの前記画像データのレイアウト中における意味を判定する意味判定部と、A semantic determination unit that determines the meaning of the object extracted by the object extraction unit in the layout of the image data based on a predetermined determination rule;
前記意味判定部にて複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された各オブジェクトの順位を判定する信頼度判定部と、A reliability determination unit that determines the rank of each object determined to have the meaning when the meaning determination unit determines that the plurality of objects have the same meaning;
前記意味判定部にて複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された複数のオブジェクトに関する情報を、該意味に関連付けて、前記信頼度判定部にて判定される順位が高い順にリスト表示させる通知部と、When the meaning determination unit determines that the plurality of objects have the same meaning, the reliability determination unit associates information about the plurality of objects determined to have the meaning with the meaning. A notification unit for displaying a list in descending order of determination;
ユーザの操作入力を受け付ける操作入力部と、An operation input unit for receiving user operation inputs;
前記操作入力部にて受け付けたユーザの操作入力により選択されたオブジェクトを、該オブジェクトについて前記意味判定部にて判定された意味を有するものとして設定するとともに、前記操作入力部にて受け付けたユーザの操作入力により、オブジェクトの順位を変更する意味設定部と、The object selected by the user's operation input received by the operation input unit is set as having the meaning determined by the meaning determination unit for the object, and the object received by the operation input unit A semantic setting unit for changing the order of objects by operation input;
前記操作入力部によるオブジェクトの選択履歴およびオブジェクトの順位の履歴を取得する履歴情報取得部と、を備え、A history information acquisition unit for acquiring an object selection history and an object ranking history by the operation input unit,
前記通知部は、前記意味判定部にて複数のオブジェクトが同一の意味を有すると判定された場合に、前記履歴情報取得部にて取得されるオブジェクトの選択履歴およびオブジェクトの順位の履歴を反映させてオブジェクトをリスト表示する画像処理システム。The notification unit reflects the object selection history and the object ranking history acquired by the history information acquisition unit when the meaning determination unit determines that the plurality of objects have the same meaning. An image processing system that displays objects as a list.
前記画像データ取得部にて取得される画像データの画像中に含まれるオブジェクトを抽出するオブジェクト抽出部と、An object extraction unit that extracts an object included in an image of the image data acquired by the image data acquisition unit;
所定の判定ルールに基づいて、前記オブジェクト抽出部にて抽出されるオブジェクトの前記画像データのレイアウト中における意味を判定する意味判定部と、A semantic determination unit that determines the meaning of the object extracted by the object extraction unit in the layout of the image data based on a predetermined determination rule;
前記意味判定部にて複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された各オブジェクトの順位を、前記画像データのレイアウトにおける前記各オブジェクトの位置に基づいて判定する信頼度判定部と、When the plurality of objects are determined to have the same meaning by the meaning determination unit, the rank of each object determined to have the meaning is determined based on the position of each object in the layout of the image data. A reliability determination unit for determining;
前記意味判定部にて複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された複数のオブジェクトに関する情報を、該意味に関する情報に関連付けて、前記信頼度判定部にて判定される順位が高い順にリスト表示させる通知部と、When the meaning determination unit determines that the plurality of objects have the same meaning, the reliability determination unit associates information on the plurality of objects determined to have the meaning with the information on the meaning. A notification unit for displaying a list in descending order of determination in
を備える画像処理システム。An image processing system comprising:
前記画像データ取得部にて取得される画像データの画像中に含まれるテキスト情報を抽出する抽出部と、An extraction unit that extracts text information included in an image of the image data acquired by the image data acquisition unit;
所定の判定ルールに基づいて、前記抽出部にて抽出されるテキスト情報中に人名のテキスト情報があるか否かを判定する意味判定部と、Based on a predetermined determination rule, a meaning determination unit that determines whether there is text information of a person name in the text information extracted by the extraction unit;
前記意味判定部が人名と判定したテキスト情報の順位を、前記テキスト情報の近隣に所定の付記文字があるか否か、および付記文字の種類に基づいて判定する信頼度判定部と、 A reliability determination unit that determines, based on the type of additional characters, whether or not there is a predetermined additional character in the vicinity of the text information, and the ranking of the text information determined by the meaning determining unit as a person name;
前記意味判定部にて人名のテキスト情報と判定されたテキスト情報が複数ある場合に、該人名のテキスト情報を、前記信頼度判定部にて判定される順位が高い順にリスト表示させる通知部と、When there are a plurality of text information determined as the text information of the name of the person in the meaning determination section, the notification section that displays the list of the text information of the name of the person in descending order of the order determined by the reliability determination section;
を備えてなる画像処理システム。An image processing system comprising:
前記意味判定部における意味判定処理の信頼度を判定する信頼度判定部を備え、
前記通知部は、前記意味判定部にて複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された複数のオブジェクトを、該意味に関連付けて、前記信頼度判定部にて判定される信頼度が高い順にリスト表示させる画像処理システム。 The image processing system according to claim 1,
A reliability determination unit that determines the reliability of the meaning determination process in the meaning determination unit;
When the meaning determining unit determines that the plurality of objects have the same meaning, the notification unit associates the plurality of objects determined to have the meaning with the meaning, and determines the reliability. An image processing system that causes a list to be displayed in descending order of reliability.
前記操作入力部にて受け付けたユーザの操作入力により選択されたオブジェクトを、該オブジェクトについて前記意味判定部にて判定された意味を有するものとして設定する意味設定部と、
前記操作入力部によるオブジェクトの選択履歴を取得する履歴情報取得部を備え、
前記意味設定部は、前記意味判定部にて複数のオブジェクトが同一の意味を有すると判定された場合に、前記履歴情報取得部にて取得される履歴情報に基づいて、前記通知部によりリスト表示されるオブジェクトの内の過去に選択された頻度が最も高いオブジェクトを、該オブジェクトについて前記意味判定部にて判定された意味を有するものとして設定する画像処理システム。 The image processing system according to claim 3 .
A meaning setting unit that sets the object selected by the user's operation input received by the operation input unit as having the meaning determined by the meaning determination unit for the object;
Includes a history information acquisition unit that acquires the selection history of the object by the operation input unit,
The meaning setting unit displays a list by the notification unit based on history information acquired by the history information acquisition unit when the meaning determination unit determines that a plurality of objects have the same meaning. An image processing system that sets an object having the highest frequency of selection in the past as having the meaning determined by the meaning determination unit for the object.
前記操作入力部によるオブジェクトの選択を行うユーザを識別するための識別情報を取得する識別情報取得部を備え、
前記履歴情報取得部は、前記識別情報取得部にて取得された識別情報に対応するユーザによる前記操作入力部にて受け付けたオブジェクトの選択履歴に関する情報を取得する画像処理システム。 The image processing system according to claim 1, wherein:
An identification information acquisition unit for acquiring identification information for identifying a user who selects an object by the operation input unit ;
The history information acquisition unit is an image processing system that acquires information related to an object selection history received by the operation input unit by a user corresponding to the identification information acquired by the identification information acquisition unit.
前記オブジェクト抽出部にて抽出されるオブジェクトが文字である場合に、当該文字の属性を判定する文字属性判定部と、
前記文字属性判定部により属性が判定された文字を、該文字について判定された属性の文字を入力とすべき所定の処理における入力文字候補として表示させる入力候補表示部と、を備えてなる画像処理システム。 In the image processing system according to any one of claims 1 to 3 ,
A character attribute determination unit that determines an attribute of the character when the object extracted by the object extraction unit is a character;
An input candidate display unit that displays a character whose attribute is determined by the character attribute determination unit as an input character candidate in a predetermined process in which the character having the attribute determined for the character is to be input. system.
前記取得される画像データの画像中に含まれるオブジェクトを抽出し、
所定の判定ルールに基づいて、前記抽出されるオブジェクトの前記画像データのレイアウト中における意味を判定し、
複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された複数のオブジェクトに関する情報を、該意味に関する情報に関連付けてリスト表示し、
ユーザの操作入力を受け付け、
受け付けたユーザの操作入力により選択されたオブジェクトを、該オブジェクトについて判定された意味を有するものとして設定し、
受け付けたオブジェクトの選択履歴を取得し、
複数のオブジェクトが同一の意味を有すると判定された場合に、取得されるオブジェクトの履歴情報に基づいて、リスト表示されるオブジェクトの内の過去に選択された頻度が最も高いオブジェクトを、該オブジェクトについて判定された意味を有するものとして設定する画像処理方法。 Get image data,
Extracting an object contained in the image of the acquired image data;
Based on a predetermined determination rule, determine the meaning of the extracted object in the layout of the image data,
When a plurality of objects are determined to have the same meaning, information related to the plurality of objects determined to have the meaning is displayed in a list in association with the information related to the meaning .
Accept user input,
The object selected by the received user operation input is set as having the determined meaning for the object,
Get selection history of accepted objects ,
When it is determined that a plurality of objects have the same meaning, an object with the highest frequency selected in the past among the objects displayed in the list is selected for the object based on the history information of the acquired object. An image processing method set as having a determined meaning .
前記取得される画像データの画像中に含まれるオブジェクトを抽出し、Extracting an object contained in the image of the acquired image data;
所定の判定ルールに基づいて、前記抽出されるオブジェクトの前記画像データのレイアウト中における意味を判定し、Based on a predetermined determination rule, determine the meaning of the extracted object in the layout of the image data,
複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された各オブジェクトの順位を判定し、When it is determined that a plurality of objects have the same meaning, the order of each object determined to have the meaning is determined,
複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された複数のオブジェクトに関する情報を、該意味に関連付けて、判定された順位が高い順にリスト表示し、When it is determined that a plurality of objects have the same meaning, information on the plurality of objects determined to have the meaning is associated with the meaning and displayed in a list in descending order of the determined order.
ユーザの操作入力を受け付け、Accept user input,
受け付けたユーザの操作入力により選択されたオブジェクトを、該オブジェクトについて判定された意味を有するものとして設定するとともに、受け付けたユーザの操作入力により、オブジェクトの順位を変更し、The object selected by the received user operation input is set as having the determined meaning for the object, and the order of the objects is changed by the received user operation input,
オブジェクトの選択履歴およびオブジェクトの順位の履歴を取得し、Get object selection history and object ranking history,
複数のオブジェクトが同一の意味を有すると判定された場合に、取得されるオブジェクトの選択履歴およびオブジェクトの順位の履歴を反映させてオブジェクトをリスト表示する画像処理方法。An image processing method for displaying an object in a list by reflecting an acquired object selection history and an object ranking history when a plurality of objects are determined to have the same meaning.
前記取得される画像データの画像中に含まれるオブジェクトを抽出し、Extracting an object contained in the image of the acquired image data;
所定の判定ルールに基づいて、前記抽出されるオブジェクトの前記画像データのレイアウト中における意味を判定し、Based on a predetermined determination rule, determine the meaning of the extracted object in the layout of the image data,
複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された各オブジェクトの順位を、前記画像データのレイアウトにおける前記各オブジェクトの位置に基づいて判定し、When it is determined that a plurality of objects have the same meaning, the order of each object determined to have the meaning is determined based on the position of each object in the layout of the image data,
複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された複数のオブジェクトに関する情報を、該意味に関する情報に関連付けて、判定された順位が高い順にリスト表示する画像処理方法。When it is determined that a plurality of objects have the same meaning, information relating to the plurality of objects determined to have the meaning is associated with the information related to the meaning and displayed as a list in descending order of the determined order. Processing method.
前記取得される画像データの画像中に含まれるオブジェクトを抽出し、
所定の判定ルールに基づいて、前記抽出されるオブジェクトの前記画像データのレイアウト中における意味を判定し、
複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された複数のオブジェクトに関する情報を、該意味に関する情報に関連付けてリスト表示し、
ユーザの操作入力により選択されたオブジェクトを、該オブジェクトについて判定された意味を有するものとして設定し、
ユーザの操作入力により選択されたオブジェクトの選択履歴を取得し、
複数のオブジェクトが同一の意味を有すると判定された場合に、取得されるオブジェクトの履歴情報に基づいて、リスト表示されるオブジェクトの内の過去に選択された頻度が最も高いオブジェクトを、該オブジェクトについて判定された意味を有するものとして設定する
処理をコンピュータに実行させる画像処理プログラム。 Get image data,
Extracting an object contained in the image of the acquired image data;
Based on a predetermined determination rule, determine the meaning of the extracted object in the layout of the image data,
When a plurality of objects are determined to have the same meaning, information related to the plurality of objects determined to have the meaning is displayed in a list in association with the information related to the meaning .
The object selected by the user's operation input is set as having the determined meaning for the object,
Get selection history of objects selected by user operation input ,
When it is determined that a plurality of objects have the same meaning, an object with the highest frequency selected in the past among the objects displayed in the list is selected for the object based on the history information of the acquired object. An image processing program for causing a computer to execute a process of setting as having a determined meaning .
前記取得される画像データの画像中に含まれるオブジェクトを抽出し、Extracting an object contained in the image of the acquired image data;
所定の判定ルールに基づいて、前記抽出されるオブジェクトの前記画像データのレイアウト中における意味を判定し、Based on a predetermined determination rule, determine the meaning of the extracted object in the layout of the image data,
複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された各オブジェクトの順位を判定し、When it is determined that a plurality of objects have the same meaning, the order of each object determined to have the meaning is determined,
複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された複数のオブジェクトに関する情報を、該意味に関連付けて、判定された順位が高い順にリスト表示し、When it is determined that a plurality of objects have the same meaning, information on the plurality of objects determined to have the meaning is associated with the meaning and displayed in a list in descending order of the determined order.
ユーザの操作入力により選択されたオブジェクトを、該オブジェクトについて判定された意味を有するものとして設定するとともに、受け付けたユーザの操作入力により、オブジェクトの順位を変更し、The object selected by the user's operation input is set as having the determined meaning for the object, and the order of the objects is changed by the received user operation input,
オブジェクトの選択履歴およびオブジェクトの順位の履歴を取得し、Get object selection history and object ranking history,
複数のオブジェクトが同一の意味を有すると判定された場合に、取得されるオブジェクトの選択履歴およびオブジェクトの順位の履歴を反映させてオブジェクトをリスト表示するWhen a plurality of objects are determined to have the same meaning, the object selection list and the object order history are reflected to display a list of objects.
処理をコンピュータに実行させる画像処理プログラム。An image processing program that causes a computer to execute processing.
前記取得される画像データの画像中に含まれるオブジェクトを抽出し、Extracting an object contained in the image of the acquired image data;
所定の判定ルールに基づいて、前記抽出されるオブジェクトの前記画像データのレイアウト中における意味を判定し、Based on a predetermined determination rule, determine the meaning of the extracted object in the layout of the image data,
複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された各オブジェクトの順位を、前記画像データのレイアウトにおける前記各オブジェクトの位置に基づいて判定し、When it is determined that a plurality of objects have the same meaning, the order of each object determined to have the meaning is determined based on the position of each object in the layout of the image data,
複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された複数のオブジェクトに関する情報を、該意味に関する情報に関連付けて、判定された順位が高い順にリスト表示するWhen it is determined that a plurality of objects have the same meaning, information on the plurality of objects determined to have the meaning is associated with the information on the meaning and displayed in a list in descending order of the determined order.
処理をコンピュータに実行させる画像処理プログラム。An image processing program that causes a computer to execute processing.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US11/966,330 US8189920B2 (en) | 2007-01-17 | 2007-12-28 | Image processing system, image processing method, and image processing program |
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US88528607P | 2007-01-17 | 2007-01-17 | |
| US60/885,286 | 2007-01-17 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2008176764A JP2008176764A (en) | 2008-07-31 |
| JP4964080B2 true JP4964080B2 (en) | 2012-06-27 |
Family
ID=39703710
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2007257287A Expired - Fee Related JP4964080B2 (en) | 2007-01-17 | 2007-10-01 | Image processing system, image processing method, and image processing program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4964080B2 (en) |
Families Citing this family (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP5720350B2 (en) * | 2011-03-23 | 2015-05-20 | 富士ゼロックス株式会社 | Information processing apparatus, information processing program, and information processing system |
| JP2014013534A (en) * | 2012-07-05 | 2014-01-23 | Ricoh Co Ltd | Document processor, image processor, image processing method and document processing program |
| JP7150967B2 (en) * | 2018-01-23 | 2022-10-11 | キヤノン株式会社 | Apparatus, method, and program for setting information related to scanned images |
| JP7401344B2 (en) * | 2020-01-21 | 2023-12-19 | キヤノン株式会社 | Image processing system for digitizing documents, its control method and program |
| US20240126978A1 (en) * | 2022-10-14 | 2024-04-18 | Google Llc | Determining attributes for elements of displayable content and adding them to an accessibility tree |
| JP7543489B2 (en) * | 2023-02-09 | 2024-09-02 | キヤノン株式会社 | Information processing device, control method thereof, and program |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4565585B2 (en) * | 2000-04-13 | 2010-10-20 | キヤノン株式会社 | Data processing apparatus, data processing method, and recording medium |
| JP3994625B2 (en) * | 2000-05-11 | 2007-10-24 | コニカミノルタビジネステクノロジーズ株式会社 | Image forming apparatus, image forming method, and computer-readable recording medium storing image forming program |
-
2007
- 2007-10-01 JP JP2007257287A patent/JP4964080B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2008176764A (en) | 2008-07-31 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8189920B2 (en) | Image processing system, image processing method, and image processing program | |
| US8107727B2 (en) | Document processing apparatus, document processing method, and computer program product | |
| US11303769B2 (en) | Image processing system that computerizes documents with notification of labeled items, control method thereof, and storage medium | |
| US11836442B2 (en) | Information processing apparatus, method, and storage medium for associating metadata with image data | |
| US20070098263A1 (en) | Data entry apparatus and program therefor | |
| US7610274B2 (en) | Method, apparatus, and program for retrieving data | |
| CN107533648A (en) | Character input acceptance method, character input acceptance apparatus and character input receiving procedure | |
| JP4964080B2 (en) | Image processing system, image processing method, and image processing program | |
| CN103699891B (en) | Image processing apparatus and image processing method | |
| JP2018128996A (en) | Information processing apparatus, control method, and program | |
| JP7532085B2 (en) | Image processing device, image processing method, and program | |
| US20150261735A1 (en) | Document processing system, document processing apparatus, and document processing method | |
| CN111444751B (en) | Information processing apparatus, storage medium, and information processing method | |
| JP2007026316A (en) | Image management apparatus, image management computer program, and recording medium recording the same | |
| JPWO2014170965A1 (en) | Document processing method, document processing apparatus, and document processing program | |
| JP4983464B2 (en) | Form image processing apparatus and form image processing program | |
| JP2014006758A (en) | Preserved document delivery management system and preserved document delivery management method | |
| US10409390B2 (en) | Display device and method for controlling display device | |
| JP2016018454A (en) | Image processing system and controlling method thereof | |
| CN110909723B (en) | Information processing apparatus and computer-readable storage medium | |
| JP2008040753A (en) | Image processing apparatus, method, program, and recording medium | |
| CN113347314B (en) | Information and image processing device, system and recording medium | |
| JP3979288B2 (en) | Document search apparatus and document search program | |
| JP2017204270A (en) | Character string area/character rectangle extraction apparatus, character string area/character rectangle extraction method, and program | |
| EP3287952A1 (en) | Input control program, input control device, input control method, character correction program, character correction device, and character correction method |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20090803 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100301 |
|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20100324 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100402 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110929 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111004 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120306 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120327 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150406 Year of fee payment: 3 |
|
| LAPS | Cancellation because of no payment of annual fees |