Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP4964080B2 - Image processing system, image processing method, and image processing program - Google Patents
[go: Go Back, main page]

JP4964080B2 - Image processing system, image processing method, and image processing program - Google Patents

Image processing system, image processing method, and image processing program Download PDF

Info

Publication number
JP4964080B2
JP4964080B2 JP2007257287A JP2007257287A JP4964080B2 JP 4964080 B2 JP4964080 B2 JP 4964080B2 JP 2007257287 A JP2007257287 A JP 2007257287A JP 2007257287 A JP2007257287 A JP 2007257287A JP 4964080 B2 JP4964080 B2 JP 4964080B2
Authority
JP
Japan
Prior art keywords
meaning
determined
image data
objects
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007257287A
Other languages
Japanese (ja)
Other versions
JP2008176764A (en
Inventor
肇 富沢
彰彦 藤原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Tec Corp
Original Assignee
Toshiba Corp
Toshiba Tec Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Tec Corp filed Critical Toshiba Corp
Priority to US11/966,330 priority Critical patent/US8189920B2/en
Publication of JP2008176764A publication Critical patent/JP2008176764A/en
Application granted granted Critical
Publication of JP4964080B2 publication Critical patent/JP4964080B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)

Description

本発明は、画像データの画像中に含まれるオブジェクトを抽出し、当該抽出されるオブジェクトの当該画像データのレイアウト中における意味付けを行う技術に関するものである。   The present invention relates to a technique for extracting an object included in an image of image data and giving meaning to the extracted object in the layout of the image data.

従来、紙原稿をスキャンして電子データ化し、その電子化されたドキュメント画像情報に対して領域解析を行って文字領域等のオブジェクトを抽出し、OCR処理により文字領域のテキスト情報を取得し、このテキスト情報に基づいて所定の処理を行う画像処理システムが知られる。   Conventionally, a paper document is scanned into electronic data, an area analysis is performed on the digitized document image information to extract an object such as a character area, and text information of the character area is obtained by OCR processing. An image processing system that performs a predetermined process based on text information is known.

上記従来の画像処理システムでは、ある文字領域のレイアウト中における意味(タイトル、ヘッダ、本文の段落など)の抽出、文字領域中のテキスト情報のテキストの属性(“2006/01/25”という文字列は[日付]である、など)の抽出を行っていた(例えば、特許文献1を参照。)。   In the conventional image processing system described above, the meaning (title, header, body paragraph, etc.) in the layout of a certain character area is extracted, and the text attribute of the text information in the character area (character string “2006/01/25”) [Date], etc.) (for example, see Patent Document 1).

また、画像データの画像中から抽出したオブジェクトに対して判定される意味やテキストに対して判定される属性に対して、例えばGUIなどのインタフェースを用いて修正可能とする技術も知られる(例えば、特許文献2を参照。)。
特開平11−250041号公報 特開2001−344562号公報
Further, there is also known a technique that makes it possible to correct the meaning determined for an object extracted from an image of image data and the attribute determined for text using an interface such as a GUI (for example, (See Patent Document 2).
Japanese Patent Laid-Open No. 11-250041 JP 2001-344562 A

上記従来の画像処理システムでは、画像中に含まれるオブジェクトに対して最終的に判定された単一の意味のみをユーザに通知可能としている。よって、ユーザは、上記画像処理システムにて自動的に行われた意味判定処理が妥当なものであるか否かを、最終的に判定された単一の意味のみに基づいて判断しなければならなかった。   In the above conventional image processing system, only a single meaning finally determined for an object included in an image can be notified to the user. Therefore, the user must determine whether or not the semantic determination process automatically performed by the image processing system is appropriate based only on the finally determined single meaning. There wasn't.

また、画像中に含まれるオブジェクトに対して自動的に行われた意味判定の結果を修正したいような場合(例えば、ある意味が判定されたオブジェクトが適切でない場合に、適切なオブジェクトに変更する等)においても、ユーザは、自己が適切と考える修正候補を自分で判断しなければならず、操作の負担となっていた。   In addition, when it is desired to correct the result of the semantic determination automatically performed on an object included in the image (for example, when an object whose meaning is determined is not appropriate, it is changed to an appropriate object, etc.) ), The user has to determine a correction candidate that he / she thinks appropriate, which is a burden of operation.

本発明は上述した問題点を解決するためになされたものであり、画像中に含まれるオブジェクトに対して行われる意味判定処理の処理結果の管理を行う場合における、操作負担の軽減に寄与することができる技術を提供することを目的とする。   The present invention has been made to solve the above-described problems, and contributes to reducing the operation burden when managing the processing results of the semantic determination processing performed on the objects included in the image. It aims at providing the technology that can do.

上述した課題を解決するため、本発明の一態様に係る画像処理システムは、画像データを取得する画像データ取得部と、前記画像データ取得部にて取得される画像データの画像中に含まれるオブジェクトを抽出するオブジェクト抽出部と、所定の判定ルールに基づいて、前記オブジェクト抽出部にて抽出されるオブジェクトの前記画像データのレイアウト中における意味を判定する意味判定部と、前記意味判定部にて複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された複数のオブジェクトに関する情報を、該意味に関する情報に関連付けてリスト表示させる通知部と、ユーザの操作入力を受け付ける操作入力部と、前記操作入力部にて受け付けたユーザの操作入力により選択されたオブジェクトを、該オブジェクトについて前記意味判定部にて判定された意味を有するものとして設定する意味設定部と、前記操作入力部によるオブジェクトの選択履歴を取得する履歴情報取得部と、を備え、前記意味設定部は、前記意味判定部にて複数のオブジェクトが同一の意味を有すると判定された場合に、前記履歴情報取得部にて取得される履歴情報に基づいて、前記通知部によりリスト表示されるオブジェクトの内の過去に選択された頻度が最も高いオブジェクトを、該オブジェクトについて前記意味判定部にて判定された意味を有するものとして設定することを特徴とするものである。
In order to solve the above-described problem, an image processing system according to an aspect of the present invention includes an image data acquisition unit that acquires image data, and an object included in an image of the image data acquired by the image data acquisition unit. An object extracting unit for extracting the object, a meaning determining unit for determining the meaning of the object extracted by the object extracting unit in the layout of the image data based on a predetermined determination rule, and a plurality of the meaning determining unit When it is determined that the objects have the same meaning, a notification unit that displays a list of information related to the plurality of objects determined to have the meaning in association with the information related to the meaning, and accepts a user operation input An operation input unit and an object selected by a user operation input received by the operation input unit, It includes a meaning setting unit that sets as having a meaning that is determined by the meaning determining part for an object, and a history information acquisition unit that acquires the selection history of the object by the operation input unit, the means setting section, When it is determined that the plurality of objects have the same meaning in the meaning determination unit, based on the history information acquired by the history information acquisition unit, of the objects displayed as a list by the notification unit The object having the highest frequency selected in the past is set as having the meaning determined by the meaning determination unit for the object .

また、本発明の一態様に係る画像処理方法は、画像データを取得し、前記取得される画像データの画像中に含まれるオブジェクトを抽出し、所定の判定ルールに基づいて、前記抽出されるオブジェクトの前記画像データのレイアウト中における意味を判定し、複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された複数のオブジェクトに関する情報を、該意味に関する情報に関連付けてリスト表示し、ユーザの操作入力を受け付け、受け付けたユーザの操作入力により選択されたオブジェクトを、該オブジェクトについて判定された意味を有するものとして設定し、受け付けたオブジェクトの選択履歴を取得し、複数のオブジェクトが同一の意味を有すると判定された場合に、取得されるオブジェクトの履歴情報に基づいて、リスト表示されるオブジェクトの内の過去に選択された頻度が最も高いオブジェクトを、該オブジェクトについて判定された意味を有するものとして設定することを特徴とすることができる。
The image processing method according to one aspect of the present invention acquires image data, extracts an object included in an image of the acquired image data, and extracts the extracted object based on a predetermined determination rule. When the meaning of the image data in the layout is determined and it is determined that the plurality of objects have the same meaning, the information on the plurality of objects determined to have the meaning is associated with the information on the meaning Display the list, accept the user's operation input, set the object selected by the accepted user's operation input as having the determined meaning for the object, obtain the selection history of the accepted object, If it is determined that the objects have the same meaning, Based on the gravel information, the highest object is selected frequencies in the past of the objects to be listed, it may be characterized by setting as having a meaning that is determined for the object.

また、本発明の一態様に係る画像処理プログラムは、画像データを取得し、前記取得される画像データの画像中に含まれるオブジェクトを抽出し、所定の判定ルールに基づいて、前記抽出されるオブジェクトの前記画像データのレイアウト中における意味を判定し、複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された複数のオブジェクトに関する情報を、該意味に関する情報に関連付けてリスト表示し、ユーザの操作入力により選択されたオブジェクトを、該オブジェクトについて判定された意味を有するものとして設定し、ユーザの操作入力により選択されたオブジェクトの選択履歴を取得し複数のオブジェクトが同一の意味を有すると判定された場合に、取得されるオブジェクトの履歴情報に基づいて、リスト表示されるオブジェクトの内の過去に選択された頻度が最も高いオブジェクトを、該オブジェクトについて判定された意味を有するものとして設定する処理をコンピュータに実行させることを特徴とすることができる。 An image processing program according to an aspect of the present invention acquires image data, extracts an object included in an image of the acquired image data, and extracts the extracted object based on a predetermined determination rule. When the meaning of the image data in the layout is determined and it is determined that the plurality of objects have the same meaning, the information on the plurality of objects determined to have the meaning is associated with the information on the meaning Display the list, set the object selected by the user's operation input as having the meaning determined for the object, obtain the selection history of the object selected by the user's operation input , a plurality of objects When it is determined that they have the same meaning, the history information of the acquired object Zui, it is possible, characterized in that the highest object selected frequency in the past of the objects to be listed, to execute processing of setting as having a meaning that is determined for the object in the computer .

以上に詳述したように本発明によれば、画像中に含まれるオブジェクトに対して行われる意味判定処理の処理結果の管理を行う場合における、操作負担の軽減に寄与することができる技術を提供することができる。   As described above in detail, according to the present invention, there is provided a technique capable of contributing to the reduction of the operation burden when managing the processing result of the semantic determination process performed on the object included in the image. can do.

以下、本発明の実施の形態について図面を参照しつつ説明する。   Embodiments of the present invention will be described below with reference to the drawings.

(第1の実施の形態)
まず、本発明の第1の実施の形態について説明する。
(First embodiment)
First, a first embodiment of the present invention will be described.

図1は、本発明の第1の実施の形態による画像処理システムS1について説明するための機能ブロック図である。   FIG. 1 is a functional block diagram for explaining an image processing system S1 according to the first embodiment of the present invention.

本実施の形態による画像処理システムS1は、画像データ取得部101、ドキュメント領域解析モジュール102、領域意味解析モジュール104、領域意味提示モジュール108、領域意味設定モジュール110、表示部111、操作入力部112、文字認識モジュール113、意味情報保管モジュール114、テキスト意味解析モジュール115、CPU801およびメモリ802を備えてなる構成となっている。画像処理システムS1は、例えば、これらの構成を備えたMFP(Multi Function Peripheral)により実現することができる。   The image processing system S1 according to the present embodiment includes an image data acquisition unit 101, a document region analysis module 102, a region meaning analysis module 104, a region meaning presentation module 108, a region meaning setting module 110, a display unit 111, an operation input unit 112, A character recognition module 113, a semantic information storage module 114, a text semantic analysis module 115, a CPU 801, and a memory 802 are provided. The image processing system S1 can be realized by, for example, an MFP (Multi Function Peripheral) having these configurations.

画像データ取得部101は、画像処理システムS1における処理対象となる画像データを取得する。以下、一例として、原稿からスキャンして得られる画像データを取得する場合を例に挙げるが、これに限られるものではなく、結果として電子化された画像データであれば画像データ取得部101におけるデータ取得の対象となる。また、   The image data acquisition unit 101 acquires image data to be processed in the image processing system S1. Hereinafter, as an example, a case where image data obtained by scanning from a document is acquired will be described as an example. However, the present invention is not limited thereto, and as a result, if the image data is digitized, data in the image data acquisition unit 101 is used. It becomes the object of acquisition. Also,

ドキュメント領域解析モジュール(オブジェクト抽出部に相当)102は、画像データ取得部101にて取得される画像データの画像中に含まれるオブジェクトを抽出する。具体的には、ドキュメント領域解析モジュール102は、例えば、画像データの画像中における、文字列を囲む矩形領域の位置とサイズ(あるいは、矩形領域の左上の位置座標、および右下の位置座標)の解析を行い、画像データの画像中に含まれる文字領域等のオブジェクトを抽出する。   A document area analysis module (corresponding to an object extraction unit) 102 extracts an object included in an image of image data acquired by the image data acquisition unit 101. Specifically, the document area analysis module 102 has, for example, the position and size of the rectangular area surrounding the character string in the image of the image data (or the upper left position coordinates and the lower right position coordinates of the rectangular area). Analysis is performed, and an object such as a character area included in the image of the image data is extracted.

領域意味解析モジュール(意味判定部に相当)104は、例えばメモリ802等の記憶領域に格納されている所定の判定ルールに基づいて、オブジェクト抽出部102にて抽出されるオブジェクトの画像データのレイアウト中における意味(例えば、「タイトル」、「ヘッダ」、「フッタ」、「段落」等)を解析(判定)する。領域意味解析モジュール104における解析結果(各オブジェクトの意味)は、各オブジェクトに対応づけられて意味情報保管モジュール114に格納される。   An area semantic analysis module (equivalent to a semantic determination unit) 104 is in the process of laying out image data of an object extracted by the object extraction unit 102 based on a predetermined determination rule stored in a storage area such as the memory 802, for example. Is analyzed (determined) (for example, “title”, “header”, “footer”, “paragraph”, etc.). The analysis result (meaning of each object) in the area semantic analysis module 104 is stored in the semantic information storage module 114 in association with each object.

領域意味提示モジュール(通知部に相当)108は、意味情報保管モジュール114に格納されている各種情報に基づいて、領域意味解析モジュール104にて複数のオブジェクトが同一の意味を有すると判定された場合(例えば、複数のオブジェクトが「タイトル」であると判定された場合等)に、該意味を有すると判定された複数のオブジェクトに関する情報を、該意味に関する情報に関連付けて表示部111にてリスト表示させる。これにより、ユーザは、画像中に含まれるオブジェクトが、どのような意味を有するものとして判定されているか(解析結果)を容易に把握することができる。   When the area meaning presenting module (corresponding to the notification unit) 108 determines that a plurality of objects have the same meaning in the area meaning analyzing module 104 based on various types of information stored in the semantic information storage module 114. (For example, when it is determined that a plurality of objects are “titles”), information on the plurality of objects determined to have the meaning is displayed as a list on the display unit 111 in association with the information on the meaning Let Accordingly, the user can easily grasp what meaning (analysis result) the object included in the image is determined to have.

領域意味設定モジュール(候補選択部および意味設定部に相当)110は、ユーザの操作入力部112への操作入力に基づいて、領域意味提示モジュール108からの命令により表示部111にてリスト表示させるオブジェクトの内のいずれかを選択する。そして、領域意味設定モジュール110は、上述のようにして選択されたオブジェクトを、該オブジェクトについて領域意味解析モジュール104にて判定された意味を有するものとして設定する。   The area meaning setting module (corresponding to the candidate selection section and the meaning setting section) 110 is an object that is displayed in a list on the display section 111 in accordance with a command from the area meaning presentation module 108 based on an operation input to the operation input section 112 by the user. Select one of. Then, the area meaning setting module 110 sets the object selected as described above as having the meaning determined by the area meaning analysis module 104 for the object.

表示部111は、例えば液晶ディスプレイやCRTディスプレイから構成されており、画像処理システムS1における処理結果等を画面表示する役割を有している。表示部111は、具体的には、例えば、MFPのコントロールパネルのGUI画面や、PCのGUI画面などにより実現することができる。   The display unit 111 includes, for example, a liquid crystal display or a CRT display, and has a role of displaying a processing result or the like in the image processing system S1 on the screen. Specifically, the display unit 111 can be realized by a GUI screen of an MFP control panel, a GUI screen of a PC, or the like.

操作入力部112は、例えば、キーボードやマウス等から構成されており、ユーザの操作入力を受け付ける役割を有している。もちろん、表示部111および操作入力部112の機能を例えばタッチパネルディスプレイ等によって一体的に実現してもよい。   The operation input unit 112 includes, for example, a keyboard, a mouse, and the like, and has a role of receiving user operation inputs. Of course, the functions of the display unit 111 and the operation input unit 112 may be integrally realized by, for example, a touch panel display.

文字認識モジュール113は、画像データの画像中に含まれる文字画像から文字をテキスト情報として認識する機能を有している。   The character recognition module 113 has a function of recognizing characters as text information from a character image included in the image data image.

意味情報保管モジュール114は、例えばHDD等の記憶装置から構成されており、ドキュメント領域解析モジュール102、領域意味解析モジュール104および文字認識モジュール113における処理結果を統合して保管する役割を有している。また、以下説明する他の保管モジュールも同様にHDD等の記憶装置から構成されており、データベースとしての役割を有しているものとする。   The semantic information storage module 114 is composed of a storage device such as an HDD, and has a role of integrating and storing the processing results in the document area analysis module 102, the area meaning analysis module 104, and the character recognition module 113. . In addition, the other storage modules described below are similarly configured from a storage device such as an HDD, and have a role as a database.

テキスト意味解析モジュール115は、ドキュメント領域解析モジュール102にて抽出された文字領域の中の文字あるいは文字列に対し、文字認識モジュール113にて求めたテキスト情報を基にして、その文字あるいは文字列のテキスト意味(すなわち、「日付」、「社名」、「人名」などの属性)を解析する。   The text semantic analysis module 115 determines the character or character string based on the text information obtained by the character recognition module 113 for the character or character string in the character area extracted by the document area analysis module 102. The text meaning (that is, attributes such as “date”, “company name”, “person name”) is analyzed.

具体的に、テキスト意味解析モジュール115では、画像中から抽出されたある文字領域のテキスト情報に含まれている「2006/01/25」という文字列の属性は「日付」であるというように解析を行う。   Specifically, the text semantic analysis module 115 analyzes that the attribute of the character string “2006/01/25” included in the text information of a certain character region extracted from the image is “date”. I do.

CPU801は、本実施の形態による画像処理システムにおける各種処理を行う役割を有しており、またメモリ802に格納されているプログラムを実行することにより種々の機能を実現する役割も有している。メモリ802は、例えばROMやRAM等から構成されており、画像処理システムにおいて利用される種々の情報やプログラムを格納する役割を有している。   The CPU 801 has a role of performing various processes in the image processing system according to the present embodiment, and also has a role of realizing various functions by executing a program stored in the memory 802. The memory 802 includes, for example, a ROM, a RAM, and the like, and has a role of storing various information and programs used in the image processing system.

以下、本実施の形態による画像処理システムS1による処理の詳細について説明する。ここでは、一例として、図2に示すようなドキュメントをスキャンして得られる画像データに対して所定の処理を行う場合について説明する。図3は、本発明の第1の実施の形態における処理の流れについて説明するための図である。   Details of the processing by the image processing system S1 according to this embodiment will be described below. Here, as an example, a case where a predetermined process is performed on image data obtained by scanning a document as shown in FIG. 2 will be described. FIG. 3 is a diagram for explaining the flow of processing in the first embodiment of the present invention.

まず、ドキュメント領域解析モジュール102は、図2に示すようなレイアウトで文字列等のオブジェクトが配置されているドキュメント画像における「2006/01/25」という文字領域や、「申し込み案内」といった文字領域を、それぞれ文字領域1、文字領域2として抽出する。   First, the document area analysis module 102 creates a character area such as “2006/01/25” or a character area such as “application guidance” in a document image in which objects such as character strings are arranged in the layout shown in FIG. Are extracted as character area 1 and character area 2, respectively.

具体的に、ドキュメント領域解析モジュール102は、例えば文字領域のようなオブジェクトを抽出する場合、ドキュメント画像の左上を座標の原点として、文字領域1が座標(80,10)から座標(120、20)の矩形領域であると認識する、といった処理を行う。なお、ドキュメント領域解析モジュール102による画像中からのオブジェクトの抽出処理は、そのオブジェクトがドキュメント画像中においてどのような位置にあるかを特定することができればよい。例えば、「文字領域1を包囲する矩形領域の左上の座標が(80,10)であり、矩形の幅が40、高さが10である」といった表現方法を採用することもできる。   Specifically, when extracting an object such as a character area, for example, the document area analysis module 102 uses the upper left corner of the document image as the origin of coordinates, and the character area 1 is changed from coordinates (80, 10) to coordinates (120, 20). The process of recognizing the rectangular area is performed. Note that the object extraction process from the image by the document area analysis module 102 only needs to be able to specify the position of the object in the document image. For example, an expression method such as “the upper left coordinate of the rectangular area surrounding the character area 1 is (80, 10), the rectangular width is 40, and the height is 10” may be employed.

次に、領域意味解析モジュール104によって、ドキュメント領域解析モジュール102により抽出された文字領域の意味を解析する。   Next, the meaning of the character area extracted by the document area analysis module 102 is analyzed by the area meaning analysis module 104.

例えば、領域意味解析モジュール104は、文字領域1は「ヘッダ」であり、文字領域2は処理対象となっているドキュメント画像における「タイトル」であるといった解析を行う。   For example, the area semantic analysis module 104 performs analysis such that the character area 1 is a “header” and the character area 2 is a “title” in the document image to be processed.

次に、文字認識モジュール113によって、ドキュメント領域解析モジュール102にて抽出された文字領域の画像を解析し、テキスト情報を取得する。例えば、文字認識モジュール113は、文字領域1のテキスト情報は「2006/01/25」であるといった解析を行う。   Next, the character recognition module 113 analyzes the image of the character area extracted by the document area analysis module 102 and acquires text information. For example, the character recognition module 113 analyzes that the text information of the character area 1 is “2006/01/25”.

上述のようにして、ドキュメント領域解析モジュール102、領域意味解析モジュール104および文字認識モジュール113により取得される各種情報および解析結果は、意味情報保管モジュール114にて保管される。   As described above, various information and analysis results acquired by the document area analysis module 102, the area meaning analysis module 104, and the character recognition module 113 are stored in the semantic information storage module 114.

ここで、図3で示されるように、文字領域を包囲する矩形領域の位置、領域の意味、テキスト情報の他に、テキスト意味解析モジュール115にて、当該テキスト情報内の文字列からテキスト意味を抽出可能である場合、その文字列の矩形領域の位置、その文字列のテキスト意味およびその文字列のテキスト情報が保持される。なお、意味情報保管モジュール114は、1つの文字領域に含まれるいくつかの文字列が、それぞれ個別にテキスト意味を持っているならば、それらの情報をすべて保持することができる。図4は、意味情報保管モジュール114にて統合的に保管される各種情報それぞれの関わり合いを示す図である。   Here, as shown in FIG. 3, in addition to the position of the rectangular area surrounding the character area, the meaning of the area, and the text information, the text semantic analysis module 115 obtains the text meaning from the character string in the text information. If extraction is possible, the position of the rectangular area of the character string, the text meaning of the character string, and the text information of the character string are retained. Note that the semantic information storage module 114 can retain all pieces of information as long as several character strings included in one character area have text meanings individually. FIG. 4 is a diagram showing the relationship between various pieces of information stored in an integrated manner in the semantic information storage module 114.

このようにすることで、ユーザは、ある意味を有するオブジェクトの設定を、リスト表示されるオブジェクトの中から選択することにより行うことができ、オブジェクトの修正候補の入力負担を大幅に軽減することができる。   In this way, the user can set an object having a certain meaning by selecting from among the objects displayed in the list, which can greatly reduce the burden of inputting correction candidates for the object. it can.

また、画像中のオブジェクトへの意味付けの仕方の修正を、あらかじめ所定のアルゴリズムによる意味判定処理を経て行う構成とすることにより、既存の意味判定処理を実行させるためのプログラムに大幅な変更を加えることなく、オブジェクトへの意味付けに対して柔軟な変更を加えることができる。   In addition, by modifying the meaning of an object in an image through a semantic determination process using a predetermined algorithm in advance, a significant change is made to a program for executing an existing semantic determination process. Without any changes, it is possible to make flexible changes to the meaning of objects.

(第2の実施の形態)
次に、本発明の第2の実施の形態について説明する。
(Second Embodiment)
Next, a second embodiment of the present invention will be described.

図5は、本発明の第2の実施の形態による画像処理システムS2について説明するための機能ブロック図である。   FIG. 5 is a functional block diagram for explaining an image processing system S2 according to the second embodiment of the present invention.

本実施の形態は、上述の第1の実施の形態の変形例である。以下、すでに第1の実施の形態にて説明した部分と同様な機能を有する部分には同一符号を付し、説明は割愛する。本実施の形態と第1の実施の形態とは、表示部111におけるオブジェクトと意味の関連付けの表示方法が異なっている。   The present embodiment is a modification of the above-described first embodiment. Hereinafter, parts having the same functions as those already described in the first embodiment are denoted by the same reference numerals, and description thereof is omitted. The present embodiment and the first embodiment are different in the display method of the association between the object and the meaning on the display unit 111.

本実施の形態による画像処理システムS2は、第1の実施の形態による画像処理システムS1に加え、領域意味属性保管モジュール116、領域意味属性提示モジュール117および領域意味属性設定モジュール118を備えている。また、本実施の形態における領域意味解析モジュール104は、第1の実施の形態にて示した機能に加え、領域意味解析モジュール104にて行うオブジェクトの意味解析処理(意味判定処理)の確からしさ(信頼度)を判定する機能(信頼度判定部の機能に相当)を有している。   The image processing system S2 according to this embodiment includes an area meaning attribute storage module 116, an area meaning attribute presentation module 117, and an area meaning attribute setting module 118 in addition to the image processing system S1 according to the first embodiment. In addition to the functions shown in the first embodiment, the area semantic analysis module 104 according to the present embodiment has a certainty of object semantic analysis processing (semantic determination processing) performed by the region semantic analysis module 104 ( (Reliability) determination function (corresponding to the function of the reliability determination unit).

領域意味属性保管モジュール116は、領域意味解析モジュール104にて実行される領域意味判定処理の結果の信頼度等の属性情報を取得し、その情報を保管する役割を有している。   The area semantic attribute storage module 116 has a role of acquiring attribute information such as reliability of the result of the area meaning determination process executed by the area semantic analysis module 104 and storing the information.

領域意味属性提示モジュール117は、領域意味属性保管モジュール116にて保管されている属性の値に応じて、意味情報保管モジュール114で保管されている情報を提示する。よって、本実施の形態では、領域意味提示モジュール108および領域意味属性提示モジュール117が、通知部に相当する機能を有している。   The area semantic attribute presentation module 117 presents information stored in the semantic information storage module 114 in accordance with the attribute value stored in the area semantic attribute storage module 116. Therefore, in this embodiment, the area meaning presentation module 108 and the area meaning attribute presentation module 117 have a function corresponding to a notification unit.

本実施の形態における領域意味提示モジュール108および領域意味属性提示モジュール117は、互いに協働して、領域意味解析モジュール104にて複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された複数のオブジェクトを、該意味に関連付けて、領域意味解析モジュール104にて判定される信頼度が高い順に表示部111にてリスト表示させる。   The area meaning presentation module 108 and the area meaning attribute presentation module 117 in the present embodiment cooperate with each other, and when the area meaning analysis module 104 determines that a plurality of objects have the same meaning, the meaning A plurality of objects that are determined to have, are associated with the meaning and displayed in a list on the display unit 111 in descending order of reliability determined by the area semantic analysis module 104.

領域意味属性設定モジュール118は、領域意味属性保管モジュール116にて保管されている属性の値を手動で設定する手段をユーザに与える。よって、本実施の形態では、領域意味設定モジュール110および領域意味属性設定モジュール118が、候補選択部および意味設定部に相当する機能を有している。   The area semantic attribute setting module 118 gives the user a means for manually setting the value of the attribute stored in the area semantic attribute storage module 116. Therefore, in this embodiment, the region meaning setting module 110 and the region meaning attribute setting module 118 have functions corresponding to a candidate selection unit and a meaning setting unit.

以下、本実施の形態による画像処理システムS2における処理の詳細について説明する。   Details of processing in the image processing system S2 according to the present embodiment will be described below.

ここでは、画像処理システムS2における処理対象となるドキュメントの画像データから、領域意味が「タイトル」である文字領域のテキスト情報を抽出し、当該テキスト情報に基づいて、上記処理対象であるドキュメントの画像データを所定の記憶装置に保存する際のファイル名を生成する処理について説明する。   Here, text information of a character area whose area meaning is “title” is extracted from image data of a document to be processed in the image processing system S2, and the image of the document to be processed is based on the text information. Processing for generating a file name when saving data in a predetermined storage device will be described.

例えば、図2に示したようなドキュメントの画像データが処理対象データとして画像処理システムS2に入力される場合、「タイトル」として抽出されたテキスト情報(例えば、「申し込み案内」や「提出先」といった文字列など)から、「申し込み案内−提出先.pdf」といったファイル名を生成し、ユーザに提示する。そして、ユーザが上述のようにして生成されたファイル名に対する確認を促し、ユーザにより修正が加えられた場合、当該修正されたファイル名を画像データファイルに付与して保存する。図6は、本発明の第2の実施の形態における処理の流れについて説明するためのフローチャートである。   For example, when image data of a document as shown in FIG. 2 is input to the image processing system S2 as processing target data, text information extracted as “title” (for example, “application guide”, “submission destination”, etc.) A file name such as “application guide-submission destination.pdf” is generated from a character string or the like and presented to the user. Then, the user prompts for confirmation on the file name generated as described above, and when the correction is made by the user, the corrected file name is assigned to the image data file and stored. FIG. 6 is a flowchart for explaining the flow of processing in the second embodiment of the present invention.

まず、画像データ取得部101にて、ドキュメント処理システムS2における処理対象となるドキュメントの画像データを取得する(S101)。   First, the image data acquisition unit 101 acquires image data of a document to be processed in the document processing system S2 (S101).

次に、ドキュメント領域解析モジュール102により、ドキュメント画像中の文字領域を解析し、文字領域を囲む矩形の座標(位置とサイズなど)を取得する。ドキュメント領域解析モジュール102にて取得される情報は、意味情報保管モジュール114に通知され、保管される(S102)。   Next, the document area analysis module 102 analyzes a character area in the document image, and acquires rectangular coordinates (position and size, etc.) surrounding the character area. Information acquired by the document area analysis module 102 is notified to the semantic information storage module 114 and stored (S102).

次に、領域意味解析モジュール104により、例えばメモリ802等の記憶領域に格納されている所定の判定ルールに基づいて、ドキュメント領域解析モジュール102にて抽出された文字領域の領域意味(抽出されるオブジェクトの当該画像データのレイアウト中における意味)を解析する。また、領域意味解析モジュール104は、上記画像データ中に含まれるオブジェクトの意味判定処理と共に、当該意味判定処理の信頼度の判定も行う。   Next, the area meaning of the character area extracted by the document area analysis module 102 (extracted object) based on a predetermined determination rule stored in a storage area such as the memory 802 by the area semantic analysis module 104, for example. Of the image data in the layout). The area semantic analysis module 104 also determines the reliability of the semantic determination process as well as the semantic determination process of the object included in the image data.

具体的に、領域意味解析モジュール104における意味判定処理の信頼度(確からしさ)の判定処理は、例えば、意味が「タイトル」である文字領域の判定では、ある文字領域がドキュメントのレイアウト中における上側寄りに位置している場合は10点、文字領域が大きい場合には20点というような得点付けを行ない、この得点付けの結果得られる合計点を意味判定処理の確からしさの指標とする。上記得点付けの結果得られる合計点は、意味情報保管モジュール114に格納される。   Specifically, the determination process of the reliability (probability) of the meaning determination process in the area semantic analysis module 104 is, for example, a determination of a character area whose meaning is “title”. A score of 10 points is assigned when the character area is close, and 20 points are assigned when the character area is large, and the total score obtained as a result of the scoring is used as an index of the certainty of the meaning determination process. The total score obtained as a result of the above scoring is stored in the semantic information storage module 114.

このようにして領域意味解析モジュール104にて取得された領域意味の情報は、意味情報保管モジュール114に通知され、保管される。このとき、領域意味解析モジュール104は、解析結果が正解である確からしさ(信頼度)に基づいて、各文字領域の候補順位を得て、この候補順位を属性として領域意味属性保管モジュール116に通知し、保管させる(S103)。   Information on the area meaning acquired by the area semantic analysis module 104 in this way is notified to the semantic information storage module 114 and stored. At this time, the area semantic analysis module 104 obtains the candidate rank of each character area based on the probability (reliability) that the analysis result is correct, and notifies the area semantic attribute storage module 116 of this candidate rank as an attribute. And store it (S103).

図2に例示したドキュメントの画像データについて、領域意味解析モジュール104は、例えば「申し込み案内」というテキスト情報を持つ文字領域2と、「提出先」というテキスト情報を持つ文字領域3の領域意味を「タイトル」として解釈した場合、これら解析結果を意味情報保管モジュール114に通知し保管させる。具体的に、領域意味解析モジュール104は、領域意味を解析する際に得られる、文字領域2が最も「タイトル」である可能性が高く、文字領域3が2番目に「タイトル」である可能性が高い、という解析結果の確からしさの順位を、領域意味属性保管モジュール116に通知し、図7に示すようなデータテーブル等の形式で保管させる(S103)。   For the image data of the document illustrated in FIG. 2, the area semantic analysis module 104 determines the area meanings of the character area 2 having text information “application guidance” and the character area 3 having text information “submission destination”, for example. When interpreted as “title”, the analysis result is notified to the semantic information storage module 114 and stored. Specifically, the area semantic analysis module 104 has a high possibility that the character area 2 obtained when analyzing the area meaning is the most “title”, and the character area 3 may be the second “title”. The probability ranking of the analysis result that is high is notified to the area meaning attribute storage module 116 and stored in the form of a data table or the like as shown in FIG. 7 (S103).

次に、文字認識モジュール113は、ドキュメント領域解析モジュール102で解析された文字領域のテキスト情報を取得する。文字認識モジュール113にて取得されるテキスト情報は、意味情報保管モジュール114に通知され、保管される(S104)。例えば、文字認識モジュール113は、「申し込み案内」という文字領域2のテキスト情報を取得した場合、当該テキスト情報を意味情報保管モジュール114に通知して保管させる。   Next, the character recognition module 113 acquires text information of the character area analyzed by the document area analysis module 102. The text information acquired by the character recognition module 113 is notified to the semantic information storage module 114 and stored (S104). For example, when the text recognition module 113 acquires the text information of the character area 2 of “application guidance”, the text recognition module 113 notifies the semantic information storage module 114 to store the text information.

次に、領域意味属性提示モジュール117によって、意味情報保管モジュール114にて保管されている文字領域を、領域意味属性保管モジュール116にて保管されている解析結果の確からしさの順に並べ、表示部111にて画面表示させてユーザに提示させる(S105)。このような領域意味属性提示モジュール117による情報の提示は、例えば、図8に示すようなGUI画面上で行われる。   Next, the area semantic attribute presentation module 117 arranges the character areas stored in the semantic information storage module 114 in the order of the probability of the analysis results stored in the area semantic attribute storage module 116, and displays the display unit 111. Is displayed on the screen and presented to the user (S105). Such information presentation by the region meaning attribute presentation module 117 is performed on a GUI screen as shown in FIG. 8, for example.

表示部111に表示されるGUI画面上では、プレビューウィンドウであるウィンドウ201において、入力されたドキュメントの画像に加え、ドキュメント領域解析モジュール102にて抽出された文字領域を囲む矩形が表示される。さらに、領域意味解析モジュール104にて領域意味が「タイトル」であると解析された文字領域を囲む矩形の枠線は、赤色で強調表示されている。リストボックス202には、この「タイトル」と意味をもつと解釈された複数の文字領域のテキスト情報が、領域意味解析モジュール104にて解析された際の確からしさ(信頼度)の順に並べられ、「タイトル」という意味に関連付けてリスト表示されている。具体的に、図8に示す例では、「申し込み案内」という文字領域が1番「タイトル」らしいと解析され、「提出先」という文字領域が2番目に「タイトル」らしいと解析されているため、この順で(信頼度が高い順に)リストボックス202にリスト表示されている。   On the GUI screen displayed on the display unit 111, in the window 201, which is a preview window, a rectangle surrounding the character area extracted by the document area analysis module 102 is displayed in addition to the input document image. Further, the rectangular frame surrounding the character area analyzed by the area semantic analysis module 104 as having the area meaning “title” is highlighted in red. In the list box 202, text information of a plurality of character areas interpreted as having the meaning of “title” is arranged in the order of the probability (reliability) when analyzed by the area semantic analysis module 104. Listed in association with the meaning of “title”. Specifically, in the example shown in FIG. 8, the character area “application guidance” is analyzed to be the first “title”, and the character area “submission destination” is analyzed to be the second “title”. In this order (in descending order of reliability), the list box 202 displays a list.

次に、ユーザに提示されている領域意味が「タイトル」と解析された文字領域のリストの中に、ユーザが判断して「タイトル」ではないと考える候補が存在する場合(S106,Yes)、領域意味設定モジュール110は操作入力部112へのユーザの操作入力に基づいて、当該「タイトル」でない候補をリストから除外する(S107)。   Next, when there is a candidate that the user determines to be not “title” in the list of character areas analyzed as “title” as the area meaning presented to the user (S106, Yes), The area meaning setting module 110 excludes the candidate that is not the “title” from the list based on the user's operation input to the operation input unit 112 (S107).

このとき、リストから削除された文字領域の領域意味は[タイトル]ではないという情報を、意味情報保管モジュール114に通知する。ユーザに操作インタフェースを与え、その操作の結果を意味情報保管モジュール114に通知する機能は、領域意味設定モジュール110により提供される。例えば、図8に示すGUI画面にてリストボックス202に表示されている文字領域のリストから、領域意味が「タイトル」ではないとユーザが判断する候補があった場合、ユーザは、リストボックス202にてその候補の項目を選択し、削除ボタンであるコマンドボタン205を押下することにより、選択した項目をリストから削除することができる。   At this time, the semantic information storage module 114 is notified of information that the area meaning of the character area deleted from the list is not [title]. The area meaning setting module 110 provides a function of giving an operation interface to the user and notifying the semantic information storage module 114 of the operation result. For example, if there is a candidate that the user determines that the area meaning is not “title” from the list of character areas displayed in the list box 202 on the GUI screen shown in FIG. By selecting the candidate item and pressing the command button 205 which is a delete button, the selected item can be deleted from the list.

次に、表示部111にてユーザに提示されている領域意味が「タイトル」らしい順に並べられている文字領域のリストボックス202において、ユーザが判断して、それら文字領域が「タイトル」らしい順に配列されていないと判断した場合(S108,Yes)、領域意味属性設定モジュール118は、操作入力部112へのユーザの操作入力に基づいて、リストにおける文字領域の候補の順位を修正する(S109)。   Next, in the character area list box 202 in which the area meanings presented to the user on the display unit 111 are arranged in the order of “title”, the user determines and arranges the character areas in the order of “title”. If it is determined that it has not been performed (S108, Yes), the area meaning attribute setting module 118 corrects the ranking of the candidate character areas in the list based on the user's operation input to the operation input unit 112 (S109).

このようにして順位が変更されたリストの変更後の文字領域の配列順位([タイトル]らしい順位)に関する情報は、領域意味属性設定モジュール118によって領域意味属性保管モジュール116に通知される。ユーザに操作インタフェースを与え、その操作の結果を領域意味属性保管モジュール116に通知する機能は、領域意味属性設定モジュール118により提供される。   Information relating to the arrangement order of the character areas after the change of the list whose order has been changed in this way (order that seems to be [title]) is notified to the area meaning attribute storage module 116 by the area meaning attribute setting module 118. A function of giving an operation interface to the user and notifying the result of the operation to the area meaning attribute storage module 116 is provided by the area meaning attribute setting module 118.

例えば、図8に示すGUI画面上にてリストボックス202に表示されている「タイトル」と判定された文字領域のリスト中からある項目を選択し、コマンドボタン203を押下すると、選択した項目よりも1つ上位の項目と順位が入れ替わり、コマンドボタン204を押下すると、選択した項目よりも1つ下位の項目と順位が入れ替わる。   For example, when an item is selected from the list of character areas determined as “title” displayed in the list box 202 on the GUI screen shown in FIG. When the command button 204 is pressed when the order of the item one higher is switched, the order is switched with the item one lower than the selected item.

また、コマンドボタン205や、コマンドボタン203および204により編集されたリストボックス202は、コマンドボタン206を押下することにより、最初に提示された状態に戻すことができる。   Further, the command box 205 and the list box 202 edited by the command buttons 203 and 204 can be returned to the initially presented state by pressing the command button 206.

次に、「タイトル」らしい順に並べられている文字領域の順に、そのテキスト情報を“‐”(ハイフン)などで連結し、拡張子などを付与してファイル名を生成する(S110)。図8では、一例として、リストボックス1‐2に表示されている項目の順に、そのテキスト情報を“‐”で連結し、拡張子“.pdf”を付与して生成したファイル名がテキストボックス207に表示されている。   Next, in the order of the character areas arranged in the order of “title”, the text information is connected with “-” (hyphen) or the like, and an extension is given to generate a file name (S110). In FIG. 8, as an example, the file name generated by concatenating the text information with “-” in order of the items displayed in the list box 1-2 and giving the extension “.pdf” is the text box 207. Is displayed.

最後に、処理対象である画像データは、S110で生成されたファイル名を付与されて記憶装置(例えば、メモリ802)に保存される。具体的な動作としては、例えば、コマンドボタン209の保存ボタンを押すと、テキストボックス207に表示されているテキスト情報がファイル名に設定されて画像データが保存される。   Lastly, the image data to be processed is stored in a storage device (for example, the memory 802) with the file name generated in S110. As a specific operation, for example, when the save button of the command button 209 is pressed, the text information displayed in the text box 207 is set as the file name and the image data is saved.

なお、図8に示すGUI画面では、テキストボックス207には「タイトル」として抽出された文字領域のテキスト情報が表示されるが、文字認識モジュール113の認識結果が誤っており、表示されるテキスト情報が誤ったものになってしまう場合もあり得る。このような場合、ユーザは、操作入力部112への操作入力により、テキストボックス207に直接テキストを入力することにより、文字認識モジュール113の誤認識を修正することが可能である。   In the GUI screen shown in FIG. 8, text information of the character area extracted as “title” is displayed in the text box 207, but the recognition result of the character recognition module 113 is incorrect, and the displayed text information is displayed. May become wrong. In such a case, the user can correct misrecognition of the character recognition module 113 by directly inputting the text into the text box 207 by the operation input to the operation input unit 112.

本実施の形態では、領域意味が「タイトル」である文字領域のテキスト情報のみを利用してファイル名を生成しているが、これに限られるものではなく、領域意味が「ヘッダ」である文字領域のテキスト情報をファイル名に利用する等、その他さまざまな領域意味のテキスト情報を利用することが可能である。また、処理対象である画像データに対する所定の処理として、特定の領域意味のテキスト情報に基づいてファイル名を生成する例を示したが、この他、ユーザによる修正が施された領域意味やテキスト情報を、ドキュメントの画像データの検索のキーワードとして利用することもできる。   In the present embodiment, the file name is generated using only the text information of the character area whose area meaning is “title”. However, the present invention is not limited to this, and the character whose area meaning is “header”. It is possible to use text information of various other meanings, such as using text information of a region as a file name. In addition, as an example of a predetermined process for image data to be processed, a file name is generated based on text information having a specific area meaning. In addition, the area meaning and text information modified by the user are also shown. Can be used as a search keyword for image data of a document.

以上、本実施の形態のような構成とすることにより、ユーザは特定の意味を有すると思われるオブジェクトを、リスト表示されている複数のオブジェクトの中で上位にランキングされているオブジェクト(その意味を有する可能性が高いオブジェクト)から確認してゆくことができる。これにより、ユーザは、ある意味を有する可能性があると判定されたオブジェクト群の中から最もその意味に適合するオブジェクトを探索する作業を少ない負担で行うことができる。   As described above, with the configuration of the present embodiment, the user can select an object that has a specific meaning as an object ranked higher among a plurality of objects displayed in the list (the meaning of the object). It is possible to confirm from an object that is highly likely to have). As a result, the user can perform an operation of searching for an object that most closely matches the meaning among a group of objects determined to have a certain meaning with a small burden.

(第3の実施の形態)
次に、本発明の第3の実施の形態について説明する。
(Third embodiment)
Next, a third embodiment of the present invention will be described.

図9は、本発明の第3の実施の形態による画像処理システムS3について説明するための機能ブロック図である。   FIG. 9 is a functional block diagram for explaining an image processing system S3 according to the third embodiment of the present invention.

本実施の形態は、上述の第1および第2の実施の形態の変形例である。以下、すでに第1および第2の実施の形態にて説明した部分と同様な機能を有する部分には同一符号を付し、説明は割愛する。本実施の形態による画像処理システムS3は、画像データから抽出されるオブジェクト領域に対する意味付けの修正方法が、上述の各実施の形態とは異なる。   This embodiment is a modification of the above-described first and second embodiments. Hereinafter, parts having the same functions as those already described in the first and second embodiments are denoted by the same reference numerals, and description thereof is omitted. The image processing system S3 according to the present embodiment is different from the above-described embodiments in a method for correcting meanings for object regions extracted from image data.

具体的に、本実施の形態による画像処理システムS3は、第2の実施の形態による画像処理システムS2に加え、領域意味設定傾向解析モジュール(履歴情報取得部および識別情報取得部に相当)119、領域意味ドキュメント傾向比較モジュール(画像種別判別部に相当)120、領域意味設定傾向保管モジュール121および領域意味定型設定モジュール(意味設定部、履歴情報取得部および識別情報取得部に相当)122を備えてなる構成となっている。   Specifically, the image processing system S3 according to the present embodiment includes an area meaning setting tendency analysis module (corresponding to a history information acquisition unit and an identification information acquisition unit) 119, in addition to the image processing system S2 according to the second embodiment. An area meaning document tendency comparison module (corresponding to an image type determination unit) 120, an area meaning setting tendency storage module 121, and an area meaning fixed setting module (corresponding to a meaning setting unit, a history information acquisition unit, and an identification information acquisition unit) 122 are provided. It becomes the composition which becomes.

領域意味設定傾向解析モジュール(履歴情報取得部および識別情報取得部に相当)119は、意味情報保管モジュール114で保管されているドキュメントの情報に対し、領域意味設定モジュール110および領域意味属性設定モジュール118を介して設定されるユーザの修正(オブジェクトの選択)操作に関する情報(選択履歴)を取得し、当該ユーザの修正の仕方に傾向があるかどうかを解析する。ここで、領域意味設定傾向解析モジュール119は、領域意味設定モジュール110および領域意味属性設定モジュール118を介して行なわれる修正操作の内容をユーザ毎に特定するために、新規に処理対象となっているドキュメントに対して、操作入力部112を用いて領域意味設定モジュール110および領域意味属性設定モジュール118を操作するユーザを識別するための情報(パスワード認証の際に入力されるID情報やパスワード、バイオメトリクス認証の際に取得される指紋、瞳孔、声紋等に関する情報など)を取得する。このようにして取得されるユーザ識別情報は、過去に処理対象となったドキュメントについて修正操作を行なった場合を含め、その処理内容(選択、設定、修正など)と対応付けて意味情報保管モジュール114に格納されている。   An area meaning setting trend analysis module (corresponding to a history information acquisition unit and an identification information acquisition unit) 119 performs an area meaning setting module 110 and an area meaning attribute setting module 118 on the document information stored in the semantic information storage module 114. The information (selection history) related to the user's correction (object selection) operation set via the user ID is acquired, and whether there is a tendency in the user's correction method is analyzed. Here, the area meaning setting tendency analysis module 119 is a new processing target in order to specify the content of the correction operation performed through the area meaning setting module 110 and the area meaning attribute setting module 118 for each user. Information for identifying a user who operates the region meaning setting module 110 and the region meaning attribute setting module 118 using the operation input unit 112 for the document (ID information, password, biometrics input at the time of password authentication) Information on fingerprints, pupils, voiceprints, etc. acquired at the time of authentication). The user identification information acquired in this manner includes the semantic information storage module 114 in association with the processing contents (selection, setting, correction, etc.) including the case where the correction operation is performed on the document that has been processed in the past. Stored in

領域意味設定傾向保管モジュール121は、領域意味設定傾向解析モジュール119にて解析された、あるドキュメントに対して行われるユーザの修正内容を当該ドキュメントと対応づけて保管する。   The area meaning setting trend storage module 121 stores the correction contents of the user made on a certain document analyzed by the area meaning setting tendency analysis module 119 in association with the document.

領域意味ドキュメント傾向比較モジュール(画像種別判別部)120は、画像データ取得部101にて取得される処理対象であるドキュメントの画像が、領域意味設定傾向保管モジュール121に保管されているドキュメントの画像に類似しているかどうかを比較することにより、当該処理対象である画像データの種別を判別する。   The area meaning document tendency comparison module (image type determination unit) 120 converts the image of the document to be processed acquired by the image data acquisition unit 101 into the image of the document stored in the area meaning setting trend storage module 121. By comparing whether or not they are similar, the type of the image data to be processed is determined.

領域意味定型設定モジュール(意味設定部、履歴情報取得部および識別情報取得部に相当)122は、領域意味ドキュメント傾向比較モジュール120にて、処理対象であるドキュメントの画像データに類似する画像データが領域意味設定傾向保管モジュール121にて保管されている場合、その傾向を持ったドキュメントに対しユーザが行った過去の修正操作(オブジェクトの選択履歴など)に関する情報を、領域意味設定傾向解析モジュール119に取得されるユーザ識別情報に基づいて領域意味設定傾向保管モジュール121から取得し、その修正操作と同様な内容の修正を意味情報保管モジュール114あるいは領域意味属性保管モジュール116に保管されている情報に施す。このように、領域意味定型設定モジュール122は、領域意味ドキュメント傾向比較モジュール120にて判別された種別の画像データに対する領域意味設定モジュール110でのオブジェクトの選択履歴に関する情報を取得する。   An area semantic fixed setting module (equivalent to a meaning setting unit, a history information acquisition unit, and an identification information acquisition unit) 122 uses an area semantic document tendency comparison module 120 to store image data similar to the image data of a document to be processed. When stored in the semantic setting trend storage module 121, the area semantic setting trend analysis module 119 obtains information regarding past correction operations (such as object selection history) performed by the user on a document having the tendency. Is acquired from the region meaning setting trend storage module 121 based on the user identification information, and the same content correction as the correction operation is applied to the information stored in the semantic information storage module 114 or the region meaning attribute storage module 116. As described above, the area meaning fixed form setting module 122 acquires information regarding the object selection history in the area meaning setting module 110 for the type of image data determined by the area meaning document tendency comparison module 120.

このような構成とすることにより、ある種別の画像(例えば、あるフォーマットの文書画像など)中のオブジェクトに対してどのような意味付けがされることが多いかを履歴情報から把握し、その意味付けの傾向をオブジェクトへの意味付けに反映させることができる。   By adopting such a configuration, it is possible to grasp from the history information what kind of meaning is often given to an object in a certain type of image (for example, a document image of a certain format), and its meaning The tendency of attaching can be reflected in the meaning given to the object.

本実施の形態では、入力された画像データに含まれる各オブジェクトの領域意味の解析結果および領域意味の属性の解析結果についての、ユーザの過去の修正操作の傾向を解析し、新たに入力されたドキュメントが過去に入力されたドキュメントに類似していれば、過去にユーザが行った修正操作を、入力されたドキュメントにあらかじめ施した後、結果をユーザに提示する構成となっている。   In the present embodiment, the tendency of the user's past correction operation with respect to the analysis result of the area meaning and the analysis result of the attribute of the area meaning of each object included in the input image data is analyzed and newly input If the document is similar to a document input in the past, a correction operation performed by the user in the past is performed in advance on the input document, and then the result is presented to the user.

本実施の形態による画像処理システムS3において、図2に例示するようなドキュメントの画像データが入力され、領域意味が「タイトル」であると判定される文字領域が2つある場合、当該「タイトル」であると判定された文字領域のテキスト情報が、その確からしさの順に表示部111にリスト表示される。ここでユーザが、表示部111にて提示された結果から、「タイトル」の候補として挙がった文字領域の2番目の候補を、領域意味が「タイトル」ではないと判断し、領域意味設定モジュール110にて候補から削除する操作を行ったとする。   In the image processing system S3 according to this embodiment, when image data of a document as illustrated in FIG. 2 is input and there are two character areas whose area meaning is determined to be “title”, the “title” The text information of the character area determined to be is displayed as a list on the display unit 111 in the order of the probability. Here, based on the result presented on the display unit 111, the user determines that the second candidate of the character area listed as the “title” candidate is not “title”, and the area meaning setting module 110. Suppose you have performed an operation to delete from candidates.

このとき、入力された画像データの情報とユーザの修正操作を、領域意味設定傾向保管モジュール121にて記録させておく。次に、新たな処理対象としての画像データが入力された場合、過去に処理済の画像データとレイアウト等が類似したものであれば、当該画像データに対して過去に行われたユーザの修正操作を、新たに入力された画像データに対して自動的に施す。つまり、この場合では、「タイトル」の候補として判定された2つの文字領域のうち、2番目の候補を削除する。このようにして、2番目の候補が削除された結果をユーザに提示することで、ユーザは過去に類似する画像データに対して行った、「タイトル」と判定された2番目の文字領域候補を削除するという操作を、新たに入力された類似ドキュメントでは省略することができる。   At this time, the information on the input image data and the user's correction operation are recorded in the area meaning setting tendency storage module 121. Next, when image data to be newly processed is input, if the image data processed in the past is similar in layout, etc., the user's correction operation performed in the past on the image data Are automatically applied to newly input image data. In other words, in this case, the second candidate is deleted from the two character areas determined as candidates for the “title”. In this way, by presenting the result of the deletion of the second candidate to the user, the user performed the second character area candidate determined as “title”, which was performed on similar image data in the past. The delete operation can be omitted for newly input similar documents.

図10は、ドキュメント処理システムS3に入力されたドキュメントの画像データに対し、ユーザが行う修正操作の傾向を取得する処理について説明するためのフローチャートである。   FIG. 10 is a flowchart for explaining a process of acquiring a tendency of a correction operation performed by the user on the document image data input to the document processing system S3.

まず、画像データ取得部101にて、ドキュメント処理システム13に入力されるドキュメントの画像を取得する(S201)。   First, the image data acquisition unit 101 acquires an image of a document input to the document processing system 13 (S201).

次に、ドキュメントの画像の解析を行う。ドキュメント領域解析モジュール102により、ドキュメント画像中の文字領域を解析し、文字領域を囲む矩形の座標(位置、サイズなど)の情報と、領域意味解析モジュール104により取得される、文字領域の領域意味と、文字認識モジュール113により取得されるテキスト情報と、を意味情報保管モジュール114に通知し、保管させる(S202)。   Next, the document image is analyzed. The document area analysis module 102 analyzes the character area in the document image, information on the coordinates (position, size, etc.) of the rectangle surrounding the character area, and the area meaning of the character area acquired by the area semantic analysis module 104 The text information acquired by the character recognition module 113 is notified to the semantic information storage module 114 and stored (S202).

次に、領域意味解析モジュール104にて解析された領域意味の解析結果の確からしさ(信頼度の高さ)の順位を領域意味属性保管モジュール116に通知し、保管させる(S203)。   Next, the region semantic attribute storage module 116 is notified of the rank of the reliability (high reliability) of the region semantic analysis result analyzed by the region semantic analysis module 104 and stored (S203).

次に、意味情報保管モジュール114および領域意味属性保管モジュール116にて保管されている情報を、領域意味属性提示モジュール117により、ユーザに提示する(S204)。   Next, the information stored in the semantic information storage module 114 and the regional meaning attribute storage module 116 is presented to the user by the regional meaning attribute presentation module 117 (S204).

次に、ユーザは表示部111に提示された解析結果を確認し、必要があれば領域意味の修正、または領域意味属性の修正を、それぞれ、領域意味設定モジュール110、または領域意味属性設定モジュール118により行う(S205)。   Next, the user confirms the analysis result presented on the display unit 111, and if necessary, corrects the area meaning or the area meaning attribute if necessary, by the area meaning setting module 110 or the area meaning attribute setting module 118, respectively. (S205).

S205における処理にて、ユーザが、領域意味設定モジュール110あるいは領域意味属性設定モジュール118を用いて修正を行った場合(S205,Yes)は、領域意味設定傾向解析モジュール119により、領域意味設定モジュール110あるいは領域意味属性設定モジュール118に指示されたユーザの修正操作と、入力されたドキュメントに関する情報(意味情報保管モジュール114にて保管されている情報)と、上記修正操作を行なったユーザを識別するための情報とを関連付け、領域意味設定傾向保管モジュール121に通知し、保管させる(S206)。   If the user makes corrections using the region meaning setting module 110 or the region meaning attribute setting module 118 in the processing in S205 (S205, Yes), the region meaning setting trend analysis module 119 causes the region meaning setting module 110 to perform the correction. Alternatively, the user's correction operation instructed to the area meaning attribute setting module 118, information on the input document (information stored in the semantic information storage module 114), and the user who performed the correction operation are identified. And the area meaning setting tendency storage module 121 is notified and stored (S206).

例えば、入力されたドキュメントの画像データに関する情報として、ドキュメント領域解析モジュール102にて解析された全文字領域の座標と、その画像データのドキュメントのレイアウトに類似する画像に対してユーザが過去に行った、「タイトル」として判定された文字領域の候補の内の2番目を候補から除外する、という修正作業とを関連付けて領域意味設定傾向保管モジュール121にて保管させる。図11は、ドキュメントの画像データに含まれる各文字領域の座標と、当該ドキュメントと類似するドキュメント画像に対してユーザが過去行った修正操作の内容とが対応付けられて領域意味設定傾向保管モジュール121に保管されている状況を示す図である。   For example, as information related to image data of an input document, a user has performed in the past on an image similar to the document layout of the image data and the coordinates of all character regions analyzed by the document region analysis module 102. Then, the region meaning setting tendency storage module 121 stores them in association with the correction work of excluding the second character region candidate determined as “title” from the candidates. FIG. 11 shows an area meaning setting tendency storage module 121 in which the coordinates of each character area included in the image data of the document are associated with the contents of the correction operation performed by the user in the past on the document image similar to the document. It is a figure which shows the condition currently stored in.

図12は、本実施の形態による画像処理システムS3における処理の詳細について説明するためのフローチャートである。   FIG. 12 is a flowchart for explaining details of processing in the image processing system S3 according to the present embodiment.

本実施の形態による画像処理システムS3では、入力されたドキュメントの画像データが、領域意味設定傾向保管モジュール121に保管されている(以前、入力された)ドキュメントのレイアウトに類似している場合に、以前のドキュメントに対して行ったユーザの修正操作を、新たに入力されたドキュメントの画像データに対して施しておき、ユーザに提示する。   In the image processing system S3 according to the present embodiment, when the image data of the input document is similar to the layout of the document stored (previously input) in the area meaning setting tendency storage module 121, The user's correction operation performed on the previous document is performed on the image data of the newly input document and presented to the user.

まず、画像データ取得部101にて、ドキュメント処理システム13に入力されたドキュメントの画像を取得する(S301)。   First, the image data acquisition unit 101 acquires an image of a document input to the document processing system 13 (S301).

次に、入力されたドキュメントの画像の解析を行う。ドキュメント領域解析モジュール102によりドキュメント画像中の文字領域を解析して得られる文字領域を囲む矩形の座標(位置、サイズなど)の情報と、領域意味解析モジュール104により取得される文字領域の領域意味と、文字認識モジュール113により取得されるテキスト情報と、を対応づけて意味情報保管モジュール114に通知し、保管させる(S302)。   Next, the input document image is analyzed. Information on the coordinates (position, size, etc.) of the rectangle surrounding the character area obtained by analyzing the character area in the document image by the document area analysis module 102, and the area meaning of the character area acquired by the area semantic analysis module 104 Then, the text information acquired by the character recognition module 113 is associated with the semantic information storage module 114 and stored (S302).

次に、領域意味解析モジュール104にて解析された領域意味の解析結果の確からしさの順位を、領域意味属性保管モジュール116に通知し、保管させる(S303)。   Next, the order of the probability of the analysis result of the area meaning analyzed by the area semantic analysis module 104 is notified to the area meaning attribute storage module 116 and stored (S303).

次に、入力されたドキュメントに類似するレイアウトを有するドキュメントが、領域意味設定傾向保管モジュール121にて保管されているかどうか、領域意味ドキュメント傾向比較モジュール120により比較、判定を行う(S304)。ドキュメントの比較については、例えば、図11に示すように、領域意味設定傾向保管モジュール121に以前入力されたドキュメントから抽出されるすべての文字領域の座標情報が保管されている場合には、ドキュメント領域解析モジュール102にて新たに取得されたドキュメントの画像データから抽出される文字領域の座標と比較し、その値の差が小さければ、2つのドキュメントは類似していると判断する。   Next, whether or not a document having a layout similar to the input document is stored in the region meaning setting tendency storage module 121 is compared and determined by the region meaning document tendency comparison module 120 (S304). As for comparison of documents, for example, as shown in FIG. 11, when coordinate information of all character areas extracted from a document previously input in the area meaning setting tendency storage module 121 is stored, the document area Compared with the coordinates of the character area extracted from the image data of the document newly acquired by the analysis module 102, if the difference between the values is small, it is determined that the two documents are similar.

なお、ここでは、ドキュメント画像中に含まれる文字領域の座標のみを用いてドキュメントの類似を判定する例を示すが、これに限られるものではない。例えば、ドキュメント画像から抽出されるテキスト情報を利用し、2つのドキュメントにおいて共通する単語が多い場合は類似していると判断するなど、意味情報保管モジュール114および領域意味属性保管モジュール116にて保存される種々の情報を用いて、ドキュメントの比較を行うことができる。   Here, an example is shown in which the similarity of a document is determined using only the coordinates of a character area included in the document image, but the present invention is not limited to this. For example, the text information extracted from the document image is used and stored in the semantic information storage module 114 and the region semantic attribute storage module 116 such that when there are many common words in two documents, it is determined that they are similar. A variety of information can be used to compare documents.

次に、入力されたドキュメントに類似したドキュメントが領域意味設定傾向保管モジュール121に保管されている場合(S304,Yes)、新たに入力されたドキュメントの画像データに対し、領域意味設定傾向保管モジュール121に保管されている、類似したドキュメントに対して過去にユーザが行った修正操作を、領域意味定型設定モジュール122により実行させる(S305)。   Next, when a document similar to the input document is stored in the area meaning setting tendency storage module 121 (Yes in S304), the area meaning setting tendency storage module 121 is added to the image data of the newly input document. The region semantic fixed setting module 122 executes correction operations previously performed by the user on similar documents stored in (S305).

例えば、領域意味ドキュメント傾向比較モジュール120が、入力されたドキュメントが、図11に示すように領域意味設定傾向保管モジュール121に情報が保管されているドキュメントAに類似していると判定した場合、領域意味定型設定モジュール122は、領域意味設定傾向保管モジュール121にて保管されている、ドキュメントAに対してユーザが行った修正操作、“2番目の[タイトル]文字領域候補を除外する”という操作を実行する。すなわち、領域意味設定モジュール110に、領域意味が2番目に[タイトル]らしいと解析された文字領域の領域意味を、[タイトル]ではないと修正するよう指示を出す。   For example, if the area-meaning document tendency comparison module 120 determines that the input document is similar to the document A in which information is stored in the area meaning setting tendency storage module 121 as shown in FIG. The semantic fixed form setting module 122 performs a correction operation performed on the document A stored in the area meaning setting tendency storage module 121 by the user, an operation of “excluding the second [title] character area candidate”. Execute. That is, the area meaning setting module 110 is instructed to correct the area meaning of the character area that has been analyzed that the area meaning seems to be the second [title].

次に、S304にて、入力されたドキュメントに類似したドキュメントが領域意味設定傾向保管モジュール121に保管されている場合(S304,Yes)にはS305で修正を施した結果を、類似したドキュメントがない場合(S304,No)にはS302およびS303における解析結果を、領域意味属性提示モジュール117により、ユーザに提示する(S306)。   Next, in S304, when a document similar to the input document is stored in the area meaning setting tendency storage module 121 (S304, Yes), there is no similar document as a result of correction in S305. In the case (S304, No), the analysis results in S302 and S303 are presented to the user by the region meaning attribute presentation module 117 (S306).

次に、提示された内容をユーザが修正した場合(S307,Yes)は、S308にて、図10にて示したS206と同様に、領域意味設定傾向解析モジュール119により、入力されたドキュメントとユーザの修正操作を領域意味設定傾向保管モジュール121に保管した後(S308)、処理を終了する。一方、提示された内容をユーザが修正していなければ(S307,No)処理を終了する。   Next, when the user corrects the presented content (S307, Yes), in S308, similarly to S206 shown in FIG. 10, the input document and user are input by the area meaning setting trend analysis module 119. Is stored in the area meaning setting tendency storage module 121 (S308), and the process is terminated. On the other hand, if the user has not corrected the presented content (S307, No), the process is terminated.

なお、本実施の形態では、処理対象の画像データと類似する処理済みの画像データがあった場合に、当該処理済みの画像データに加えたのと同様な修正を加える構成を示したが、これに限られるものではない。例えば、処理対象の画像データとレイアウト等が類似する処理済の画像データが複数あるような場合には、領域意味定型設定モジュール122は、領域意味解析モジュール104にて複数のオブジェクトが同一の意味を有すると判定された場合に、領域意味設定傾向解析モジュール119にて取得される履歴情報に基づいて、領域意味提示モジュール108によりリスト表示されるオブジェクトの内の過去に選択された頻度が最も高いオブジェクトを、該オブジェクトについて領域意味解析モジュール104にて判定された意味を有するものとして設定するようにしてもよい。このように、過去の選択操作の履歴(傾向)を、画像中に含まれるオブジェクトに対する意味設定処理に自動的に反映させることにより、ユーザは類似したドキュメントに対し毎回同じ修正を行う必要がなく、利便性の向上に寄与することができる。   In this embodiment, when there is processed image data similar to the image data to be processed, a configuration in which the same correction as that added to the processed image data is shown. It is not limited to. For example, when there are a plurality of processed image data having a layout similar to that of the image data to be processed, the region semantic fixed setting module 122 causes the region semantic analysis module 104 to have the same meaning for the plurality of objects. Objects that have been selected in the past among the objects displayed in a list by the area meaning presentation module 108 based on the history information acquired by the area meaning setting trend analysis module 119 when it is determined that May be set as having the meaning determined by the area semantic analysis module 104 for the object. In this way, by automatically reflecting the past selection operation history (trend) in the semantic setting process for the object included in the image, the user does not need to make the same correction to a similar document each time. It can contribute to the improvement of convenience.

また、本実施の形態では、過去の修正履歴に基づく修正処理を、処理対象の画像データと類似する処理済みの画像データがあるか否かに基づいて行う構成を示したが、これに限られるものではない。例えば、領域意味設定傾向解析モジュール119において、オブジェクトの選択を行うユーザを識別するための識別情報を取得し、当該取得された識別情報に対応するユーザによるオブジェクトの選択履歴に関する情報を取得する構成としてもよい。このような構成とすることにより、あるユーザが画像中のオブジェクトに対してどのような意味付けをしているかを履歴情報から把握し、その意味付けの選択の仕方の傾向をオブジェクトへの意味付けに反映させることができる。   In the present embodiment, the configuration in which the correction processing based on the past correction history is performed based on whether or not there is processed image data similar to the image data to be processed is shown, but the present invention is not limited thereto. It is not a thing. For example, the region meaning setting tendency analysis module 119 acquires identification information for identifying a user who selects an object, and acquires information related to an object selection history by the user corresponding to the acquired identification information. Also good. By adopting such a configuration, it is possible to grasp from a history information what kind of meaning a user gives to an object in the image, and to give meaning to the object how to select the meaning. Can be reflected.

また、あるレイアウトを有するドキュメントに対して過去に行なわれた修正内容等を、過去に入力されたドキュメントと類似するレイアウトを有する新規入力ドキュメントに対して自動反映させる構成する場合において、取得する修正操作の履歴情報は、必ずしも1人のユーザのものに限定する必要はなく、所定のグループに属する複数ユーザの操作履歴を取得したり、ユーザに関係なくドキュメントのレイアウトが類似するドキュメントに対して過去に行なわれた修正操作の履歴を全て取得したりすることもできる。   Further, a correction operation to be acquired in the case of a configuration in which correction contents and the like made in the past for a document having a certain layout are automatically reflected to a new input document having a layout similar to a document input in the past. The history information is not necessarily limited to that of a single user, but the operation history of a plurality of users belonging to a predetermined group can be acquired or a document with a similar document layout can be obtained in the past regardless of the user. It is also possible to acquire all the history of corrective operations performed.

(第4の実施の形態)
次に、本発明の第4の実施の形態について説明する。
(Fourth embodiment)
Next, a fourth embodiment of the present invention will be described.

図13は、本発明の第4の実施の形態による画像処理システムS4の構成を示す機能ブロック図である。本実施の形態は、第1の実施の形態の変形例である。本実施の形態による画像処理システムS4は、第1の実施の形態における画像処理システムS1における領域意味提示モジュール108および領域意味設定モジュール110を、テキスト意味提示モジュール123およびテキスト意味設定モジュール124に変更した構成となっている。   FIG. 13 is a functional block diagram showing a configuration of an image processing system S4 according to the fourth embodiment of the present invention. This embodiment is a modification of the first embodiment. In the image processing system S4 according to the present embodiment, the area meaning presentation module 108 and the area meaning setting module 110 in the image processing system S1 according to the first embodiment are changed to a text meaning presentation module 123 and a text meaning setting module 124. It has a configuration.

テキスト意味提示モジュール123は、意味情報保管モジュール114で保管されているテキスト意味を表示部111に画面表示させることによりユーザに提示する。   The text meaning presentation module 123 presents the text meaning stored in the semantic information storage module 114 to the user by causing the display unit 111 to display the screen.

テキスト意味設定モジュール124は、意味情報保管モジュール114で保管されているテキスト意味を、操作入力部112への操作入力により手動で設定する手段をユーザに与える。   The text meaning setting module 124 gives the user means for manually setting the text meaning stored in the semantic information storage module 114 by an operation input to the operation input unit 112.

このような構成により、意味情報保管モジュール114にて保管されているテキスト意味の解析結果を、テキスト意味提示モジュール123によってユーザに提示する。ユーザは提示された解析結果を自身で確認することができ、誤って解析されている箇所を確認することができる。   With such a configuration, the analysis result of the text meaning stored in the semantic information storage module 114 is presented to the user by the text meaning presentation module 123. The user can confirm the presented analysis result by himself / herself, and can confirm a location that has been erroneously analyzed.

さらに、テキスト意味情報設定モジュール124によって、ユーザはテキスト意味解析モジュール115が出力したテキスト意味の解析結果を設定または修正することができる。   Further, the text semantic information setting module 124 allows the user to set or correct the text semantic analysis result output by the text semantic analysis module 115.

(第5の実施の形態)
次に、本発明の第5の実施の形態について説明する。
(Fifth embodiment)
Next, a fifth embodiment of the present invention will be described.

図14は、本発明の第5の実施の形態による画像処理システムS5の構成を示す機能ブロック図である。本実施の形態は、上述の第4の実施の形態の変形例である。本実施の形態による画像処理システムS5は、第4の実施の形態による画像処理システムS4の構成に加え、テキスト意味属性保管モジュール125、テキスト意味属性提示モジュール126およびテキスト意味属性設定モジュール127を備えてなる構成となっている。   FIG. 14 is a functional block diagram showing a configuration of an image processing system S5 according to the fifth embodiment of the present invention. The present embodiment is a modification of the above-described fourth embodiment. The image processing system S5 according to the present embodiment includes a text semantic attribute storage module 125, a text semantic attribute presentation module 126, and a text semantic attribute setting module 127 in addition to the configuration of the image processing system S4 according to the fourth embodiment. It becomes the composition which becomes.

テキスト意味属性保管モジュール125は、テキスト意味解析モジュール(文字属性判定部に相当)115にて解析されるテキスト意味の結果が正解である確からしさなどの属性を取得し、その情報を保管する。テキスト意味解析モジュール115は、ドキュメント領域解析モジュール102にて抽出されるオブジェクトが文字領域である場合に、当該文字領域に含まれる文字の属性を判定する。テキスト意味解析モジュール115にて判定された文字の属性に関する情報は、テキスト意味属性保管モジュール125に格納される。   The text meaning attribute storage module 125 acquires attributes such as the probability that the text meaning result analyzed by the text meaning analysis module (corresponding to the character attribute determination unit) 115 is correct, and stores the information. When the object extracted by the document area analysis module 102 is a character area, the text semantic analysis module 115 determines the attribute of the character included in the character area. Information regarding the character attributes determined by the text semantic analysis module 115 is stored in the text semantic attribute storage module 125.

なお、テキスト意味解析モジュール115におけるテキスト意味の結果が正解である確からしさの判定は、例えば「人名」であるか否かの判定においては、判定対象となるテキスト情報の近隣に「殿」あるいは「様」といった文字があれば10点とする、といった所定のルールによる得点付けを行ない、この得点付けの結果得られる得点が高いもの程「人名」である可能性が高いテキストであると判定する。テキスト意味解析モジュール115におけるテキスト意味判定の結果が正解である確からしさの判定を行なうための所定のルールは、例えばメモリ802に格納される。   The determination of the probability that the text meaning result in the text meaning analysis module 115 is correct is, for example, whether or not it is “person name”, in the vicinity of the text information to be determined, If there is a character such as “sama”, a score of 10 is assigned according to a predetermined rule, and the higher the score obtained as a result of this scoring, the more likely it is to be a “person name”. Predetermined rules for determining the likelihood that the result of the text meaning determination in the text meaning analysis module 115 is correct are stored in the memory 802, for example.

テキスト意味属性提示モジュール(入力候補表示部)126は、テキスト意味属性保管モジュール125にて保管されているテキストの属性の値に応じて、意味情報保管モジュール114で保管されている情報を表示部111に画面表示させる。   The text semantic attribute presentation module (input candidate display unit) 126 displays information stored in the semantic information storage module 114 according to the value of the text attribute stored in the text semantic attribute storage module 125. Display on the screen.

テキスト意味属性設定モジュール127は、操作入力部112への操作入力に基づいて、テキスト意味属性保管モジュール125にて保管されている属性の値を手動で設定する手段をユーザに与える。   The text meaning attribute setting module 127 gives the user a means for manually setting the value of the attribute stored in the text meaning attribute storage module 125 based on the operation input to the operation input unit 112.

本実施の形態では、画像処理システムS5に入力されたドキュメントの画像データから、テキストの意味が「人名」である文字領域のテキスト情報を抽出する。入力されたドキュメントの画像データから複数の「人名」が検出される場合は、ユーザが所望する順序もしくはテキスト意味の判定結果が正解である可能性が高いものほど上位になるような順序で「人名」を並べたリストを生成する。この「人名」リストに挙げられた項目や順序にしたがい、入力されたドキュメント画像を保存する際の送信先が変化する。   In the present embodiment, text information of a character region whose text meaning is “person name” is extracted from the image data of the document input to the image processing system S5. When multiple “person names” are detected from the image data of the input document, the “person names” are ordered in a higher order as the user's desired order or the text meaning determination result is more likely to be correct. ”Is generated. In accordance with the items and order listed in the “person name” list, the transmission destination for saving the input document image changes.

例えば、ドキュメントから“東京太郎”という「人名」のテキスト情報が取得されたら当該ドキュメントを送信先Aに送信し、“東京太郎”、“大阪次郎”の順のリストが取得されたら当該ドキュメントを送信先Bに送信し、“大阪次郎”、“東京太郎”という順であれば当該ドキュメントを送信先Cに送信する、といった処理を行うことができる。   For example, when the text information of “person name” “Tokyo Taro” is acquired from the document, the document is transmitted to the destination A, and when the list of “Tokyo Taro” and “Jiro Osaka” is acquired, the document is transmitted. If the order is “Jiro Osaka” and “Taro Tokyo” in this order, the document can be sent to the destination C.

図15は、本発明の第5の実施の形態による画像処理システムS5の処理の詳細について説明するためのフローチャートである。以下、一例として、自動でドキュメントから取得した結果に対し、ユーザが適切な修正を加え、修正された情報に基づいて生成された「人名」リストにしたがってドキュメントを送信する処理について説明する。ここでの「人名」リストの生成処理では、ユーザが所望する順序で並べられたものを作成するものとする。   FIG. 15 is a flowchart for explaining details of processing of the image processing system S5 according to the fifth embodiment of the present invention. Hereinafter, as an example, a description will be given of a process in which a user appropriately corrects a result obtained automatically from a document and transmits the document according to a “person name” list generated based on the corrected information. In the generation process of the “person name” list here, a list arranged in the order desired by the user is created.

まず、画像データ取得部101にて、画像処理システムS5に入力されるドキュメントの画像データを取得する(S401)。   First, the image data acquisition unit 101 acquires image data of a document input to the image processing system S5 (S401).

次に、ドキュメント領域解析モジュール102によりドキュメント画像中の文字領域を解析し、文字領域を囲む矩形の座標(位置とサイズなど)を取得する(S402)。このようにして取得した情報は意味情報保管モジュール114に通知され、保管される。   Next, the document area analysis module 102 analyzes the character area in the document image, and obtains the coordinates (position and size, etc.) of the rectangle surrounding the character area (S402). The information acquired in this way is notified to the semantic information storage module 114 and stored.

次に、文字認識モジュール113にて、文字領域のテキスト情報を取得する。取得されたテキスト情報は、意味情報保管モジュール114に保管される。例えば、文字領域2について“申し込み案内”というテキスト情報が取得された場合、当該テキスト情報は意味情報保管モジュール114に保管される(S403)。   Next, the text recognition module 113 acquires text information of the character area. The acquired text information is stored in the semantic information storage module 114. For example, when the text information “application guidance” is acquired for the character area 2, the text information is stored in the semantic information storage module 114 (S403).

次に、抽出された文字領域内におけるテキスト情報のテキスト意味をテキスト意味解析モジュール115によって取得する。そして、取得されたテキスト意味に関する情報を意味情報保管モジュール114にて保管させる。さらに、このとき、テキスト意味が付与されたすべてのテキスト情報に対し、ユーザが所望しているテキスト情報の順に順位を付与する。この順位を属性としてテキスト意味属性保管モジュール125に通知し、保管させる(S404)。   Next, the text meaning analysis module 115 acquires the text meaning of the text information in the extracted character area. Then, the semantic information storage module 114 stores the acquired text meaning information. Furthermore, at this time, the ranking is assigned to all text information to which the text meaning is given in the order of the text information desired by the user. This ranking is notified to the text meaning attribute storage module 125 as an attribute and stored (S404).

例えば、図2に例示したようなレイアウトのドキュメントの画像データでは、“東京太郎”や“大阪次郎”というテキスト情報のテキスト意味が「人名」として解析され、この解析結果が意味情報保管モジュール114に保管される。さらに、テキスト意味解析モジュール115にてテキスト意味が付与されたテキスト情報に対し、“東京太郎”が1番ユーザの所望する「人名」であり、“大阪次郎”が2番目に所望する「人名」である、というユーザの所望する順位を属性としてテキスト意味属性保管モジュール125に保管させる。図16は、テキスト意味属性保管モジュール125に保管されるテキスト意味属性を示すデータテーブルの一例である。   For example, in the image data of the document with the layout as illustrated in FIG. 2, the text meaning of the text information “Taro Tokyo” or “Jiro Osaka” is analyzed as “person name”, and the analysis result is sent to the semantic information storage module 114. Stored. Furthermore, “Taro Tokyo” is the “person name” desired by the first user and “Jiro Osaka” is the second desired “person name” for the text information assigned the text meaning by the text semantic analysis module 115. Is stored in the text semantic attribute storage module 125 as an attribute. FIG. 16 is an example of a data table showing text semantic attributes stored in the text semantic attribute storage module 125.

次に、テキスト意味属性提示モジュール126によって、意味情報保管モジュール114にて保管されているテキスト情報を、テキスト意味属性保管モジュール125にて保管されているユーザの所望する順に並べ、表示部111にて画面表示させる(S405)。図17は、テキスト意味属性提示モジュール126により表示部111にて表示させるGUIの表示例を示す図である。このように、テキスト意味属性提示モジュール126は、抽出されるオブジェクトが文字である場合に、当該文字の属性を判定し、属性が判定された文字を、該文字について判定された属性の文字を入力とすべき所定の処理における入力文字候補として表示させる。   Next, the text semantic attribute presentation module 126 arranges the text information stored in the semantic information storage module 114 in the order desired by the user stored in the text semantic attribute storage module 125, and the display unit 111 The screen is displayed (S405). FIG. 17 is a diagram illustrating a display example of a GUI displayed on the display unit 111 by the text meaning attribute presentation module 126. As described above, when the extracted object is a character, the text meaning attribute presentation module 126 determines the attribute of the character, and inputs the character with the determined attribute for the character with the determined attribute. Are displayed as input character candidates in a predetermined process.

図17に示すGUI画面では、プレビューウィンドウであるウィンドウ301において、入力されたドキュメントの画像に加え、ドキュメント領域解析モジュール102にて抽出された文字領域を囲む矩形が表示されている。さらに、テキスト意味解析モジュール115にてテキスト意味が「人名」と解析された文字領域の矩形の枠線は、赤色で強調表示されている。リストボックス302には、領域意味解析モジュール104にて意味が「タイトル」であると解析されたテキスト情報が、テキスト意味解析モジュール115にて付与されたユーザの所望の順に並べられ、リスト表示されている。   In the GUI screen shown in FIG. 17, in a window 301 that is a preview window, in addition to the input document image, a rectangle surrounding the character area extracted by the document area analysis module 102 is displayed. Further, the rectangular border of the character area whose text meaning is analyzed as “person name” by the text meaning analysis module 115 is highlighted in red. In the list box 302, the text information analyzed by the area semantic analysis module 104 as having the meaning “title” is arranged in a desired order given by the text semantic analysis module 115 and displayed in a list. Yes.

例えば、図17に示す例では、“東京太郎”という文字領域がユーザが1番所望する「人名」であると解析され、“大阪次郎”という文字領域がユーザが2番目に所望する「人名」であると解析されたため、この順序でリストボックス302にリスト表示されている。   For example, in the example shown in FIG. 17, the character area “Taro Tokyo” is analyzed as the “person name” desired by the user first, and the character area “Jiro Osaka” is the second “person name” desired by the user. Therefore, the list is displayed in the list box 302 in this order.

次に、表示部111にてユーザに提示しているテキスト意味が「人名」と解析されたテキスト情報のリストの中に、ユーザが判断して所望する「人名」ではないと思われる候補がある場合(S406,Yes)、操作入力部112への操作入力に基づいてテキスト意味設定モジュール124により除外する。   Next, in the list of text information whose text meaning presented to the user on the display unit 111 is analyzed as “person name”, there is a candidate that seems not to be the desired “person name” as judged by the user. In the case (S406, Yes), the text meaning setting module 124 excludes it based on the operation input to the operation input unit 112.

このとき、テキスト意味設定モジュール124は、リストから削除されたテキスト情報のテキスト意味は「人名」ではないという情報を、意味情報保管モジュール114に通知する(S407)。   At this time, the text meaning setting module 124 notifies the meaning information storage module 114 of information that the text meaning of the text information deleted from the list is not “person name” (S407).

例えば、GUI画面上にてリストボックス302に表示されているリストから、テキスト意味が「人名」ではないと判断される候補があった場合(S408,Yes)、リストボックス302にてその候補の項目を選択し、削除ボタンであるコマンドボタン305を押下する。これにより、選択した項目がリストから削除される。   For example, if there is a candidate whose text meaning is not “person name” from the list displayed in the list box 302 on the GUI screen (S408, Yes), the candidate item is displayed in the list box 302. And the command button 305 as a delete button is pressed. As a result, the selected item is deleted from the list.

次に、ユーザの所望する順に並べられたテキスト意味が「人名」であるテキスト情報のリストから、ユーザが判断して所望する「人名」順ではないと思われる候補の順位を、操作入力部112への操作入力に基づいて、テキスト意味属性設定モジュール127により修正する操作を行う(S409)。   Next, from the list of text information whose text meaning is “person name” arranged in the order desired by the user, the operation input unit 112 determines the ranking of candidates that are judged not to be in the order of “person name” desired by the user. Based on the operation input to, the text semantic attribute setting module 127 performs a correction operation (S409).

このとき、ユーザの所望する「人名」の順位の変更に関する情報を、テキスト意味属性保管モジュール125に通知する。   At this time, the text semantic attribute storage module 125 is notified of information related to the change in the ranking of the “person name” desired by the user.

例えば、GUI画面上にてリストボックス302に表示されている「人名」のリストから任意の項目を選択し、コマンドボタン303を押下すると、選択した項目よりも1つ上位の項目と順位が入れ替わり、コマンドボタン304を押すと、選択した項目よりも1つ下位の項目と順位が入れ替わる。   For example, when an arbitrary item is selected from the “person name” list displayed in the list box 302 on the GUI screen and the command button 303 is pressed, the order is switched to the item one higher than the selected item, When the command button 304 is pressed, the order is switched to an item one level lower than the selected item.

また、コマンドボタン305や、コマンドボタン303および304により編集されたリストボックス302は、コマンドボタン306を押すことにより、最初に提示された表示状態に戻すことができる。   Further, the command box 305 and the list box 302 edited by the command buttons 303 and 304 can be returned to the initially displayed state by pressing the command button 306.

次に、ユーザの所望する「人名」の順に並べられているリストに基づき、ドキュメントの送信先を決定する(S410)。送信先は事前に定義されており、リストの内容に従って送信先が決定される。   Next, the transmission destination of the document is determined based on the list arranged in the order of “person names” desired by the user (S410). The transmission destination is defined in advance, and the transmission destination is determined according to the contents of the list.

最後に、S410の処理で決定した送信先に、入力されたドキュメントを送信する(S411)。例えば、コマンドボタン307の送信ボタンを押すと、ドキュメントの送信を開始する。   Finally, the input document is transmitted to the transmission destination determined in S410 (S411). For example, when a transmission button of the command button 307 is pressed, document transmission is started.

なお、図17に示すGUI画面では、テキストボックス302には「人名」として抽出された文字領域のテキスト情報が表示されるが、文字認識モジュール113の認識結果が誤っており、表示されるテキスト情報が誤ったものになってしまう場合もあり得る。このような場合には、テキストボックス302に、操作入力部112を利用してユーザが直接テキストを入力することにより、文字認識モジュール113における認識ミスを修正することができる。   In the GUI screen shown in FIG. 17, the text information of the character area extracted as “person name” is displayed in the text box 302, but the recognition result of the character recognition module 113 is incorrect and the displayed text information is displayed. May become wrong. In such a case, recognition errors in the character recognition module 113 can be corrected by the user directly entering text in the text box 302 using the operation input unit 112.

なお、本実施の形態では、テキスト意味が「人名」であるテキスト情報をドキュメントデータの送信先の選定に利用する例を示したが、これに限られるものではない。例えば、テキスト意味が「日付」であるテキスト情報等、さまざまなテキスト意味を有するテキスト情報を利用することも可能である。   In the present embodiment, an example is shown in which text information whose text meaning is “person name” is used to select a transmission destination of document data. However, the present invention is not limited to this. For example, it is possible to use text information having various text meanings such as text information whose text meaning is “date”.

また、取得されたテキスト意味の情報の利用方法についても、送信先の選定に限らず、例えば、取得されたテキスト意味に対してユーザの修正を促し、修正されたテキスト意味情報を、当該テキスト意味が抽出されたドキュメントの検索に利用することもできる。   In addition, the method of using the acquired text meaning information is not limited to the selection of the transmission destination, for example, the user is prompted to correct the acquired text meaning, and the corrected text meaning information is used as the text meaning. It can also be used to search for documents that have been extracted.

このように、本実施の形態におけるテキスト意味属性提示モジュール126は、テキスト意味解析モジュール115により属性が判定された文字を、該文字について判定された属性の文字を入力とすべき所定の処理における入力文字候補として表示させる。このようにすることで、ユーザは、ある属性(例えば、人名、電話番号、住所など)を有する文字を、その属性をもつ文字を入力とする処理における文字入力を、入力文字候補の中から選択することにより行うことができ、文字入力の負担を大幅に軽減することができる。   As described above, the text meaning attribute presentation module 126 according to the present exemplary embodiment uses the character whose attribute has been determined by the text meaning analysis module 115 as an input in a predetermined process in which the character having the attribute determined for the character is to be input. Display as a character candidate. By doing in this way, the user selects a character input in a process in which a character having a certain attribute (for example, a person name, a telephone number, an address, etc.) is input as a character having the attribute from the input character candidates. The burden of character input can be greatly reduced.

(第6の実施の形態)
次に、本発明の第6の実施の形態について説明する。
(Sixth embodiment)
Next, a sixth embodiment of the present invention will be described.

本実施の形態は、上述の第5の実施の形態の変形例である。以下、すでに第5の実施の形態にて説明した部分と同様な機能を有する部分には同一符号を付し、説明は割愛する。本実施の形態による画像処理システムS6は、画像データから抽出されるテキスト情報に付与する属性の修正方法が、上述の第5の実施の形態とは異なる。図18は、本発明の第6の実施の形態による画像処理システムS6の構成を示す機能ブロック図である。   The present embodiment is a modification of the above-described fifth embodiment. Hereinafter, parts having the same functions as those already described in the fifth embodiment are denoted by the same reference numerals, and description thereof is omitted. The image processing system S6 according to the present embodiment differs from the above-described fifth embodiment in a method for correcting an attribute added to text information extracted from image data. FIG. 18 is a functional block diagram showing a configuration of an image processing system S6 according to the sixth embodiment of the present invention.

具体的に、本実施の形態による画像処理システムS6は、第5の実施の形態による画像処理システムS5に加え、テキスト意味設定傾向解析モジュール(履歴情報取得部および識別情報取得部に相当)128、テキスト意味ドキュメント傾向比較モジュール(画像種別判別部に相当)130、テキスト意味設定傾向保管モジュール129およびテキスト意味定型設定モジュール(意味設定部、履歴情報取得部および識別情報取得部に相当)131を備えてなる構成となっている。   Specifically, the image processing system S6 according to this embodiment includes a text meaning setting tendency analysis module (corresponding to a history information acquisition unit and an identification information acquisition unit) 128 in addition to the image processing system S5 according to the fifth embodiment. A text meaning document tendency comparison module (corresponding to an image type determination unit) 130, a text meaning setting tendency storage module 129, and a text meaning fixed setting module (corresponding to a meaning setting unit, a history information acquisition unit, and an identification information acquisition unit) 131 are provided. It becomes the composition which becomes.

テキスト意味設定傾向解析モジュール128は、意味情報保管モジュール114で保管されているドキュメントの情報に対し、テキスト意味設定モジュール124およびテキスト意味属性設定モジュール127を介して設定されるユーザの修正内容に傾向があるかどうかを解析する。   The text meaning setting tendency analysis module 128 has a tendency to the user's correction contents set via the text meaning setting module 124 and the text meaning attribute setting module 127 with respect to the document information stored in the meaning information storage module 114. Analyze if there is.

テキスト意味設定傾向保管モジュール129は、テキスト意味設定傾向解析モジュール128によって解析された、あるドキュメントに対して行われるユーザの修正操作の内容と、当該ドキュメントを識別するための情報とを組にして保管する。   The text meaning setting tendency storage module 129 stores the contents of the user's correction operation performed on a certain document analyzed by the text meaning setting tendency analysis module 128 and information for identifying the document as a set. To do.

テキスト意味ドキュメント傾向比較モジュール130は、処理対象となる画像データのドキュメントが、テキスト意味設定傾向保管モジュール129に保管されているドキュメントのレイアウトに類似しているかどうかを比較する。   The text meaning document tendency comparison module 130 compares whether the document of the image data to be processed is similar to the document layout stored in the text meaning setting tendency storage module 129.

テキスト意味定型設定モジュール131は、テキスト意味ドキュメント傾向比較モジュール130にて、処理対象であるドキュメントに類似したドキュメントがテキスト意味設定傾向保管モジュール129にて保管されている場合、テキスト意味設定傾向保管モジュール129より、その傾向を持ったドキュメントに対しユーザが行った過去の修正操作に関する情報を取得し、その操作内容を意味情報保管モジュール114あるいはテキスト意味属性保管モジュール125に格納されている処理対象ドキュメントに関する情報に反映させる。   When the text meaning document setting comparison module 130 stores a document similar to the document to be processed in the text meaning setting trend storage module 129, the text meaning setting trend storage module 129 stores the text meaning setting tendency storage module 129. Thus, information on the past correction operation performed by the user on the document having the tendency is acquired, and information on the processing target document stored in the semantic information storage module 114 or the text semantic attribute storage module 125 is acquired. To reflect.

本実施の形態では、入力される処理対象であるドキュメントに対するテキスト意味解析結果およびテキスト意味属性解析結果についての、ユーザの修正操作の傾向を解析する。そして、新たに入力されるドキュメントのレイアウト等が過去に処理対象となったドキュメントに類似していれば、当該過去に入力されたドキュメント画像に対してユーザが行った修正操作を、新たに入力されたドキュメントにあらかじめ自動的に施した後、当該自動修正した結果をユーザに提示する構成となっている。   In this embodiment, the tendency of the user's correction operation is analyzed for the text semantic analysis result and the text semantic attribute analysis result for the input document to be processed. If the layout of a newly input document is similar to a document that has been processed in the past, a correction operation performed by the user on the previously input document image is newly input. After the document is automatically applied to the document, the result of the automatic correction is presented to the user.

例えば、本実施の形態による画像処理システムS6では、図2に例示したようなレイアウトで配置されたオブジェクトを含むドキュメント画像を取得すると、テキスト意味が「人名」である2つの文字領域のテキスト情報が、ユーザの所望の順序で表示部111にリスト表示される。ここでは、ユーザが、表示部111にてリスト表示された結果から、「人名」としてリスト表示されている項目の内の2番目の項目を、テキスト意味が「人名」ではないものと判断し、リストから削除する操作を行ったものとする。このとき、入力されたドキュメント画像1の情報と、ユーザの修正操作を履歴情報として記録しておく。次に、新たに処理対象となるドキュメントの画像データが画像処理システムS6に入力された場合、過去に処理対象となったドキュメントの画像データとレイアウト等が類似したものであれば、当該過去に処理したドキュメント画像に対して行ったユーザの修正操作を、新たに入力されたドキュメントの画像データに対してあらかじめ自動的に反映させる。つまり、この場合、新たに入力されたドキュメントの画像データについての解析の結果得られる「人名」リストの項目の内の2番目の項目を自動的に削除する。このようにして2番目の項目が削除された「人名」リストをユーザに提示することで、ユーザは過去に類似するドキュメントの画像データに対して行った修正操作を、新たに処理対象となるドキュメントでは省略することができる。   For example, in the image processing system S6 according to the present embodiment, when a document image including an object arranged in the layout illustrated in FIG. 2 is acquired, text information of two character areas whose text meaning is “person name” is obtained. The list is displayed on the display unit 111 in the order desired by the user. Here, from the result of the list displayed on the display unit 111, the user determines that the second item among the items listed as “person name” is not “person name” in the text meaning, It is assumed that an operation for deleting from the list has been performed. At this time, the input document image 1 information and the user's correction operation are recorded as history information. Next, when image data of a document to be processed is newly input to the image processing system S6, if the image data of the document to be processed in the past is similar to the layout or the like, the processing is performed in the past. The user's correction operation performed on the document image is automatically reflected in advance on the newly input document image data. That is, in this case, the second item of the items in the “person name” list obtained as a result of the analysis of the image data of the newly input document is automatically deleted. By presenting the “person name” list from which the second item has been deleted in this way to the user, the user can newly perform a correction operation performed on image data of a similar document in the past. Then it can be omitted.

図19は、本発明の第6の実施の形態による画像処理システムS6における処理の詳細を示すフローチャートである。   FIG. 19 is a flowchart showing details of processing in the image processing system S6 according to the sixth embodiment of the present invention.

まず、画像処理システムS6に入力されたドキュメントに対し、ユーザが行う修正操作の傾向を取得する処理について記述する。   First, a process for obtaining a tendency of a correction operation performed by the user for a document input to the image processing system S6 will be described.

はじめに、画像データ取得部101にて、ドキュメント処理システム23に入力されるドキュメントの画像データを取得する(S501)。   First, the image data acquisition unit 101 acquires image data of a document input to the document processing system 23 (S501).

次に、ドキュメント領域解析モジュール102により、ドキュメント画像中の文字領域を解析し、文字領域を囲む矩形の座標(位置、サイズなど)の情報を取得する。また、文字認識モジュール113により、ドキュメント領域解析モジュール102にて抽出された文字領域のテキスト情報を認識する。そして、テキスト意味解析モジュール115にて、文字認識モジュール113にて認識されたテキスト情報のテキスト意味を認識する。このようにして、ドキュメント領域解析モジュール102、文字認識モジュール113およびテキスト意味解析モジュール115にて取得される各種情報は、意味情報保管モジュール114に保管される(S502)。   Next, the document area analysis module 102 analyzes the character area in the document image and acquires information on the coordinates (position, size, etc.) of the rectangle surrounding the character area. Further, the character recognition module 113 recognizes the text information of the character area extracted by the document area analysis module 102. Then, the text meaning analysis module 115 recognizes the text meaning of the text information recognized by the character recognition module 113. In this way, various types of information acquired by the document area analysis module 102, the character recognition module 113, and the text semantic analysis module 115 are stored in the semantic information storage module 114 (S502).

次に、テキスト意味解析モジュール115にて解析されたテキスト意味のリスト表示における、ユーザの所望の表示順序を、属性としてテキスト意味属性保管モジュール125に保管させる(S503)。   Next, the user's desired display order in the text meaning list display analyzed by the text meaning analysis module 115 is stored in the text meaning attribute storage module 125 as an attribute (S503).

次に、意味情報保管モジュール114およびテキスト意味属性保管モジュール125にて保管されている情報を、テキスト意味属性提示モジュール126により表示部111に画面表示させ、ユーザに提示する(S504)。   Next, the information stored in the semantic information storage module 114 and the text semantic attribute storage module 125 is displayed on the display unit 111 by the text semantic attribute presentation module 126 and presented to the user (S504).

次に、ユーザが表示部111に提示された解析結果を確認した結果、テキスト意味設定モジュール124またはテキスト意味属性設定モジュール127を用いて、テキスト意味またはテキスト意味属性の修正を行った場合(S505,Yes)、S506の処理を実行させる。具体的には、入力されたドキュメントの画像データに関する情報(つまり、意味情報保管モジュール114にて保管されている情報)と、テキスト意味設定傾向解析モジュール128により、テキスト意味設定モジュールあるいはテキスト意味属性設定モジュール127を介して該ドキュメントについて行われたユーザの修正操作内容を示す情報とを関連付けて、テキスト意味設定傾向保管モジュール129に保管させる(S506)。   Next, as a result of confirming the analysis result presented on the display unit 111 by the user, when the text meaning setting module 124 or the text meaning attribute setting module 127 is used to correct the text meaning or the text meaning attribute (S505). Yes), the process of S506 is executed. Specifically, the text semantic setting module or text semantic attribute setting is performed by the information related to the image data of the input document (that is, information stored in the semantic information storage module 114) and the text semantic setting trend analysis module 128. The text meaning setting trend storage module 129 stores the information in association with the information indicating the content of the user's correction operation performed on the document via the module 127 (S506).

例えば、入力されたドキュメントの情報として、ドキュメント領域解析モジュール102にて解析された全文字領域の位置(座標など)を示す情報と、そのドキュメントに類似するレイアウトのドキュメントに対して過去にユーザが行った修正作業の内容に関する情報とが、関連付けてテキスト意味設定傾向保管モジュール129に保管される。   For example, as input document information, a user has performed in the past on information indicating the positions (coordinates, etc.) of all character regions analyzed by the document region analysis module 102 and a document having a layout similar to the document. The information regarding the contents of the correction work is stored in the text meaning setting trend storage module 129 in association with each other.

図20では、ドキュメントの画像データの画像中に含まれる文字領域等のオブジェクトのドキュメント中における座標情報と、これら文字領域について判定された属性情報等に対してユーザが過去に行った修正操作の内容とが組になりテキスト意味設定傾向保管モジュール129に保管されている状況を示す。   In FIG. 20, the contents of the correction operation performed by the user in the past on the coordinate information in the document of the object such as the character area included in the image of the document image data and the attribute information determined on the character area. And shows a situation where the text meaning setting trend storage module 129 is stored.

次に、本実施の形態による画像処理システムS6に処理対象として新たに入力されたドキュメントのレイアウトが、テキスト意味設定傾向保管モジュール129に保管されている(過去に入力された)ドキュメントのレイアウトと類似している場合に、当該過去に入力されたドキュメントに対して行われたユーザの修正操作と同様の内容の修正を上記新たに入力されたドキュメントに対して自動的に施しておき、ユーザに提示する処理について説明する。図21は、本発明の第6の実施の形態における、新規に入力されるドキュメントへの過去の修正操作の反映処理の詳細について説明するためのフローチャートである。   Next, the layout of the document newly input as the processing target in the image processing system S6 according to the present embodiment is similar to the layout of the document stored in the text meaning setting trend storage module 129 (input in the past). If it is, the same correction as the user's correction operation performed on the past input document is automatically applied to the newly input document and presented to the user. Processing to be performed will be described. FIG. 21 is a flowchart for explaining the details of the reflection processing of the past correction operation to the newly input document in the sixth embodiment of the present invention.

まず、画像データ取得部101にて、ドキュメント処理システムS6に入力されるドキュメントの画像データを取得する(S601)。   First, the image data acquisition unit 101 acquires image data of a document input to the document processing system S6 (S601).

次に、ドキュメント領域解析モジュール102により、ドキュメントの画像データの画像中の文字領域等のオブジェクトを解析し、各文字領域を囲む矩形の座標(位置、サイズなど)に関する情報を取得する。また、文字認識モジュール113により、ドキュメント領域解析モジュール102にて画像中から抽出される文字領域からテキスト情報を認識する。そして、テキスト意味解析モジュール115により、文字認識モジュール113にて認識されたテキスト情報のテキスト意味を認識する。このようにして、ドキュメント領域解析モジュール102、文字認識モジュール113およびテキスト意味解析モジュール115にて取得される各種情報は、意味情報保管モジュール114に保管される(S602)。   Next, the document area analysis module 102 analyzes an object such as a character area in the image of the document image data, and acquires information on the coordinates (position, size, etc.) of the rectangle surrounding each character area. In addition, the character recognition module 113 recognizes text information from the character area extracted from the image by the document area analysis module 102. Then, the text meaning analysis module 115 recognizes the text meaning of the text information recognized by the character recognition module 113. In this way, various types of information acquired by the document area analysis module 102, the character recognition module 113, and the text semantic analysis module 115 are stored in the semantic information storage module 114 (S602).

次に、テキスト意味解析モジュール115にて解析されたテキスト意味のリスト表示における、ユーザの所望の表示順序を、属性としてテキスト意味属性保管モジュール125に保管させる(S603)。   Next, the user's desired display order in the list display of the text meaning analyzed by the text meaning analysis module 115 is stored in the text meaning attribute storage module 125 as an attribute (S603).

次に、処理対象として新たに入力されたドキュメントに類似するレイアウトを有するドキュメントに関する情報が、テキスト意味設定傾向保管モジュール129にて保管されているかどうか、テキスト意味ドキュメント傾向比較モジュール128による比較判定処理を行う(S604)。   Next, whether or not information related to a document having a layout similar to a document newly input as a processing target is stored in the text meaning setting trend storage module 129 is compared with the text meaning document trend comparison module 128. This is performed (S604).

テキスト意味ドキュメント傾向比較モジュール128におけるドキュメントの比較については、例えば図20に示すように、テキスト意味設定傾向保管モジュール129に過去に入力されたドキュメントから抽出された全ての文字領域の座標値に関する情報が保管されている場合、ドキュメント領域解析モジュール102にて取得された、新たに入力されたドキュメントの画像データから抽出される文字領域の座標値と比較し、その値の差が小さければ、2つのドキュメントは類似していると判断する。   As for comparison of documents in the text meaning document tendency comparison module 128, as shown in FIG. 20, for example, information on the coordinate values of all character areas extracted from documents input in the past to the text meaning setting tendency storage module 129 is obtained. If the difference is small when compared with the coordinate value of the character area extracted from the image data of the newly input document acquired by the document area analysis module 102, the two documents are stored. Are judged to be similar.

なお、ここでは、ドキュメント画像中に含まれる文字領域の座標(ドキュメントにおけるオブジェクトのレイアウトに関する情報)のみを用いてドキュメントの類似を判定する構成を例示したが、これに限られるものではない。例えば、ドキュメントの画像中に含まれる文字領域のテキスト情報を利用し、類比の対象となる2つのドキュメント間で共通して含む単語が多い場合には類似するドキュメントであると判断するなど、意味情報保管モジュール114および領域意味属性保管モジュール125にて保存されている種々の情報を用いて、ドキュメントの比較を行うこともできる。   Here, the configuration in which the similarity of the document is determined using only the coordinates of the character area included in the document image (information regarding the layout of the object in the document) is illustrated, but the present invention is not limited to this. For example, using text information of a character area included in a document image, if there are many words included in common between two documents to be compared, the semantic information is determined to be similar. Documents can also be compared using various information stored in the storage module 114 and the area meaning attribute storage module 125.

次に、画像処理システムS6に入力されたドキュメントに類似するレイアウトを有するドキュメントに関する情報がテキスト意味設定傾向保管モジュール129に保管されている場合(S604,Yes)、新たに入力されたドキュメントの画像データに対し、テキスト意味設定傾向保管モジュール129に保管されている、当該新たに入力されたドキュメントに類似するドキュメントに対して過去にユーザが行った修正操作と同様の内容の修正処理を、テキスト意味定型設定モジュール131により自動的に施す。   Next, when information regarding a document having a layout similar to the document input to the image processing system S6 is stored in the text meaning setting trend storage module 129 (S604, Yes), image data of the newly input document On the other hand, the text semantic fixed form is subjected to correction processing having the same content as the correction operation previously performed by the user on the document similar to the newly input document stored in the text meaning setting trend storage module 129. Automatically performed by the setting module 131.

具体的には、S604にて、テキスト意味ドキュメント傾向比較モジュール130が、新規に画像処理システムS6に入力されたドキュメントが、図20に示すようにテキスト意味設定傾向保管モジュール129に情報が保管されているドキュメントAに類似していると判定した場合(S604,Yes)、テキスト意味定型設定モジュール131は、テキスト意味設定傾向保管モジュール129にて保管されている、ドキュメントAに対してユーザが行った修正操作と同様の内容の修正処理を当該新規に入力されたドキュメントの画像データに対して実行する。すなわち、ここでは、テキスト意味が「人名」であり、ユーザが所望する順位が2番目のテキスト情報である、と解析されたテキスト情報を、テキスト意味が「人名」ではないと修正するようにテキスト意味設定モジュール124に指示を出す。   Specifically, in S604, the text meaning document tendency comparison module 130 stores the information newly stored in the text meaning setting tendency storage module 129 as shown in FIG. 20 in the image processing system S6. If it is determined that the document A is similar to the existing document A (S604, Yes), the text semantic fixed setting module 131 corrects the document A stored in the text semantic setting trend storage module 129 by the user. A correction process having the same contents as the operation is performed on the image data of the newly input document. In other words, here, the text information that has been analyzed that the text meaning is “person name” and the order desired by the user is the second text information is corrected so that the text meaning is not “person name”. An instruction is issued to the meaning setting module 124.

テキスト意味属性提示モジュール126は、新規に画像処理システムS6に入力されたドキュメントとレイアウトが類似するドキュメントに関する情報が、テキスト意味設定傾向保管モジュール129にある場合(S604,Yes)には、S605で修正を施した結果を表示部111にてユーザに提示させ(S605)、類似したドキュメントに関する情報がない場合(S604,No)にはS602およびS603における解析結果を表示部111にてユーザに提示させる(S606)。   The text meaning attribute presentation module 126 corrects the information in the text meaning setting tendency storage module 129 in step S605 if the text meaning setting tendency storage module 129 has information on a document whose layout is similar to the document newly input to the image processing system S6. The display unit 111 presents the result of performing (S605), and if there is no information regarding a similar document (S604, No), the display unit 111 presents the analysis result in S602 and S603 ( S606).

次に、表示部111にて提示されたテキスト意味もしくはテキスト意味属性の内容をユーザが修正した場合(S607,Yes)には、テキスト意味設定傾向解析モジュール128により、当該意味および属性の判定内容が修正された新規入力ドキュメントとユーザの修正操作を対応付けて、テキスト意味設定傾向保管モジュール129に保管し(S608)、処理を終了する。一方、表示部111にて提示された内容をユーザが修正していなければ(S607,No)処理を終了する。   Next, when the user corrects the content of the text meaning or the text meaning attribute presented on the display unit 111 (S607, Yes), the text meaning setting trend analysis module 128 determines the content of determination of the meaning and attribute. The corrected new input document and the user's correction operation are associated with each other and stored in the text meaning setting trend storage module 129 (S608), and the process ends. On the other hand, if the user has not corrected the content presented on the display unit 111 (S607, No), the process is terminated.

また、上述の各実施の形態では、ドキュメントの画像データの画像中から抽出されるオブジェクトが主に文字領域である例を示したが、これに限られるものではなく、通常のドキュメントに含まれ得る図形や写真画像等のオブジェクトも抽出の対象となり得ることは言うまでもない。   In each of the above-described embodiments, an example in which an object extracted from an image of document image data is mainly a character area has been described. However, the present invention is not limited to this, and can be included in a normal document. Needless to say, objects such as figures and photographic images can also be extracted.

なお、上述の各実施の形態では、オブジェクトと当該オブジェクトについての意味判定結果を画面表示することにより、ユーザへの通知を行う構成を例に挙げたが、これに限られるものではなく、例えば、音声によって上記と同様な内容の通知を行うようにしてもよい。   In each of the above-described embodiments, the configuration in which notification is given to the user by displaying the object and the semantic determination result about the object on the screen is given as an example. However, the present invention is not limited to this. For example, You may make it perform notification of the content similar to the above by an audio | voice.

なお、上述の実施の形態では、スキャンした画像データに対して所定のルールに基づく意味判定処理を施し、当該判定処理の処理結果に対し、候補選択部による選択や、意味設定部によるユーザや文書種別に応じた意味設定を行う構成を例示したが、これに限られるものではなく、例えば、スキャンした画像データに対してユーザや文書種別に応じて予め決定されているルールに基づいて、意味判定処理を行うようにしてもよい。   In the above-described embodiment, the scanned image data is subjected to semantic determination processing based on a predetermined rule, and the processing result of the determination processing is selected by the candidate selection unit or the user or document by the semantic setting unit. The configuration for performing the semantic setting according to the type is illustrated, but the configuration is not limited to this. For example, the semantic determination is performed based on a rule determined in advance according to the user or the document type with respect to the scanned image data. Processing may be performed.

このような処理アルゴリズムとすることにより、上述の実施の形態におけるオブジェクトへの適切な意味付けの選択を行う処理ステップを削減することができる。   By adopting such a processing algorithm, it is possible to reduce processing steps for selecting an appropriate meaning for an object in the above-described embodiment.

上述の画像処理システムでの処理における各ステップは、メモリ802に格納されている画像処理プログラムをCPU801に実行させることにより実現されるものである。   Each step in the processing in the above-described image processing system is realized by causing the CPU 801 to execute an image processing program stored in the memory 802.

本実施の形態では装置内部に発明を実施する機能が予め記録されている場合で説明をしたが、これに限らず同様の機能をネットワークから装置にダウンロードしても良いし、同様の機能を記録媒体に記憶させたものを装置にインストールしてもよい。記録媒体としては、CD−ROM等プログラムを記憶でき、かつ装置が読み取り可能な記録媒体であれば、その形態は何れの形態であっても良い。またこのように予めインストールやダウンロードにより得る機能は装置内部のOS(オペレーティング・システム)等と共働してその機能を実現させるものであってもよい。   In this embodiment, the function for implementing the invention is recorded in advance in the apparatus. However, the present invention is not limited to this, and the same function may be downloaded from the network to the apparatus, and the same function is recorded. What is stored in the medium may be installed in the apparatus. The recording medium may be any form as long as the recording medium can store the program and can be read by the apparatus, such as a CD-ROM. Further, the function obtained by installing or downloading in advance may be realized in cooperation with an OS (operating system) or the like inside the apparatus.

本発明を特定の態様により詳細に説明したが、本発明の精神および範囲を逸脱しないかぎり、様々な変更および改質がなされ得ることは、当業者には自明であろう。   Although the present invention has been described in detail according to particular embodiments, it will be apparent to those skilled in the art that various changes and modifications can be made without departing from the spirit and scope of the invention.

本発明の第1の実施の形態による画像処理システムS1について説明するための機能ブロック図である。It is a functional block diagram for demonstrating image processing system S1 by the 1st Embodiment of this invention. 処理対象となるドキュメントの一例を示す図である。It is a figure which shows an example of the document used as a process target. 本発明の第1の実施の形態における処理の流れについて説明するための図である。It is a figure for demonstrating the flow of the process in the 1st Embodiment of this invention. 意味情報保管モジュール114にて統合的に保管される各種情報それぞれの関わり合いを示す図である。It is a figure which shows the relationship between each of the various information stored integrally by the semantic information storage module 114. FIG. 本発明の第2の実施の形態による画像処理システムS2について説明するための機能ブロック図である。It is a functional block diagram for demonstrating image processing system S2 by the 2nd Embodiment of this invention. 本発明の第2の実施の形態における処理の流れについて説明するためのフローチャートである。It is a flowchart for demonstrating the flow of the process in the 2nd Embodiment of this invention. 領域意味属性保管モジュール116に格納されるデータテーブルの一例を示す図である。It is a figure which shows an example of the data table stored in the area | region meaning attribute storage module. 表示部111にて画面表示されるGUI画面の一例を示す図である。6 is a diagram illustrating an example of a GUI screen displayed on the display unit 111. FIG. 本発明の第3の実施の形態による画像処理システムS3について説明するための機能ブロック図である。It is a functional block diagram for demonstrating image processing system S3 by the 3rd Embodiment of this invention. 入力されたドキュメントの画像データに対し、ユーザが行う修正操作の傾向を取得する処理について説明するためのフローチャートである。It is a flowchart for demonstrating the process which acquires the tendency of correction operation which a user performs with respect to the image data of the input document. ドキュメントの各文字領域の座標と、当該ドキュメントと類似するドキュメント画像に対してユーザが過去行った修正操作の内容とが対応付けられて保管されている状況を示す図である。It is a figure which shows the condition where the coordinate of each character area of a document, and the content of the correction operation which the user performed in the past with respect to the document image similar to the said document are matched and stored. 本実施の形態による画像処理システムS3における処理の詳細について説明するためのフローチャートである。It is a flowchart for demonstrating the detail of the process in image processing system S3 by this Embodiment. 本発明の第4の実施の形態による画像処理システムS4の構成を示す機能ブロック図である。It is a functional block diagram which shows the structure of image processing system S4 by the 4th Embodiment of this invention. 本発明の第5の実施の形態による画像処理システムS5の構成を示す機能ブロック図である。It is a functional block diagram which shows the structure of image processing system S5 by the 5th Embodiment of this invention. 本発明の第5の実施の形態による画像処理システムS5の処理の詳細について説明するためのフローチャートである。It is a flowchart for demonstrating the detail of a process of image processing system S5 by the 5th Embodiment of this invention. テキスト意味属性保管モジュール125に保管されるテキスト意味属性を示すデータテーブルの一例である。It is an example of the data table which shows the text meaning attribute stored in the text meaning attribute storage module 125. テキスト意味属性提示モジュール126により表示部111にて表示させるGUIの表示例を示す図である。It is a figure which shows the example of a display of GUI displayed on the display part 111 by the text meaning attribute presentation module 126. FIG. 本発明の第6の実施の形態による画像処理システムS6の構成を示す機能ブロック図である。It is a functional block diagram which shows the structure of image processing system S6 by the 6th Embodiment of this invention. 本発明の第6の実施の形態による画像処理システムS6における処理の詳細を示すフローチャートである。It is a flowchart which shows the detail of the process in image processing system S6 by the 6th Embodiment of this invention. 文字領域等のオブジェクトのドキュメント中における座標情報と、これら文字領域について判定された属性情報等に対してユーザが過去に行った修正操作の内容とが組になり保管されている状況を示す図である。The figure which shows the situation where the coordinate information in the document of objects, such as a character area, and the content of the correction operation which the user performed in the past with respect to the attribute information etc. which were determined about these character areas are made into a set, and are stored. is there. 本発明の第6の実施の形態における、新規に入力されるドキュメントへの過去の修正操作の反映処理の詳細について説明するためのフローチャートである。It is a flowchart for demonstrating the detail of the reflection process of the past correction operation to the document newly input in the 6th Embodiment of this invention.

符号の説明Explanation of symbols

S1〜S6 画像処理システム、101 画像データ取得部、102 ドキュメント領域解析モジュール、104 領域意味解析モジュール、108 領域意味提示モジュール、110 領域意味設定モジュール、111 表示部、112 操作入力部、113 文字認識モジュール、114 意味情報保管モジュール、115 テキスト意味解析モジュール、116 領域意味属性保管モジュール、117 領域意味属性提示モジュール、118 領域意味属性設定モジュール、119 領域意味設定傾向解析モジュール、120 領域意味ドキュメント傾向比較モジュール、121 領域意味設定傾向保管モジュール、122 領域意味定型設定モジュール、123 テキスト意味提示モジュール、124 テキスト意味設定モジュール、125 テキスト意味属性保管モジュール、126 テキスト意味属性提示モジュール、127 テキスト意味属性設定モジュール、128 テキスト意味設定傾向解析モジュール、130 テキスト意味ドキュメント傾向比較モジュール、129 テキスト意味設定傾向保管モジュール、131 テキスト意味定型設定モジュール、801 CPU、802 メモリ。 S1 to S6 Image processing system, 101 Image data acquisition unit, 102 Document area analysis module, 104 Area meaning analysis module, 108 Area meaning presentation module, 110 Area meaning setting module, 111 Display section, 112 Operation input section, 113 Character recognition module , 114 semantic information storage module, 115 text semantic analysis module, 116 area semantic attribute storage module, 117 area semantic attribute presentation module, 118 area semantic attribute setting module, 119 area semantic setting trend analysis module, 120 area semantic document trend comparison module, 121 area meaning setting tendency storage module, 122 area meaning fixed form setting module, 123 text meaning presentation module, 124 text meaning setting module, 125 text Semantic attribute storage module, 126 text semantic attribute presentation module, 127 text semantic attribute setting module, 128 text semantic setting trend analysis module, 130 text semantic document trend comparison module, 129 text semantic setting trend storage module, 131 text semantic fixed setting module , 801 CPU, 802 memory.

Claims (14)

画像データを取得する画像データ取得部と、
前記画像データ取得部にて取得される画像データの画像中に含まれるオブジェクトを抽出するオブジェクト抽出部と、
所定の判定ルールに基づいて、前記オブジェクト抽出部にて抽出されるオブジェクトの前記画像データのレイアウト中における意味を判定する意味判定部と、
前記意味判定部にて複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された複数のオブジェクトに関する情報を、該意味に関する情報に関連付けてリスト表示させる通知部と、
ユーザの操作入力を受け付ける操作入力部と、
前記操作入力部にて受け付けたユーザの操作入力により選択されたオブジェクトを、該オブジェクトについて前記意味判定部にて判定された意味を有するものとして設定する意味設定部と、
前記操作入力部によるオブジェクトの選択履歴を取得する履歴情報取得部と、を備え、
前記意味設定部は、前記意味判定部にて複数のオブジェクトが同一の意味を有すると判定された場合に、前記履歴情報取得部にて取得される履歴情報に基づいて、前記通知部によりリスト表示されるオブジェクトの内の過去に選択された頻度が最も高いオブジェクトを、該オブジェクトについて前記意味判定部にて判定された意味を有するものとして設定する画像処理システム。
An image data acquisition unit for acquiring image data;
An object extraction unit that extracts an object included in an image of the image data acquired by the image data acquisition unit;
A semantic determination unit that determines the meaning of the object extracted by the object extraction unit in the layout of the image data based on a predetermined determination rule;
A notification unit configured to display a list of information related to a plurality of objects determined to have the meaning in association with the information related to the meaning when the meaning determination unit determines that the plurality of objects have the same meaning; ,
An operation input unit for receiving user operation inputs;
A meaning setting unit that sets the object selected by the user's operation input received by the operation input unit as having the meaning determined by the meaning determination unit for the object;
A history information acquisition unit that acquires an object selection history by the operation input unit ,
The meaning setting unit displays a list by the notification unit based on history information acquired by the history information acquisition unit when the meaning determination unit determines that a plurality of objects have the same meaning. An image processing system that sets an object having the highest frequency of selection in the past as having the meaning determined by the meaning determination unit for the object .
画像データを取得する画像データ取得部と、An image data acquisition unit for acquiring image data;
前記画像データ取得部にて取得される画像データの画像中に含まれるオブジェクトを抽出するオブジェクト抽出部と、An object extraction unit that extracts an object included in an image of the image data acquired by the image data acquisition unit;
所定の判定ルールに基づいて、前記オブジェクト抽出部にて抽出されるオブジェクトの前記画像データのレイアウト中における意味を判定する意味判定部と、A semantic determination unit that determines the meaning of the object extracted by the object extraction unit in the layout of the image data based on a predetermined determination rule;
前記意味判定部にて複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された各オブジェクトの順位を判定する信頼度判定部と、A reliability determination unit that determines the rank of each object determined to have the meaning when the meaning determination unit determines that the plurality of objects have the same meaning;
前記意味判定部にて複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された複数のオブジェクトに関する情報を、該意味に関連付けて、前記信頼度判定部にて判定される順位が高い順にリスト表示させる通知部と、When the meaning determination unit determines that the plurality of objects have the same meaning, the reliability determination unit associates information about the plurality of objects determined to have the meaning with the meaning. A notification unit for displaying a list in descending order of determination;
ユーザの操作入力を受け付ける操作入力部と、An operation input unit for receiving user operation inputs;
前記操作入力部にて受け付けたユーザの操作入力により選択されたオブジェクトを、該オブジェクトについて前記意味判定部にて判定された意味を有するものとして設定するとともに、前記操作入力部にて受け付けたユーザの操作入力により、オブジェクトの順位を変更する意味設定部と、The object selected by the user's operation input received by the operation input unit is set as having the meaning determined by the meaning determination unit for the object, and the object received by the operation input unit A semantic setting unit for changing the order of objects by operation input;
前記操作入力部によるオブジェクトの選択履歴およびオブジェクトの順位の履歴を取得する履歴情報取得部と、を備え、A history information acquisition unit for acquiring an object selection history and an object ranking history by the operation input unit,
前記通知部は、前記意味判定部にて複数のオブジェクトが同一の意味を有すると判定された場合に、前記履歴情報取得部にて取得されるオブジェクトの選択履歴およびオブジェクトの順位の履歴を反映させてオブジェクトをリスト表示する画像処理システム。The notification unit reflects the object selection history and the object ranking history acquired by the history information acquisition unit when the meaning determination unit determines that the plurality of objects have the same meaning. An image processing system that displays objects as a list.
画像データを取得する画像データ取得部と、An image data acquisition unit for acquiring image data;
前記画像データ取得部にて取得される画像データの画像中に含まれるオブジェクトを抽出するオブジェクト抽出部と、An object extraction unit that extracts an object included in an image of the image data acquired by the image data acquisition unit;
所定の判定ルールに基づいて、前記オブジェクト抽出部にて抽出されるオブジェクトの前記画像データのレイアウト中における意味を判定する意味判定部と、A semantic determination unit that determines the meaning of the object extracted by the object extraction unit in the layout of the image data based on a predetermined determination rule;
前記意味判定部にて複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された各オブジェクトの順位を、前記画像データのレイアウトにおける前記各オブジェクトの位置に基づいて判定する信頼度判定部と、When the plurality of objects are determined to have the same meaning by the meaning determination unit, the rank of each object determined to have the meaning is determined based on the position of each object in the layout of the image data. A reliability determination unit for determining;
前記意味判定部にて複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された複数のオブジェクトに関する情報を、該意味に関する情報に関連付けて、前記信頼度判定部にて判定される順位が高い順にリスト表示させる通知部と、When the meaning determination unit determines that the plurality of objects have the same meaning, the reliability determination unit associates information on the plurality of objects determined to have the meaning with the information on the meaning. A notification unit for displaying a list in descending order of determination in
を備える画像処理システム。An image processing system comprising:
画像データを取得する画像データ取得部と、An image data acquisition unit for acquiring image data;
前記画像データ取得部にて取得される画像データの画像中に含まれるテキスト情報を抽出する抽出部と、An extraction unit that extracts text information included in an image of the image data acquired by the image data acquisition unit;
所定の判定ルールに基づいて、前記抽出部にて抽出されるテキスト情報中に人名のテキスト情報があるか否かを判定する意味判定部と、Based on a predetermined determination rule, a meaning determination unit that determines whether there is text information of a person name in the text information extracted by the extraction unit;
前記意味判定部が人名と判定したテキスト情報の順位を、前記テキスト情報の近隣に所定の付記文字があるか否か、および付記文字の種類に基づいて判定する信頼度判定部と、  A reliability determination unit that determines, based on the type of additional characters, whether or not there is a predetermined additional character in the vicinity of the text information, and the ranking of the text information determined by the meaning determining unit as a person name;
前記意味判定部にて人名のテキスト情報と判定されたテキスト情報が複数ある場合に、該人名のテキスト情報を、前記信頼度判定部にて判定される順位が高い順にリスト表示させる通知部と、When there are a plurality of text information determined as the text information of the name of the person in the meaning determination section, the notification section that displays the list of the text information of the name of the person in descending order of the order determined by the reliability determination section;
を備えてなる画像処理システム。An image processing system comprising:
請求項1に記載の画像処理システムにおいて、
前記意味判定部における意味判定処理の信頼度を判定する信頼度判定部を備え、
前記通知部は、前記意味判定部にて複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された複数のオブジェクトを、該意味に関連付けて、前記信頼度判定部にて判定される信頼度が高い順にリスト表示させる画像処理システム。
The image processing system according to claim 1,
A reliability determination unit that determines the reliability of the meaning determination process in the meaning determination unit;
When the meaning determining unit determines that the plurality of objects have the same meaning, the notification unit associates the plurality of objects determined to have the meaning with the meaning, and determines the reliability. An image processing system that causes a list to be displayed in descending order of reliability.
請求項3に記載の画像処理システムにおいて、
前記操作入力部にて受け付けたユーザの操作入力により選択されたオブジェクトを、該オブジェクトについて前記意味判定部にて判定された意味を有するものとして設定する意味設定部と、
前記操作入力部によるオブジェクトの選択履歴を取得する履歴情報取得部を備え、
前記意味設定部は、前記意味判定部にて複数のオブジェクトが同一の意味を有すると判定された場合に、前記履歴情報取得部にて取得される履歴情報に基づいて、前記通知部によりリスト表示されるオブジェクトの内の過去に選択された頻度が最も高いオブジェクトを、該オブジェクトについて前記意味判定部にて判定された意味を有するものとして設定する画像処理システム。
The image processing system according to claim 3 .
A meaning setting unit that sets the object selected by the user's operation input received by the operation input unit as having the meaning determined by the meaning determination unit for the object;
Includes a history information acquisition unit that acquires the selection history of the object by the operation input unit,
The meaning setting unit displays a list by the notification unit based on history information acquired by the history information acquisition unit when the meaning determination unit determines that a plurality of objects have the same meaning. An image processing system that sets an object having the highest frequency of selection in the past as having the meaning determined by the meaning determination unit for the object.
請求項1、または請求項6のいずれかに記載の画像処理システムにおいて、
前記操作入力部によるオブジェクトの選択を行うユーザを識別するための識別情報を取得する識別情報取得部を備え、
前記履歴情報取得部は、前記識別情報取得部にて取得された識別情報に対応するユーザによる前記操作入力部にて受け付けたオブジェクトの選択履歴に関する情報を取得する画像処理システム。
The image processing system according to claim 1, wherein:
An identification information acquisition unit for acquiring identification information for identifying a user who selects an object by the operation input unit ;
The history information acquisition unit is an image processing system that acquires information related to an object selection history received by the operation input unit by a user corresponding to the identification information acquired by the identification information acquisition unit.
請求項1〜請求項3のいずれかに記載の画像処理システムにおいて、
前記オブジェクト抽出部にて抽出されるオブジェクトが文字である場合に、当該文字の属性を判定する文字属性判定部と、
前記文字属性判定部により属性が判定された文字を、該文字について判定された属性の文字を入力とすべき所定の処理における入力文字候補として表示させる入力候補表示部と、を備えてなる画像処理システム。
In the image processing system according to any one of claims 1 to 3 ,
A character attribute determination unit that determines an attribute of the character when the object extracted by the object extraction unit is a character;
An input candidate display unit that displays a character whose attribute is determined by the character attribute determination unit as an input character candidate in a predetermined process in which the character having the attribute determined for the character is to be input. system.
画像データを取得し、
前記取得される画像データの画像中に含まれるオブジェクトを抽出し、
所定の判定ルールに基づいて、前記抽出されるオブジェクトの前記画像データのレイアウト中における意味を判定し、
複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された複数のオブジェクトに関する情報を、該意味に関する情報に関連付けてリスト表示し、
ユーザの操作入力を受け付け、
受け付けたユーザの操作入力により選択されたオブジェクトを、該オブジェクトについて判定された意味を有するものとして設定し、
受け付けたオブジェクトの選択履歴を取得し
複数のオブジェクトが同一の意味を有すると判定された場合に、取得されるオブジェクトの履歴情報に基づいて、リスト表示されるオブジェクトの内の過去に選択された頻度が最も高いオブジェクトを、該オブジェクトについて判定された意味を有するものとして設定する画像処理方法。
Get image data,
Extracting an object contained in the image of the acquired image data;
Based on a predetermined determination rule, determine the meaning of the extracted object in the layout of the image data,
When a plurality of objects are determined to have the same meaning, information related to the plurality of objects determined to have the meaning is displayed in a list in association with the information related to the meaning .
Accept user input,
The object selected by the received user operation input is set as having the determined meaning for the object,
Get selection history of accepted objects ,
When it is determined that a plurality of objects have the same meaning, an object with the highest frequency selected in the past among the objects displayed in the list is selected for the object based on the history information of the acquired object. An image processing method set as having a determined meaning .
画像データを取得し、Get image data,
前記取得される画像データの画像中に含まれるオブジェクトを抽出し、Extracting an object contained in the image of the acquired image data;
所定の判定ルールに基づいて、前記抽出されるオブジェクトの前記画像データのレイアウト中における意味を判定し、Based on a predetermined determination rule, determine the meaning of the extracted object in the layout of the image data,
複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された各オブジェクトの順位を判定し、When it is determined that a plurality of objects have the same meaning, the order of each object determined to have the meaning is determined,
複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された複数のオブジェクトに関する情報を、該意味に関連付けて、判定された順位が高い順にリスト表示し、When it is determined that a plurality of objects have the same meaning, information on the plurality of objects determined to have the meaning is associated with the meaning and displayed in a list in descending order of the determined order.
ユーザの操作入力を受け付け、Accept user input,
受け付けたユーザの操作入力により選択されたオブジェクトを、該オブジェクトについて判定された意味を有するものとして設定するとともに、受け付けたユーザの操作入力により、オブジェクトの順位を変更し、The object selected by the received user operation input is set as having the determined meaning for the object, and the order of the objects is changed by the received user operation input,
オブジェクトの選択履歴およびオブジェクトの順位の履歴を取得し、Get object selection history and object ranking history,
複数のオブジェクトが同一の意味を有すると判定された場合に、取得されるオブジェクトの選択履歴およびオブジェクトの順位の履歴を反映させてオブジェクトをリスト表示する画像処理方法。An image processing method for displaying an object in a list by reflecting an acquired object selection history and an object ranking history when a plurality of objects are determined to have the same meaning.
画像データを取得し、Get image data,
前記取得される画像データの画像中に含まれるオブジェクトを抽出し、Extracting an object contained in the image of the acquired image data;
所定の判定ルールに基づいて、前記抽出されるオブジェクトの前記画像データのレイアウト中における意味を判定し、Based on a predetermined determination rule, determine the meaning of the extracted object in the layout of the image data,
複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された各オブジェクトの順位を、前記画像データのレイアウトにおける前記各オブジェクトの位置に基づいて判定し、When it is determined that a plurality of objects have the same meaning, the order of each object determined to have the meaning is determined based on the position of each object in the layout of the image data,
複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された複数のオブジェクトに関する情報を、該意味に関する情報に関連付けて、判定された順位が高い順にリスト表示する画像処理方法。When it is determined that a plurality of objects have the same meaning, information relating to the plurality of objects determined to have the meaning is associated with the information related to the meaning and displayed as a list in descending order of the determined order. Processing method.
画像データを取得し、
前記取得される画像データの画像中に含まれるオブジェクトを抽出し、
所定の判定ルールに基づいて、前記抽出されるオブジェクトの前記画像データのレイアウト中における意味を判定し、
複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された複数のオブジェクトに関する情報を、該意味に関する情報に関連付けてリスト表示し、
ユーザの操作入力により選択されたオブジェクトを、該オブジェクトについて判定された意味を有するものとして設定し、
ユーザの操作入力により選択されたオブジェクトの選択履歴を取得し
複数のオブジェクトが同一の意味を有すると判定された場合に、取得されるオブジェクトの履歴情報に基づいて、リスト表示されるオブジェクトの内の過去に選択された頻度が最も高いオブジェクトを、該オブジェクトについて判定された意味を有するものとして設定する
処理をコンピュータに実行させる画像処理プログラム。
Get image data,
Extracting an object contained in the image of the acquired image data;
Based on a predetermined determination rule, determine the meaning of the extracted object in the layout of the image data,
When a plurality of objects are determined to have the same meaning, information related to the plurality of objects determined to have the meaning is displayed in a list in association with the information related to the meaning .
The object selected by the user's operation input is set as having the determined meaning for the object,
Get selection history of objects selected by user operation input ,
When it is determined that a plurality of objects have the same meaning, an object with the highest frequency selected in the past among the objects displayed in the list is selected for the object based on the history information of the acquired object. An image processing program for causing a computer to execute a process of setting as having a determined meaning .
画像データを取得し、Get image data,
前記取得される画像データの画像中に含まれるオブジェクトを抽出し、Extracting an object contained in the image of the acquired image data;
所定の判定ルールに基づいて、前記抽出されるオブジェクトの前記画像データのレイアウト中における意味を判定し、Based on a predetermined determination rule, determine the meaning of the extracted object in the layout of the image data,
複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された各オブジェクトの順位を判定し、When it is determined that a plurality of objects have the same meaning, the order of each object determined to have the meaning is determined,
複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された複数のオブジェクトに関する情報を、該意味に関連付けて、判定された順位が高い順にリスト表示し、When it is determined that a plurality of objects have the same meaning, information on the plurality of objects determined to have the meaning is associated with the meaning and displayed in a list in descending order of the determined order.
ユーザの操作入力により選択されたオブジェクトを、該オブジェクトについて判定された意味を有するものとして設定するとともに、受け付けたユーザの操作入力により、オブジェクトの順位を変更し、The object selected by the user's operation input is set as having the determined meaning for the object, and the order of the objects is changed by the received user operation input,
オブジェクトの選択履歴およびオブジェクトの順位の履歴を取得し、Get object selection history and object ranking history,
複数のオブジェクトが同一の意味を有すると判定された場合に、取得されるオブジェクトの選択履歴およびオブジェクトの順位の履歴を反映させてオブジェクトをリスト表示するWhen a plurality of objects are determined to have the same meaning, the object selection list and the object order history are reflected to display a list of objects.
処理をコンピュータに実行させる画像処理プログラム。An image processing program that causes a computer to execute processing.
画像データを取得し、Get image data,
前記取得される画像データの画像中に含まれるオブジェクトを抽出し、Extracting an object contained in the image of the acquired image data;
所定の判定ルールに基づいて、前記抽出されるオブジェクトの前記画像データのレイアウト中における意味を判定し、Based on a predetermined determination rule, determine the meaning of the extracted object in the layout of the image data,
複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された各オブジェクトの順位を、前記画像データのレイアウトにおける前記各オブジェクトの位置に基づいて判定し、When it is determined that a plurality of objects have the same meaning, the order of each object determined to have the meaning is determined based on the position of each object in the layout of the image data,
複数のオブジェクトが同一の意味を有すると判定された場合に、該意味を有すると判定された複数のオブジェクトに関する情報を、該意味に関する情報に関連付けて、判定された順位が高い順にリスト表示するWhen it is determined that a plurality of objects have the same meaning, information on the plurality of objects determined to have the meaning is associated with the information on the meaning and displayed in a list in descending order of the determined order.
処理をコンピュータに実行させる画像処理プログラム。An image processing program that causes a computer to execute processing.
JP2007257287A 2007-01-17 2007-10-01 Image processing system, image processing method, and image processing program Expired - Fee Related JP4964080B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US11/966,330 US8189920B2 (en) 2007-01-17 2007-12-28 Image processing system, image processing method, and image processing program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US88528607P 2007-01-17 2007-01-17
US60/885,286 2007-01-17

Publications (2)

Publication Number Publication Date
JP2008176764A JP2008176764A (en) 2008-07-31
JP4964080B2 true JP4964080B2 (en) 2012-06-27

Family

ID=39703710

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007257287A Expired - Fee Related JP4964080B2 (en) 2007-01-17 2007-10-01 Image processing system, image processing method, and image processing program

Country Status (1)

Country Link
JP (1) JP4964080B2 (en)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5720350B2 (en) * 2011-03-23 2015-05-20 富士ゼロックス株式会社 Information processing apparatus, information processing program, and information processing system
JP2014013534A (en) * 2012-07-05 2014-01-23 Ricoh Co Ltd Document processor, image processor, image processing method and document processing program
JP7150967B2 (en) * 2018-01-23 2022-10-11 キヤノン株式会社 Apparatus, method, and program for setting information related to scanned images
JP7401344B2 (en) * 2020-01-21 2023-12-19 キヤノン株式会社 Image processing system for digitizing documents, its control method and program
US20240126978A1 (en) * 2022-10-14 2024-04-18 Google Llc Determining attributes for elements of displayable content and adding them to an accessibility tree
JP7543489B2 (en) * 2023-02-09 2024-09-02 キヤノン株式会社 Information processing device, control method thereof, and program

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4565585B2 (en) * 2000-04-13 2010-10-20 キヤノン株式会社 Data processing apparatus, data processing method, and recording medium
JP3994625B2 (en) * 2000-05-11 2007-10-24 コニカミノルタビジネステクノロジーズ株式会社 Image forming apparatus, image forming method, and computer-readable recording medium storing image forming program

Also Published As

Publication number Publication date
JP2008176764A (en) 2008-07-31

Similar Documents

Publication Publication Date Title
US8189920B2 (en) Image processing system, image processing method, and image processing program
US8107727B2 (en) Document processing apparatus, document processing method, and computer program product
US11303769B2 (en) Image processing system that computerizes documents with notification of labeled items, control method thereof, and storage medium
US11836442B2 (en) Information processing apparatus, method, and storage medium for associating metadata with image data
US20070098263A1 (en) Data entry apparatus and program therefor
US7610274B2 (en) Method, apparatus, and program for retrieving data
CN107533648A (en) Character input acceptance method, character input acceptance apparatus and character input receiving procedure
JP4964080B2 (en) Image processing system, image processing method, and image processing program
CN103699891B (en) Image processing apparatus and image processing method
JP2018128996A (en) Information processing apparatus, control method, and program
JP7532085B2 (en) Image processing device, image processing method, and program
US20150261735A1 (en) Document processing system, document processing apparatus, and document processing method
CN111444751B (en) Information processing apparatus, storage medium, and information processing method
JP2007026316A (en) Image management apparatus, image management computer program, and recording medium recording the same
JPWO2014170965A1 (en) Document processing method, document processing apparatus, and document processing program
JP4983464B2 (en) Form image processing apparatus and form image processing program
JP2014006758A (en) Preserved document delivery management system and preserved document delivery management method
US10409390B2 (en) Display device and method for controlling display device
JP2016018454A (en) Image processing system and controlling method thereof
CN110909723B (en) Information processing apparatus and computer-readable storage medium
JP2008040753A (en) Image processing apparatus, method, program, and recording medium
CN113347314B (en) Information and image processing device, system and recording medium
JP3979288B2 (en) Document search apparatus and document search program
JP2017204270A (en) Character string area/character rectangle extraction apparatus, character string area/character rectangle extraction method, and program
EP3287952A1 (en) Input control program, input control device, input control method, character correction program, character correction device, and character correction method

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20090803

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100301

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100324

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100402

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110929

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111004

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120306

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120327

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150406

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees