Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP6922365B2 - Document processing equipment and programs - Google Patents
[go: Go Back, main page]

JP6922365B2 - Document processing equipment and programs - Google Patents

Document processing equipment and programs Download PDF

Info

Publication number
JP6922365B2
JP6922365B2 JP2017078774A JP2017078774A JP6922365B2 JP 6922365 B2 JP6922365 B2 JP 6922365B2 JP 2017078774 A JP2017078774 A JP 2017078774A JP 2017078774 A JP2017078774 A JP 2017078774A JP 6922365 B2 JP6922365 B2 JP 6922365B2
Authority
JP
Japan
Prior art keywords
area
character
designated area
expansion
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017078774A
Other languages
Japanese (ja)
Other versions
JP2018180872A (en
Inventor
真太郎 安達
真太郎 安達
紘幸 岸本
紘幸 岸本
和宏 大谷
和宏 大谷
岡田 茂
茂 岡田
邦彦 小林
邦彦 小林
茜 吉崎
茜 吉崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2017078774A priority Critical patent/JP6922365B2/en
Publication of JP2018180872A publication Critical patent/JP2018180872A/en
Application granted granted Critical
Publication of JP6922365B2 publication Critical patent/JP6922365B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)

Description

本発明は、文書処理装置及びプログラムに関する。 The present invention relates to a document processing apparatus and a program.

特許文献1には、本発明における画像入力装置は、スキャナ機器から画像を入力し、入力した画像上の部分領域に対し光学式文字認識(以下、ゾーンOCR)を実行し、OCR結果として取得されたテキストデータを文書のインデックスデータとし、最終的に文書(画像とインデックスデータ)を文書管理システムへ保存する画像入力装置であり、OCRによってインデックスデータを作成する処理において、部分画像切り出しによる文字切れによる誤認識を補正し、妥当なOCR出力をインデックスデータとして採用する処理を備える画像入力装置であり、まず、インデックスデータを作成するための部分領域に対するOCR処理のために、予め原稿上のOCR領域設定をフォームとして登録するフォーム登録ステップを備え、また、実際の原稿をスキャンし、OCRによってインデックスを作成し、文書(画像とインデックス)を文書管理システムへ保存する画像入力ステップを備え、さらに、前期画像入力ステップにおいては、画像上の部分領域に対するOCR処理で、スキャン入力した画像のインデックス作成処理において、前期フォーム登録ステップで登録されたフォームのOCR領域設定にしたがってスキャン入力した画像の部分領域を切り出し、その部分領域画像に対し、1回目のOCR処理と、次に自動的に部分領域を拡張し2回目のOCR処理を実行し、1回目のOCRの解析結果と2回目のOCRの解析結果を、まず条件1の判断として、「第1のOCR結果」と「第2のOCR結果」を比較した結果、同じテキストデータである場合は、「第1のOCR結果」をインデックスデータとして採用し、次に条件2の判断として、「第1のOCR結果」と「第2のOCR結果」が違うテキストデータで、「第2のOCR結果」に改行コードが含まれていない場合には、「第2のOCR結果」をインデックスデータとして採用し、最後に条件3の判断として、「第1のOCR結果」と「第2のOCR結果」が違うテキストデータである場合で、「第2のOCR結果」に改行コードが含まれている場合、「第2のOCR結果」の文字列を改行コードで分割し、分割されたテキストデータをそれぞれ「第1のOCR結果」と比較し、文字数や文字列を構成するキャラクタが「第1のOCR結果」と近いものをインデックスデータとして採用するといった、条件1、条件2、条件3の判断処理による部分画像切り出しによる文字切れによる誤認識を補正し、インデックデータを取得することを特徴とする画像入力装置が記載されている。 According to Patent Document 1, the image input device of the present invention inputs an image from a scanner device, executes optical character recognition (hereinafter, zone OCR) on a partial region on the input image, and obtains it as an OCR result. It is an image input device that uses the text data as the index data of the document and finally saves the document (image and index data) in the document management system. It is an image input device equipped with a process of correcting erroneous recognition and adopting an appropriate OCR output as index data. First, an OCR area is set in advance on a document for OCR processing for a partial area for creating index data. It has a form registration step to register the document as a form, and also has an image input step to scan the actual manuscript, create an index by OCR, and save the document (image and index) in the document management system. In the input step, in the OCR processing for the partial area on the image, in the index creation processing of the scanned image, the partial area of the scanned image is cut out according to the OCR area setting of the form registered in the previous term form registration step. For the partial area image, the first OCR processing and then the partial area is automatically expanded and the second OCR processing is executed, and the analysis result of the first OCR and the analysis result of the second OCR are displayed. First, as a judgment of condition 1, if the results of comparing the "first OCR result" and the "second OCR result" are the same text data, the "first OCR result" is adopted as the index data, and then As a judgment of condition 2, if the "first OCR result" and the "second OCR result" are different text data and the "second OCR result" does not include a line feed code, the "second OCR result" is determined. "OCR result" is adopted as index data, and finally, as a judgment of condition 3, when "first OCR result" and "second OCR result" are different text data, "second OCR result" If contains a line feed code, the character string of the "second OCR result" is divided by the line feed code, the divided text data is compared with the "first OCR result", and the number of characters and the character string are calculated. Partial image cutout by the judgment processing of condition 1, condition 2, and condition 3, such as adopting the one whose constituent character is close to the "first OCR result" as index data. Described is an image input device characterized by correcting erroneous recognition due to character breakage due to a sword and acquiring index data.

特開2008−40598号公報Japanese Unexamined Patent Publication No. 2008-40598

本発明は、文字認識処理において、文字以外のオブジェクトの全体を包含する領域まで文字を認識するように指定された指定領域を拡大しない技術と比較して、認識しようとする文字の周辺に文字以外のオブジェクトが存在することによる文字の認識率の低下を抑制することができる文書処理装置及びプログラムを提供することを目的とする。 In the character recognition process, the present invention is compared with a technique in which a designated area designated to recognize a character is not expanded to an area including the entire object other than the character, and the character other than the character is around the character to be recognized. It is an object of the present invention to provide a document processing device and a program capable of suppressing a decrease in the character recognition rate due to the existence of the object.

請求項1に係る本発明は、文字認識処理をするように指定された指定領域の周辺に文字以外のオブジェクトが存在する場合に、文字以外のオブジェクトの全体を包含する領域まで指定領域を拡大する領域拡大手段を有する文書処理装置である。 The present invention according to claim 1 expands the designated area to an area including the entire non-character object when an object other than the character exists around the designated area designated to perform character recognition processing. It is a document processing device having an area expansion means.

請求項2に係る本発明は、前記文字以外のオブジェクトが罫線である場合に、前記領域拡大手段は、罫線の全体を包含する領域まで指定領域を拡大する請求項1記載の文書処理装置である。 The present invention according to claim 2 is the document processing apparatus according to claim 1, wherein when an object other than the characters is a ruled line, the area expanding means expands a designated area to an area including the entire ruled line. ..

請求項3に係る本発明は、罫線が、少なくとも一つの升目を有する表を形成している場合に、前記領域拡大手段は、表の全ての升目を包含する領域まで指定範囲を拡大する請求項2記載の文書処理装置である。 The present invention according to claim 3 claims that when the ruled lines form a table having at least one square, the area expanding means expands the designated range to an area including all the squares of the table. 2. The document processing apparatus according to 2.

請求項4に係る本発明は、罫線が、文字が記載される文字記載領域と、文字記載領域と隣接する他の領域とを区切る区切線である場合に、前記領域拡大手段は、区切線の全体を包含する領域まで指定領域を拡大する請求項2記載の文書処理装置である。 According to the fourth aspect of the present invention, when the ruled line is a dividing line that separates the character writing area in which the characters are written and another area adjacent to the character writing area, the area expanding means is the dividing line. The document processing apparatus according to claim 2, wherein the designated area is expanded to include the entire area.

請求項5に係る本発明は、指定領域が、連続して配置された複数の文字からなる文字列の一部のみを包含する場合に、前記拡大手段は、少なくとも文字列の全体を包含する領域まで指定領域を拡大する請求項1乃至4いずれか記載の文書処理装置である。 According to the fifth aspect of the present invention, when the designated area includes only a part of a character string composed of a plurality of characters arranged continuously, the expanding means includes at least the entire character string. The document processing apparatus according to any one of claims 1 to 4, wherein the designated area is expanded to.

請求項6に係る本発明は、指定領域が、複数の文字列の一部のみを包含する場合に、前記拡大手段は、少なくとも複数の文字列の全ての全体を包含する領域まで指定領域を拡大する請求項1乃至4いずれか記載の文書処理装置である。 According to the sixth aspect of the present invention, when the designated area includes only a part of a plurality of character strings, the expansion means expands the designated area to an area including at least all of the plurality of character strings. The document processing apparatus according to any one of claims 1 to 4.

請求項7に係る本発明は、指定領域の周辺に複数の文字以外のオブジェクトが存在する場合に、前記領域拡大手段は、複数の文字以外のオブジェクトの全ての全体を包含する領域まで指定領域を拡大する請求項1乃至6いずれか記載の文書処理装置である。 According to the seventh aspect of the present invention, when there are a plurality of objects other than characters in the vicinity of the designated area, the area expanding means extends the designated area to an area including all of the objects other than the plurality of characters. The document processing apparatus according to any one of claims 1 to 6, which is expanded.

請求項8に係る本発明は、文字認識処理をするように指定された指定領域の周辺に文字以外のオブジェクトが存在する場合に、文字以外のオブジェクトの全体を包含する領域まで指定領域を拡大する領域拡大ステップをコンピュータに実行させるプログラムである。 The present invention according to claim 8 expands the designated area to an area including the entire non-character object when there is a non-character object around the designated area designated to perform character recognition processing. A program that causes a computer to perform an area expansion step.

請求項1に係る本発明によれば、文字認識処理において、文字以外のオブジェクトの全体を包含する領域まで文字を認識するように指定された指定領域を拡大しない技術と比較して、認識しようとする文字の周辺に文字以外のオブジェクトが存在することによる文字の認識率の低下を抑制することができる文書処理装置を提供することができる文書処理装置を提供することができる。 According to the first aspect of the present invention, in the character recognition process, an attempt is made to recognize a character as compared with a technique of not expanding a designated area designated to recognize a character to an area including the entire object other than the character. It is possible to provide a document processing device capable of providing a document processing device capable of suppressing a decrease in the recognition rate of a character due to the existence of an object other than the character in the vicinity of the character to be used.

請求項2に係る本発明によれば、罫線の全体を包含する領域まで指定領域を拡大しない技術と比較して、認識しようとうする文字の周辺に罫線が存在することによる文字の認識率の低下を抑制することができる。 According to the second aspect of the present invention, as compared with the technique of not expanding the designated area to the area including the entire ruled line, the recognition rate of the character is lowered due to the existence of the ruled line around the character to be recognized. Can be suppressed.

請求項3に係る本発明によれば、表の全体を包含する領域まで指定領域を拡大しない技術と比較して、認識しようとうする文字の周辺に表が存在することによる文字の認識率の低下を抑制することができる。 According to the third aspect of the present invention, the recognition rate of characters is lowered due to the presence of the table around the character to be recognized, as compared with the technique of not expanding the designated area to the area including the entire table. Can be suppressed.

請求項4に係る本発明によれば、区切線の全体を包含する領域まで指定領域を拡大しない技術と比較して、認識しようとうする文字の周辺に区切線が存在することによる文字の認識率の低下を抑制することができる。 According to the fourth aspect of the present invention, the recognition rate of characters due to the existence of a dividing line around the character to be recognized is compared with the technique of not expanding the designated area to the area including the entire dividing line. Can be suppressed.

請求項5に係る本発明によれば、文字列の全体を包含するまで指定領域を拡大しない技術と比較して、文字列中における認識することができる文字を増やすことができる。 According to the fifth aspect of the present invention, the number of characters that can be recognized in the character string can be increased as compared with the technique that does not expand the designated area until the entire character string is included.

請求項6に係る本発明によれば、複数の文字列の全ての全体を包含する領域まで指定領域を拡大しない技術と比較して、文字列中における認識することができる文字を増やすことができる。 According to the sixth aspect of the present invention, the number of characters that can be recognized in the character string can be increased as compared with the technique that does not expand the designated area to the area that includes all of the plurality of character strings. ..

請求項7に係る本発明によれば、一部の文字以外のオブジェクトの全体だけを包含する領域まで指定領域を拡大する技術と比較して、認識しようとする文字の周辺に文字以外のオブジェクトが存在することによる文字の認識率の低下を抑制することができる。 According to the seventh aspect of the present invention, as compared with the technique of expanding the designated area to the area including only the entire object other than a part of the character, the object other than the character is formed around the character to be recognized. It is possible to suppress a decrease in the recognition rate of characters due to their existence.

請求項7に係る本発明によれば、文字認識処理において、文字以外のオブジェクトの全体を包含する領域まで文字を認識するように指定された指定領域を拡大しない技術と比較して、認識しようとする文字の周辺に文字以外のオブジェクトが存在することによる文字の認識率の低下を抑制することができるプログラムを提供することができる。 According to the present invention according to claim 7, in the character recognition process, an attempt is made to recognize a character as compared with a technique of not expanding a designated area designated to recognize a character to an area including the entire object other than the character. It is possible to provide a program capable of suppressing a decrease in the recognition rate of a character due to the existence of an object other than the character in the vicinity of the character to be used.

本発明の実施形態で用いられる文書処理システムの構成を示す図である。It is a figure which shows the structure of the document processing system used in embodiment of this invention. 本発明の実施形態で用いられる文書処理システムが有する読取装置のハードウェア構成を示すブロック図である。It is a block diagram which shows the hardware structure of the reading apparatus which the document processing system used in embodiment of this invention has. 本発明の実施形態で用いられる文書処理システムが有するサーバ装置のハードウェア構成を示すブロック図である。It is a block diagram which shows the hardware configuration of the server apparatus which the document processing system used in embodiment of this invention has. 本発明の実施形態で用いられる文書処理システムが有する画像形成装置のハードウェア構成を示すブロック図である。It is a block diagram which shows the hardware structure of the image forming apparatus which the document processing system used in embodiment of this invention has. 本発明の実施形態で用いられる文書処理システムが有する端末装置のハードウェア構成を示すブロック図である。It is a block diagram which shows the hardware composition of the terminal apparatus which the document processing system used in embodiment of this invention has. 本発明の実施形態で用いられる文書処理システムによる処理の概要を説明し、図6(A)は、処理の第1の例を説明する図であり、図6(B)は、処理の第2の例を説明する図であり、図6(C)は、処理の第3の例を示す図である。An outline of processing by the document processing system used in the embodiment of the present invention will be described, FIG. 6 (A) is a diagram illustrating a first example of processing, and FIG. 6 (B) is a second processing. 6 (C) is a diagram showing a third example of processing. 本発明の実施形態で用いられる文書処理システムのソフトウエア構成を示すブロック図である。It is a block diagram which shows the software structure of the document processing system used in embodiment of this invention. 本発明の実施形態で用いられる文書処理システムにおける処理の全体を説明するフローチャートである。It is a flowchart explaining the whole processing in the document processing system used in embodiment of this invention. 本発明の実施形態で用いられる文書処理システムにおける指定領域を拡大する処理を説明する第1のフローチャートである。It is 1st flowchart explaining the process of expanding the designated area in the document processing system used in embodiment of this invention. 本発明の実施形態で用いられる文書処理システムにおける指定領域を拡大する処理を説明する第2のフローチャートである。It is a 2nd flowchart explaining the process which expands the designated area in the document processing system used in embodiment of this invention. 本発明の実施形態で用いられる文書処理システムにおける前処理を説明するフローチャートである。It is a flowchart explaining the preprocessing in the document processing system used in embodiment of this invention.

以下、本発明の実施形態について図面を参照して詳細に説明する。
図1は、本発明の実施形態で用いられる文書処理システム10の構成の一例を示す図である。図1に示すように、文書処理システム10は、例えば複数の端末装置100を有する。端末装置100としては、例えばパーソナルコンピュータを用いることができる。端末装置100は、それぞれが表示部102と操作部104とを有する。表示部102としては、例えばCRT(Cathode Ray Tube)表示装置や、液晶表示装置を用いることができる。操作部104としては、例えばキーボート、マウス等を用いることができる。尚、端末装置100の詳細は後述する。
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
FIG. 1 is a diagram showing an example of the configuration of the document processing system 10 used in the embodiment of the present invention. As shown in FIG. 1, the document processing system 10 has, for example, a plurality of terminal devices 100. As the terminal device 100, for example, a personal computer can be used. Each of the terminal devices 100 has a display unit 102 and an operation unit 104. As the display unit 102, for example, a CRT (Cathode Ray Tube) display device or a liquid crystal display device can be used. As the operation unit 104, for example, a keyboard, a mouse, or the like can be used. The details of the terminal device 100 will be described later.

文書処理システム10は、サーバ装置300をさらに有する。サーバ装置300の詳細は後述する。 The document processing system 10 further includes a server device 300. Details of the server device 300 will be described later.

文書処理システム10は、読取装置400をさらに有する。読取装置400は、所謂スキャナであって、光学的に原稿を読み取り、光学的に読み取った原稿を電子文書(電子ファイル)に変換する。尚、読取装置400の詳細は後述する。 The document processing system 10 further includes a reading device 400. The scanning device 400 is a so-called scanner, which optically reads a document and converts the optically read document into an electronic document (electronic file). The details of the reading device 400 will be described later.

文書処理システム10は、画像形成装置500をさらに有する。画像形成装置500は、所謂複合機であって、原稿の複写や文書ファイルのプリント等の記録媒体への画像形成とともに、原稿の読み取りや、ファクシミリの送信を行うことができる。ここで、記録媒体としては、例えば普通紙を用いることができる。画像形成装置500は、原稿読取部502を有する。原稿読取部502は、光学的に原稿を読み取り、光学的に読み取った原稿を電子文書に変換する。尚、画像形成装置500の詳細は後述する。 The document processing system 10 further includes an image forming apparatus 500. The image forming apparatus 500 is a so-called multifunction device, and can perform image forming on a recording medium such as copying a document or printing a document file, as well as reading a document and transmitting a facsimile. Here, as the recording medium, for example, plain paper can be used. The image forming apparatus 500 has a document reading unit 502. The document reading unit 502 optically reads the document and converts the optically read document into an electronic document. The details of the image forming apparatus 500 will be described later.

上述の端末装置100と、サーバ装置300と、読取装置400と、画像形成装置500とは、ネットワーク600を介して相互に接続されていて、ネットワーク600を介して相互に通信が可能である。 The terminal device 100, the server device 300, the reading device 400, and the image forming device 500 are connected to each other via the network 600, and can communicate with each other via the network 600.

図2は、読取装置400のハードウェア構成を示すブロック図である。図2に示すように、読取装置400は、CPU410と、メモリ412と、記憶装置416と、通信インターフェイス418と、スキャン駆動部420と、操作部422とを少なくとも有し、これらがバスを介して相互に接続されていて、相互に通信可能となっている。 FIG. 2 is a block diagram showing a hardware configuration of the reader 400. As shown in FIG. 2, the reading device 400 has at least a CPU 410, a memory 412, a storage device 416, a communication interface 418, a scan driving unit 420, and an operating unit 422, which are via a bus. They are connected to each other and can communicate with each other.

記憶装置416としては、例えばハードディスクドライブ(HDD)等を用いることができる。通信インターフェイス418は、上述のネットワーク600を介して、上述のサーバ装置300等の外部の装置との間でデータの送信及び受信を行う。CPU410は、メモリ412又は記憶装置416に格納されたプログラムに基づいて処理を実行して、読取装置400の動作を制御する。 As the storage device 416, for example, a hard disk drive (HDD) or the like can be used. The communication interface 418 transmits and receives data to and from an external device such as the server device 300 described above via the network 600 described above. The CPU 410 executes processing based on a program stored in the memory 412 or the storage device 416 to control the operation of the reading device 400.

図3は、サーバ装置300のハードウェア構成を示すブロック図である。図3に示すように、サーバ装置300は、CPU310と、メモリ312と、記憶装置316と、通信インターフェイス318とを有し、これらがバスを介して相互に接続されていて、相互に通信可能となっている。 FIG. 3 is a block diagram showing a hardware configuration of the server device 300. As shown in FIG. 3, the server device 300 has a CPU 310, a memory 312, a storage device 316, and a communication interface 318, which are connected to each other via a bus and can communicate with each other. It has become.

記憶装置316としては、例えばハードディスクドライブ(HDD)等を用いることができる。また、記憶装置316に、端末装置100で作成された電子文書や、読取装置400で読み取られた電子文書や、画像形成装置500で読み取られた電子文書や、画像形成装置500がファクシミリとして受信した電子文書等を記憶させてもよい。 As the storage device 316, for example, a hard disk drive (HDD) or the like can be used. Further, the storage device 316 receives the electronic document created by the terminal device 100, the electronic document read by the reading device 400, the electronic document read by the image forming device 500, and the image forming device 500 as a facsimile. An electronic document or the like may be stored.

通信インターフェイス318は、上述のネットワーク600を介して、上述の端末装置100等の外部の装置との間でデータの送信及び受信を行う。CPU310は、メモリ312又は記憶装置316に格納されたプログラムに基づいて処理を実行して、サーバ装置300の動作を制御する。 The communication interface 318 transmits and receives data to and from an external device such as the terminal device 100 described above via the network 600 described above. The CPU 310 executes processing based on a program stored in the memory 312 or the storage device 316 to control the operation of the server device 300.

図4は、画像形成装置500のハードウェア構成を示すブロック図である。図4に示すように、画像形成装置500は、CPU510と、メモリ512と、記憶装置516と、通信インターフェイス518と、スキャン駆動部520と、操作部522と、画像形成部524とを有し、これらがバスを介して相互に接続されていて、相互に通信可能となっている。 FIG. 4 is a block diagram showing a hardware configuration of the image forming apparatus 500. As shown in FIG. 4, the image forming apparatus 500 includes a CPU 510, a memory 512, a storage device 516, a communication interface 518, a scan driving unit 520, an operation unit 522, and an image forming unit 524. These are connected to each other via a bus so that they can communicate with each other.

記憶装置516としては、例えばハードディスクドライブ(HDD)等を用いることができる。通信インターフェイス518は、上述のネットワーク600を介して、上述のサーバ装置300等の外部の装置との間でデータの送信及び受信を行う。CPU510は、メモリ512又は記憶装置516に格納されたプログラムに基づいて処理を実行して画像形成装置500の動作を制御する。スキャン駆動部520は、先述の原稿読取部510を駆動する。画像形成部524は、例えば電子写真方式やインクジェット方式等が用いられていて、記録媒体に画像を形成する。 As the storage device 516, for example, a hard disk drive (HDD) or the like can be used. The communication interface 518 transmits and receives data to and from an external device such as the server device 300 described above via the network 600 described above. The CPU 510 controls the operation of the image forming apparatus 500 by executing processing based on the program stored in the memory 512 or the storage device 516. The scan drive unit 520 drives the document reading unit 510 described above. The image forming unit 524 uses, for example, an electrophotographic method, an inkjet method, or the like, and forms an image on a recording medium.

図5は、端末装置100のハードウェア構成を示すブロック図である。図5に示すように、端末装置100は、CPU110と、メモリ112と、記憶装置116と、通信インターフェイス118と、先述の表示部102と、先述の操作部104とを少なくとも有し、これらがバスを介して相互に接続されていて、相互に通信可能となっている。記憶装置116としては、例えばハードディスクドライブ(HDD)等を用いることができる。通信インターフェイス118は、上述のネットワーク600を介して、上述のサーバ装置300等の外部の装置との間でデータの送信及び受信を行う。 FIG. 5 is a block diagram showing a hardware configuration of the terminal device 100. As shown in FIG. 5, the terminal device 100 has at least a CPU 110, a memory 112, a storage device 116, a communication interface 118, the above-mentioned display unit 102, and the above-mentioned operation unit 104, and these are buses. They are connected to each other via and can communicate with each other. As the storage device 116, for example, a hard disk drive (HDD) or the like can be used. The communication interface 118 transmits and receives data to and from an external device such as the server device 300 described above via the network 600 described above.

メモリ112又は記憶装置116には、プログラムが記憶されている。より具体的には、メモリ112又は記憶装置116には、文書処理のためのプログラムであり、文字認識のためのプログラムである本発明に係るプログラム900(図7を参照)が記憶されている。CPU110は、メモリ112又は記憶装置116に格納されたプログラム900に基づいて処理を実行して、端末装置100の動作を制御する。より具体的には、CPU110は、端末装置100を制御して文書処理を行わせ、端末装置100を制御して文字認識を行わせ、端末装置100を制御して本発明に係るプログラム900を実行させる。このように、端末装置100は、特許請求の範囲に記載の文書処理装置に相当する。尚、プログラム900の詳細は後述する。 The program is stored in the memory 112 or the storage device 116. More specifically, the memory 112 or the storage device 116 stores a program 900 (see FIG. 7) according to the present invention, which is a program for document processing and a program for character recognition. The CPU 110 executes processing based on the program 900 stored in the memory 112 or the storage device 116 to control the operation of the terminal device 100. More specifically, the CPU 110 controls the terminal device 100 to perform document processing, controls the terminal device 100 to perform character recognition, and controls the terminal device 100 to execute the program 900 according to the present invention. Let me. As described above, the terminal device 100 corresponds to the document processing device described in the claims. The details of the program 900 will be described later.

この実施形態においては、メモリ112又は記憶装置116に本発明に係るプログラム900を記憶させ、端末装置100を特許請求の範囲に記載の文書処理装置として用いるものの、メモリ412又は記憶装置416に本発明に係るプログラム900を記憶させ、読取装置400を特許請求の範囲に記載の文書処理装置として用いてもよい。また、メモリ312又は記憶装置316に本発明のプログラム900を記憶させ、サーバ装置300を特許請求の範囲に記載の文書処理装置として用いてもよい。また、メモリ512又は記憶装置516に本発明のプログラム900を記憶させ、画像形成装置500を特許請求の範囲に記載の文書処理装置として用いてもよい。 In this embodiment, the memory 112 or the storage device 116 stores the program 900 according to the present invention, and the terminal device 100 is used as the document processing device described in the claims, but the memory 412 or the storage device 416 of the present invention is used. The program 900 according to the above may be stored, and the reading device 400 may be used as the document processing device described in the claims. Further, the program 900 of the present invention may be stored in the memory 312 or the storage device 316, and the server device 300 may be used as the document processing device described in the claims. Further, the program 900 of the present invention may be stored in the memory 512 or the storage device 516, and the image forming device 500 may be used as the document processing device described in the claims.

図6は、プログラム900の処理の概要を説明する図であり、図6(A)はプログラム900による処理の第1の例を説明していて、図6(B)はプログラム900による第2の例を説明していて、図6(C)はプログラム900による第3の例を説明している。 6A and 6B are views for explaining the outline of the processing of the program 900, FIG. 6A illustrates the first example of the processing by the program 900, and FIG. 6B shows the second example of the processing by the program 900. An example is described, and FIG. 6C illustrates a third example by program 900.

プログラム900は、OCR(Optical Character Recognition/Reader)とも称される光学的文字認識に関する処理のプログラムであり、図6に示すように、光学的に文字認識をするように予め指定された指定領域を一定の条件のもとで拡大するプログラムである。図6においては、プログラム900で拡大される前の指定領域(以下、拡大前指定領域R1とする)を太い一点鎖線で示しており、プログラム900により拡大された後の指定領域(以下、拡大後指定領域R2とする)を太い点線で示している。 The program 900 is a processing program related to optical character recognition, which is also called OCR (Optical Character Recognition / Reader), and as shown in FIG. 6, a designated area designated in advance to perform optical character recognition is set. It is a program that expands under certain conditions. In FIG. 6, the designated area before being expanded by the program 900 (hereinafter referred to as the designated area before expansion R1) is shown by a thick alternate long and short dash line, and the designated area after being expanded by the program 900 (hereinafter referred to as after expansion). The designated area R2) is indicated by a thick dotted line.

より具体的には、プログラム900は、拡大前指定領域R1の周辺に、すなわち拡大前指定領域R1の内側及び拡大前指定領域R1の外側の少なくとも一方に文字以外のオブジェクトが存在する場合に、文字以外のオブジェクトの全体を包含する領域まで、拡大前指定領域R1を拡大後指定領域R2へと拡大する。ここで、文字以外のオブジェクトとしては、例えば、矢印等の画像や、罫線等を挙げることができる。そして、罫線としては、例えば、少なくとも一つの升目を有する表や区切線を挙げることができる。ここで、区切り線とは、文字が記載される文字記載領域と、上述の文字記載領域と隣接する他の領域とを区切る線分をいう。以下、文以外のオブジェクトが罫線Lである場合であって、罫線Lが表を形成している場合と、罫線Lが区切線である場合と例として示して説明をする。 More specifically, the program 900 describes a character when an object other than a character exists in the vicinity of the pre-expansion designated area R1, that is, at least one of the inside of the pre-expansion designated area R1 and the outside of the pre-expansion designated area R1. The pre-expansion designated area R1 is expanded to the post-expansion designated area R2 to the area including the entire object other than the above. Here, examples of objects other than characters include images such as arrows and ruled lines. Then, as the ruled line, for example, a table having at least one square or a dividing line can be mentioned. Here, the dividing line means a line segment that separates a character description area in which characters are described and another area adjacent to the above-mentioned character description area. Hereinafter, the case where the object other than the sentence is the ruled line L, the case where the ruled line L forms a table, and the case where the ruled line L is a dividing line will be described as an example.

図6(A)に示す第1の例においては、拡大前指定領域R1内に「1,000」との文字があり、拡大前指定領域R1の上部に「金額」との文字があり、拡大前指定領域R1の下部に「2,590」との文字がある。また、拡大前指定領域R1の周囲にある文字以外のオブジェクトは罫線L1であり、罫線L1が横3升、縦3升の表を形成している。この第1の例においては、プログラム900は、表の全ての升目(9個の升目)を指定領域が包含する領域まで、拡大前指定領域R1から拡大後指定領域R2へと指定領域を拡大する。 In the first example shown in FIG. 6A, there is a character "1,000" in the pre-expansion designated area R1 and a character "amount" in the upper part of the pre-expansion designated area R1. There is a character "2,590" at the bottom of the pre-designated area R1. Further, the objects other than the characters around the designated area R1 before enlargement are ruled lines L1, and the ruled lines L1 form a table of 3 horizontal squares and 3 vertical squares. In this first example, the program 900 expands the designated area from the pre-expansion designated area R1 to the post-expansion designated area R2 to the area covered by the designated area (9 squares) in the table. ..

図6(B)に示す第2の例においては、拡大前指定領域R1内に「1,000」との文字がある。また、拡大前指定領域R1の周囲にある文字以外のオブジェクトは罫線L2であり、罫線L2は区切線である。この第2の例においては、プログラム900は、罫線L2の全体を指定領域が包含する領域まで、拡大前指定領域R1から拡大後指定領域R2へと指定領域を拡大する。 In the second example shown in FIG. 6B, there is a character "1,000" in the pre-expansion designated area R1. Further, the objects other than the characters around the pre-expansion designated area R1 are the ruled line L2, and the ruled line L2 is the dividing line. In this second example, the program 900 expands the designated area from the pre-expansion designated area R1 to the post-expansion designated area R2 to the area where the designated area covers the entire ruled line L2.

図6(C)に示す第3の例においては、拡大前指定領域R1内に「1,000」との文字列の全てが配置されている。すなわち、拡大前指定領域R1が、連続して配置された複数の文字からなる「1,000」との文字列の全てを包含している。また、図6(C)に示す第3の例においては、拡大前指定領域R1内に「2,000」との文字列の一部が配置されている。すなわち、拡大前指定領域R1が、連続して配置された複数の文字からなる「2,000」との文字列の一部分のみを包含している。 In the third example shown in FIG. 6C, all of the character strings "1,000" are arranged in the pre-expansion designated area R1. That is, the pre-expansion designated area R1 includes all of the character strings "1,000" composed of a plurality of characters arranged consecutively. Further, in the third example shown in FIG. 6C, a part of the character string "2,000" is arranged in the pre-expansion designated area R1. That is, the pre-expansion designated area R1 includes only a part of the character string "2,000" composed of a plurality of characters arranged consecutively.

また、拡大前指定領域R1の周囲にある文字以外のオブジェクトは、罫線L3と罫線L4である。このように、この第3の例においては、拡大前指定領域R1の周囲に複数の(2つの)文字以外のオブジェクトが存在している。罫線L3は一枡からなる表を形成していて、罫線L4も、同様に一枡からなる表を形成している。 The objects other than the characters around the pre-expansion designated area R1 are the ruled line L3 and the ruled line L4. As described above, in this third example, there are a plurality of objects other than the (two) characters around the pre-expansion designated area R1. The ruled line L3 forms a table composed of one square, and the ruled line L4 also forms a table composed of one square.

この第3の例においては、プログラム900は、一部分のみが拡大前指定領域R1に包含されている「2,000」との文字列の全体が拡大後指定領域R2に包含される領域まで、指定領域を拡大前指定領域R1から拡大後指定領域R2へと拡大している。また、この第3の例においては、プログラム900は、文字以外のオブジェクトである複数のオブジェクト(罫線L3が形成する表と罫線L4が形成する表)の全てを指定領域が包含するように、指定領域を拡大前指定領域R1から拡大後指定領域R2まで拡大している。 In this third example, the program 900 specifies up to an area in which the entire character string "2,000", of which only a part is included in the pre-expansion designated area R1, is included in the post-expansion designated area R2. The area is expanded from the designated area R1 before expansion to the designated area R2 after expansion. Further, in the third example, the program 900 specifies that the designated area includes all of a plurality of objects (a table formed by the ruled line L3 and a table formed by the ruled line L4) which are objects other than characters. The area is expanded from the designated area R1 before expansion to the designated area R2 after expansion.

さらには、この第3の例においては、プログラム900は、「1,000」との文字列と「2,000」との文字列との複数文字列のうちの一部である「1,000」との文字列」の全体のみが拡大前指定領域R1に包含されていて、複数の文字列のうちの他の一部である「2,000」との文字列の全体は拡大前指定領域R1に包含されていない状態から、「1,000」との文字列と「2,000」との文字列との複数文字列の全ての全体を包含する領域ように、指定領域を拡大後指定領域R2まで拡大している。 Furthermore, in this third example, the program 900 is a part of a plurality of character strings of the character string "1,000" and the character string "2,000", "1,000". Only the entire character string with "" is included in the pre-expansion designated area R1, and the entire character string with "2,000", which is another part of the plurality of character strings, is included in the pre-expansion designated area. Designated after expanding the designated area so that it covers all of the plurality of character strings of the character string "1,000" and the character string "2,000" from the state not included in R1. It is expanded to the area R2.

尚、プログラム900の具体的なアルゴリズムは後述する。 The specific algorithm of the program 900 will be described later.

図7は、文書処理システム10のソフトウエア構成を示すブロック図であり、本発明のプログラム900の構成を示すブロック図である。図7に示すように、プログラム900は、受付部910を有する。受付部910は、読取装置400や原稿読取部502から電子文書を受け付ける。 FIG. 7 is a block diagram showing the software configuration of the document processing system 10, and is a block diagram showing the configuration of the program 900 of the present invention. As shown in FIG. 7, the program 900 has a reception unit 910. The reception unit 910 receives an electronic document from the reading device 400 or the document reading unit 502.

プログラム900は、領域拡大処理部912をさらに有する。領域拡大処理部912は、先に具体例を示して説明をしたように(図6(A)、図6(B)、図6(C)を参照)、文字認識をするように指定された指定領域の周辺に文字以外のオブジェクトが存在する場合に、文字以外のオブジェクトの全体を指定領域が包含する領域まで、拡大前指定領域R1から拡大後指定領域R2へと指定領域を拡大する。 The program 900 further includes an area expansion processing unit 912. The area expansion processing unit 912 is designated to perform character recognition as described above by showing a specific example (see FIGS. 6 (A), 6 (B), and 6 (C)). When an object other than characters exists around the designated area, the designated area is expanded from the pre-expansion designated area R1 to the post-expansion designated area R2 to the area where the entire non-character object is included in the designated area.

プログラム900は、前処理部914をさらに有する。前処理部914は、後述する文字認識処理部916が文字を認識することに先立ち前処理をする。より具体的には、受付部910は、受付部910が受け付けた電子文書や領域拡大処理部912で指定領域が拡大された電子文書から、例えば罫線等の文字以外のオブジェクトを除去する処理を施す。このように、前処理部914は、領域拡大処理部912によって拡大された指定領域から、文字以外のオブジェクトを除去する除去手段として用いられている。 The program 900 further includes a preprocessing unit 914. The pre-processing unit 914 performs pre-processing before the character recognition processing unit 916, which will be described later, recognizes a character. More specifically, the reception unit 910 performs a process of removing objects other than characters such as ruled lines from the electronic document received by the reception unit 910 and the electronic document whose designated area is expanded by the area expansion processing unit 912. .. As described above, the preprocessing unit 914 is used as a removing means for removing objects other than characters from the designated area expanded by the area expansion processing unit 912.

前処理部914は、文字以外のオブジェクトの除去と併せて、例えば、原稿を読み取る際等に乗じたノイズの除去をしたり、傾いた状態で原稿が読み取られた等の理由で生じる傾斜を解消するためのスキュー補正(傾斜解消処理)をしたりする。 In addition to removing objects other than characters, the preprocessing unit 914 removes noise that is multiplied when reading the document, and eliminates the tilt that occurs because the document is read in a tilted state. Skew correction (tilt elimination processing) for this is performed.

プログラム900は、文字認識処理部916をさらに有する。文字認識処理部916は、前処理部914から受け付けた電子文書から文字を認識する処理をする。 The program 900 further includes a character recognition processing unit 916. The character recognition processing unit 916 performs processing for recognizing characters from the electronic document received from the preprocessing unit 914.

プログラム900は、出力部918をさらに有する。出力部918は、文字認識処理部916から受け付けた電子文書を、例えばサーバ装置300や画像形成装置500等の外部の装置へと出力する。 The program 900 further includes an output unit 918. The output unit 918 outputs the electronic document received from the character recognition processing unit 916 to an external device such as the server device 300 or the image forming device 500.

図8は、文書処理システム10の動作の一例を示すフローチャートである。図8に示すように、一連の動作が開始を開始させると、ステップS100において、CPU110は受付部910を制御し、受付部910に電子文書を受け付けさせる。 FIG. 8 is a flowchart showing an example of the operation of the document processing system 10. As shown in FIG. 8, when a series of operations is started, in step S100, the CPU 110 controls the reception unit 910 and causes the reception unit 910 to accept the electronic document.

次のステップであるステップS200では、CPU110は、領域拡大処理部912を制御して、領域拡大処理部912に、文字認識をするように指定された指定領域の周辺に文字以外のオブジェクトが存在する場合に、文字以外のオブジェクトの全体を指定領域が包含する領域まで指定領域を拡大前指定領域R1から拡大後指定領域R2へと拡大させる。 In step S200, which is the next step, the CPU 110 controls the area expansion processing unit 912, and the area expansion processing unit 912 has an object other than characters around the designated area designated to perform character recognition. In this case, the designated area is expanded from the pre-expansion designated area R1 to the post-expansion designated area R2 to the area where the entire object other than the characters is included in the designated area.

次のステップであるステップS300では、CPU110は、前処理部914を制御して、前処理部914に前処理をさせる。すなわち、CPU110は、前処理部914を制御して、前処理部914に電子文書から文字以外のオブジェクトを除去させたり、ノイズ除去をさせたり、スキュー補正をさせたりする。 In step S300, which is the next step, the CPU 110 controls the preprocessing unit 914 to cause the preprocessing unit 914 to perform preprocessing. That is, the CPU 110 controls the preprocessing unit 914 to cause the preprocessing unit 914 to remove objects other than characters from the electronic document, to remove noise, and to perform skew correction.

次のステップであるステップS500では、CPU110は、文字認識処理部916を制御して、文字認識処理部916に、ステップS300で前処理された電子文書から文字を認識させる処理をさせる。 In step S500, which is the next step, the CPU 110 controls the character recognition processing unit 916 to cause the character recognition processing unit 916 to recognize characters from the electronic document preprocessed in step S300.

次のステップであるステップS600では、CPU110は、出力部918を制御し、出力部918に、ステップS500でも文字が認識された電子文書を例えばサーバ装置300や画像形成装置500等の外部の装置へと出力させる。 In step S600, which is the next step, the CPU 110 controls the output unit 918, and sends the electronic document whose characters are recognized in step S500 to the output unit 918 to an external device such as the server device 300 or the image forming device 500. Is output.

図9は、上述のステップS200における領域拡大処理の詳細の一例を示すフローチャートであって、図6(A)と図6(B)とに示す拡大前指定領域R1の周囲に罫線がある場合の処理の詳細を示すフローチャートである。ステップS200における領域拡大処理を開始すると、CPU110は、ステップS202において、領域拡大処理部912に、拡大前指定領域R1の中心から左右両方向に向けて、例えば罫線等の文字以外のオブジェクト(以下、単に「罫線」とする、また、図9及び図10において単に「罫線」と示す)の検索をさせる。 FIG. 9 is a flowchart showing an example of details of the area expansion process in step S200, and is a case where there is a ruled line around the pre-expansion designated area R1 shown in FIGS. 6 (A) and 6 (B). It is a flowchart which shows the detail of a process. When the area expansion process in step S200 is started, the CPU 110 tells the area expansion processing unit 912 in step S202 from the center of the pre-expansion designated area R1 in both the left and right directions, for example, an object other than characters such as a ruled line (hereinafter, simply). The search for "ruled lines" (also simply referred to as "ruled lines" in FIGS. 9 and 10) is performed.

次のステップS204では、ステップS202における左右への検索の結果、罫線が有ったか否かが判別され、罫線が有った場合はステップS206に進み、罫線がなかった場合はステップS250に進む。 In the next step S204, as a result of the search to the left and right in step S202, it is determined whether or not there is a ruled line, and if there is a ruled line, the process proceeds to step S206, and if there is no ruled line, the process proceeds to step S250.

ステップS206では、CPU110は、領域拡大処理部912にステップS202で検索された罫線の矩形調査をさせる。すなわち、CPU110は、領域拡大処理部912に罫線の座標を抽出させる。 In step S206, the CPU 110 causes the area expansion processing unit 912 to investigate the rectangle of the ruled line searched in step S202. That is, the CPU 110 causes the area expansion processing unit 912 to extract the coordinates of the ruled line.

次のステップであるステップS208では、ステップS206で抽出された罫線の座標を用いて、ステップS202で検索された罫線が拡大前指定領域R1の全体を包含しているか否かを判別し、ステップS208で検索された罫線が拡大前指定領域R1の全体を包含しているとの判別がなされた場合はステップS218へと進み、ステップS208で検索された罫線が拡大前指定領域R1の全体を包含していないとの判別がなされた場合は、ステップS210に進む。 In step S208, which is the next step, it is determined whether or not the ruled line searched in step S202 includes the entire pre-expansion designated area R1 by using the coordinates of the ruled line extracted in step S206, and step S208. If it is determined that the ruled line searched in step 2 includes the entire pre-expansion designated area R1, the process proceeds to step S218, and the ruled line searched in step S208 includes the entire pre-expansion designated area R1. If it is determined that the case is not present, the process proceeds to step S210.

ステップS210では、ステップS206で抽出された罫線の座標を用いて、ステップS202で検索された罫線が拡大前指定領域R1の一部分を包含しているか否かを判別し、ステップS208で検索された罫線が拡大前指定領域R1の一部分を包含しているとの判別がなされた場合はステップS212へと進み、ステップS208で検索された罫線が拡大前指定領域R1の一部分も包含していないとの判別がなされた場合は、ステップS220に進む。 In step S210, it is determined whether or not the ruled line searched in step S202 includes a part of the pre-expansion designated area R1 by using the coordinates of the ruled line extracted in step S206, and the ruled line searched in step S208 is determined. If it is determined that a part of the pre-expansion designated area R1 is included, the process proceeds to step S212, and it is determined that the ruled line searched in step S208 does not include a part of the pre-expansion designated area R1. If is done, the process proceeds to step S220.

ステップS212では、ステップS210で拡大前指定領域R1の一部を包含しているとの判断がなされた罫線を、続いての処理のために一次候補として登録する。 In step S212, the ruled line determined in step S210 to include a part of the pre-expansion designated area R1 is registered as a primary candidate for subsequent processing.

次のステップであるステップS214では、ステップS212で一時候補として登録された罫線の他に、ステップS202で検索された罫線が有るか否かを判別し、ステップS212で一時候補として登録された罫線の他に罫線が有ると判別した場合は、ステップS206に戻り、以上で説明をした処理を他の罫線について繰り返す。一方、ステップS212で一時候補として登録をされた罫線の他に、ステップS202で検索された罫線がないと判別した場合は、ステップS216に進む。 In step S214, which is the next step, it is determined whether or not there is a ruled line searched in step S202 in addition to the ruled line registered as a temporary candidate in step S212, and the ruled line registered as a temporary candidate in step S212 is determined. If it is determined that there is another ruled line, the process returns to step S206, and the process described above is repeated for the other ruled line. On the other hand, if it is determined that there is no ruled line searched in step S202 other than the ruled line registered as a temporary candidate in step S212, the process proceeds to step S216.

ステップS216では、ステップS212で一時候補として、これまでに登録された罫線が続いての処理のために選択される。 In step S216, the ruled lines registered so far are selected as temporary candidates in step S212 for subsequent processing.

ステップS250では、CPU110は、領域拡大処理部912に、拡大前指定領域R1の中心から上下両方向に向けて、罫線の検索をさせる。尚、上下方向に向けて罫線の検索の詳細は後述する(図10を参照)。 In step S250, the CPU 110 causes the area expansion processing unit 912 to search for ruled lines from the center of the pre-expansion designated area R1 in both the upper and lower directions. The details of searching for ruled lines in the vertical direction will be described later (see FIG. 10).

次のステップであるステップS280では、ステップS250における上下への検索結果、罫線が有ったか否かが判別され、罫線が有ったとの判別がなされた場合はステップS218に進み、ステップS250における上下への検索の結果、罫線がなかったとの判別がなされた場合は、ステップS220に進む。 In step S280, which is the next step, the search result up and down in step S250 determines whether or not there is a ruled line, and if it is determined that there is a ruled line, the process proceeds to step S218, and the up and down in step S250. As a result of the search for, if it is determined that there is no ruled line, the process proceeds to step S220.

ステップS218では、指定領域が罫線の全体を包含する領域まで拡大され、指定領域が拡大前指定領域R1から拡大後指定領域R2へと拡大される。すなわち、ステップS208において指定領域の全体を包含しているとの判別された罫線の大きさまで指定領域が拡大されるか、ステップS216で選択された全部の罫線を包含する領域まで指定領域が拡大されるか、ステップS250で検索された罫線の全体を包含する領域まで指定領域が拡大される。 In step S218, the designated area is expanded to an area including the entire ruled line, and the designated area is expanded from the pre-expansion designated area R1 to the post-expansion designated area R2. That is, the designated area is expanded to the size of the ruled line determined to include the entire designated area in step S208, or the designated area is expanded to the area including all the ruled lines selected in step S216. Or, the designated area is expanded to the area including the entire ruled line searched in step S250.

ステップS220では、指定領域の拡大はされない。すなわち、続いてのステップで、拡大前指定領域R1について前処理がなされ(図8におけるステップS300を参照)、さらには、文字認識処理がなされる(図8におけるステップS500を参照)。 In step S220, the designated area is not expanded. That is, in the subsequent step, the pre-expansion designated area R1 is preprocessed (see step S300 in FIG. 8), and further, the character recognition process is performed (see step S500 in FIG. 8).

図10は、上述のステップS250における上下への罫線の検索と、ステップS280におおける判別との詳細を示すフローチャートである。ステップS250における上下の罫線の検索を開始すると、CPU110は、ステップS252において、領域拡大処理部912に、指定領域の中心から上側に向けて罫線の検索をさせる。 FIG. 10 is a flowchart showing the details of the search for the vertical ruled lines in step S250 and the discrimination in step S280. When the search for the upper and lower ruled lines in step S250 is started, the CPU 110 causes the area expansion processing unit 912 to search the ruled lines from the center of the designated area to the upper side in step S252.

次のステップであるステップS254では、ステップS252における上への検索の結果、罫線が有ったか否かが判別され、罫線が有った場合はステップS256に進む、罫線がなかった場合はステップS258に進む。 In step S254, which is the next step, as a result of the upward search in step S252, it is determined whether or not there is a ruled line, and if there is a ruled line, the process proceeds to step S256, and if there is no ruled line, step S258. Proceed to.

ステップS256では、CPU110は、領域拡大処理部912に、ステップS253で検索された罫線が包含される領域まで指定領域を拡大するように指定領域を拡大する際の上端側を決定させる。 In step S256, the CPU 110 causes the area expansion processing unit 912 to determine the upper end side when expanding the designated area so as to expand the designated area to the area including the ruled line searched in step S253.

ステップS258では、CPU110は、領域拡大処理部912に、指定領域の中心から下側に向けて罫線の検索をさせる。 In step S258, the CPU 110 causes the area expansion processing unit 912 to search for ruled lines from the center of the designated area to the lower side.

次のステップであるステップS260では、ステップS258における下への検索の結果、罫線が有ったか否かが判別され、罫線が有った場合はステップS262に進み、罫線がなかった場合はステップS284に進む。 In step S260, which is the next step, as a result of the downward search in step S258, it is determined whether or not there is a ruled line, and if there is a ruled line, the process proceeds to step S262, and if there is no ruled line, step S284. Proceed to.

ステップS262では、CPU110は、領域拡大処理部912に、ステップS258で検索された罫線が包含される領域まで指定領域を拡大するように指定領域を拡大する際の下端側を決定させる。 In step S262, the CPU 110 causes the area expansion processing unit 912 to determine the lower end side when expanding the designated area so as to expand the designated area to the area including the ruled line searched in step S258.

次のステップであるステップS282では、指定領域の上側及び下側の少なくともいずれか一方にはが罫線が有るものとされ、次のステップS218(図9を参照)へと進む。この際、ステップS218では、ステップS256で決定された指定領域を拡大する際の上端部と、ステップS262で決定された指定領域を拡大する際の下端部とに基づいて、拡大前指定領域R1が拡大後指定領域R2へと拡大される。 In step S282, which is the next step, it is assumed that at least one of the upper side and the lower side of the designated area has a ruled line, and the process proceeds to the next step S218 (see FIG. 9). At this time, in step S218, the pre-expansion designated area R1 is set based on the upper end portion when expanding the designated area determined in step S256 and the lower end portion when expanding the designated area determined in step S262. After expansion, it is expanded to the designated area R2.

ステップS284では、指定領域の上側にも下側にも罫線がないものとされ、次のステップS220(図9を参照)へと進む。 In step S284, it is assumed that there is no ruled line on either the upper side or the lower side of the designated area, and the process proceeds to the next step S220 (see FIG. 9).

以上の説明においては、拡大前指定領域R1の周囲に罫線がある場合の指定領域の拡大を例として挙げて指定領域の拡大を説明したものの、連続して配置された複数の文字からなる文字列の一部のみを拡大前指定領域R1が包含する場合や、複数の文字列の一部のみを拡大前指定領域R1が包含する場合も、拡大前指定領域R1の周囲に罫線がある場合と同様に指定領域の拡大がなされる。 In the above description, the expansion of the designated area has been described by taking as an example the expansion of the designated area when there is a ruled line around the designated area R1 before expansion, but a character string consisting of a plurality of characters arranged continuously has been described. When the pre-expansion designated area R1 includes only a part of the above, or when the pre-expansion designated area R1 includes only a part of a plurality of character strings, it is the same as when there is a ruled line around the pre-expansion designated area R1. The designated area is expanded.

また、拡大前指定領域R1の周囲に罫線がある場合の指定領域の拡大と、連続して配置された複数の文字からなる文字列の一部のみを拡大前指定領域R1が包含する場合の指定領域の拡大と、複数の文字列の一部のみを拡大前指定領域R1が包含する場合の指定領域の拡大とは、重畳して、例えば同時になされる。 Further, the expansion of the designated area when there is a ruled line around the designated area R1 before expansion, and the designation when the designated area R1 before expansion includes only a part of the character string composed of a plurality of characters arranged continuously. The expansion of the area and the expansion of the designated area when the pre-expansion designated area R1 includes only a part of the plurality of character strings are superimposed, for example, performed at the same time.

図11は、上述のステップS300における前処理の詳細を示すフローチャートである。ステップS300における前処理を開始すると、CPU110は、ステップS302において、前処理部914に例えば原稿を読み取る際等に乗じたノイズを除去させる。 FIG. 11 is a flowchart showing the details of the preprocessing in step S300 described above. When the preprocessing in step S300 is started, the CPU 110 causes the preprocessing unit 914 to remove the noise multiplied by, for example, when reading the original in step S302.

次のステップであるステップS304では、CPU110は、前処理部914に、傾いた状態で原稿が読み取られた等の理由で生じる傾斜を解消するためのスキュー補正(傾斜解消処理)をさせる。 In step S304, which is the next step, the CPU 110 causes the preprocessing unit 914 to perform skew correction (tilt elimination processing) for eliminating the inclination caused by reasons such as the original being read in an inclined state.

次のステップであるステップS306では、拡大後指定領域R2内に縦の罫線が有るか否かの判別がなされ、縦の罫線が有るとの判別がなされた場合はステップS310に進み、縦の罫線がないとの判別がなされた場合は、ステップS308に進む。 In step S306, which is the next step, it is determined whether or not there is a vertical ruled line in the designated area R2 after enlargement, and if it is determined that there is a vertical ruled line, the process proceeds to step S310 and the vertical ruled line is determined. If it is determined that there is no such thing, the process proceeds to step S308.

ステップS308では、拡大後指定領域R2内に横の罫線が有るか否かの判別がなされ、横の罫線があるとの判別がなされた場合はステップS310に進み、横の罫線がないとの判別がなされた場合は、一連の前処理が終了する。 In step S308, it is determined whether or not there is a horizontal ruled line in the designated area R2 after enlargement, and if it is determined that there is a horizontal ruled line, the process proceeds to step S310 and it is determined that there is no horizontal ruled line. If is done, a series of preprocessing is completed.

ステップS310では、拡大後指定領域R2内に有る縦の罫線の座標等の情報と、横の罫線の座標等との情報の少なくともいずれか一方を用いて、拡大後指定領域R2内における箱構造解析がなされ、罫線によって区切られた領域(例えば表におけるそれぞれの升目)ごとに、ステップS500の文字認識処理がなされるようにする。このように、罫線で区切られた領域ごとに文字認識がなされるようにすることにより、ステップS500における文字認識処理部916で文字認識処理がなされるに先立ち、領域拡大処理部912で拡大処理された指定領域から、文字以外のオブジェクトの一例である罫線が除去されることになる。 In step S310, the box structure analysis in the enlarged designated area R2 is performed by using at least one of the information such as the coordinates of the vertical ruled line in the enlarged designated area R2 and the information such as the coordinates of the horizontal ruled line. The character recognition process of step S500 is performed for each area (for example, each square in the table) separated by the ruled line. In this way, by making the character recognition performed for each area delimited by the ruled line, the area expansion processing unit 912 enlarges the character recognition process prior to the character recognition processing performed by the character recognition processing unit 916 in step S500. The ruled line, which is an example of an object other than characters, is removed from the specified area.

10:文書処理システム
100:端末装置
100:端末装置
300:サーバ装置
400:読取装置
500:画像形成装置
900:プログラム
910:受付部
912:領域拡大処理部
914:前処理部
916:文字認識処理部
918:出力部
L:罫線
R1:拡大前指定領域
R2:拡大後指定領域
10: Document processing system 100: Terminal device 100: Terminal device 300: Server device 400: Reading device 500: Image forming device 900: Program 910: Reception unit 912: Area expansion processing unit 914: Preprocessing unit 916: Character recognition processing unit 918: Output unit L: Ruled line R1: Designated area before enlargement R2: Designated area after enlargement

Claims (8)

文字認識処理をするように指定された指定領域の周辺に文字以外のオブジェクトが存在する場合に、文字以外のオブジェクトの全体を包含する処理領域まで指定領域を拡大する領域拡大手段と、
前記領域拡大手段によって拡大された処理領域の画像から文字以外のオブジェクトを除去する除去手段と、
前記除去手段によって文字以外のオブジェクトが除去された画像の文字認識処理をする文字認識手段と、
を有する文書処理装置。
When there are non-character objects around the specified area specified for character recognition processing, an area expansion means that expands the specified area to a processing area that includes the entire non-character object, and an area expansion means .
A removing means for removing objects other than characters from the image of the processing area enlarged by the area expanding means,
A character recognition means that performs character recognition processing of an image in which objects other than characters have been removed by the removal means, and
Document processing device with.
前記文字以外のオブジェクトが罫線である場合に、
前記領域拡大手段は、罫線の全体を包含する領域まで指定領域を拡大する
請求項1記載の文書処理装置。
When the object other than the above characters is a ruled line,
The document processing apparatus according to claim 1, wherein the area expanding means expands a designated area to an area including the entire ruled line.
罫線が、少なくとも一つの升目を有する表を形成している場合に、
前記領域拡大手段は、表の全ての升目を包含する領域まで指定領域を拡大する
請求項2記載の文書処理装置。
If the ruled lines form a table with at least one square,
The document processing apparatus according to claim 2 , wherein the area expansion means expands a designated area to an area including all the squares in the table.
罫線が、文字が記載される文字記載領域と、文字記載領域と隣接する他の領域とを区切る区切線である場合に、
前記領域拡大手段は、区切線の全体を包含する領域まで指定領域を拡大する
請求項2記載の文書処理装置。
When the ruled line is a delimiter line that separates the character description area in which characters are described from another area adjacent to the character description area.
The document processing apparatus according to claim 2, wherein the area expanding means expands a designated area to an area including the entire dividing line.
指定領域が、連続して配置された複数の文字からなる文字列の一部のみを包含する場合に、
前記領域拡大手段は、少なくとも文字列の全体を包含する領域まで指定領域を拡大する
請求項1乃至4いずれか記載の文書処理装置。
When the specified area contains only a part of a character string consisting of a plurality of characters arranged consecutively.
The document processing apparatus according to any one of claims 1 to 4, wherein the area expanding means expands a designated area to at least an area including the entire character string.
指定領域が、複数の文字列の一部のみを包含する場合に、
前記領域拡大手段は、少なくとも複数の文字列の全ての全体を包含する領域まで指定領域を拡大する
請求項1乃至4いずれか記載の文書処理装置。
When the specified area contains only a part of multiple character strings
The document processing apparatus according to any one of claims 1 to 4, wherein the area expanding means expands a designated area to an area including all of at least a plurality of character strings.
指定領域の周辺に複数の文字以外のオブジェクトが存在する場合に、
前記領域拡大手段は、複数の文字以外のオブジェクトの全ての全体を包含する領域まで指定領域を拡大する
請求項1乃至6いずれか記載の文書処理装置。
When there are multiple non-character objects around the specified area
The document processing apparatus according to any one of claims 1 to 6, wherein the area expanding means expands a designated area to an area including the entire object other than a plurality of characters.
文字認識処理をするように指定された指定領域の周辺に文字以外のオブジェクトが存在する場合に、文字以外のオブジェクトの全体を包含する領域まで指定領域を拡大する領域拡大ステップと、
前記領域拡大ステップによって拡大された処理領域の画像から文字以外のオブジェクトを除去する除去ステップと、
前記除去ステップによって文字以外のオブジェクトが除去された画像の文字認識処理をする文字認識ステップと、
をコンピュータに実行させるプログラム。
When there are non-character objects around the specified area specified for character recognition processing, the area expansion step to expand the specified area to the area that includes the entire non-character object, and the area expansion step.
A removal step that removes objects other than characters from the image of the processing area enlarged by the area expansion step, and
A character recognition step for performing character recognition processing on an image in which objects other than characters have been removed by the removal step, and
A program that causes a computer to run.
JP2017078774A 2017-04-12 2017-04-12 Document processing equipment and programs Active JP6922365B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017078774A JP6922365B2 (en) 2017-04-12 2017-04-12 Document processing equipment and programs

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017078774A JP6922365B2 (en) 2017-04-12 2017-04-12 Document processing equipment and programs

Publications (2)

Publication Number Publication Date
JP2018180872A JP2018180872A (en) 2018-11-15
JP6922365B2 true JP6922365B2 (en) 2021-08-18

Family

ID=64276771

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017078774A Active JP6922365B2 (en) 2017-04-12 2017-04-12 Document processing equipment and programs

Country Status (1)

Country Link
JP (1) JP6922365B2 (en)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000020641A (en) * 1998-07-07 2000-01-21 Oki Electric Ind Co Ltd Character recognition system
JP2004094427A (en) * 2002-08-30 2004-03-25 Hitachi Ltd Form image processing apparatus and program for realizing the apparatus
JP4830331B2 (en) * 2005-03-28 2011-12-07 富士ゼロックス株式会社 Character image cutting device and program
WO2015163118A1 (en) * 2014-04-22 2015-10-29 シャープ株式会社 Character specifying device, and control program

Also Published As

Publication number Publication date
JP2018180872A (en) 2018-11-15

Similar Documents

Publication Publication Date Title
JP3308032B2 (en) Skew correction method, skew angle detection method, skew correction device, and skew angle detection device
JP5111268B2 (en) Image processing apparatus, image processing method, program thereof, and storage medium
JP5121599B2 (en) Image processing apparatus, image processing method, program thereof, and storage medium
JP5017031B2 (en) Image processing apparatus, image processing method, image processing program, and storage medium
JP2001358925A (en) Unit and method for image processing and recording medium
JP2001297303A (en) Document image recognition method and apparatus, and computer-readable recording medium
JP2018055255A (en) Information processing apparatus, information processing method, and program
US20090141025A1 (en) Drawing apparatus, drawing program, and drawing method
US6947596B2 (en) Character recognition method, program and recording medium
JP5049922B2 (en) Image processing apparatus and image processing method
CN1859541B (en) Image processing apparatus and its control method
JP2006514344A (en) Digital capture, storage, and transmission method of information by camera equipped in communication terminal
JP2002015280A (en) IMAGE RECOGNITION DEVICE, IMAGE RECOGNITION METHOD, AND COMPUTER-READABLE RECORDING MEDIUM CONTAINING IMAGE RECOGNITION PROGRAM
US9392140B2 (en) Image processing apparatus
JP6922365B2 (en) Document processing equipment and programs
JP2006072839A (en) Image processing method, image processing apparatus, image processing program, and recording medium
JP5794154B2 (en) Image processing program, image processing method, and image processing apparatus
JP7301529B2 (en) Image processing device, image processing method, and program
JP3187895B2 (en) Character area extraction method
JP2007295210A (en) Image processing apparatus, image processing method, image processing program, and recording medium recording the same
JP4974367B2 (en) Region dividing method and apparatus, and program
JP7640708B2 (en) Image processing device, image processing method, and program
JP2009141525A (en) Image processing apparatus and image processing method
JP5248074B2 (en) Music score recognition apparatus, music score recognition method, and computer program
US8432555B2 (en) Image processing apparatus, image processing method, computer-readable medium and computer data signal

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200228

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20201102

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210419

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210629

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210712

R150 Certificate of patent or registration of utility model

Ref document number: 6922365

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150