JP6922365B2 - Document processing equipment and programs - Google Patents
Document processing equipment and programs Download PDFInfo
- Publication number
- JP6922365B2 JP6922365B2 JP2017078774A JP2017078774A JP6922365B2 JP 6922365 B2 JP6922365 B2 JP 6922365B2 JP 2017078774 A JP2017078774 A JP 2017078774A JP 2017078774 A JP2017078774 A JP 2017078774A JP 6922365 B2 JP6922365 B2 JP 6922365B2
- Authority
- JP
- Japan
- Prior art keywords
- area
- character
- designated area
- expansion
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 description 42
- 238000012015 optical character recognition Methods 0.000 description 32
- 238000007781 pre-processing Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 8
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 239000000470 constituent Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
Images
Landscapes
- Character Input (AREA)
Description
本発明は、文書処理装置及びプログラムに関する。 The present invention relates to a document processing apparatus and a program.
特許文献1には、本発明における画像入力装置は、スキャナ機器から画像を入力し、入力した画像上の部分領域に対し光学式文字認識(以下、ゾーンOCR)を実行し、OCR結果として取得されたテキストデータを文書のインデックスデータとし、最終的に文書(画像とインデックスデータ)を文書管理システムへ保存する画像入力装置であり、OCRによってインデックスデータを作成する処理において、部分画像切り出しによる文字切れによる誤認識を補正し、妥当なOCR出力をインデックスデータとして採用する処理を備える画像入力装置であり、まず、インデックスデータを作成するための部分領域に対するOCR処理のために、予め原稿上のOCR領域設定をフォームとして登録するフォーム登録ステップを備え、また、実際の原稿をスキャンし、OCRによってインデックスを作成し、文書(画像とインデックス)を文書管理システムへ保存する画像入力ステップを備え、さらに、前期画像入力ステップにおいては、画像上の部分領域に対するOCR処理で、スキャン入力した画像のインデックス作成処理において、前期フォーム登録ステップで登録されたフォームのOCR領域設定にしたがってスキャン入力した画像の部分領域を切り出し、その部分領域画像に対し、1回目のOCR処理と、次に自動的に部分領域を拡張し2回目のOCR処理を実行し、1回目のOCRの解析結果と2回目のOCRの解析結果を、まず条件1の判断として、「第1のOCR結果」と「第2のOCR結果」を比較した結果、同じテキストデータである場合は、「第1のOCR結果」をインデックスデータとして採用し、次に条件2の判断として、「第1のOCR結果」と「第2のOCR結果」が違うテキストデータで、「第2のOCR結果」に改行コードが含まれていない場合には、「第2のOCR結果」をインデックスデータとして採用し、最後に条件3の判断として、「第1のOCR結果」と「第2のOCR結果」が違うテキストデータである場合で、「第2のOCR結果」に改行コードが含まれている場合、「第2のOCR結果」の文字列を改行コードで分割し、分割されたテキストデータをそれぞれ「第1のOCR結果」と比較し、文字数や文字列を構成するキャラクタが「第1のOCR結果」と近いものをインデックスデータとして採用するといった、条件1、条件2、条件3の判断処理による部分画像切り出しによる文字切れによる誤認識を補正し、インデックデータを取得することを特徴とする画像入力装置が記載されている。 According to Patent Document 1, the image input device of the present invention inputs an image from a scanner device, executes optical character recognition (hereinafter, zone OCR) on a partial region on the input image, and obtains it as an OCR result. It is an image input device that uses the text data as the index data of the document and finally saves the document (image and index data) in the document management system. It is an image input device equipped with a process of correcting erroneous recognition and adopting an appropriate OCR output as index data. First, an OCR area is set in advance on a document for OCR processing for a partial area for creating index data. It has a form registration step to register the document as a form, and also has an image input step to scan the actual manuscript, create an index by OCR, and save the document (image and index) in the document management system. In the input step, in the OCR processing for the partial area on the image, in the index creation processing of the scanned image, the partial area of the scanned image is cut out according to the OCR area setting of the form registered in the previous term form registration step. For the partial area image, the first OCR processing and then the partial area is automatically expanded and the second OCR processing is executed, and the analysis result of the first OCR and the analysis result of the second OCR are displayed. First, as a judgment of condition 1, if the results of comparing the "first OCR result" and the "second OCR result" are the same text data, the "first OCR result" is adopted as the index data, and then As a judgment of condition 2, if the "first OCR result" and the "second OCR result" are different text data and the "second OCR result" does not include a line feed code, the "second OCR result" is determined. "OCR result" is adopted as index data, and finally, as a judgment of condition 3, when "first OCR result" and "second OCR result" are different text data, "second OCR result" If contains a line feed code, the character string of the "second OCR result" is divided by the line feed code, the divided text data is compared with the "first OCR result", and the number of characters and the character string are calculated. Partial image cutout by the judgment processing of condition 1, condition 2, and condition 3, such as adopting the one whose constituent character is close to the "first OCR result" as index data. Described is an image input device characterized by correcting erroneous recognition due to character breakage due to a sword and acquiring index data.
本発明は、文字認識処理において、文字以外のオブジェクトの全体を包含する領域まで文字を認識するように指定された指定領域を拡大しない技術と比較して、認識しようとする文字の周辺に文字以外のオブジェクトが存在することによる文字の認識率の低下を抑制することができる文書処理装置及びプログラムを提供することを目的とする。 In the character recognition process, the present invention is compared with a technique in which a designated area designated to recognize a character is not expanded to an area including the entire object other than the character, and the character other than the character is around the character to be recognized. It is an object of the present invention to provide a document processing device and a program capable of suppressing a decrease in the character recognition rate due to the existence of the object.
請求項1に係る本発明は、文字認識処理をするように指定された指定領域の周辺に文字以外のオブジェクトが存在する場合に、文字以外のオブジェクトの全体を包含する領域まで指定領域を拡大する領域拡大手段を有する文書処理装置である。 The present invention according to claim 1 expands the designated area to an area including the entire non-character object when an object other than the character exists around the designated area designated to perform character recognition processing. It is a document processing device having an area expansion means.
請求項2に係る本発明は、前記文字以外のオブジェクトが罫線である場合に、前記領域拡大手段は、罫線の全体を包含する領域まで指定領域を拡大する請求項1記載の文書処理装置である。 The present invention according to claim 2 is the document processing apparatus according to claim 1, wherein when an object other than the characters is a ruled line, the area expanding means expands a designated area to an area including the entire ruled line. ..
請求項3に係る本発明は、罫線が、少なくとも一つの升目を有する表を形成している場合に、前記領域拡大手段は、表の全ての升目を包含する領域まで指定範囲を拡大する請求項2記載の文書処理装置である。 The present invention according to claim 3 claims that when the ruled lines form a table having at least one square, the area expanding means expands the designated range to an area including all the squares of the table. 2. The document processing apparatus according to 2.
請求項4に係る本発明は、罫線が、文字が記載される文字記載領域と、文字記載領域と隣接する他の領域とを区切る区切線である場合に、前記領域拡大手段は、区切線の全体を包含する領域まで指定領域を拡大する請求項2記載の文書処理装置である。 According to the fourth aspect of the present invention, when the ruled line is a dividing line that separates the character writing area in which the characters are written and another area adjacent to the character writing area, the area expanding means is the dividing line. The document processing apparatus according to claim 2, wherein the designated area is expanded to include the entire area.
請求項5に係る本発明は、指定領域が、連続して配置された複数の文字からなる文字列の一部のみを包含する場合に、前記拡大手段は、少なくとも文字列の全体を包含する領域まで指定領域を拡大する請求項1乃至4いずれか記載の文書処理装置である。 According to the fifth aspect of the present invention, when the designated area includes only a part of a character string composed of a plurality of characters arranged continuously, the expanding means includes at least the entire character string. The document processing apparatus according to any one of claims 1 to 4, wherein the designated area is expanded to.
請求項6に係る本発明は、指定領域が、複数の文字列の一部のみを包含する場合に、前記拡大手段は、少なくとも複数の文字列の全ての全体を包含する領域まで指定領域を拡大する請求項1乃至4いずれか記載の文書処理装置である。 According to the sixth aspect of the present invention, when the designated area includes only a part of a plurality of character strings, the expansion means expands the designated area to an area including at least all of the plurality of character strings. The document processing apparatus according to any one of claims 1 to 4.
請求項7に係る本発明は、指定領域の周辺に複数の文字以外のオブジェクトが存在する場合に、前記領域拡大手段は、複数の文字以外のオブジェクトの全ての全体を包含する領域まで指定領域を拡大する請求項1乃至6いずれか記載の文書処理装置である。 According to the seventh aspect of the present invention, when there are a plurality of objects other than characters in the vicinity of the designated area, the area expanding means extends the designated area to an area including all of the objects other than the plurality of characters. The document processing apparatus according to any one of claims 1 to 6, which is expanded.
請求項8に係る本発明は、文字認識処理をするように指定された指定領域の周辺に文字以外のオブジェクトが存在する場合に、文字以外のオブジェクトの全体を包含する領域まで指定領域を拡大する領域拡大ステップをコンピュータに実行させるプログラムである。 The present invention according to claim 8 expands the designated area to an area including the entire non-character object when there is a non-character object around the designated area designated to perform character recognition processing. A program that causes a computer to perform an area expansion step.
請求項1に係る本発明によれば、文字認識処理において、文字以外のオブジェクトの全体を包含する領域まで文字を認識するように指定された指定領域を拡大しない技術と比較して、認識しようとする文字の周辺に文字以外のオブジェクトが存在することによる文字の認識率の低下を抑制することができる文書処理装置を提供することができる文書処理装置を提供することができる。 According to the first aspect of the present invention, in the character recognition process, an attempt is made to recognize a character as compared with a technique of not expanding a designated area designated to recognize a character to an area including the entire object other than the character. It is possible to provide a document processing device capable of providing a document processing device capable of suppressing a decrease in the recognition rate of a character due to the existence of an object other than the character in the vicinity of the character to be used.
請求項2に係る本発明によれば、罫線の全体を包含する領域まで指定領域を拡大しない技術と比較して、認識しようとうする文字の周辺に罫線が存在することによる文字の認識率の低下を抑制することができる。 According to the second aspect of the present invention, as compared with the technique of not expanding the designated area to the area including the entire ruled line, the recognition rate of the character is lowered due to the existence of the ruled line around the character to be recognized. Can be suppressed.
請求項3に係る本発明によれば、表の全体を包含する領域まで指定領域を拡大しない技術と比較して、認識しようとうする文字の周辺に表が存在することによる文字の認識率の低下を抑制することができる。 According to the third aspect of the present invention, the recognition rate of characters is lowered due to the presence of the table around the character to be recognized, as compared with the technique of not expanding the designated area to the area including the entire table. Can be suppressed.
請求項4に係る本発明によれば、区切線の全体を包含する領域まで指定領域を拡大しない技術と比較して、認識しようとうする文字の周辺に区切線が存在することによる文字の認識率の低下を抑制することができる。 According to the fourth aspect of the present invention, the recognition rate of characters due to the existence of a dividing line around the character to be recognized is compared with the technique of not expanding the designated area to the area including the entire dividing line. Can be suppressed.
請求項5に係る本発明によれば、文字列の全体を包含するまで指定領域を拡大しない技術と比較して、文字列中における認識することができる文字を増やすことができる。 According to the fifth aspect of the present invention, the number of characters that can be recognized in the character string can be increased as compared with the technique that does not expand the designated area until the entire character string is included.
請求項6に係る本発明によれば、複数の文字列の全ての全体を包含する領域まで指定領域を拡大しない技術と比較して、文字列中における認識することができる文字を増やすことができる。 According to the sixth aspect of the present invention, the number of characters that can be recognized in the character string can be increased as compared with the technique that does not expand the designated area to the area that includes all of the plurality of character strings. ..
請求項7に係る本発明によれば、一部の文字以外のオブジェクトの全体だけを包含する領域まで指定領域を拡大する技術と比較して、認識しようとする文字の周辺に文字以外のオブジェクトが存在することによる文字の認識率の低下を抑制することができる。 According to the seventh aspect of the present invention, as compared with the technique of expanding the designated area to the area including only the entire object other than a part of the character, the object other than the character is formed around the character to be recognized. It is possible to suppress a decrease in the recognition rate of characters due to their existence.
請求項7に係る本発明によれば、文字認識処理において、文字以外のオブジェクトの全体を包含する領域まで文字を認識するように指定された指定領域を拡大しない技術と比較して、認識しようとする文字の周辺に文字以外のオブジェクトが存在することによる文字の認識率の低下を抑制することができるプログラムを提供することができる。 According to the present invention according to claim 7, in the character recognition process, an attempt is made to recognize a character as compared with a technique of not expanding a designated area designated to recognize a character to an area including the entire object other than the character. It is possible to provide a program capable of suppressing a decrease in the recognition rate of a character due to the existence of an object other than the character in the vicinity of the character to be used.
以下、本発明の実施形態について図面を参照して詳細に説明する。
図1は、本発明の実施形態で用いられる文書処理システム10の構成の一例を示す図である。図1に示すように、文書処理システム10は、例えば複数の端末装置100を有する。端末装置100としては、例えばパーソナルコンピュータを用いることができる。端末装置100は、それぞれが表示部102と操作部104とを有する。表示部102としては、例えばCRT(Cathode Ray Tube)表示装置や、液晶表示装置を用いることができる。操作部104としては、例えばキーボート、マウス等を用いることができる。尚、端末装置100の詳細は後述する。
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
FIG. 1 is a diagram showing an example of the configuration of the
文書処理システム10は、サーバ装置300をさらに有する。サーバ装置300の詳細は後述する。
The
文書処理システム10は、読取装置400をさらに有する。読取装置400は、所謂スキャナであって、光学的に原稿を読み取り、光学的に読み取った原稿を電子文書(電子ファイル)に変換する。尚、読取装置400の詳細は後述する。
The
文書処理システム10は、画像形成装置500をさらに有する。画像形成装置500は、所謂複合機であって、原稿の複写や文書ファイルのプリント等の記録媒体への画像形成とともに、原稿の読み取りや、ファクシミリの送信を行うことができる。ここで、記録媒体としては、例えば普通紙を用いることができる。画像形成装置500は、原稿読取部502を有する。原稿読取部502は、光学的に原稿を読み取り、光学的に読み取った原稿を電子文書に変換する。尚、画像形成装置500の詳細は後述する。
The
上述の端末装置100と、サーバ装置300と、読取装置400と、画像形成装置500とは、ネットワーク600を介して相互に接続されていて、ネットワーク600を介して相互に通信が可能である。
The
図2は、読取装置400のハードウェア構成を示すブロック図である。図2に示すように、読取装置400は、CPU410と、メモリ412と、記憶装置416と、通信インターフェイス418と、スキャン駆動部420と、操作部422とを少なくとも有し、これらがバスを介して相互に接続されていて、相互に通信可能となっている。
FIG. 2 is a block diagram showing a hardware configuration of the
記憶装置416としては、例えばハードディスクドライブ(HDD)等を用いることができる。通信インターフェイス418は、上述のネットワーク600を介して、上述のサーバ装置300等の外部の装置との間でデータの送信及び受信を行う。CPU410は、メモリ412又は記憶装置416に格納されたプログラムに基づいて処理を実行して、読取装置400の動作を制御する。
As the
図3は、サーバ装置300のハードウェア構成を示すブロック図である。図3に示すように、サーバ装置300は、CPU310と、メモリ312と、記憶装置316と、通信インターフェイス318とを有し、これらがバスを介して相互に接続されていて、相互に通信可能となっている。
FIG. 3 is a block diagram showing a hardware configuration of the
記憶装置316としては、例えばハードディスクドライブ(HDD)等を用いることができる。また、記憶装置316に、端末装置100で作成された電子文書や、読取装置400で読み取られた電子文書や、画像形成装置500で読み取られた電子文書や、画像形成装置500がファクシミリとして受信した電子文書等を記憶させてもよい。
As the
通信インターフェイス318は、上述のネットワーク600を介して、上述の端末装置100等の外部の装置との間でデータの送信及び受信を行う。CPU310は、メモリ312又は記憶装置316に格納されたプログラムに基づいて処理を実行して、サーバ装置300の動作を制御する。
The
図4は、画像形成装置500のハードウェア構成を示すブロック図である。図4に示すように、画像形成装置500は、CPU510と、メモリ512と、記憶装置516と、通信インターフェイス518と、スキャン駆動部520と、操作部522と、画像形成部524とを有し、これらがバスを介して相互に接続されていて、相互に通信可能となっている。
FIG. 4 is a block diagram showing a hardware configuration of the
記憶装置516としては、例えばハードディスクドライブ(HDD)等を用いることができる。通信インターフェイス518は、上述のネットワーク600を介して、上述のサーバ装置300等の外部の装置との間でデータの送信及び受信を行う。CPU510は、メモリ512又は記憶装置516に格納されたプログラムに基づいて処理を実行して画像形成装置500の動作を制御する。スキャン駆動部520は、先述の原稿読取部510を駆動する。画像形成部524は、例えば電子写真方式やインクジェット方式等が用いられていて、記録媒体に画像を形成する。
As the
図5は、端末装置100のハードウェア構成を示すブロック図である。図5に示すように、端末装置100は、CPU110と、メモリ112と、記憶装置116と、通信インターフェイス118と、先述の表示部102と、先述の操作部104とを少なくとも有し、これらがバスを介して相互に接続されていて、相互に通信可能となっている。記憶装置116としては、例えばハードディスクドライブ(HDD)等を用いることができる。通信インターフェイス118は、上述のネットワーク600を介して、上述のサーバ装置300等の外部の装置との間でデータの送信及び受信を行う。
FIG. 5 is a block diagram showing a hardware configuration of the
メモリ112又は記憶装置116には、プログラムが記憶されている。より具体的には、メモリ112又は記憶装置116には、文書処理のためのプログラムであり、文字認識のためのプログラムである本発明に係るプログラム900(図7を参照)が記憶されている。CPU110は、メモリ112又は記憶装置116に格納されたプログラム900に基づいて処理を実行して、端末装置100の動作を制御する。より具体的には、CPU110は、端末装置100を制御して文書処理を行わせ、端末装置100を制御して文字認識を行わせ、端末装置100を制御して本発明に係るプログラム900を実行させる。このように、端末装置100は、特許請求の範囲に記載の文書処理装置に相当する。尚、プログラム900の詳細は後述する。
The program is stored in the
この実施形態においては、メモリ112又は記憶装置116に本発明に係るプログラム900を記憶させ、端末装置100を特許請求の範囲に記載の文書処理装置として用いるものの、メモリ412又は記憶装置416に本発明に係るプログラム900を記憶させ、読取装置400を特許請求の範囲に記載の文書処理装置として用いてもよい。また、メモリ312又は記憶装置316に本発明のプログラム900を記憶させ、サーバ装置300を特許請求の範囲に記載の文書処理装置として用いてもよい。また、メモリ512又は記憶装置516に本発明のプログラム900を記憶させ、画像形成装置500を特許請求の範囲に記載の文書処理装置として用いてもよい。
In this embodiment, the
図6は、プログラム900の処理の概要を説明する図であり、図6(A)はプログラム900による処理の第1の例を説明していて、図6(B)はプログラム900による第2の例を説明していて、図6(C)はプログラム900による第3の例を説明している。 6A and 6B are views for explaining the outline of the processing of the program 900, FIG. 6A illustrates the first example of the processing by the program 900, and FIG. 6B shows the second example of the processing by the program 900. An example is described, and FIG. 6C illustrates a third example by program 900.
プログラム900は、OCR(Optical Character Recognition/Reader)とも称される光学的文字認識に関する処理のプログラムであり、図6に示すように、光学的に文字認識をするように予め指定された指定領域を一定の条件のもとで拡大するプログラムである。図6においては、プログラム900で拡大される前の指定領域(以下、拡大前指定領域R1とする)を太い一点鎖線で示しており、プログラム900により拡大された後の指定領域(以下、拡大後指定領域R2とする)を太い点線で示している。 The program 900 is a processing program related to optical character recognition, which is also called OCR (Optical Character Recognition / Reader), and as shown in FIG. 6, a designated area designated in advance to perform optical character recognition is set. It is a program that expands under certain conditions. In FIG. 6, the designated area before being expanded by the program 900 (hereinafter referred to as the designated area before expansion R1) is shown by a thick alternate long and short dash line, and the designated area after being expanded by the program 900 (hereinafter referred to as after expansion). The designated area R2) is indicated by a thick dotted line.
より具体的には、プログラム900は、拡大前指定領域R1の周辺に、すなわち拡大前指定領域R1の内側及び拡大前指定領域R1の外側の少なくとも一方に文字以外のオブジェクトが存在する場合に、文字以外のオブジェクトの全体を包含する領域まで、拡大前指定領域R1を拡大後指定領域R2へと拡大する。ここで、文字以外のオブジェクトとしては、例えば、矢印等の画像や、罫線等を挙げることができる。そして、罫線としては、例えば、少なくとも一つの升目を有する表や区切線を挙げることができる。ここで、区切り線とは、文字が記載される文字記載領域と、上述の文字記載領域と隣接する他の領域とを区切る線分をいう。以下、文以外のオブジェクトが罫線Lである場合であって、罫線Lが表を形成している場合と、罫線Lが区切線である場合と例として示して説明をする。 More specifically, the program 900 describes a character when an object other than a character exists in the vicinity of the pre-expansion designated area R1, that is, at least one of the inside of the pre-expansion designated area R1 and the outside of the pre-expansion designated area R1. The pre-expansion designated area R1 is expanded to the post-expansion designated area R2 to the area including the entire object other than the above. Here, examples of objects other than characters include images such as arrows and ruled lines. Then, as the ruled line, for example, a table having at least one square or a dividing line can be mentioned. Here, the dividing line means a line segment that separates a character description area in which characters are described and another area adjacent to the above-mentioned character description area. Hereinafter, the case where the object other than the sentence is the ruled line L, the case where the ruled line L forms a table, and the case where the ruled line L is a dividing line will be described as an example.
図6(A)に示す第1の例においては、拡大前指定領域R1内に「1,000」との文字があり、拡大前指定領域R1の上部に「金額」との文字があり、拡大前指定領域R1の下部に「2,590」との文字がある。また、拡大前指定領域R1の周囲にある文字以外のオブジェクトは罫線L1であり、罫線L1が横3升、縦3升の表を形成している。この第1の例においては、プログラム900は、表の全ての升目(9個の升目)を指定領域が包含する領域まで、拡大前指定領域R1から拡大後指定領域R2へと指定領域を拡大する。 In the first example shown in FIG. 6A, there is a character "1,000" in the pre-expansion designated area R1 and a character "amount" in the upper part of the pre-expansion designated area R1. There is a character "2,590" at the bottom of the pre-designated area R1. Further, the objects other than the characters around the designated area R1 before enlargement are ruled lines L1, and the ruled lines L1 form a table of 3 horizontal squares and 3 vertical squares. In this first example, the program 900 expands the designated area from the pre-expansion designated area R1 to the post-expansion designated area R2 to the area covered by the designated area (9 squares) in the table. ..
図6(B)に示す第2の例においては、拡大前指定領域R1内に「1,000」との文字がある。また、拡大前指定領域R1の周囲にある文字以外のオブジェクトは罫線L2であり、罫線L2は区切線である。この第2の例においては、プログラム900は、罫線L2の全体を指定領域が包含する領域まで、拡大前指定領域R1から拡大後指定領域R2へと指定領域を拡大する。 In the second example shown in FIG. 6B, there is a character "1,000" in the pre-expansion designated area R1. Further, the objects other than the characters around the pre-expansion designated area R1 are the ruled line L2, and the ruled line L2 is the dividing line. In this second example, the program 900 expands the designated area from the pre-expansion designated area R1 to the post-expansion designated area R2 to the area where the designated area covers the entire ruled line L2.
図6(C)に示す第3の例においては、拡大前指定領域R1内に「1,000」との文字列の全てが配置されている。すなわち、拡大前指定領域R1が、連続して配置された複数の文字からなる「1,000」との文字列の全てを包含している。また、図6(C)に示す第3の例においては、拡大前指定領域R1内に「2,000」との文字列の一部が配置されている。すなわち、拡大前指定領域R1が、連続して配置された複数の文字からなる「2,000」との文字列の一部分のみを包含している。 In the third example shown in FIG. 6C, all of the character strings "1,000" are arranged in the pre-expansion designated area R1. That is, the pre-expansion designated area R1 includes all of the character strings "1,000" composed of a plurality of characters arranged consecutively. Further, in the third example shown in FIG. 6C, a part of the character string "2,000" is arranged in the pre-expansion designated area R1. That is, the pre-expansion designated area R1 includes only a part of the character string "2,000" composed of a plurality of characters arranged consecutively.
また、拡大前指定領域R1の周囲にある文字以外のオブジェクトは、罫線L3と罫線L4である。このように、この第3の例においては、拡大前指定領域R1の周囲に複数の(2つの)文字以外のオブジェクトが存在している。罫線L3は一枡からなる表を形成していて、罫線L4も、同様に一枡からなる表を形成している。 The objects other than the characters around the pre-expansion designated area R1 are the ruled line L3 and the ruled line L4. As described above, in this third example, there are a plurality of objects other than the (two) characters around the pre-expansion designated area R1. The ruled line L3 forms a table composed of one square, and the ruled line L4 also forms a table composed of one square.
この第3の例においては、プログラム900は、一部分のみが拡大前指定領域R1に包含されている「2,000」との文字列の全体が拡大後指定領域R2に包含される領域まで、指定領域を拡大前指定領域R1から拡大後指定領域R2へと拡大している。また、この第3の例においては、プログラム900は、文字以外のオブジェクトである複数のオブジェクト(罫線L3が形成する表と罫線L4が形成する表)の全てを指定領域が包含するように、指定領域を拡大前指定領域R1から拡大後指定領域R2まで拡大している。 In this third example, the program 900 specifies up to an area in which the entire character string "2,000", of which only a part is included in the pre-expansion designated area R1, is included in the post-expansion designated area R2. The area is expanded from the designated area R1 before expansion to the designated area R2 after expansion. Further, in the third example, the program 900 specifies that the designated area includes all of a plurality of objects (a table formed by the ruled line L3 and a table formed by the ruled line L4) which are objects other than characters. The area is expanded from the designated area R1 before expansion to the designated area R2 after expansion.
さらには、この第3の例においては、プログラム900は、「1,000」との文字列と「2,000」との文字列との複数文字列のうちの一部である「1,000」との文字列」の全体のみが拡大前指定領域R1に包含されていて、複数の文字列のうちの他の一部である「2,000」との文字列の全体は拡大前指定領域R1に包含されていない状態から、「1,000」との文字列と「2,000」との文字列との複数文字列の全ての全体を包含する領域ように、指定領域を拡大後指定領域R2まで拡大している。 Furthermore, in this third example, the program 900 is a part of a plurality of character strings of the character string "1,000" and the character string "2,000", "1,000". Only the entire character string with "" is included in the pre-expansion designated area R1, and the entire character string with "2,000", which is another part of the plurality of character strings, is included in the pre-expansion designated area. Designated after expanding the designated area so that it covers all of the plurality of character strings of the character string "1,000" and the character string "2,000" from the state not included in R1. It is expanded to the area R2.
尚、プログラム900の具体的なアルゴリズムは後述する。 The specific algorithm of the program 900 will be described later.
図7は、文書処理システム10のソフトウエア構成を示すブロック図であり、本発明のプログラム900の構成を示すブロック図である。図7に示すように、プログラム900は、受付部910を有する。受付部910は、読取装置400や原稿読取部502から電子文書を受け付ける。
FIG. 7 is a block diagram showing the software configuration of the
プログラム900は、領域拡大処理部912をさらに有する。領域拡大処理部912は、先に具体例を示して説明をしたように(図6(A)、図6(B)、図6(C)を参照)、文字認識をするように指定された指定領域の周辺に文字以外のオブジェクトが存在する場合に、文字以外のオブジェクトの全体を指定領域が包含する領域まで、拡大前指定領域R1から拡大後指定領域R2へと指定領域を拡大する。
The program 900 further includes an area
プログラム900は、前処理部914をさらに有する。前処理部914は、後述する文字認識処理部916が文字を認識することに先立ち前処理をする。より具体的には、受付部910は、受付部910が受け付けた電子文書や領域拡大処理部912で指定領域が拡大された電子文書から、例えば罫線等の文字以外のオブジェクトを除去する処理を施す。このように、前処理部914は、領域拡大処理部912によって拡大された指定領域から、文字以外のオブジェクトを除去する除去手段として用いられている。
The program 900 further includes a
前処理部914は、文字以外のオブジェクトの除去と併せて、例えば、原稿を読み取る際等に乗じたノイズの除去をしたり、傾いた状態で原稿が読み取られた等の理由で生じる傾斜を解消するためのスキュー補正(傾斜解消処理)をしたりする。
In addition to removing objects other than characters, the
プログラム900は、文字認識処理部916をさらに有する。文字認識処理部916は、前処理部914から受け付けた電子文書から文字を認識する処理をする。
The program 900 further includes a character
プログラム900は、出力部918をさらに有する。出力部918は、文字認識処理部916から受け付けた電子文書を、例えばサーバ装置300や画像形成装置500等の外部の装置へと出力する。
The program 900 further includes an
図8は、文書処理システム10の動作の一例を示すフローチャートである。図8に示すように、一連の動作が開始を開始させると、ステップS100において、CPU110は受付部910を制御し、受付部910に電子文書を受け付けさせる。
FIG. 8 is a flowchart showing an example of the operation of the
次のステップであるステップS200では、CPU110は、領域拡大処理部912を制御して、領域拡大処理部912に、文字認識をするように指定された指定領域の周辺に文字以外のオブジェクトが存在する場合に、文字以外のオブジェクトの全体を指定領域が包含する領域まで指定領域を拡大前指定領域R1から拡大後指定領域R2へと拡大させる。
In step S200, which is the next step, the
次のステップであるステップS300では、CPU110は、前処理部914を制御して、前処理部914に前処理をさせる。すなわち、CPU110は、前処理部914を制御して、前処理部914に電子文書から文字以外のオブジェクトを除去させたり、ノイズ除去をさせたり、スキュー補正をさせたりする。
In step S300, which is the next step, the
次のステップであるステップS500では、CPU110は、文字認識処理部916を制御して、文字認識処理部916に、ステップS300で前処理された電子文書から文字を認識させる処理をさせる。
In step S500, which is the next step, the
次のステップであるステップS600では、CPU110は、出力部918を制御し、出力部918に、ステップS500でも文字が認識された電子文書を例えばサーバ装置300や画像形成装置500等の外部の装置へと出力させる。
In step S600, which is the next step, the
図9は、上述のステップS200における領域拡大処理の詳細の一例を示すフローチャートであって、図6(A)と図6(B)とに示す拡大前指定領域R1の周囲に罫線がある場合の処理の詳細を示すフローチャートである。ステップS200における領域拡大処理を開始すると、CPU110は、ステップS202において、領域拡大処理部912に、拡大前指定領域R1の中心から左右両方向に向けて、例えば罫線等の文字以外のオブジェクト(以下、単に「罫線」とする、また、図9及び図10において単に「罫線」と示す)の検索をさせる。
FIG. 9 is a flowchart showing an example of details of the area expansion process in step S200, and is a case where there is a ruled line around the pre-expansion designated area R1 shown in FIGS. 6 (A) and 6 (B). It is a flowchart which shows the detail of a process. When the area expansion process in step S200 is started, the
次のステップS204では、ステップS202における左右への検索の結果、罫線が有ったか否かが判別され、罫線が有った場合はステップS206に進み、罫線がなかった場合はステップS250に進む。 In the next step S204, as a result of the search to the left and right in step S202, it is determined whether or not there is a ruled line, and if there is a ruled line, the process proceeds to step S206, and if there is no ruled line, the process proceeds to step S250.
ステップS206では、CPU110は、領域拡大処理部912にステップS202で検索された罫線の矩形調査をさせる。すなわち、CPU110は、領域拡大処理部912に罫線の座標を抽出させる。
In step S206, the
次のステップであるステップS208では、ステップS206で抽出された罫線の座標を用いて、ステップS202で検索された罫線が拡大前指定領域R1の全体を包含しているか否かを判別し、ステップS208で検索された罫線が拡大前指定領域R1の全体を包含しているとの判別がなされた場合はステップS218へと進み、ステップS208で検索された罫線が拡大前指定領域R1の全体を包含していないとの判別がなされた場合は、ステップS210に進む。 In step S208, which is the next step, it is determined whether or not the ruled line searched in step S202 includes the entire pre-expansion designated area R1 by using the coordinates of the ruled line extracted in step S206, and step S208. If it is determined that the ruled line searched in step 2 includes the entire pre-expansion designated area R1, the process proceeds to step S218, and the ruled line searched in step S208 includes the entire pre-expansion designated area R1. If it is determined that the case is not present, the process proceeds to step S210.
ステップS210では、ステップS206で抽出された罫線の座標を用いて、ステップS202で検索された罫線が拡大前指定領域R1の一部分を包含しているか否かを判別し、ステップS208で検索された罫線が拡大前指定領域R1の一部分を包含しているとの判別がなされた場合はステップS212へと進み、ステップS208で検索された罫線が拡大前指定領域R1の一部分も包含していないとの判別がなされた場合は、ステップS220に進む。 In step S210, it is determined whether or not the ruled line searched in step S202 includes a part of the pre-expansion designated area R1 by using the coordinates of the ruled line extracted in step S206, and the ruled line searched in step S208 is determined. If it is determined that a part of the pre-expansion designated area R1 is included, the process proceeds to step S212, and it is determined that the ruled line searched in step S208 does not include a part of the pre-expansion designated area R1. If is done, the process proceeds to step S220.
ステップS212では、ステップS210で拡大前指定領域R1の一部を包含しているとの判断がなされた罫線を、続いての処理のために一次候補として登録する。 In step S212, the ruled line determined in step S210 to include a part of the pre-expansion designated area R1 is registered as a primary candidate for subsequent processing.
次のステップであるステップS214では、ステップS212で一時候補として登録された罫線の他に、ステップS202で検索された罫線が有るか否かを判別し、ステップS212で一時候補として登録された罫線の他に罫線が有ると判別した場合は、ステップS206に戻り、以上で説明をした処理を他の罫線について繰り返す。一方、ステップS212で一時候補として登録をされた罫線の他に、ステップS202で検索された罫線がないと判別した場合は、ステップS216に進む。 In step S214, which is the next step, it is determined whether or not there is a ruled line searched in step S202 in addition to the ruled line registered as a temporary candidate in step S212, and the ruled line registered as a temporary candidate in step S212 is determined. If it is determined that there is another ruled line, the process returns to step S206, and the process described above is repeated for the other ruled line. On the other hand, if it is determined that there is no ruled line searched in step S202 other than the ruled line registered as a temporary candidate in step S212, the process proceeds to step S216.
ステップS216では、ステップS212で一時候補として、これまでに登録された罫線が続いての処理のために選択される。 In step S216, the ruled lines registered so far are selected as temporary candidates in step S212 for subsequent processing.
ステップS250では、CPU110は、領域拡大処理部912に、拡大前指定領域R1の中心から上下両方向に向けて、罫線の検索をさせる。尚、上下方向に向けて罫線の検索の詳細は後述する(図10を参照)。
In step S250, the
次のステップであるステップS280では、ステップS250における上下への検索結果、罫線が有ったか否かが判別され、罫線が有ったとの判別がなされた場合はステップS218に進み、ステップS250における上下への検索の結果、罫線がなかったとの判別がなされた場合は、ステップS220に進む。 In step S280, which is the next step, the search result up and down in step S250 determines whether or not there is a ruled line, and if it is determined that there is a ruled line, the process proceeds to step S218, and the up and down in step S250. As a result of the search for, if it is determined that there is no ruled line, the process proceeds to step S220.
ステップS218では、指定領域が罫線の全体を包含する領域まで拡大され、指定領域が拡大前指定領域R1から拡大後指定領域R2へと拡大される。すなわち、ステップS208において指定領域の全体を包含しているとの判別された罫線の大きさまで指定領域が拡大されるか、ステップS216で選択された全部の罫線を包含する領域まで指定領域が拡大されるか、ステップS250で検索された罫線の全体を包含する領域まで指定領域が拡大される。 In step S218, the designated area is expanded to an area including the entire ruled line, and the designated area is expanded from the pre-expansion designated area R1 to the post-expansion designated area R2. That is, the designated area is expanded to the size of the ruled line determined to include the entire designated area in step S208, or the designated area is expanded to the area including all the ruled lines selected in step S216. Or, the designated area is expanded to the area including the entire ruled line searched in step S250.
ステップS220では、指定領域の拡大はされない。すなわち、続いてのステップで、拡大前指定領域R1について前処理がなされ(図8におけるステップS300を参照)、さらには、文字認識処理がなされる(図8におけるステップS500を参照)。 In step S220, the designated area is not expanded. That is, in the subsequent step, the pre-expansion designated area R1 is preprocessed (see step S300 in FIG. 8), and further, the character recognition process is performed (see step S500 in FIG. 8).
図10は、上述のステップS250における上下への罫線の検索と、ステップS280におおける判別との詳細を示すフローチャートである。ステップS250における上下の罫線の検索を開始すると、CPU110は、ステップS252において、領域拡大処理部912に、指定領域の中心から上側に向けて罫線の検索をさせる。
FIG. 10 is a flowchart showing the details of the search for the vertical ruled lines in step S250 and the discrimination in step S280. When the search for the upper and lower ruled lines in step S250 is started, the
次のステップであるステップS254では、ステップS252における上への検索の結果、罫線が有ったか否かが判別され、罫線が有った場合はステップS256に進む、罫線がなかった場合はステップS258に進む。 In step S254, which is the next step, as a result of the upward search in step S252, it is determined whether or not there is a ruled line, and if there is a ruled line, the process proceeds to step S256, and if there is no ruled line, step S258. Proceed to.
ステップS256では、CPU110は、領域拡大処理部912に、ステップS253で検索された罫線が包含される領域まで指定領域を拡大するように指定領域を拡大する際の上端側を決定させる。
In step S256, the
ステップS258では、CPU110は、領域拡大処理部912に、指定領域の中心から下側に向けて罫線の検索をさせる。
In step S258, the
次のステップであるステップS260では、ステップS258における下への検索の結果、罫線が有ったか否かが判別され、罫線が有った場合はステップS262に進み、罫線がなかった場合はステップS284に進む。 In step S260, which is the next step, as a result of the downward search in step S258, it is determined whether or not there is a ruled line, and if there is a ruled line, the process proceeds to step S262, and if there is no ruled line, step S284. Proceed to.
ステップS262では、CPU110は、領域拡大処理部912に、ステップS258で検索された罫線が包含される領域まで指定領域を拡大するように指定領域を拡大する際の下端側を決定させる。
In step S262, the
次のステップであるステップS282では、指定領域の上側及び下側の少なくともいずれか一方にはが罫線が有るものとされ、次のステップS218(図9を参照)へと進む。この際、ステップS218では、ステップS256で決定された指定領域を拡大する際の上端部と、ステップS262で決定された指定領域を拡大する際の下端部とに基づいて、拡大前指定領域R1が拡大後指定領域R2へと拡大される。 In step S282, which is the next step, it is assumed that at least one of the upper side and the lower side of the designated area has a ruled line, and the process proceeds to the next step S218 (see FIG. 9). At this time, in step S218, the pre-expansion designated area R1 is set based on the upper end portion when expanding the designated area determined in step S256 and the lower end portion when expanding the designated area determined in step S262. After expansion, it is expanded to the designated area R2.
ステップS284では、指定領域の上側にも下側にも罫線がないものとされ、次のステップS220(図9を参照)へと進む。 In step S284, it is assumed that there is no ruled line on either the upper side or the lower side of the designated area, and the process proceeds to the next step S220 (see FIG. 9).
以上の説明においては、拡大前指定領域R1の周囲に罫線がある場合の指定領域の拡大を例として挙げて指定領域の拡大を説明したものの、連続して配置された複数の文字からなる文字列の一部のみを拡大前指定領域R1が包含する場合や、複数の文字列の一部のみを拡大前指定領域R1が包含する場合も、拡大前指定領域R1の周囲に罫線がある場合と同様に指定領域の拡大がなされる。 In the above description, the expansion of the designated area has been described by taking as an example the expansion of the designated area when there is a ruled line around the designated area R1 before expansion, but a character string consisting of a plurality of characters arranged continuously has been described. When the pre-expansion designated area R1 includes only a part of the above, or when the pre-expansion designated area R1 includes only a part of a plurality of character strings, it is the same as when there is a ruled line around the pre-expansion designated area R1. The designated area is expanded.
また、拡大前指定領域R1の周囲に罫線がある場合の指定領域の拡大と、連続して配置された複数の文字からなる文字列の一部のみを拡大前指定領域R1が包含する場合の指定領域の拡大と、複数の文字列の一部のみを拡大前指定領域R1が包含する場合の指定領域の拡大とは、重畳して、例えば同時になされる。 Further, the expansion of the designated area when there is a ruled line around the designated area R1 before expansion, and the designation when the designated area R1 before expansion includes only a part of the character string composed of a plurality of characters arranged continuously. The expansion of the area and the expansion of the designated area when the pre-expansion designated area R1 includes only a part of the plurality of character strings are superimposed, for example, performed at the same time.
図11は、上述のステップS300における前処理の詳細を示すフローチャートである。ステップS300における前処理を開始すると、CPU110は、ステップS302において、前処理部914に例えば原稿を読み取る際等に乗じたノイズを除去させる。
FIG. 11 is a flowchart showing the details of the preprocessing in step S300 described above. When the preprocessing in step S300 is started, the
次のステップであるステップS304では、CPU110は、前処理部914に、傾いた状態で原稿が読み取られた等の理由で生じる傾斜を解消するためのスキュー補正(傾斜解消処理)をさせる。
In step S304, which is the next step, the
次のステップであるステップS306では、拡大後指定領域R2内に縦の罫線が有るか否かの判別がなされ、縦の罫線が有るとの判別がなされた場合はステップS310に進み、縦の罫線がないとの判別がなされた場合は、ステップS308に進む。 In step S306, which is the next step, it is determined whether or not there is a vertical ruled line in the designated area R2 after enlargement, and if it is determined that there is a vertical ruled line, the process proceeds to step S310 and the vertical ruled line is determined. If it is determined that there is no such thing, the process proceeds to step S308.
ステップS308では、拡大後指定領域R2内に横の罫線が有るか否かの判別がなされ、横の罫線があるとの判別がなされた場合はステップS310に進み、横の罫線がないとの判別がなされた場合は、一連の前処理が終了する。 In step S308, it is determined whether or not there is a horizontal ruled line in the designated area R2 after enlargement, and if it is determined that there is a horizontal ruled line, the process proceeds to step S310 and it is determined that there is no horizontal ruled line. If is done, a series of preprocessing is completed.
ステップS310では、拡大後指定領域R2内に有る縦の罫線の座標等の情報と、横の罫線の座標等との情報の少なくともいずれか一方を用いて、拡大後指定領域R2内における箱構造解析がなされ、罫線によって区切られた領域(例えば表におけるそれぞれの升目)ごとに、ステップS500の文字認識処理がなされるようにする。このように、罫線で区切られた領域ごとに文字認識がなされるようにすることにより、ステップS500における文字認識処理部916で文字認識処理がなされるに先立ち、領域拡大処理部912で拡大処理された指定領域から、文字以外のオブジェクトの一例である罫線が除去されることになる。
In step S310, the box structure analysis in the enlarged designated area R2 is performed by using at least one of the information such as the coordinates of the vertical ruled line in the enlarged designated area R2 and the information such as the coordinates of the horizontal ruled line. The character recognition process of step S500 is performed for each area (for example, each square in the table) separated by the ruled line. In this way, by making the character recognition performed for each area delimited by the ruled line, the area
10:文書処理システム
100:端末装置
100:端末装置
300:サーバ装置
400:読取装置
500:画像形成装置
900:プログラム
910:受付部
912:領域拡大処理部
914:前処理部
916:文字認識処理部
918:出力部
L:罫線
R1:拡大前指定領域
R2:拡大後指定領域
10: Document processing system 100: Terminal device 100: Terminal device 300: Server device 400: Reading device 500: Image forming device 900: Program 910: Reception unit 912: Area expansion processing unit 914: Preprocessing unit 916: Character recognition processing unit 918: Output unit L: Ruled line R1: Designated area before enlargement R2: Designated area after enlargement
Claims (8)
前記領域拡大手段によって拡大された処理領域の画像から文字以外のオブジェクトを除去する除去手段と、
前記除去手段によって文字以外のオブジェクトが除去された画像の文字認識処理をする文字認識手段と、
を有する文書処理装置。 When there are non-character objects around the specified area specified for character recognition processing, an area expansion means that expands the specified area to a processing area that includes the entire non-character object, and an area expansion means .
A removing means for removing objects other than characters from the image of the processing area enlarged by the area expanding means,
A character recognition means that performs character recognition processing of an image in which objects other than characters have been removed by the removal means, and
Document processing device with.
前記領域拡大手段は、罫線の全体を包含する領域まで指定領域を拡大する
請求項1記載の文書処理装置。 When the object other than the above characters is a ruled line,
The document processing apparatus according to claim 1, wherein the area expanding means expands a designated area to an area including the entire ruled line.
前記領域拡大手段は、表の全ての升目を包含する領域まで指定領域を拡大する
請求項2記載の文書処理装置。 If the ruled lines form a table with at least one square,
The document processing apparatus according to claim 2 , wherein the area expansion means expands a designated area to an area including all the squares in the table.
前記領域拡大手段は、区切線の全体を包含する領域まで指定領域を拡大する
請求項2記載の文書処理装置。 When the ruled line is a delimiter line that separates the character description area in which characters are described from another area adjacent to the character description area.
The document processing apparatus according to claim 2, wherein the area expanding means expands a designated area to an area including the entire dividing line.
前記領域拡大手段は、少なくとも文字列の全体を包含する領域まで指定領域を拡大する
請求項1乃至4いずれか記載の文書処理装置。 When the specified area contains only a part of a character string consisting of a plurality of characters arranged consecutively.
The document processing apparatus according to any one of claims 1 to 4, wherein the area expanding means expands a designated area to at least an area including the entire character string.
前記領域拡大手段は、少なくとも複数の文字列の全ての全体を包含する領域まで指定領域を拡大する
請求項1乃至4いずれか記載の文書処理装置。 When the specified area contains only a part of multiple character strings
The document processing apparatus according to any one of claims 1 to 4, wherein the area expanding means expands a designated area to an area including all of at least a plurality of character strings.
前記領域拡大手段は、複数の文字以外のオブジェクトの全ての全体を包含する領域まで指定領域を拡大する
請求項1乃至6いずれか記載の文書処理装置。 When there are multiple non-character objects around the specified area
The document processing apparatus according to any one of claims 1 to 6, wherein the area expanding means expands a designated area to an area including the entire object other than a plurality of characters.
前記領域拡大ステップによって拡大された処理領域の画像から文字以外のオブジェクトを除去する除去ステップと、
前記除去ステップによって文字以外のオブジェクトが除去された画像の文字認識処理をする文字認識ステップと、
をコンピュータに実行させるプログラム。 When there are non-character objects around the specified area specified for character recognition processing, the area expansion step to expand the specified area to the area that includes the entire non-character object, and the area expansion step.
A removal step that removes objects other than characters from the image of the processing area enlarged by the area expansion step, and
A character recognition step for performing character recognition processing on an image in which objects other than characters have been removed by the removal step, and
A program that causes a computer to run.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017078774A JP6922365B2 (en) | 2017-04-12 | 2017-04-12 | Document processing equipment and programs |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017078774A JP6922365B2 (en) | 2017-04-12 | 2017-04-12 | Document processing equipment and programs |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2018180872A JP2018180872A (en) | 2018-11-15 |
| JP6922365B2 true JP6922365B2 (en) | 2021-08-18 |
Family
ID=64276771
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2017078774A Active JP6922365B2 (en) | 2017-04-12 | 2017-04-12 | Document processing equipment and programs |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6922365B2 (en) |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000020641A (en) * | 1998-07-07 | 2000-01-21 | Oki Electric Ind Co Ltd | Character recognition system |
| JP2004094427A (en) * | 2002-08-30 | 2004-03-25 | Hitachi Ltd | Form image processing apparatus and program for realizing the apparatus |
| JP4830331B2 (en) * | 2005-03-28 | 2011-12-07 | 富士ゼロックス株式会社 | Character image cutting device and program |
| WO2015163118A1 (en) * | 2014-04-22 | 2015-10-29 | シャープ株式会社 | Character specifying device, and control program |
-
2017
- 2017-04-12 JP JP2017078774A patent/JP6922365B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| JP2018180872A (en) | 2018-11-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3308032B2 (en) | Skew correction method, skew angle detection method, skew correction device, and skew angle detection device | |
| JP5111268B2 (en) | Image processing apparatus, image processing method, program thereof, and storage medium | |
| JP5121599B2 (en) | Image processing apparatus, image processing method, program thereof, and storage medium | |
| JP5017031B2 (en) | Image processing apparatus, image processing method, image processing program, and storage medium | |
| JP2001358925A (en) | Unit and method for image processing and recording medium | |
| JP2001297303A (en) | Document image recognition method and apparatus, and computer-readable recording medium | |
| JP2018055255A (en) | Information processing apparatus, information processing method, and program | |
| US20090141025A1 (en) | Drawing apparatus, drawing program, and drawing method | |
| US6947596B2 (en) | Character recognition method, program and recording medium | |
| JP5049922B2 (en) | Image processing apparatus and image processing method | |
| CN1859541B (en) | Image processing apparatus and its control method | |
| JP2006514344A (en) | Digital capture, storage, and transmission method of information by camera equipped in communication terminal | |
| JP2002015280A (en) | IMAGE RECOGNITION DEVICE, IMAGE RECOGNITION METHOD, AND COMPUTER-READABLE RECORDING MEDIUM CONTAINING IMAGE RECOGNITION PROGRAM | |
| US9392140B2 (en) | Image processing apparatus | |
| JP6922365B2 (en) | Document processing equipment and programs | |
| JP2006072839A (en) | Image processing method, image processing apparatus, image processing program, and recording medium | |
| JP5794154B2 (en) | Image processing program, image processing method, and image processing apparatus | |
| JP7301529B2 (en) | Image processing device, image processing method, and program | |
| JP3187895B2 (en) | Character area extraction method | |
| JP2007295210A (en) | Image processing apparatus, image processing method, image processing program, and recording medium recording the same | |
| JP4974367B2 (en) | Region dividing method and apparatus, and program | |
| JP7640708B2 (en) | Image processing device, image processing method, and program | |
| JP2009141525A (en) | Image processing apparatus and image processing method | |
| JP5248074B2 (en) | Music score recognition apparatus, music score recognition method, and computer program | |
| US8432555B2 (en) | Image processing apparatus, image processing method, computer-readable medium and computer data signal |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200228 |
|
| RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20201102 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210224 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210419 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210629 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210712 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6922365 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |