JP4766451B2 - Encoding apparatus, image processing apparatus, encoding method, and encoding program - Google Patents
Encoding apparatus, image processing apparatus, encoding method, and encoding program Download PDFInfo
- Publication number
- JP4766451B2 JP4766451B2 JP2005365759A JP2005365759A JP4766451B2 JP 4766451 B2 JP4766451 B2 JP 4766451B2 JP 2005365759 A JP2005365759 A JP 2005365759A JP 2005365759 A JP2005365759 A JP 2005365759A JP 4766451 B2 JP4766451 B2 JP 4766451B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- character data
- encoding
- character
- reduction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 13
- 238000000926 separation method Methods 0.000 description 40
- 238000000605 extraction Methods 0.000 description 22
- 238000010586 diagram Methods 0.000 description 8
- 238000007906 compression Methods 0.000 description 5
- 230000006835 compression Effects 0.000 description 5
- 239000000284 extract Substances 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 2
- 230000008602 contraction Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
Images
Landscapes
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本発明は、データを符号化する符号化装置、画像処理装置、符号化方法及び符号化プログラムに関するものである。 The present invention relates to an encoding device, an image processing device, an encoding method, and an encoding program for encoding data.
画像データを効率的に符号化する画像処理装置として、画像データを文字画像領域と他の画像領域とに分離して符号化を行うものが知られている。この種の画像処理装置において、確実に符号量の総量を一定量に制御することは公知である(特許文献1参照)。また、画像データを活字、手書き文字、写真及び絵柄などの画像領域に分割し、画像領域の画像種類に適した画像データ圧縮を行うことにより、圧縮率を高めることは公知である(特許文献2参照)。 As an image processing apparatus that efficiently encodes image data, an image processing apparatus that performs encoding by separating image data into a character image area and another image area is known. In this type of image processing apparatus, it is known to reliably control the total amount of codes to a constant amount (see Patent Document 1). In addition, it is known to increase the compression rate by dividing image data into image areas such as printed characters, handwritten characters, photographs, and patterns and performing image data compression suitable for the image type of the image area (Patent Document 2). reference).
しかしながら、上記従来例においては、文字画像領域を抽出するための処理を画像全体に対して一律に行う必要があり、符号化処理の高速化と画質の向上とを両立させることができないという問題があった。 However, in the above conventional example, it is necessary to uniformly perform the process for extracting the character image area on the entire image, and it is impossible to achieve both the high speed encoding process and the improvement of the image quality. there were.
そこで、本発明は、符号化精度を低下させることなく、入力データを高速に符号化することができる符号化装置、画像処理装置、符号化方法及び符号化プログラムを提供することを目的とする。 Accordingly, an object of the present invention is to provide an encoding device, an image processing device, an encoding method, and an encoding program that can encode input data at high speed without reducing the encoding accuracy.
上記目的を達成するため、本発明の第1の特徴とするところは、入力データを第1の縮小率で縮小する第1の縮小手段と、この第1の縮小手段が縮小した入力データを、このデータに含まれる連結成分の大きさと第1の値との比較結果に基づいて、文字データ及び文字データ以外のデータに分類する第1の分類手段と、この第1の分類手段が分類した文字データに含まれる黒画素の連結成分の特徴量に基づいて、前記第1の縮小手段によって縮小された入力データが正しく分類されているか否かを判定しつつ、正しく分類されていると判定した文字データを文字データに対応するアルゴリズムで符号化する符号化手段と、この符号化手段が正しく分類されていないと判定した文字データ以外のデータを、前記第1の縮小率よりも低い第2の縮小率で縮小する第2の縮小手段と、この第2の縮小手段が縮小した文字データ以外のデータを、このデータに含まれる連結成分の大きさと前記第1の値とは異なる第2の値との比較結果に基づいて、文字データ及び文字データ以外のデータに分類する第2の分類手段とを有し、前記符号化手段は、前記第2の分類手段が分類した文字データをさらに符号化する
符号化装置にある。したがって、第1の縮小手段によって縮小された入力データは、正しく分類されている場合には、さらに分類することなく符号化することができるので、入力データを高速に符号化することができ、正しく分類されていない場合には、さらに分類した後に符号化するので、符号化精度の低下を防止することができる。
In order to achieve the above object, the first feature of the present invention is that the first reduction means for reducing the input data at the first reduction rate, and the input data reduced by the first reduction means, based on the comparison result of the size and the first value of the connected components contained in the data, the first classification means for classifying the data other than character data, and character data, the first character classification means classifies the based on the feature amount of the connected component of black pixels included in the data, while determining whether the first input data reduced by the reduction means are correctly classified, and determined to be correctly classified character encoding means for encoding algorithm corresponding data to the character data, the data other than the determined character data and the encoding means is not correctly classified, the lower than the first reduction ratio second contraction A second reduction means for reducing at a rate, and data other than the character data reduced by the second reduction means, and a second value different from the first value and the size of the connected component included in the data And a second classifying unit that classifies the data into data other than character data and character data , and the encoding unit further encodes the character data classified by the second classifying unit. It is in the encoding device. Accordingly, the input data reduced by the first reduction unit, when it is correctly classified, since it is possible to encode without further classification, can be encoded into a high speed input data correctly If not classified, encoding is performed after further classification, so that it is possible to prevent a decrease in encoding accuracy .
好適には、前記第1の分類手段は、前記第2の分類手段よりも少ない処理量で所定量のデータを分離する。 Preferably, the first classification unit separates a predetermined amount of data with a smaller processing amount than the second classification unit.
また、本発明の第2の特徴とするところは、入力画像を第1の縮小率で縮小する第1の縮小手段と、この第1の縮小手段が縮小した入力データを、このデータに含まれる連結成分の大きさと第1の値との比較結果に基づいて、文字データ及び文字データ以外のデータに分類する第1の分類手段と、この第1の分類手段が分類した文字データに含まれる黒画素の連結成分の特徴量に基づいて、前記第1の縮小手段によって縮小された入力データが正しく分類されているか否かを判定しつつ、正しく分類されていると判定した文字データを文字データに対応するアルゴリズムで符号化する符号化手段と、この符号化手段が正しく分類されていないと判定した文字データ以外のデータを、前記第1の縮小率よりも低い第2の縮小率で縮小する第2の縮小手段と、この第2の縮小手段が縮小した文字データ以外のデータを、このデータに含まれる連結成分の大きさと前記第1の値とは異なる第2の値との比較結果に基づいて、文字データ及び文字データ以外のデータに分類する第2の分類手段とを有し、前記符号化手段は、前記第2の分類手段が分類した文字データをさらに符号化する画像処理装置にある。 The second feature of the present invention is that the data includes first reduction means for reducing an input image at a first reduction ratio and input data reduced by the first reduction means. Based on the comparison result between the size of the connected component and the first value, first classification means for classifying the data into data other than character data and character data, and black included in the character data classified by the first classification means Based on the feature quantity of the connected component of the pixels, it is determined whether the input data reduced by the first reduction means is correctly classified, and the character data determined to be correctly classified is character data. Encoding means for encoding with a corresponding algorithm and data other than character data determined that the encoding means is not correctly classified are reduced at a second reduction ratio lower than the first reduction ratio. 2 And small unit, the data other than the second character data reduction means is reduced, based on a result of comparison between different second values of the magnitude and the first value of the connected components contained in the data, And a second classification unit that classifies the character data and data other than the character data, and the encoding unit is in an image processing apparatus that further encodes the character data classified by the second classification unit.
好適には、前記第1の分類手段は、前記第2の分類手段よりも少ない処理量で所定量のデータを分離する。 Preferably, the first classification unit separates a predetermined amount of data with a smaller processing amount than the second classification unit.
また、好適には、前記第1の分類手段は、文字データ、ハーフトーンデータ、JBIG2の一般領域としての符号化に適さないデータ及びその他のデータの組み合わせを含むいずれか2つ以上のデータに入力画像を分離する。 Preferably, the first classification means inputs any two or more data including a combination of character data, halftone data, data not suitable for encoding as a general area of JBIG2, and other data. Separate images .
また、本発明の第3の特徴とするところは、入力データを第1の縮小率で縮小し、前記第1の縮小率で縮小した入力データを、このデータに含まれる連結成分の大きさと第1の値との比較結果に基づいて、文字データ及び文字データ以外のデータに分類し、分類した文字データに含まれる黒画素の連結成分の特徴量に基づいて、前記第1の縮小率で縮小された入力データが正しく分類されているか否かを判定しつつ、正しく分類されていると判定した文字データを文字データに対応するアルゴリズムで符号化し、正しく分類されていないと判定した文字データ以外のデータを、前記第1の縮小率よりも低い第2の縮小率で縮小し、前記第2の縮小率で縮小した文字データ以外のデータを、このデータに含まれる連結成分の大きさと前記第1の値とは異なる第2の値との比較結果に基づいて、文字データ及び文字データ以外のデータに分類し、分類した文字データを符号化する符号化方法にある。 The third feature of the present invention is that the input data is reduced at the first reduction ratio, and the input data reduced at the first reduction ratio is compared with the size of the connected component included in the data and Based on the comparison result with the value of 1, the data is classified into character data and data other than the character data, and reduced at the first reduction rate based on the feature amount of the connected component of the black pixels included in the classified character data. The character data determined to be correctly classified are encoded with an algorithm corresponding to the character data while determining whether the input data is correctly classified , and other than character data determined not to be correctly classified The data is reduced at a second reduction rate lower than the first reduction rate, and data other than the character data reduced at the second reduction rate is used as the size of the connected component included in the data and the first data. of Based on different second value as the comparison result of the, classified into character data and character other than the data data and the character data is classified into coding method for coding.
また、本発明の第4の特徴とするところは、入力データを第1の縮小率で縮小するステップと、前記第1の縮小率で縮小した入力データを、このデータに含まれる連結成分の大きさと第1の値との比較結果に基づいて、文字データ及び文字データ以外のデータに分類するステップと、分類した文字データに含まれる黒画素の連結成分の特徴量に基づいて、前記第1の縮小率で縮小された入力データが正しく分類されているか否かを判定しつつ、正しく分類されていると判定した文字データを文字データに対応するアルゴリズムで符号化するステップと、正しく分類されていないと判定した文字データ以外のデータを、前記第1の縮小率よりも低い第2の縮小率で縮小するステップと、前記第2の縮小率で縮小した文字データ以外のデータを、このデータに含まれる連結成分の大きさと前記第1の値とは異なる第2の値との比較結果に基づいて、文字データ及び文字データ以外のデータに分類するステップと、分類した文字データを符号化するステップとをコンピュータに実行させる符号化プログラムにある。 According to a fourth feature of the present invention, the step of reducing the input data at the first reduction ratio and the input data reduced at the first reduction ratio are compared with the magnitude of the connected component included in the data. On the basis of the comparison result between the first value and the character data, the step of classifying the data into data other than character data and character data, and the feature value of the connected component of black pixels included in the classified character data. A step of encoding character data determined to be correctly classified with an algorithm corresponding to the character data while determining whether or not the input data reduced by the reduction ratio is correctly classified and not correctly classified and data other than character data is determined, a step of reduction in the second reduction ratio lower than the first reduction ratio, the data other than character data reduced by the second reduction ratio, Based on the result of comparison between the second value that is different from the size and the first value of the connected components contained in the data, the step of classifying the non-character data and character data data, text data classified code And an encoding program for causing a computer to execute the step of converting.
本発明によれば、符号化精度を低下させることなく、入力データを高速に符号化することができる。 According to the present invention, input data can be encoded at high speed without reducing the encoding accuracy.
次に本発明の実施形態を図面に基づいて説明する。
図1において、本発明の実施形態に係る画像処理装置1の概要が示されている。画像処理装置1は、表示装置及びキーボードなどを含むユーザインタフェース装置(UI装置)10、HDD・CD装置などの記憶装置12、印刷装置14、通信装置16及び制御装置2などから構成される。制御装置2は、CPU20及びメモリ22などを含み、画像処理装置1を構成する各部を制御する。
つまり、画像処理装置1は、コンピュータとしての機能を含み、後述する符号化プログラム3を実行することにより、記憶媒体120又は通信装置16を介して受け入れた画像データ(入力画像)を符号化し、例えば記憶装置12に記憶するようにされている。
Next, embodiments of the present invention will be described with reference to the drawings.
FIG. 1 shows an outline of an image processing apparatus 1 according to an embodiment of the present invention. The image processing apparatus 1 includes a user interface device (UI device) 10 including a display device and a keyboard, a
That is, the image processing apparatus 1 includes a function as a computer, encodes image data (input image) received via the
図2乃至図5において、画像処理装置1により実行される符号化プログラム3の構成が示されている。
図2に示すように、符号化プログラム3は、領域粗分離部30、テキスト符号化部32、一般符号化部34及び領域詳細分離部36を有する。
2 to 5, the configuration of the encoding program 3 executed by the image processing apparatus 1 is shown.
As shown in FIG. 2, the encoding program 3 includes a region
図3は、領域粗分離部30の構成を示すブロック図である。
図3に示すように、領域粗分離部30は、第1の縮小処理部300、連結成分抽出部302及び第1の分類部304から構成され、例えば“Dave A.D. Tompkins, Faouzi Kossentini. A Fast Segmentation Algorithm for Bi-Level Image Compression using JBIG2. Proceedings of the 1999 IEEE International Conference on Image Processing (ICIP), 1999”(:文献A)に記載された方法で入力画像をテキスト領域とその他の領域とに粗く分離する(粗分離)。
FIG. 3 is a block diagram showing the configuration of the area
As shown in FIG. 3, the region
第1の縮小処理部300は、受け入れた入力画像を所定の縮小率で縮小し、連結成分抽出部302に対して出力する。
The first
連結成分抽出部302は、第1の縮小処理部300から入力される画像の着目画素と8−近傍画素との8−連結成分をそれぞれ抽出し、第1の分類部304に対して出力する。
The connected
第1の分類部304は、連結成分抽出部302から入力される8−連結成分の大きさを所定の閾値(第1分類閾値)と比較し、8−連結成分の大きさが所定の閾値よりも小さい場合には、着目画素をテキスト領域としてテキスト符号化部32に対して出力し、8−連結成分の大きさが所定の閾値以上の場合には、着目画素をその他の領域として一般符号化部34に対して出力する。
The
例えば、図6に示した上記文献Aに記載されている縮小画像例のように、領域粗分離部30は、入力画像を縮小した後にテキスト領域とその他の領域とに分離して出力する。
For example, as in the reduced image example described in the document A shown in FIG. 6, the area
図4は、テキスト符号化部32の構成を示すブロック図である。
図4に示すように、テキスト符号化部32は、シンボル抽出部320、特徴量抽出部322、非テキストシンボル除去部324、辞書作成部326及び符号化処理部328から構成される。
FIG. 4 is a block diagram showing a configuration of the
As shown in FIG. 4, the
シンボル抽出部320は、領域粗分離部30からテキスト領域を受け入れ、黒画素の連結成分を抽出し、特徴量抽出部322に対して出力する。
また、シンボル抽出部320は、後述する領域詳細分離部36から入力されるテキスト領域に対しても同様に、黒画素の連結成分を抽出し、特徴量抽出部322に対して出力する。
以下、シンボル抽出部320が抽出した黒画素の連結成分をシンボルと記す。
The
Similarly, the
Hereinafter, the connected components of black pixels extracted by the
特徴量抽出部322は、シンボル抽出部320から入力される各シンボルの特徴量を抽出(算出)し、非テキストシンボル除去部324に対して出力する。特徴量抽出部322が抽出する特徴量は、例えばシンボルの縦横サイズ及び穴の数などである。
The feature
非テキスト(文字)シンボル除去部324は、特徴量抽出部322から入力されるシンボルの特徴量を所定の閾値と比較して、所定の閾値から外れた特徴量を有するシンボルを非テキストシンボルの領域と判定し、領域詳細分離部36に対して出力する。また、非テキストシンボル除去部324は、特徴量抽出部322から入力されるシンボルの特徴量が所定の閾値内にある場合には、シンボルがテキスト領域として正しく判定されているとみなして辞書作成部326に対して出力する。
つまり、領域粗分離部30が領域を正しく分離していない場合には、非テキストシンボル除去部324は、非テキストシンボルの領域をテキスト領域から除去する。
The non-text (character)
That is, when the region
辞書作成部326は、JBIG(Joint Bi-Level Image Expert Group)が作成したJBIG2 Amd.1相当の機能を有し、非テキストシンボル除去部324から入力されるシンボルを相互に比較し、同一とみなせないシンボルを辞書に追加することにより、シンボル辞書を作成して符号化処理部328に対して出力する。
また、辞書作成部326は、シンボル相互の特徴量を比較することにより、シンボルを比較する処理を高速化している。ここで、辞書作成部326は、抽出(算出)済みの特徴量を利用してシンボルを比較するようにされている。
The
Further, the
符号化処理部328は、例えばJBIG2のテキスト領域符号化手順に従い、辞書作成部326から入力されるシンボル辞書を用いてテキスト領域(Text region)を符号化(テキスト符号化)し、記憶装置12などに対して出力する。
The
このように、テキスト符号化部32は、例えば非テキストシンボル除去部324が明らかに文字でないシンボル(サイズが閾値よりも大きい、又は穴の数が閾値よりも多いなど)をテキスト領域から除去することにより、辞書作成部326が作成する辞書サイズを小さくし、シンボル辞書作成処理時間の削減、及び入力画像の圧縮率の向上を実現する。
また、テキスト符号化部32は、領域詳細分離部36から入力されるテキスト領域に対しても符号化を行うので、入力画像の符号化精度を向上させている。
In this way, the
Further, since the
一般符号化部34は、領域粗分離部30から入力されるその他の領域を、例えばJBIG2の一般領域(Generic region)として符号化(一般符号化)し、記憶装置12などに対して出力する。
また、一般符号化部34は、後述する領域詳細分離部36から入力されるその他の領域に対しても、領域粗分離部30から入力されるその他の領域と同様に符号化するようにされている。
The general encoding unit 34 encodes (general encoding) the other region input from the region
Further, the general encoding unit 34 encodes other regions input from the region
図5は、領域詳細分離部36の構成を示すブロック図である。
図5に示すように、領域詳細分離部36は、第2の縮小処理部360、連結成分抽出部362及び第2の分類部364から構成され、領域粗分離部30とは異なる設定(条件)の領域粗分離部30とほぼ同じ方法で、領域粗分離部30が分離を誤った領域をテキスト領域とその他の領域とに詳細に分離する(詳細分離)。
FIG. 5 is a block diagram illustrating a configuration of the region
As shown in FIG. 5, the region
第2の縮小処理部360は、例えば入力画像を参照しつつ、テキスト符号化部32から受け入れた非文字シンボルの領域を、第1の縮小処理部300よりも低い(縮小後の画像サイズが第1の縮小処理部300よりも大きくなる)縮小率で縮小し、連結成分抽出部362に対して出力する。
The second
連結成分抽出部362は、第2の縮小処理部360から入力される画像の着目画素と8−近傍画素との8−連結成分をそれぞれ抽出し、第2の分類部364に対して出力する。
The connected
第2の分類部364は、連結成分抽出部362から入力される8−連結成分の大きさと、第1の分類部304の閾値(第1分類閾値)とは異なる閾値(第2分類閾値)とを比較し、8−連結成分の大きさが第2分類閾値よりも小さい場合には、着目画素をテキスト領域としてテキスト符号化部32に対して出力し、8−連結成分の大きさが第2分類閾値以上の場合には、着目画素をその他の領域として一般符号化部34に対して出力する。
The
次に、画像処理装置1が符号化プログラム3を実行することにより、入力画像を符号化する処理について説明する。
図7は、画像処理装置1が符号化プログラム3を実行することにより、入力画像を符号化する処理(S10)を示すフローチャートである。
図7に示すように、ステップ100(S100)において、領域粗分離部30は、入力画像をテキスト領域とその他の領域とに粗く分離する(粗分離)。
Next, processing for encoding an input image by the image processing apparatus 1 executing the encoding program 3 will be described.
FIG. 7 is a flowchart showing a process (S10) of encoding an input image by the image processing apparatus 1 executing the encoding program 3.
As shown in FIG. 7, in step 100 (S100), the area
ステップ102(S102)において、テキスト符号化部32は、領域粗分離部30による領域の粗分離が正しいか否かを、領域ごとに非テキストシンボル除去部324によって判定し、領域が正しく分離されている場合にはS106の処理に進み、領域が正しく判定されていない場合にはS104の処理に進む。
In step 102 (S102), the
ステップ104(S104)において、領域詳細分離部36は、領域粗分離部30が分離を誤った領域をテキスト領域とその他の領域とに詳細に分離する(詳細分離)。
In step 104 (S104), the region
ステップ106(S106)において、テキスト符号化部32は、領域粗分離部30が分離を誤った領域を領域詳細分離部36が再分離した結果を含むテキスト領域をテキスト符号化する。
In step 106 (S106), the
ステップ108(S108)において、一般符号化部34は、領域粗分離部30が分離を誤った領域を領域詳細分離部36が再分離した結果を含むその他の領域を一般符号化する。
In step 108 (S108), the general encoding unit 34 performs general encoding on the other regions including the result of the region
また、上記実施形態においては、符号化プログラム3について、入力画像をテキスト領域とその他の領域とに分離する場合を例に説明したが、これに限定されることなく、例えば符号化プログラム3は、テキスト符号化部32及び一般符号化部34以外に、さらに1つ以上の符号化部を有する構成であってもよいし、ハーフトーン領域(Halftone region)などを分離して、JBIG2に対応する領域それぞれに入力画像を分離して符号化するものであってもよい。
さらに、例えば符号化プログラム3が3つ以上の符号化部を有する場合、一般符号化部34による符号化が適していない領域を一般符号化部34が除去して第2の縮小処理部360に対して出力し、領域詳細分離部36が受け入れた領域それぞれを詳細に分離するようにされてもよい。
Moreover, in the said embodiment, although the case where the input image was isolate | separated into a text area | region and another area | region was demonstrated to the encoding program 3 as an example, it is not limited to this, For example, the encoding program 3 is: In addition to the
Furthermore, for example, when the encoding program 3 has three or more encoding units, the general encoding unit 34 removes an area that is not suitable for encoding by the general encoding unit 34 and the second
このように、画像処理装置1は、領域粗分離部30が粗分離した結果をテキスト符号化部32が符号化する場合に、領域粗分離部30による分離が誤っている領域を領域詳細分離部36が詳細分離するので、領域詳細分離部36が詳細に分離する領域の量を削減することができるとともに、テキスト符号化部32が不要なパターンマッチングを行うことを防止することができ、シンボル辞書の無駄防止、圧縮率の向上、符号化処理速度の向上及び画質の向上を実現することができる。
As described above, when the
1・・・画像処理装置
12・・・記憶装置
16・・・通信装置
120・・・記憶媒体
2・・・制御装置
20・・・CPU
22・・・メモリ
3・・・符号化プログラム
30・・・領域粗分離部
300・・・第1の縮小処理部
302・・・連結成分抽出部
304・・・第1の分類部
32・・・テキスト符号化部
320・・・シンボル抽出部
322・・・特徴量抽出部
324・・・非テキストシンボル除去部
326・・・辞書作成部
328・・・符号化処理部
34・・・一般符号化部
36・・・領域詳細分離部
360・・・第2の縮小処理部
362・・・連結成分抽出部
364・・・第2の分類部
DESCRIPTION OF SYMBOLS 1 ...
DESCRIPTION OF
Claims (7)
この第1の縮小手段が縮小した入力データを、このデータに含まれる連結成分の大きさと第1の値との比較結果に基づいて、文字データ及び文字データ以外のデータに分類する第1の分類手段と、
この第1の分類手段が分類した文字データに含まれる黒画素の連結成分の特徴量に基づいて、前記第1の縮小手段によって縮小された入力データが正しく分類されているか否かを判定しつつ、正しく分類されていると判定した文字データを文字データに対応するアルゴリズムで符号化する符号化手段と、
この符号化手段が正しく分類されていないと判定した文字データ以外のデータを、前記第1の縮小率よりも低い第2の縮小率で縮小する第2の縮小手段と、
この第2の縮小手段が縮小した文字データ以外のデータを、このデータに含まれる連結成分の大きさと前記第1の値とは異なる第2の値との比較結果に基づいて、文字データ及び文字データ以外のデータに分類する第2の分類手段と
を有し、
前記符号化手段は、前記第2の分類手段が分類した文字データをさらに符号化する
符号化装置。 First reduction means for reducing input data at a first reduction rate;
The input data which the first reduction unit is reduced, based on the comparison result of the size and the first value of the connected components contained in the data, the first classification to classify the data other than character data, and character data Means,
While determining whether the input data reduced by the first reduction means is correctly classified based on the feature amount of the connected component of the black pixels included in the character data classified by the first classification means. Encoding means for encoding character data determined to be correctly classified with an algorithm corresponding to the character data ;
Second reduction means for reducing data other than character data determined not to be correctly classified by the encoding means at a second reduction rate lower than the first reduction rate;
Based on the comparison result between the data other than the character data reduced by the second reduction means and the second value different from the first value, the size of the connected component included in the data and the character data and the character data A second classification means for classifying data other than data ,
The encoding unit further encodes the character data classified by the second classification unit.
請求項1記載の符号化装置。 The encoding apparatus according to claim 1, wherein the first classification unit separates a predetermined amount of data with a smaller processing amount than the second classification unit.
この第1の縮小手段が縮小した入力データを、このデータに含まれる連結成分の大きさと第1の値との比較結果に基づいて、文字データ及び文字データ以外のデータに分類する第1の分類手段と、
この第1の分類手段が分類した文字データに含まれる黒画素の連結成分の特徴量に基づいて、前記第1の縮小手段によって縮小された入力データが正しく分類されているか否かを判定しつつ、正しく分類されていると判定した文字データを文字データに対応するアルゴリズムで符号化する符号化手段と、
この符号化手段が正しく分類されていないと判定した文字データ以外のデータを、前記第1の縮小率よりも低い第2の縮小率で縮小する第2の縮小手段と、
この第2の縮小手段が縮小した文字データ以外のデータを、このデータに含まれる連結成分の大きさと前記第1の値とは異なる第2の値との比較結果に基づいて、文字データ及び文字データ以外のデータに分類する第2の分類手段と
を有し、
前記符号化手段は、前記第2の分類手段が分類した文字データをさらに符号化する
画像処理装置。 First reduction means for reducing the input image at a first reduction rate;
The input data which the first reduction unit is reduced, based on the comparison result of the size and the first value of the connected components contained in the data, the first classification to classify the data other than character data, and character data Means,
While determining whether the input data reduced by the first reduction means is correctly classified based on the feature amount of the connected component of the black pixels included in the character data classified by the first classification means. Encoding means for encoding character data determined to be correctly classified with an algorithm corresponding to the character data ;
Second reduction means for reducing data other than character data determined not to be correctly classified by the encoding means at a second reduction rate lower than the first reduction rate;
Based on the comparison result between the data other than the character data reduced by the second reduction means and the second value different from the first value, the size of the connected component included in the data and the character data and the character data A second classification means for classifying data other than data ,
The image processing apparatus , wherein the encoding means further encodes the character data classified by the second classification means.
請求項3記載の画像処理装置。 Said first classifying means, the image processing apparatus according to claim 3, wherein separating the predetermined amount of data in less processing than the second classifying means.
請求項3又は4記載の画像処理装置。 The first classification means separates an input image into any two or more data including a combination of character data, halftone data, data not suitable for encoding as a general area of JBIG2, and other data. 3. The image processing apparatus according to 3 or 4 .
前記第1の縮小率で縮小した入力データを、このデータに含まれる連結成分の大きさと第1の値との比較結果に基づいて、文字データ及び文字データ以外のデータに分類し、
分類した文字データに含まれる黒画素の連結成分の特徴量に基づいて、前記第1の縮小率で縮小された入力データが正しく分類されているか否かを判定しつつ、正しく分類されていると判定した文字データを文字データに対応するアルゴリズムで符号化し、
正しく分類されていないと判定した文字データ以外のデータを、前記第1の縮小率よりも低い第2の縮小率で縮小し、
前記第2の縮小率で縮小した文字データ以外のデータを、このデータに含まれる連結成分の大きさと前記第1の値とは異なる第2の値との比較結果に基づいて、文字データ及び文字データ以外のデータに分類し、
分類した文字データを符号化する
符号化方法。 Reduce the input data by the first reduction rate,
Classifying the input data reduced at the first reduction rate into character data and data other than character data based on a comparison result between the size of the connected component included in the data and the first value ;
Based on the feature amount of the connected component of black pixels included in the classified character data, while determining whether the first input data reduced by the reduction ratio is correctly classified and are correctly classified the determined character data encoded with an algorithm corresponding to the character data,
Reducing data other than character data determined not to be correctly classified at a second reduction ratio lower than the first reduction ratio;
Based on the comparison result between the data other than the character data reduced at the second reduction ratio and the size of the connected component included in the data and the second value different from the first value , the character data and the character Classify it into data other than data ,
An encoding method that encodes classified character data .
前記第1の縮小率で縮小した入力データを、このデータに含まれる連結成分の大きさと第1の値との比較結果に基づいて、文字データ及び文字データ以外のデータに分類するステップと、
分類した文字データに含まれる黒画素の連結成分の特徴量に基づいて、前記第1の縮小率で縮小された入力データが正しく分類されているか否かを判定しつつ、正しく分類されていると判定した文字データを文字データに対応するアルゴリズムで符号化するステップと、
正しく分類されていないと判定した文字データ以外のデータを、前記第1の縮小率よりも低い第2の縮小率で縮小するステップと、
前記第2の縮小率で縮小した文字データ以外のデータを、このデータに含まれる連結成分の大きさと前記第1の値とは異なる第2の値との比較結果に基づいて、文字データ及び文字データ以外のデータに分類するステップと、
分類した文字データを符号化するステップと
をコンピュータに実行させる符号化プログラム。 Reducing the input data at a first reduction rate;
Classifying the input data reduced at the first reduction ratio into character data and data other than character data based on a comparison result between the size of the connected component included in the data and the first value ;
Based on the feature amount of the connected component of black pixels included in the classified character data, while determining whether the first input data reduced by the reduction ratio is correctly classified and are correctly classified a step of encoding algorithm corresponding to the determined character data into character data,
Reducing data other than character data determined not to be correctly classified at a second reduction rate lower than the first reduction rate;
Based on the comparison result between the data other than the character data reduced at the second reduction ratio and the size of the connected component included in the data and the second value different from the first value , the character data and the character Categorizing into non-data data ,
An encoding program for causing a computer to execute the step of encoding the classified character data .
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2005365759A JP4766451B2 (en) | 2005-12-20 | 2005-12-20 | Encoding apparatus, image processing apparatus, encoding method, and encoding program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2005365759A JP4766451B2 (en) | 2005-12-20 | 2005-12-20 | Encoding apparatus, image processing apparatus, encoding method, and encoding program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2007174008A JP2007174008A (en) | 2007-07-05 |
| JP4766451B2 true JP4766451B2 (en) | 2011-09-07 |
Family
ID=38300024
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2005365759A Expired - Fee Related JP4766451B2 (en) | 2005-12-20 | 2005-12-20 | Encoding apparatus, image processing apparatus, encoding method, and encoding program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4766451B2 (en) |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3281065B2 (en) * | 1992-11-11 | 2002-05-13 | キヤノン株式会社 | Area separation method |
| JP2800633B2 (en) * | 1993-04-30 | 1998-09-21 | 富士ゼロックス株式会社 | Image coding device |
| JP2005252321A (en) * | 2004-03-01 | 2005-09-15 | Canon Inc | Image processing apparatus and image processing method |
-
2005
- 2005-12-20 JP JP2005365759A patent/JP4766451B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2007174008A (en) | 2007-07-05 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7936929B2 (en) | Image processing method and apparatus for removing noise from a document image | |
| JP4152789B2 (en) | Clustering system and clustering method | |
| JP4631133B2 (en) | Apparatus, method and recording medium for character recognition processing | |
| US8947736B2 (en) | Method for binarizing scanned document images containing gray or light colored text printed with halftone pattern | |
| US11568623B2 (en) | Image processing apparatus, image processing method, and storage medium | |
| JP2001358925A (en) | Unit and method for image processing and recording medium | |
| JP6743092B2 (en) | Image processing apparatus, image processing control method, and program | |
| US20080069447A1 (en) | Character recognition method, character recognition device, and computer product | |
| RU2737001C1 (en) | Image processing device and method and data medium | |
| US8810877B2 (en) | Image processing apparatus, image processing method, and storage medium for eliminating blurring of scanned image | |
| JP4766451B2 (en) | Encoding apparatus, image processing apparatus, encoding method, and encoding program | |
| US10931852B2 (en) | Image processing apparatus, image processing method, and storage medium, with determining whether or not character clipping rectangle determined to be non-character region is character region | |
| JPH11272798A (en) | Method and device for distinguishing bold character | |
| US11288536B2 (en) | Image processing apparatus, image processing method, and non-transitory computer-readable storage medium | |
| KR100334624B1 (en) | Clustering based document image segmentation method | |
| KR100713335B1 (en) | Image recognition method | |
| JP3187894B2 (en) | Document image tilt detection method | |
| JP2002056356A (en) | Character recognition device, character recognition method, and recording medium | |
| JPH0785221A (en) | Method for separating and recognizing character and symbol in automatic drawing recognizing device | |
| JP2010135962A (en) | Image processing apparatus and image processing program | |
| JP2010218106A (en) | Image processing apparatus, image processing method and program | |
| JP2004094292A (en) | Character recognition device, character recognition method, and program used to execute the method | |
| JP2010098744A (en) | Image processing apparatus and image processing method | |
| Rajeswari et al. | Test Segmentation of MRC Document Compression and Decompression by Using MATLAB | |
| KR20250073993A (en) | Method and apparatus for generating binary image for recognizing chinese character in old chinese books |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081120 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110304 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110308 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110506 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110523 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 4766451 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110605 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140624 Year of fee payment: 3 |
|
| LAPS | Cancellation because of no payment of annual fees |