JP4830331B2 - Character image cutting device and program - Google Patents
Character image cutting device and program Download PDFInfo
- Publication number
- JP4830331B2 JP4830331B2 JP2005092520A JP2005092520A JP4830331B2 JP 4830331 B2 JP4830331 B2 JP 4830331B2 JP 2005092520 A JP2005092520 A JP 2005092520A JP 2005092520 A JP2005092520 A JP 2005092520A JP 4830331 B2 JP4830331 B2 JP 4830331B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- region
- area
- pixels
- expansion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Input (AREA)
Description
本発明は、文字認識処理に用いられる文字画像の切り出し技術に関する。 The present invention relates to a character image clipping technique used for character recognition processing.
文字を示す画像データから抽出した特徴点と、予めデータベースに登録してある文字の特徴点とを比較することにより、画像データにより示される文字を認識し、認識した文字を示すテキストデータを生成する技術がある。 By comparing the feature points extracted from the image data indicating characters with the feature points of characters registered in advance in the database, the characters indicated by the image data are recognized, and text data indicating the recognized characters is generated. There is technology.
上記のような文字認識処理において、画像データが複数の文字を示す場合、その画像データから各々の文字を示す画像データを切り出すことが必要となる。すなわち、画像データに含まれる連続したオン画素群のいずれが1つの文字を構成するものであるかを特定する必要がある。そのような文字画像の切り出し技術を開示したものとして、例えば特許文献1がある。
特許文献1に開示の技術によれば、各々のオン画素群を1つの文字の構成要素と仮定して文字認識処理を行った場合の結果および隣接する2以上のオン画素群を1つの文字の構成要素と仮定して文字認識処理を行った場合の結果を、単語辞書に登録されている単語と照合することにより、いずれの結果が正しいものであるかを特定する。 According to the technique disclosed in Patent Document 1, the result of character recognition processing assuming that each on-pixel group is a constituent element of one character and two or more adjacent on-pixel groups of one character By comparing the result of character recognition processing assuming that it is a component with a word registered in the word dictionary, it is specified which result is correct.
上記の従来技術による場合、文字認識処理が複数回行われる上に、文字認識処理の結果を単語と照合する処理が必要となるため、1文字を示す画像データの切り出しに時間がかかる、という問題がある。また、予め単語辞書の整備が必要であり、かつ単語辞書の記憶領域の確保も必要である。 In the case of the above prior art, since the character recognition process is performed a plurality of times and the process of matching the result of the character recognition process with a word is required, it takes time to cut out image data indicating one character. There is. In addition, it is necessary to prepare a word dictionary in advance and to secure a storage area for the word dictionary.
上述の事情に鑑み、本発明は簡便かつ高速に画像データから各々の文字部分を切り出す手段を提供することを目的とする。 In view of the circumstances described above, an object of the present invention is to provide means for cutting out each character portion from image data simply and at high speed.
上述の課題を解決するため、本発明は、平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する画像データ取得手段と、前記画像データ取得手段により取得された画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する領域内画像認識手段と、前記領域内画像認識手段により認識された領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する判定手段と、前記判定手段により前記オン画素の集まりが存在する場合には当該オン画素の集まりを当該領域内画像に統合した画像を拡張領域内画像として認識し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該領域内画像を拡張領域内画像として認識する拡張領域内画像認識手段と、前記拡張領域内画像認識手段により認識された拡張領域内画像を示すデータを、1文字を表す画像データとして出力する出力手段とを備えることを特徴とする文字画像切出装置を提供する。 In order to solve the above-described problem, the present invention provides an image data acquisition unit that acquires image data including a collection of pixel data indicating attribute values of each of a plurality of pixels constituting an image arranged on a plane; Of the pixels indicated by the pixel data included in the image data acquired by the image data acquisition means, the pixel is represented by a predetermined grid on the plane from among the on pixels indicating attribute values exceeding a predetermined threshold value. a region in the image recognition means for recognizing a set of oN pixels as an area in the image being arranged in succession to one another in the region, before Symbol territory outside adjacent to the recognized area in the image by the area in the image recognition means a determination unit configured to determine whether there is a collection of on-pixels arranged mutually in succession, the on if a collection of pixels is present by the determining means There recognizes an image obtained by integrating a group of the ON pixels in the area in the image as an extended area in an image, a collection of on-pixels that are arranged consecutively to each other in front Symbol territory outside and adjacent to the region in an image If not, the extended area image recognition means for recognizing the in-area image as the extended area image, and the data indicating the extended area image recognized by the extended area image recognition means are image data representing one character. And a character image cutting device.
また、本発明は、平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する画像データ取得手段と、前記画像データ取得手段により取得された画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する領域内画像認識手段と、前記領域内画像認識手段により認識された領域内画像に対し膨張処理を行い、膨張領域内画像を生成する膨張画像生成手段と、前記膨張画像生成手段により生成された膨張領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する判定手段と、前記判定手段により前記オン画素の集まりが存在する場合には当該オン画素の集まりを当該膨張領域内画像に統合した画像を拡張膨張領域内画像として認識し、当該膨張領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該膨張領域内画像を拡張膨張領域内画像として認識する拡張膨張領域内画像認識手段と、前記拡張膨張領域内画像認識手段により認識された拡張膨張領域内画像を示すデータを、1文字を表す画像データとして出力する出力手段とを備えることを特徴とする文字画像切出装置を提供する。 In addition, the present invention provides an image data acquisition unit that acquires image data including a collection of pixel data indicating attribute values of a plurality of pixels constituting an image arranged on a plane, and the image data acquisition unit acquires the image data. Among the pixels indicated by the pixel data included in the image data that has been processed, the pixels that are consecutive from each other in the area represented by the predetermined grid on the plane are selected from the on pixels that indicate attribute values that exceed a predetermined threshold. An intra-region image recognition unit that recognizes a collection of on-pixels arranged as an intra-region image, and performs an expansion process on the intra-region image recognized by the intra-region image recognition unit to generate an in-expansion region image an expansion image generation means, the dilated image generating means by adjacent the generated expanded area images on the pixels that are arranged consecutively to each other in front Symbol territory outside A determination unit configured to determine whether Mari is present, the determination unit by the ON pixels of the on-pixels gather the expansion region in the integrated image extended expansion area in an image in the image of when the collection is present recognized as recognized extend the expansion region in an image when the collection of oN pixels that are arranged consecutively to each other does not exist in the previous SL territory outside and adjacent to the expansion region in an image as an extended expansion zone in the image Characters comprising: in-expansion area image recognition means; and output means for outputting data indicating the in-expansion area image recognized by the in-expansion area image recognition means as image data representing one character An image cutting device is provided.
好ましい態様において、前記文字画像切出装置は前記拡張膨張領域内画像認識手段により認識された拡張膨張領域内画像に対し収縮処理を行い、収縮拡張膨張領域内画像を生成する収縮画像生成手段をさらに備え、前記出力手段は、拡張膨張領域内画像を示すデータの代わりに、前記収縮画像生成手段により生成された収縮拡張膨張領域内画像を示すデータを出力するように構成されてもよい。 In a preferred aspect, the character image cutout device further includes a contraction image generation unit that performs contraction processing on the image in the expansion expansion region recognized by the image recognition unit in expansion expansion region and generates an image in the expansion expansion region. The output means may be configured to output data indicating a contraction / expansion / expansion area image generated by the contraction image generation means, instead of data indicating the expansion / expansion area image.
また、本発明は、平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する画像データ取得手段と、前記画像データ取得手段により取得された画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する領域内画像認識手段と、前記領域内画像認識手段により認識された領域内画像に対し膨張処理を行い、膨張領域内画像を生成する膨張画像生成手段と、前記膨張画像生成手段により生成された膨張領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する判定手段と、前記判定手段により前記オン画素の集まりが存在する場合には当該オン画素の集まりを当該膨張領域内画像に統合した画像を拡張膨張領域内画像として認識し、当該膨張領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該膨張領域内画像を拡張膨張領域内画像として認識する拡張膨張領域内画像認識手段と、前記画像データ取得手段により取得された画像データにより示される画像と前記拡張膨張領域内画像認識手段により認識された拡張膨張領域内画像との両方においてオン画素である画素の集まりを重複画像として認識する重複画像認識手段と、前記重複画像認識手段により認識された重複画像を示すデータを、1文字を表す画像データとして出力する出力手段とを備えることを特徴とする文字画像切出装置を提供する。 In addition, the present invention provides an image data acquisition unit that acquires image data including a collection of pixel data indicating attribute values of a plurality of pixels constituting an image arranged on a plane, and the image data acquisition unit acquires the image data. Among the pixels indicated by the pixel data included in the image data that has been processed, the pixels that are consecutive from each other in the area represented by the predetermined grid on the plane are selected from the on pixels that indicate attribute values that exceed a predetermined threshold. An intra-region image recognition unit that recognizes a collection of on-pixels arranged as an intra-region image, and performs an expansion process on the intra-region image recognized by the intra-region image recognition unit to generate an in-expansion region image an expansion image generation means, the dilated image generating means by adjacent the generated expanded area images on the pixels that are arranged consecutively to each other in front Symbol territory outside A determination unit configured to determine whether Mari is present, the determination unit by the ON pixels of the on-pixels gather the expansion region in the integrated image extended expansion area in an image in the image of when the collection is present recognized as recognized extend the expansion region in an image when the collection of oN pixels that are arranged consecutively to each other does not exist in the previous SL territory outside and adjacent to the expansion region in an image as an extended expansion zone in the image Pixels that are ON pixels in both the in-expansion region image recognition unit, the image indicated by the image data acquired by the image data acquisition unit, and the expansion in-expansion region image recognition unit A duplicate image recognition means for recognizing a set of images as a duplicate image, and data representing the duplicate image recognized by the duplicate image recognition means as one character. Providing a character image extraction device characterized by an output means for outputting as image data.
また、本発明は、平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する画像データ取得手段と、前記画像データ取得手段により取得された画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する領域内画像認識手段と、前記領域内画像認識手段により認識された領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する判定手段と、前記判定手段により前記オン画素の集まりが存在する場合には当該オン画素の集まりを当該領域内画像に統合した画像を拡張領域内画像として認識し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該領域内画像を拡張領域内画像として認識する拡張領域内画像認識手段と、前記拡張領域内画像認識手段により認識された拡張領域内画像に外接する前記平面上の所定の形状の領域を拡張領域として認識する拡張領域認識手段と、前記拡張領域認識手段により認識された拡張領域内に含まれるオン画素の集まりにより示される画像を示すデータを、1文字を表す画像データとして出力する出力手段とを備えることを特徴とする文字画像切出装置を提供する。 In addition, the present invention provides an image data acquisition unit that acquires image data including a collection of pixel data indicating attribute values of a plurality of pixels constituting an image arranged on a plane, and the image data acquisition unit acquires the image data. Among the pixels indicated by the pixel data included in the image data that has been processed, the pixels that are consecutive from each other in the area represented by the predetermined grid on the plane are selected from the on pixels that indicate attribute values that exceed a predetermined threshold. a region in the image recognition means for recognizing a group of on-pixels arranged as an area in an image Te, arranged in series with each other in adjacent pre Symbol territory outside the recognition area in the image by the area in the image recognition means a determination unit configured to determine whether a collection of on-pixels are there, collecting of the oN pixels in the case where the collection of the oN pixels is present by the determining means Ri and recognizes images integrated in the area in the image as an extended area within the image, the in the case where collection of ON pixels that are arranged consecutively to each other in front Symbol territory outside and adjacent to the region in an image is not present An extension area image recognition means for recognizing an in-area image as an extension area image, and an area of a predetermined shape on the plane that circumscribes the extension area image recognized by the extension area image recognition means as an extension area An extended area recognizing means for recognizing; and an output means for outputting data indicating an image indicated by a collection of on-pixels included in the extended area recognized by the extended area recognizing means as image data representing one character. A character image cutting device is provided.
好ましい態様において、前記文字画像切出装置の前記領域内画像認識手段は、前記拡張領域認識手段により拡張領域の認識が行われた後、前記拡張領域認識手段により認識された拡張領域を前記領域として前記領域内画像の認識処理を再実行し、前記拡張領域内画像認識手段は、前記領域内画像認識手段による認識処理の再実行により認識された領域内画像に対し前記拡張領域内画像の認識処理を再実行し、前記拡張領域認識手段は、前記拡張領域内画像認識手段による認識処理の再実行により認識された拡張領域内画像に対し前記拡張領域の認識処理を再実行し、前記出力手段は、前記拡張領域認識手段による認識処理の再実行により認識された拡張領域内に含まれるオン画素の集まりにより示される画像を示すデータを、前記1文字を表す画像データとして出力するように構成されてもよい。 In a preferred embodiment, the area in the image recognition means of the character image extraction apparatus, the extension after the recognition of the extended region is performed by the region recognizing means, before Symbol territory recognized extended regions by the extended region recognizing means And re-execution of the recognition process of the in-region image as a region, and the extended region image recognition means performs the processing of the extension in-region image with respect to the in-region image recognized by re-execution of the recognition process by the in-region image recognition unit Re-execution of recognition processing, the extension region recognition means re-executes recognition processing of the extension region on the image in the extension region recognized by re-execution of recognition processing by the image recognition means in the extension region, and the output Means for representing data representing an image indicated by a collection of on-pixels included in an extended area recognized by re-execution of recognition processing by the extended area recognizing means; It may be configured to output as image data.
また、本発明は、平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する画像データ取得手段と、前記画像データ取得手段により取得された画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する領域内画像認識手段と、前記領域内画像認識手段により認識された1以上の領域内画像のうち少なくとも1の領域内画像に関し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する判定手段と、前記判定手段により前記オン画素の集まりが存在する場合、当該領域内画像を前記領域内画像認識手段により認識された領域内画像の集まりから除外する領域内画像除外手段と、前記領域内画像認識手段により認識された領域内画像のうち前記領域内画像除外手段により除外されなかった領域内画像の集まりを、1文字を表す画像データとして出力する出力手段とを備えることを特徴とする文字画像切出装置を提供する。 In addition, the present invention provides an image data acquisition unit that acquires image data including a collection of pixel data indicating attribute values of a plurality of pixels constituting an image arranged on a plane, and the image data acquisition unit acquires the image data. Among the pixels indicated by the pixel data included in the image data that has been processed, the pixels that are consecutive from each other in the area represented by the predetermined grid on the plane are selected from the on pixels that indicate attribute values that exceed a predetermined threshold. An intra-region image recognition means for recognizing a collection of on-pixels arranged as an intra-region image, and at least one intra-region image among at least one intra-region image recognized by the intra-region image recognition means, a determination unit configured to determine whether there is a collection of on-pixels that are arranged consecutively to each other in front Symbol territory outside adjacent to the region in an image, said determining means If there are more group of the on-pixel, and the area in the image excluding means excludes from collection areas within the image that has been recognized by the region within the image the area in the image recognition unit are recognized by the region image recognition means A character image cutout device comprising: output means for outputting a collection of in-area images that are not excluded by the in-area image excluding means among the in-area images, as image data representing one character. To do.
好ましい態様において、前記文字画像切出装置の前記領域内画像除外手段は、1の領域内画像に関し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在する場合、当該オン画素の集まりの占める面積よりも当該1の領域内画像の占める面積が狭いときには、当該1の領域内画像を前記領域内画像認識手段により認識された領域内画像の集まりから除外し、当該オン画素の集まりの占める面積よりも当該1の領域内画像の占める面積が広いときには、当該1の領域内画像を前記領域内画像の集まりから除外しないように構成されてもよい。 In a preferred aspect, the in-region image excluding unit of the character image cutting device includes a group of on pixels that are adjacent to the in-region image and are continuously arranged outside the region with respect to the one in-region image. If present, if the area occupied by the image in one region is smaller than the area occupied by the set of on-pixels, the image in the one region is extracted from the set of images in the region recognized by the image recognition means in the region. If the area occupied by the image in one region is larger than the area occupied by the collection of on-pixels, the image in the one area may not be excluded from the collection of images in the region .
また、他の好ましい態様において、前記文字画像切出装置は前記領域内画像除外手段により除外されなかった領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在する場合には当該オン画素の集まりを当該領域内画像に統合した画像を拡張領域内画像として認識し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該領域内画像を拡張領域内画像として認識する拡張領域内画像認識手段をさらに備え、前記出力手段は、前記拡張領域内画像認識手段により認識された拡張領域内画像を示すデータを、前記1文字を表す画像データとして出力するように構成されてもよい。 Further, in another preferred embodiment, the character image extraction apparatus collection of ON pixels that are arranged consecutively to each other in front Symbol territory outside adjacent to that have not been region image excluding by the region image excluding means oN pixels in which the a group of on-pixels to recognize an image integrated in the area in the image as an extended area in the image, is arranged in series with each other before Symbol territory outside and adjacent to the region in the image, if present If there is no set of images, the image processing apparatus further includes an extended area image recognition means for recognizing the image in the area as an extended area image, and the output means recognizes the extended area image recognized by the extended area image recognition means. May be output as image data representing the one character.
また、本発明は、上記いずれかに記載の前記文字画像切出装置が行う処理と同様の処理をコンピュータに実行させることを特徴とするプログラムを提供する。 In addition , the present invention provides a program that causes a computer to execute the same process as the process performed by any one of the character image cutting apparatuses described above.
本発明によれば、升目からはみ出して書かれた文字を示す画像から、正しく1文字を示す画像が切り出されるため、高い精度の文字認識が可能となる。 According to the present invention, since an image that correctly shows one character is cut out from an image that shows characters that are written out of the cell, highly accurate character recognition is possible.
[実施形態]
以下、本発明の好適な実施形態を説明する。図1は以下に説明する実施形態にかかる文字認識システム1の構成を示したブロック図である。文字認識システム1は、複数の文字を示す画像データから各々の文字を示す画像データを切り出して送信する文字画像切出装置10と、文字画像切出装置10に対し複数の文字を示す画像データを送信するタブレットPC(Personal Computer)11と、文字画像切出装置10から送信される各々の文字を示す画像データに対し文字認識処理を行い認識した文字を示すテキストデータを生成する文字認識装置12を備えている。
[Embodiment]
Hereinafter, preferred embodiments of the present invention will be described. FIG. 1 is a block diagram showing a configuration of a character recognition system 1 according to an embodiment described below. The character recognition system 1 includes a character
タブレットPC11は、液晶ディスプレイに積層されたペンタブレット型入力デバイスを備え、ユーザが液晶ディスプレイに表示される升目に対しペン型のスタイラスを用いて筆記動作を行うと、ペンタブレット型入力デバイスがその筆記動作における筆圧の加えられた位置および筆圧の大きさを測定し、それらの測定値に基づきユーザにより書かれた文字を示す画像データを生成する。 The tablet PC 11 includes a pen tablet-type input device stacked on a liquid crystal display. When a user performs a writing operation using a pen-type stylus on a grid displayed on the liquid crystal display, the pen tablet-type input device performs the writing operation. The position where the pen pressure is applied in the operation and the magnitude of the pen pressure are measured, and image data indicating characters written by the user is generated based on the measured values.
[1.第1実施形態]
図2は、ユーザがタブレットPC11に表示される4文字分の升目に対し「榊原正義」なる文字列を筆記した場合に、従来技術により第2の升目から切り出される画像データ(図2(a))と、本発明の第1実施形態にかかる文字画像切出装置10−1により第2の升目から切り出される画像データ(図2(b))とを用いて、文字認識装置12が文字認識処理を行った際に得られるテキストデータを比較して示した図である。
[1. First Embodiment]
FIG. 2 shows image data cut out from the second square by the conventional technique when the user writes a character string “Masayoshi Sugawara” for the four-character square displayed on the tablet PC 11 (FIG. 2A). ) And image data cut out from the second grid by the character image cutout device 10-1 according to the first embodiment of the present invention (FIG. 2B), the
図2に示されるように、升目から「原」の文字の一部がはみ出して書かれている場合、従来技術によれば升目からはみ出した画像部分を含まない画像データが文字認識装置12に対し出力されるため、その画像データを用いた文字認識が正しく行われない場合が多い。これに対し、文字画像切出装置10−1による場合、升目の外に配置されている画像であっても、升目の中に配置されている画像と連続している部分を含む画像データが文字認識装置12に対し出力されるため、その画像データを用いた文字認識が正しく行わる可能性が従来技術による場合と比較して高い。
As shown in FIG. 2, when a part of the “original” character is written out from the cell, according to the prior art, image data that does not include the image portion that protrudes from the cell is transmitted to the
図3は文字画像切出装置10−1の構成を示したブロック図である。文字画像切出装置10−1は、文字画像切出装置10−1の構成部を制御する制御部101と、制御部101による各種処理を指示するプログラムおよび各種データを記憶するとともに制御部101のワークエリアとして用いられる記憶部102を備えている。
FIG. 3 is a block diagram showing the configuration of the character image cutting device 10-1. The character image cutout device 10-1 stores a
制御部101は、タブレットPC11から文字列を示す画像データと、タブレットPC11において表示される升目の各々の領域を示す領域データとを受信する画像データ入力部1011を備えている。画像データ入力部1011はタブレットPC11から受信した画像データおよび領域データをそれぞれ記憶部102に画像データ1021および領域データ1022として記憶する。画像データ1021は、平面上に等間隔で配置された画素に対応する画素データの集合であり、各画素データには例えば彩度データ、明度データおよび色相データが含まれている。
The
制御部101は画像データ1021により示される画像データを、白黒の2値画像データに変換する2値化部1012を備えている。2値化部1012は、画像データ1021に含まれる画素データのうち明度データが所定の閾値を超えるものを値「1」をとるオン画素データ、それ以外を値「0」をとるオフ画素データに変換することにより、2値画像データを生成する。2値化部1012は生成した2値画像データを2値画像データ1023として記憶部102に記憶する。
The
制御部101は、2値画像データ1023により示される画素画像データのうち、領域データ1022により示される各々の升目の領域に含まれる画像データの部分を取り出し、それらに含まれる連続する画像部分を各々分離して認識する領域内画像認識部1013を備えている。以下、第2の升目の領域に含まれる画像データに関し、文字画像切出装置10−1において行われる処理を説明する。領域内画像認識部1013は、第2の升目の領域(以下、「所定領域」と呼ぶ)に含まれるオン画素データを、互いに連続するオン画素データ群にグループ化する。以下、領域内画像認識部1013により1つのグループと認識されたオン画素データ群により示される画像の各々を「領域内画像」と呼ぶ。領域内画像認識部1013は、認識した領域内画像の各々に対し識別ラベルを付加する。図2に示されるL1〜L4は、領域内画像認識部1013により付加された識別ラベルを示している。
The
制御部101は、領域内画像を所定領域外の連続部分にまで拡張する拡張領域内画像認識部1014を備えている。領域内画像認識部1013は識別ラベルを付加した領域内画像を示すデータ(以下、「領域内画像データ」と呼ぶ)を拡張領域内画像認識部1014に引き渡す。拡張領域内画像認識部1014は、領域内画像認識部1013から受け取った領域内画像データおよび2値画像データ1023を用いて、領域内画像の各々に関し、所定領域外に連続するオン画素群が存在するか否かを判定し、連続したオン画素群があるものに関しては、当該オン画素群を領域内画像に統合することにより領域内画像を拡張する。具体的には、図2に示されるように、識別ラベルL1の領域内画像が拡張領域内画像認識部1014により拡張される。以下、拡張領域内画像認識部1014による拡張処理の施された領域内画像を「拡張領域内画像」と呼ぶ。
The
制御部101は、1文字を示す画像データを文字認識装置12に送信する画像データ出力部1015を備えている。拡張領域内画像認識部1014は拡張領域内画像を示す拡張領域内画像データを画像データ出力部1015に引き渡す。画像データ出力部1015は受け取った拡張領域内画像データを、1文字を示す画像データとして文字認識装置12に対し送信する。
The
以上のように文字画像切出装置10−1により切り出され文字認識装置12に送信される画像データは、升目からはみ出して書かれた文字部分を含む画像を示すため、文字認識処理において高い精度の結果をもたらすものとなる。
As described above, the image data cut out by the character image cutout device 10-1 and transmitted to the
[2.第2実施形態]
図4は、ユーザがタブレットPC11に表示される4文字分の升目に対し「榊原正義」なる文字列を筆記した場合に、従来技術により第1の升目から切り出される画像データ(図4(a))と、本発明の第2実施形態にかかる文字画像切出装置10−2により第1の升目から切り出される画像データ(図4(b))とを用いて、文字認識装置12が文字認識処理を行った際に得られるテキストデータを比較して示した図である。
[2. Second Embodiment]
FIG. 4 shows image data cut out from the first square by the conventional technique when the user writes a character string “Masayoshi Sugawara” for the four-character square displayed on the tablet PC 11 (FIG. 4A). ) And image data cut out from the first cell by the character image cutout device 10-2 according to the second embodiment of the present invention (FIG. 4B), the
図4に示されるように、「榊」の文字の一部が升目から完全に外れている場合、従来技術によれば升目から外れている画像部分を含まない画像データが文字認識装置12に対し出力されるため、その画像データを用いた文字認識は正しく行われない。これに対し、文字画像切出装置10−2による場合、升目の外に配置されている画像であっても、升目の中に配置されている画像と近接している部分を含む画像データが文字認識装置12に対し出力されるため、その画像データを用いた文字認識が正しく行わる可能性が高い。
As shown in FIG. 4, when a part of the character “榊” is completely out of the cell, according to the prior art, image data that does not include an image part that is out of the cell is transferred to the
図5は文字画像切出装置10−2の構成を示したブロック図である。文字画像切出装置10−2の構成および動作は多くの点で文字画像切出装置10−1のそれらと共通しているため、以下、文字画像切出装置10−2が文字画像切出装置10−1と異なる点のみを説明する。また、以下の説明において参照する図において、文字画像切出装置10−1の構成部に対応する構成部には文字画像切出装置10−1において用いられたものと同じ符号が付されている。 FIG. 5 is a block diagram showing the configuration of the character image cutting device 10-2. Since the configuration and operation of the character image cutting device 10-2 are the same as those of the character image cutting device 10-1 in many respects, the character image cutting device 10-2 is hereinafter referred to as the character image cutting device. Only differences from 10-1 will be described. Moreover, in the figure referred in the following description, the same code | symbol as what was used in the character image cutting device 10-1 is attached | subjected to the component corresponding to the component of the character image cutting device 10-1. .
文字画像切出装置10−2の制御部101は領域内画像に対し膨張処理を行う膨張画像生成部2011を備えている。膨張画像生成部2011は、領域内画像認識部1013から領域内画像データを受け取り、受け取った領域内画像データにより示される領域内画像の各々の外輪を示すオン画素データに隣接するオフ画素データをオン画素データに書き換える処理を所定回数だけ繰り返すことにより、領域内画像の膨張を行う。以下、膨張画像生成部2011による膨張処理の施された領域内画像を「膨張領域内画像」と呼ぶ。
The
文字画像切出装置10−2の制御部101は、文字画像切出装置10−1の制御部101が備える拡張領域内画像認識部1014の代わりに拡張膨張領域内画像認識部2012を備えている。膨張画像生成部2011は膨張領域内画像を示す膨張領域内画像データを拡張膨張領域内画像認識部2012に引き渡す。
The
拡張膨張領域内画像認識部2012は膨張画像生成部2011から受け取った膨張領域内画像データおよび2値画像データ1023を用いて、膨張領域内画像の各々に関し、所定領域外に連続するオン画素群が存在するか否かを判定し、連続したオン画素群があるものに関しては、当該オン画素群を膨張領域内画像に統合することにより膨張領域内画像を拡張する。具体的には、図4に示されるように、識別ラベルL2の膨張領域内画像が拡張膨張領域内画像認識部2012により拡張される。以下、拡張膨張領域内画像認識部2012による拡張処理の施された領域内画像を「拡張膨張領域内画像」と呼ぶ。
The expanded in-region
拡張膨張領域内画像認識部2012は拡張膨張領域内画像を示す拡張膨張領域内画像データを画像データ出力部1015に引き渡す。画像データ出力部1015は受け取った拡張膨張領域内画像データを、1文字を示す画像データとして文字認識装置12に対し送信する。
The inflated region
以上のように文字画像切出装置10−2により切り出され文字認識装置12に送信される画像データは、升目から外れて書かれた文字部分を含む画像を示すため、文字認識処理において高い精度の結果をもたらすものとなる。
As described above, the image data cut out by the character image cutout device 10-2 and transmitted to the
ところで、拡張膨張領域内画像認識部2012により生成される拡張膨張領域内画像は、升目内の画像に関しては膨張処理が施され、升目外の画像に関しては膨張処理が施されていない。一般的に、オリジナルの画像を用いて文字認識が行われる場合の方が、膨張処理が施されている画像を用いて文字認識が行われる場合と比較して、高い精度の結果が得られる。そこで、文字画像切出装置10−2に対し以下の変形を加えてもよい。
By the way, the expansion in-expansion area image generated by the expansion in-expansion area
図6は、文字画像切出装置10−2の制御部101に、拡張膨張領域内画像に対し収縮処理を行う収縮画像生成部2013を備えさせた場合の構成を示したブロック図である。収縮画像生成部2013は拡張膨張領域内画像認識部2012と画像データ出力部1015の間に介挿され、拡張膨張領域内画像認識部2012から拡張膨張領域内画像データを受け取り、受け取った拡張膨張領域内画像データにより示される拡張膨張領域内画像の各々の外輪を示すオン画素データをオフ画素データに書き換える処理を所定回数だけ繰り返すことにより、拡張膨張領域内画像の収縮を行う。以下、収縮画像生成部2013による収縮処理の施された拡張膨張領域内画像を「収縮拡張膨張領域内画像」と呼ぶ。
FIG. 6 is a block diagram illustrating a configuration when the
収縮拡張膨張領域内画像は、升目内の画像に関してはオリジナルの画像と同様の太さの画像を、また升目外の画像に関してはオリジナルの画像と比較して細い画像を含んでいる。一般的に文字認識処理においては、画像の特徴点を抽出するために、太さを持った画像を細線化する処理が行われるため、収縮拡張膨張領域内画像において升目外の画像がオリジナルの画像に比べ細い点は文字認識の精度にあまり悪影響を与えない。一方、収縮拡張膨張領域内画像に含まれる升目内の画像が拡張膨張領域内画像と比較してオリジナルに近似する太さである結果、より高い精度の文字認識をもたらす画像となる。 The image within the contraction / expansion / expansion region includes an image having the same thickness as the original image with respect to the image within the mesh, and a thin image with respect to the image outside the mesh compared with the original image. In general, in character recognition processing, in order to extract feature points of an image, processing for thinning an image having a thickness is performed. Compared with, the thin point does not have a bad influence on the accuracy of character recognition. On the other hand, the image in the grid included in the image in the contraction / expansion / expansion area has a thickness that approximates the original as compared with the image in the expansion / expansion area, resulting in an image that provides higher-accuracy character recognition.
収縮画像生成部2013は、収縮拡張膨張領域内画像を示す収縮拡張膨張領域内画像データを画像データ出力部1015に引き渡す。画像データ出力部1015は受け取った収縮拡張膨張領域内画像データを、1文字を示す画像データとして文字認識装置12に対し送信する。
The contracted
また、図7は、文字画像切出装置10−2の制御部101に、拡張膨張領域内画像と2値画像データ1023により示される画像との重複部分の画像を取り出す重複画像認識部2014を備えさせた場合の構成を示すブロック図である。重複画像認識部2014は拡張膨張領域内画像認識部2012と画像データ出力部1015の間に介挿され、拡張膨張領域内画像認識部2012から拡張膨張領域内画像データを受け取り、受け取った拡張膨張領域内画像データに含まれる画素データの各々に関し、当該画素データに対応する2値画像データ1023に含まれる画素データとの間の論理積を算出する。重複画像認識部2014により算出された論理積の結果を値とする画素データの集まりは、拡張膨張領域内画像と2値画像データ1023により示される画像との重複画像を示すデータである。
Further, in FIG. 7, the
上記のように重複画像認識部2014により認識される重複画像は、オリジナルの画像の中から、拡張膨張領域内画像により占められる範囲に含まれる部分を取り出したものである。従って、膨張処理が施された拡張膨張領域内画像と比較して、より高い精度の文字認識をもたらす画像となる。
As described above, the overlapping image recognized by the overlapping
重複画像認識部2014は、重複画像を示すデータを画像データ出力部1015に引き渡す。画像データ出力部1015は受け取った重複画像を示すデータを、1文字を示す画像データとして文字認識装置12に対し送信する。
The duplicate
[3.第3実施形態]
図8は、第2実施形態の場合と同様に、ユーザがタブレットPC11に表示される4文字分の升目に対し「榊原正義」なる文字列を筆記した場合に、本発明の第3実施形態にかかる文字画像切出装置10−3により第1の升目から画像データが切り出される様子を示した図である。
[3. Third Embodiment]
FIG. 8 shows the third embodiment of the present invention when the user writes a character string “Masayoshi Sugawara” for the four-character cell displayed on the
図9は文字画像切出装置10−3の構成を示したブロック図である。文字画像切出装置10−3の構成および動作は多くの点で文字画像切出装置10−2のそれらと共通しているため、以下、文字画像切出装置10−3が文字画像切出装置10−2と異なる点のみを説明する。また、以下の説明において参照する図において、文字画像切出装置10−1もしくは文字画像切出装置10−2の構成部に対応する構成部には文字画像切出装置10−1もしくは文字画像切出装置10−2において用いられたものと同じ符号が付されている。 FIG. 9 is a block diagram showing the configuration of the character image cutting device 10-3. Since the configuration and operation of the character image cutting device 10-3 are similar to those of the character image cutting device 10-2 in many respects, the character image cutting device 10-3 is hereinafter referred to as the character image cutting device. Only differences from 10-2 will be described. In the drawings referred to in the following description, the component corresponding to the component of the character image cutting device 10-1 or the character image cutting device 10-2 includes the character image cutting device 10-1 or the character image cutting device. The same code | symbol as what was used in the taking-out apparatus 10-2 is attached | subjected.
文字画像切出装置10−3の制御部101は領域内画像認識部1013の代わりに、2値画像データ1023に含まれる連続する画像部分を各々分離して認識する画像認識部3011を備えている。画像認識部3011は、2値画像データ1023に含まれるオン画素データを、互いに連続するオン画素データ群にグループ化し、各々のオン画素データを部分画像として認識する。画像認識部3011は、そのように認識した部分画像の各々に対し識別ラベルを付加する。画像認識部3011は識別ラベルを付加した部分画像を示すデータ(以下、「部分画像データ」と呼ぶ)を膨張画像生成部2011に引き渡す。
The
膨張画像生成部2011は受け取った部分画像データにより示される部分画像の各々に対し膨張処理を行い、膨張画像を生成する。文字画像切出装置10−3の制御部101は、膨張処理により互いに連続することとなった部分画像を一つの部分画像とする連結膨張画像認識部3012を備えている。膨張画像生成部2011は膨張画像を示す膨張画像データを連結膨張画像認識部3012に引き渡す。連結膨張画像認識部3012は膨張画像データにより示される膨張画像を互いに連続する膨張画像群にグループ化し、グループ化した膨張画像群を連結して1つの画像として再認識する。以下、そのように連結された膨張画像群を「連結膨張画像」と呼ぶ。
The expanded
文字画像切出装置10−3の制御部101は、所定領域に一部もしくは全部が含まれる連結膨張画像を認識する領域内連結膨張画像認識部3013を備えている。領域内連結膨張画像認識部3013は連結膨張画像認識部3012から連結膨張画像を示す連結膨張画像データを受け取り、連結膨張画像データにより示される連結膨張画像のうち、領域データ1022により示される第1の升目の少なくとも一部を占めているものを特定する。以下、領域内連結膨張画像認識部3013により特定された連結膨張画像を「領域内連結膨張画像」と呼ぶ。
The
領域内連結膨張画像認識部3013は、領域内連結膨張画像を示す領域内連結膨張画像データを画像データ出力部1015に引き渡す。画像データ出力部1015は受け取った領域内連結膨張画像データを、1文字を示す画像データとして文字認識装置12に対し送信する。
The intra-region linked dilated
以上のように文字画像切出装置10−3により切り出され文字認識装置12に送信される画像データは、文字画像切出装置10−2により切り出される画像データと同様に、升目から外れて書かれた文字部分を含む画像を示すため、文字認識処理において高い精度の結果をもたらすものとなる。
As described above, the image data cut out by the character image cutout device 10-3 and transmitted to the
ところで、領域内連結膨張画像認識部3013により認識される領域内連結膨張画像は、升目の内外のいずれに関してもオリジナルの画像に膨張処理が施された画像である。そこで、より高い文字認識の精度をもたらす画像を生成するために、文字画像切出装置10−3に対し以下の変形を加えてもよい。
By the way, the intra-region linked dilated image recognized by the intra-region linked dilated
図10は、文字画像切出装置10−3の制御部101に収縮画像生成部2013を備えさせた場合の構成を示すブロック図である。収縮画像生成部2013は領域内連結膨張画像認識部3013と画像データ出力部1015の間に介挿され、領域内連結膨張画像認識部3013から受け取った領域内連結膨張画像データにより示される領域内連結膨張画像に対し収縮処理を行い、収縮領域内連結膨張画像を生成する。収縮領域内連結膨張画像は、領域内連結膨張画像と比較して、オリジナルの画像と近似する太さであり、より高い精度の文字認識をもたらす。
FIG. 10 is a block diagram illustrating a configuration in the case where the
収縮画像生成部2013は収縮領域内連結膨張画像を示す収縮領域内連結膨張画像データを画像データ出力部1015に引き渡す。画像データ出力部1015は受け取った収縮領域内連結膨張画像データを、1文字を示す画像データとして文字認識装置12に対し送信する。
The contracted
また、図11は、文字画像切出装置10−3の制御部101に重複画像認識部2014を備えさせた場合の構成を示すブロック図である。重複画像認識部2014は領域内連結膨張画像認識部3013と画像データ出力部1015の間に介挿され、領域内連結膨張画像認識部3013から受け取った領域内連結膨張画像データにより示される領域内連結膨張画像と2値画像データ1023により示される画像との重複部分の画像を取り出す。
FIG. 11 is a block diagram illustrating a configuration when the
上記のように重複画像認識部2014により認識される重複画像は、オリジナルの画像の中から、領域内連結膨張画像により占められる範囲に含まれる部分を取り出したものである。従って、膨張処理が施された領域内連結膨張画像と比較して、より高い精度の文字認識をもたらす画像となる。
As described above, the overlapping image recognized by the overlapping
重複画像認識部2014は、重複画像を示すデータを画像データ出力部1015に引き渡す。画像データ出力部1015は受け取った重複画像を示すデータを、1文字を示す画像データとして文字認識装置12に対し送信する。
The duplicate
[4.第4実施形態]
図12は、第2実施形態および第3実施形態の場合と同様に、ユーザがタブレットPC11に表示される4文字分の升目に対し「榊原正義」なる文字列を筆記した場合に、本発明の第4実施形態にかかる文字画像切出装置10−4により第1の升目から画像データが切り出される様子を示した図である。
[4. Fourth Embodiment]
FIG. 12 shows the case where the user writes the character string “Masayoshi Sugawara” for the four-character cell displayed on the
図13は文字画像切出装置10−4の構成を示したブロック図である。文字画像切出装置10−4の構成および動作は多くの点で文字画像切出装置10−3のそれらと共通しているため、以下、文字画像切出装置10−4が文字画像切出装置10−3と異なる点のみを説明する。また、以下の説明において参照する図において、文字画像切出装置10−1ないし文字画像切出装置10−3の構成部に対応する構成部には文字画像切出装置10−1ないし文字画像切出装置10−3において用いられたものと同じ符号が付されている。 FIG. 13 is a block diagram showing the configuration of the character image cutting device 10-4. Since the configuration and operation of the character image cutting device 10-4 are similar to those of the character image cutting device 10-3 in many respects, the character image cutting device 10-4 is hereinafter referred to as the character image cutting device. Only differences from 10-3 will be described. Further, in the drawings to be referred to in the following description, the component corresponding to the component of the character image cutting device 10-1 to the character image cutting device 10-3 has a character image cutting device 10-1 to a character image cutting device. The same code | symbol as what was used in the taking-out apparatus 10-3 is attached | subjected.
文字画像切出装置10−4の制御部101は、文字画像切出装置10−3が備える全ての構成部に加え、2値画像データ1023に示される画像データのうち、領域データ1022により示される升目に含まれる画像データの部分を取り出し、それらに含まれる連続する画像部分を各々分離し、領域内画像として認識する領域内画像認識部1013を備えている。領域内画像認識部1013は認識した領域内画像およびそれらに付した識別ラベルを示す領域内画像データを領域内連結膨張画像認識部3013に引き渡す。
The
文字画像切出装置10−4の領域内連結膨張画像認識部3013は、連結膨張画像認識部3012から連結膨張画像を示す連結膨張画像データを受け取り、また領域内画像認識部1013から領域内画像データを受け取る。領域内連結膨張画像認識部3013は領域内画像データにより示される領域内画像の各々に関し、当該領域内画像に含まれる任意のオン画素を起点として選択する。領域内連結膨張画像認識部3013は、連結膨張画像データにより示される連結膨張画像に含まれる、先に選択した起点のオン画素に対応する位置のオン画素を特定し、特定したオン画素に連続するオン画素群を領域内連結膨張画像として認識する。
The intra-region connected expanded
例えば、図12に示される例によれば、連結膨張画像により示される「榊」の画像は、その文字を構成する左側のパーツ(L11)は識別ラベルL1もしくはL2が付された領域内画像に含まれるオン画素を起点とした取り出し処理により領域内連結膨張画像として認識される。また、連結膨張画像により示される「榊」の画像の右側のパーツ(L12)は識別ラベルL3が付された領域内画像に含まれるオン画素を起点とした取り出し処理により領域内連結膨張画像として認識される。 For example, according to the example shown in FIG. 12, the image of “榊” shown by the connected expanded image is an image in the region where the left part (L11) constituting the character is attached with the identification label L1 or L2. It is recognized as an intra-region connected expanded image by the extraction process starting from the included on-pixel. In addition, the right part (L12) of the “榊” image indicated by the connected dilated image is recognized as an intra-region dilated image by the extraction process starting from the on-pixel included in the intra-region image with the identification label L3. Is done.
領域内連結膨張画像認識部3013は上記のように領域内連結膨張画像を認識すると、認識した領域内連結膨張画像を示す領域内連結膨張画像データを画像データ出力部1015に引き渡す。画像データ出力部1015は受け取った領域内連結膨張画像データを、1文字を示す画像データとして文字認識装置12に対し送信する。
When the intra-region linked dilated
以上のように文字画像切出装置10−4により切り出され文字認識装置12に送信される画像データは、文字画像切出装置10−3により切り出される画像データと同じ画像データとなり、升目から外れて書かれた文字部分を含む画像を示すため、文字認識処理において高い精度の結果をもたらすものとなる。
As described above, the image data cut out by the character image cutout device 10-4 and transmitted to the
ところで、文字画像切出装置10−4の領域内連結膨張画像認識部3013により認識される領域内連結膨張画像は、文字画像切出装置10−3の文字画像切出装置10−4により認識される領域内連結膨張画像と同じものであるため、文字画像切出装置10−4に対し、文字画像切出装置10−3に関し上述したものと同様の変形を加えてもよい。
By the way, the intra-region connected expanded image recognized by the intra-region connected expanded
すなわち、文字画像切出装置10−4の領域内連結膨張画像認識部3013と画像データ出力部1015の間に収縮画像生成部2013を介挿し、領域内連結膨張画像に収縮処理を施した収縮領域内連結膨張画像を生成し、収縮領域内連結膨張画像を示す収縮領域内連結膨張画像データを画像データ出力部1015から出力するようにしてもよい。また、文字画像切出装置10−4の領域内連結膨張画像認識部3013と画像データ出力部1015の間に重複画像認識部2014を介挿し、領域内連結膨張画像と2値画像データ1023により示される画像との重複画像を認識し、重複画像を示すデータを画像データ出力部1015から出力するようにしてもよい。
That is, a contracted area obtained by interpolating the contracted
[5.第5実施形態]
図14は、ユーザがタブレットPC11に表示される4文字分の升目に対し「榊原正義」なる文字列を筆記した場合に、従来技術により第4の升目から切り出される画像データ(図14(a))と、本発明の第5実施形態にかかる文字画像切出装置10−5により第4の升目から切り出される画像データ(図14(b))とを用いて、文字認識装置12が文字認識処理を行った際に得られるテキストデータを比較して示した図である。
[5. Fifth Embodiment]
FIG. 14 shows image data cut out from the fourth square by the conventional technique when the user writes a character string “Masayoshi Sugawara” for the four squares displayed on the tablet PC 11 (FIG. 14A). ) And image data cut out from the fourth cell by the character image cutout device 10-5 according to the fifth embodiment of the present invention (FIG. 14B), the
図15は文字画像切出装置10−5の構成を示したブロック図である。文字画像切出装置10−5の構成および動作は多くの点で文字画像切出装置10−1のそれらと共通しているため、以下、文字画像切出装置10−5が文字画像切出装置10−1と異なる点のみを説明する。また、以下の説明において参照する図において、文字画像切出装置10−1ないし文字画像切出装置10−4の構成部に対応する構成部には文字画像切出装置10−1ないし文字画像切出装置10−4において用いられたものと同じ符号が付されている。 FIG. 15 is a block diagram showing the configuration of the character image cutting device 10-5. Since the configuration and operation of the character image cutting device 10-5 are similar to those of the character image cutting device 10-1 in many respects, the character image cutting device 10-5 is hereinafter referred to as the character image cutting device. Only differences from 10-1 will be described. Further, in the drawings to be referred to in the following description, the component corresponding to the component of the character image cutting device 10-1 to the character image cutting device 10-4 has a character image cutting device 10-1 to a character image cutting device. The same reference numerals as those used in the dispensing device 10-4 are attached.
文字画像切出装置10−5の制御部101は、処理対象の領域を升目から拡張領域内画像に外接する矩形の領域に拡張する拡張領域認識部5011を備えている。文字画像切出装置10−5の制御部101が備える拡張領域内画像認識部1014は、領域内画像認識部1013から升目の中に配置された領域内画像を示す領域内画像データを受け取り、受け取った領域内画像データおよび2値画像データ1023を用いて拡張領域内画像データを生成すると、生成した拡張領域内画像データを拡張領域認識部5011に引き渡す。
The
拡張領域認識部5011は、拡張領域内画像認識部1014から受け取った拡張領域内画像データにより示される拡張領域内画像の集まりに外接する矩形領域を特定する。以下、そのように特定された領域を「拡張領域」と呼ぶ。図14において、領域A0は領域データ1022により示される第4の升目の領域を示し、領域A1は拡張領域を示す。拡張領域認識部5011は、拡張領域を示す拡張領域データを領域内画像認識部1013に引き渡す。
The extension
領域内画像認識部1013は、拡張領域認識部5011から拡張領域データを受け取ると、2値画像データ1023に含まれるオン画素データのうち、領域データ1022により示される升目の領域に代えて、領域内画像の認識処理を再度実行する。その結果、図14において、既に認識されていた識別ラベルL1〜L3の付された領域内画像に加え、新たに識別ラベルL4の付された領域内画像が領域内画像認識部1013により認識される。領域内画像認識部1013はそのように認識した領域内画像を示す領域内画像データを拡張領域内画像認識部1014に引き渡す。
When the in-region
拡張領域内画像認識部1014は領域内画像認識部1013から拡張領域に関し生成した領域内画像データを受け取ると、受け取った領域内画像データにより示される領域内画像の拡張処理を再実行する。その結果、図14において、識別ラベルL4の付された領域内画像が拡張される。拡張領域内画像認識部1014はそのように認識した拡張領域内画像を示す拡張領域内画像データを画像データ出力部1015に引き渡す。画像データ出力部1015は受け取った拡張領域内画像データを、1文字を示す画像データとして文字認識装置12に対し送信する。
When the intra-region
上記の説明においては、拡張領域認識部5011による拡張領域の認識処理、領域内画像認識部1013による領域内画像の認識処理および拡張領域内画像認識部1014による拡張領域内画像の認識処理が1回だけ繰り返されるものとしたが、繰り返し回数を所定の複数回としてもよい。また、拡張領域内画像認識部1014による領域内画像の拡張もしくは拡張領域認識部5011による領域の拡張が行われなくなるまで、それらの処理を繰り返すようにしてもよい。
In the above description, the extension
以上のように文字画像切出装置10−5により切り出され文字認識装置12に送信される画像データは、例えば文字画像切出装置10−1における拡張処理によっては切り出されないような、升目外に分離して書かれた文字部分をも含む画像を示すため、文字認識処理において高い精度の結果をもたらすものとなる。
As described above, the image data cut out by the character image cutting device 10-5 and transmitted to the
ところで、文字画像切出装置10−5における領域拡張による認識処理の繰り返し実行を、文字画像切出装置10−2ないし文字画像切出装置10−4の拡張処理等と組み合わせてもよい。 By the way, the repeated execution of recognition processing by area expansion in the character image cutting device 10-5 may be combined with the expansion processing of the character image cutting device 10-2 to the character image cutting device 10-4.
[6.第6実施形態]
図16は、ユーザがタブレットPC11に表示される4文字分の升目に対し「榊原正義」なる文字列を筆記した場合に、本発明の第6実施形態にかかる文字画像切出装置10−6により第1の升目から画像データが切り出される様子を示した図である。この例においては、第1の升目には、第2の升目に書かれるべき文字の一部がはみ出して書かれているため、第1の升目に含まれる画像を用いて文字認識処理を行った場合、高い文字認識の精度は期待できない。これに対し、文字画像切出装置10−6は近隣の升目からはみ出してきた画像部分を除去することにより、高い精度の文字認識をもたらす画像の切り出しを行う。
[6. Sixth Embodiment]
FIG. 16 shows a case where the character image cutting device 10-6 according to the sixth embodiment of the present invention is used when the user writes a character string “Masayoshi Sugawara” with respect to the four-character grid displayed on the
図17は、文字画像切出装置10−6の構成を示したブロック図である。文字画像切出装置10−6の構成および動作は多くの点で文字画像切出装置10−1のそれらと共通しているため、以下、文字画像切出装置10−6が文字画像切出装置10−1と異なる点のみを説明する。また、以下の説明において参照する図において、文字画像切出装置10−1ないし文字画像切出装置10−5の構成部に対応する構成部には文字画像切出装置10−1ないし文字画像切出装置10−5において用いられたものと同じ符号が付されている。 FIG. 17 is a block diagram showing the configuration of the character image cutting device 10-6. Since the configuration and operation of the character image cutting device 10-6 are similar to those of the character image cutting device 10-1 in many respects, the character image cutting device 10-6 is hereinafter referred to as the character image cutting device. Only differences from 10-1 will be described. Further, in the drawings to be referred to in the following description, the component corresponding to the component of the character image cutting device 10-1 to the character image cutting device 10-5 has the character image cutting device 10-1 to the character image cutting device. The same code | symbol as what was used in the taking-out apparatus 10-5 is attached | subjected.
文字画像切出装置10−6の制御部101は、文字画像切出装置10−1の制御部101が備える拡張領域内画像認識部1014に代えて、領域内画像のうち升目外に連続するオン画素群を有するものの中から、近隣の升目からはみ出してきた部分を示すものと思われる領域内画像を画像データ出力部1015に引き渡す領域内画像の集まりから除外する領域内画像除外部6011を備えている。
The
領域内画像認識部1013は領域内画像データを領域内画像除外部6011に引き渡す。領域内画像除外部6011は受け取った領域内画像データおよび2値画像データ1023を用いて、領域内画像の各々に関し、升目外に連続するオン画素群が存在するか否かを判定し、連続したオン画素群があるもの(図16における、識別ラベルL1およびL5の付された領域内画像)に関しては、升目内の領域内画像に含まれるオン画素の数(もしくはその面積)と、領域内画像に連続する升目外のオン画素群に含まれるオン画素の数(もしくはその面積)とを比較する。領域内画像除外部6011は、升目内のオン画素の数が升目外のオン画素の数よりも少ない場合(図16における、識別ラベルL5の付された領域内画像)、その領域内画像を画像データ出力部1015に出力する領域内画像の集まりから除外する。
The intra-region
すなわち、領域内画像除外部6011は、升目外に連続するオン画素群を有しない領域内画像と、升目外に連続するオン画素群を有するが升目外に連続するオン画素群の占める面積よりも広い面積を占める領域内画像とを示す領域内画像データを、画像データ出力部1015に引き渡す。画像データ出力部1015は受け取った領域内画像データを、1文字を示す画像データとして文字認識装置12に対し送信する。
That is, the in-region
以上のように文字画像切出装置10−6により切り出され文字認識装置12に送信される画像データは、近隣の升目からはみ出した文字部分が除外された画像を示すため、文字認識処理において高い精度の結果をもたらすものとなる。
As described above, the image data cut out by the character image cutout device 10-6 and transmitted to the
ところで、文字画像切出装置10−6における領域内画像の除外処理を、文字画像切出装置10−1ないし文字画像切出装置10−5の拡張処理等と組み合わせてもよい。例えば、図18は文字画像切出装置10−6に文字画像切出装置10−1における領域内画像の拡張処理を組み合わせた場合の構成を示したブロック図である。 By the way, the in-region image exclusion processing in the character image cutting device 10-6 may be combined with the expansion processing of the character image cutting device 10-1 to the character image cutting device 10-5. For example, FIG. 18 is a block diagram showing a configuration when the character image cutting device 10-6 is combined with the in-region image expansion processing in the character image cutting device 10-1.
図18に示される構成の文字画像切出装置10−6においては、領域内画像除外部6011と画像データ出力部1015の間に拡張領域内画像認識部1014が介挿されている。この場合、拡張領域内画像認識部1014は領域内画像除外部6011から、除外されなかった領域内画像を示す領域内画像データを受け取り、受け取った領域内画像データにより示される領域内画像に対し拡張処理を行い、拡張領域内画像を認識する。拡張領域内画像認識部1014は認識した拡張領域内画像を示す拡張領域内画像データを、画像データ出力部1015に引き渡す。画像データ出力部1015は受け取った拡張領域内画像データを、1文字を示す画像データとして文字認識装置12に対し送信する。
In the character image cutout device 10-6 configured as shown in FIG. 18, an extended in-region
このように画像データ出力部1015から送信される画像データは、近隣の升目からはみ出した文字部分が除外され、かつ升目外にはみ出した文字部分を取り込んだ画像を示すため、文字認識処理においてより高い精度の結果をもたらすものとなる。
In this way, the image data transmitted from the image
また、文字画像切出装置10−6の領域内画像除外部6011が升目の内外に配置されるオン画素数を基準として領域内画像を除外する代わりに、例えば領域内画像除外部6011は升目の内外にまたがる拡張領域内画像を含めた画像データと除外した画像データの2セットの画像データを、画像データ出力部1015を介して文字認識装置12に送信するようにしてもよい。その場合、文字認識装置12においてそれらの画像データの各々に対し文字認識処理を行い、認識結果を登録された単語を示すテキストデータ等と比較することにより、正しいと思われる認識結果を採用するようにしてもよい。
Further, instead of the in-region
ところで、上述した文字画像切出装置10は、いずれも専用のハードウェアにより実現されてもよいし、汎用的なPCにアプリケーションプログラムに従った処理を実行させることにより実現されてもよい。
By the way, each of the character
また、上述した実施形態においては、文字認識システム1は文字画像切出装置10、タブレットPC11および文字認識装置12を互いに接続することにより実現されるものとして説明したが、それらの配置は任意に変更可能である。例えば、文字認識装置12を文字画像切出装置10と同じ筐体内に配置したり、文字画像切出装置10をタブレットPC11により実現するようにしたりしてもよい。また、文字画像切出装置10とタブレットPC11および文字画像切出装置10と文字認識装置12をネットワークを介して相互に接続するようにしてもよい。
Moreover, in embodiment mentioned above, although the character recognition system 1 demonstrated as what was implement | achieved by mutually connecting the character
また、上述した実施形態においては、文字画像切出装置10に対し、タブレットPC11から文字列を示す画像データが入力されるものとして説明したが、例えばタブレットPC11の代わりに、画像を光学的に読み取り画像データを生成するスキャナ装置を文字画像切出装置10に接続し、紙面に書かれた文字列をスキャナ装置に読み取らせ、スキャナ装置により生成された画像データを文字画像切出装置10に入力させるようにしてもよい。その場合、例えば、升目を示す図形を例えば朱色等で色付けしておき、文字画像切出装置10において色フィルタにより升目を示す図形を抽出後、図形認識処理を行い升目の領域を特定するようにすればよい。もしくは、図形認識処理のみによって升目の領域を特定するようにしてもよい。
Further, in the above-described embodiment, it has been described that image data indicating a character string is input from the
また、上述した実施形態においては、手書きによる文字列から1文字分の画像を切り出す場合について説明したが、升目に対しずれて印字された活字等に関しても本発明にかかる文字認識システムが利用可能であることは言うまでもない。 Further, in the above-described embodiment, the case where an image for one character is cut out from a handwritten character string has been described. However, the character recognition system according to the present invention can also be used for printed characters that are shifted from the grid. Needless to say.
1…文字認識システム、10…文字画像切出装置、11…タブレットPC、12…文字認識装置、101…制御部、102…記憶部、1011…画像データ入力部、1012…2値化部、1013…領域内画像認識部、1014…拡張領域内画像認識部、1015…画像データ出力部、1021…画像データ、1022…領域データ、1023…2値画像データ、2011…膨張画像生成部、2012…拡張膨張領域内画像認識部、2013…収縮画像生成部、2014…重複画像認識部、3011…画像認識部、3012…連結膨張画像認識部、3013…領域内連結膨張画像認識部、5011…拡張領域認識部、6011…領域内画像除外部 DESCRIPTION OF SYMBOLS 1 ... Character recognition system, 10 ... Character image cutting device, 11 ... Tablet PC, 12 ... Character recognition device, 101 ... Control part, 102 ... Memory | storage part, 1011 ... Image data input part, 1012 ... Binarization part, 1013 ... Image recognition unit in region, 1014 ... Image recognition unit in extended region, 1015 ... Image data output unit, 1021 ... Image data, 1022 ... Region data, 1023 ... Binary image data, 2011 ... Expanded image generation unit, 2012 ... Extension Expansion region image recognition unit, 2013 ... Shrinkage image generation unit, 2014 ... Duplicate image recognition unit, 3011 ... Image recognition unit, 3012 ... Concatenated expansion image recognition unit, 3013 ... Intra-region connection expansion image recognition unit, 5011 ... Expansion region recognition Part, 6011...
Claims (11)
前記画像データ取得手段により取得された画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する領域内画像認識手段と、
前記領域内画像認識手段により認識された領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する判定手段と、
前記判定手段により前記オン画素の集まりが存在する場合には当該オン画素の集まりを当該領域内画像に統合した画像を拡張領域内画像として認識し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該領域内画像を拡張領域内画像として認識する拡張領域内画像認識手段と、
前記拡張領域内画像認識手段により認識された拡張領域内画像を示すデータを、1文字を表す画像データとして出力する出力手段と
を備えることを特徴とする文字画像切出装置。 Image data acquisition means for acquiring image data consisting of a collection of pixel data indicating attribute values of each of a plurality of pixels constituting an image arranged on a plane;
Of the pixels indicated by the pixel data included in the image data acquired by the image data acquisition means, the pixel is represented by a predetermined grid on the plane from among the on pixels that indicate an attribute value exceeding a predetermined threshold. In-region image recognition means for recognizing a collection of on-pixels arranged continuously in a region as an in-region image;
Determining means for determining whether there is a collection of on-pixels adjacent to the in-area image recognized by the in-area image recognition means and continuously arranged outside the area;
If the determination means includes a set of on-pixels, an image obtained by integrating the set of on-pixels into the image in the region is recognized as an image in the extension region, and is adjacent to the image in the region and mutually outside the region. Extended region image recognition means for recognizing the image in the region as an image in the extended region when there is no group of continuously arranged on pixels;
A character image cutting device comprising: output means for outputting data indicating an image in the extended area recognized by the image recognition means in the extended area as image data representing one character.
前記画像データ取得手段により取得された画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する領域内画像認識手段と、
前記領域内画像認識手段により認識された領域内画像に対し膨張処理を行い、膨張領域内画像を生成する膨張画像生成手段と、
前記膨張画像生成手段により生成された膨張領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する判定手段と、
前記判定手段により前記オン画素の集まりが存在する場合には当該オン画素の集まりを当該膨張領域内画像に統合した画像を拡張膨張領域内画像として認識し、当該膨張領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該膨張領域内画像を拡張膨張領域内画像として認識する拡張膨張領域内画像認識手段と、
前記拡張膨張領域内画像認識手段により認識された拡張膨張領域内画像を示すデータを、1文字を表す画像データとして出力する出力手段と
を備えることを特徴とする文字画像切出装置。 Image data acquisition means for acquiring image data consisting of a collection of pixel data indicating attribute values of each of a plurality of pixels constituting an image arranged on a plane;
Of the pixels indicated by the pixel data included in the image data acquired by the image data acquisition means, the pixel is represented by a predetermined grid on the plane from among the on pixels that indicate an attribute value exceeding a predetermined threshold. In-region image recognition means for recognizing a collection of on-pixels arranged continuously in a region as an in-region image;
Expansion image generation means for performing expansion processing on the in-region image recognized by the in-region image recognition means, and generating an in-expansion area image;
Determining means for determining whether there is a collection of on-pixels adjacent to the in-expansion area image generated by the inflated image generation means and continuously arranged outside the area;
When the determination unit includes the collection of on-pixels, an image obtained by integrating the collection of on-pixels with the image in the expansion area is recognized as an image in the expansion area, and is adjacent to the image in the expansion area. An expansion in-expansion region image recognition means for recognizing the in-expansion region image as an expansion in-expansion region image when there is no collection of on-pixels arranged continuously outside.
A character image cutout device comprising: output means for outputting data indicating an image in the expanded expansion area recognized by the image recognition means in the expanded expansion area as image data representing one character.
をさらに備え、
前記出力手段は、拡張膨張領域内画像を示すデータの代わりに、前記収縮画像生成手段により生成された収縮拡張膨張領域内画像を示すデータを出力する
ことを特徴とする請求項2に記載の文字画像切出装置。 Further comprising contraction image generation means for performing contraction processing on the image in the expansion expansion area recognized by the image recognition means in the expansion expansion area and generating an image in the contraction expansion expansion area,
3. The character according to claim 2, wherein the output unit outputs data indicating the image in the contraction / expansion / expansion region generated by the contraction image generation unit, instead of data indicating the image in the expansion / expansion region. Image cutting device.
前記画像データ取得手段により取得された画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する領域内画像認識手段と、
前記領域内画像認識手段により認識された領域内画像に対し膨張処理を行い、膨張領域内画像を生成する膨張画像生成手段と、
前記膨張画像生成手段により生成された膨張領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する判定手段と、
前記判定手段により前記オン画素の集まりが存在する場合には当該オン画素の集まりを当該膨張領域内画像に統合した画像を拡張膨張領域内画像として認識し、当該膨張領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該膨張領域内画像を拡張膨張領域内画像として認識する拡張膨張領域内画像認識手段と、
前記画像データ取得手段により取得された画像データにより示される画像と前記拡張膨張領域内画像認識手段により認識された拡張膨張領域内画像との両方においてオン画素である画素の集まりを重複画像として認識する重複画像認識手段と、
前記重複画像認識手段により認識された重複画像を示すデータを、1文字を表す画像データとして出力する出力手段と
を備えることを特徴とする文字画像切出装置。 Image data acquisition means for acquiring image data consisting of a collection of pixel data indicating attribute values of each of a plurality of pixels constituting an image arranged on a plane;
Of the pixels indicated by the pixel data included in the image data acquired by the image data acquisition means, the pixel is represented by a predetermined grid on the plane from among the on pixels that indicate an attribute value exceeding a predetermined threshold. In-region image recognition means for recognizing a collection of on-pixels arranged continuously in a region as an in-region image;
Expansion image generation means for performing expansion processing on the in-region image recognized by the in-region image recognition means, and generating an in-expansion area image;
Determining means for determining whether there is a collection of on-pixels adjacent to the in-expansion area image generated by the inflated image generation means and continuously arranged outside the area;
When the determination unit includes the collection of on-pixels, an image obtained by integrating the collection of on-pixels with the image in the expansion area is recognized as an image in the expansion area, and is adjacent to the image in the expansion area. An expansion in-expansion region image recognition means for recognizing the in-expansion region image as an expansion in-expansion region image when there is no collection of on-pixels arranged continuously outside.
A set of pixels that are on-pixels is recognized as a duplicate image in both the image indicated by the image data acquired by the image data acquisition unit and the image in the expansion expansion region recognized by the image recognition unit in the expansion expansion region. Duplicate image recognition means;
A character image cutting device comprising: output means for outputting data indicating a duplicate image recognized by the duplicate image recognition means as image data representing one character.
前記画像データ取得手段により取得された画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する領域内画像認識手段と、
前記領域内画像認識手段により認識された領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する判定手段と、
前記判定手段により前記オン画素の集まりが存在する場合には当該オン画素の集まりを当該領域内画像に統合した画像を拡張領域内画像として認識し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該領域内画像を拡張領域内画像として認識する拡張領域内画像認識手段と、
前記拡張領域内画像認識手段により認識された拡張領域内画像に外接する前記平面上の所定の形状の領域を拡張領域として認識する拡張領域認識手段と、
前記拡張領域認識手段により認識された拡張領域内に含まれるオン画素の集まりにより示される画像を示すデータを、1文字を表す画像データとして出力する出力手段と
を備えることを特徴とする文字画像切出装置。 Image data acquisition means for acquiring image data consisting of a collection of pixel data indicating attribute values of each of a plurality of pixels constituting an image arranged on a plane;
Of the pixels indicated by the pixel data included in the image data acquired by the image data acquisition means, the pixel is represented by a predetermined grid on the plane from among the on pixels that indicate an attribute value exceeding a predetermined threshold. In-region image recognition means for recognizing a collection of on-pixels arranged continuously in a region as an in-region image;
Determining means for determining whether there is a collection of on-pixels adjacent to the in-area image recognized by the in-area image recognition means and continuously arranged outside the area;
If the determination means includes a set of on-pixels, an image obtained by integrating the set of on-pixels into the image in the region is recognized as an image in the extension region, and is adjacent to the image in the region and mutually outside the region. Extended region image recognition means for recognizing the image in the region as an image in the extended region when there is no group of continuously arranged on pixels;
Extended area recognition means for recognizing an area of a predetermined shape on the plane circumscribing an image in the extension area recognized by the image recognition means in the extension area as an extension area;
Output means for outputting data indicating an image indicated by a collection of on-pixels included in the extension area recognized by the extension area recognition means as image data representing one character. Out device.
前記拡張領域内画像認識手段は、前記領域内画像認識手段による認識処理の再実行により認識された領域内画像に対し前記拡張領域内画像の認識処理を再実行し、
前記拡張領域認識手段は、前記拡張領域内画像認識手段による認識処理の再実行により認識された拡張領域内画像に対し前記拡張領域の認識処理を再実行し、
前記出力手段は、前記拡張領域認識手段による認識処理の再実行により認識された拡張領域内に含まれるオン画素の集まりにより示される画像を示すデータを、前記1文字を表す画像データとして出力する
ことを特徴とする請求項5に記載の文字画像切出装置。 The in-region image recognition unit re-executes the in-region image recognition processing with the extension region recognized by the extension region recognition unit as the region after the extension region is recognized by the extension region recognition unit. ,
The extended area image recognition means re-executes the recognition process of the extended area image for the image in the area recognized by re-execution of the recognition process by the intra-area image recognition means,
The extension area recognition means re-executes the extension area recognition process on the extension area image recognized by re-execution of the recognition process by the extension area image recognition means,
The output means outputs data indicating an image indicated by a collection of on-pixels included in an extended area recognized by re-execution of recognition processing by the extended area recognition means as image data representing the one character. The character image cutting device according to claim 5.
前記画像データ取得手段により取得された画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する領域内画像認識手段と、
前記領域内画像認識手段により認識された1以上の領域内画像のうち少なくとも1の領域内画像に関し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する判定手段と、
前記判定手段により前記オン画素の集まりが存在する場合、当該領域内画像を前記領域内画像認識手段により認識された領域内画像の集まりから除外する領域内画像除外手段と、
前記領域内画像認識手段により認識された領域内画像のうち前記領域内画像除外手段により除外されなかった領域内画像の集まりを、1文字を表す画像データとして出力する出力手段と
を備えることを特徴とする文字画像切出装置。 Image data acquisition means for acquiring image data consisting of a collection of pixel data indicating attribute values of each of a plurality of pixels constituting an image arranged on a plane;
Of the pixels indicated by the pixel data included in the image data acquired by the image data acquisition means, the pixel is represented by a predetermined grid on the plane from among the on pixels that indicate an attribute value exceeding a predetermined threshold. In-region image recognition means for recognizing a collection of on-pixels arranged continuously in a region as an in-region image;
Regarding at least one intra-region image among one or more intra-region images recognized by the intra-region image recognition means, a collection of on-pixels arranged adjacent to the intra-region image and continuously outside the region. Determination means for determining whether or not it exists;
An intra-region image excluding unit for excluding the intra-region image from the intra-region image collection recognized by the intra-region image recognition unit when the determination unit includes the set of on-pixels;
Output means for outputting, as image data representing one character, a collection of intra-area images that are not excluded by the intra-area image exclusion means among the intra-area images recognized by the intra-area image recognition means. A character image cutting device.
ことを特徴とする請求項7に記載の文字画像切出装置。 The area in the image excluding means relates the first region in an image, if the set of ON pixels that are arranged consecutively to each other in front Symbol territory outside and adjacent to the region in an image is present, the collection of the ON pixels When the area occupied by the image in one region is smaller than the area occupied, the image in the one region is excluded from the collection of images in the region recognized by the image recognition means in the region, and the collection of the on pixels occupies. The character image cutting device according to claim 7 , wherein when the area occupied by the image in one area is larger than the area, the image in the one area is not excluded from the collection of images in the area .
をさらに備え、
前記出力手段は、前記拡張領域内画像認識手段により認識された拡張領域内画像を示すデータを、前記1文字を表す画像データとして出力する
ことを特徴とする請求項8に記載の文字画像切出装置。 When there is a collection of on-pixels adjacent to the in-area image that has not been excluded by the in-area image excluding means and continuously arranged outside the area, the on-pixel collection is used as the in-area image. If the integrated image is recognized as an image in the extension area and there is no collection of on pixels that are adjacent to the image in the area and are continuously arranged outside the area, the image in the area is determined to be an image in the extension area. Further comprising an image recognition means in the extended area that recognizes as
The character image cutout according to claim 8 , wherein the output means outputs data indicating the image in the extended area recognized by the image recognition means in the extended area as image data representing the one character. apparatus.
取得した画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する処理と、
認識した領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する処理と、
前記オン画素の集まりが存在する場合には当該オン画素の集まりを当該領域内画像に統合した画像を拡張領域内画像として認識し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該領域内画像を拡張領域内画像として認識する処理と、
認識した拡張領域内画像を示すデータを、1文字を表す画像データとして出力する処理と
をコンピュータに実行させることを特徴とするプログラム。 Processing for obtaining image data composed of a collection of pixel data indicating attribute values of each of a plurality of pixels constituting an image arranged on a plane;
Among the pixels indicated by the pixel data included in the acquired image data, among the on pixels indicating attribute values exceeding a predetermined threshold value, the pixels are continuous with each other within the area represented by the predetermined grid on the plane. Processing for recognizing a collection of on-pixels arranged as an in-region image,
A process of determining whether there is a collection of on-pixels adjacent to the recognized in-region image and continuously arranged outside the region;
Recognizing an image obtained by integrating the collection of the ON pixels in the area in the image in the case where collection of pre SL on pixel exists as an extended area within the image, and adjacent to the area in the image to one another continuously outside the said region A process of recognizing the image in the area as an image in the extension area when there is no collection of arranged on pixels,
A program for causing a computer to execute a process of outputting data indicating a recognized image in an extended area as image data representing one character.
取得した画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する処理と、
認識された1以上の領域内画像のうち少なくとも1の領域内画像に関し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する処理と、
前記オン画素の集まりが存在する場合、当該領域内画像を認識した領域内画像の集まりから除外する処理と、
認識した領域内画像のうち除外しなかった領域内画像の集まりを、1文字を表す画像データとして出力する処理と
をコンピュータに実行させることを特徴とするプログラム。 Processing for obtaining image data composed of a collection of pixel data indicating attribute values of each of a plurality of pixels constituting an image arranged on a plane;
Among the pixels indicated by the pixel data included in the acquired image data, among the on pixels indicating attribute values exceeding a predetermined threshold value, the pixels are continuous with each other within the area represented by the predetermined grid on the plane. Processing for recognizing a collection of on-pixels arranged as an in-region image,
For at least one in-region image among one or more recognized in-region images, it is determined whether there is a collection of on-pixels that are adjacent to the in-region image and are continuously arranged outside the region. Processing to
If a collection of pre-Symbol ON pixels are present, the process of excluding the region image from the collection of recognized areas in the image,
A program that causes a computer to execute a process of outputting a collection of intra-region images that are not excluded among recognized intra-region images as image data representing one character.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2005092520A JP4830331B2 (en) | 2005-03-28 | 2005-03-28 | Character image cutting device and program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2005092520A JP4830331B2 (en) | 2005-03-28 | 2005-03-28 | Character image cutting device and program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2006277092A JP2006277092A (en) | 2006-10-12 |
| JP4830331B2 true JP4830331B2 (en) | 2011-12-07 |
Family
ID=37211821
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2005092520A Expired - Fee Related JP4830331B2 (en) | 2005-03-28 | 2005-03-28 | Character image cutting device and program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4830331B2 (en) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4935459B2 (en) * | 2007-03-28 | 2012-05-23 | 沖電気工業株式会社 | Character recognition method, character recognition program, and character recognition device |
| JP2015038670A (en) * | 2012-11-28 | 2015-02-26 | 株式会社東芝 | Electronic device, and method |
| JP6922365B2 (en) * | 2017-04-12 | 2021-08-18 | 富士フイルムビジネスイノベーション株式会社 | Document processing equipment and programs |
Family Cites Families (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS617988A (en) * | 1984-06-22 | 1986-01-14 | Hitachi Ltd | Pattern restoration method |
| JPS6133583A (en) * | 1984-07-25 | 1986-02-17 | Nec Corp | Character segmentation device |
| JPH069064B2 (en) * | 1984-12-04 | 1994-02-02 | オムロン株式会社 | Handwriting recognition device |
| JPH05342409A (en) * | 1992-06-05 | 1993-12-24 | Nec Corp | Character recognizing device |
| JPH06251198A (en) * | 1993-02-23 | 1994-09-09 | Toshiba Corp | Character input device |
| JP3852218B2 (en) * | 1998-09-10 | 2006-11-29 | 富士ゼロックス株式会社 | Image processing method and image processing apparatus |
| JP4442977B2 (en) * | 2000-02-07 | 2010-03-31 | 株式会社日本デジタル研究所 | Character recognition device, character image interpolation method, and recording medium recording character image interpolation program |
| JP2004094427A (en) * | 2002-08-30 | 2004-03-25 | Hitachi Ltd | Form image processing apparatus and program for realizing the apparatus |
-
2005
- 2005-03-28 JP JP2005092520A patent/JP4830331B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2006277092A (en) | 2006-10-12 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN107680589B (en) | Voice information interaction method, device and equipment | |
| RU2437152C2 (en) | Device to process images, method and computer programme to process images | |
| KR20130029430A (en) | Character recognition device, character recognition method, character recognition system, and character recognition program | |
| RU2631168C2 (en) | Methods and devices that convert images of documents to electronic documents using trie-data structures containing unparameterized symbols for definition of word and morphemes on document image | |
| CN106599940B (en) | Picture character recognition method and device | |
| RU2643465C2 (en) | Devices and methods using a hierarchially ordered data structure containing unparametric symbols for converting document images to electronic documents | |
| RU2619712C1 (en) | Optical character recognition of image series | |
| RU2613849C1 (en) | Optical character recognition of image series | |
| JPH0830732A (en) | Character recognition method | |
| CN111798543B (en) | Model training method, data processing method, device, equipment and storage medium | |
| JP2010157107A (en) | Business document processor | |
| JPH11120293A (en) | Character recognition / correction method | |
| US20190318190A1 (en) | Information processing apparatus, and non-transitory computer readable medium | |
| CN112232282A (en) | A gesture recognition method, device, storage medium and electronic device | |
| JP4830331B2 (en) | Character image cutting device and program | |
| US9342739B2 (en) | Character recognition apparatus, non-transitory computer readable medium, and character recognition method | |
| WO2015079751A1 (en) | Translation device | |
| WO2017038952A1 (en) | Character recognition device, character recognition method, and program | |
| CN111079749B (en) | End-to-end commodity price tag character recognition method and system with gesture correction | |
| WO2020054067A1 (en) | Image information processing device, image information processing method, and image information processing program | |
| JP7267854B2 (en) | Form recognition device, form recognition method, and form recognition system | |
| Bidari et al. | Semantic segmentation using U-Net architecture for change detection on hyperspectral imagery | |
| JP6575116B2 (en) | Character recognition device, character recognition processing system, and program | |
| JP2020154449A (en) | Image processing equipment and programs | |
| JP6724547B2 (en) | Information processing apparatus, information processing method, and information processing program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080221 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100916 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101019 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101214 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110614 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110721 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110823 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110905 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 4830331 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140930 Year of fee payment: 3 |
|
| LAPS | Cancellation because of no payment of annual fees | ||
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R370 | Written measure of declining of transfer procedure |
Free format text: JAPANESE INTERMEDIATE CODE: R370 |