JP4830331B2

JP4830331B2 - 文字画像切出装置およびプログラム

Info

Publication number: JP4830331B2
Application number: JP2005092520A
Authority: JP
Inventors: 俊哉小山
Original assignee: Fuji Xerox Co Ltd; Fujifilm Business Innovation Corp
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2005-03-28
Filing date: 2005-03-28
Publication date: 2011-12-07
Anticipated expiration: 2025-03-28
Also published as: JP2006277092A

Description

本発明は、文字認識処理に用いられる文字画像の切り出し技術に関する。

文字を示す画像データから抽出した特徴点と、予めデータベースに登録してある文字の特徴点とを比較することにより、画像データにより示される文字を認識し、認識した文字を示すテキストデータを生成する技術がある。

上記のような文字認識処理において、画像データが複数の文字を示す場合、その画像データから各々の文字を示す画像データを切り出すことが必要となる。すなわち、画像データに含まれる連続したオン画素群のいずれが１つの文字を構成するものであるかを特定する必要がある。そのような文字画像の切り出し技術を開示したものとして、例えば特許文献１がある。
特開平１０−２０７９８５号公報

特許文献１に開示の技術によれば、各々のオン画素群を１つの文字の構成要素と仮定して文字認識処理を行った場合の結果および隣接する２以上のオン画素群を１つの文字の構成要素と仮定して文字認識処理を行った場合の結果を、単語辞書に登録されている単語と照合することにより、いずれの結果が正しいものであるかを特定する。

上記の従来技術による場合、文字認識処理が複数回行われる上に、文字認識処理の結果を単語と照合する処理が必要となるため、１文字を示す画像データの切り出しに時間がかかる、という問題がある。また、予め単語辞書の整備が必要であり、かつ単語辞書の記憶領域の確保も必要である。

上述の事情に鑑み、本発明は簡便かつ高速に画像データから各々の文字部分を切り出す手段を提供することを目的とする。

上述の課題を解決するため、本発明は、平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する画像データ取得手段と、前記画像データ取得手段により取得された画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する領域内画像認識手段と、前記領域内画像認識手段により認識された領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する判定手段と、前記判定手段により前記オン画素の集まりが存在する場合には当該オン画素の集まりを当該領域内画像に統合した画像を拡張領域内画像として認識し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該領域内画像を拡張領域内画像として認識する拡張領域内画像認識手段と、前記拡張領域内画像認識手段により認識された拡張領域内画像を示すデータを、１文字を表す画像データとして出力する出力手段とを備えることを特徴とする文字画像切出装置を提供する。

また、本発明は、平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する画像データ取得手段と、前記画像データ取得手段により取得された画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する領域内画像認識手段と、前記領域内画像認識手段により認識された領域内画像に対し膨張処理を行い、膨張領域内画像を生成する膨張画像生成手段と、前記膨張画像生成手段により生成された膨張領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する判定手段と、前記判定手段により前記オン画素の集まりが存在する場合には当該オン画素の集まりを当該膨張領域内画像に統合した画像を拡張膨張領域内画像として認識し、当該膨張領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該膨張領域内画像を拡張膨張領域内画像として認識する拡張膨張領域内画像認識手段と、前記拡張膨張領域内画像認識手段により認識された拡張膨張領域内画像を示すデータを、１文字を表す画像データとして出力する出力手段とを備えることを特徴とする文字画像切出装置を提供する。

好ましい態様において、前記文字画像切出装置は前記拡張膨張領域内画像認識手段により認識された拡張膨張領域内画像に対し収縮処理を行い、収縮拡張膨張領域内画像を生成する収縮画像生成手段をさらに備え、前記出力手段は、拡張膨張領域内画像を示すデータの代わりに、前記収縮画像生成手段により生成された収縮拡張膨張領域内画像を示すデータを出力するように構成されてもよい。

また、本発明は、平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する画像データ取得手段と、前記画像データ取得手段により取得された画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する領域内画像認識手段と、前記領域内画像認識手段により認識された領域内画像に対し膨張処理を行い、膨張領域内画像を生成する膨張画像生成手段と、前記膨張画像生成手段により生成された膨張領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する判定手段と、前記判定手段により前記オン画素の集まりが存在する場合には当該オン画素の集まりを当該膨張領域内画像に統合した画像を拡張膨張領域内画像として認識し、当該膨張領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該膨張領域内画像を拡張膨張領域内画像として認識する拡張膨張領域内画像認識手段と、前記画像データ取得手段により取得された画像データにより示される画像と前記拡張膨張領域内画像認識手段により認識された拡張膨張領域内画像との両方においてオン画素である画素の集まりを重複画像として認識する重複画像認識手段と、前記重複画像認識手段により認識された重複画像を示すデータを、１文字を表す画像データとして出力する出力手段とを備えることを特徴とする文字画像切出装置を提供する。

また、本発明は、平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する画像データ取得手段と、前記画像データ取得手段により取得された画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する領域内画像認識手段と、前記領域内画像認識手段により認識された領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する判定手段と、前記判定手段により前記オン画素の集まりが存在する場合には当該オン画素の集まりを当該領域内画像に統合した画像を拡張領域内画像として認識し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該領域内画像を拡張領域内画像として認識する拡張領域内画像認識手段と、前記拡張領域内画像認識手段により認識された拡張領域内画像に外接する前記平面上の所定の形状の領域を拡張領域として認識する拡張領域認識手段と、前記拡張領域認識手段により認識された拡張領域内に含まれるオン画素の集まりにより示される画像を示すデータを、１文字を表す画像データとして出力する出力手段とを備えることを特徴とする文字画像切出装置を提供する。

好ましい態様において、前記文字画像切出装置の前記領域内画像認識手段は、前記拡張領域認識手段により拡張領域の認識が行われた後、前記拡張領域認識手段により認識された拡張領域を前記領域として前記領域内画像の認識処理を再実行し、前記拡張領域内画像認識手段は、前記領域内画像認識手段による認識処理の再実行により認識された領域内画像に対し前記拡張領域内画像の認識処理を再実行し、前記拡張領域認識手段は、前記拡張領域内画像認識手段による認識処理の再実行により認識された拡張領域内画像に対し前記拡張領域の認識処理を再実行し、前記出力手段は、前記拡張領域認識手段による認識処理の再実行により認識された拡張領域内に含まれるオン画素の集まりにより示される画像を示すデータを、前記１文字を表す画像データとして出力するように構成されてもよい。

また、本発明は、平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する画像データ取得手段と、前記画像データ取得手段により取得された画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する領域内画像認識手段と、前記領域内画像認識手段により認識された１以上の領域内画像のうち少なくとも１の領域内画像に関し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する判定手段と、前記判定手段により前記オン画素の集まりが存在する場合、当該領域内画像を前記領域内画像認識手段により認識された領域内画像の集まりから除外する領域内画像除外手段と、前記領域内画像認識手段により認識された領域内画像のうち前記領域内画像除外手段により除外されなかった領域内画像の集まりを、１文字を表す画像データとして出力する出力手段とを備えることを特徴とする文字画像切出装置を提供する。

好ましい態様において、前記文字画像切出装置の前記領域内画像除外手段は、１の領域内画像に関し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在する場合、当該オン画素の集まりの占める面積よりも当該１の領域内画像の占める面積が狭いときには、当該１の領域内画像を前記領域内画像認識手段により認識された領域内画像の集まりから除外し、当該オン画素の集まりの占める面積よりも当該１の領域内画像の占める面積が広いときには、当該１の領域内画像を前記領域内画像の集まりから除外しないように構成されてもよい。

また、他の好ましい態様において、前記文字画像切出装置は前記領域内画像除外手段により除外されなかった領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在する場合には当該オン画素の集まりを当該領域内画像に統合した画像を拡張領域内画像として認識し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該領域内画像を拡張領域内画像として認識する拡張領域内画像認識手段をさらに備え、前記出力手段は、前記拡張領域内画像認識手段により認識された拡張領域内画像を示すデータを、前記１文字を表す画像データとして出力するように構成されてもよい。

また、本発明は、上記いずれかに記載の前記文字画像切出装置が行う処理と同様の処理をコンピュータに実行させることを特徴とするプログラムを提供する。

本発明によれば、升目からはみ出して書かれた文字を示す画像から、正しく１文字を示す画像が切り出されるため、高い精度の文字認識が可能となる。

［実施形態］
以下、本発明の好適な実施形態を説明する。図１は以下に説明する実施形態にかかる文字認識システム１の構成を示したブロック図である。文字認識システム１は、複数の文字を示す画像データから各々の文字を示す画像データを切り出して送信する文字画像切出装置１０と、文字画像切出装置１０に対し複数の文字を示す画像データを送信するタブレットＰＣ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ）１１と、文字画像切出装置１０から送信される各々の文字を示す画像データに対し文字認識処理を行い認識した文字を示すテキストデータを生成する文字認識装置１２を備えている。

タブレットＰＣ１１は、液晶ディスプレイに積層されたペンタブレット型入力デバイスを備え、ユーザが液晶ディスプレイに表示される升目に対しペン型のスタイラスを用いて筆記動作を行うと、ペンタブレット型入力デバイスがその筆記動作における筆圧の加えられた位置および筆圧の大きさを測定し、それらの測定値に基づきユーザにより書かれた文字を示す画像データを生成する。

［１．第１実施形態］
図２は、ユーザがタブレットＰＣ１１に表示される４文字分の升目に対し「榊原正義」なる文字列を筆記した場合に、従来技術により第２の升目から切り出される画像データ（図２（ａ））と、本発明の第１実施形態にかかる文字画像切出装置１０−１により第２の升目から切り出される画像データ（図２（ｂ））とを用いて、文字認識装置１２が文字認識処理を行った際に得られるテキストデータを比較して示した図である。

図２に示されるように、升目から「原」の文字の一部がはみ出して書かれている場合、従来技術によれば升目からはみ出した画像部分を含まない画像データが文字認識装置１２に対し出力されるため、その画像データを用いた文字認識が正しく行われない場合が多い。これに対し、文字画像切出装置１０−１による場合、升目の外に配置されている画像であっても、升目の中に配置されている画像と連続している部分を含む画像データが文字認識装置１２に対し出力されるため、その画像データを用いた文字認識が正しく行わる可能性が従来技術による場合と比較して高い。

図３は文字画像切出装置１０−１の構成を示したブロック図である。文字画像切出装置１０−１は、文字画像切出装置１０−１の構成部を制御する制御部１０１と、制御部１０１による各種処理を指示するプログラムおよび各種データを記憶するとともに制御部１０１のワークエリアとして用いられる記憶部１０２を備えている。

制御部１０１は、タブレットＰＣ１１から文字列を示す画像データと、タブレットＰＣ１１において表示される升目の各々の領域を示す領域データとを受信する画像データ入力部１０１１を備えている。画像データ入力部１０１１はタブレットＰＣ１１から受信した画像データおよび領域データをそれぞれ記憶部１０２に画像データ１０２１および領域データ１０２２として記憶する。画像データ１０２１は、平面上に等間隔で配置された画素に対応する画素データの集合であり、各画素データには例えば彩度データ、明度データおよび色相データが含まれている。

制御部１０１は画像データ１０２１により示される画像データを、白黒の２値画像データに変換する２値化部１０１２を備えている。２値化部１０１２は、画像データ１０２１に含まれる画素データのうち明度データが所定の閾値を超えるものを値「１」をとるオン画素データ、それ以外を値「０」をとるオフ画素データに変換することにより、２値画像データを生成する。２値化部１０１２は生成した２値画像データを２値画像データ１０２３として記憶部１０２に記憶する。

制御部１０１は、２値画像データ１０２３により示される画素画像データのうち、領域データ１０２２により示される各々の升目の領域に含まれる画像データの部分を取り出し、それらに含まれる連続する画像部分を各々分離して認識する領域内画像認識部１０１３を備えている。以下、第２の升目の領域に含まれる画像データに関し、文字画像切出装置１０−１において行われる処理を説明する。領域内画像認識部１０１３は、第２の升目の領域（以下、「所定領域」と呼ぶ）に含まれるオン画素データを、互いに連続するオン画素データ群にグループ化する。以下、領域内画像認識部１０１３により１つのグループと認識されたオン画素データ群により示される画像の各々を「領域内画像」と呼ぶ。領域内画像認識部１０１３は、認識した領域内画像の各々に対し識別ラベルを付加する。図２に示されるＬ１〜Ｌ４は、領域内画像認識部１０１３により付加された識別ラベルを示している。

制御部１０１は、領域内画像を所定領域外の連続部分にまで拡張する拡張領域内画像認識部１０１４を備えている。領域内画像認識部１０１３は識別ラベルを付加した領域内画像を示すデータ（以下、「領域内画像データ」と呼ぶ）を拡張領域内画像認識部１０１４に引き渡す。拡張領域内画像認識部１０１４は、領域内画像認識部１０１３から受け取った領域内画像データおよび２値画像データ１０２３を用いて、領域内画像の各々に関し、所定領域外に連続するオン画素群が存在するか否かを判定し、連続したオン画素群があるものに関しては、当該オン画素群を領域内画像に統合することにより領域内画像を拡張する。具体的には、図２に示されるように、識別ラベルＬ１の領域内画像が拡張領域内画像認識部１０１４により拡張される。以下、拡張領域内画像認識部１０１４による拡張処理の施された領域内画像を「拡張領域内画像」と呼ぶ。

制御部１０１は、１文字を示す画像データを文字認識装置１２に送信する画像データ出力部１０１５を備えている。拡張領域内画像認識部１０１４は拡張領域内画像を示す拡張領域内画像データを画像データ出力部１０１５に引き渡す。画像データ出力部１０１５は受け取った拡張領域内画像データを、１文字を示す画像データとして文字認識装置１２に対し送信する。

以上のように文字画像切出装置１０−１により切り出され文字認識装置１２に送信される画像データは、升目からはみ出して書かれた文字部分を含む画像を示すため、文字認識処理において高い精度の結果をもたらすものとなる。

［２．第２実施形態］
図４は、ユーザがタブレットＰＣ１１に表示される４文字分の升目に対し「榊原正義」なる文字列を筆記した場合に、従来技術により第１の升目から切り出される画像データ（図４（ａ））と、本発明の第２実施形態にかかる文字画像切出装置１０−２により第１の升目から切り出される画像データ（図４（ｂ））とを用いて、文字認識装置１２が文字認識処理を行った際に得られるテキストデータを比較して示した図である。

図４に示されるように、「榊」の文字の一部が升目から完全に外れている場合、従来技術によれば升目から外れている画像部分を含まない画像データが文字認識装置１２に対し出力されるため、その画像データを用いた文字認識は正しく行われない。これに対し、文字画像切出装置１０−２による場合、升目の外に配置されている画像であっても、升目の中に配置されている画像と近接している部分を含む画像データが文字認識装置１２に対し出力されるため、その画像データを用いた文字認識が正しく行わる可能性が高い。

図５は文字画像切出装置１０−２の構成を示したブロック図である。文字画像切出装置１０−２の構成および動作は多くの点で文字画像切出装置１０−１のそれらと共通しているため、以下、文字画像切出装置１０−２が文字画像切出装置１０−１と異なる点のみを説明する。また、以下の説明において参照する図において、文字画像切出装置１０−１の構成部に対応する構成部には文字画像切出装置１０−１において用いられたものと同じ符号が付されている。

文字画像切出装置１０−２の制御部１０１は領域内画像に対し膨張処理を行う膨張画像生成部２０１１を備えている。膨張画像生成部２０１１は、領域内画像認識部１０１３から領域内画像データを受け取り、受け取った領域内画像データにより示される領域内画像の各々の外輪を示すオン画素データに隣接するオフ画素データをオン画素データに書き換える処理を所定回数だけ繰り返すことにより、領域内画像の膨張を行う。以下、膨張画像生成部２０１１による膨張処理の施された領域内画像を「膨張領域内画像」と呼ぶ。

文字画像切出装置１０−２の制御部１０１は、文字画像切出装置１０−１の制御部１０１が備える拡張領域内画像認識部１０１４の代わりに拡張膨張領域内画像認識部２０１２を備えている。膨張画像生成部２０１１は膨張領域内画像を示す膨張領域内画像データを拡張膨張領域内画像認識部２０１２に引き渡す。

拡張膨張領域内画像認識部２０１２は膨張画像生成部２０１１から受け取った膨張領域内画像データおよび２値画像データ１０２３を用いて、膨張領域内画像の各々に関し、所定領域外に連続するオン画素群が存在するか否かを判定し、連続したオン画素群があるものに関しては、当該オン画素群を膨張領域内画像に統合することにより膨張領域内画像を拡張する。具体的には、図４に示されるように、識別ラベルＬ２の膨張領域内画像が拡張膨張領域内画像認識部２０１２により拡張される。以下、拡張膨張領域内画像認識部２０１２による拡張処理の施された領域内画像を「拡張膨張領域内画像」と呼ぶ。

拡張膨張領域内画像認識部２０１２は拡張膨張領域内画像を示す拡張膨張領域内画像データを画像データ出力部１０１５に引き渡す。画像データ出力部１０１５は受け取った拡張膨張領域内画像データを、１文字を示す画像データとして文字認識装置１２に対し送信する。

以上のように文字画像切出装置１０−２により切り出され文字認識装置１２に送信される画像データは、升目から外れて書かれた文字部分を含む画像を示すため、文字認識処理において高い精度の結果をもたらすものとなる。

ところで、拡張膨張領域内画像認識部２０１２により生成される拡張膨張領域内画像は、升目内の画像に関しては膨張処理が施され、升目外の画像に関しては膨張処理が施されていない。一般的に、オリジナルの画像を用いて文字認識が行われる場合の方が、膨張処理が施されている画像を用いて文字認識が行われる場合と比較して、高い精度の結果が得られる。そこで、文字画像切出装置１０−２に対し以下の変形を加えてもよい。

図６は、文字画像切出装置１０−２の制御部１０１に、拡張膨張領域内画像に対し収縮処理を行う収縮画像生成部２０１３を備えさせた場合の構成を示したブロック図である。収縮画像生成部２０１３は拡張膨張領域内画像認識部２０１２と画像データ出力部１０１５の間に介挿され、拡張膨張領域内画像認識部２０１２から拡張膨張領域内画像データを受け取り、受け取った拡張膨張領域内画像データにより示される拡張膨張領域内画像の各々の外輪を示すオン画素データをオフ画素データに書き換える処理を所定回数だけ繰り返すことにより、拡張膨張領域内画像の収縮を行う。以下、収縮画像生成部２０１３による収縮処理の施された拡張膨張領域内画像を「収縮拡張膨張領域内画像」と呼ぶ。

収縮拡張膨張領域内画像は、升目内の画像に関してはオリジナルの画像と同様の太さの画像を、また升目外の画像に関してはオリジナルの画像と比較して細い画像を含んでいる。一般的に文字認識処理においては、画像の特徴点を抽出するために、太さを持った画像を細線化する処理が行われるため、収縮拡張膨張領域内画像において升目外の画像がオリジナルの画像に比べ細い点は文字認識の精度にあまり悪影響を与えない。一方、収縮拡張膨張領域内画像に含まれる升目内の画像が拡張膨張領域内画像と比較してオリジナルに近似する太さである結果、より高い精度の文字認識をもたらす画像となる。

収縮画像生成部２０１３は、収縮拡張膨張領域内画像を示す収縮拡張膨張領域内画像データを画像データ出力部１０１５に引き渡す。画像データ出力部１０１５は受け取った収縮拡張膨張領域内画像データを、１文字を示す画像データとして文字認識装置１２に対し送信する。

また、図７は、文字画像切出装置１０−２の制御部１０１に、拡張膨張領域内画像と２値画像データ１０２３により示される画像との重複部分の画像を取り出す重複画像認識部２０１４を備えさせた場合の構成を示すブロック図である。重複画像認識部２０１４は拡張膨張領域内画像認識部２０１２と画像データ出力部１０１５の間に介挿され、拡張膨張領域内画像認識部２０１２から拡張膨張領域内画像データを受け取り、受け取った拡張膨張領域内画像データに含まれる画素データの各々に関し、当該画素データに対応する２値画像データ１０２３に含まれる画素データとの間の論理積を算出する。重複画像認識部２０１４により算出された論理積の結果を値とする画素データの集まりは、拡張膨張領域内画像と２値画像データ１０２３により示される画像との重複画像を示すデータである。

上記のように重複画像認識部２０１４により認識される重複画像は、オリジナルの画像の中から、拡張膨張領域内画像により占められる範囲に含まれる部分を取り出したものである。従って、膨張処理が施された拡張膨張領域内画像と比較して、より高い精度の文字認識をもたらす画像となる。

重複画像認識部２０１４は、重複画像を示すデータを画像データ出力部１０１５に引き渡す。画像データ出力部１０１５は受け取った重複画像を示すデータを、１文字を示す画像データとして文字認識装置１２に対し送信する。

［３．第３実施形態］
図８は、第２実施形態の場合と同様に、ユーザがタブレットＰＣ１１に表示される４文字分の升目に対し「榊原正義」なる文字列を筆記した場合に、本発明の第３実施形態にかかる文字画像切出装置１０−３により第１の升目から画像データが切り出される様子を示した図である。

図９は文字画像切出装置１０−３の構成を示したブロック図である。文字画像切出装置１０−３の構成および動作は多くの点で文字画像切出装置１０−２のそれらと共通しているため、以下、文字画像切出装置１０−３が文字画像切出装置１０−２と異なる点のみを説明する。また、以下の説明において参照する図において、文字画像切出装置１０−１もしくは文字画像切出装置１０−２の構成部に対応する構成部には文字画像切出装置１０−１もしくは文字画像切出装置１０−２において用いられたものと同じ符号が付されている。

文字画像切出装置１０−３の制御部１０１は領域内画像認識部１０１３の代わりに、２値画像データ１０２３に含まれる連続する画像部分を各々分離して認識する画像認識部３０１１を備えている。画像認識部３０１１は、２値画像データ１０２３に含まれるオン画素データを、互いに連続するオン画素データ群にグループ化し、各々のオン画素データを部分画像として認識する。画像認識部３０１１は、そのように認識した部分画像の各々に対し識別ラベルを付加する。画像認識部３０１１は識別ラベルを付加した部分画像を示すデータ（以下、「部分画像データ」と呼ぶ）を膨張画像生成部２０１１に引き渡す。

膨張画像生成部２０１１は受け取った部分画像データにより示される部分画像の各々に対し膨張処理を行い、膨張画像を生成する。文字画像切出装置１０−３の制御部１０１は、膨張処理により互いに連続することとなった部分画像を一つの部分画像とする連結膨張画像認識部３０１２を備えている。膨張画像生成部２０１１は膨張画像を示す膨張画像データを連結膨張画像認識部３０１２に引き渡す。連結膨張画像認識部３０１２は膨張画像データにより示される膨張画像を互いに連続する膨張画像群にグループ化し、グループ化した膨張画像群を連結して１つの画像として再認識する。以下、そのように連結された膨張画像群を「連結膨張画像」と呼ぶ。

文字画像切出装置１０−３の制御部１０１は、所定領域に一部もしくは全部が含まれる連結膨張画像を認識する領域内連結膨張画像認識部３０１３を備えている。領域内連結膨張画像認識部３０１３は連結膨張画像認識部３０１２から連結膨張画像を示す連結膨張画像データを受け取り、連結膨張画像データにより示される連結膨張画像のうち、領域データ１０２２により示される第１の升目の少なくとも一部を占めているものを特定する。以下、領域内連結膨張画像認識部３０１３により特定された連結膨張画像を「領域内連結膨張画像」と呼ぶ。

領域内連結膨張画像認識部３０１３は、領域内連結膨張画像を示す領域内連結膨張画像データを画像データ出力部１０１５に引き渡す。画像データ出力部１０１５は受け取った領域内連結膨張画像データを、１文字を示す画像データとして文字認識装置１２に対し送信する。

以上のように文字画像切出装置１０−３により切り出され文字認識装置１２に送信される画像データは、文字画像切出装置１０−２により切り出される画像データと同様に、升目から外れて書かれた文字部分を含む画像を示すため、文字認識処理において高い精度の結果をもたらすものとなる。

ところで、領域内連結膨張画像認識部３０１３により認識される領域内連結膨張画像は、升目の内外のいずれに関してもオリジナルの画像に膨張処理が施された画像である。そこで、より高い文字認識の精度をもたらす画像を生成するために、文字画像切出装置１０−３に対し以下の変形を加えてもよい。

図１０は、文字画像切出装置１０−３の制御部１０１に収縮画像生成部２０１３を備えさせた場合の構成を示すブロック図である。収縮画像生成部２０１３は領域内連結膨張画像認識部３０１３と画像データ出力部１０１５の間に介挿され、領域内連結膨張画像認識部３０１３から受け取った領域内連結膨張画像データにより示される領域内連結膨張画像に対し収縮処理を行い、収縮領域内連結膨張画像を生成する。収縮領域内連結膨張画像は、領域内連結膨張画像と比較して、オリジナルの画像と近似する太さであり、より高い精度の文字認識をもたらす。

収縮画像生成部２０１３は収縮領域内連結膨張画像を示す収縮領域内連結膨張画像データを画像データ出力部１０１５に引き渡す。画像データ出力部１０１５は受け取った収縮領域内連結膨張画像データを、１文字を示す画像データとして文字認識装置１２に対し送信する。

また、図１１は、文字画像切出装置１０−３の制御部１０１に重複画像認識部２０１４を備えさせた場合の構成を示すブロック図である。重複画像認識部２０１４は領域内連結膨張画像認識部３０１３と画像データ出力部１０１５の間に介挿され、領域内連結膨張画像認識部３０１３から受け取った領域内連結膨張画像データにより示される領域内連結膨張画像と２値画像データ１０２３により示される画像との重複部分の画像を取り出す。

上記のように重複画像認識部２０１４により認識される重複画像は、オリジナルの画像の中から、領域内連結膨張画像により占められる範囲に含まれる部分を取り出したものである。従って、膨張処理が施された領域内連結膨張画像と比較して、より高い精度の文字認識をもたらす画像となる。

［４．第４実施形態］
図１２は、第２実施形態および第３実施形態の場合と同様に、ユーザがタブレットＰＣ１１に表示される４文字分の升目に対し「榊原正義」なる文字列を筆記した場合に、本発明の第４実施形態にかかる文字画像切出装置１０−４により第１の升目から画像データが切り出される様子を示した図である。

図１３は文字画像切出装置１０−４の構成を示したブロック図である。文字画像切出装置１０−４の構成および動作は多くの点で文字画像切出装置１０−３のそれらと共通しているため、以下、文字画像切出装置１０−４が文字画像切出装置１０−３と異なる点のみを説明する。また、以下の説明において参照する図において、文字画像切出装置１０−１ないし文字画像切出装置１０−３の構成部に対応する構成部には文字画像切出装置１０−１ないし文字画像切出装置１０−３において用いられたものと同じ符号が付されている。

文字画像切出装置１０−４の制御部１０１は、文字画像切出装置１０−３が備える全ての構成部に加え、２値画像データ１０２３に示される画像データのうち、領域データ１０２２により示される升目に含まれる画像データの部分を取り出し、それらに含まれる連続する画像部分を各々分離し、領域内画像として認識する領域内画像認識部１０１３を備えている。領域内画像認識部１０１３は認識した領域内画像およびそれらに付した識別ラベルを示す領域内画像データを領域内連結膨張画像認識部３０１３に引き渡す。

文字画像切出装置１０−４の領域内連結膨張画像認識部３０１３は、連結膨張画像認識部３０１２から連結膨張画像を示す連結膨張画像データを受け取り、また領域内画像認識部１０１３から領域内画像データを受け取る。領域内連結膨張画像認識部３０１３は領域内画像データにより示される領域内画像の各々に関し、当該領域内画像に含まれる任意のオン画素を起点として選択する。領域内連結膨張画像認識部３０１３は、連結膨張画像データにより示される連結膨張画像に含まれる、先に選択した起点のオン画素に対応する位置のオン画素を特定し、特定したオン画素に連続するオン画素群を領域内連結膨張画像として認識する。

例えば、図１２に示される例によれば、連結膨張画像により示される「榊」の画像は、その文字を構成する左側のパーツ（Ｌ１１）は識別ラベルＬ１もしくはＬ２が付された領域内画像に含まれるオン画素を起点とした取り出し処理により領域内連結膨張画像として認識される。また、連結膨張画像により示される「榊」の画像の右側のパーツ（Ｌ１２）は識別ラベルＬ３が付された領域内画像に含まれるオン画素を起点とした取り出し処理により領域内連結膨張画像として認識される。

領域内連結膨張画像認識部３０１３は上記のように領域内連結膨張画像を認識すると、認識した領域内連結膨張画像を示す領域内連結膨張画像データを画像データ出力部１０１５に引き渡す。画像データ出力部１０１５は受け取った領域内連結膨張画像データを、１文字を示す画像データとして文字認識装置１２に対し送信する。

以上のように文字画像切出装置１０−４により切り出され文字認識装置１２に送信される画像データは、文字画像切出装置１０−３により切り出される画像データと同じ画像データとなり、升目から外れて書かれた文字部分を含む画像を示すため、文字認識処理において高い精度の結果をもたらすものとなる。

ところで、文字画像切出装置１０−４の領域内連結膨張画像認識部３０１３により認識される領域内連結膨張画像は、文字画像切出装置１０−３の文字画像切出装置１０−４により認識される領域内連結膨張画像と同じものであるため、文字画像切出装置１０−４に対し、文字画像切出装置１０−３に関し上述したものと同様の変形を加えてもよい。

すなわち、文字画像切出装置１０−４の領域内連結膨張画像認識部３０１３と画像データ出力部１０１５の間に収縮画像生成部２０１３を介挿し、領域内連結膨張画像に収縮処理を施した収縮領域内連結膨張画像を生成し、収縮領域内連結膨張画像を示す収縮領域内連結膨張画像データを画像データ出力部１０１５から出力するようにしてもよい。また、文字画像切出装置１０−４の領域内連結膨張画像認識部３０１３と画像データ出力部１０１５の間に重複画像認識部２０１４を介挿し、領域内連結膨張画像と２値画像データ１０２３により示される画像との重複画像を認識し、重複画像を示すデータを画像データ出力部１０１５から出力するようにしてもよい。

［５．第５実施形態］
図１４は、ユーザがタブレットＰＣ１１に表示される４文字分の升目に対し「榊原正義」なる文字列を筆記した場合に、従来技術により第４の升目から切り出される画像データ（図１４（ａ））と、本発明の第５実施形態にかかる文字画像切出装置１０−５により第４の升目から切り出される画像データ（図１４（ｂ））とを用いて、文字認識装置１２が文字認識処理を行った際に得られるテキストデータを比較して示した図である。

図１５は文字画像切出装置１０−５の構成を示したブロック図である。文字画像切出装置１０−５の構成および動作は多くの点で文字画像切出装置１０−１のそれらと共通しているため、以下、文字画像切出装置１０−５が文字画像切出装置１０−１と異なる点のみを説明する。また、以下の説明において参照する図において、文字画像切出装置１０−１ないし文字画像切出装置１０−４の構成部に対応する構成部には文字画像切出装置１０−１ないし文字画像切出装置１０−４において用いられたものと同じ符号が付されている。

文字画像切出装置１０−５の制御部１０１は、処理対象の領域を升目から拡張領域内画像に外接する矩形の領域に拡張する拡張領域認識部５０１１を備えている。文字画像切出装置１０−５の制御部１０１が備える拡張領域内画像認識部１０１４は、領域内画像認識部１０１３から升目の中に配置された領域内画像を示す領域内画像データを受け取り、受け取った領域内画像データおよび２値画像データ１０２３を用いて拡張領域内画像データを生成すると、生成した拡張領域内画像データを拡張領域認識部５０１１に引き渡す。

拡張領域認識部５０１１は、拡張領域内画像認識部１０１４から受け取った拡張領域内画像データにより示される拡張領域内画像の集まりに外接する矩形領域を特定する。以下、そのように特定された領域を「拡張領域」と呼ぶ。図１４において、領域Ａ０は領域データ１０２２により示される第４の升目の領域を示し、領域Ａ１は拡張領域を示す。拡張領域認識部５０１１は、拡張領域を示す拡張領域データを領域内画像認識部１０１３に引き渡す。

領域内画像認識部１０１３は、拡張領域認識部５０１１から拡張領域データを受け取ると、２値画像データ１０２３に含まれるオン画素データのうち、領域データ１０２２により示される升目の領域に代えて、領域内画像の認識処理を再度実行する。その結果、図１４において、既に認識されていた識別ラベルＬ１〜Ｌ３の付された領域内画像に加え、新たに識別ラベルＬ４の付された領域内画像が領域内画像認識部１０１３により認識される。領域内画像認識部１０１３はそのように認識した領域内画像を示す領域内画像データを拡張領域内画像認識部１０１４に引き渡す。

拡張領域内画像認識部１０１４は領域内画像認識部１０１３から拡張領域に関し生成した領域内画像データを受け取ると、受け取った領域内画像データにより示される領域内画像の拡張処理を再実行する。その結果、図１４において、識別ラベルＬ４の付された領域内画像が拡張される。拡張領域内画像認識部１０１４はそのように認識した拡張領域内画像を示す拡張領域内画像データを画像データ出力部１０１５に引き渡す。画像データ出力部１０１５は受け取った拡張領域内画像データを、１文字を示す画像データとして文字認識装置１２に対し送信する。

上記の説明においては、拡張領域認識部５０１１による拡張領域の認識処理、領域内画像認識部１０１３による領域内画像の認識処理および拡張領域内画像認識部１０１４による拡張領域内画像の認識処理が１回だけ繰り返されるものとしたが、繰り返し回数を所定の複数回としてもよい。また、拡張領域内画像認識部１０１４による領域内画像の拡張もしくは拡張領域認識部５０１１による領域の拡張が行われなくなるまで、それらの処理を繰り返すようにしてもよい。

以上のように文字画像切出装置１０−５により切り出され文字認識装置１２に送信される画像データは、例えば文字画像切出装置１０−１における拡張処理によっては切り出されないような、升目外に分離して書かれた文字部分をも含む画像を示すため、文字認識処理において高い精度の結果をもたらすものとなる。

ところで、文字画像切出装置１０−５における領域拡張による認識処理の繰り返し実行を、文字画像切出装置１０−２ないし文字画像切出装置１０−４の拡張処理等と組み合わせてもよい。

［６．第６実施形態］
図１６は、ユーザがタブレットＰＣ１１に表示される４文字分の升目に対し「榊原正義」なる文字列を筆記した場合に、本発明の第６実施形態にかかる文字画像切出装置１０−６により第１の升目から画像データが切り出される様子を示した図である。この例においては、第１の升目には、第２の升目に書かれるべき文字の一部がはみ出して書かれているため、第１の升目に含まれる画像を用いて文字認識処理を行った場合、高い文字認識の精度は期待できない。これに対し、文字画像切出装置１０−６は近隣の升目からはみ出してきた画像部分を除去することにより、高い精度の文字認識をもたらす画像の切り出しを行う。

図１７は、文字画像切出装置１０−６の構成を示したブロック図である。文字画像切出装置１０−６の構成および動作は多くの点で文字画像切出装置１０−１のそれらと共通しているため、以下、文字画像切出装置１０−６が文字画像切出装置１０−１と異なる点のみを説明する。また、以下の説明において参照する図において、文字画像切出装置１０−１ないし文字画像切出装置１０−５の構成部に対応する構成部には文字画像切出装置１０−１ないし文字画像切出装置１０−５において用いられたものと同じ符号が付されている。

文字画像切出装置１０−６の制御部１０１は、文字画像切出装置１０−１の制御部１０１が備える拡張領域内画像認識部１０１４に代えて、領域内画像のうち升目外に連続するオン画素群を有するものの中から、近隣の升目からはみ出してきた部分を示すものと思われる領域内画像を画像データ出力部１０１５に引き渡す領域内画像の集まりから除外する領域内画像除外部６０１１を備えている。

領域内画像認識部１０１３は領域内画像データを領域内画像除外部６０１１に引き渡す。領域内画像除外部６０１１は受け取った領域内画像データおよび２値画像データ１０２３を用いて、領域内画像の各々に関し、升目外に連続するオン画素群が存在するか否かを判定し、連続したオン画素群があるもの（図１６における、識別ラベルＬ１およびＬ５の付された領域内画像）に関しては、升目内の領域内画像に含まれるオン画素の数（もしくはその面積）と、領域内画像に連続する升目外のオン画素群に含まれるオン画素の数（もしくはその面積）とを比較する。領域内画像除外部６０１１は、升目内のオン画素の数が升目外のオン画素の数よりも少ない場合（図１６における、識別ラベルＬ５の付された領域内画像）、その領域内画像を画像データ出力部１０１５に出力する領域内画像の集まりから除外する。

すなわち、領域内画像除外部６０１１は、升目外に連続するオン画素群を有しない領域内画像と、升目外に連続するオン画素群を有するが升目外に連続するオン画素群の占める面積よりも広い面積を占める領域内画像とを示す領域内画像データを、画像データ出力部１０１５に引き渡す。画像データ出力部１０１５は受け取った領域内画像データを、１文字を示す画像データとして文字認識装置１２に対し送信する。

以上のように文字画像切出装置１０−６により切り出され文字認識装置１２に送信される画像データは、近隣の升目からはみ出した文字部分が除外された画像を示すため、文字認識処理において高い精度の結果をもたらすものとなる。

ところで、文字画像切出装置１０−６における領域内画像の除外処理を、文字画像切出装置１０−１ないし文字画像切出装置１０−５の拡張処理等と組み合わせてもよい。例えば、図１８は文字画像切出装置１０−６に文字画像切出装置１０−１における領域内画像の拡張処理を組み合わせた場合の構成を示したブロック図である。

図１８に示される構成の文字画像切出装置１０−６においては、領域内画像除外部６０１１と画像データ出力部１０１５の間に拡張領域内画像認識部１０１４が介挿されている。この場合、拡張領域内画像認識部１０１４は領域内画像除外部６０１１から、除外されなかった領域内画像を示す領域内画像データを受け取り、受け取った領域内画像データにより示される領域内画像に対し拡張処理を行い、拡張領域内画像を認識する。拡張領域内画像認識部１０１４は認識した拡張領域内画像を示す拡張領域内画像データを、画像データ出力部１０１５に引き渡す。画像データ出力部１０１５は受け取った拡張領域内画像データを、１文字を示す画像データとして文字認識装置１２に対し送信する。

このように画像データ出力部１０１５から送信される画像データは、近隣の升目からはみ出した文字部分が除外され、かつ升目外にはみ出した文字部分を取り込んだ画像を示すため、文字認識処理においてより高い精度の結果をもたらすものとなる。

また、文字画像切出装置１０−６の領域内画像除外部６０１１が升目の内外に配置されるオン画素数を基準として領域内画像を除外する代わりに、例えば領域内画像除外部６０１１は升目の内外にまたがる拡張領域内画像を含めた画像データと除外した画像データの２セットの画像データを、画像データ出力部１０１５を介して文字認識装置１２に送信するようにしてもよい。その場合、文字認識装置１２においてそれらの画像データの各々に対し文字認識処理を行い、認識結果を登録された単語を示すテキストデータ等と比較することにより、正しいと思われる認識結果を採用するようにしてもよい。

ところで、上述した文字画像切出装置１０は、いずれも専用のハードウェアにより実現されてもよいし、汎用的なＰＣにアプリケーションプログラムに従った処理を実行させることにより実現されてもよい。

また、上述した実施形態においては、文字認識システム１は文字画像切出装置１０、タブレットＰＣ１１および文字認識装置１２を互いに接続することにより実現されるものとして説明したが、それらの配置は任意に変更可能である。例えば、文字認識装置１２を文字画像切出装置１０と同じ筐体内に配置したり、文字画像切出装置１０をタブレットＰＣ１１により実現するようにしたりしてもよい。また、文字画像切出装置１０とタブレットＰＣ１１および文字画像切出装置１０と文字認識装置１２をネットワークを介して相互に接続するようにしてもよい。

また、上述した実施形態においては、文字画像切出装置１０に対し、タブレットＰＣ１１から文字列を示す画像データが入力されるものとして説明したが、例えばタブレットＰＣ１１の代わりに、画像を光学的に読み取り画像データを生成するスキャナ装置を文字画像切出装置１０に接続し、紙面に書かれた文字列をスキャナ装置に読み取らせ、スキャナ装置により生成された画像データを文字画像切出装置１０に入力させるようにしてもよい。その場合、例えば、升目を示す図形を例えば朱色等で色付けしておき、文字画像切出装置１０において色フィルタにより升目を示す図形を抽出後、図形認識処理を行い升目の領域を特定するようにすればよい。もしくは、図形認識処理のみによって升目の領域を特定するようにしてもよい。

また、上述した実施形態においては、手書きによる文字列から１文字分の画像を切り出す場合について説明したが、升目に対しずれて印字された活字等に関しても本発明にかかる文字認識システムが利用可能であることは言うまでもない。

本発明の実施形態にかかる文字認識システムの構成を示したブロック図である。本発明の第１実施形態にかかる文字画像切出装置により画像データが切り出される様子を示した図である。本発明の第１実施形態にかかる文字画像切出装置の構成を示したブロック図である。本発明の第２実施形態にかかる文字画像切出装置により画像データが切り出される様子を示した図である。本発明の第２実施形態にかかる文字画像切出装置の構成を示したブロック図である。本発明の第２実施形態にかかる文字画像切出装置の構成を示したブロック図である。本発明の第２実施形態にかかる文字画像切出装置の構成を示したブロック図である。本発明の第３実施形態にかかる文字画像切出装置により画像データが切り出される様子を示した図である。本発明の第３実施形態にかかる文字画像切出装置の構成を示したブロック図である。本発明の第３実施形態にかかる文字画像切出装置の構成を示したブロック図である。本発明の第３実施形態にかかる文字画像切出装置の構成を示したブロック図である。本発明の第４実施形態にかかる文字画像切出装置により画像データが切り出される様子を示した図である。本発明の第４実施形態にかかる文字画像切出装置の構成を示したブロック図である。本発明の第５実施形態にかかる文字画像切出装置により画像データが切り出される様子を示した図である。本発明の第５実施形態にかかる文字画像切出装置の構成を示したブロック図である。本発明の第６実施形態にかかる文字画像切出装置により画像データが切り出される様子を示した図である。本発明の第６実施形態にかかる文字画像切出装置の構成を示したブロック図である。本発明の第６実施形態にかかる文字画像切出装置の構成を示したブロック図である。

符号の説明

１…文字認識システム、１０…文字画像切出装置、１１…タブレットＰＣ、１２…文字認識装置、１０１…制御部、１０２…記憶部、１０１１…画像データ入力部、１０１２…２値化部、１０１３…領域内画像認識部、１０１４…拡張領域内画像認識部、１０１５…画像データ出力部、１０２１…画像データ、１０２２…領域データ、１０２３…２値画像データ、２０１１…膨張画像生成部、２０１２…拡張膨張領域内画像認識部、２０１３…収縮画像生成部、２０１４…重複画像認識部、３０１１…画像認識部、３０１２…連結膨張画像認識部、３０１３…領域内連結膨張画像認識部、５０１１…拡張領域認識部、６０１１…領域内画像除外部

Claims

平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する画像データ取得手段と、
前記画像データ取得手段により取得された画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する領域内画像認識手段と、
前記領域内画像認識手段により認識された領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する判定手段と、
前記判定手段により前記オン画素の集まりが存在する場合には当該オン画素の集まりを当該領域内画像に統合した画像を拡張領域内画像として認識し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該領域内画像を拡張領域内画像として認識する拡張領域内画像認識手段と、
前記拡張領域内画像認識手段により認識された拡張領域内画像を示すデータを、１文字を表す画像データとして出力する出力手段と
を備えることを特徴とする文字画像切出装置。
平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する画像データ取得手段と、
前記画像データ取得手段により取得された画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する領域内画像認識手段と、
前記領域内画像認識手段により認識された領域内画像に対し膨張処理を行い、膨張領域内画像を生成する膨張画像生成手段と、
前記膨張画像生成手段により生成された膨張領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する判定手段と、
前記判定手段により前記オン画素の集まりが存在する場合には当該オン画素の集まりを当該膨張領域内画像に統合した画像を拡張膨張領域内画像として認識し、当該膨張領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該膨張領域内画像を拡張膨張領域内画像として認識する拡張膨張領域内画像認識手段と、
前記拡張膨張領域内画像認識手段により認識された拡張膨張領域内画像を示すデータを、１文字を表す画像データとして出力する出力手段と
を備えることを特徴とする文字画像切出装置。
前記拡張膨張領域内画像認識手段により認識された拡張膨張領域内画像に対し収縮処理を行い、収縮拡張膨張領域内画像を生成する収縮画像生成手段
をさらに備え、
前記出力手段は、拡張膨張領域内画像を示すデータの代わりに、前記収縮画像生成手段により生成された収縮拡張膨張領域内画像を示すデータを出力する
ことを特徴とする請求項２に記載の文字画像切出装置。
平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する画像データ取得手段と、
前記画像データ取得手段により取得された画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する領域内画像認識手段と、
前記領域内画像認識手段により認識された領域内画像に対し膨張処理を行い、膨張領域内画像を生成する膨張画像生成手段と、
前記膨張画像生成手段により生成された膨張領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する判定手段と、
前記判定手段により前記オン画素の集まりが存在する場合には当該オン画素の集まりを当該膨張領域内画像に統合した画像を拡張膨張領域内画像として認識し、当該膨張領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該膨張領域内画像を拡張膨張領域内画像として認識する拡張膨張領域内画像認識手段と、
前記画像データ取得手段により取得された画像データにより示される画像と前記拡張膨張領域内画像認識手段により認識された拡張膨張領域内画像との両方においてオン画素である画素の集まりを重複画像として認識する重複画像認識手段と、
前記重複画像認識手段により認識された重複画像を示すデータを、１文字を表す画像データとして出力する出力手段と
を備えることを特徴とする文字画像切出装置。
平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する画像データ取得手段と、
前記画像データ取得手段により取得された画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する領域内画像認識手段と、
前記領域内画像認識手段により認識された領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する判定手段と、
前記判定手段により前記オン画素の集まりが存在する場合には当該オン画素の集まりを当該領域内画像に統合した画像を拡張領域内画像として認識し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該領域内画像を拡張領域内画像として認識する拡張領域内画像認識手段と、
前記拡張領域内画像認識手段により認識された拡張領域内画像に外接する前記平面上の所定の形状の領域を拡張領域として認識する拡張領域認識手段と、
前記拡張領域認識手段により認識された拡張領域内に含まれるオン画素の集まりにより示される画像を示すデータを、１文字を表す画像データとして出力する出力手段と
を備えることを特徴とする文字画像切出装置。
前記領域内画像認識手段は、前記拡張領域認識手段により拡張領域の認識が行われた後、前記拡張領域認識手段により認識された拡張領域を前記領域として前記領域内画像の認識処理を再実行し、
前記拡張領域内画像認識手段は、前記領域内画像認識手段による認識処理の再実行により認識された領域内画像に対し前記拡張領域内画像の認識処理を再実行し、
前記拡張領域認識手段は、前記拡張領域内画像認識手段による認識処理の再実行により認識された拡張領域内画像に対し前記拡張領域の認識処理を再実行し、
前記出力手段は、前記拡張領域認識手段による認識処理の再実行により認識された拡張領域内に含まれるオン画素の集まりにより示される画像を示すデータを、前記１文字を表す画像データとして出力する
ことを特徴とする請求項５に記載の文字画像切出装置。
平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する画像データ取得手段と、
前記画像データ取得手段により取得された画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する領域内画像認識手段と、
前記領域内画像認識手段により認識された１以上の領域内画像のうち少なくとも１の領域内画像に関し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する判定手段と、
前記判定手段により前記オン画素の集まりが存在する場合、当該領域内画像を前記領域内画像認識手段により認識された領域内画像の集まりから除外する領域内画像除外手段と、
前記領域内画像認識手段により認識された領域内画像のうち前記領域内画像除外手段により除外されなかった領域内画像の集まりを、１文字を表す画像データとして出力する出力手段と
を備えることを特徴とする文字画像切出装置。
前記領域内画像除外手段は、１の領域内画像に関し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在する場合、当該オン画素の集まりの占める面積よりも当該１の領域内画像の占める面積が狭いときには、当該１の領域内画像を前記領域内画像認識手段により認識された領域内画像の集まりから除外し、当該オン画素の集まりの占める面積よりも当該１の領域内画像の占める面積が広いときには、当該１の領域内画像を前記領域内画像の集まりから除外しない
ことを特徴とする請求項７に記載の文字画像切出装置。
前記領域内画像除外手段により除外されなかった領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在する場合には当該オン画素の集まりを当該領域内画像に統合した画像を拡張領域内画像として認識し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該領域内画像を拡張領域内画像として認識する拡張領域内画像認識手段
をさらに備え、
前記出力手段は、前記拡張領域内画像認識手段により認識された拡張領域内画像を示すデータを、前記１文字を表す画像データとして出力する
ことを特徴とする請求項８に記載の文字画像切出装置。
平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する処理と、
取得した画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する処理と、
認識した領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する処理と、
前記オン画素の集まりが存在する場合には当該オン画素の集まりを当該領域内画像に統合した画像を拡張領域内画像として認識し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該領域内画像を拡張領域内画像として認識する処理と、
認識した拡張領域内画像を示すデータを、１文字を表す画像データとして出力する処理と
をコンピュータに実行させることを特徴とするプログラム。
平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する処理と、
取得した画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する処理と、
認識された１以上の領域内画像のうち少なくとも１の領域内画像に関し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する処理と、
前記オン画素の集まりが存在する場合、当該領域内画像を認識した領域内画像の集まりから除外する処理と、
認識した領域内画像のうち除外しなかった領域内画像の集まりを、１文字を表す画像データとして出力する処理と
をコンピュータに実行させることを特徴とするプログラム。