Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP4830331B2 - 文字画像切出装置およびプログラム - Google Patents
[go: Go Back, main page]

JP4830331B2 - 文字画像切出装置およびプログラム - Google Patents

文字画像切出装置およびプログラム Download PDF

Info

Publication number
JP4830331B2
JP4830331B2 JP2005092520A JP2005092520A JP4830331B2 JP 4830331 B2 JP4830331 B2 JP 4830331B2 JP 2005092520 A JP2005092520 A JP 2005092520A JP 2005092520 A JP2005092520 A JP 2005092520A JP 4830331 B2 JP4830331 B2 JP 4830331B2
Authority
JP
Japan
Prior art keywords
image
region
area
pixels
expansion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005092520A
Other languages
English (en)
Other versions
JP2006277092A (ja
Inventor
俊哉 小山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2005092520A priority Critical patent/JP4830331B2/ja
Publication of JP2006277092A publication Critical patent/JP2006277092A/ja
Application granted granted Critical
Publication of JP4830331B2 publication Critical patent/JP4830331B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Description

本発明は、文字認識処理に用いられる文字画像の切り出し技術に関する。
文字を示す画像データから抽出した特徴点と、予めデータベースに登録してある文字の特徴点とを比較することにより、画像データにより示される文字を認識し、認識した文字を示すテキストデータを生成する技術がある。
上記のような文字認識処理において、画像データが複数の文字を示す場合、その画像データから各々の文字を示す画像データを切り出すことが必要となる。すなわち、画像データに含まれる連続したオン画素群のいずれが1つの文字を構成するものであるかを特定する必要がある。そのような文字画像の切り出し技術を開示したものとして、例えば特許文献1がある。
特開平10−207985号公報
特許文献1に開示の技術によれば、各々のオン画素群を1つの文字の構成要素と仮定して文字認識処理を行った場合の結果および隣接する2以上のオン画素群を1つの文字の構成要素と仮定して文字認識処理を行った場合の結果を、単語辞書に登録されている単語と照合することにより、いずれの結果が正しいものであるかを特定する。
上記の従来技術による場合、文字認識処理が複数回行われる上に、文字認識処理の結果を単語と照合する処理が必要となるため、1文字を示す画像データの切り出しに時間がかかる、という問題がある。また、予め単語辞書の整備が必要であり、かつ単語辞書の記憶領域の確保も必要である。
上述の事情に鑑み、本発明は簡便かつ高速に画像データから各々の文字部分を切り出す手段を提供することを目的とする。
上述の課題を解決するため、本発明は、平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する画像データ取得手段と、前記画像データ取得手段により取得された画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する領域内画像認識手段と、前記領域内画像認識手段により認識された領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する判定手段と、前記判定手段により前記オン画素の集まりが存在する場合には当該オン画素の集まりを当該領域内画像に統合した画像を拡張領域内画像として認識し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該領域内画像を拡張領域内画像として認識する拡張領域内画像認識手段と、前記拡張領域内画像認識手段により認識された拡張領域内画像を示すデータを、1文字を表す画像データとして出力する出力手段とを備えることを特徴とする文字画像切出装置を提供する。
また、本発明は、平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する画像データ取得手段と、前記画像データ取得手段により取得された画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する領域内画像認識手段と、前記領域内画像認識手段により認識された領域内画像に対し膨張処理を行い、膨張領域内画像を生成する膨張画像生成手段と、前記膨張画像生成手段により生成された膨張領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する判定手段と、前記判定手段により前記オン画素の集まりが存在する場合には当該オン画素の集まりを当該膨張領域内画像に統合した画像を拡張膨張領域内画像として認識し、当該膨張領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該膨張領域内画像を拡張膨張領域内画像として認識する拡張膨張領域内画像認識手段と、前記拡張膨張領域内画像認識手段により認識された拡張膨張領域内画像を示すデータを、1文字を表す画像データとして出力する出力手段とを備えることを特徴とする文字画像切出装置を提供する。
好ましい態様において、前記文字画像切出装置は前記拡張膨張領域内画像認識手段により認識された拡張膨張領域内画像に対し収縮処理を行い、収縮拡張膨張領域内画像を生成する収縮画像生成手段をさらに備え、前記出力手段は、拡張膨張領域内画像を示すデータの代わりに、前記収縮画像生成手段により生成された収縮拡張膨張領域内画像を示すデータを出力するように構成されてもよい。
また、本発明は、平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する画像データ取得手段と、前記画像データ取得手段により取得された画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する領域内画像認識手段と、前記領域内画像認識手段により認識された領域内画像に対し膨張処理を行い、膨張領域内画像を生成する膨張画像生成手段と、前記膨張画像生成手段により生成された膨張領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する判定手段と、前記判定手段により前記オン画素の集まりが存在する場合には当該オン画素の集まりを当該膨張領域内画像に統合した画像を拡張膨張領域内画像として認識し、当該膨張領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該膨張領域内画像を拡張膨張領域内画像として認識する拡張膨張領域内画像認識手段と、前記画像データ取得手段により取得された画像データにより示される画像と前記拡張膨張領域内画像認識手段により認識された拡張膨張領域内画像との両方においてオン画素である画素の集まりを重複画像として認識する重複画像認識手段と、前記重複画像認識手段により認識された重複画像を示すデータを、1文字を表す画像データとして出力する出力手段とを備えることを特徴とする文字画像切出装置を提供する。
また、本発明は、平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する画像データ取得手段と、前記画像データ取得手段により取得された画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する領域内画像認識手段と、前記領域内画像認識手段により認識された領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する判定手段と、前記判定手段により前記オン画素の集まりが存在する場合には当該オン画素の集まりを当該領域内画像に統合した画像を拡張領域内画像として認識し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該領域内画像を拡張領域内画像として認識する拡張領域内画像認識手段と、前記拡張領域内画像認識手段により認識された拡張領域内画像に外接する前記平面上の所定の形状の領域を拡張領域として認識する拡張領域認識手段と、前記拡張領域認識手段により認識された拡張領域内に含まれるオン画素の集まりにより示される画像を示すデータを、1文字を表す画像データとして出力する出力手段とを備えることを特徴とする文字画像切出装置を提供する。
好ましい態様において、前記文字画像切出装置の前記領域内画像認識手段は、前記拡張領域認識手段により拡張領域の認識が行われた後、前記拡張領域認識手段により認識された拡張領域を前記領域として前記領域内画像の認識処理を再実行し、前記拡張領域内画像認識手段は、前記領域内画像認識手段による認識処理の再実行により認識された領域内画像に対し前記拡張領域内画像の認識処理を再実行し、前記拡張領域認識手段は、前記拡張領域内画像認識手段による認識処理の再実行により認識された拡張領域内画像に対し前記拡張領域の認識処理を再実行し、前記出力手段は、前記拡張領域認識手段による認識処理の再実行により認識された拡張領域内に含まれるオン画素の集まりにより示される画像を示すデータを、前記1文字を表す画像データとして出力するように構成されてもよい。
また、本発明は、平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する画像データ取得手段と、前記画像データ取得手段により取得された画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する領域内画像認識手段と、前記領域内画像認識手段により認識された1以上の領域内画像のうち少なくとも1の領域内画像に関し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する判定手段と、前記判定手段により前記オン画素の集まりが存在する場合、当該領域内画像を前記領域内画像認識手段により認識された領域内画像の集まりから除外する領域内画像除外手段と、前記領域内画像認識手段により認識された領域内画像のうち前記領域内画像除外手段により除外されなかった領域内画像の集まりを、1文字を表す画像データとして出力する出力手段とを備えることを特徴とする文字画像切出装置を提供する。
好ましい態様において、前記文字画像切出装置の前記領域内画像除外手段は、1の領域内画像に関し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在する場合、当該オン画素の集まりの占める面積よりも当該1の領域内画像の占める面積が狭いときには、当該1の領域内画像を前記領域内画像認識手段により認識された領域内画像の集まりから除外し、当該オン画素の集まりの占める面積よりも当該1の領域内画像の占める面積が広いときには、当該1の領域内画像を前記領域内画像の集まりから除外しないように構成されてもよい。
また、他の好ましい態様において、前記文字画像切出装置は前記領域内画像除外手段により除外されなかった領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在する場合には当該オン画素の集まりを当該領域内画像に統合した画像を拡張領域内画像として認識し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該領域内画像を拡張領域内画像として認識する拡張領域内画像認識手段をさらに備え、前記出力手段は、前記拡張領域内画像認識手段により認識された拡張領域内画像を示すデータを、前記1文字を表す画像データとして出力するように構成されてもよい。
また、本発明は、上記いずれかに記載の前記文字画像切出装置が行う処理と同様の処理をコンピュータに実行させることを特徴とするプログラムを提供する。
本発明によれば、升目からはみ出して書かれた文字を示す画像から、正しく1文字を示す画像が切り出されるため、高い精度の文字認識が可能となる。
[実施形態]
以下、本発明の好適な実施形態を説明する。図1は以下に説明する実施形態にかかる文字認識システム1の構成を示したブロック図である。文字認識システム1は、複数の文字を示す画像データから各々の文字を示す画像データを切り出して送信する文字画像切出装置10と、文字画像切出装置10に対し複数の文字を示す画像データを送信するタブレットPC(Personal Computer)11と、文字画像切出装置10から送信される各々の文字を示す画像データに対し文字認識処理を行い認識した文字を示すテキストデータを生成する文字認識装置12を備えている。
タブレットPC11は、液晶ディスプレイに積層されたペンタブレット型入力デバイスを備え、ユーザが液晶ディスプレイに表示される升目に対しペン型のスタイラスを用いて筆記動作を行うと、ペンタブレット型入力デバイスがその筆記動作における筆圧の加えられた位置および筆圧の大きさを測定し、それらの測定値に基づきユーザにより書かれた文字を示す画像データを生成する。
[1.第1実施形態]
図2は、ユーザがタブレットPC11に表示される4文字分の升目に対し「榊原正義」なる文字列を筆記した場合に、従来技術により第2の升目から切り出される画像データ(図2(a))と、本発明の第1実施形態にかかる文字画像切出装置10−1により第2の升目から切り出される画像データ(図2(b))とを用いて、文字認識装置12が文字認識処理を行った際に得られるテキストデータを比較して示した図である。
図2に示されるように、升目から「原」の文字の一部がはみ出して書かれている場合、従来技術によれば升目からはみ出した画像部分を含まない画像データが文字認識装置12に対し出力されるため、その画像データを用いた文字認識が正しく行われない場合が多い。これに対し、文字画像切出装置10−1による場合、升目の外に配置されている画像であっても、升目の中に配置されている画像と連続している部分を含む画像データが文字認識装置12に対し出力されるため、その画像データを用いた文字認識が正しく行わる可能性が従来技術による場合と比較して高い。
図3は文字画像切出装置10−1の構成を示したブロック図である。文字画像切出装置10−1は、文字画像切出装置10−1の構成部を制御する制御部101と、制御部101による各種処理を指示するプログラムおよび各種データを記憶するとともに制御部101のワークエリアとして用いられる記憶部102を備えている。
制御部101は、タブレットPC11から文字列を示す画像データと、タブレットPC11において表示される升目の各々の領域を示す領域データとを受信する画像データ入力部1011を備えている。画像データ入力部1011はタブレットPC11から受信した画像データおよび領域データをそれぞれ記憶部102に画像データ1021および領域データ1022として記憶する。画像データ1021は、平面上に等間隔で配置された画素に対応する画素データの集合であり、各画素データには例えば彩度データ、明度データおよび色相データが含まれている。
制御部101は画像データ1021により示される画像データを、白黒の2値画像データに変換する2値化部1012を備えている。2値化部1012は、画像データ1021に含まれる画素データのうち明度データが所定の閾値を超えるものを値「1」をとるオン画素データ、それ以外を値「0」をとるオフ画素データに変換することにより、2値画像データを生成する。2値化部1012は生成した2値画像データを2値画像データ1023として記憶部102に記憶する。
制御部101は、2値画像データ1023により示される画素画像データのうち、領域データ1022により示される各々の升目の領域に含まれる画像データの部分を取り出し、それらに含まれる連続する画像部分を各々分離して認識する領域内画像認識部1013を備えている。以下、第2の升目の領域に含まれる画像データに関し、文字画像切出装置10−1において行われる処理を説明する。領域内画像認識部1013は、第2の升目の領域(以下、「所定領域」と呼ぶ)に含まれるオン画素データを、互いに連続するオン画素データ群にグループ化する。以下、領域内画像認識部1013により1つのグループと認識されたオン画素データ群により示される画像の各々を「領域内画像」と呼ぶ。領域内画像認識部1013は、認識した領域内画像の各々に対し識別ラベルを付加する。図2に示されるL1〜L4は、領域内画像認識部1013により付加された識別ラベルを示している。
制御部101は、領域内画像を所定領域外の連続部分にまで拡張する拡張領域内画像認識部1014を備えている。領域内画像認識部1013は識別ラベルを付加した領域内画像を示すデータ(以下、「領域内画像データ」と呼ぶ)を拡張領域内画像認識部1014に引き渡す。拡張領域内画像認識部1014は、領域内画像認識部1013から受け取った領域内画像データおよび2値画像データ1023を用いて、領域内画像の各々に関し、所定領域外に連続するオン画素群が存在するか否かを判定し、連続したオン画素群があるものに関しては、当該オン画素群を領域内画像に統合することにより領域内画像を拡張する。具体的には、図2に示されるように、識別ラベルL1の領域内画像が拡張領域内画像認識部1014により拡張される。以下、拡張領域内画像認識部1014による拡張処理の施された領域内画像を「拡張領域内画像」と呼ぶ。
制御部101は、1文字を示す画像データを文字認識装置12に送信する画像データ出力部1015を備えている。拡張領域内画像認識部1014は拡張領域内画像を示す拡張領域内画像データを画像データ出力部1015に引き渡す。画像データ出力部1015は受け取った拡張領域内画像データを、1文字を示す画像データとして文字認識装置12に対し送信する。
以上のように文字画像切出装置10−1により切り出され文字認識装置12に送信される画像データは、升目からはみ出して書かれた文字部分を含む画像を示すため、文字認識処理において高い精度の結果をもたらすものとなる。
[2.第2実施形態]
図4は、ユーザがタブレットPC11に表示される4文字分の升目に対し「榊原正義」なる文字列を筆記した場合に、従来技術により第1の升目から切り出される画像データ(図4(a))と、本発明の第2実施形態にかかる文字画像切出装置10−2により第1の升目から切り出される画像データ(図4(b))とを用いて、文字認識装置12が文字認識処理を行った際に得られるテキストデータを比較して示した図である。
図4に示されるように、「榊」の文字の一部が升目から完全に外れている場合、従来技術によれば升目から外れている画像部分を含まない画像データが文字認識装置12に対し出力されるため、その画像データを用いた文字認識は正しく行われない。これに対し、文字画像切出装置10−2による場合、升目の外に配置されている画像であっても、升目の中に配置されている画像と近接している部分を含む画像データが文字認識装置12に対し出力されるため、その画像データを用いた文字認識が正しく行わる可能性が高い。
図5は文字画像切出装置10−2の構成を示したブロック図である。文字画像切出装置10−2の構成および動作は多くの点で文字画像切出装置10−1のそれらと共通しているため、以下、文字画像切出装置10−2が文字画像切出装置10−1と異なる点のみを説明する。また、以下の説明において参照する図において、文字画像切出装置10−1の構成部に対応する構成部には文字画像切出装置10−1において用いられたものと同じ符号が付されている。
文字画像切出装置10−2の制御部101は領域内画像に対し膨張処理を行う膨張画像生成部2011を備えている。膨張画像生成部2011は、領域内画像認識部1013から領域内画像データを受け取り、受け取った領域内画像データにより示される領域内画像の各々の外輪を示すオン画素データに隣接するオフ画素データをオン画素データに書き換える処理を所定回数だけ繰り返すことにより、領域内画像の膨張を行う。以下、膨張画像生成部2011による膨張処理の施された領域内画像を「膨張領域内画像」と呼ぶ。
文字画像切出装置10−2の制御部101は、文字画像切出装置10−1の制御部101が備える拡張領域内画像認識部1014の代わりに拡張膨張領域内画像認識部2012を備えている。膨張画像生成部2011は膨張領域内画像を示す膨張領域内画像データを拡張膨張領域内画像認識部2012に引き渡す。
拡張膨張領域内画像認識部2012は膨張画像生成部2011から受け取った膨張領域内画像データおよび2値画像データ1023を用いて、膨張領域内画像の各々に関し、所定領域外に連続するオン画素群が存在するか否かを判定し、連続したオン画素群があるものに関しては、当該オン画素群を膨張領域内画像に統合することにより膨張領域内画像を拡張する。具体的には、図4に示されるように、識別ラベルL2の膨張領域内画像が拡張膨張領域内画像認識部2012により拡張される。以下、拡張膨張領域内画像認識部2012による拡張処理の施された領域内画像を「拡張膨張領域内画像」と呼ぶ。
拡張膨張領域内画像認識部2012は拡張膨張領域内画像を示す拡張膨張領域内画像データを画像データ出力部1015に引き渡す。画像データ出力部1015は受け取った拡張膨張領域内画像データを、1文字を示す画像データとして文字認識装置12に対し送信する。
以上のように文字画像切出装置10−2により切り出され文字認識装置12に送信される画像データは、升目から外れて書かれた文字部分を含む画像を示すため、文字認識処理において高い精度の結果をもたらすものとなる。
ところで、拡張膨張領域内画像認識部2012により生成される拡張膨張領域内画像は、升目内の画像に関しては膨張処理が施され、升目外の画像に関しては膨張処理が施されていない。一般的に、オリジナルの画像を用いて文字認識が行われる場合の方が、膨張処理が施されている画像を用いて文字認識が行われる場合と比較して、高い精度の結果が得られる。そこで、文字画像切出装置10−2に対し以下の変形を加えてもよい。
図6は、文字画像切出装置10−2の制御部101に、拡張膨張領域内画像に対し収縮処理を行う収縮画像生成部2013を備えさせた場合の構成を示したブロック図である。収縮画像生成部2013は拡張膨張領域内画像認識部2012と画像データ出力部1015の間に介挿され、拡張膨張領域内画像認識部2012から拡張膨張領域内画像データを受け取り、受け取った拡張膨張領域内画像データにより示される拡張膨張領域内画像の各々の外輪を示すオン画素データをオフ画素データに書き換える処理を所定回数だけ繰り返すことにより、拡張膨張領域内画像の収縮を行う。以下、収縮画像生成部2013による収縮処理の施された拡張膨張領域内画像を「収縮拡張膨張領域内画像」と呼ぶ。
収縮拡張膨張領域内画像は、升目内の画像に関してはオリジナルの画像と同様の太さの画像を、また升目外の画像に関してはオリジナルの画像と比較して細い画像を含んでいる。一般的に文字認識処理においては、画像の特徴点を抽出するために、太さを持った画像を細線化する処理が行われるため、収縮拡張膨張領域内画像において升目外の画像がオリジナルの画像に比べ細い点は文字認識の精度にあまり悪影響を与えない。一方、収縮拡張膨張領域内画像に含まれる升目内の画像が拡張膨張領域内画像と比較してオリジナルに近似する太さである結果、より高い精度の文字認識をもたらす画像となる。
収縮画像生成部2013は、収縮拡張膨張領域内画像を示す収縮拡張膨張領域内画像データを画像データ出力部1015に引き渡す。画像データ出力部1015は受け取った収縮拡張膨張領域内画像データを、1文字を示す画像データとして文字認識装置12に対し送信する。
また、図7は、文字画像切出装置10−2の制御部101に、拡張膨張領域内画像と2値画像データ1023により示される画像との重複部分の画像を取り出す重複画像認識部2014を備えさせた場合の構成を示すブロック図である。重複画像認識部2014は拡張膨張領域内画像認識部2012と画像データ出力部1015の間に介挿され、拡張膨張領域内画像認識部2012から拡張膨張領域内画像データを受け取り、受け取った拡張膨張領域内画像データに含まれる画素データの各々に関し、当該画素データに対応する2値画像データ1023に含まれる画素データとの間の論理積を算出する。重複画像認識部2014により算出された論理積の結果を値とする画素データの集まりは、拡張膨張領域内画像と2値画像データ1023により示される画像との重複画像を示すデータである。
上記のように重複画像認識部2014により認識される重複画像は、オリジナルの画像の中から、拡張膨張領域内画像により占められる範囲に含まれる部分を取り出したものである。従って、膨張処理が施された拡張膨張領域内画像と比較して、より高い精度の文字認識をもたらす画像となる。
重複画像認識部2014は、重複画像を示すデータを画像データ出力部1015に引き渡す。画像データ出力部1015は受け取った重複画像を示すデータを、1文字を示す画像データとして文字認識装置12に対し送信する。
[3.第3実施形態]
図8は、第2実施形態の場合と同様に、ユーザがタブレットPC11に表示される4文字分の升目に対し「榊原正義」なる文字列を筆記した場合に、本発明の第3実施形態にかかる文字画像切出装置10−3により第1の升目から画像データが切り出される様子を示した図である。
図9は文字画像切出装置10−3の構成を示したブロック図である。文字画像切出装置10−3の構成および動作は多くの点で文字画像切出装置10−2のそれらと共通しているため、以下、文字画像切出装置10−3が文字画像切出装置10−2と異なる点のみを説明する。また、以下の説明において参照する図において、文字画像切出装置10−1もしくは文字画像切出装置10−2の構成部に対応する構成部には文字画像切出装置10−1もしくは文字画像切出装置10−2において用いられたものと同じ符号が付されている。
文字画像切出装置10−3の制御部101は領域内画像認識部1013の代わりに、2値画像データ1023に含まれる連続する画像部分を各々分離して認識する画像認識部3011を備えている。画像認識部3011は、2値画像データ1023に含まれるオン画素データを、互いに連続するオン画素データ群にグループ化し、各々のオン画素データを部分画像として認識する。画像認識部3011は、そのように認識した部分画像の各々に対し識別ラベルを付加する。画像認識部3011は識別ラベルを付加した部分画像を示すデータ(以下、「部分画像データ」と呼ぶ)を膨張画像生成部2011に引き渡す。
膨張画像生成部2011は受け取った部分画像データにより示される部分画像の各々に対し膨張処理を行い、膨張画像を生成する。文字画像切出装置10−3の制御部101は、膨張処理により互いに連続することとなった部分画像を一つの部分画像とする連結膨張画像認識部3012を備えている。膨張画像生成部2011は膨張画像を示す膨張画像データを連結膨張画像認識部3012に引き渡す。連結膨張画像認識部3012は膨張画像データにより示される膨張画像を互いに連続する膨張画像群にグループ化し、グループ化した膨張画像群を連結して1つの画像として再認識する。以下、そのように連結された膨張画像群を「連結膨張画像」と呼ぶ。
文字画像切出装置10−3の制御部101は、所定領域に一部もしくは全部が含まれる連結膨張画像を認識する領域内連結膨張画像認識部3013を備えている。領域内連結膨張画像認識部3013は連結膨張画像認識部3012から連結膨張画像を示す連結膨張画像データを受け取り、連結膨張画像データにより示される連結膨張画像のうち、領域データ1022により示される第1の升目の少なくとも一部を占めているものを特定する。以下、領域内連結膨張画像認識部3013により特定された連結膨張画像を「領域内連結膨張画像」と呼ぶ。
領域内連結膨張画像認識部3013は、領域内連結膨張画像を示す領域内連結膨張画像データを画像データ出力部1015に引き渡す。画像データ出力部1015は受け取った領域内連結膨張画像データを、1文字を示す画像データとして文字認識装置12に対し送信する。
以上のように文字画像切出装置10−3により切り出され文字認識装置12に送信される画像データは、文字画像切出装置10−2により切り出される画像データと同様に、升目から外れて書かれた文字部分を含む画像を示すため、文字認識処理において高い精度の結果をもたらすものとなる。
ところで、領域内連結膨張画像認識部3013により認識される領域内連結膨張画像は、升目の内外のいずれに関してもオリジナルの画像に膨張処理が施された画像である。そこで、より高い文字認識の精度をもたらす画像を生成するために、文字画像切出装置10−3に対し以下の変形を加えてもよい。
図10は、文字画像切出装置10−3の制御部101に収縮画像生成部2013を備えさせた場合の構成を示すブロック図である。収縮画像生成部2013は領域内連結膨張画像認識部3013と画像データ出力部1015の間に介挿され、領域内連結膨張画像認識部3013から受け取った領域内連結膨張画像データにより示される領域内連結膨張画像に対し収縮処理を行い、収縮領域内連結膨張画像を生成する。収縮領域内連結膨張画像は、領域内連結膨張画像と比較して、オリジナルの画像と近似する太さであり、より高い精度の文字認識をもたらす。
収縮画像生成部2013は収縮領域内連結膨張画像を示す収縮領域内連結膨張画像データを画像データ出力部1015に引き渡す。画像データ出力部1015は受け取った収縮領域内連結膨張画像データを、1文字を示す画像データとして文字認識装置12に対し送信する。
また、図11は、文字画像切出装置10−3の制御部101に重複画像認識部2014を備えさせた場合の構成を示すブロック図である。重複画像認識部2014は領域内連結膨張画像認識部3013と画像データ出力部1015の間に介挿され、領域内連結膨張画像認識部3013から受け取った領域内連結膨張画像データにより示される領域内連結膨張画像と2値画像データ1023により示される画像との重複部分の画像を取り出す。
上記のように重複画像認識部2014により認識される重複画像は、オリジナルの画像の中から、領域内連結膨張画像により占められる範囲に含まれる部分を取り出したものである。従って、膨張処理が施された領域内連結膨張画像と比較して、より高い精度の文字認識をもたらす画像となる。
重複画像認識部2014は、重複画像を示すデータを画像データ出力部1015に引き渡す。画像データ出力部1015は受け取った重複画像を示すデータを、1文字を示す画像データとして文字認識装置12に対し送信する。
[4.第4実施形態]
図12は、第2実施形態および第3実施形態の場合と同様に、ユーザがタブレットPC11に表示される4文字分の升目に対し「榊原正義」なる文字列を筆記した場合に、本発明の第4実施形態にかかる文字画像切出装置10−4により第1の升目から画像データが切り出される様子を示した図である。
図13は文字画像切出装置10−4の構成を示したブロック図である。文字画像切出装置10−4の構成および動作は多くの点で文字画像切出装置10−3のそれらと共通しているため、以下、文字画像切出装置10−4が文字画像切出装置10−3と異なる点のみを説明する。また、以下の説明において参照する図において、文字画像切出装置10−1ないし文字画像切出装置10−3の構成部に対応する構成部には文字画像切出装置10−1ないし文字画像切出装置10−3において用いられたものと同じ符号が付されている。
文字画像切出装置10−4の制御部101は、文字画像切出装置10−3が備える全ての構成部に加え、2値画像データ1023に示される画像データのうち、領域データ1022により示される升目に含まれる画像データの部分を取り出し、それらに含まれる連続する画像部分を各々分離し、領域内画像として認識する領域内画像認識部1013を備えている。領域内画像認識部1013は認識した領域内画像およびそれらに付した識別ラベルを示す領域内画像データを領域内連結膨張画像認識部3013に引き渡す。
文字画像切出装置10−4の領域内連結膨張画像認識部3013は、連結膨張画像認識部3012から連結膨張画像を示す連結膨張画像データを受け取り、また領域内画像認識部1013から領域内画像データを受け取る。領域内連結膨張画像認識部3013は領域内画像データにより示される領域内画像の各々に関し、当該領域内画像に含まれる任意のオン画素を起点として選択する。領域内連結膨張画像認識部3013は、連結膨張画像データにより示される連結膨張画像に含まれる、先に選択した起点のオン画素に対応する位置のオン画素を特定し、特定したオン画素に連続するオン画素群を領域内連結膨張画像として認識する。
例えば、図12に示される例によれば、連結膨張画像により示される「榊」の画像は、その文字を構成する左側のパーツ(L11)は識別ラベルL1もしくはL2が付された領域内画像に含まれるオン画素を起点とした取り出し処理により領域内連結膨張画像として認識される。また、連結膨張画像により示される「榊」の画像の右側のパーツ(L12)は識別ラベルL3が付された領域内画像に含まれるオン画素を起点とした取り出し処理により領域内連結膨張画像として認識される。
領域内連結膨張画像認識部3013は上記のように領域内連結膨張画像を認識すると、認識した領域内連結膨張画像を示す領域内連結膨張画像データを画像データ出力部1015に引き渡す。画像データ出力部1015は受け取った領域内連結膨張画像データを、1文字を示す画像データとして文字認識装置12に対し送信する。
以上のように文字画像切出装置10−4により切り出され文字認識装置12に送信される画像データは、文字画像切出装置10−3により切り出される画像データと同じ画像データとなり、升目から外れて書かれた文字部分を含む画像を示すため、文字認識処理において高い精度の結果をもたらすものとなる。
ところで、文字画像切出装置10−4の領域内連結膨張画像認識部3013により認識される領域内連結膨張画像は、文字画像切出装置10−3の文字画像切出装置10−4により認識される領域内連結膨張画像と同じものであるため、文字画像切出装置10−4に対し、文字画像切出装置10−3に関し上述したものと同様の変形を加えてもよい。
すなわち、文字画像切出装置10−4の領域内連結膨張画像認識部3013と画像データ出力部1015の間に収縮画像生成部2013を介挿し、領域内連結膨張画像に収縮処理を施した収縮領域内連結膨張画像を生成し、収縮領域内連結膨張画像を示す収縮領域内連結膨張画像データを画像データ出力部1015から出力するようにしてもよい。また、文字画像切出装置10−4の領域内連結膨張画像認識部3013と画像データ出力部1015の間に重複画像認識部2014を介挿し、領域内連結膨張画像と2値画像データ1023により示される画像との重複画像を認識し、重複画像を示すデータを画像データ出力部1015から出力するようにしてもよい。
[5.第5実施形態]
図14は、ユーザがタブレットPC11に表示される4文字分の升目に対し「榊原正義」なる文字列を筆記した場合に、従来技術により第4の升目から切り出される画像データ(図14(a))と、本発明の第5実施形態にかかる文字画像切出装置10−5により第4の升目から切り出される画像データ(図14(b))とを用いて、文字認識装置12が文字認識処理を行った際に得られるテキストデータを比較して示した図である。
図15は文字画像切出装置10−5の構成を示したブロック図である。文字画像切出装置10−5の構成および動作は多くの点で文字画像切出装置10−1のそれらと共通しているため、以下、文字画像切出装置10−5が文字画像切出装置10−1と異なる点のみを説明する。また、以下の説明において参照する図において、文字画像切出装置10−1ないし文字画像切出装置10−4の構成部に対応する構成部には文字画像切出装置10−1ないし文字画像切出装置10−4において用いられたものと同じ符号が付されている。
文字画像切出装置10−5の制御部101は、処理対象の領域を升目から拡張領域内画像に外接する矩形の領域に拡張する拡張領域認識部5011を備えている。文字画像切出装置10−5の制御部101が備える拡張領域内画像認識部1014は、領域内画像認識部1013から升目の中に配置された領域内画像を示す領域内画像データを受け取り、受け取った領域内画像データおよび2値画像データ1023を用いて拡張領域内画像データを生成すると、生成した拡張領域内画像データを拡張領域認識部5011に引き渡す。
拡張領域認識部5011は、拡張領域内画像認識部1014から受け取った拡張領域内画像データにより示される拡張領域内画像の集まりに外接する矩形領域を特定する。以下、そのように特定された領域を「拡張領域」と呼ぶ。図14において、領域A0は領域データ1022により示される第4の升目の領域を示し、領域A1は拡張領域を示す。拡張領域認識部5011は、拡張領域を示す拡張領域データを領域内画像認識部1013に引き渡す。
領域内画像認識部1013は、拡張領域認識部5011から拡張領域データを受け取ると、2値画像データ1023に含まれるオン画素データのうち、領域データ1022により示される升目の領域に代えて、領域内画像の認識処理を再度実行する。その結果、図14において、既に認識されていた識別ラベルL1〜L3の付された領域内画像に加え、新たに識別ラベルL4の付された領域内画像が領域内画像認識部1013により認識される。領域内画像認識部1013はそのように認識した領域内画像を示す領域内画像データを拡張領域内画像認識部1014に引き渡す。
拡張領域内画像認識部1014は領域内画像認識部1013から拡張領域に関し生成した領域内画像データを受け取ると、受け取った領域内画像データにより示される領域内画像の拡張処理を再実行する。その結果、図14において、識別ラベルL4の付された領域内画像が拡張される。拡張領域内画像認識部1014はそのように認識した拡張領域内画像を示す拡張領域内画像データを画像データ出力部1015に引き渡す。画像データ出力部1015は受け取った拡張領域内画像データを、1文字を示す画像データとして文字認識装置12に対し送信する。
上記の説明においては、拡張領域認識部5011による拡張領域の認識処理、領域内画像認識部1013による領域内画像の認識処理および拡張領域内画像認識部1014による拡張領域内画像の認識処理が1回だけ繰り返されるものとしたが、繰り返し回数を所定の複数回としてもよい。また、拡張領域内画像認識部1014による領域内画像の拡張もしくは拡張領域認識部5011による領域の拡張が行われなくなるまで、それらの処理を繰り返すようにしてもよい。
以上のように文字画像切出装置10−5により切り出され文字認識装置12に送信される画像データは、例えば文字画像切出装置10−1における拡張処理によっては切り出されないような、升目外に分離して書かれた文字部分をも含む画像を示すため、文字認識処理において高い精度の結果をもたらすものとなる。
ところで、文字画像切出装置10−5における領域拡張による認識処理の繰り返し実行を、文字画像切出装置10−2ないし文字画像切出装置10−4の拡張処理等と組み合わせてもよい。
[6.第6実施形態]
図16は、ユーザがタブレットPC11に表示される4文字分の升目に対し「榊原正義」なる文字列を筆記した場合に、本発明の第6実施形態にかかる文字画像切出装置10−6により第1の升目から画像データが切り出される様子を示した図である。この例においては、第1の升目には、第2の升目に書かれるべき文字の一部がはみ出して書かれているため、第1の升目に含まれる画像を用いて文字認識処理を行った場合、高い文字認識の精度は期待できない。これに対し、文字画像切出装置10−6は近隣の升目からはみ出してきた画像部分を除去することにより、高い精度の文字認識をもたらす画像の切り出しを行う。
図17は、文字画像切出装置10−6の構成を示したブロック図である。文字画像切出装置10−6の構成および動作は多くの点で文字画像切出装置10−1のそれらと共通しているため、以下、文字画像切出装置10−6が文字画像切出装置10−1と異なる点のみを説明する。また、以下の説明において参照する図において、文字画像切出装置10−1ないし文字画像切出装置10−5の構成部に対応する構成部には文字画像切出装置10−1ないし文字画像切出装置10−5において用いられたものと同じ符号が付されている。
文字画像切出装置10−6の制御部101は、文字画像切出装置10−1の制御部101が備える拡張領域内画像認識部1014に代えて、領域内画像のうち升目外に連続するオン画素群を有するものの中から、近隣の升目からはみ出してきた部分を示すものと思われる領域内画像を画像データ出力部1015に引き渡す領域内画像の集まりから除外する領域内画像除外部6011を備えている。
領域内画像認識部1013は領域内画像データを領域内画像除外部6011に引き渡す。領域内画像除外部6011は受け取った領域内画像データおよび2値画像データ1023を用いて、領域内画像の各々に関し、升目外に連続するオン画素群が存在するか否かを判定し、連続したオン画素群があるもの(図16における、識別ラベルL1およびL5の付された領域内画像)に関しては、升目内の領域内画像に含まれるオン画素の数(もしくはその面積)と、領域内画像に連続する升目外のオン画素群に含まれるオン画素の数(もしくはその面積)とを比較する。領域内画像除外部6011は、升目内のオン画素の数が升目外のオン画素の数よりも少ない場合(図16における、識別ラベルL5の付された領域内画像)、その領域内画像を画像データ出力部1015に出力する領域内画像の集まりから除外する。
すなわち、領域内画像除外部6011は、升目外に連続するオン画素群を有しない領域内画像と、升目外に連続するオン画素群を有するが升目外に連続するオン画素群の占める面積よりも広い面積を占める領域内画像とを示す領域内画像データを、画像データ出力部1015に引き渡す。画像データ出力部1015は受け取った領域内画像データを、1文字を示す画像データとして文字認識装置12に対し送信する。
以上のように文字画像切出装置10−6により切り出され文字認識装置12に送信される画像データは、近隣の升目からはみ出した文字部分が除外された画像を示すため、文字認識処理において高い精度の結果をもたらすものとなる。
ところで、文字画像切出装置10−6における領域内画像の除外処理を、文字画像切出装置10−1ないし文字画像切出装置10−5の拡張処理等と組み合わせてもよい。例えば、図18は文字画像切出装置10−6に文字画像切出装置10−1における領域内画像の拡張処理を組み合わせた場合の構成を示したブロック図である。
図18に示される構成の文字画像切出装置10−6においては、領域内画像除外部6011と画像データ出力部1015の間に拡張領域内画像認識部1014が介挿されている。この場合、拡張領域内画像認識部1014は領域内画像除外部6011から、除外されなかった領域内画像を示す領域内画像データを受け取り、受け取った領域内画像データにより示される領域内画像に対し拡張処理を行い、拡張領域内画像を認識する。拡張領域内画像認識部1014は認識した拡張領域内画像を示す拡張領域内画像データを、画像データ出力部1015に引き渡す。画像データ出力部1015は受け取った拡張領域内画像データを、1文字を示す画像データとして文字認識装置12に対し送信する。
このように画像データ出力部1015から送信される画像データは、近隣の升目からはみ出した文字部分が除外され、かつ升目外にはみ出した文字部分を取り込んだ画像を示すため、文字認識処理においてより高い精度の結果をもたらすものとなる。
また、文字画像切出装置10−6の領域内画像除外部6011が升目の内外に配置されるオン画素数を基準として領域内画像を除外する代わりに、例えば領域内画像除外部6011は升目の内外にまたがる拡張領域内画像を含めた画像データと除外した画像データの2セットの画像データを、画像データ出力部1015を介して文字認識装置12に送信するようにしてもよい。その場合、文字認識装置12においてそれらの画像データの各々に対し文字認識処理を行い、認識結果を登録された単語を示すテキストデータ等と比較することにより、正しいと思われる認識結果を採用するようにしてもよい。
ところで、上述した文字画像切出装置10は、いずれも専用のハードウェアにより実現されてもよいし、汎用的なPCにアプリケーションプログラムに従った処理を実行させることにより実現されてもよい。
また、上述した実施形態においては、文字認識システム1は文字画像切出装置10、タブレットPC11および文字認識装置12を互いに接続することにより実現されるものとして説明したが、それらの配置は任意に変更可能である。例えば、文字認識装置12を文字画像切出装置10と同じ筐体内に配置したり、文字画像切出装置10をタブレットPC11により実現するようにしたりしてもよい。また、文字画像切出装置10とタブレットPC11および文字画像切出装置10と文字認識装置12をネットワークを介して相互に接続するようにしてもよい。
また、上述した実施形態においては、文字画像切出装置10に対し、タブレットPC11から文字列を示す画像データが入力されるものとして説明したが、例えばタブレットPC11の代わりに、画像を光学的に読み取り画像データを生成するスキャナ装置を文字画像切出装置10に接続し、紙面に書かれた文字列をスキャナ装置に読み取らせ、スキャナ装置により生成された画像データを文字画像切出装置10に入力させるようにしてもよい。その場合、例えば、升目を示す図形を例えば朱色等で色付けしておき、文字画像切出装置10において色フィルタにより升目を示す図形を抽出後、図形認識処理を行い升目の領域を特定するようにすればよい。もしくは、図形認識処理のみによって升目の領域を特定するようにしてもよい。
また、上述した実施形態においては、手書きによる文字列から1文字分の画像を切り出す場合について説明したが、升目に対しずれて印字された活字等に関しても本発明にかかる文字認識システムが利用可能であることは言うまでもない。
本発明の実施形態にかかる文字認識システムの構成を示したブロック図である。 本発明の第1実施形態にかかる文字画像切出装置により画像データが切り出される様子を示した図である。 本発明の第1実施形態にかかる文字画像切出装置の構成を示したブロック図である。 本発明の第2実施形態にかかる文字画像切出装置により画像データが切り出される様子を示した図である。 本発明の第2実施形態にかかる文字画像切出装置の構成を示したブロック図である。 本発明の第2実施形態にかかる文字画像切出装置の構成を示したブロック図である。 本発明の第2実施形態にかかる文字画像切出装置の構成を示したブロック図である。 本発明の第3実施形態にかかる文字画像切出装置により画像データが切り出される様子を示した図である。 本発明の第3実施形態にかかる文字画像切出装置の構成を示したブロック図である。 本発明の第3実施形態にかかる文字画像切出装置の構成を示したブロック図である。 本発明の第3実施形態にかかる文字画像切出装置の構成を示したブロック図である。 本発明の第4実施形態にかかる文字画像切出装置により画像データが切り出される様子を示した図である。 本発明の第4実施形態にかかる文字画像切出装置の構成を示したブロック図である。 本発明の第5実施形態にかかる文字画像切出装置により画像データが切り出される様子を示した図である。 本発明の第5実施形態にかかる文字画像切出装置の構成を示したブロック図である。 本発明の第6実施形態にかかる文字画像切出装置により画像データが切り出される様子を示した図である。 本発明の第6実施形態にかかる文字画像切出装置の構成を示したブロック図である。 本発明の第6実施形態にかかる文字画像切出装置の構成を示したブロック図である。
符号の説明
1…文字認識システム、10…文字画像切出装置、11…タブレットPC、12…文字認識装置、101…制御部、102…記憶部、1011…画像データ入力部、1012…2値化部、1013…領域内画像認識部、1014…拡張領域内画像認識部、1015…画像データ出力部、1021…画像データ、1022…領域データ、1023…2値画像データ、2011…膨張画像生成部、2012…拡張膨張領域内画像認識部、2013…収縮画像生成部、2014…重複画像認識部、3011…画像認識部、3012…連結膨張画像認識部、3013…領域内連結膨張画像認識部、5011…拡張領域認識部、6011…領域内画像除外部

Claims (11)

  1. 平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する画像データ取得手段と、
    前記画像データ取得手段により取得された画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する領域内画像認識手段と、
    前記領域内画像認識手段により認識された領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する判定手段と、
    前記判定手段により前記オン画素の集まりが存在する場合には当該オン画素の集まりを当該領域内画像に統合した画像を拡張領域内画像として認識し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該領域内画像を拡張領域内画像として認識する拡張領域内画像認識手段と、
    前記拡張領域内画像認識手段により認識された拡張領域内画像を示すデータを、1文字を表す画像データとして出力する出力手段と
    を備えることを特徴とする文字画像切出装置。
  2. 平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する画像データ取得手段と、
    前記画像データ取得手段により取得された画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する領域内画像認識手段と、
    前記領域内画像認識手段により認識された領域内画像に対し膨張処理を行い、膨張領域内画像を生成する膨張画像生成手段と、
    前記膨張画像生成手段により生成された膨張領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する判定手段と、
    前記判定手段により前記オン画素の集まりが存在する場合には当該オン画素の集まりを当該膨張領域内画像に統合した画像を拡張膨張領域内画像として認識し、当該膨張領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該膨張領域内画像を拡張膨張領域内画像として認識する拡張膨張領域内画像認識手段と、
    前記拡張膨張領域内画像認識手段により認識された拡張膨張領域内画像を示すデータを、1文字を表す画像データとして出力する出力手段と
    を備えることを特徴とする文字画像切出装置。
  3. 前記拡張膨張領域内画像認識手段により認識された拡張膨張領域内画像に対し収縮処理を行い、収縮拡張膨張領域内画像を生成する収縮画像生成手段
    をさらに備え、
    前記出力手段は、拡張膨張領域内画像を示すデータの代わりに、前記収縮画像生成手段により生成された収縮拡張膨張領域内画像を示すデータを出力する
    ことを特徴とする請求項2に記載の文字画像切出装置。
  4. 平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する画像データ取得手段と、
    前記画像データ取得手段により取得された画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する領域内画像認識手段と、
    前記領域内画像認識手段により認識された領域内画像に対し膨張処理を行い、膨張領域内画像を生成する膨張画像生成手段と、
    前記膨張画像生成手段により生成された膨張領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する判定手段と、
    前記判定手段により前記オン画素の集まりが存在する場合には当該オン画素の集まりを当該膨張領域内画像に統合した画像を拡張膨張領域内画像として認識し、当該膨張領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該膨張領域内画像を拡張膨張領域内画像として認識する拡張膨張領域内画像認識手段と、
    前記画像データ取得手段により取得された画像データにより示される画像と前記拡張膨張領域内画像認識手段により認識された拡張膨張領域内画像との両方においてオン画素である画素の集まりを重複画像として認識する重複画像認識手段と、
    前記重複画像認識手段により認識された重複画像を示すデータを、1文字を表す画像データとして出力する出力手段と
    を備えることを特徴とする文字画像切出装置。
  5. 平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する画像データ取得手段と、
    前記画像データ取得手段により取得された画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する領域内画像認識手段と、
    前記領域内画像認識手段により認識された領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する判定手段と、
    前記判定手段により前記オン画素の集まりが存在する場合には当該オン画素の集まりを当該領域内画像に統合した画像を拡張領域内画像として認識し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該領域内画像を拡張領域内画像として認識する拡張領域内画像認識手段と、
    前記拡張領域内画像認識手段により認識された拡張領域内画像に外接する前記平面上の所定の形状の領域を拡張領域として認識する拡張領域認識手段と、
    前記拡張領域認識手段により認識された拡張領域内に含まれるオン画素の集まりにより示される画像を示すデータを、1文字を表す画像データとして出力する出力手段と
    を備えることを特徴とする文字画像切出装置。
  6. 前記領域内画像認識手段は、前記拡張領域認識手段により拡張領域の認識が行われた後、前記拡張領域認識手段により認識された拡張領域を前記領域として前記領域内画像の認識処理を再実行し、
    前記拡張領域内画像認識手段は、前記領域内画像認識手段による認識処理の再実行により認識された領域内画像に対し前記拡張領域内画像の認識処理を再実行し、
    前記拡張領域認識手段は、前記拡張領域内画像認識手段による認識処理の再実行により認識された拡張領域内画像に対し前記拡張領域の認識処理を再実行し、
    前記出力手段は、前記拡張領域認識手段による認識処理の再実行により認識された拡張領域内に含まれるオン画素の集まりにより示される画像を示すデータを、前記1文字を表す画像データとして出力する
    ことを特徴とする請求項5に記載の文字画像切出装置。
  7. 平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する画像データ取得手段と、
    前記画像データ取得手段により取得された画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する領域内画像認識手段と、
    前記領域内画像認識手段により認識された1以上の領域内画像のうち少なくとも1の領域内画像に関し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する判定手段と、
    前記判定手段により前記オン画素の集まりが存在する場合、当該領域内画像を前記領域内画像認識手段により認識された領域内画像の集まりから除外する領域内画像除外手段と、
    前記領域内画像認識手段により認識された領域内画像のうち前記領域内画像除外手段により除外されなかった領域内画像の集まりを、1文字を表す画像データとして出力する出力手段と
    を備えることを特徴とする文字画像切出装置。
  8. 前記領域内画像除外手段は、1の領域内画像に関し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在する場合、当該オン画素の集まりの占める面積よりも当該1の領域内画像の占める面積が狭いときには、当該1の領域内画像を前記領域内画像認識手段により認識された領域内画像の集まりから除外し、当該オン画素の集まりの占める面積よりも当該1の領域内画像の占める面積が広いときには、当該1の領域内画像を前記領域内画像の集まりから除外しない
    ことを特徴とする請求項7に記載の文字画像切出装置。
  9. 前記領域内画像除外手段により除外されなかった領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在する場合には当該オン画素の集まりを当該領域内画像に統合した画像を拡張領域内画像として認識し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該領域内画像を拡張領域内画像として認識する拡張領域内画像認識手段
    をさらに備え、
    前記出力手段は、前記拡張領域内画像認識手段により認識された拡張領域内画像を示すデータを、前記1文字を表す画像データとして出力する
    ことを特徴とする請求項に記載の文字画像切出装置。
  10. 平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する処理と、
    取得した画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する処理と、
    認識した領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する処理と、
    記オン画素の集まりが存在する場合には当該オン画素の集まりを当該領域内画像に統合した画像を拡張領域内画像として認識し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該領域内画像を拡張領域内画像として認識する処理と、
    認識した拡張領域内画像を示すデータを、1文字を表す画像データとして出力する処理と
    をコンピュータに実行させることを特徴とするプログラム。
  11. 平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する処理と、
    取得した画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する処理と、
    認識された1以上の領域内画像のうち少なくとも1の領域内画像に関し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する処理と、
    記オン画素の集まりが存在する場合、当該領域内画像を認識した領域内画像の集まりから除外する処理と、
    認識した領域内画像のうち除外しなかった領域内画像の集まりを、1文字を表す画像データとして出力する処理と
    をコンピュータに実行させることを特徴とするプログラム。
JP2005092520A 2005-03-28 2005-03-28 文字画像切出装置およびプログラム Expired - Fee Related JP4830331B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005092520A JP4830331B2 (ja) 2005-03-28 2005-03-28 文字画像切出装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005092520A JP4830331B2 (ja) 2005-03-28 2005-03-28 文字画像切出装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2006277092A JP2006277092A (ja) 2006-10-12
JP4830331B2 true JP4830331B2 (ja) 2011-12-07

Family

ID=37211821

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005092520A Expired - Fee Related JP4830331B2 (ja) 2005-03-28 2005-03-28 文字画像切出装置およびプログラム

Country Status (1)

Country Link
JP (1) JP4830331B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4935459B2 (ja) * 2007-03-28 2012-05-23 沖電気工業株式会社 文字認識方法、文字認識プログラムおよび文字認識装置
JP2015038670A (ja) * 2012-11-28 2015-02-26 株式会社東芝 電子機器および方法
JP6922365B2 (ja) * 2017-04-12 2021-08-18 富士フイルムビジネスイノベーション株式会社 文書処理装置及びプログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS617988A (ja) * 1984-06-22 1986-01-14 Hitachi Ltd パタ−ン復元方式
JPS6133583A (ja) * 1984-07-25 1986-02-17 Nec Corp 文字セグメンテ−シヨン装置
JPH069064B2 (ja) * 1984-12-04 1994-02-02 オムロン株式会社 手書き文字認識装置
JPH05342409A (ja) * 1992-06-05 1993-12-24 Nec Corp 文字認識装置
JPH06251198A (ja) * 1993-02-23 1994-09-09 Toshiba Corp 文字入力装置
JP3852218B2 (ja) * 1998-09-10 2006-11-29 富士ゼロックス株式会社 画像処理方法および画像処理装置
JP4442977B2 (ja) * 2000-02-07 2010-03-31 株式会社日本デジタル研究所 文字認識装置、文字イメージ補間方法及び文字イメージ補間プログラムを記録した記録媒体
JP2004094427A (ja) * 2002-08-30 2004-03-25 Hitachi Ltd 帳票画像処理装置及び該装置を実現するためのプログラム

Also Published As

Publication number Publication date
JP2006277092A (ja) 2006-10-12

Similar Documents

Publication Publication Date Title
CN107680589B (zh) 语音信息交互方法、装置及其设备
RU2437152C2 (ru) Устройство обработки изображений, способ и компьютерная программа обработки изображений
KR20130029430A (ko) 문자 인식 장치, 문자 인식 방법, 문자 인식 시스템, 및 문자 인식 프로그램
RU2631168C2 (ru) Способы и устройства, которые преобразуют изображения документов в электронные документы с использованием trie-структуры данных, содержащей непараметризованные символы для определения слов и морфем на изображении документа
CN106599940B (zh) 图片文字的识别方法及装置
RU2643465C2 (ru) Устройства и способы, которые используют иерархически упорядоченную структуру данных, содержащую непараметризованные символы, для преобразования изображений документов в электронные документы
RU2619712C1 (ru) Оптическое распознавание символов серии изображений
RU2613849C1 (ru) Оптическое распознавание символов серии изображений
JPH0830732A (ja) 文字認識方法
CN111798543B (zh) 模型训练方法、数据处理方法、装置、设备及存储介质
JP2010157107A (ja) 業務文書処理装置
JPH11120293A (ja) 文字認識/修正方式
US20190318190A1 (en) Information processing apparatus, and non-transitory computer readable medium
CN112232282A (zh) 一种手势识别方法、装置、存储介质和电子设备
JP4830331B2 (ja) 文字画像切出装置およびプログラム
US9342739B2 (en) Character recognition apparatus, non-transitory computer readable medium, and character recognition method
WO2015079751A1 (ja) 翻訳装置
WO2017038952A1 (ja) 文字認識装置、文字認識方法およびプログラム
CN111079749B (zh) 一种带姿态校正的端到端商品价签文字识别方法和系统
WO2020054067A1 (ja) 画像情報処理装置、画像情報処理方法、及び画像情報処理プログラム
JP7267854B2 (ja) 帳票認識装置、帳票認識方法、及び帳票認識システム
Bidari et al. Semantic segmentation using U-Net architecture for change detection on hyperspectral imagery
JP6575116B2 (ja) 文字認識装置、文字認識処理システム、およびプログラム
JP2020154449A (ja) 画像処理装置及びプログラム
JP6724547B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080221

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100916

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101019

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110614

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110721

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110823

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110905

R150 Certificate of patent or registration of utility model

Ref document number: 4830331

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140930

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees
S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R370 Written measure of declining of transfer procedure

Free format text: JAPANESE INTERMEDIATE CODE: R370