JP4830331B2 - 文字画像切出装置およびプログラム - Google Patents
文字画像切出装置およびプログラム Download PDFInfo
- Publication number
- JP4830331B2 JP4830331B2 JP2005092520A JP2005092520A JP4830331B2 JP 4830331 B2 JP4830331 B2 JP 4830331B2 JP 2005092520 A JP2005092520 A JP 2005092520A JP 2005092520 A JP2005092520 A JP 2005092520A JP 4830331 B2 JP4830331 B2 JP 4830331B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- region
- area
- pixels
- expansion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Input (AREA)
Description
以下、本発明の好適な実施形態を説明する。図1は以下に説明する実施形態にかかる文字認識システム1の構成を示したブロック図である。文字認識システム1は、複数の文字を示す画像データから各々の文字を示す画像データを切り出して送信する文字画像切出装置10と、文字画像切出装置10に対し複数の文字を示す画像データを送信するタブレットPC(Personal Computer)11と、文字画像切出装置10から送信される各々の文字を示す画像データに対し文字認識処理を行い認識した文字を示すテキストデータを生成する文字認識装置12を備えている。
図2は、ユーザがタブレットPC11に表示される4文字分の升目に対し「榊原正義」なる文字列を筆記した場合に、従来技術により第2の升目から切り出される画像データ(図2(a))と、本発明の第1実施形態にかかる文字画像切出装置10−1により第2の升目から切り出される画像データ(図2(b))とを用いて、文字認識装置12が文字認識処理を行った際に得られるテキストデータを比較して示した図である。
図4は、ユーザがタブレットPC11に表示される4文字分の升目に対し「榊原正義」なる文字列を筆記した場合に、従来技術により第1の升目から切り出される画像データ(図4(a))と、本発明の第2実施形態にかかる文字画像切出装置10−2により第1の升目から切り出される画像データ(図4(b))とを用いて、文字認識装置12が文字認識処理を行った際に得られるテキストデータを比較して示した図である。
図8は、第2実施形態の場合と同様に、ユーザがタブレットPC11に表示される4文字分の升目に対し「榊原正義」なる文字列を筆記した場合に、本発明の第3実施形態にかかる文字画像切出装置10−3により第1の升目から画像データが切り出される様子を示した図である。
図12は、第2実施形態および第3実施形態の場合と同様に、ユーザがタブレットPC11に表示される4文字分の升目に対し「榊原正義」なる文字列を筆記した場合に、本発明の第4実施形態にかかる文字画像切出装置10−4により第1の升目から画像データが切り出される様子を示した図である。
図14は、ユーザがタブレットPC11に表示される4文字分の升目に対し「榊原正義」なる文字列を筆記した場合に、従来技術により第4の升目から切り出される画像データ(図14(a))と、本発明の第5実施形態にかかる文字画像切出装置10−5により第4の升目から切り出される画像データ(図14(b))とを用いて、文字認識装置12が文字認識処理を行った際に得られるテキストデータを比較して示した図である。
図16は、ユーザがタブレットPC11に表示される4文字分の升目に対し「榊原正義」なる文字列を筆記した場合に、本発明の第6実施形態にかかる文字画像切出装置10−6により第1の升目から画像データが切り出される様子を示した図である。この例においては、第1の升目には、第2の升目に書かれるべき文字の一部がはみ出して書かれているため、第1の升目に含まれる画像を用いて文字認識処理を行った場合、高い文字認識の精度は期待できない。これに対し、文字画像切出装置10−6は近隣の升目からはみ出してきた画像部分を除去することにより、高い精度の文字認識をもたらす画像の切り出しを行う。
Claims (11)
- 平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する画像データ取得手段と、
前記画像データ取得手段により取得された画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する領域内画像認識手段と、
前記領域内画像認識手段により認識された領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する判定手段と、
前記判定手段により前記オン画素の集まりが存在する場合には当該オン画素の集まりを当該領域内画像に統合した画像を拡張領域内画像として認識し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該領域内画像を拡張領域内画像として認識する拡張領域内画像認識手段と、
前記拡張領域内画像認識手段により認識された拡張領域内画像を示すデータを、1文字を表す画像データとして出力する出力手段と
を備えることを特徴とする文字画像切出装置。 - 平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する画像データ取得手段と、
前記画像データ取得手段により取得された画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する領域内画像認識手段と、
前記領域内画像認識手段により認識された領域内画像に対し膨張処理を行い、膨張領域内画像を生成する膨張画像生成手段と、
前記膨張画像生成手段により生成された膨張領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する判定手段と、
前記判定手段により前記オン画素の集まりが存在する場合には当該オン画素の集まりを当該膨張領域内画像に統合した画像を拡張膨張領域内画像として認識し、当該膨張領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該膨張領域内画像を拡張膨張領域内画像として認識する拡張膨張領域内画像認識手段と、
前記拡張膨張領域内画像認識手段により認識された拡張膨張領域内画像を示すデータを、1文字を表す画像データとして出力する出力手段と
を備えることを特徴とする文字画像切出装置。 - 前記拡張膨張領域内画像認識手段により認識された拡張膨張領域内画像に対し収縮処理を行い、収縮拡張膨張領域内画像を生成する収縮画像生成手段
をさらに備え、
前記出力手段は、拡張膨張領域内画像を示すデータの代わりに、前記収縮画像生成手段により生成された収縮拡張膨張領域内画像を示すデータを出力する
ことを特徴とする請求項2に記載の文字画像切出装置。 - 平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する画像データ取得手段と、
前記画像データ取得手段により取得された画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する領域内画像認識手段と、
前記領域内画像認識手段により認識された領域内画像に対し膨張処理を行い、膨張領域内画像を生成する膨張画像生成手段と、
前記膨張画像生成手段により生成された膨張領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する判定手段と、
前記判定手段により前記オン画素の集まりが存在する場合には当該オン画素の集まりを当該膨張領域内画像に統合した画像を拡張膨張領域内画像として認識し、当該膨張領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該膨張領域内画像を拡張膨張領域内画像として認識する拡張膨張領域内画像認識手段と、
前記画像データ取得手段により取得された画像データにより示される画像と前記拡張膨張領域内画像認識手段により認識された拡張膨張領域内画像との両方においてオン画素である画素の集まりを重複画像として認識する重複画像認識手段と、
前記重複画像認識手段により認識された重複画像を示すデータを、1文字を表す画像データとして出力する出力手段と
を備えることを特徴とする文字画像切出装置。 - 平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する画像データ取得手段と、
前記画像データ取得手段により取得された画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する領域内画像認識手段と、
前記領域内画像認識手段により認識された領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する判定手段と、
前記判定手段により前記オン画素の集まりが存在する場合には当該オン画素の集まりを当該領域内画像に統合した画像を拡張領域内画像として認識し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該領域内画像を拡張領域内画像として認識する拡張領域内画像認識手段と、
前記拡張領域内画像認識手段により認識された拡張領域内画像に外接する前記平面上の所定の形状の領域を拡張領域として認識する拡張領域認識手段と、
前記拡張領域認識手段により認識された拡張領域内に含まれるオン画素の集まりにより示される画像を示すデータを、1文字を表す画像データとして出力する出力手段と
を備えることを特徴とする文字画像切出装置。 - 前記領域内画像認識手段は、前記拡張領域認識手段により拡張領域の認識が行われた後、前記拡張領域認識手段により認識された拡張領域を前記領域として前記領域内画像の認識処理を再実行し、
前記拡張領域内画像認識手段は、前記領域内画像認識手段による認識処理の再実行により認識された領域内画像に対し前記拡張領域内画像の認識処理を再実行し、
前記拡張領域認識手段は、前記拡張領域内画像認識手段による認識処理の再実行により認識された拡張領域内画像に対し前記拡張領域の認識処理を再実行し、
前記出力手段は、前記拡張領域認識手段による認識処理の再実行により認識された拡張領域内に含まれるオン画素の集まりにより示される画像を示すデータを、前記1文字を表す画像データとして出力する
ことを特徴とする請求項5に記載の文字画像切出装置。 - 平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する画像データ取得手段と、
前記画像データ取得手段により取得された画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する領域内画像認識手段と、
前記領域内画像認識手段により認識された1以上の領域内画像のうち少なくとも1の領域内画像に関し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する判定手段と、
前記判定手段により前記オン画素の集まりが存在する場合、当該領域内画像を前記領域内画像認識手段により認識された領域内画像の集まりから除外する領域内画像除外手段と、
前記領域内画像認識手段により認識された領域内画像のうち前記領域内画像除外手段により除外されなかった領域内画像の集まりを、1文字を表す画像データとして出力する出力手段と
を備えることを特徴とする文字画像切出装置。 - 前記領域内画像除外手段は、1の領域内画像に関し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在する場合、当該オン画素の集まりの占める面積よりも当該1の領域内画像の占める面積が狭いときには、当該1の領域内画像を前記領域内画像認識手段により認識された領域内画像の集まりから除外し、当該オン画素の集まりの占める面積よりも当該1の領域内画像の占める面積が広いときには、当該1の領域内画像を前記領域内画像の集まりから除外しない
ことを特徴とする請求項7に記載の文字画像切出装置。 - 前記領域内画像除外手段により除外されなかった領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在する場合には当該オン画素の集まりを当該領域内画像に統合した画像を拡張領域内画像として認識し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該領域内画像を拡張領域内画像として認識する拡張領域内画像認識手段
をさらに備え、
前記出力手段は、前記拡張領域内画像認識手段により認識された拡張領域内画像を示すデータを、前記1文字を表す画像データとして出力する
ことを特徴とする請求項8に記載の文字画像切出装置。 - 平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する処理と、
取得した画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する処理と、
認識した領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する処理と、
前記オン画素の集まりが存在する場合には当該オン画素の集まりを当該領域内画像に統合した画像を拡張領域内画像として認識し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在しない場合には当該領域内画像を拡張領域内画像として認識する処理と、
認識した拡張領域内画像を示すデータを、1文字を表す画像データとして出力する処理と
をコンピュータに実行させることを特徴とするプログラム。 - 平面上に配置された画像を構成する複数の画素の各々の属性値を示す画素データの集まりからなる画像データを取得する処理と、
取得した画像データに含まれる画素データにより示される画素のうち、所定の閾値を超える属性値を示すオン画素の中から、前記平面上の予め定められた升目により表される領域内において互いに連続して配置されているオン画素の集まりを領域内画像として認識する処理と、
認識された1以上の領域内画像のうち少なくとも1の領域内画像に関し、当該領域内画像に隣接し前記領域外において互いに連続して配置されているオン画素の集まりが存在するか否かを判定する処理と、
前記オン画素の集まりが存在する場合、当該領域内画像を認識した領域内画像の集まりから除外する処理と、
認識した領域内画像のうち除外しなかった領域内画像の集まりを、1文字を表す画像データとして出力する処理と
をコンピュータに実行させることを特徴とするプログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2005092520A JP4830331B2 (ja) | 2005-03-28 | 2005-03-28 | 文字画像切出装置およびプログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2005092520A JP4830331B2 (ja) | 2005-03-28 | 2005-03-28 | 文字画像切出装置およびプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2006277092A JP2006277092A (ja) | 2006-10-12 |
| JP4830331B2 true JP4830331B2 (ja) | 2011-12-07 |
Family
ID=37211821
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2005092520A Expired - Fee Related JP4830331B2 (ja) | 2005-03-28 | 2005-03-28 | 文字画像切出装置およびプログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4830331B2 (ja) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4935459B2 (ja) * | 2007-03-28 | 2012-05-23 | 沖電気工業株式会社 | 文字認識方法、文字認識プログラムおよび文字認識装置 |
| JP2015038670A (ja) * | 2012-11-28 | 2015-02-26 | 株式会社東芝 | 電子機器および方法 |
| JP6922365B2 (ja) * | 2017-04-12 | 2021-08-18 | 富士フイルムビジネスイノベーション株式会社 | 文書処理装置及びプログラム |
Family Cites Families (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS617988A (ja) * | 1984-06-22 | 1986-01-14 | Hitachi Ltd | パタ−ン復元方式 |
| JPS6133583A (ja) * | 1984-07-25 | 1986-02-17 | Nec Corp | 文字セグメンテ−シヨン装置 |
| JPH069064B2 (ja) * | 1984-12-04 | 1994-02-02 | オムロン株式会社 | 手書き文字認識装置 |
| JPH05342409A (ja) * | 1992-06-05 | 1993-12-24 | Nec Corp | 文字認識装置 |
| JPH06251198A (ja) * | 1993-02-23 | 1994-09-09 | Toshiba Corp | 文字入力装置 |
| JP3852218B2 (ja) * | 1998-09-10 | 2006-11-29 | 富士ゼロックス株式会社 | 画像処理方法および画像処理装置 |
| JP4442977B2 (ja) * | 2000-02-07 | 2010-03-31 | 株式会社日本デジタル研究所 | 文字認識装置、文字イメージ補間方法及び文字イメージ補間プログラムを記録した記録媒体 |
| JP2004094427A (ja) * | 2002-08-30 | 2004-03-25 | Hitachi Ltd | 帳票画像処理装置及び該装置を実現するためのプログラム |
-
2005
- 2005-03-28 JP JP2005092520A patent/JP4830331B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2006277092A (ja) | 2006-10-12 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN107680589B (zh) | 语音信息交互方法、装置及其设备 | |
| RU2437152C2 (ru) | Устройство обработки изображений, способ и компьютерная программа обработки изображений | |
| KR20130029430A (ko) | 문자 인식 장치, 문자 인식 방법, 문자 인식 시스템, 및 문자 인식 프로그램 | |
| RU2631168C2 (ru) | Способы и устройства, которые преобразуют изображения документов в электронные документы с использованием trie-структуры данных, содержащей непараметризованные символы для определения слов и морфем на изображении документа | |
| CN106599940B (zh) | 图片文字的识别方法及装置 | |
| RU2643465C2 (ru) | Устройства и способы, которые используют иерархически упорядоченную структуру данных, содержащую непараметризованные символы, для преобразования изображений документов в электронные документы | |
| RU2619712C1 (ru) | Оптическое распознавание символов серии изображений | |
| RU2613849C1 (ru) | Оптическое распознавание символов серии изображений | |
| JPH0830732A (ja) | 文字認識方法 | |
| CN111798543B (zh) | 模型训练方法、数据处理方法、装置、设备及存储介质 | |
| JP2010157107A (ja) | 業務文書処理装置 | |
| JPH11120293A (ja) | 文字認識/修正方式 | |
| US20190318190A1 (en) | Information processing apparatus, and non-transitory computer readable medium | |
| CN112232282A (zh) | 一种手势识别方法、装置、存储介质和电子设备 | |
| JP4830331B2 (ja) | 文字画像切出装置およびプログラム | |
| US9342739B2 (en) | Character recognition apparatus, non-transitory computer readable medium, and character recognition method | |
| WO2015079751A1 (ja) | 翻訳装置 | |
| WO2017038952A1 (ja) | 文字認識装置、文字認識方法およびプログラム | |
| CN111079749B (zh) | 一种带姿态校正的端到端商品价签文字识别方法和系统 | |
| WO2020054067A1 (ja) | 画像情報処理装置、画像情報処理方法、及び画像情報処理プログラム | |
| JP7267854B2 (ja) | 帳票認識装置、帳票認識方法、及び帳票認識システム | |
| Bidari et al. | Semantic segmentation using U-Net architecture for change detection on hyperspectral imagery | |
| JP6575116B2 (ja) | 文字認識装置、文字認識処理システム、およびプログラム | |
| JP2020154449A (ja) | 画像処理装置及びプログラム | |
| JP6724547B2 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080221 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100916 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101019 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101214 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110614 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110721 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110823 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110905 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 4830331 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140930 Year of fee payment: 3 |
|
| LAPS | Cancellation because of no payment of annual fees | ||
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R370 | Written measure of declining of transfer procedure |
Free format text: JAPANESE INTERMEDIATE CODE: R370 |