JP6463066B2 - 情報処理装置、情報処理方法、プログラム - Google Patents
情報処理装置、情報処理方法、プログラム Download PDFInfo
- Publication number
- JP6463066B2 JP6463066B2 JP2014209332A JP2014209332A JP6463066B2 JP 6463066 B2 JP6463066 B2 JP 6463066B2 JP 2014209332 A JP2014209332 A JP 2014209332A JP 2014209332 A JP2014209332 A JP 2014209332A JP 6463066 B2 JP6463066 B2 JP 6463066B2
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- cell
- character
- recognition cell
- control unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—Two-dimensional [2D] image generation
- G06T11/60—Creating or editing images; Combining images with text
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—Two-dimensional [2D] image generation
- G06T11/20—Drawing from basic elements
- G06T11/23—Drawing from basic elements using straight lines or curves
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—Two-dimensional [2D] image generation
- G06T11/20—Drawing from basic elements
- G06T11/26—Drawing of charts or graphs
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2210/00—Indexing scheme for image generation or computer graphics
- G06T2210/22—Cropping
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1475—Inclination or skew detection or correction of characters or of image to be recognised
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/43—Editing text-bitmaps, e.g. alignment, spacing; Semantic analysis of bitmaps of text without OCR
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Character Input (AREA)
- Image Analysis (AREA)
Description
<複写機の構成と情報処理装置の構成>
図1に本実施形態における複写機100の構成を示す。複写機100は、スキャナ101、送受信部102、プリンタ103より構成される。
複写機100のスキャナが文書をスキャンすると、スキャン画像(スキャン画像データとも言う)が生成される。生成されたスキャン画像を送受信部102が情報処理装置200に送信する。すると、情報処理装置200の送受信部201がこれを受信し、保存部202にそのスキャン画像を保存する。
(1)二値化
制御部203は、スキャン画像に対して2値化を行うことにより、2値画像を得る。この2値化により、スキャン画像における閾値より濃い色の画素は黒画素、その閾値より薄い色の画素は白画素となる。なお、以下では、スキャン画像が100DPIであるものとして説明を行うが、スキャン画像がこの解像度に限られないのは言うまでもない。
制御部203は、2値画像に対して8連結で繋がる黒画素の輪郭を追跡することにより、8方向の何れかの方向で連続して存在する黒画素の塊(黒画素塊)を検出する。8連結とは、左上、左、左下、下、右下、右、右上、上の8つの方向の何れかで、同じ色(今回のケースでは黒)の画素が連続しているという意味である。一方、4連結とは、左、下、右、上の4つの方向の何れかで同じ色の画素が連続しているという意味である。この(2)では、8方向に存在する8つの隣接画素の何れもが黒画素ではない単独の黒画素は検出されない。一方、8方向に存在する8つの隣接画素の何れか1つにでも黒画素が存在する黒画素は、その隣接する黒画素と共に、黒画素塊として検出されることになる。図23の2301は制御部203が検出した黒画素塊の一例である。また制御部203は、検出した黒画素塊の外接矩形の位置情報(四頂点のX、Y座標情報のこと)を算出する。なお、X軸は右方向に伸び、Y軸は下方向に伸びているものとする。幅は、X軸方向の長さ、高さは、Y軸方向の長さを指す。図23の2302は黒画素塊2301の外接矩形である。なお、本明細書で矩形と表現した時には、斜め向きの矩形は含まれず、四辺の全てがX座標軸、Y座標軸の何れかと平行な矩形を表す。
制御部203は検出した黒画素塊が以下の全ての条件に該当するか判定し、全てに該当する黒画素塊を表の枠線を構成する黒画素塊であると判定する。
制御部203は、表領域内部の認識セルを特定する。認識セルを特定するためには、表領域内部の白画素の輪郭を追跡することにより、白画素塊を検出する必要がある。その上で、その白画素塊が所定の条件に合致する場合に、その白画素塊の外接矩形は、認識セルとして特定される。図23の2303、2304は、制御部203が特定した認識セルである。制御部203は、特定された認識セルの位置情報を保存部202に保存する。
制御部203は、各認識セルの内部に、その各認識セルに内接する白画素塊によって囲まれた黒画素塊があるか判定する。そして、黒画素塊があると判定した場合、全ての黒画素塊に外接矩形を設定する。
制御部203は、各文字領域に対して文字認識を行うことによって、各文字領域に対応する認識文字を得る。認識文字は、対応する文字領域に関連付けて保存部202に保存する。そうすることによって、認識文字は、文字領域と予め関連付けられている認識セルとも関連付けられることになる。文字認識を行わない場合、もしくは文字認識に失敗した場合は、文字領域に関連付けられる認識文字はない。
制御部203は、各認識セルの四辺(即ち、白画素塊の外接矩形の四辺)に太線枠を付けてスキャン画像を表示部204に表示する。表示された画面は図5となっている。なお、枠の形態は、太線でなくても実線でなくても良く、黒でなくても良いのは言うまでも無いが、これ以降は、太線であるものとして説明を続ける。また、この(7)で太線枠と共に表示されるスキャン画像は、(1)−(6)の処理が行われる前のスキャン画像であり、即ち、2値化前のスキャン画像である。
ユーザが受付部205を介して、表示部204に表示されている図5における任意の箇所をクリックする。なお、本明細書においてクリックとは、マウスの左ボタンを押して、すぐに(押してから一定時間内に)離す行為のことである。クリックされた箇所が認識セルの外接矩形の内側の場合に、制御部203は、その認識セルが選択されたと判定する(S801)。図6に、認識セル602が選択された際に表示される表示画面を示す。ここでは、認識セル602が選択されたものとして以下説明を続ける。なお、601は、受付部205を介してユーザが指し示している場所を示すマウスポインタである。
S901では、制御部203は、認識セル位置変更ハンドル603を非表示にする。
上述の通り、ユーザが受付部205に対して行った操作が認識セル位置変更ハンドル603に対する操作であれば、制御部203は、S804(図10のS1001)に処理を進める。
図11を用いて、S905.1の処理の詳細を説明する。
左側の余白 x1−X1
右側の余白 X2−x2
(左側の余白)≧(右側の余白)ならば、基準線は文字領域の右辺、すなわち、(x2,y2),(x2,y2)を結ぶ直線に設定される。
(左側の余白)<(右側の余白)ならば、基準線は文字領域の左辺、すなわち、(x1,y1)、(x1,y2)を結ぶ直線に設定される。
左上座標(x2−W,y2−H)
右下座標(x2,y2)
となる。
左上座標(x1,y2−H)
右下座標(x1+W,y2)
となる。
図4において、認識セル406と認識セル407は、本来は単一のセルであるにも関わらず、ノイズの関係で別々の認識セルとして特定されている。認識セル406と認識セル407を結合して、単一の認識セルとする手段について、図15を用いて説明する。なお図15は、図10のS1001の認識セル位置変更の処理の詳細を示す。
制御部203が行うS802における編集ウィンドウに表示する認識文字の選択手段について図24のフローをもちいて詳細を説明する。
SOLD TO −−(1)
Kawasaki BlackBlue −−(2)
Co.,Ltd.−−(3)
53, Imai Kamicho,−−(4)
Nakahara−ku Kawasaki−shi,−−(5)
Kanagawa, 〒211−8511−−(6)
Tel−−(7)
044−987−6543−−(8)
Fax−−(9)
044−98706544−−(10)
の10個存在する。
図20−23を用いて、S904の詳細を説明する。
ρ=Xb1cosθ+Yb1sinθ・・・式1
この式1が表す直線を図19に図示する。
図22において、結合前の認識セルの内部の色の削除をした後、図11の処理で結合後の認識セルに編集後の文字を配置すると、削除されなかったスキャン画像のセルの罫線と配置した編集後の文字が重なってしまう場合がある。このような場合、結合前の認識セルに、編集後の文字列を分割して配置することで、スキャン画像のセルの罫線と編集後の文字が重ならずに文字を配置することができる。具体的な方法を以下に説明する。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
Claims (11)
- 文書の画像を取得する取得手段と、
前記画像に含まれる表領域から検出した白画素塊の外接矩形に基づいて、矩形の認識セルを特定する特定手段と、
前記認識セルを構成する四辺の周囲の領域それぞれから直線を検出する検出手段と、
前記画像において、前記検出手段で検出された四本の直線に囲まれた領域の内部の色情報を削除する削除手段と
を有することを特徴とする情報処理装置。 - 前記認識セルを構成する四辺の周囲の領域とは、各辺を基準として各辺の直行方向に広がった領域であることを特徴とする請求項1に記載の情報処理装置。
- 前記検出手段は、前記認識セルに対応するセルの罫線のエッジに基づいて前記直線を検出することを特徴とする請求項1又は2に記載の情報処理装置。
- 前記検出手段は、
前記四辺の周囲の領域からエッジ画素の検出を行うエッジ検出手段と、
前記エッジ検出手段で検出された各エッジ画素を通る線の重複回数に基づいて、前記直線を検出する罫線検出手段とを有する
ことを特徴とする請求項3に記載の情報処理装置。 - 前記罫線検出手段は、
一つの辺の周囲の領域から複数本の線が検出された場合に、前記認識セルの中心位置を基準として当該複数本の線のうちの最も内側の線を、前記直線として検出することを特徴とする請求項4に記載の情報処理装置。 - 前記特定手段で前記表領域から複数の認識セルが特定され、当該特定された複数の認識セルからユーザの操作に基づいて1つの認識セルが選択されて編集の指示が為された場合、前記削除手段は、前記画像において、当該選択された1つの認識セルを構成する四辺の周囲の領域それぞれから前記検出手段で検出された四本の直線に囲まれた領域の内部の色情報を削除することを特徴とする請求項1に記載の情報処理装置。
- 前記編集の指示は前記選択された1つの認識セルに配置される文字の編集の指示であって、当該文字の編集の指示が為された場合、前記画像において、前記選択された1つの認識セルを構成する四辺の周囲の領域それぞれから前記検出手段で検出された四本の直線に囲まれた領域の内部の色情報を前記削除手段で削除した後に、編集後の文字を前記選択された1つの認識セル内に配置する配置手段を更に有することを特徴とする請求項6に記載の情報処理装置。
- 前記削除手段は、前記検出手段で検出された四本の直線に囲まれた領域の内部の画素の色情報を、規定の色情報に置換することにより、前記検出手段で検出された四本の直線に囲まれた領域の内部の色情報を削除する、ことを特徴とする請求項1乃至7の何れか1項に記載の情報処理装置。
- 前記取得手段で取得される画像は、スキャナで前記文書をスキャンすることにより生成されるスキャン画像である、ことを特徴とする請求項1乃至8の何れか1項に記載の情報処理装置。
- 画像を取得する取得工程と、
前記画像に含まれる表領域から検出した白画素塊の外接矩形に基づいて、矩形の認識セルを特定する特定工程と、
前記認識セルを構成する四辺の周囲の領域それぞれから直線を検出する検出工程と、
前記画像において、前記検出工程で検出された四本の直線に囲まれた領域の内部の色情報を削除する削除工程と
を有することを特徴とする情報処理方法。 - 請求項1乃至9の何れか1項に記載の情報処理装置の各手段として、コンピュータを機能させるためのコンピュータで読み取り可能なプログラム。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2014209332A JP6463066B2 (ja) | 2014-07-07 | 2014-10-10 | 情報処理装置、情報処理方法、プログラム |
| US14/791,070 US9898845B2 (en) | 2014-07-07 | 2015-07-02 | Information processing apparatus, information processing method, and storage medium |
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2014139868 | 2014-07-07 | ||
| JP2014139868 | 2014-07-07 | ||
| JP2014209332A JP6463066B2 (ja) | 2014-07-07 | 2014-10-10 | 情報処理装置、情報処理方法、プログラム |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JP2016027444A JP2016027444A (ja) | 2016-02-18 |
| JP2016027444A5 JP2016027444A5 (ja) | 2017-11-09 |
| JP6463066B2 true JP6463066B2 (ja) | 2019-01-30 |
Family
ID=55017338
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2014209332A Active JP6463066B2 (ja) | 2014-07-07 | 2014-10-10 | 情報処理装置、情報処理方法、プログラム |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US9898845B2 (ja) |
| JP (1) | JP6463066B2 (ja) |
Families Citing this family (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP6808330B2 (ja) * | 2016-02-26 | 2021-01-06 | キヤノン株式会社 | 情報処理装置、情報処理方法、及びプログラム |
| JP6531738B2 (ja) * | 2016-08-08 | 2019-06-19 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
| JP6900164B2 (ja) * | 2016-09-27 | 2021-07-07 | キヤノン株式会社 | 情報処理装置、情報処理方法及びプログラム |
| JP6696445B2 (ja) * | 2017-01-18 | 2020-05-20 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
| KR102655430B1 (ko) * | 2021-02-22 | 2024-04-08 | 네이버 주식회사 | 테이블 생성 방법 및 시스템 |
| JP2022174656A (ja) * | 2021-05-11 | 2022-11-24 | 広島県公立大学法人 | コンクリート構造物検査システム、コンクリート構造物検査用ドローンおよびコンクリート構造物検査方法 |
| JP2022178570A (ja) * | 2021-05-20 | 2022-12-02 | シャープ株式会社 | 画像処理装置、制御方法及びプログラム |
Family Cites Families (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH07107694B2 (ja) * | 1984-08-31 | 1995-11-15 | 株式会社日立製作所 | 文書処理装置 |
| JPS61193281A (ja) * | 1985-02-22 | 1986-08-27 | Hitachi Ltd | 文書入力方式 |
| JP2001094760A (ja) * | 1999-09-22 | 2001-04-06 | Canon Inc | 情報処理装置 |
| JP5374220B2 (ja) * | 2009-04-23 | 2013-12-25 | キヤノン株式会社 | 動きベクトル検出装置およびその制御方法、ならびに撮像装置 |
| JP5867045B2 (ja) * | 2011-12-12 | 2016-02-24 | 富士ゼロックス株式会社 | 画像処理装置及びプログラム |
| US9165187B2 (en) * | 2012-01-12 | 2015-10-20 | Kofax, Inc. | Systems and methods for mobile image capture and processing |
-
2014
- 2014-10-10 JP JP2014209332A patent/JP6463066B2/ja active Active
-
2015
- 2015-07-02 US US14/791,070 patent/US9898845B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| US9898845B2 (en) | 2018-02-20 |
| US20160005203A1 (en) | 2016-01-07 |
| JP2016027444A (ja) | 2016-02-18 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6463066B2 (ja) | 情報処理装置、情報処理方法、プログラム | |
| EP2966578B1 (en) | Information processing apparatus, information processing method, program, and storage medium | |
| US6587587B2 (en) | System and methods for spacing, storing and recognizing electronic representations of handwriting, printing and drawings | |
| US10222971B2 (en) | Display apparatus, method, and storage medium | |
| JP6797636B2 (ja) | サーバ装置、情報処理方法、及びプログラム | |
| US10607381B2 (en) | Information processing apparatus | |
| CN107133615B (zh) | 信息处理设备和信息处理方法 | |
| JP6150766B2 (ja) | 情報処理装置、プログラム、及び自動ページ差し替え方法 | |
| JP2013168018A (ja) | 画像処理装置、画像処理装置の制御方法及びプログラム | |
| US20160349968A1 (en) | Methods of Content-Based Image Area Selection | |
| JP5981175B2 (ja) | 図面表示装置、及び図面表示プログラム | |
| US11588945B2 (en) | Data input support apparatus that displays a window with an item value display area, an overview image display area, and an enlarged image display area | |
| US8355577B2 (en) | Image processing apparatus and method | |
| JP5921156B2 (ja) | 印刷装置、レイアウト変更方法、及びプログラム | |
| JP5917016B2 (ja) | 情報処理装置、その制御方法、および制御プログラム | |
| CN113506354A (zh) | 一种文字渲染方法、装置及电子设备 | |
| CN105302431A (zh) | 图像处理设备、图像处理方法和图像处理系统 | |
| JP6452329B2 (ja) | 情報処理装置、情報処理方法、プログラム | |
| JP7324305B2 (ja) | 電子帳票作成装置、電子帳票作成方法、及びプログラム | |
| US10146763B2 (en) | Renderable text extraction tool | |
| JP6489768B2 (ja) | 情報処理装置、情報処理方法、プログラム | |
| JP6370162B2 (ja) | 情報処理装置、情報処理方法、プログラム | |
| JP2013164659A (ja) | 画像処理装置、画像処理装置の制御方法、及びプログラム | |
| US10404872B2 (en) | Multi-function device with selective redaction | |
| JP2014211747A (ja) | 画像処理装置、端末装置、情報処理方法及びプログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170926 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170926 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180905 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180918 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181116 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181204 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181228 |
|
| R151 | Written notification of patent or utility model registration |
Ref document number: 6463066 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |