JP7761130B2 - 文字認識システム、文字認識方法および文字認識プログラム - Google Patents
文字認識システム、文字認識方法および文字認識プログラムInfo
- Publication number
- JP7761130B2 JP7761130B2 JP2024508871A JP2024508871A JP7761130B2 JP 7761130 B2 JP7761130 B2 JP 7761130B2 JP 2024508871 A JP2024508871 A JP 2024508871A JP 2024508871 A JP2024508871 A JP 2024508871A JP 7761130 B2 JP7761130 B2 JP 7761130B2
- Authority
- JP
- Japan
- Prior art keywords
- preprint
- image
- characters written
- recognition
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/192—Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
- G06V30/194—References adjustable by an adaptive method, e.g. learning
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Description
本発明の第1の実施形態について、図を参照して詳細に説明する。図1は、本実施形態の帳票処理システムの構成の例を示す図である。帳票処理システムは、一例として、文字認識システム10と、スキャナー20と、情報処理サーバ30を備える。文字認識システム10は、例えば、ネットワークを介して、スキャナー20と接続する。また、文字認識システム10は、ネットワークを介して、情報処理サーバ30と接続する。スキャナー20および情報処理サーバ30は、複数であってもよい。スキャナー20および情報処理サーバ30の数は、特に限定されない。
本発明の第2の実施形態について図を参照して詳細に説明する。図16は、本実施形態の帳票処理システムの構成の例を示す図である。帳票処理システムは、一例として、文字認識システム40と、スキャナー20と、情報処理サーバ30を備える。文字認識システム40は、例えば、ネットワークを介して、スキャナー20と接続する。また、文字認識システム40は、ネットワークを介して、情報処理サーバ30と接続する。スキャナー20および情報処理サーバ30は、複数であってもよい。スキャナー20および情報処理サーバ30の数は、特に限定されない。また、本実施形態のスキャナー20と、情報処理サーバ30の機能は、第1の実施形態のスキャナー20と、情報処理サーバ30と同様である。
11 取得部
12 画像抽出部
13 認識部
14 出力部
15 生成部
16 記憶部
20 スキャナー
30 情報処理サーバ
40 文字認識システム
41 認識部
42 生成部
51 変換部
52 画像認識部
100 コンピュータ
101 CPU
102 メモリ
103 記憶装置
104 入出力I/F
105 通信I/F
Claims (9)
- プレプリントを含む帳票のプレプリント上に記載された文字を写した画像を取得する取得手段と、
プレプリント上に記載された文字を写した画像の画素データおよびプレプリントを写したプレプリント画像の画素データを画素ごとに結合したデータから前記プレプリント上に記載された文字を認識する認識モデルを用いて、取得した前記画像の画素データおよび前記プレプリント画像の画素データを画素ごとに結合したデータから、取得した前記画像のプレプリント上に記載された文字を認識する認識手段と、
前記認識の結果を出力する出力手段と
を備える文字認識システム。 - 変換パラメータを用いて、前記プレプリント画像を変換する変換手段をさらに備え、
前記認識手段は、取得した前記画像の画素データおよび変換された前記プレプリント画像の画素データを画素ごとに結合したデータから、取得した前記画像のプレプリント上に記載された文字を認識する、
請求項1に記載の文字認識システム。 - 前記変換手段は、前記画像の画素データおよび変換された前記プレプリント画像の画素データを画素ごとに結合したデータから変換パラメータを推定する変換モデルを用いて、前記プレプリント画像を変換する、
請求項2に記載の文字認識システム。 - 前記認識手段は、前記画像から前記プレプリント上に記載された文字を認識する対象の帳票の種類を特定し、特定した帳票の種類に対応する定義データを基に、プレプリント上に記載された文字を認識する、
請求項1から3いずれかに記載の文字認識システム。 - 前記認識手段は、帳票上におけるプレプリントの位置が定義された定義データを基に、プレプリント上に記載された文字を認識する、
請求項1から4いずれかに記載の文字認識システム。 - プレプリント上に記載された文字を写した画像の画素データおよび前記プレプリント画像の画素データを画素ごとに結合したデータと、プレプリント上に記載されている文字との関係を学習し、プレプリント上に記載された文字を写した画像の画素データおよび前記プレプリント画像の画素データを画素ごとに結合したデータから、前記画像のプレプリント上に記載された文字を認識する認識モデルを生成する生成手段をさらに備える、
請求項1から5いずれかに記載の文字認識システム。 - 前記生成手段は、プレプリント上に記載された文字を写した画像の画素データおよび前記プレプリント画像の画素データを画素ごとに結合したデータと、変換パラメータとの関係を学習し、前記プレプリント画像の変換に用いる変換パラメータを推定する変換モデルを生成する、
請求項6に記載の文字認識システム。 - プレプリントを含む帳票のプレプリント上に記載された文字を写した画像を取得し、
プレプリント上に記載された文字を写した画像の画素データおよびプレプリントを写したプレプリント画像の画素データを画素ごとに結合したデータから前記プレプリント上に記載された文字を認識する認識モデルを用いて、取得した前記画像の画素データおよび前記プレプリント画像の画素データを画素ごとに結合したデータから、取得した前記画像のプレプリント上に記載された文字を認識し、
前記認識の結果を出力する、
文字認識方法。 - プレプリントを含む帳票のプレプリント上に記載された文字を写した画像を取得する処理と、
プレプリント上に記載された文字を写した画像の画素データおよびプレプリントを写したプレプリント画像の画素データを画素ごとに結合したデータから前記プレプリント上に記載された文字を認識する認識モデルを用いて、取得した前記画像の画素データおよび前記プレプリント画像の画素データを画素ごとに結合したデータから、取得した前記画像のプレプリント上に記載された文字を認識する処理と、
前記認識の結果を出力する処理と
をコンピュータに実行させる文字認識プログラム。
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PCT/JP2022/013389 WO2023181149A1 (ja) | 2022-03-23 | 2022-03-23 | 文字認識システム、文字認識方法および記録媒体 |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JPWO2023181149A1 JPWO2023181149A1 (ja) | 2023-09-28 |
| JPWO2023181149A5 JPWO2023181149A5 (ja) | 2024-11-07 |
| JP7761130B2 true JP7761130B2 (ja) | 2025-10-28 |
Family
ID=88100226
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2024508871A Active JP7761130B2 (ja) | 2022-03-23 | 2022-03-23 | 文字認識システム、文字認識方法および文字認識プログラム |
Country Status (2)
| Country | Link |
|---|---|
| JP (1) | JP7761130B2 (ja) |
| WO (1) | WO2023181149A1 (ja) |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007148846A (ja) | 2005-11-29 | 2007-06-14 | Nec Corp | Ocr装置、フォームアウト方法及びフォームアウトプログラム |
| JP2020123272A (ja) | 2019-01-31 | 2020-08-13 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
| JP2021043650A (ja) | 2019-09-10 | 2021-03-18 | キヤノン株式会社 | 画像処理装置、画像処理システム、画像処理方法、及びプログラム |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH05266247A (ja) * | 1992-03-19 | 1993-10-15 | Toshiba Corp | 画像データ処理システム |
-
2022
- 2022-03-23 JP JP2024508871A patent/JP7761130B2/ja active Active
- 2022-03-23 WO PCT/JP2022/013389 patent/WO2023181149A1/ja not_active Ceased
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007148846A (ja) | 2005-11-29 | 2007-06-14 | Nec Corp | Ocr装置、フォームアウト方法及びフォームアウトプログラム |
| JP2020123272A (ja) | 2019-01-31 | 2020-08-13 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
| JP2021043650A (ja) | 2019-09-10 | 2021-03-18 | キヤノン株式会社 | 画像処理装置、画像処理システム、画像処理方法、及びプログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| WO2023181149A1 (ja) | 2023-09-28 |
| JPWO2023181149A1 (ja) | 2023-09-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US12354396B2 (en) | System for information extraction from form-like documents | |
| US11461552B2 (en) | Automated document review system combining deterministic and machine learning algorithms for legal document review | |
| US20190279170A1 (en) | Dynamic resource management associated with payment instrument exceptions processing | |
| US8897563B1 (en) | Systems and methods for automatically processing electronic documents | |
| CN109902271B (zh) | 基于迁移学习的文本数据标注方法、装置、终端及介质 | |
| CN101276412A (zh) | 信息处理装置、信息处理系统和信息处理方法 | |
| US20190340429A1 (en) | System and Method for Processing and Identifying Content in Form Documents | |
| US12175786B2 (en) | Systems, methods, and devices for automatically converting explanation of benefits (EOB) printable documents into electronic format using artificial intelligence techniques | |
| US11699297B2 (en) | Image analysis based document processing for inference of key-value pairs in non-fixed digital documents | |
| Tornés et al. | Receipt dataset for document forgery detection | |
| CN117831052A (zh) | 金融表单的识别方法及其装置、电子设备及存储介质 | |
| CN111881880A (zh) | 一种基于新型网络的票据文本识别方法 | |
| JP7761130B2 (ja) | 文字認識システム、文字認識方法および文字認識プログラム | |
| US10922537B2 (en) | System and method for processing and identifying content in form documents | |
| Lerouge et al. | DocXPand-25k: a large and diverse benchmark dataset for identity documents analysis | |
| JP2020140706A (ja) | 情報処理方法、情報処理装置及びスキャナ | |
| CN117542054A (zh) | 一种信息识别方法、装置、存储介质及电子设备 | |
| JP2024021728A (ja) | 文字認識モデルの学習方法、文字認識方法、文字認識モデル学習装置、学習モデル、文字認識装置 | |
| CN102648474B (zh) | 对待与服务关联的文档进行分类的方法、以及相关的扫描仪 | |
| Reed et al. | Hybrid CNN–LSTM Framework for OCR-Based Text Extraction from Receipts | |
| CN118366175B (zh) | 一种基于字频的文档图像分类方法 | |
| US12230047B2 (en) | Systems and methods for reading flat cards | |
| TWI807467B (zh) | 要項偵測模型建立方法、業務導向要項鍵值辨識系統及方法 | |
| US20250292227A1 (en) | Document remembrance and counterfeit detection | |
| KR20240157344A (ko) | 인공지능 금융문서 정보 추출 시스템 및 방법 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240902 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240902 |
|
| RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20250203 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250217 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250708 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250828 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250916 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250929 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7761130 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |