Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP5636766B2 - 画像処理装置及び画像処理プログラム - Google Patents
[go: Go Back, main page]

JP5636766B2 - 画像処理装置及び画像処理プログラム - Google Patents

画像処理装置及び画像処理プログラム Download PDF

Info

Publication number
JP5636766B2
JP5636766B2 JP2010146014A JP2010146014A JP5636766B2 JP 5636766 B2 JP5636766 B2 JP 5636766B2 JP 2010146014 A JP2010146014 A JP 2010146014A JP 2010146014 A JP2010146014 A JP 2010146014A JP 5636766 B2 JP5636766 B2 JP 5636766B2
Authority
JP
Japan
Prior art keywords
calculating
calculation means
character
image
weight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010146014A
Other languages
English (en)
Other versions
JP2012008909A (ja
Inventor
木村 俊一
俊一 木村
瑛一 田中
瑛一 田中
関野 雅則
雅則 関野
久保田 聡
聡 久保田
越 裕
裕 越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2010146014A priority Critical patent/JP5636766B2/ja
Publication of JP2012008909A publication Critical patent/JP2012008909A/ja
Application granted granted Critical
Publication of JP5636766B2 publication Critical patent/JP5636766B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

本発明は、画像処理装置及び画像処理プログラムに関する。
画像から文字画像を切り出す技術がある。
これに関連する技術として、例えば、特許文献1には、文字認識において文字の大きさや形、ピッチ等が文書毎に異なっていても精度のよい認識を行うことを目的とし、言語的に正しいと思われる部分の文字を確定文字検出部が確定文字として検出し、認識結果出力部が認識結果として出力する一方、文字矩形情報検出部が確定文字の矩形情報を検出し、矩形評価関数の最適化を行い、矩形分割統合部は最適化された矩形評価関数に基づいてまだ確定されていない部分の基本矩形の分割・統合を行うことによって新たな基本矩形を求め、再び候補文字選出部以下の処理を行い、また筆記者推定部が確定文字から得た情報を用いて候補文字選出部で用いる辞書を最適化することが開示されている。
また、例えば、特許文献2には、文書画像から高速にかつ正確に文字の切り出しを可能とし、さらに、漢字やひらがななどに英数字記号の混在する文書における文字の切り出しを高速にかつ正確に行うことを目的とし、各外接矩形の形状情報から切り出し候補を推定し、この推定した切り出し候補に対して文字認識を行い、この文字認識の結果により切り出し確定可能と判断された切り出し候補に対してはそれを切り出し結果として確定し、前記文字認識の結果により切り出し確定可能と判断されなかった切り出し候補に対しては、各外接矩形の組み合わせによる複数の切り出し候補を推定し、それぞれの切り出し候補毎に個々の矩形に対する認識評価値を求め、これら個々の矩形に対する認識評価値を用いた各切り出し候補毎の組み合わせ評価値のうち最適な組み合わせ評価値を得た切り出し候補を切り出し結果として確定し、また、英数字記号のみを対象とした認識を行って、英数字記号のみを先に確定したのちに、英数字記号と確定された文字以外の文字の切り出しを行うことが開示されている。
また、例えば、特許文献3には、文字識別や文字列照合で、文字の切り出し方が確定できない場合でも、高い精度で文字を切り出し文字列を認識することを課題とし、多重仮説検定型の文字切り出し処理において、まず従来の方法で全部の切り出し方の中からより正しいと判断される複数の切り出し方の候補を選別し、次いで本発明の方法である各文字パターンの大きさや前後のパターンとの位置関係に基づき切り出し方の仮説の妥当性を評価するための評価値(概形ペナルティ)を求め、この仮定は予め収集登録しサンプルを学習して求めた線形識別関数により行い、このようにして正しい切り出し方を判別することにより、大きさや位置関係の情報を容易に扱えるようになることが開示されている。
特開平05−174187号公報 特開平08−161432号公報 特開平09−185681号公報
本発明は、画像内に存在する文字画像を切り出す位置を決定する場合にあって、切り出す位置の候補の評価値が特異の値となった場合に、その特異な評価値だけによって切り出す位置が決定されてしまうことを防ぐようにした画像処理装置及び画像処理プログラムを提供することを目的としている。
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、画像内に存在する1つの文字画像を切り出す位置の候補に関する複数の特徴量に対して、重み付き線形和を計算する第1の計算手段と、前記第1の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記1つの文字画像を切り出す位置の候補の評価値を計算する第2の計算手段と、前記第2の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定する切出位置決定手段と、文字画像の切り出し位置の教師データを受け付ける受付手段と、前記切出位置決定手段によって決定された切り出し位置と前記受付手段によって受け付けられた教師データを比較して、切り出し位置の正解個数又は誤り個数を算出する個数算出手段と、前記個数算出手段によって算出された切り出し位置の正解個数又は誤り個数に基づいて、1文字分の文字切り出し位置における前記第1の計算手段で用いる重みを変更する重み変更手段を具備し、前記重み変更手段は、現在の重みでの場合の正解個数又は誤り個数に基づいた値から変更後の重みでの正解個数又は誤り個数に基づいた値への変更量から次の重みを決定することを特徴とする画像処理装置である。
請求項2の発明は、画像内に存在する1つの文字画像を切り出す位置の候補に関する複数の特徴量に対して、重み付き線形和を計算する第1の計算手段と、前記第1の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記1つの文字画像を切り出す位置の候補の評価値を計算する第2の計算手段と、前記第2の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定する切出位置決定手段と、前記第1の計算手段と前記第2の計算手段による組を複数有し、前記複数の第2の計算手段によって計算された評価値に対して、重み付き線形和を計算する第3の計算手段と、前記第3の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記1つの文字画像を切り出す位置の候補の評価値を計算する第4の計算手段を具備し、前記切出位置決定手段は、前記第4の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定し、文字画像の切り出し位置の教師データを受け付ける受付手段と、前記切出位置決定手段によって決定された切り出し位置と前記受付手段によって受け付けられた教師データを比較して、切り出し位置の正解個数又は誤り個数を算出する個数算出手段と、前記個数算出手段によって算出された切り出し位置の正解個数又は誤り個数に基づいて、1文字分の文字切り出し位置における前記第1の計算手段、又は前記第3の計算手段で用いる重みを変更する重み変更手段を具備し、前記重み変更手段は、現在の重みでの場合の正解個数又は誤り個数に基づいた値から変更後の重みでの正解個数又は誤り個数に基づいた値への変更量から次の重みを決定することを特徴とする画像処理装置である。
請求項3の発明は、画像内に存在する1つの文字画像を切り出す位置の候補に関する複数の特徴量に対して、重み付き線形和を計算する第1の計算手段と、前記第1の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記1つの文字画像を切り出す位置の候補の評価値を計算する第2の計算手段と、前記第2の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定する切出位置決定手段と、前記第1の計算手段と前記第2の計算手段による組を複数有し、前記複数の第2の計算手段によって計算された評価値の和を計算する第5の計算手段を具備し、前記切出位置決定手段は、前記第5の計算手段によって計算された評価値の和に基づいて、前記画像内に存在する文字画像を切り出す位置を決定し、文字画像の切り出し位置の教師データを受け付ける受付手段と、前記切出位置決定手段によって決定された切り出し位置と前記受付手段によって受け付けられた教師データを比較して、切り出し位置の正解個数又は誤り個数を算出する個数算出手段と、前記個数算出手段によって算出された切り出し位置の正解個数又は誤り個数に基づいて、1文字分の文字切り出し位置における前記第1の計算手段で用いる重みを変更する重み変更手段を具備し、前記重み変更手段は、現在の重みでの場合の正解個数又は誤り個数に基づいた値から変更後の重みでの正解個数又は誤り個数に基づいた値への変更量から次の重みを決定することを特徴とする画像処理装置である。
請求項4の発明は、画像内に存在する1つの文字画像を切り出す位置の候補に関する複数の特徴量に対して、重み付き線形和を計算する第1の計算手段と、前記第1の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記1つの文字画像を切り出す位置の候補の評価値を計算する第2の計算手段と、前記第2の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定する切出位置決定手段と、前記第1の計算手段と前記第2の計算手段による組を複数有し、前記複数の第2の計算手段によって計算された評価値に対して、重み付き線形和を計算する第3の計算手段と、前記第3の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記1つの文字画像を切り出す位置の候補の評価値を計算する第4の計算手段を具備し、前記切出位置決定手段は、前記第4の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定し、前記第1の計算手段と前記第2の計算手段による複数の組と、前記第3の計算手段と前記第4の計算手段による組を複数有し、前記複数の第4の計算手段によって計算された評価値の和を計算する第6の計算手段を具備し、前記切出位置決定手段は、前記第6の計算手段によって計算された評価値の和に基づいて、前記画像内に存在する文字画像を切り出す位置を決定し、文字画像の切り出し位置の教師データを受け付ける受付手段と、前記切出位置決定手段によって決定された切り出し位置と前記受付手段によって受け付けられた教師データを比較して、切り出し位置の正解個数又は誤り個数を算出する個数算出手段と、前記個数算出手段によって算出された切り出し位置の正解個数又は誤り個数に基づいて、1文字分の文字切り出し位置における前記第1の計算手段、又は前記第3の計算手段で用いる重みを変更する重み変更手段を具備し、前記重み変更手段は、現在の重みでの場合の正解個数又は誤り個数に基づいた値から変更後の重みでの正解個数又は誤り個数に基づいた値への変更量から次の重みを決定することを特徴とする画像処理装置である。
請求項の発明は、コンピュータを、画像内に存在する1つの文字画像を切り出す位置の候補に関する複数の特徴量に対して、重み付き線形和を計算する第1の計算手段と、前記第1の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記1つの文字画像を切り出す位置の候補の評価値を計算する第2の計算手段と、前記第2の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定する切出位置決定手段と、文字画像の切り出し位置の教師データを受け付ける受付手段と、前記切出位置決定手段によって決定された切り出し位置と前記受付手段によって受け付けられた教師データを比較して、切り出し位置の正解個数又は誤り個数を算出する個数算出手段と、前記個数算出手段によって算出された切り出し位置の正解個数又は誤り個数に基づいて、1文字分の文字切り出し位置における前記第1の計算手段で用いる重みを変更する重み変更手段として機能させ、前記重み変更手段は、現在の重みでの場合の正解個数又は誤り個数に基づいた値から変更後の重みでの正解個数又は誤り個数に基づいた値への変更量から次の重みを決定することを特徴とする画像処理プログラムである。
請求項6の発明は、コンピュータを、画像内に存在する1つの文字画像を切り出す位置の候補に関する複数の特徴量に対して、重み付き線形和を計算する第1の計算手段と、前記第1の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記1つの文字画像を切り出す位置の候補の評価値を計算する第2の計算手段と、前記第2の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定する切出位置決定手段と、前記第1の計算手段と前記第2の計算手段による組を複数有し、前記複数の第2の計算手段によって計算された評価値に対して、重み付き線形和を計算する第3の計算手段と、前記第3の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記1つの文字画像を切り出す位置の候補の評価値を計算する第4の計算手段として機能させ、前記切出位置決定手段は、前記第4の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定し、文字画像の切り出し位置の教師データを受け付ける受付手段と、前記切出位置決定手段によって決定された切り出し位置と前記受付手段によって受け付けられた教師データを比較して、切り出し位置の正解個数又は誤り個数を算出する個数算出手段と、前記個数算出手段によって算出された切り出し位置の正解個数又は誤り個数に基づいて、1文字分の文字切り出し位置における前記第1の計算手段、又は前記第3の計算手段で用いる重みを変更する重み変更手段として機能させ、前記重み変更手段は、現在の重みでの場合の正解個数又は誤り個数に基づいた値から変更後の重みでの正解個数又は誤り個数に基づいた値への変更量から次の重みを決定することを特徴とする画像処理プログラムである。
請求項7の発明は、コンピュータを、画像内に存在する1つの文字画像を切り出す位置の候補に関する複数の特徴量に対して、重み付き線形和を計算する第1の計算手段と、前記第1の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記1つの文字画像を切り出す位置の候補の評価値を計算する第2の計算手段と、前記第2の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定する切出位置決定手段と、前記第1の計算手段と前記第2の計算手段による組を複数有し、前記複数の第2の計算手段によって計算された評価値の和を計算する第5の計算手段として機能させ、前記切出位置決定手段は、前記第5の計算手段によって計算された評価値の和に基づいて、前記画像内に存在する文字画像を切り出す位置を決定し、文字画像の切り出し位置の教師データを受け付ける受付手段と、前記切出位置決定手段によって決定された切り出し位置と前記受付手段によって受け付けられた教師データを比較して、切り出し位置の正解個数又は誤り個数を算出する個数算出手段と、前記個数算出手段によって算出された切り出し位置の正解個数又は誤り個数に基づいて、1文字分の文字切り出し位置における前記第1の計算手段で用いる重みを変更する重み変更手段として機能させ、前記重み変更手段は、現在の重みでの場合の正解個数又は誤り個数に基づいた値から変更後の重みでの正解個数又は誤り個数に基づいた値への変更量から次の重みを決定することを特徴とする画像処理プログラムである。
請求項8の発明は、コンピュータを、画像内に存在する1つの文字画像を切り出す位置の候補に関する複数の特徴量に対して、重み付き線形和を計算する第1の計算手段と、前記第1の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記1つの文字画像を切り出す位置の候補の評価値を計算する第2の計算手段と、前記第2の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定する切出位置決定手段と、前記第1の計算手段と前記第2の計算手段による組を複数有し、前記複数の第2の計算手段によって計算された評価値に対して、重み付き線形和を計算する第3の計算手段と、前記第3の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記1つの文字画像を切り出す位置の候補の評価値を計算する第4の計算手段として機能させ、前記切出位置決定手段は、前記第4の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定し、前記第1の計算手段と前記第2の計算手段による複数の組と、前記第3の計算手段と前記第4の計算手段による組を複数有し、前記複数の第4の計算手段によって計算された評価値の和を計算する第6の計算手段として機能させ、前記切出位置決定手段は、前記第6の計算手段によって計算された評価値の和に基づいて、前記画像内に存在する文字画像を切り出す位置を決定し、文字画像の切り出し位置の教師データを受け付ける受付手段と、前記切出位置決定手段によって決定された切り出し位置と前記受付手段によって受け付けられた教師データを比較して、切り出し位置の正解個数又は誤り個数を算出する個数算出手段と、前記個数算出手段によって算出された切り出し位置の正解個数又は誤り個数に基づいて、1文字分の文字切り出し位置における前記第1の計算手段、又は前記第3の計算手段で用いる重みを変更する重み変更手段として機能させ、前記重み変更手段は、現在の重みでの場合の正解個数又は誤り個数に基づいた値から変更後の重みでの正解個数又は誤り個数に基づいた値への変更量から次の重みを決定することを特徴とする画像処理プログラムである。
請求項1の画像処理装置によれば、画像内に存在する文字画像を切り出す位置を決定する場合にあって、切り出す位置の候補の評価値が特異の値となった場合に、その特異な評価値だけによって切り出す位置が決定されてしまうことを防ぐことができる。また、画像内に存在する文字画像を切り出す位置を決定する場合にあって、評価値を計算するために利用する重みを決定することができる。
請求項2の画像処理装置によれば、本構成を有していない場合に比較して、画像内に存在する文字画像を切り出す位置を精度よく決定することができる。また、画像内に存在する文字画像を切り出す位置を決定する場合にあって、評価値を計算するために利用する重みを決定することができる。
請求項3の画像処理装置によれば、本構成を有していない場合に比較して、画像内に存在する文字画像を切り出す位置を精度よく決定することができる。また、画像内に存在する文字画像を切り出す位置を決定する場合にあって、評価値を計算するために利用する重みを決定することができる。
請求項4の画像処理装置によれば、本構成を有していない場合に比較して、画像内に存在する文字画像を切り出す位置を精度よく決定することができる。また、画像内に存在する文字画像を切り出す位置を決定する場合にあって、評価値を計算するために利用する重みを決定することができる。
請求項の画像処理プログラムによれば、画像内に存在する文字画像を切り出す位置を決定する場合にあって、切り出す位置の候補の評価値が特異の値となった場合に、その特異な評価値だけによって切り出す位置が決定されてしまうことを防ぐことができる。また、画像内に存在する文字画像を切り出す位置を決定する場合にあって、評価値を計算するために利用する重みを決定することができる。
請求項6の画像処理プログラムによれば、本構成を有していない場合に比較して、画像内に存在する文字画像を切り出す位置を精度よく決定することができる。また、画像内に存在する文字画像を切り出す位置を決定する場合にあって、評価値を計算するために利用する重みを決定することができる。
請求項7の画像処理プログラムによれば、本構成を有していない場合に比較して、画像内に存在する文字画像を切り出す位置を精度よく決定することができる。また、画像内に存在する文字画像を切り出す位置を決定する場合にあって、評価値を計算するために利用する重みを決定することができる。
請求項8の画像処理プログラムによれば、本構成を有していない場合に比較して、画像内に存在する文字画像を切り出す位置を精度よく決定することができる。また、画像内に存在する文字画像を切り出す位置を決定する場合にあって、評価値を計算するために利用する重みを決定することができる。
第1の実施の形態の構成例についての概念的なモジュール構成図である。 第1の実施の形態のアーク評価値決定モジュール内の構成例についての概念的なモジュール構成図である。 教師用データテーブルのデータ構造例を示す説明図である。 第2の実施の形態のアーク評価値決定モジュール内の構成例についての概念的なモジュール構成図である。 第3の実施の形態のアーク評価値決定モジュール内の構成例についての概念的なモジュール構成図である。 第3の実施の形態のアーク評価値算出モジュール内の構成例についての概念的なモジュール構成図である。 教師用データテーブルのデータ構造例を示す説明図である。 アーク候補決定モジュール、アーク評価値決定モジュール、文字切り出し位置決定モジュールの関係例を示す説明図である。 第4の実施の形態の構成例についての概念的なモジュール構成図である。 第1〜第4の実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。 文字列画像の例を示す説明図である。 文字境界候補の例を示す説明図である。 外接矩形の例を示す説明図である。 文字切り出し結果の例を示す説明図である。 文字切り出し位置を示すグラフ表現の例を示す説明図である。 グラフ表現内のパターン2の例を示す説明図である。 一般的な文字切り出し、文字認識を行う画像処理装置の構成例についての概念的なモジュール構成図である。 文字切り出し位置を示すグラフ表現にアーク評価値を付加した例を示す説明図である。 特徴量空間において直線で分離できる場合の例を示す説明図である。 特徴量空間において直線では分離できない場合の例を示す説明図である。
本実施の形態は、例えば文字認識等のように文字画像を対象とした処理を行う場合に、画像内に存在する文字画像を切り出すためのものである。
まず、本実施の形態を説明する前に、その前提又は本実施の形態を利用する画像処理装置について説明する。なお、この説明は、本実施の形態の理解を容易にすることを目的とするものである。
例えば、図11の例に示すような文字列画像を対象とする。まず、この文字列画像を文字セグメントに分割する。文字セグメントとは、文字そのもの、あるいは文字の一部となる可能性がある文字部分である。ここでは、図11の例に示すような横書きの文字列画像を例にとる。横書きの画像では、垂直な線(あるいは垂直に近い線)で分割を行うことにより、文字セグメントに分割する。例えば図12に示した縦線(切れ目候補1210、切れ目候補1220)で、文字列画像を分割して、3つの文字セグメント「イ」、「ヒ」、及び、「学」を得ることができる。図12の例に示した縦線を切れ目候補と呼ぶこととする。切れ目候補1210が「イ」と「ヒ」を分け、切れ目候補1220が「ヒ」と「学」を分けている。
次に、図13の例に示すように、各文字セグメントに対し、その外接矩形(外接矩形1310、外接矩形1320、外接矩形1330)を抽出する。
以下、特許文献3に記載されている技術内容を例にして説明する。なお、以下の説明で用いる用語は、特許文献3で用いる用語とは異なっている場合がある。
前述の文字セグメントを統合して、文字画像を決定する。複数の文字セグメントを統合して1つの文字画像を形成する場合もあれば、1つの文字セグメントが1つの文字となる場合もある。文字画像を決定するとは、文字の切り出し位置を決定することと同値であるから、以下では文字切り出し位置の決定という場合もある。
文字セグメントの統合のパターンは複数存在する。複数存在するパターンの中で、最も文字画像として評価の高いものを選択することによって、最終的な文字切り出し位置を決定する。
図13の例に対しては、全ての文字切り出しパターンは、図14に示す例のようになる。つまり、図14(a)の例では、パターン1として3つの文字画像(外接矩形1310、1320、1330)、図14(b)の例では、パターン2として2つの文字画像(外接矩形1310と1320、1330)、図14(c)の例では、パターン3として1つの文字画像(外接矩形1310と1320と1330)、図14(d)の例では、パターン4として2つの文字画像(外接矩形1310、外接矩形1320と1330)を示している。
文字切り出し位置を示すグラフ表現として、図14の例に示した複数の切り出しパターンを表すことができる。図15の例において、グラフは、始点ノード1500、終点ノード1590、中間ノード1510(ノード1)、中間ノード1520(ノード2)の4つのノードと、ノード間を接続するアークで構成されている(ノード間の接続線をアークと呼ぶこととする)。始点は、文字列画像の左端、終点は文字列画像の右端にあたる。中間ノード1510(ノード1)、中間ノード1520(ノード2)は、それぞれ、文字の切れ目候補位置(すなわち、図12の例に示した切れ目候補1210、切れ目候補1220)を示す。中間ノード1510(ノード1)は、切れ目候補1210に対応している。また、中間ノード1520(ノード2)は、切れ目候補1220に対応している。
始点から、各ノードを通って、終点に至る経路を以下、「パス」と呼ぶ。パスは、1又は複数のアークから構成される。通常、複数のパスが存在する。図14の例に示した文字切り出しパターンは、これらの複数のパスに対応している。例えば、図14(b)の例に示したパターン2は、図16の太線で示したパス(文字切り出しパターン1504、文字切り出しパターン1522)と対応している。
ここで、どれか1つのアークには、1つの文字画像の候補が対応している。例えば、始点ノード1500と中間ノード1520(ノード2)を結ぶアークには、「化」という文字画像(文字切り出しパターン1504)が対応している。1つのアークに対応する文字に対して、その文字の評価値を決定することができる。これを「アーク評価値」と呼ぶこととする。
アーク評価値は、文字の形状情報や、文字認識における認識確度などから算出する。この詳細に関しては後述する。
ここで、図17を用いて、一般的な文字切り出し、文字認識を行う画像処理装置の構成例についての概念的なモジュール構成図を説明する。
この画像処理装置は、画像受付モジュール110、文字列抽出モジュール120、文字境界候補抽出モジュール130、アーク特徴量抽出モジュール140、線形重み付け加算モジュール1710、文字切り出しモジュール160、文字認識モジュール170を有している。
画像受付モジュール110は、文字列抽出モジュール120と接続されており、対象となる画像を受け付けて、その画像を文字列抽出モジュール120へ渡す。画像を受け付けるとは、例えば、スキャナ、カメラ等で画像を読み込むこと、ファックス等で通信回線を介して外部機器から画像を受信すること、ハードディスク(コンピュータに内蔵されているものの他に、ネットワークを介して接続されているもの等を含む)等に記憶されている画像を読み出すこと等が含まれる。画像は、2値画像、多値画像(カラー画像を含む)であってもよい。受け付ける画像は、1枚であってもよいし、複数枚であってもよい。また、画像の内容として、文字が含まれていれば、ビジネスに用いられる文書、広告宣伝用のパンフレット等であってもよい。
文字列抽出モジュール120は、画像受付モジュール110、文字境界候補抽出モジュール130と接続されており、画像受付モジュール110から画像を受け取り、その画像から文字列画像を抽出し、その文字列画像を文字境界候補抽出モジュール130へ渡す。文字列画像の抽出は、従来から知られている技術を用いるようにしてもよい。例えば、横方向又は縦方向に存在する黒画素数のヒストグラムを作成し、そのヒストグラムについて予め定められた幅を有しており、隣のヒストグラムと予め定められた距離以上離れているものを文字列の画像として抽出する。
文字境界候補抽出モジュール130は、文字列抽出モジュール120、アーク特徴量抽出モジュール140と接続されており、文字列抽出モジュール120から文字列画像を受け取り、文字列画像の境界候補を抽出し、その境界候補をアーク特徴量抽出モジュール140へ渡す。例えば、図12の例に示した切れ目候補1210、切れ目候補1220である。
アーク特徴量抽出モジュール140は、文字境界候補抽出モジュール130、線形重み付け加算モジュール1710と接続されており、文字境界候補抽出モジュール130から境界候補を受け取り、その境界候補の特徴量を抽出し、複数の特徴量を特徴量ベクトルとして線形重み付け加算モジュール1710へ渡す。前述の文字切り出し位置を示すグラフ表現における各アークの特徴量を抽出する。アークの特徴量については後述する。アーク特徴量は一般的には複数であるが、1つであってもよい。以下、アーク特徴量を特徴量ベクトルともいう。
線形重み付け加算モジュール1710は、アーク特徴量抽出モジュール140、文字切り出しモジュール160と接続されており、アーク特徴量抽出モジュール140から特徴量ベクトルを受け取り、その特徴量ベクトルのアーク評価値を計算し、そのアーク評価値を文字切り出しモジュール160へ渡す。アーク評価値の計算については後述する。
文字切り出しモジュール160は、線形重み付け加算モジュール1710、文字認識モジュール170と接続されており、線形重み付け加算モジュール1710からアーク評価値を受け取り、アーク評価値に基づいて、切れ目候補の選択、つまり文字列画像内に存在する文字画像を切り出す位置を決定し、その切れ目候補に沿って文字画像を文字列画像(又は画像受付モジュール110が受け取った画像)から切り出し、その文字画像を文字認識モジュール170へ渡す。アーク評価値に基づいてとは、例えば、アーク評価値が最も高い値(1つの文字を切り出している可能性が高いことを示している値)のものを選択することである。
文字認識モジュール170は、文字切り出しモジュール160と接続されており、文字切り出しモジュール160から文字画像を受け取り、その文字画像を文字認識して、認識結果としての文字コードを出力する。
アーク特徴量抽出モジュール140、線形重み付け加算モジュール1710の処理について説明する。
1つのパスは、複数のアークから構成されている。複数のアーク評価値を用いて、そのアークから構成されるパスの評価値を計算することができる。これを「パス評価値」と呼ぶこととする。
パス評価値としては、例えば、アーク評価値の重み付け和などが相当する。特許文献3に記載されている技術では、アーク内の文字セグメント数で重み付けを行う。
文字切り出し位置を決定するため、複数のパスの中で、最もパス評価値の高いパスを選択する。パスが選択できれば、文字切り出し位置が確定して、さらに、文字認識結果も確定することになる。
図16の例では、太線のパスが選択されたとする。この場合、文字切り出し位置は、始点ノード1500と、中間ノード1520(ノード2)と、終点ノード1590の3点となる。また、文字認識結果は、「化」、「学」となる。
特に、線形重み付け加算モジュール1710が行うアーク評価値の算出方法を説明する。
特許文献3に記載の技術では、文字形状情報と、文字認識確度情報の重み付き線形和を用いて、文字評価値を算出する。さらに具体的には、特許文献3に記載の技術では、下記のようにアーク評価値の算出を行う。
まず、各アークに対応する文字の外接矩形を作る。これは、図14の例に示す各パターン内の各文字の外接矩形に相当する。以下、各アークに対応する文字の外接矩形を、アークの外接矩形と呼ぶ。
次に、下記のように、アークの特徴量(複数)を計算する。
: 該当アークの外接矩形の高さ
: 該当アークの外接矩形の幅
: 該当アークの外接矩形と、左側アークの外接矩形の間隔
: 該当アークの外接矩形と、右側アークの外接矩形の間隔
: 該当アーク内の文字セグメントの外接矩形間の最大の間隔
: 該当アーク内の連結成分数
さらに、文字類似度を、fとする。
特許文献3に記載の技術では、アーク評価値Vを式(1)で決定する。ただし、この場合、(1)式でN=7とする。
Figure 0005636766
つまり、文字形状情報(f〜f)と、文字認識確度情報fの重み付け線形和でアーク評価値は決定される。wは、線形和算出時の重みである。cは定数である。 特許文献3の記述方法では、式(1)の記載ではなく、別の形式で記述されている。しかし、記述の違いはあるが、数学的には同じとなっている。
線形重み付け加算モジュール1710は、特徴量ベクトルとして、特徴量である前述のf〜fの値を受け付ける。ここでは特徴数をNとしている。線形重み付け加算モジュール1710の内部動作は、式(1)で示されるものである。そして、アーク評価値Vを文字切り出しモジュール160へ渡す。
次に、特許文献3に記載の技術を実施した場合に起こり得る現象について説明する。
<現象1>
特許文献3に記載の技術では、特徴量の線形和をアーク評価値としていた。線形和であるため、特徴量の内容によっては、アーク評価値の値域はマイナス無限大〜プラス無限大の値を取り得る。
このように線形和を用いてアーク評価値を算出すると、アーク評価値が非常に高い値や非常に低い値になってしまう場合がある。
アーク評価値が非常に高い値や非常に低い値になってしまう場合、全体のパス評価値がその非常に高い、あるいは、非常に低い値に引きずられてしまう場合がある。例えば、ここではパス評価値をアーク評価値の重み付き和で評価するとする。重みは適当に定める。ここでは従来技術のようにアーク内の文字セグメント数で重み付けを行うとする。
図15の例において、図18の例に示すような評価値となっているとする。
このようなアーク評価値となっている場合、例えば、アーク内の文字セグメント数で重み付けを行うとすると、
・文字切り出しパターン1504「化」、文字切り出しパターン1522「学」の場合のパス評価値は、10×2+10=30 である。
・文字切り出しパターン1506「イ」、文字切り出しパターン1512「ヒ」、文字切り出しパターン1522「学」の場合のパス評価値は、1+100+10=111 である。
すなわち、「ヒ」のアーク評価値が他の評価値と比べて高すぎるために、他の評価値が小さい場合(すなわち、文字らしくない場合、例えば、文字切り出しパターン1506「イ」のアーク評価値は1)でも、その値に引きずられて、「ヒ」を含むパスが選択されてしまうこととなる。
<現象2>
ここで、アーク特徴量ベクトルf=(f, …, f)、重みベクトルをw=(w, …, w)とする。また、アーク評価値関数をV(f)とする。式(1)は、式(2)のようになる。
Figure 0005636766
次に、正解切り出し位置に対応するアーク特徴量ベクトルをf、不正解切り出し位置に対応するアーク特徴量ベクトルをfとする。
アーク評価値関数が妥当であるためには、式(3)のような関係になることが望ましい。つまり、正解切り出し位置の場合のアーク評価値は、不正解切り出し位置の場合のアーク評価値よりも大きな値であることが望ましい。
Figure 0005636766
正解アーク、不正解アークは複数存在するため、式(3)のような関係を得るためには、正解切り出し位置の場合のアーク評価値の最小値VTminと、不正解切り出し位置の場合のアーク評価値の最大値VFmaxとの関係が、式(4)のようになる必要がある。
Figure 0005636766
式(4)が成り立つとき、式(5)を満たす値Vが存在する。
Figure 0005636766
ここで、特徴量ベクトルはN次元の空間内に存在する。式(1)又は式(2)は、このN次元特徴量空間における超平面を形成する。つまり、アーク評価値V(f)が、所定の値Vとなるような特徴量ベクトルfの集合は、式(6)で示される超平面上に存在することになる。
Figure 0005636766
(6)式で表すことのできる超平面は(5)式より、正解切り出し位置の場合の特徴量ベクトル(正解特徴量ベクトル)の分布と、不正解切り出し位置の場合の特徴量ベクトル(不正解特徴量ベクトル)の分布を完全に分離することになる。このように、特徴量空間内の超平面で、正解特徴量ベクトルの分布と不正解特徴量ベクトルの分布を分離することができれば、(3)式を満たすことができて、妥当なアーク評価値関数を設計することが可能となる。
簡単のため、特徴量空間が2次元の場合を図示する。2次元の場合には、超平面は直線となる。図19の例に示す破線1930のように、正解特徴量分布1920と不正解特徴量分布1910が直線で分離できる場合は問題がない。
特許文献3に記載の技術では、式(1)を採用しているため、分離面は超平面以外にはあり得ない。ところが、実際には、正解と不正解の分離面は超平面ではなく、もっと複雑な形状を示している可能性がある。超平面で分離不可能な複雑な形状を正解と不正解の分布が持つ場合、特許文献3に記載の技術では対応できない。
例えば、図20の例に示すような正解特徴量分布2020と不正解特徴量分布2010の分布の場合、もはや直線で分離することは不可能である。このような場合、特許文献3に記載の技術では、妥当なアーク評価値を求めることができなくなる。つまり、式(7)で示されるような現象が起こってしまう。この現象が起きると、間違った文字切り出し位置であるにも関わらず、高いアーク評価値を得ることになってしまう。結果として、文字切り出し位置を誤ることになる。
Figure 0005636766
以上で、本実施の形態の前提又は本実施の形態を利用する画像処理装置についての説明を終了する。
以下、図面に基づき本発明を実現するにあたっての好適な各種の実施の形態の例を説明する。
<第1の実施の形態>
図1は、第1の実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
本実施の形態である画像処理装置は、図1の例に示すように、画像受付モジュール110、文字列抽出モジュール120、文字境界候補抽出モジュール130、アーク特徴量抽出モジュール140、アーク評価値決定モジュール150、文字切り出しモジュール160、文字認識モジュール170を有している。なお、前述の図17の例に示した画像処理装置と同種の部位には同一符号を付し重複した説明を省略する。したがって、アーク評価値決定モジュール150を詳細に説明する。ただし、文字列抽出モジュール120、文字境界候補抽出モジュール130、アーク特徴量抽出モジュール140については、より詳細に説明する。
文字列抽出モジュール120は、画像受付モジュール110、文字境界候補抽出モジュール130と接続されている。
文字列抽出モジュール120は、対象としている画像から横書き又は縦書きである1列の文字列画像を抽出する。ここで、列とは、横書きの場合は、横に並ぶ列であり、縦書きの場合は縦に並ぶ列である。
画像として、複数の文字列が存在するものがある。このような複数文字列を単一の文字列になるように分離する手法としては、従来よりさまざまなものが提案されているため、それらを用いればよい。
単一の文字列となるように分離する例として、特開平4−311283号公報、特開平3−233789号公報、特開平5−73718号公報、特開2000−90194号公報等に記載の技術がある。これらの手法や、その他の手法を用いればよい。
文字境界候補抽出モジュール130は、文字列抽出モジュール120、アーク特徴量抽出モジュール140と接続されている。
文字境界候補抽出モジュール130は、1列の文字列画像を受け取り、複数の文字セグメントに分割する。この文字セグメント分割方式としてもさまざまな方式があるため、そのうちのどれかを用いればよい。例えば、特開平5−114047号公報、特開平4−100189号公報、特開平4−92992号公報、特開平4−68481号公報、特開平9−54814号公報等に記載の技術、特許文献3の特に0021段落に記載の文字の境界候補抽出方式、特開平5−128308号公報の特に0005段落に記載の文字切り出し位置決定方式等を用いればよい。これ以外の方法でももちろん構わない。
アーク特徴量抽出モジュール140は、文字境界候補抽出モジュール130、アーク評価値決定モジュール150と接続されている。
アーク特徴量抽出モジュール140が抽出するアークの特徴量ベクトルの内容としては、特に限定しない。例えば、前述したf〜fの特徴量を用いてもよい。その他の特徴量を用いてもよい。特徴量ベクトルの次元数(すなわち、特徴量の種類数)に関しても、さまざまであって、何次元でも構わない。
また、文字を切り出した後に文字認識を行い、その文字認識確度をアークの特徴量の1つとして用いる場合の具体例に関して補足する。これは、特許文献3に記載の技術では文字類似度として示していた量である。
文字認識確度としては、文字認識時に出力した文字コードの確信度合いあるいは尤度のようなものを得ることができればよい。このような文字認識確度を得る手法としても、従来よりさまざまな手法が提案されているため、そのうちのいずれかを用いればよい。例えば、特許文献3の0024段落に記載の方式、特許文献2の0051段落に記載の認識評価値取得方式等を用いてもよい。その他の手法を用いてもよい。
アーク評価値決定モジュール150は、アーク特徴量抽出モジュール140、文字切り出しモジュール160と接続されており、アーク特徴量抽出モジュール140から特徴量ベクトルを受け取り、その特徴量ベクトルを用いてアーク評価値を決定し、そのアーク評価値を文字切り出しモジュール160に渡す。
アーク評価値決定モジュール150は、他のアーク評価値と比べた場合に非常に大きなアーク評価値、他のアーク評価値と比べた場合に非常に小さなアーク評価値による影響が大きくなることを防ぐものである。つまり、他のアーク評価値と比べた場合に大きなアーク評価値の場合にはその大きさによる影響を小さくし、小さなアーク評価値の場合にはその小ささによる影響を小さくする。手法としては、特徴量の重み付け加算結果に対して、さらに、以下の特徴を持った非線形関数を付与する。非線形関数としては、(1)単調関数であって、(2)入力がプラス無限大のときや、マイナス無限大のとき、所定の値に収束すること、又は、ある中心位置から外れれば外れるほど、その傾きの絶対値が小さくなる関数である。
図2は、第1の実施の形態のアーク評価値決定モジュール150内の構成例についての概念的なモジュール構成図である。アーク評価値決定モジュール150は、線形重み付け加算モジュール210、非線形関数モジュール220を有している。線形重み付け加算モジュール210と非線形関数モジュール220は接続されている。
線形重み付け加算モジュール210は、アーク特徴量抽出モジュール140から特徴ベクトルとして、特徴量1〜N(画像内に存在する1つの文字画像を切り出す位置の候補に関する複数の特徴量)を受け取り、前述の図17の例の線形重み付け加算モジュール1710と同等の重み付き線形和の計算処理を行う。その結果を非線形関数モジュール220へ渡す。
非線形関数モジュール220は、線形重み付け加算モジュール210から計算結果を引数として受け取り、その引数が極限の値の場合に予め定められた値に収束するようになる、又はその引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又はその非線形単調関数に近似する関数によって、1つの文字画像を切り出す位置の候補の評価値(アーク評価値)を計算する。つまり、アーク評価関数によって計算する。
アーク評価値関数をV(f)とすると、この構成の演算は、式(8)となる。入力特徴量ベクトルをf、重みベクトルをw、重みのスカラー値をcとしている。σ()は非線形関数である。
Figure 0005636766
このような構成を採ることによって、極端に大きな(あるいは極端に小さな)値をとった場合の影響を少なくする。
図18に示した例で、非線形関数(線形重み付け加算モジュール210)の入出力を、例えば、下記のような場合について説明する。
入力:1 出力:1
入力:10 出力:2
入力:100 出力:3
このようにすると、
パス1:「化」「学」の場合のパス評価値は、2×2+2=6
パス2:「イ」「ヒ」「学」の場合のパス評価値は、1+3+2=6
となって、値100の影響を小さくすることができて、パス1とパス2の評価値が同程度の値となる。
非線形関数の例としては、ハイパーボリックタンジェント関数、ロジスティックシグモイド関数など、前述の「非線形関数条件」に合致するものであれば、どのような関数であってもよい。
本実施の形態を実際に使用する場合には、線形重み付け加算モジュール210における重み(すなわち、wとc)を決定しなければならない。そのため、図3の例に示すような教師用データテーブル300を用意する。
教師用データテーブル300は、データ番号欄310、特徴量1欄320、特徴量2欄330、特徴量N欄380、正解/非正解欄390等を有している。データ番号欄310は、アークを一意に識別するデータ番号を記憶する。例えば、各アークに対して個別のデータ番号を1から順に与えることにする。特徴量1欄320から特徴量N欄380は、アーク特徴量抽出モジュール140が抽出した特徴量を記憶する。つまり、あるアークの特徴量をアーク特徴量抽出モジュール140が抽出し、それを教師用データテーブル300の表の横に並べて入力する。さらに、そのアークが正解の文字の切れ目を表している場合には正解/非正解欄390に例えば1と入力する。そのアークが正解の文字の切れ目を表していない場合には正解/非正解欄390に例えば0と入力する。
以上のように作成したデータを教師データとして、特徴量を入力したときに、前述の正解/非正解データとできるだけ近い値を得ることができるように重みを決定すればよい。
できるだけ近い値の評価方法としては、以下のような手法がある。まず、各アークに番号を与えるデータ番号をkとする。データ番号kのアークに対して、アーク評価値決定モジュール150を用いて算出したアーク評価値をVとする。また、番号kのアークの教師データをtとする。ここでは、例えば、
・正解のとき t=1
・不正解のとき t=0
とする。
このとき、(9)式を最小とするように重みを決定すればよい。
Figure 0005636766
又は、(10)式を最小とするように重みを決定すればよい。
Figure 0005636766
又は、(11)式を最小とするように重みを決定すればよい。
Figure 0005636766
これらに限らず、Vとtの値の差が小さいとき小さくなるような評価値を最小とするように重みを決定する方法であれば、どのようなものでもよい。
重み決定方式としては、一般的なロジスティック回帰の回帰係数決定方式や、単層パーセプトロンの重み決定方式を利用すればよい。
文字切り出しモジュール160は、アーク評価値決定モジュール150、文字認識モジュール170と接続されており、アーク評価値決定モジュール150によって計算されたアーク評価値に基づいて、文字列画像内に存在する文字画像を切り出す位置を決定し、文字列画像(又は画像受付モジュール110が受け取った画像)から文字画像を切り出す。
<第2の実施の形態>
第1の実施の形態では、非線形関数を単調関数としたため、出力のアーク評価値の大きさは変わるが、その相対的な順番を変えることはない。つまり、前述の<現象2>は起こり得る。
第2の実施の形態は、図1の例に示した構成を有しており、アーク評価値決定モジュール150が線形重み付け加算と非線形関数の組による処理を2度繰り返す構成を採る。
図4は、第2の実施の形態のアーク評価値決定モジュール150内の構成例についての概念的なモジュール構成図である。
アーク評価値決定モジュール150は、線形重み付け加算モジュール1−1:411、線形重み付け加算モジュール1−2:412、・・・、線形重み付け加算モジュール1−M:41M、非線形関数σ1−1モジュール421、非線形関数σ1−2モジュール422、・・・、非線形関数σ1−Mモジュール42M、線形重み付け加算モジュール2:430、非線形関数σモジュール440を有している。図4において、複数の特徴量(特徴量1〜特徴量N)を特徴量ベクトルとして1本の線で記述している。
線形重み付け加算モジュール1−1:411は、非線形関数σ1−1モジュール421と接続されている。
線形重み付け加算モジュール1−2:412は、非線形関数σ1−2モジュール422と接続されている。
線形重み付け加算モジュール1−M:41Mは、非線形関数σ1−Mモジュール42Mと接続されている。
非線形関数σ1−1モジュール421は、線形重み付け加算モジュール1−1:411、線形重み付け加算モジュール2:430と接続されている。
非線形関数σ1−2モジュール422は、線形重み付け加算モジュール1−2:412、線形重み付け加算モジュール2:430と接続されている。
非線形関数σ1−Mモジュール42Mは、線形重み付け加算モジュール1−M:41M、線形重み付け加算モジュール2:430と接続されている。
線形重み付け加算モジュール1−1:411と非線形関数σ1−1モジュール421の組み合わせ、線形重み付け加算モジュール1−2:412と非線形関数σ1−2モジュール422の組み合わせ、線形重み付け加算モジュール1−M:41Mと非線形関数σ1−Mモジュール42Mの組み合わせは、第1の実施の形態における線形重み付け加算モジュール210と非線形関数モジュール220の組み合わせに該当する。
線形重み付け加算モジュール2:430は、非線形関数σ1−1モジュール421、非線形関数σ1−2モジュール422、非線形関数σ1−Mモジュール42M、非線形関数σモジュール440と接続されている。
非線形関数σモジュール440は、線形重み付け加算モジュール2:430と接続されている。
線形重み付け加算モジュール2:430は第1の実施の形態における線形重み付け加算モジュール210に該当し、非線形関数σモジュール440は第1の実施の形態における非線形関数モジュール220に該当する。
線形重み付け加算モジュール1−iと非線形関数σ1−iモジュールの組み合わせでは(ただし、i=1,2,…,M)、(12)式による演算を行って、出力値Uを得る。w1−i及びc1−iは、線形重み付け加算モジュール1−iで用いる重みである。なお、Mは、1段目の線形重み付け加算モジュールの数である。
Figure 0005636766
さらに、(13)式に示すようにUを定義する。
Figure 0005636766
線形重み付け加算モジュール2:430と非線形関数σモジュール440の組み合わせでは、(14)式による演算を行って、出力値Vを得る。w及びcは、線形重み付け加算モジュール2:430で用いる重みである。
Figure 0005636766
前述において、非線形関数σは非線形関数σ1−1モジュール421等の関数σ1−i(ただし、i=1,2,…,M)、及び関数σの複数存在している。これらの関数は同じであってもよいし、異なっていてもよい。典型的にはハイパーボリックタンジェント関数やロジスティックシグモイド関数などを共通に用いればよい。
第2の実施の形態においては、その構成が3層のパーセプトロンと同等となる。そのため、正解アークと非正解アークが非線形な分離面を持っていても対応が可能となる。また、通常の誤差逆伝播方式を用いて重み係数を決定するようにしてもよい。その際の教師データとしては、図13の例に示した教師用データテーブル300を用いればよい。第2の実施の形態のアーク評価値決定モジュール150を用いて算出したアーク評価値yと教師データtの値の差が小さいとき小さくなるような評価値の例も、第1の実施と同等である。
<第3の実施の形態>
第3の実施の形態は、図1の例に示した構成を有しており、さらに、アーク評価値決定モジュール150内で、第2の実施の形態のアーク評価値決定モジュール150を複数用いて、その和を取るものである。
1つの推定器であるアーク評価値決定モジュール150の性能が悪くても、複数の推定器を用いることによって、性能を上げることが可能である。例えば、3つの推定器があるとする。そのうち、1つの推定器が不正解で、残り2つの推定器が正解であるとする。この3つの多数決を取って、正解のほうを採用することによって、正解の推定を行うことが可能となる。
本実施の形態の例では、多数決の演算を加算によって行う。
図5は、第3の実施の形態のアーク評価値決定モジュール150内の構成例についての概念的なモジュール構成図である。
アーク評価値決定モジュール150は、アーク評価値算出モジュール1:511、アーク評価値算出モジュール2:512、アーク評価値算出モジュールK:51K、アーク評価値加算モジュール520を有している。
アーク評価値算出モジュール1:511、アーク評価値算出モジュール2:512、アーク評価値算出モジュールK:51Kは、それぞれアーク評価値加算モジュール520と接続されている。
第3の実施の形態では、複数のアーク評価値算出モジュール(アーク評価値算出モジュール1〜アーク評価値算出モジュールK)を用いる。アーク評価値算出モジュールjの出力は、Vとする。
アーク評価値算出モジュールjは、第2の実施の形態のアーク評価値決定モジュール150と同等の構成を採る。
図6は、第3の実施の形態のアーク評価値算出モジュール内の構成例についての概念的なモジュール構成図である。
線形重み付け加算モジュールj−1−1:611、線形重み付け加算モジュールj−1−2:612、線形重み付け加算モジュールj−1−Mj:61M、非線形関数σj−1−1モジュール621、非線形関数σj−1−2モジュール622、非線形関数σj−1−Mjモジュール62M、線形重み付け加算モジュールj−2:630、非線形関数σj−2モジュール640を有している。
線形重み付け加算モジュールj−1−1:611は、非線形関数σj−1−1モジュール621と接続されている。
線形重み付け加算モジュールj−1−2:612は、非線形関数σj−1−2モジュール622と接続されている。
線形重み付け加算モジュールj−1−Mj:61Mは、非線形関数σj−1−Mjモジュール62Mと接続されている。
非線形関数σj−1−1モジュール621は、線形重み付け加算モジュールj−1−1:611、線形重み付け加算モジュールj−2:630と接続されている。
非線形関数σj−1−2モジュール622は、線形重み付け加算モジュールj−1−2:612、線形重み付け加算モジュールj−2:630と接続されている。
非線形関数σj−1−Mjモジュール62Mは、線形重み付け加算モジュールj−1−Mj:61M、線形重み付け加算モジュールj−2:630と接続されている。
線形重み付け加算モジュールj−2:630は、非線形関数σj−1−1モジュール621、非線形関数σj−1−2モジュール622、非線形関数σj−1−Mjモジュール62M、非線形関数σj−2モジュール640と接続されている。
非線形関数σj−2モジュール640は、線形重み付け加算モジュールj−2:630と接続されている。
アーク評価値算出モジュールjは、各構成要素に添え字jが付与されていることを除いて、第2の実施の形態と動作は同等である。以下、動作を示す。線形重み付け加算器j−1−iと非線形関数σj−1−iの組み合わせでは(ただし、i=1,2,…,Mj)、(15)式による演算を行って、出力値Uj−iを得る。wj−1−i及びcj−1−iは、線形重み付け加算モジュールj−1−iが用いる重みである。Mjは、1段目の線形重み付け加算モジュールの数である。
Figure 0005636766
さらに、(16)式に示すようにUを定義する。
Figure 0005636766
線形重み付け加算モジュールj−2と非線形関数σj−2モジュールの組み合わせでは、(17)式による演算を行って、出力値Vを得る。wj−2及びcj−2は、線形重み付け加算モジュールj−2が用いる重みである。
Figure 0005636766
アーク評価値加算モジュール520では、アーク評価値算出モジュール1:511、アーク評価値算出モジュール2:512、・・・、アーク評価値算出モジュールK:51Kによって計算されたアーク評価値の和を計算する。具体的には、例えば、(18)式を用いて、アーク評価値Vを算出する。
Figure 0005636766
このVが、第3の実施の形態のアーク評価値決定モジュール150が文字切り出しモジュール160へ渡すアーク評価値である。
第3の実施の形態においては、重みwj−1−i、cj−1−i、wj−2及びcj−2を決定する必要がある。ただし、i=1,2,…,Mj、j=1,2,…,Kである。
前記の重み決定方法としては、文献「J. Friedman, T. Hastie, R. Tibshirani著 “Additive Logistic Regression: a Statistical View of Boosting”、Annals of Statistics、Vol. 28, No. 2, pp. 337−407, 2000」に記載のジェントルアダブースト方式と呼ばれる方式を用いるようにしてもよい。
以下、ここでは、説明の都合上、非線形関数σとして、例えば、入力がマイナス無限大で0、プラス無限大で1になる関数を用いることとする。実際にはマイナス無限大やプラス無限大で収束する値に応じて線形変換を行えば、入力がマイナス無限大で−1、プラス無限大で1になる関数などに変更してもよい。
次に、教師用データとして、図7の例に示す教師用データテーブル700を用意する。教師用データテーブル700は、データ番号欄710、特徴量1欄720、特徴量2欄730、特徴量N欄770、正解/非正解欄780、ウエイト欄790等を有している。これは、図3の例に示す教師用データテーブル300にウエイト欄790を追加したものである。ここで、「ウエイト」と「重み」は、意味的には同じである。しかし、これまで、線形重み付け加算モジュールにおける係数に対して「重み」という用語を用いていたため、その用語と区別をするため、教師データの重みに関しては「ウエイト」という用語を用いることとする。また、データの量をGとする。
さらに、以下に示す手法を用いて重みを決定していく。
ここで、データ番号kに対して、正解/非正解を表す記号をyとする。第3の実施の形態においては、例えば、
・正解のとき y=+1
・不正解のとき y=−1
とする。
さらに、非線形関数σとして、ロジスティックシグモイド関数を採用する。このとき、Vは0〜1までの値を取る。
1.まず、図7の例に示した教師用データテーブル700内のデータのウエイトを全て等しく1/Gとする。
2.j=1とする。
(ア)各教師データのウエイトを用いて、その重み付け2乗誤差を最小とするように、アーク評価値算出モジュールjの重みを決定する。決定方法は、第2の実施の形態の説明で記載したものと同等である。通常は単なる2乗誤差を最小化するように重みを決定するのに対して、ウエイトで重み付けした重み付け2乗誤差を最小とするように重みを決定する点が異なる。
つまり、第1の実施の形態又は第2の実施の形態では、(19)式を最小とするように重みを決定していたのに対し、ここでは、(20)式を最小とするように重みを決定する。ただし、ここで、t=(y+1)/2の関係がある。
Figure 0005636766
Figure 0005636766
(イ)教師データのウエイトを更新する。
(イ−1)k番目のデータに対するアーク評価値をVjkとする。
(イ−2)ウエイトを(21)式で更新する。これは、アーク評価値の推定が間違ったデータのウエイトを大きくして、合っていたデータのウエイトを小さくする操作を示している。
Figure 0005636766
(ウ)もしjが所定の値以上になっているか、あるいは、評価値推定精度が十分であれば終了する。
(エ)jを1増大させて、(ア)に戻る。
前記(ア)では、2乗誤差を最小としているが、第1の実施の形態の説明でも述べたように、(10)式、(11)式その他の評価値を最小としてもよい。その場合のウエイトのつけ方も同等であり、各kに対してaを乗じればよい。具体的には(22)式のようになる。この(22)式を最小とするように重みを決定すればよい。
Figure 0005636766
又は、(23)式を最小とするように重みを決定すればよい。
Figure 0005636766
前述では、非線形関数σとして、ロジスティックシグモイド関数を採用する。このとき、Vは0〜1までの値を取るため、2Vjk−1の計算を行った。これは値域を−1〜+1の範囲に変更するためである。この変更は単に線形変換を行っているにすぎない。他の非線形関数を用いる場合においても、単に値域を−1〜+1の範囲にするように線形変換を行えばよい。
また、前述では、各アーク評価値算出モジュール(アーク評価値算出モジュール1:511、アーク評価値算出モジュール2:512、・・・、アーク評価値算出モジュールK:51K)に入力する特徴量ベクトルを同じものとしていたが、その内容を異なるものにしてもよい。
すなわち、
・アーク評価値算出モジュール1の入力を、文字セグメント外接矩形の高さのみとする。
・アーク評価値算出モジュール2の入力を、全ての特徴量とする。
・アーク評価値算出モジュール3の入力を、文字セグメント外接矩形の幅のみとする。
・ …
等としてもよい。
また、前述では、各アーク評価値算出器の構成は第2の実施の形態のアーク評価値決定モジュール150の構成(図4の例参照)としていたが、第1の実施の形態のアーク評価値決定モジュール150の構成(図2の例参照)を混在させて含んでもよいし、全てが第1の実施の形態のアーク評価値決定モジュール150の構成であってもよい。すなわち、
・アーク評価値算出器1が第2の実施の形態のアーク評価値決定モジュール150の構成
・アーク評価値算出器2が第1の実施の形態のアーク評価値決定モジュール150の構成
・アーク評価値算出器3が第2の実施の形態のアーク評価値決定モジュール150の構成
・ …
としてもよいし、
・アーク評価値算出器1が第1の実施の形態のアーク評価値決定モジュール150の構成
・アーク評価値算出器2が第1の実施の形態のアーク評価値決定モジュール150の構成
・アーク評価値算出器3が第1の実施の形態のアーク評価値決定モジュール150の構成
・ …
としてもよいし、
・アーク評価値算出器1が第2の実施の形態のアーク評価値決定モジュール150の構成
・アーク評価値算出器2が第2の実施の形態のアーク評価値決定モジュール150の構成
・アーク評価値算出器3が第2の実施の形態のアーク評価値決定モジュール150の構成
・ …
としてもよい。
<第4の実施の形態>
前述の実施の形態では、アーク評価値決定モジュール150において、アーク評価値を推定していることになる。
推定するアーク評価値の教師データとしては、例えば、そのアークが文字の正解切り出し位置に相当している場合は1として、不正解切り出し位置に相当している場合は0としていた。
その場合、以下の2通りの最適化(重み決定)となっていることになる。
・クラス0とクラス1の2クラス分類問題として、クラス分類の誤りができるだけ小さくなるように重みを決定する。
・0〜1の間に存在する推定値と、教師データ(0又は1)との2乗誤差(絶対値誤差、クロスエントロピー等の誤差を示すような評価値であってもよい)を最小化するように重みを決定する。
しかし、アーク評価値が不正確であっても、文字切り出し位置が正確であればよい。逆に、アーク評価値が正確であったとしても、文字切り出し位置が不正確ではいけない。
アーク評価値と、文字切り出し位置の正確さは、複雑な関係になっており、単調な関係ではない。図8に、アーク候補決定モジュール810、アーク評価値決定モジュール820、文字切り出し位置決定モジュール830の関係例を示す。
アーク候補決定モジュール810は、アーク評価値決定モジュール820と接続されている。
アーク評価値決定モジュール820は、アーク候補決定モジュール810、文字切り出し位置決定モジュール830と接続されている。
文字切り出し位置決定モジュール830は、アーク評価値決定モジュール820と接続されている。
文字認識の処理において、まずアーク候補決定モジュール810において、画像を受け付け、前述したように複数のアーク候補が抽出される。さらに、アーク評価値決定モジュール820において、アークの評価値が決定され、文字切り出し位置決定モジュール830において、複数のアーク候補の集合としての複数のパスの中から、最適なパスを選択されることによって、文字切り出し位置が確定する。なお、図1の例に示したモジュール構成と比較すると、アーク候補決定モジュール810は画像受付モジュール110〜アーク特徴量抽出モジュール140に該当し、アーク評価値決定モジュール820はアーク評価値決定モジュール150に該当し、文字切り出し位置決定モジュール830は文字切り出しモジュール160に該当する。
第1の実施の形態〜第3の実施の形態では、アーク評価値決定モジュール150におけるアーク評価値決定を、アークの中だけを参照して行っていたが、第4の実施の形態では上図全体を考えて、アーク評価値決定モジュール820で用いられる重みを決定する例を示す。
以下、アーク評価値決定モジュール820の構成は、第1の実施の形態〜第3の実施の形態の説明で述べたもののいずれかであるとする。
第4の実施の形態は、第1の実施の形態〜第3の実施の形態の重みを決定する方法に関するものである。アーク評価値決定モジュール820の構成は第1の実施の形態〜第3の実施の形態の例で示したアーク評価値決定モジュール150である。
図9は、第4の実施の形態の構成例についての概念的なモジュール構成図である。
第4の実施の形態の画像処理装置は、図9の例に示すように、アーク候補決定モジュール910、重み変更モジュール920、アーク評価値決定モジュール930、文字切り出し位置決定モジュール940、切り出し位置正解個数算出モジュール950を有している。なお、アーク候補決定モジュール910は図8の例に示したアーク候補決定モジュール810に該当し、アーク評価値決定モジュール930は図8の例に示したアーク評価値決定モジュール820に該当し、文字切り出し位置決定モジュール940は図8の例に示した文字切り出し位置決定モジュール830に該当する。
アーク候補決定モジュール910は、アーク評価値決定モジュール930と接続されており、画像を受け付け、アーク候補を決定する。
重み変更モジュール920は、アーク評価値決定モジュール930、切り出し位置正解個数算出モジュール950と接続されており、切り出し位置正解個数算出モジュール950によって算出された切り出し位置の正解個数に基づいて、1文字分の文字切り出し位置におけるアーク評価値決定モジュール930で用いる重みを変更する。そして、現在の重みでの場合の正解個数から変更後の重みでの正解個数への変更量から次の重みを決定する。
アーク評価値決定モジュール930は、アーク候補決定モジュール910、重み変更モジュール920、文字切り出し位置決定モジュール940と接続されており、アーク候補決定モジュール910からのアーク候補を受け取り、重み変更モジュール920からの重みを用いて、アーク評価値を決定する。
文字切り出し位置決定モジュール940は、アーク評価値決定モジュール930、切り出し位置正解個数算出モジュール950と接続されており、アーク評価値決定モジュール930からのアーク評価値に基づいて、画像内に存在する文字画像を切り出す位置を決定し、その決定された切り出し位置を切り出し位置正解個数算出モジュール950へ渡す。
切り出し位置正解個数算出モジュール950は、重み変更モジュール920、文字切り出し位置決定モジュール940と接続されており、文字切り出し位置決定モジュール940から切り出し位置と文字画像を切り出す位置の教師データを受け付け、文字切り出し位置決定モジュール940からの切り出し位置と教師データを比較して、切り出し位置の正解個数を算出する。
次に処理の流れを説明する。
まず、アーク候補決定モジュール910は画像を受け付け、アーク候補を決定する。
アーク評価値決定モジュール930が用いる初期の重みは、乱数であってもよいし、第1の実施の形態〜第3の実施の形態の説明に記載した手法で定めた重みであってもよい。いずれにせよ、重み変更モジュール920では、初期の重みを保持する。
次に、アーク評価値決定モジュール930はアーク評価値を決定する。そして、文字切り出し位置決定モジュール940が、そのアーク評価値を用いて、文字切り出し位置を決定する。
決定後の文字切り出し位置は、切り出し位置正解個数算出モジュール950に渡される。それとは別に、文字切り出し教師データが切り出し位置正解個数算出モジュール950に入力される。
ここで、文字切り出し結果とは、例えば、画像中の文字の外接矩形の位置、サイズと、文字コードのペアからなっている。文字切り出し教師データも同様である。
切り出し位置正解個数算出モジュール950では、
・教師文字:文字切り出し教師データ内に存在する、複数の文字(外接矩形の位置、サイズと、文字コードを持っている)
と、
・推定文字:文字切り出し位置決定モジュール940で決定した文字
との比較を行う。
教師文字と推定文字の文字切り出し位置、サイズと文字コードが一致した個数を、切り出し位置正解個数算出モジュール950では算出する。ここで、文字切り出し位置、サイズの一致の判定に関しては、微小なずれを許容するようにしてもよい。なお、文字コードの一致を判定せずに、文字切り出し位置、サイズの一致だけを判定してもよい。
以上のように判定した正解個数が、重み変更モジュール920に渡される。
重み変更モジュール920では、正解個数と、重み変更モジュール920内で保持している過去の重みを用いて、次の重みを決定する。
ここで、アーク評価値決定モジュール930で用いる重み(すなわち全てのwやc)を並べた重みベクトルをWとする。Wの要素を(W,W,…)とする。
また、初期重みをWとする。次の重みをWとする。このように次々に重みを更新していく。正解個数が増加しなくなった時点や、正解個数の増加率が所定の値以下になった時点、又は、繰り返し回数が予め定められた回数となった時点で重み変更の処理を終了して、その時点の重みをアーク評価値決定モジュール930に出力する。
次に、重み変更モジュール920の処理の詳細を説明する。
まず、文字切り出し正解個数をAとする。Aは、Wの関数である。すなわち、A(W)と記すことができる。Aを最大化するようにWを決定すればよい。さて、現在の重みをWとする。また、変更後の重みをWm+1とする。
重みの更新式は、(24)式となる。
Figure 0005636766
ここでαは重み更新の速度を規定するパラメタである。∇は、(25)式を示す演算子である。
Figure 0005636766
∇Aは、Wを変更したときのAの変化量を示す。この変化の方向にWを動かせばAを増大させることができる。
ただし、関数A(W)の内容が不明であるため、∇Aを解析的に計算することは不可能である。そこで、適当なεを定めて、(26)式又は(27)式として、数値演算的に∇Aを計算する。
Figure 0005636766
Figure 0005636766
又は、重みの更新の別の方法として下記の方法を用いる。ランダム、網羅的、又は予め定められたアルゴリズムを用いて更新量dWを設定して、(28)式とする。
Figure 0005636766
このWm+1を用いて、(29)式の関係を有しているならば、WをWm+1に更新する。(29)式の関係を有していなければ、更新せずに、次のdWを試す。
Figure 0005636766
以上で、正解個数を最大化する。
前述の説明では、正解個数を最大化していたが、誤り個数を最小化してもよい。又は、誤り率(すなわち、誤り個数/正解個数、又は誤り個数/(誤り個数+正解個数))を最小化してもよい。又は正解率(すなわち、正解個数/誤り個数、又は正解個数/(誤り個数+正解個数))を最大化してもよい。つまり、正解個数又は誤り個数に基づいた値として、正解個数、誤り個数、正解率、誤り率がある。
図10を参照して、第1〜第4の実施の形態の画像処理装置のハードウェア構成例について説明する。図10に示す構成は、例えばパーソナルコンピュータ(PC)などによって構成されるものであり、スキャナ等のデータ読み取り部1017と、プリンタなどのデータ出力部1018を備えたハードウェア構成例を示している。
CPU1001は、前述の実施の形態において説明した各種のモジュール、すなわち、図1、図2、図4、図5、図6、図8、図9、図17等の例に示した各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。
ROM(Read Only Memory)1002は、CPU1001が使用するプログラムや演算パラメータ等を格納する。RAM1003は、CPU1001の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス1004により相互に接続されている。
ホストバス1004は、ブリッジ1005を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス1006に接続されている。
キーボード1008、マウス等のポインティングデバイス1009は、操作者により操作される入力デバイスである。ディスプレイ1010は、液晶表示装置又はCRT(Cathode Ray Tube)などがあり、各種情報をテキストやイメージ情報として表示する。
HDD(Hard Disk Drive)1011は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU1001によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、画像、文字画像、文字切り出し位置、文字切り出し位置の候補、教師用データテーブル300、教師用データテーブル700などが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
ドライブ1012は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体1013に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース1007、外部バス1006、ブリッジ1005、及びホストバス1004を介して接続されているRAM1003に供給する。リムーバブル記録媒体1013も、ハードディスクと同様のデータ記録領域として利用可能である。
接続ポート1014は、外部接続機器1015を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート1014は、インタフェース1007、及び外部バス1006、ブリッジ1005、ホストバス1004等を介してCPU1001等に接続されている。通信部1016は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部1017は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部1018は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
なお、図10に示す画像処理装置のハードウェア構成は、1つの構成例を示すものであり、第1〜第4の実施の形態は、図10に示す構成に限らず、第1〜第4の実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図10に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。
なお、前述の各種の実施の形態を組み合わせてもよく(例えば、ある実施の形態内のモジュールを他の実施の形態内に適用する、入れ替えする等も含む)、各モジュールの処理内容として背景技術で説明した技術を採用してもよい。
なお、数式を用いて説明したが、数式には、その数式と同等のものが含まれる。同等のものとは、その数式そのものの他に、最終的な結果に影響を及ぼさない程度の数式の変形、又は数式をアルゴリズミックな解法で解くこと等が含まれる。
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray Disc(登録商標))、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
41M…線形重み付け加算モジュール1−M
42M…非線形関数σ1−Mモジュール
51K…アーク評価値算出モジュールK
61M…線形重み付け加算モジュールj−1−Mj
62M…非線形関数σj−1−Mjモジュール
110…画像受付モジュール
120…文字列抽出モジュール
130…文字境界候補抽出モジュール
140…アーク特徴量抽出モジュール
150…アーク評価値決定モジュール
160…文字切り出しモジュール
170…文字認識モジュール
210…線形重み付け加算モジュール
220…非線形関数モジュール
411…線形重み付け加算モジュール1−1
412…線形重み付け加算モジュール1−2
421…非線形関数σ1−1モジュール
422…非線形関数σ1−2モジュール
430…線形重み付け加算モジュール2
440…非線形関数σモジュール
511…アーク評価値算出モジュール1
512…アーク評価値算出モジュール2
520…アーク評価値加算モジュール
611…線形重み付け加算モジュールj−1−1
612…線形重み付け加算モジュールj−1−2
621…非線形関数σj−1−1モジュール
622…非線形関数σj−1−2モジュール
630…線形重み付け加算モジュールj−2
640…非線形関数σj−2モジュール
810…アーク候補決定モジュール
820…アーク評価値決定モジュール
830…文字切り出し位置決定モジュール
910…アーク候補決定モジュール
920…重み変更モジュール
930…アーク評価値決定モジュール
940…文字切り出し位置決定モジュール
950…切り出し位置正解個数算出モジュール
1710…線形重み付け加算モジュール

Claims (8)

  1. 画像内に存在する1つの文字画像を切り出す位置の候補に関する複数の特徴量に対して、重み付き線形和を計算する第1の計算手段と、
    前記第1の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記1つの文字画像を切り出す位置の候補の評価値を計算する第2の計算手段と、
    前記第2の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定する切出位置決定手段と、
    文字画像の切り出し位置の教師データを受け付ける受付手段と、
    前記切出位置決定手段によって決定された切り出し位置と前記受付手段によって受け付けられた教師データを比較して、切り出し位置の正解個数又は誤り個数を算出する個数算出手段と、
    前記個数算出手段によって算出された切り出し位置の正解個数又は誤り個数に基づいて、1文字分の文字切り出し位置における前記第1の計算手段で用いる重みを変更する重み変更手段
    を具備し、
    前記重み変更手段は、現在の重みでの場合の正解個数又は誤り個数に基づいた値から変更後の重みでの正解個数又は誤り個数に基づいた値への変更量から次の重みを決定する
    ことを特徴とする画像処理装置。
  2. 画像内に存在する1つの文字画像を切り出す位置の候補に関する複数の特徴量に対して、重み付き線形和を計算する第1の計算手段と、
    前記第1の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記1つの文字画像を切り出す位置の候補の評価値を計算する第2の計算手段と、
    前記第2の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定する切出位置決定手段と、
    前記第1の計算手段と前記第2の計算手段による組を複数有し、
    前記複数の第2の計算手段によって計算された評価値に対して、重み付き線形和を計算する第3の計算手段と、
    前記第3の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記1つの文字画像を切り出す位置の候補の評価値を計算する第4の計算手段
    を具備し、
    前記切出位置決定手段は、前記第4の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定し、
    文字画像の切り出し位置の教師データを受け付ける受付手段と、
    前記切出位置決定手段によって決定された切り出し位置と前記受付手段によって受け付けられた教師データを比較して、切り出し位置の正解個数又は誤り個数を算出する個数算出手段と、
    前記個数算出手段によって算出された切り出し位置の正解個数又は誤り個数に基づいて、1文字分の文字切り出し位置における前記第1の計算手段、又は前記第3の計算手段で用いる重みを変更する重み変更手段
    を具備し、
    前記重み変更手段は、現在の重みでの場合の正解個数又は誤り個数に基づいた値から変更後の重みでの正解個数又は誤り個数に基づいた値への変更量から次の重みを決定する
    ことを特徴とする画像処理装置。
  3. 画像内に存在する1つの文字画像を切り出す位置の候補に関する複数の特徴量に対して、重み付き線形和を計算する第1の計算手段と、
    前記第1の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記1つの文字画像を切り出す位置の候補の評価値を計算する第2の計算手段と、
    前記第2の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定する切出位置決定手段と、
    前記第1の計算手段と前記第2の計算手段による組を複数有し、
    前記複数の第2の計算手段によって計算された評価値の和を計算する第5の計算手段
    を具備し、
    前記切出位置決定手段は、前記第5の計算手段によって計算された評価値の和に基づいて、前記画像内に存在する文字画像を切り出す位置を決定し、
    文字画像の切り出し位置の教師データを受け付ける受付手段と、
    前記切出位置決定手段によって決定された切り出し位置と前記受付手段によって受け付けられた教師データを比較して、切り出し位置の正解個数又は誤り個数を算出する個数算出手段と、
    前記個数算出手段によって算出された切り出し位置の正解個数又は誤り個数に基づいて、1文字分の文字切り出し位置における前記第1の計算手段で用いる重みを変更する重み変更手段
    を具備し、
    前記重み変更手段は、現在の重みでの場合の正解個数又は誤り個数に基づいた値から変更後の重みでの正解個数又は誤り個数に基づいた値への変更量から次の重みを決定する
    ことを特徴とする画像処理装置。
  4. 画像内に存在する1つの文字画像を切り出す位置の候補に関する複数の特徴量に対して、重み付き線形和を計算する第1の計算手段と、
    前記第1の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記1つの文字画像を切り出す位置の候補の評価値を計算する第2の計算手段と、
    前記第2の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定する切出位置決定手段と、
    前記第1の計算手段と前記第2の計算手段による組を複数有し、
    前記複数の第2の計算手段によって計算された評価値に対して、重み付き線形和を計算する第3の計算手段と、
    前記第3の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記1つの文字画像を切り出す位置の候補の評価値を計算する第4の計算手段
    を具備し、
    前記切出位置決定手段は、前記第4の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定し、
    前記第1の計算手段と前記第2の計算手段による複数の組と、前記第3の計算手段と前記第4の計算手段による組を複数有し、
    前記複数の第4の計算手段によって計算された評価値の和を計算する第6の計算手段
    を具備し、
    前記切出位置決定手段は、前記第6の計算手段によって計算された評価値の和に基づいて、前記画像内に存在する文字画像を切り出す位置を決定し、
    文字画像の切り出し位置の教師データを受け付ける受付手段と、
    前記切出位置決定手段によって決定された切り出し位置と前記受付手段によって受け付けられた教師データを比較して、切り出し位置の正解個数又は誤り個数を算出する個数算出手段と、
    前記個数算出手段によって算出された切り出し位置の正解個数又は誤り個数に基づいて、1文字分の文字切り出し位置における前記第1の計算手段、又は前記第3の計算手段で用いる重みを変更する重み変更手段
    を具備し、
    前記重み変更手段は、現在の重みでの場合の正解個数又は誤り個数に基づいた値から変更後の重みでの正解個数又は誤り個数に基づいた値への変更量から次の重みを決定する
    ことを特徴とする画像処理装置。
  5. コンピュータを、
    画像内に存在する1つの文字画像を切り出す位置の候補に関する複数の特徴量に対して、重み付き線形和を計算する第1の計算手段と、
    前記第1の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記1つの文字画像を切り出す位置の候補の評価値を計算する第2の計算手段と、
    前記第2の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定する切出位置決定手段と、
    文字画像の切り出し位置の教師データを受け付ける受付手段と、
    前記切出位置決定手段によって決定された切り出し位置と前記受付手段によって受け付けられた教師データを比較して、切り出し位置の正解個数又は誤り個数を算出する個数算出手段と、
    前記個数算出手段によって算出された切り出し位置の正解個数又は誤り個数に基づいて、1文字分の文字切り出し位置における前記第1の計算手段で用いる重みを変更する重み変更手段
    として機能させ、
    前記重み変更手段は、現在の重みでの場合の正解個数又は誤り個数に基づいた値から変更後の重みでの正解個数又は誤り個数に基づいた値への変更量から次の重みを決定する
    ことを特徴とする画像処理プログラム。
  6. コンピュータを、
    画像内に存在する1つの文字画像を切り出す位置の候補に関する複数の特徴量に対して、重み付き線形和を計算する第1の計算手段と、
    前記第1の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記1つの文字画像を切り出す位置の候補の評価値を計算する第2の計算手段と、
    前記第2の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定する切出位置決定手段と、
    前記第1の計算手段と前記第2の計算手段による組を複数有し、
    前記複数の第2の計算手段によって計算された評価値に対して、重み付き線形和を計算する第3の計算手段と、
    前記第3の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記1つの文字画像を切り出す位置の候補の評価値を計算する第4の計算手段
    として機能させ、
    前記切出位置決定手段は、前記第4の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定し、
    文字画像の切り出し位置の教師データを受け付ける受付手段と、
    前記切出位置決定手段によって決定された切り出し位置と前記受付手段によって受け付けられた教師データを比較して、切り出し位置の正解個数又は誤り個数を算出する個数算出手段と、
    前記個数算出手段によって算出された切り出し位置の正解個数又は誤り個数に基づいて、1文字分の文字切り出し位置における前記第1の計算手段、又は前記第3の計算手段で用いる重みを変更する重み変更手段
    として機能させ、
    前記重み変更手段は、現在の重みでの場合の正解個数又は誤り個数に基づいた値から変更後の重みでの正解個数又は誤り個数に基づいた値への変更量から次の重みを決定する
    ことを特徴とする画像処理プログラム。
  7. コンピュータを、
    画像内に存在する1つの文字画像を切り出す位置の候補に関する複数の特徴量に対して、重み付き線形和を計算する第1の計算手段と、
    前記第1の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記1つの文字画像を切り出す位置の候補の評価値を計算する第2の計算手段と、
    前記第2の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定する切出位置決定手段と、
    前記第1の計算手段と前記第2の計算手段による組を複数有し、
    前記複数の第2の計算手段によって計算された評価値の和を計算する第5の計算手段
    として機能させ、
    前記切出位置決定手段は、前記第5の計算手段によって計算された評価値の和に基づいて、前記画像内に存在する文字画像を切り出す位置を決定し、
    文字画像の切り出し位置の教師データを受け付ける受付手段と、
    前記切出位置決定手段によって決定された切り出し位置と前記受付手段によって受け付けられた教師データを比較して、切り出し位置の正解個数又は誤り個数を算出する個数算出手段と、
    前記個数算出手段によって算出された切り出し位置の正解個数又は誤り個数に基づいて、1文字分の文字切り出し位置における前記第1の計算手段で用いる重みを変更する重み変更手段
    として機能させ、
    前記重み変更手段は、現在の重みでの場合の正解個数又は誤り個数に基づいた値から変更後の重みでの正解個数又は誤り個数に基づいた値への変更量から次の重みを決定する
    ことを特徴とする画像処理プログラム。
  8. コンピュータを、
    画像内に存在する1つの文字画像を切り出す位置の候補に関する複数の特徴量に対して、重み付き線形和を計算する第1の計算手段と、
    前記第1の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記1つの文字画像を切り出す位置の候補の評価値を計算する第2の計算手段と、
    前記第2の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定する切出位置決定手段と、
    前記第1の計算手段と前記第2の計算手段による組を複数有し、
    前記複数の第2の計算手段によって計算された評価値に対して、重み付き線形和を計算する第3の計算手段と、
    前記第3の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記1つの文字画像を切り出す位置の候補の評価値を計算する第4の計算手段
    として機能させ、
    前記切出位置決定手段は、前記第4の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定し、
    前記第1の計算手段と前記第2の計算手段による複数の組と、前記第3の計算手段と前記第4の計算手段による組を複数有し、
    前記複数の第4の計算手段によって計算された評価値の和を計算する第6の計算手段
    として機能させ、
    前記切出位置決定手段は、前記第6の計算手段によって計算された評価値の和に基づいて、前記画像内に存在する文字画像を切り出す位置を決定し、
    文字画像の切り出し位置の教師データを受け付ける受付手段と、
    前記切出位置決定手段によって決定された切り出し位置と前記受付手段によって受け付けられた教師データを比較して、切り出し位置の正解個数又は誤り個数を算出する個数算出手段と、
    前記個数算出手段によって算出された切り出し位置の正解個数又は誤り個数に基づいて、1文字分の文字切り出し位置における前記第1の計算手段、又は前記第3の計算手段で用いる重みを変更する重み変更手段
    として機能させ、
    前記重み変更手段は、現在の重みでの場合の正解個数又は誤り個数に基づいた値から変更後の重みでの正解個数又は誤り個数に基づいた値への変更量から次の重みを決定する
    ことを特徴とする画像処理プログラム。
JP2010146014A 2010-06-28 2010-06-28 画像処理装置及び画像処理プログラム Expired - Fee Related JP5636766B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010146014A JP5636766B2 (ja) 2010-06-28 2010-06-28 画像処理装置及び画像処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010146014A JP5636766B2 (ja) 2010-06-28 2010-06-28 画像処理装置及び画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2012008909A JP2012008909A (ja) 2012-01-12
JP5636766B2 true JP5636766B2 (ja) 2014-12-10

Family

ID=45539349

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010146014A Expired - Fee Related JP5636766B2 (ja) 2010-06-28 2010-06-28 画像処理装置及び画像処理プログラム

Country Status (1)

Country Link
JP (1) JP5636766B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113591858A (zh) * 2021-02-20 2021-11-02 腾讯科技(深圳)有限公司 一种文本识别方法、装置、电子设备和存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0343877A (ja) * 1989-07-12 1991-02-25 Omron Corp 画像照合装置
JP3009078B2 (ja) * 1992-01-06 2000-02-14 オムロン株式会社 文字認識装置
JP3264961B2 (ja) * 1992-01-30 2002-03-11 松下電器産業株式会社 文字認識装置
JP3180477B2 (ja) * 1992-12-10 2001-06-25 松下電器産業株式会社 パターン認識装置
JP2576080B2 (ja) * 1992-10-28 1997-01-29 エヌ・ティ・ティ・データ通信株式会社 文字切出し方法
JP3313272B2 (ja) * 1996-01-08 2002-08-12 株式会社日立製作所 住所読み取り方法および識別関数重みベクトル生成方法
JP4741019B2 (ja) * 2009-07-06 2011-08-03 セコム株式会社 インターホン装置

Also Published As

Publication number Publication date
JP2012008909A (ja) 2012-01-12

Similar Documents

Publication Publication Date Title
US8131087B2 (en) Program and apparatus for forms processing
US8045800B2 (en) Active segmentation for groups of images
US8224090B2 (en) Apparatus and method for analyzing and determining correlation of information in a document
JP5699570B2 (ja) 画像処理装置及び画像処理プログラム
US8233726B1 (en) Image-domain script and language identification
US12072957B2 (en) Data classification system, data classification method, and recording medium
JP6003705B2 (ja) 情報処理装置及び情報処理プログラム
CN101866418B (zh) 确定文档阅读顺序的方法和设备
JP6892606B2 (ja) 位置特定装置、位置特定方法及びコンピュータプログラム
JP7623868B2 (ja) データ処理装置及び方法
RU2613847C2 (ru) Выявление китайской, японской и корейской письменности
US8787676B2 (en) Image processing apparatus, computer readable medium storing program, and image processing method
JP2013047887A (ja) 画像処理装置及び画像処理プログラム
JP5636766B2 (ja) 画像処理装置及び画像処理プログラム
JP5888222B2 (ja) 情報処理装置及び情報処理プログラム
JP5673033B2 (ja) 画像処理装置及び画像処理プログラム
JP6260350B2 (ja) 画像処理装置及び画像処理プログラム
JP7504314B2 (ja) 表画像認識装置、プログラム及び表画像認識方法
JP6511942B2 (ja) 情報処理装置および情報処理プログラム
JP5821648B2 (ja) 情報処理装置及び情報処理プログラム
JP5935324B2 (ja) 情報処理装置及び情報処理プログラム
CN115439729B (zh) 一种基于交替迭代优化的场景图生成装置和方法
KR20080104425A (ko) 스팸문서 판단 시스템 및 방법
JP7228542B2 (ja) 学習プログラム、学習装置および学習方法
JP2016053797A (ja) 画像処理装置及び画像処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130522

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140404

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140924

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141007

R150 Certificate of patent or registration of utility model

Ref document number: 5636766

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees