JP5636766B2

JP5636766B2 - 画像処理装置及び画像処理プログラム

Info

Publication number: JP5636766B2
Application number: JP2010146014A
Authority: JP
Inventors: 木村　俊一; 俊一木村; 瑛一田中; 関野　雅則; 雅則関野; 久保田　聡; 聡久保田; 越　裕; 裕越
Original assignee: Fuji Xerox Co Ltd; Fujifilm Business Innovation Corp
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2010-06-28
Filing date: 2010-06-28
Publication date: 2014-12-10
Anticipated expiration: 2030-06-28
Also published as: JP2012008909A

Description

本発明は、画像処理装置及び画像処理プログラムに関する。

画像から文字画像を切り出す技術がある。
これに関連する技術として、例えば、特許文献１には、文字認識において文字の大きさや形、ピッチ等が文書毎に異なっていても精度のよい認識を行うことを目的とし、言語的に正しいと思われる部分の文字を確定文字検出部が確定文字として検出し、認識結果出力部が認識結果として出力する一方、文字矩形情報検出部が確定文字の矩形情報を検出し、矩形評価関数の最適化を行い、矩形分割統合部は最適化された矩形評価関数に基づいてまだ確定されていない部分の基本矩形の分割・統合を行うことによって新たな基本矩形を求め、再び候補文字選出部以下の処理を行い、また筆記者推定部が確定文字から得た情報を用いて候補文字選出部で用いる辞書を最適化することが開示されている。

また、例えば、特許文献２には、文書画像から高速にかつ正確に文字の切り出しを可能とし、さらに、漢字やひらがななどに英数字記号の混在する文書における文字の切り出しを高速にかつ正確に行うことを目的とし、各外接矩形の形状情報から切り出し候補を推定し、この推定した切り出し候補に対して文字認識を行い、この文字認識の結果により切り出し確定可能と判断された切り出し候補に対してはそれを切り出し結果として確定し、前記文字認識の結果により切り出し確定可能と判断されなかった切り出し候補に対しては、各外接矩形の組み合わせによる複数の切り出し候補を推定し、それぞれの切り出し候補毎に個々の矩形に対する認識評価値を求め、これら個々の矩形に対する認識評価値を用いた各切り出し候補毎の組み合わせ評価値のうち最適な組み合わせ評価値を得た切り出し候補を切り出し結果として確定し、また、英数字記号のみを対象とした認識を行って、英数字記号のみを先に確定したのちに、英数字記号と確定された文字以外の文字の切り出しを行うことが開示されている。

また、例えば、特許文献３には、文字識別や文字列照合で、文字の切り出し方が確定できない場合でも、高い精度で文字を切り出し文字列を認識することを課題とし、多重仮説検定型の文字切り出し処理において、まず従来の方法で全部の切り出し方の中からより正しいと判断される複数の切り出し方の候補を選別し、次いで本発明の方法である各文字パターンの大きさや前後のパターンとの位置関係に基づき切り出し方の仮説の妥当性を評価するための評価値（概形ペナルティ）を求め、この仮定は予め収集登録しサンプルを学習して求めた線形識別関数により行い、このようにして正しい切り出し方を判別することにより、大きさや位置関係の情報を容易に扱えるようになることが開示されている。

特開平０５−１７４１８７号公報特開平０８−１６１４３２号公報特開平０９−１８５６８１号公報

本発明は、画像内に存在する文字画像を切り出す位置を決定する場合にあって、切り出す位置の候補の評価値が特異の値となった場合に、その特異な評価値だけによって切り出す位置が決定されてしまうことを防ぐようにした画像処理装置及び画像処理プログラムを提供することを目的としている。

かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項１の発明は、画像内に存在する１つの文字画像を切り出す位置の候補に関する複数の特徴量に対して、重み付き線形和を計算する第１の計算手段と、前記第１の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記１つの文字画像を切り出す位置の候補の評価値を計算する第２の計算手段と、前記第２の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定する切出位置決定手段と、文字画像の切り出し位置の教師データを受け付ける受付手段と、前記切出位置決定手段によって決定された切り出し位置と前記受付手段によって受け付けられた教師データを比較して、切り出し位置の正解個数又は誤り個数を算出する個数算出手段と、前記個数算出手段によって算出された切り出し位置の正解個数又は誤り個数に基づいて、１文字分の文字切り出し位置における前記第１の計算手段で用いる重みを変更する重み変更手段を具備し、前記重み変更手段は、現在の重みでの場合の正解個数又は誤り個数に基づいた値から変更後の重みでの正解個数又は誤り個数に基づいた値への変更量から次の重みを決定することを特徴とする画像処理装置である。

請求項２の発明は、画像内に存在する１つの文字画像を切り出す位置の候補に関する複数の特徴量に対して、重み付き線形和を計算する第１の計算手段と、前記第１の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記１つの文字画像を切り出す位置の候補の評価値を計算する第２の計算手段と、前記第２の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定する切出位置決定手段と、前記第１の計算手段と前記第２の計算手段による組を複数有し、前記複数の第２の計算手段によって計算された評価値に対して、重み付き線形和を計算する第３の計算手段と、前記第３の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記１つの文字画像を切り出す位置の候補の評価値を計算する第４の計算手段を具備し、前記切出位置決定手段は、前記第４の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定し、文字画像の切り出し位置の教師データを受け付ける受付手段と、前記切出位置決定手段によって決定された切り出し位置と前記受付手段によって受け付けられた教師データを比較して、切り出し位置の正解個数又は誤り個数を算出する個数算出手段と、前記個数算出手段によって算出された切り出し位置の正解個数又は誤り個数に基づいて、１文字分の文字切り出し位置における前記第１の計算手段、又は前記第３の計算手段で用いる重みを変更する重み変更手段を具備し、前記重み変更手段は、現在の重みでの場合の正解個数又は誤り個数に基づいた値から変更後の重みでの正解個数又は誤り個数に基づいた値への変更量から次の重みを決定することを特徴とする画像処理装置である。

請求項３の発明は、画像内に存在する１つの文字画像を切り出す位置の候補に関する複数の特徴量に対して、重み付き線形和を計算する第１の計算手段と、前記第１の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記１つの文字画像を切り出す位置の候補の評価値を計算する第２の計算手段と、前記第２の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定する切出位置決定手段と、前記第１の計算手段と前記第２の計算手段による組を複数有し、前記複数の第２の計算手段によって計算された評価値の和を計算する第５の計算手段を具備し、前記切出位置決定手段は、前記第５の計算手段によって計算された評価値の和に基づいて、前記画像内に存在する文字画像を切り出す位置を決定し、文字画像の切り出し位置の教師データを受け付ける受付手段と、前記切出位置決定手段によって決定された切り出し位置と前記受付手段によって受け付けられた教師データを比較して、切り出し位置の正解個数又は誤り個数を算出する個数算出手段と、前記個数算出手段によって算出された切り出し位置の正解個数又は誤り個数に基づいて、１文字分の文字切り出し位置における前記第１の計算手段で用いる重みを変更する重み変更手段を具備し、前記重み変更手段は、現在の重みでの場合の正解個数又は誤り個数に基づいた値から変更後の重みでの正解個数又は誤り個数に基づいた値への変更量から次の重みを決定することを特徴とする画像処理装置である。

請求項４の発明は、画像内に存在する１つの文字画像を切り出す位置の候補に関する複数の特徴量に対して、重み付き線形和を計算する第１の計算手段と、前記第１の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記１つの文字画像を切り出す位置の候補の評価値を計算する第２の計算手段と、前記第２の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定する切出位置決定手段と、前記第１の計算手段と前記第２の計算手段による組を複数有し、前記複数の第２の計算手段によって計算された評価値に対して、重み付き線形和を計算する第３の計算手段と、前記第３の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記１つの文字画像を切り出す位置の候補の評価値を計算する第４の計算手段を具備し、前記切出位置決定手段は、前記第４の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定し、前記第１の計算手段と前記第２の計算手段による複数の組と、前記第３の計算手段と前記第４の計算手段による組を複数有し、前記複数の第４の計算手段によって計算された評価値の和を計算する第６の計算手段を具備し、前記切出位置決定手段は、前記第６の計算手段によって計算された評価値の和に基づいて、前記画像内に存在する文字画像を切り出す位置を決定し、文字画像の切り出し位置の教師データを受け付ける受付手段と、前記切出位置決定手段によって決定された切り出し位置と前記受付手段によって受け付けられた教師データを比較して、切り出し位置の正解個数又は誤り個数を算出する個数算出手段と、前記個数算出手段によって算出された切り出し位置の正解個数又は誤り個数に基づいて、１文字分の文字切り出し位置における前記第１の計算手段、又は前記第３の計算手段で用いる重みを変更する重み変更手段を具備し、前記重み変更手段は、現在の重みでの場合の正解個数又は誤り個数に基づいた値から変更後の重みでの正解個数又は誤り個数に基づいた値への変更量から次の重みを決定することを特徴とする画像処理装置である。

請求項５の発明は、コンピュータを、画像内に存在する１つの文字画像を切り出す位置の候補に関する複数の特徴量に対して、重み付き線形和を計算する第１の計算手段と、前記第１の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記１つの文字画像を切り出す位置の候補の評価値を計算する第２の計算手段と、前記第２の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定する切出位置決定手段と、文字画像の切り出し位置の教師データを受け付ける受付手段と、前記切出位置決定手段によって決定された切り出し位置と前記受付手段によって受け付けられた教師データを比較して、切り出し位置の正解個数又は誤り個数を算出する個数算出手段と、前記個数算出手段によって算出された切り出し位置の正解個数又は誤り個数に基づいて、１文字分の文字切り出し位置における前記第１の計算手段で用いる重みを変更する重み変更手段として機能させ、前記重み変更手段は、現在の重みでの場合の正解個数又は誤り個数に基づいた値から変更後の重みでの正解個数又は誤り個数に基づいた値への変更量から次の重みを決定することを特徴とする画像処理プログラムである。
請求項６の発明は、コンピュータを、画像内に存在する１つの文字画像を切り出す位置の候補に関する複数の特徴量に対して、重み付き線形和を計算する第１の計算手段と、前記第１の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記１つの文字画像を切り出す位置の候補の評価値を計算する第２の計算手段と、前記第２の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定する切出位置決定手段と、前記第１の計算手段と前記第２の計算手段による組を複数有し、前記複数の第２の計算手段によって計算された評価値に対して、重み付き線形和を計算する第３の計算手段と、前記第３の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記１つの文字画像を切り出す位置の候補の評価値を計算する第４の計算手段として機能させ、前記切出位置決定手段は、前記第４の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定し、文字画像の切り出し位置の教師データを受け付ける受付手段と、前記切出位置決定手段によって決定された切り出し位置と前記受付手段によって受け付けられた教師データを比較して、切り出し位置の正解個数又は誤り個数を算出する個数算出手段と、前記個数算出手段によって算出された切り出し位置の正解個数又は誤り個数に基づいて、１文字分の文字切り出し位置における前記第１の計算手段、又は前記第３の計算手段で用いる重みを変更する重み変更手段として機能させ、前記重み変更手段は、現在の重みでの場合の正解個数又は誤り個数に基づいた値から変更後の重みでの正解個数又は誤り個数に基づいた値への変更量から次の重みを決定することを特徴とする画像処理プログラムである。
請求項７の発明は、コンピュータを、画像内に存在する１つの文字画像を切り出す位置の候補に関する複数の特徴量に対して、重み付き線形和を計算する第１の計算手段と、前記第１の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記１つの文字画像を切り出す位置の候補の評価値を計算する第２の計算手段と、前記第２の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定する切出位置決定手段と、前記第１の計算手段と前記第２の計算手段による組を複数有し、前記複数の第２の計算手段によって計算された評価値の和を計算する第５の計算手段として機能させ、前記切出位置決定手段は、前記第５の計算手段によって計算された評価値の和に基づいて、前記画像内に存在する文字画像を切り出す位置を決定し、文字画像の切り出し位置の教師データを受け付ける受付手段と、前記切出位置決定手段によって決定された切り出し位置と前記受付手段によって受け付けられた教師データを比較して、切り出し位置の正解個数又は誤り個数を算出する個数算出手段と、前記個数算出手段によって算出された切り出し位置の正解個数又は誤り個数に基づいて、１文字分の文字切り出し位置における前記第１の計算手段で用いる重みを変更する重み変更手段として機能させ、前記重み変更手段は、現在の重みでの場合の正解個数又は誤り個数に基づいた値から変更後の重みでの正解個数又は誤り個数に基づいた値への変更量から次の重みを決定することを特徴とする画像処理プログラムである。
請求項８の発明は、コンピュータを、画像内に存在する１つの文字画像を切り出す位置の候補に関する複数の特徴量に対して、重み付き線形和を計算する第１の計算手段と、前記第１の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記１つの文字画像を切り出す位置の候補の評価値を計算する第２の計算手段と、前記第２の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定する切出位置決定手段と、前記第１の計算手段と前記第２の計算手段による組を複数有し、前記複数の第２の計算手段によって計算された評価値に対して、重み付き線形和を計算する第３の計算手段と、前記第３の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記１つの文字画像を切り出す位置の候補の評価値を計算する第４の計算手段として機能させ、前記切出位置決定手段は、前記第４の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定し、前記第１の計算手段と前記第２の計算手段による複数の組と、前記第３の計算手段と前記第４の計算手段による組を複数有し、前記複数の第４の計算手段によって計算された評価値の和を計算する第６の計算手段として機能させ、前記切出位置決定手段は、前記第６の計算手段によって計算された評価値の和に基づいて、前記画像内に存在する文字画像を切り出す位置を決定し、文字画像の切り出し位置の教師データを受け付ける受付手段と、前記切出位置決定手段によって決定された切り出し位置と前記受付手段によって受け付けられた教師データを比較して、切り出し位置の正解個数又は誤り個数を算出する個数算出手段と、前記個数算出手段によって算出された切り出し位置の正解個数又は誤り個数に基づいて、１文字分の文字切り出し位置における前記第１の計算手段、又は前記第３の計算手段で用いる重みを変更する重み変更手段として機能させ、前記重み変更手段は、現在の重みでの場合の正解個数又は誤り個数に基づいた値から変更後の重みでの正解個数又は誤り個数に基づいた値への変更量から次の重みを決定することを特徴とする画像処理プログラムである。

請求項１の画像処理装置によれば、画像内に存在する文字画像を切り出す位置を決定する場合にあって、切り出す位置の候補の評価値が特異の値となった場合に、その特異な評価値だけによって切り出す位置が決定されてしまうことを防ぐことができる。また、画像内に存在する文字画像を切り出す位置を決定する場合にあって、評価値を計算するために利用する重みを決定することができる。

請求項２の画像処理装置によれば、本構成を有していない場合に比較して、画像内に存在する文字画像を切り出す位置を精度よく決定することができる。また、画像内に存在する文字画像を切り出す位置を決定する場合にあって、評価値を計算するために利用する重みを決定することができる。

請求項３の画像処理装置によれば、本構成を有していない場合に比較して、画像内に存在する文字画像を切り出す位置を精度よく決定することができる。また、画像内に存在する文字画像を切り出す位置を決定する場合にあって、評価値を計算するために利用する重みを決定することができる。

請求項４の画像処理装置によれば、本構成を有していない場合に比較して、画像内に存在する文字画像を切り出す位置を精度よく決定することができる。また、画像内に存在する文字画像を切り出す位置を決定する場合にあって、評価値を計算するために利用する重みを決定することができる。

請求項５の画像処理プログラムによれば、画像内に存在する文字画像を切り出す位置を決定する場合にあって、切り出す位置の候補の評価値が特異の値となった場合に、その特異な評価値だけによって切り出す位置が決定されてしまうことを防ぐことができる。また、画像内に存在する文字画像を切り出す位置を決定する場合にあって、評価値を計算するために利用する重みを決定することができる。
請求項６の画像処理プログラムによれば、本構成を有していない場合に比較して、画像内に存在する文字画像を切り出す位置を精度よく決定することができる。また、画像内に存在する文字画像を切り出す位置を決定する場合にあって、評価値を計算するために利用する重みを決定することができる。
請求項７の画像処理プログラムによれば、本構成を有していない場合に比較して、画像内に存在する文字画像を切り出す位置を精度よく決定することができる。また、画像内に存在する文字画像を切り出す位置を決定する場合にあって、評価値を計算するために利用する重みを決定することができる。
請求項８の画像処理プログラムによれば、本構成を有していない場合に比較して、画像内に存在する文字画像を切り出す位置を精度よく決定することができる。また、画像内に存在する文字画像を切り出す位置を決定する場合にあって、評価値を計算するために利用する重みを決定することができる。

第１の実施の形態の構成例についての概念的なモジュール構成図である。第１の実施の形態のアーク評価値決定モジュール内の構成例についての概念的なモジュール構成図である。教師用データテーブルのデータ構造例を示す説明図である。第２の実施の形態のアーク評価値決定モジュール内の構成例についての概念的なモジュール構成図である。第３の実施の形態のアーク評価値決定モジュール内の構成例についての概念的なモジュール構成図である。第３の実施の形態のアーク評価値算出モジュール内の構成例についての概念的なモジュール構成図である。教師用データテーブルのデータ構造例を示す説明図である。アーク候補決定モジュール、アーク評価値決定モジュール、文字切り出し位置決定モジュールの関係例を示す説明図である。第４の実施の形態の構成例についての概念的なモジュール構成図である。第１〜第４の実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。文字列画像の例を示す説明図である。文字境界候補の例を示す説明図である。外接矩形の例を示す説明図である。文字切り出し結果の例を示す説明図である。文字切り出し位置を示すグラフ表現の例を示す説明図である。グラフ表現内のパターン２の例を示す説明図である。一般的な文字切り出し、文字認識を行う画像処理装置の構成例についての概念的なモジュール構成図である。文字切り出し位置を示すグラフ表現にアーク評価値を付加した例を示す説明図である。特徴量空間において直線で分離できる場合の例を示す説明図である。特徴量空間において直線では分離できない場合の例を示す説明図である。

本実施の形態は、例えば文字認識等のように文字画像を対象とした処理を行う場合に、画像内に存在する文字画像を切り出すためのものである。
まず、本実施の形態を説明する前に、その前提又は本実施の形態を利用する画像処理装置について説明する。なお、この説明は、本実施の形態の理解を容易にすることを目的とするものである。

例えば、図１１の例に示すような文字列画像を対象とする。まず、この文字列画像を文字セグメントに分割する。文字セグメントとは、文字そのもの、あるいは文字の一部となる可能性がある文字部分である。ここでは、図１１の例に示すような横書きの文字列画像を例にとる。横書きの画像では、垂直な線（あるいは垂直に近い線）で分割を行うことにより、文字セグメントに分割する。例えば図１２に示した縦線（切れ目候補１２１０、切れ目候補１２２０）で、文字列画像を分割して、３つの文字セグメント「イ」、「ヒ」、及び、「学」を得ることができる。図１２の例に示した縦線を切れ目候補と呼ぶこととする。切れ目候補１２１０が「イ」と「ヒ」を分け、切れ目候補１２２０が「ヒ」と「学」を分けている。

次に、図１３の例に示すように、各文字セグメントに対し、その外接矩形（外接矩形１３１０、外接矩形１３２０、外接矩形１３３０）を抽出する。
以下、特許文献３に記載されている技術内容を例にして説明する。なお、以下の説明で用いる用語は、特許文献３で用いる用語とは異なっている場合がある。
前述の文字セグメントを統合して、文字画像を決定する。複数の文字セグメントを統合して１つの文字画像を形成する場合もあれば、１つの文字セグメントが１つの文字となる場合もある。文字画像を決定するとは、文字の切り出し位置を決定することと同値であるから、以下では文字切り出し位置の決定という場合もある。
文字セグメントの統合のパターンは複数存在する。複数存在するパターンの中で、最も文字画像として評価の高いものを選択することによって、最終的な文字切り出し位置を決定する。
図１３の例に対しては、全ての文字切り出しパターンは、図１４に示す例のようになる。つまり、図１４（ａ）の例では、パターン１として３つの文字画像（外接矩形１３１０、１３２０、１３３０）、図１４（ｂ）の例では、パターン２として２つの文字画像（外接矩形１３１０と１３２０、１３３０）、図１４（ｃ）の例では、パターン３として１つの文字画像（外接矩形１３１０と１３２０と１３３０）、図１４（ｄ）の例では、パターン４として２つの文字画像（外接矩形１３１０、外接矩形１３２０と１３３０）を示している。

文字切り出し位置を示すグラフ表現として、図１４の例に示した複数の切り出しパターンを表すことができる。図１５の例において、グラフは、始点ノード１５００、終点ノード１５９０、中間ノード１５１０（ノード１）、中間ノード１５２０（ノード２）の４つのノードと、ノード間を接続するアークで構成されている（ノード間の接続線をアークと呼ぶこととする）。始点は、文字列画像の左端、終点は文字列画像の右端にあたる。中間ノード１５１０（ノード１）、中間ノード１５２０（ノード２）は、それぞれ、文字の切れ目候補位置（すなわち、図１２の例に示した切れ目候補１２１０、切れ目候補１２２０）を示す。中間ノード１５１０（ノード１）は、切れ目候補１２１０に対応している。また、中間ノード１５２０（ノード２）は、切れ目候補１２２０に対応している。

始点から、各ノードを通って、終点に至る経路を以下、「パス」と呼ぶ。パスは、１又は複数のアークから構成される。通常、複数のパスが存在する。図１４の例に示した文字切り出しパターンは、これらの複数のパスに対応している。例えば、図１４（ｂ）の例に示したパターン２は、図１６の太線で示したパス（文字切り出しパターン１５０４、文字切り出しパターン１５２２）と対応している。
ここで、どれか１つのアークには、１つの文字画像の候補が対応している。例えば、始点ノード１５００と中間ノード１５２０（ノード２）を結ぶアークには、「化」という文字画像（文字切り出しパターン１５０４）が対応している。１つのアークに対応する文字に対して、その文字の評価値を決定することができる。これを「アーク評価値」と呼ぶこととする。
アーク評価値は、文字の形状情報や、文字認識における認識確度などから算出する。この詳細に関しては後述する。

ここで、図１７を用いて、一般的な文字切り出し、文字認識を行う画像処理装置の構成例についての概念的なモジュール構成図を説明する。
この画像処理装置は、画像受付モジュール１１０、文字列抽出モジュール１２０、文字境界候補抽出モジュール１３０、アーク特徴量抽出モジュール１４０、線形重み付け加算モジュール１７１０、文字切り出しモジュール１６０、文字認識モジュール１７０を有している。

画像受付モジュール１１０は、文字列抽出モジュール１２０と接続されており、対象となる画像を受け付けて、その画像を文字列抽出モジュール１２０へ渡す。画像を受け付けるとは、例えば、スキャナ、カメラ等で画像を読み込むこと、ファックス等で通信回線を介して外部機器から画像を受信すること、ハードディスク（コンピュータに内蔵されているものの他に、ネットワークを介して接続されているもの等を含む）等に記憶されている画像を読み出すこと等が含まれる。画像は、２値画像、多値画像（カラー画像を含む）であってもよい。受け付ける画像は、１枚であってもよいし、複数枚であってもよい。また、画像の内容として、文字が含まれていれば、ビジネスに用いられる文書、広告宣伝用のパンフレット等であってもよい。

文字列抽出モジュール１２０は、画像受付モジュール１１０、文字境界候補抽出モジュール１３０と接続されており、画像受付モジュール１１０から画像を受け取り、その画像から文字列画像を抽出し、その文字列画像を文字境界候補抽出モジュール１３０へ渡す。文字列画像の抽出は、従来から知られている技術を用いるようにしてもよい。例えば、横方向又は縦方向に存在する黒画素数のヒストグラムを作成し、そのヒストグラムについて予め定められた幅を有しており、隣のヒストグラムと予め定められた距離以上離れているものを文字列の画像として抽出する。

文字境界候補抽出モジュール１３０は、文字列抽出モジュール１２０、アーク特徴量抽出モジュール１４０と接続されており、文字列抽出モジュール１２０から文字列画像を受け取り、文字列画像の境界候補を抽出し、その境界候補をアーク特徴量抽出モジュール１４０へ渡す。例えば、図１２の例に示した切れ目候補１２１０、切れ目候補１２２０である。

アーク特徴量抽出モジュール１４０は、文字境界候補抽出モジュール１３０、線形重み付け加算モジュール１７１０と接続されており、文字境界候補抽出モジュール１３０から境界候補を受け取り、その境界候補の特徴量を抽出し、複数の特徴量を特徴量ベクトルとして線形重み付け加算モジュール１７１０へ渡す。前述の文字切り出し位置を示すグラフ表現における各アークの特徴量を抽出する。アークの特徴量については後述する。アーク特徴量は一般的には複数であるが、１つであってもよい。以下、アーク特徴量を特徴量ベクトルともいう。

線形重み付け加算モジュール１７１０は、アーク特徴量抽出モジュール１４０、文字切り出しモジュール１６０と接続されており、アーク特徴量抽出モジュール１４０から特徴量ベクトルを受け取り、その特徴量ベクトルのアーク評価値を計算し、そのアーク評価値を文字切り出しモジュール１６０へ渡す。アーク評価値の計算については後述する。

文字切り出しモジュール１６０は、線形重み付け加算モジュール１７１０、文字認識モジュール１７０と接続されており、線形重み付け加算モジュール１７１０からアーク評価値を受け取り、アーク評価値に基づいて、切れ目候補の選択、つまり文字列画像内に存在する文字画像を切り出す位置を決定し、その切れ目候補に沿って文字画像を文字列画像（又は画像受付モジュール１１０が受け取った画像）から切り出し、その文字画像を文字認識モジュール１７０へ渡す。アーク評価値に基づいてとは、例えば、アーク評価値が最も高い値（１つの文字を切り出している可能性が高いことを示している値）のものを選択することである。
文字認識モジュール１７０は、文字切り出しモジュール１６０と接続されており、文字切り出しモジュール１６０から文字画像を受け取り、その文字画像を文字認識して、認識結果としての文字コードを出力する。

アーク特徴量抽出モジュール１４０、線形重み付け加算モジュール１７１０の処理について説明する。
１つのパスは、複数のアークから構成されている。複数のアーク評価値を用いて、そのアークから構成されるパスの評価値を計算することができる。これを「パス評価値」と呼ぶこととする。
パス評価値としては、例えば、アーク評価値の重み付け和などが相当する。特許文献３に記載されている技術では、アーク内の文字セグメント数で重み付けを行う。
文字切り出し位置を決定するため、複数のパスの中で、最もパス評価値の高いパスを選択する。パスが選択できれば、文字切り出し位置が確定して、さらに、文字認識結果も確定することになる。
図１６の例では、太線のパスが選択されたとする。この場合、文字切り出し位置は、始点ノード１５００と、中間ノード１５２０（ノード２）と、終点ノード１５９０の３点となる。また、文字認識結果は、「化」、「学」となる。

特に、線形重み付け加算モジュール１７１０が行うアーク評価値の算出方法を説明する。
特許文献３に記載の技術では、文字形状情報と、文字認識確度情報の重み付き線形和を用いて、文字評価値を算出する。さらに具体的には、特許文献３に記載の技術では、下記のようにアーク評価値の算出を行う。
まず、各アークに対応する文字の外接矩形を作る。これは、図１４の例に示す各パターン内の各文字の外接矩形に相当する。以下、各アークに対応する文字の外接矩形を、アークの外接矩形と呼ぶ。
次に、下記のように、アークの特徴量（複数）を計算する。
ｆ_１：該当アークの外接矩形の高さ
ｆ_２：該当アークの外接矩形の幅
ｆ_３：該当アークの外接矩形と、左側アークの外接矩形の間隔
ｆ_４：該当アークの外接矩形と、右側アークの外接矩形の間隔
ｆ_５：該当アーク内の文字セグメントの外接矩形間の最大の間隔
ｆ_６：該当アーク内の連結成分数
さらに、文字類似度を、ｆ_７とする。
特許文献３に記載の技術では、アーク評価値Ｖを式（１）で決定する。ただし、この場合、（１）式でＮ＝７とする。

つまり、文字形状情報（ｆ_１〜ｆ_６）と、文字認識確度情報ｆ_７の重み付け線形和でアーク評価値は決定される。ｗ_ｉは、線形和算出時の重みである。ｃは定数である。特許文献３の記述方法では、式（１）の記載ではなく、別の形式で記述されている。しかし、記述の違いはあるが、数学的には同じとなっている。
線形重み付け加算モジュール１７１０は、特徴量ベクトルとして、特徴量である前述のｆ_１〜ｆ_７の値を受け付ける。ここでは特徴数をＮとしている。線形重み付け加算モジュール１７１０の内部動作は、式（１）で示されるものである。そして、アーク評価値Ｖを文字切り出しモジュール１６０へ渡す。

次に、特許文献３に記載の技術を実施した場合に起こり得る現象について説明する。
＜現象１＞
特許文献３に記載の技術では、特徴量の線形和をアーク評価値としていた。線形和であるため、特徴量の内容によっては、アーク評価値の値域はマイナス無限大〜プラス無限大の値を取り得る。
このように線形和を用いてアーク評価値を算出すると、アーク評価値が非常に高い値や非常に低い値になってしまう場合がある。
アーク評価値が非常に高い値や非常に低い値になってしまう場合、全体のパス評価値がその非常に高い、あるいは、非常に低い値に引きずられてしまう場合がある。例えば、ここではパス評価値をアーク評価値の重み付き和で評価するとする。重みは適当に定める。ここでは従来技術のようにアーク内の文字セグメント数で重み付けを行うとする。
図１５の例において、図１８の例に示すような評価値となっているとする。
このようなアーク評価値となっている場合、例えば、アーク内の文字セグメント数で重み付けを行うとすると、
・文字切り出しパターン１５０４「化」、文字切り出しパターン１５２２「学」の場合のパス評価値は、１０×２＋１０＝３０である。
・文字切り出しパターン１５０６「イ」、文字切り出しパターン１５１２「ヒ」、文字切り出しパターン１５２２「学」の場合のパス評価値は、１＋１００＋１０＝１１１である。
すなわち、「ヒ」のアーク評価値が他の評価値と比べて高すぎるために、他の評価値が小さい場合（すなわち、文字らしくない場合、例えば、文字切り出しパターン１５０６「イ」のアーク評価値は１）でも、その値に引きずられて、「ヒ」を含むパスが選択されてしまうこととなる。

＜現象２＞
ここで、アーク特徴量ベクトルｆ＝（ｆ_１， …，ｆ_Ｎ）、重みベクトルをｗ＝（ｗ_１， …，ｗ_Ｎ）とする。また、アーク評価値関数をＶ（ｆ）とする。式（１）は、式（２）のようになる。

次に、正解切り出し位置に対応するアーク特徴量ベクトルをｆ_Ｔ、不正解切り出し位置に対応するアーク特徴量ベクトルをｆ_Ｆとする。
アーク評価値関数が妥当であるためには、式（３）のような関係になることが望ましい。つまり、正解切り出し位置の場合のアーク評価値は、不正解切り出し位置の場合のアーク評価値よりも大きな値であることが望ましい。

正解アーク、不正解アークは複数存在するため、式（３）のような関係を得るためには、正解切り出し位置の場合のアーク評価値の最小値Ｖ_Ｔｍｉｎと、不正解切り出し位置の場合のアーク評価値の最大値Ｖ_Ｆｍａｘとの関係が、式（４）のようになる必要がある。

式（４）が成り立つとき、式（５）を満たす値Ｖ_０が存在する。

ここで、特徴量ベクトルはＮ次元の空間内に存在する。式（１）又は式（２）は、このＮ次元特徴量空間における超平面を形成する。つまり、アーク評価値Ｖ（ｆ）が、所定の値Ｖ_０となるような特徴量ベクトルｆの集合は、式（６）で示される超平面上に存在することになる。

（６）式で表すことのできる超平面は（５）式より、正解切り出し位置の場合の特徴量ベクトル（正解特徴量ベクトル）の分布と、不正解切り出し位置の場合の特徴量ベクトル（不正解特徴量ベクトル）の分布を完全に分離することになる。このように、特徴量空間内の超平面で、正解特徴量ベクトルの分布と不正解特徴量ベクトルの分布を分離することができれば、（３）式を満たすことができて、妥当なアーク評価値関数を設計することが可能となる。
簡単のため、特徴量空間が２次元の場合を図示する。２次元の場合には、超平面は直線となる。図１９の例に示す破線１９３０のように、正解特徴量分布１９２０と不正解特徴量分布１９１０が直線で分離できる場合は問題がない。

特許文献３に記載の技術では、式（１）を採用しているため、分離面は超平面以外にはあり得ない。ところが、実際には、正解と不正解の分離面は超平面ではなく、もっと複雑な形状を示している可能性がある。超平面で分離不可能な複雑な形状を正解と不正解の分布が持つ場合、特許文献３に記載の技術では対応できない。
例えば、図２０の例に示すような正解特徴量分布２０２０と不正解特徴量分布２０１０の分布の場合、もはや直線で分離することは不可能である。このような場合、特許文献３に記載の技術では、妥当なアーク評価値を求めることができなくなる。つまり、式（７）で示されるような現象が起こってしまう。この現象が起きると、間違った文字切り出し位置であるにも関わらず、高いアーク評価値を得ることになってしまう。結果として、文字切り出し位置を誤ることになる。

以上で、本実施の形態の前提又は本実施の形態を利用する画像処理装置についての説明を終了する。

以下、図面に基づき本発明を実現するにあたっての好適な各種の実施の形態の例を説明する。
＜第１の実施の形態＞
図１は、第１の実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア（コンピュータ・プログラム）、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム（コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム）、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、１モジュールを１プログラムで構成してもよいし、複数モジュールを１プログラムで構成してもよく、逆に１モジュールを複数プログラムで構成してもよい。また、複数モジュールは１コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって１モジュールが複数コンピュータで実行されてもよい。なお、１つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続（データの授受、指示、データ間の参照関係等）の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク（一対一対応の通信接続を含む）等の通信手段で接続されて構成されるほか、１つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」（社会システム）にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、外部記憶媒体、通信回線を介した記憶装置、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）内のレジスタ等を含んでいてもよい。

本実施の形態である画像処理装置は、図１の例に示すように、画像受付モジュール１１０、文字列抽出モジュール１２０、文字境界候補抽出モジュール１３０、アーク特徴量抽出モジュール１４０、アーク評価値決定モジュール１５０、文字切り出しモジュール１６０、文字認識モジュール１７０を有している。なお、前述の図１７の例に示した画像処理装置と同種の部位には同一符号を付し重複した説明を省略する。したがって、アーク評価値決定モジュール１５０を詳細に説明する。ただし、文字列抽出モジュール１２０、文字境界候補抽出モジュール１３０、アーク特徴量抽出モジュール１４０については、より詳細に説明する。

文字列抽出モジュール１２０は、画像受付モジュール１１０、文字境界候補抽出モジュール１３０と接続されている。
文字列抽出モジュール１２０は、対象としている画像から横書き又は縦書きである１列の文字列画像を抽出する。ここで、列とは、横書きの場合は、横に並ぶ列であり、縦書きの場合は縦に並ぶ列である。
画像として、複数の文字列が存在するものがある。このような複数文字列を単一の文字列になるように分離する手法としては、従来よりさまざまなものが提案されているため、それらを用いればよい。
単一の文字列となるように分離する例として、特開平４−３１１２８３号公報、特開平３−２３３７８９号公報、特開平５−７３７１８号公報、特開２０００−９０１９４号公報等に記載の技術がある。これらの手法や、その他の手法を用いればよい。

文字境界候補抽出モジュール１３０は、文字列抽出モジュール１２０、アーク特徴量抽出モジュール１４０と接続されている。
文字境界候補抽出モジュール１３０は、１列の文字列画像を受け取り、複数の文字セグメントに分割する。この文字セグメント分割方式としてもさまざまな方式があるため、そのうちのどれかを用いればよい。例えば、特開平５−１１４０４７号公報、特開平４−１００１８９号公報、特開平４−９２９９２号公報、特開平４−６８４８１号公報、特開平９−５４８１４号公報等に記載の技術、特許文献３の特に００２１段落に記載の文字の境界候補抽出方式、特開平５−１２８３０８号公報の特に０００５段落に記載の文字切り出し位置決定方式等を用いればよい。これ以外の方法でももちろん構わない。

アーク特徴量抽出モジュール１４０は、文字境界候補抽出モジュール１３０、アーク評価値決定モジュール１５０と接続されている。
アーク特徴量抽出モジュール１４０が抽出するアークの特徴量ベクトルの内容としては、特に限定しない。例えば、前述したｆ_１〜ｆ_７の特徴量を用いてもよい。その他の特徴量を用いてもよい。特徴量ベクトルの次元数（すなわち、特徴量の種類数）に関しても、さまざまであって、何次元でも構わない。

また、文字を切り出した後に文字認識を行い、その文字認識確度をアークの特徴量の１つとして用いる場合の具体例に関して補足する。これは、特許文献３に記載の技術では文字類似度として示していた量である。
文字認識確度としては、文字認識時に出力した文字コードの確信度合いあるいは尤度のようなものを得ることができればよい。このような文字認識確度を得る手法としても、従来よりさまざまな手法が提案されているため、そのうちのいずれかを用いればよい。例えば、特許文献３の００２４段落に記載の方式、特許文献２の００５１段落に記載の認識評価値取得方式等を用いてもよい。その他の手法を用いてもよい。

アーク評価値決定モジュール１５０は、アーク特徴量抽出モジュール１４０、文字切り出しモジュール１６０と接続されており、アーク特徴量抽出モジュール１４０から特徴量ベクトルを受け取り、その特徴量ベクトルを用いてアーク評価値を決定し、そのアーク評価値を文字切り出しモジュール１６０に渡す。
アーク評価値決定モジュール１５０は、他のアーク評価値と比べた場合に非常に大きなアーク評価値、他のアーク評価値と比べた場合に非常に小さなアーク評価値による影響が大きくなることを防ぐものである。つまり、他のアーク評価値と比べた場合に大きなアーク評価値の場合にはその大きさによる影響を小さくし、小さなアーク評価値の場合にはその小ささによる影響を小さくする。手法としては、特徴量の重み付け加算結果に対して、さらに、以下の特徴を持った非線形関数を付与する。非線形関数としては、（１）単調関数であって、（２）入力がプラス無限大のときや、マイナス無限大のとき、所定の値に収束すること、又は、ある中心位置から外れれば外れるほど、その傾きの絶対値が小さくなる関数である。

図２は、第１の実施の形態のアーク評価値決定モジュール１５０内の構成例についての概念的なモジュール構成図である。アーク評価値決定モジュール１５０は、線形重み付け加算モジュール２１０、非線形関数モジュール２２０を有している。線形重み付け加算モジュール２１０と非線形関数モジュール２２０は接続されている。
線形重み付け加算モジュール２１０は、アーク特徴量抽出モジュール１４０から特徴ベクトルとして、特徴量１〜Ｎ（画像内に存在する１つの文字画像を切り出す位置の候補に関する複数の特徴量）を受け取り、前述の図１７の例の線形重み付け加算モジュール１７１０と同等の重み付き線形和の計算処理を行う。その結果を非線形関数モジュール２２０へ渡す。
非線形関数モジュール２２０は、線形重み付け加算モジュール２１０から計算結果を引数として受け取り、その引数が極限の値の場合に予め定められた値に収束するようになる、又はその引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又はその非線形単調関数に近似する関数によって、１つの文字画像を切り出す位置の候補の評価値（アーク評価値）を計算する。つまり、アーク評価関数によって計算する。

アーク評価値関数をＶ（ｆ）とすると、この構成の演算は、式（８）となる。入力特徴量ベクトルをｆ、重みベクトルをｗ、重みのスカラー値をｃとしている。σ（）は非線形関数である。

このような構成を採ることによって、極端に大きな（あるいは極端に小さな）値をとった場合の影響を少なくする。
図１８に示した例で、非線形関数（線形重み付け加算モジュール２１０）の入出力を、例えば、下記のような場合について説明する。
入力：１出力：１
入力：１０出力：２
入力：１００出力：３
このようにすると、
パス１：「化」「学」の場合のパス評価値は、２×２＋２＝６
パス２：「イ」「ヒ」「学」の場合のパス評価値は、１＋３＋２＝６
となって、値１００の影響を小さくすることができて、パス１とパス２の評価値が同程度の値となる。

非線形関数の例としては、ハイパーボリックタンジェント関数、ロジスティックシグモイド関数など、前述の「非線形関数条件」に合致するものであれば、どのような関数であってもよい。

本実施の形態を実際に使用する場合には、線形重み付け加算モジュール２１０における重み（すなわち、ｗとｃ）を決定しなければならない。そのため、図３の例に示すような教師用データテーブル３００を用意する。
教師用データテーブル３００は、データ番号欄３１０、特徴量１欄３２０、特徴量２欄３３０、特徴量Ｎ欄３８０、正解／非正解欄３９０等を有している。データ番号欄３１０は、アークを一意に識別するデータ番号を記憶する。例えば、各アークに対して個別のデータ番号を１から順に与えることにする。特徴量１欄３２０から特徴量Ｎ欄３８０は、アーク特徴量抽出モジュール１４０が抽出した特徴量を記憶する。つまり、あるアークの特徴量をアーク特徴量抽出モジュール１４０が抽出し、それを教師用データテーブル３００の表の横に並べて入力する。さらに、そのアークが正解の文字の切れ目を表している場合には正解／非正解欄３９０に例えば１と入力する。そのアークが正解の文字の切れ目を表していない場合には正解／非正解欄３９０に例えば０と入力する。

以上のように作成したデータを教師データとして、特徴量を入力したときに、前述の正解／非正解データとできるだけ近い値を得ることができるように重みを決定すればよい。
できるだけ近い値の評価方法としては、以下のような手法がある。まず、各アークに番号を与えるデータ番号をｋとする。データ番号ｋのアークに対して、アーク評価値決定モジュール１５０を用いて算出したアーク評価値をＶ_ｋとする。また、番号ｋのアークの教師データをｔ_ｋとする。ここでは、例えば、
・正解のときｔ_ｋ＝１
・不正解のときｔ_ｋ＝０
とする。
このとき、（９）式を最小とするように重みを決定すればよい。

又は、（１０）式を最小とするように重みを決定すればよい。

又は、（１１）式を最小とするように重みを決定すればよい。

これらに限らず、Ｖ_ｋとｔ_ｋの値の差が小さいとき小さくなるような評価値を最小とするように重みを決定する方法であれば、どのようなものでもよい。
重み決定方式としては、一般的なロジスティック回帰の回帰係数決定方式や、単層パーセプトロンの重み決定方式を利用すればよい。

文字切り出しモジュール１６０は、アーク評価値決定モジュール１５０、文字認識モジュール１７０と接続されており、アーク評価値決定モジュール１５０によって計算されたアーク評価値に基づいて、文字列画像内に存在する文字画像を切り出す位置を決定し、文字列画像（又は画像受付モジュール１１０が受け取った画像）から文字画像を切り出す。

＜第２の実施の形態＞
第１の実施の形態では、非線形関数を単調関数としたため、出力のアーク評価値の大きさは変わるが、その相対的な順番を変えることはない。つまり、前述の＜現象２＞は起こり得る。
第２の実施の形態は、図１の例に示した構成を有しており、アーク評価値決定モジュール１５０が線形重み付け加算と非線形関数の組による処理を２度繰り返す構成を採る。

図４は、第２の実施の形態のアーク評価値決定モジュール１５０内の構成例についての概念的なモジュール構成図である。
アーク評価値決定モジュール１５０は、線形重み付け加算モジュール１−１：４１１、線形重み付け加算モジュール１−２：４１２、・・・、線形重み付け加算モジュール１−Ｍ：４１Ｍ、非線形関数σ_１−１モジュール４２１、非線形関数σ_１−２モジュール４２２、・・・、非線形関数σ_１−Ｍモジュール４２Ｍ、線形重み付け加算モジュール２：４３０、非線形関数σ_２モジュール４４０を有している。図４において、複数の特徴量（特徴量１〜特徴量Ｎ）を特徴量ベクトルとして１本の線で記述している。
線形重み付け加算モジュール１−１：４１１は、非線形関数σ_１−１モジュール４２１と接続されている。
線形重み付け加算モジュール１−２：４１２は、非線形関数σ_１−２モジュール４２２と接続されている。
線形重み付け加算モジュール１−Ｍ：４１Ｍは、非線形関数σ_１−Ｍモジュール４２Ｍと接続されている。
非線形関数σ_１−１モジュール４２１は、線形重み付け加算モジュール１−１：４１１、線形重み付け加算モジュール２：４３０と接続されている。
非線形関数σ_１−２モジュール４２２は、線形重み付け加算モジュール１−２：４１２、線形重み付け加算モジュール２：４３０と接続されている。
非線形関数σ_１−Ｍモジュール４２Ｍは、線形重み付け加算モジュール１−Ｍ：４１Ｍ、線形重み付け加算モジュール２：４３０と接続されている。
線形重み付け加算モジュール１−１：４１１と非線形関数σ_１−１モジュール４２１の組み合わせ、線形重み付け加算モジュール１−２：４１２と非線形関数σ_１−２モジュール４２２の組み合わせ、線形重み付け加算モジュール１−Ｍ：４１Ｍと非線形関数σ_１−Ｍモジュール４２Ｍの組み合わせは、第１の実施の形態における線形重み付け加算モジュール２１０と非線形関数モジュール２２０の組み合わせに該当する。
線形重み付け加算モジュール２：４３０は、非線形関数σ_１−１モジュール４２１、非線形関数σ_１−２モジュール４２２、非線形関数σ_１−Ｍモジュール４２Ｍ、非線形関数σ_２モジュール４４０と接続されている。
非線形関数σ_２モジュール４４０は、線形重み付け加算モジュール２：４３０と接続されている。
線形重み付け加算モジュール２：４３０は第１の実施の形態における線形重み付け加算モジュール２１０に該当し、非線形関数σ_２モジュール４４０は第１の実施の形態における非線形関数モジュール２２０に該当する。

線形重み付け加算モジュール１−ｉと非線形関数σ_１−ｉモジュールの組み合わせでは（ただし、ｉ＝１，２，…，Ｍ）、（１２）式による演算を行って、出力値Ｕ_ｉを得る。ｗ_１−ｉ及びｃ_１−ｉは、線形重み付け加算モジュール１−ｉで用いる重みである。なお、Ｍは、１段目の線形重み付け加算モジュールの数である。

さらに、（１３）式に示すようにＵを定義する。

線形重み付け加算モジュール２：４３０と非線形関数σ_２モジュール４４０の組み合わせでは、（１４）式による演算を行って、出力値Ｖを得る。ｗ_２及びｃ_２は、線形重み付け加算モジュール２：４３０で用いる重みである。

前述において、非線形関数σは非線形関数σ_１−１モジュール４２１等の関数σ_１−ｉ（ただし、ｉ＝１，２，…，Ｍ）、及び関数σ_２の複数存在している。これらの関数は同じであってもよいし、異なっていてもよい。典型的にはハイパーボリックタンジェント関数やロジスティックシグモイド関数などを共通に用いればよい。
第２の実施の形態においては、その構成が３層のパーセプトロンと同等となる。そのため、正解アークと非正解アークが非線形な分離面を持っていても対応が可能となる。また、通常の誤差逆伝播方式を用いて重み係数を決定するようにしてもよい。その際の教師データとしては、図１３の例に示した教師用データテーブル３００を用いればよい。第２の実施の形態のアーク評価値決定モジュール１５０を用いて算出したアーク評価値ｙ_ｉと教師データｔ_ｉの値の差が小さいとき小さくなるような評価値の例も、第１の実施と同等である。

＜第３の実施の形態＞
第３の実施の形態は、図１の例に示した構成を有しており、さらに、アーク評価値決定モジュール１５０内で、第２の実施の形態のアーク評価値決定モジュール１５０を複数用いて、その和を取るものである。
１つの推定器であるアーク評価値決定モジュール１５０の性能が悪くても、複数の推定器を用いることによって、性能を上げることが可能である。例えば、３つの推定器があるとする。そのうち、１つの推定器が不正解で、残り２つの推定器が正解であるとする。この３つの多数決を取って、正解のほうを採用することによって、正解の推定を行うことが可能となる。
本実施の形態の例では、多数決の演算を加算によって行う。

図５は、第３の実施の形態のアーク評価値決定モジュール１５０内の構成例についての概念的なモジュール構成図である。
アーク評価値決定モジュール１５０は、アーク評価値算出モジュール１：５１１、アーク評価値算出モジュール２：５１２、アーク評価値算出モジュールＫ：５１Ｋ、アーク評価値加算モジュール５２０を有している。
アーク評価値算出モジュール１：５１１、アーク評価値算出モジュール２：５１２、アーク評価値算出モジュールＫ：５１Ｋは、それぞれアーク評価値加算モジュール５２０と接続されている。
第３の実施の形態では、複数のアーク評価値算出モジュール（アーク評価値算出モジュール１〜アーク評価値算出モジュールＫ）を用いる。アーク評価値算出モジュールｊの出力は、Ｖ_ｊとする。

アーク評価値算出モジュールｊは、第２の実施の形態のアーク評価値決定モジュール１５０と同等の構成を採る。
図６は、第３の実施の形態のアーク評価値算出モジュール内の構成例についての概念的なモジュール構成図である。
線形重み付け加算モジュールｊ−１−１：６１１、線形重み付け加算モジュールｊ−１−２：６１２、線形重み付け加算モジュールｊ−１−Ｍｊ：６１Ｍ、非線形関数σ_{ｊ−１−１}モジュール６２１、非線形関数σ_{ｊ−１−２}モジュール６２２、非線形関数σ_{ｊ−１−Ｍｊ}モジュール６２Ｍ、線形重み付け加算モジュールｊ−２：６３０、非線形関数σ_ｊ−２モジュール６４０を有している。
線形重み付け加算モジュールｊ−１−１：６１１は、非線形関数σ_{ｊ−１−１}モジュール６２１と接続されている。
線形重み付け加算モジュールｊ−１−２：６１２は、非線形関数σ_{ｊ−１−２}モジュール６２２と接続されている。
線形重み付け加算モジュールｊ−１−Ｍｊ：６１Ｍは、非線形関数σ_{ｊ−１−Ｍｊ}モジュール６２Ｍと接続されている。
非線形関数σ_{ｊ−１−１}モジュール６２１は、線形重み付け加算モジュールｊ−１−１：６１１、線形重み付け加算モジュールｊ−２：６３０と接続されている。
非線形関数σ_{ｊ−１−２}モジュール６２２は、線形重み付け加算モジュールｊ−１−２：６１２、線形重み付け加算モジュールｊ−２：６３０と接続されている。
非線形関数σ_{ｊ−１−Ｍｊ}モジュール６２Ｍは、線形重み付け加算モジュールｊ−１−Ｍｊ：６１Ｍ、線形重み付け加算モジュールｊ−２：６３０と接続されている。
線形重み付け加算モジュールｊ−２：６３０は、非線形関数σ_{ｊ−１−１}モジュール６２１、非線形関数σ_{ｊ−１−２}モジュール６２２、非線形関数σ_{ｊ−１−Ｍｊ}モジュール６２Ｍ、非線形関数σ_ｊ−２モジュール６４０と接続されている。
非線形関数σ_ｊ−２モジュール６４０は、線形重み付け加算モジュールｊ−２：６３０と接続されている。
アーク評価値算出モジュールｊは、各構成要素に添え字ｊが付与されていることを除いて、第２の実施の形態と動作は同等である。以下、動作を示す。線形重み付け加算器ｊ−１−ｉと非線形関数σ_{ｊ−１−ｉ}の組み合わせでは（ただし、ｉ＝１，２，…，Ｍｊ）、（１５）式による演算を行って、出力値Ｕ_ｊ−ｉを得る。ｗ_{ｊ−１−ｉ}及びｃ_{ｊ−１−ｉ}は、線形重み付け加算モジュールｊ−１−ｉが用いる重みである。Ｍｊは、１段目の線形重み付け加算モジュールの数である。

さらに、（１６）式に示すようにＵを定義する。

線形重み付け加算モジュールｊ−２と非線形関数σ_ｊ−２モジュールの組み合わせでは、（１７）式による演算を行って、出力値Ｖ_ｊを得る。ｗ_ｊ−２及びｃ_ｊ−２は、線形重み付け加算モジュールｊ−２が用いる重みである。

アーク評価値加算モジュール５２０では、アーク評価値算出モジュール１：５１１、アーク評価値算出モジュール２：５１２、・・・、アーク評価値算出モジュールＫ：５１Ｋによって計算されたアーク評価値の和を計算する。具体的には、例えば、（１８）式を用いて、アーク評価値Ｖを算出する。

このＶが、第３の実施の形態のアーク評価値決定モジュール１５０が文字切り出しモジュール１６０へ渡すアーク評価値である。

第３の実施の形態においては、重みｗ_{ｊ−１−ｉ}、ｃ_{ｊ−１−ｉ}、ｗ_ｊ−２及びｃ_ｊ−２を決定する必要がある。ただし、ｉ＝１，２，…，Ｍｊ、ｊ＝１，２，…，Ｋである。
前記の重み決定方法としては、文献「Ｊ．Ｆｒｉｅｄｍａｎ，Ｔ．Ｈａｓｔｉｅ，Ｒ．Ｔｉｂｓｈｉｒａｎｉ著 “ＡｄｄｉｔｉｖｅＬｏｇｉｓｔｉｃＲｅｇｒｅｓｓｉｏｎ：ａＳｔａｔｉｓｔｉｃａｌＶｉｅｗｏｆＢｏｏｓｔｉｎｇ”、ＡｎｎａｌｓｏｆＳｔａｔｉｓｔｉｃｓ、Ｖｏｌ．２８，Ｎｏ．２，ｐｐ．３３７−４０７，２０００」に記載のジェントルアダブースト方式と呼ばれる方式を用いるようにしてもよい。
以下、ここでは、説明の都合上、非線形関数σとして、例えば、入力がマイナス無限大で０、プラス無限大で１になる関数を用いることとする。実際にはマイナス無限大やプラス無限大で収束する値に応じて線形変換を行えば、入力がマイナス無限大で−１、プラス無限大で１になる関数などに変更してもよい。
次に、教師用データとして、図７の例に示す教師用データテーブル７００を用意する。教師用データテーブル７００は、データ番号欄７１０、特徴量１欄７２０、特徴量２欄７３０、特徴量Ｎ欄７７０、正解／非正解欄７８０、ウエイト欄７９０等を有している。これは、図３の例に示す教師用データテーブル３００にウエイト欄７９０を追加したものである。ここで、「ウエイト」と「重み」は、意味的には同じである。しかし、これまで、線形重み付け加算モジュールにおける係数に対して「重み」という用語を用いていたため、その用語と区別をするため、教師データの重みに関しては「ウエイト」という用語を用いることとする。また、データの量をＧとする。

さらに、以下に示す手法を用いて重みを決定していく。
ここで、データ番号ｋに対して、正解／非正解を表す記号をｙ_ｋとする。第３の実施の形態においては、例えば、
・正解のときｙ_ｋ＝＋１
・不正解のときｙ_ｋ＝−１
とする。
さらに、非線形関数σとして、ロジスティックシグモイド関数を採用する。このとき、Ｖ_ｊは０〜１までの値を取る。
１．まず、図７の例に示した教師用データテーブル７００内のデータのウエイトを全て等しく１／Ｇとする。
２．ｊ＝１とする。
（ア）各教師データのウエイトを用いて、その重み付け２乗誤差を最小とするように、アーク評価値算出モジュールｊの重みを決定する。決定方法は、第２の実施の形態の説明で記載したものと同等である。通常は単なる２乗誤差を最小化するように重みを決定するのに対して、ウエイトで重み付けした重み付け２乗誤差を最小とするように重みを決定する点が異なる。
つまり、第１の実施の形態又は第２の実施の形態では、（１９）式を最小とするように重みを決定していたのに対し、ここでは、（２０）式を最小とするように重みを決定する。ただし、ここで、ｔ_ｋ＝（ｙ_ｋ＋１）／２の関係がある。

（イ）教師データのウエイトを更新する。
（イ−１）ｋ番目のデータに対するアーク評価値をＶ_ｊｋとする。
（イ−２）ウエイトを（２１）式で更新する。これは、アーク評価値の推定が間違ったデータのウエイトを大きくして、合っていたデータのウエイトを小さくする操作を示している。

（ウ）もしｊが所定の値以上になっているか、あるいは、評価値推定精度が十分であれば終了する。
（エ）ｊを１増大させて、（ア）に戻る。

前記（ア）では、２乗誤差を最小としているが、第１の実施の形態の説明でも述べたように、（１０）式、（１１）式その他の評価値を最小としてもよい。その場合のウエイトのつけ方も同等であり、各ｋに対してａ_ｋを乗じればよい。具体的には（２２）式のようになる。この（２２）式を最小とするように重みを決定すればよい。

又は、（２３）式を最小とするように重みを決定すればよい。

前述では、非線形関数σとして、ロジスティックシグモイド関数を採用する。このとき、Ｖ_ｊは０〜１までの値を取るため、２Ｖ_ｊｋ−１の計算を行った。これは値域を−１〜＋１の範囲に変更するためである。この変更は単に線形変換を行っているにすぎない。他の非線形関数を用いる場合においても、単に値域を−１〜＋１の範囲にするように線形変換を行えばよい。

また、前述では、各アーク評価値算出モジュール（アーク評価値算出モジュール１：５１１、アーク評価値算出モジュール２：５１２、・・・、アーク評価値算出モジュールＫ：５１Ｋ）に入力する特徴量ベクトルを同じものとしていたが、その内容を異なるものにしてもよい。
すなわち、
・アーク評価値算出モジュール１の入力を、文字セグメント外接矩形の高さのみとする。
・アーク評価値算出モジュール２の入力を、全ての特徴量とする。
・アーク評価値算出モジュール３の入力を、文字セグメント外接矩形の幅のみとする。
・ …
等としてもよい。

また、前述では、各アーク評価値算出器の構成は第２の実施の形態のアーク評価値決定モジュール１５０の構成（図４の例参照）としていたが、第１の実施の形態のアーク評価値決定モジュール１５０の構成（図２の例参照）を混在させて含んでもよいし、全てが第１の実施の形態のアーク評価値決定モジュール１５０の構成であってもよい。すなわち、
・アーク評価値算出器１が第２の実施の形態のアーク評価値決定モジュール１５０の構成
・アーク評価値算出器２が第１の実施の形態のアーク評価値決定モジュール１５０の構成
・アーク評価値算出器３が第２の実施の形態のアーク評価値決定モジュール１５０の構成
・ …
としてもよいし、
・アーク評価値算出器１が第１の実施の形態のアーク評価値決定モジュール１５０の構成
・アーク評価値算出器２が第１の実施の形態のアーク評価値決定モジュール１５０の構成
・アーク評価値算出器３が第１の実施の形態のアーク評価値決定モジュール１５０の構成
・ …
としてもよいし、
・アーク評価値算出器１が第２の実施の形態のアーク評価値決定モジュール１５０の構成
・アーク評価値算出器２が第２の実施の形態のアーク評価値決定モジュール１５０の構成
・アーク評価値算出器３が第２の実施の形態のアーク評価値決定モジュール１５０の構成
・ …
としてもよい。

＜第４の実施の形態＞
前述の実施の形態では、アーク評価値決定モジュール１５０において、アーク評価値を推定していることになる。
推定するアーク評価値の教師データとしては、例えば、そのアークが文字の正解切り出し位置に相当している場合は１として、不正解切り出し位置に相当している場合は０としていた。
その場合、以下の２通りの最適化（重み決定）となっていることになる。
・クラス０とクラス１の２クラス分類問題として、クラス分類の誤りができるだけ小さくなるように重みを決定する。
・０〜１の間に存在する推定値と、教師データ（０又は１）との２乗誤差（絶対値誤差、クロスエントロピー等の誤差を示すような評価値であってもよい）を最小化するように重みを決定する。

しかし、アーク評価値が不正確であっても、文字切り出し位置が正確であればよい。逆に、アーク評価値が正確であったとしても、文字切り出し位置が不正確ではいけない。
アーク評価値と、文字切り出し位置の正確さは、複雑な関係になっており、単調な関係ではない。図８に、アーク候補決定モジュール８１０、アーク評価値決定モジュール８２０、文字切り出し位置決定モジュール８３０の関係例を示す。
アーク候補決定モジュール８１０は、アーク評価値決定モジュール８２０と接続されている。
アーク評価値決定モジュール８２０は、アーク候補決定モジュール８１０、文字切り出し位置決定モジュール８３０と接続されている。
文字切り出し位置決定モジュール８３０は、アーク評価値決定モジュール８２０と接続されている。
文字認識の処理において、まずアーク候補決定モジュール８１０において、画像を受け付け、前述したように複数のアーク候補が抽出される。さらに、アーク評価値決定モジュール８２０において、アークの評価値が決定され、文字切り出し位置決定モジュール８３０において、複数のアーク候補の集合としての複数のパスの中から、最適なパスを選択されることによって、文字切り出し位置が確定する。なお、図１の例に示したモジュール構成と比較すると、アーク候補決定モジュール８１０は画像受付モジュール１１０〜アーク特徴量抽出モジュール１４０に該当し、アーク評価値決定モジュール８２０はアーク評価値決定モジュール１５０に該当し、文字切り出し位置決定モジュール８３０は文字切り出しモジュール１６０に該当する。
第１の実施の形態〜第３の実施の形態では、アーク評価値決定モジュール１５０におけるアーク評価値決定を、アークの中だけを参照して行っていたが、第４の実施の形態では上図全体を考えて、アーク評価値決定モジュール８２０で用いられる重みを決定する例を示す。
以下、アーク評価値決定モジュール８２０の構成は、第１の実施の形態〜第３の実施の形態の説明で述べたもののいずれかであるとする。

第４の実施の形態は、第１の実施の形態〜第３の実施の形態の重みを決定する方法に関するものである。アーク評価値決定モジュール８２０の構成は第１の実施の形態〜第３の実施の形態の例で示したアーク評価値決定モジュール１５０である。
図９は、第４の実施の形態の構成例についての概念的なモジュール構成図である。
第４の実施の形態の画像処理装置は、図９の例に示すように、アーク候補決定モジュール９１０、重み変更モジュール９２０、アーク評価値決定モジュール９３０、文字切り出し位置決定モジュール９４０、切り出し位置正解個数算出モジュール９５０を有している。なお、アーク候補決定モジュール９１０は図８の例に示したアーク候補決定モジュール８１０に該当し、アーク評価値決定モジュール９３０は図８の例に示したアーク評価値決定モジュール８２０に該当し、文字切り出し位置決定モジュール９４０は図８の例に示した文字切り出し位置決定モジュール８３０に該当する。

アーク候補決定モジュール９１０は、アーク評価値決定モジュール９３０と接続されており、画像を受け付け、アーク候補を決定する。
重み変更モジュール９２０は、アーク評価値決定モジュール９３０、切り出し位置正解個数算出モジュール９５０と接続されており、切り出し位置正解個数算出モジュール９５０によって算出された切り出し位置の正解個数に基づいて、１文字分の文字切り出し位置におけるアーク評価値決定モジュール９３０で用いる重みを変更する。そして、現在の重みでの場合の正解個数から変更後の重みでの正解個数への変更量から次の重みを決定する。

アーク評価値決定モジュール９３０は、アーク候補決定モジュール９１０、重み変更モジュール９２０、文字切り出し位置決定モジュール９４０と接続されており、アーク候補決定モジュール９１０からのアーク候補を受け取り、重み変更モジュール９２０からの重みを用いて、アーク評価値を決定する。
文字切り出し位置決定モジュール９４０は、アーク評価値決定モジュール９３０、切り出し位置正解個数算出モジュール９５０と接続されており、アーク評価値決定モジュール９３０からのアーク評価値に基づいて、画像内に存在する文字画像を切り出す位置を決定し、その決定された切り出し位置を切り出し位置正解個数算出モジュール９５０へ渡す。
切り出し位置正解個数算出モジュール９５０は、重み変更モジュール９２０、文字切り出し位置決定モジュール９４０と接続されており、文字切り出し位置決定モジュール９４０から切り出し位置と文字画像を切り出す位置の教師データを受け付け、文字切り出し位置決定モジュール９４０からの切り出し位置と教師データを比較して、切り出し位置の正解個数を算出する。

次に処理の流れを説明する。
まず、アーク候補決定モジュール９１０は画像を受け付け、アーク候補を決定する。
アーク評価値決定モジュール９３０が用いる初期の重みは、乱数であってもよいし、第１の実施の形態〜第３の実施の形態の説明に記載した手法で定めた重みであってもよい。いずれにせよ、重み変更モジュール９２０では、初期の重みを保持する。
次に、アーク評価値決定モジュール９３０はアーク評価値を決定する。そして、文字切り出し位置決定モジュール９４０が、そのアーク評価値を用いて、文字切り出し位置を決定する。
決定後の文字切り出し位置は、切り出し位置正解個数算出モジュール９５０に渡される。それとは別に、文字切り出し教師データが切り出し位置正解個数算出モジュール９５０に入力される。
ここで、文字切り出し結果とは、例えば、画像中の文字の外接矩形の位置、サイズと、文字コードのペアからなっている。文字切り出し教師データも同様である。
切り出し位置正解個数算出モジュール９５０では、
・教師文字：文字切り出し教師データ内に存在する、複数の文字（外接矩形の位置、サイズと、文字コードを持っている）
と、
・推定文字：文字切り出し位置決定モジュール９４０で決定した文字
との比較を行う。
教師文字と推定文字の文字切り出し位置、サイズと文字コードが一致した個数を、切り出し位置正解個数算出モジュール９５０では算出する。ここで、文字切り出し位置、サイズの一致の判定に関しては、微小なずれを許容するようにしてもよい。なお、文字コードの一致を判定せずに、文字切り出し位置、サイズの一致だけを判定してもよい。

以上のように判定した正解個数が、重み変更モジュール９２０に渡される。
重み変更モジュール９２０では、正解個数と、重み変更モジュール９２０内で保持している過去の重みを用いて、次の重みを決定する。
ここで、アーク評価値決定モジュール９３０で用いる重み（すなわち全てのｗやｃ）を並べた重みベクトルをＷとする。Ｗの要素を（Ｗ_１，Ｗ_２，…）とする。
また、初期重みをＷ_０とする。次の重みをＷ_１とする。このように次々に重みを更新していく。正解個数が増加しなくなった時点や、正解個数の増加率が所定の値以下になった時点、又は、繰り返し回数が予め定められた回数となった時点で重み変更の処理を終了して、その時点の重みをアーク評価値決定モジュール９３０に出力する。

次に、重み変更モジュール９２０の処理の詳細を説明する。
まず、文字切り出し正解個数をＡとする。Ａは、Ｗの関数である。すなわち、Ａ（Ｗ）と記すことができる。Ａを最大化するようにＷを決定すればよい。さて、現在の重みをＷ_ｍとする。また、変更後の重みをＷ_ｍ＋１とする。
重みの更新式は、（２４）式となる。

ここでαは重み更新の速度を規定するパラメタである。∇は、（２５）式を示す演算子である。

∇Ａは、Ｗ_ｍを変更したときのＡの変化量を示す。この変化の方向にＷを動かせばＡを増大させることができる。

ただし、関数Ａ（Ｗ）の内容が不明であるため、∇Ａを解析的に計算することは不可能である。そこで、適当なεを定めて、（２６）式又は（２７）式として、数値演算的に∇Ａを計算する。

又は、重みの更新の別の方法として下記の方法を用いる。ランダム、網羅的、又は予め定められたアルゴリズムを用いて更新量ｄＷを設定して、（２８）式とする。

このＷ_ｍ＋１を用いて、（２９）式の関係を有しているならば、ＷをＷ_ｍ＋１に更新する。（２９）式の関係を有していなければ、更新せずに、次のｄＷを試す。

以上で、正解個数を最大化する。

前述の説明では、正解個数を最大化していたが、誤り個数を最小化してもよい。又は、誤り率（すなわち、誤り個数／正解個数、又は誤り個数／（誤り個数＋正解個数））を最小化してもよい。又は正解率（すなわち、正解個数／誤り個数、又は正解個数／（誤り個数＋正解個数））を最大化してもよい。つまり、正解個数又は誤り個数に基づいた値として、正解個数、誤り個数、正解率、誤り率がある。

図１０を参照して、第１〜第４の実施の形態の画像処理装置のハードウェア構成例について説明する。図１０に示す構成は、例えばパーソナルコンピュータ（ＰＣ）などによって構成されるものであり、スキャナ等のデータ読み取り部１０１７と、プリンタなどのデータ出力部１０１８を備えたハードウェア構成例を示している。

ＣＰＵ１００１は、前述の実施の形態において説明した各種のモジュール、すなわち、図１、図２、図４、図５、図６、図８、図９、図１７等の例に示した各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。

ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）１００２は、ＣＰＵ１００１が使用するプログラムや演算パラメータ等を格納する。ＲＡＭ１００３は、ＣＰＵ１００１の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはＣＰＵバスなどから構成されるホストバス１００４により相互に接続されている。

ホストバス１００４は、ブリッジ１００５を介して、ＰＣＩ（ＰｅｒｉｐｈｅｒａｌＣｏｍｐｏｎｅｎｔＩｎｔｅｒｃｏｎｎｅｃｔ／Ｉｎｔｅｒｆａｃｅ）バスなどの外部バス１００６に接続されている。

キーボード１００８、マウス等のポインティングデバイス１００９は、操作者により操作される入力デバイスである。ディスプレイ１０１０は、液晶表示装置又はＣＲＴ（ＣａｔｈｏｄｅＲａｙＴｕｂｅ）などがあり、各種情報をテキストやイメージ情報として表示する。

ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）１０１１は、ハードディスクを内蔵し、ハードディスクを駆動し、ＣＰＵ１００１によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、画像、文字画像、文字切り出し位置、文字切り出し位置の候補、教師用データテーブル３００、教師用データテーブル７００などが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。

ドライブ１０１２は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体１０１３に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース１００７、外部バス１００６、ブリッジ１００５、及びホストバス１００４を介して接続されているＲＡＭ１００３に供給する。リムーバブル記録媒体１０１３も、ハードディスクと同様のデータ記録領域として利用可能である。

接続ポート１０１４は、外部接続機器１０１５を接続するポートであり、ＵＳＢ、ＩＥＥＥ１３９４等の接続部を持つ。接続ポート１０１４は、インタフェース１００７、及び外部バス１００６、ブリッジ１００５、ホストバス１００４等を介してＣＰＵ１００１等に接続されている。通信部１０１６は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部１０１７は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部１０１８は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。

なお、図１０に示す画像処理装置のハードウェア構成は、１つの構成例を示すものであり、第１〜第４の実施の形態は、図１０に示す構成に限らず、第１〜第４の実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア（例えば特定用途向け集積回路（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ：ＡＳＩＣ）等）で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図１０に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機（スキャナ、プリンタ、複写機、ファックス等のいずれか２つ以上の機能を有している画像処理装置）などに組み込まれていてもよい。

なお、前述の各種の実施の形態を組み合わせてもよく（例えば、ある実施の形態内のモジュールを他の実施の形態内に適用する、入れ替えする等も含む）、各モジュールの処理内容として背景技術で説明した技術を採用してもよい。
なお、数式を用いて説明したが、数式には、その数式と同等のものが含まれる。同等のものとは、その数式そのものの他に、最終的な結果に影響を及ぼさない程度の数式の変形、又は数式をアルゴリズミックな解法で解くこと等が含まれる。

なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク（ＤＶＤ）であって、ＤＶＤフォーラムで策定された規格である「ＤＶＤ−Ｒ、ＤＶＤ−ＲＷ、ＤＶＤ−ＲＡＭ等」、ＤＶＤ＋ＲＷで策定された規格である「ＤＶＤ＋Ｒ、ＤＶＤ＋ＲＷ等」、コンパクトディスク（ＣＤ）であって、読出し専用メモリ（ＣＤ−ＲＯＭ）、ＣＤレコーダブル（ＣＤ−Ｒ）、ＣＤリライタブル（ＣＤ−ＲＷ）等、ブルーレイ・ディスク（Ｂｌｕ−ｒａｙＤｉｓｃ（登録商標））、光磁気ディスク（ＭＯ）、フレキシブルディスク（ＦＤ）、磁気テープ、ハードディスク、読出し専用メモリ（ＲＯＭ）、電気的消去及び書換可能な読出し専用メモリ（ＥＥＰＲＯＭ）、フラッシュ・メモリ、ランダム・アクセス・メモリ（ＲＡＭ）等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク（ＬＡＮ）、メトロポリタン・エリア・ネットワーク（ＭＡＮ）、ワイド・エリア・ネットワーク（ＷＡＮ）、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。

４１Ｍ…線形重み付け加算モジュール１−Ｍ
４２Ｍ…非線形関数σ_１−Ｍモジュール
５１Ｋ…アーク評価値算出モジュールＫ
６１Ｍ…線形重み付け加算モジュールｊ−１−Ｍｊ
６２Ｍ…非線形関数σ_{ｊ−１−Ｍｊ}モジュール
１１０…画像受付モジュール
１２０…文字列抽出モジュール
１３０…文字境界候補抽出モジュール
１４０…アーク特徴量抽出モジュール
１５０…アーク評価値決定モジュール
１６０…文字切り出しモジュール
１７０…文字認識モジュール
２１０…線形重み付け加算モジュール
２２０…非線形関数モジュール
４１１…線形重み付け加算モジュール１−１
４１２…線形重み付け加算モジュール１−２
４２１…非線形関数σ_１−１モジュール
４２２…非線形関数σ_１−２モジュール
４３０…線形重み付け加算モジュール２
４４０…非線形関数σ_２モジュール
５１１…アーク評価値算出モジュール１
５１２…アーク評価値算出モジュール２
５２０…アーク評価値加算モジュール
６１１…線形重み付け加算モジュールｊ−１−１
６１２…線形重み付け加算モジュールｊ−１−２
６２１…非線形関数σ_{ｊ−１−１}モジュール
６２２…非線形関数σ_{ｊ−１−２}モジュール
６３０…線形重み付け加算モジュールｊ−２
６４０…非線形関数σ_ｊ−２モジュール
８１０…アーク候補決定モジュール
８２０…アーク評価値決定モジュール
８３０…文字切り出し位置決定モジュール
９１０…アーク候補決定モジュール
９２０…重み変更モジュール
９３０…アーク評価値決定モジュール
９４０…文字切り出し位置決定モジュール
９５０…切り出し位置正解個数算出モジュール
１７１０…線形重み付け加算モジュール

Claims

画像内に存在する１つの文字画像を切り出す位置の候補に関する複数の特徴量に対して、重み付き線形和を計算する第１の計算手段と、
前記第１の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記１つの文字画像を切り出す位置の候補の評価値を計算する第２の計算手段と、
前記第２の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定する切出位置決定手段と、
文字画像の切り出し位置の教師データを受け付ける受付手段と、
前記切出位置決定手段によって決定された切り出し位置と前記受付手段によって受け付けられた教師データを比較して、切り出し位置の正解個数又は誤り個数を算出する個数算出手段と、
前記個数算出手段によって算出された切り出し位置の正解個数又は誤り個数に基づいて、１文字分の文字切り出し位置における前記第１の計算手段で用いる重みを変更する重み変更手段
を具備し、
前記重み変更手段は、現在の重みでの場合の正解個数又は誤り個数に基づいた値から変更後の重みでの正解個数又は誤り個数に基づいた値への変更量から次の重みを決定する
ことを特徴とする画像処理装置。
画像内に存在する１つの文字画像を切り出す位置の候補に関する複数の特徴量に対して、重み付き線形和を計算する第１の計算手段と、
前記第１の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記１つの文字画像を切り出す位置の候補の評価値を計算する第２の計算手段と、
前記第２の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定する切出位置決定手段と、
前記第１の計算手段と前記第２の計算手段による組を複数有し、
前記複数の第２の計算手段によって計算された評価値に対して、重み付き線形和を計算する第３の計算手段と、
前記第３の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記１つの文字画像を切り出す位置の候補の評価値を計算する第４の計算手段
を具備し、
前記切出位置決定手段は、前記第４の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定し、
文字画像の切り出し位置の教師データを受け付ける受付手段と、
前記切出位置決定手段によって決定された切り出し位置と前記受付手段によって受け付けられた教師データを比較して、切り出し位置の正解個数又は誤り個数を算出する個数算出手段と、
前記個数算出手段によって算出された切り出し位置の正解個数又は誤り個数に基づいて、１文字分の文字切り出し位置における前記第１の計算手段、又は前記第３の計算手段で用いる重みを変更する重み変更手段
を具備し、
前記重み変更手段は、現在の重みでの場合の正解個数又は誤り個数に基づいた値から変更後の重みでの正解個数又は誤り個数に基づいた値への変更量から次の重みを決定する
ことを特徴とする画像処理装置。
画像内に存在する１つの文字画像を切り出す位置の候補に関する複数の特徴量に対して、重み付き線形和を計算する第１の計算手段と、
前記第１の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記１つの文字画像を切り出す位置の候補の評価値を計算する第２の計算手段と、
前記第２の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定する切出位置決定手段と、
前記第１の計算手段と前記第２の計算手段による組を複数有し、
前記複数の第２の計算手段によって計算された評価値の和を計算する第５の計算手段
を具備し、
前記切出位置決定手段は、前記第５の計算手段によって計算された評価値の和に基づいて、前記画像内に存在する文字画像を切り出す位置を決定し、
文字画像の切り出し位置の教師データを受け付ける受付手段と、
前記切出位置決定手段によって決定された切り出し位置と前記受付手段によって受け付けられた教師データを比較して、切り出し位置の正解個数又は誤り個数を算出する個数算出手段と、
前記個数算出手段によって算出された切り出し位置の正解個数又は誤り個数に基づいて、１文字分の文字切り出し位置における前記第１の計算手段で用いる重みを変更する重み変更手段
を具備し、
前記重み変更手段は、現在の重みでの場合の正解個数又は誤り個数に基づいた値から変更後の重みでの正解個数又は誤り個数に基づいた値への変更量から次の重みを決定する
ことを特徴とする画像処理装置。
画像内に存在する１つの文字画像を切り出す位置の候補に関する複数の特徴量に対して、重み付き線形和を計算する第１の計算手段と、
前記第１の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記１つの文字画像を切り出す位置の候補の評価値を計算する第２の計算手段と、
前記第２の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定する切出位置決定手段と、
前記第１の計算手段と前記第２の計算手段による組を複数有し、
前記複数の第２の計算手段によって計算された評価値に対して、重み付き線形和を計算する第３の計算手段と、
前記第３の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記１つの文字画像を切り出す位置の候補の評価値を計算する第４の計算手段
を具備し、
前記切出位置決定手段は、前記第４の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定し、
前記第１の計算手段と前記第２の計算手段による複数の組と、前記第３の計算手段と前記第４の計算手段による組を複数有し、
前記複数の第４の計算手段によって計算された評価値の和を計算する第６の計算手段
を具備し、
前記切出位置決定手段は、前記第６の計算手段によって計算された評価値の和に基づいて、前記画像内に存在する文字画像を切り出す位置を決定し、
文字画像の切り出し位置の教師データを受け付ける受付手段と、
前記切出位置決定手段によって決定された切り出し位置と前記受付手段によって受け付けられた教師データを比較して、切り出し位置の正解個数又は誤り個数を算出する個数算出手段と、
前記個数算出手段によって算出された切り出し位置の正解個数又は誤り個数に基づいて、１文字分の文字切り出し位置における前記第１の計算手段、又は前記第３の計算手段で用いる重みを変更する重み変更手段
を具備し、
前記重み変更手段は、現在の重みでの場合の正解個数又は誤り個数に基づいた値から変更後の重みでの正解個数又は誤り個数に基づいた値への変更量から次の重みを決定する
ことを特徴とする画像処理装置。
コンピュータを、
画像内に存在する１つの文字画像を切り出す位置の候補に関する複数の特徴量に対して、重み付き線形和を計算する第１の計算手段と、
前記第１の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記１つの文字画像を切り出す位置の候補の評価値を計算する第２の計算手段と、
前記第２の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定する切出位置決定手段と、
文字画像の切り出し位置の教師データを受け付ける受付手段と、
前記切出位置決定手段によって決定された切り出し位置と前記受付手段によって受け付けられた教師データを比較して、切り出し位置の正解個数又は誤り個数を算出する個数算出手段と、
前記個数算出手段によって算出された切り出し位置の正解個数又は誤り個数に基づいて、１文字分の文字切り出し位置における前記第１の計算手段で用いる重みを変更する重み変更手段
として機能させ、
前記重み変更手段は、現在の重みでの場合の正解個数又は誤り個数に基づいた値から変更後の重みでの正解個数又は誤り個数に基づいた値への変更量から次の重みを決定する
ことを特徴とする画像処理プログラム。
コンピュータを、
画像内に存在する１つの文字画像を切り出す位置の候補に関する複数の特徴量に対して、重み付き線形和を計算する第１の計算手段と、
前記第１の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記１つの文字画像を切り出す位置の候補の評価値を計算する第２の計算手段と、
前記第２の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定する切出位置決定手段と、
前記第１の計算手段と前記第２の計算手段による組を複数有し、
前記複数の第２の計算手段によって計算された評価値に対して、重み付き線形和を計算する第３の計算手段と、
前記第３の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記１つの文字画像を切り出す位置の候補の評価値を計算する第４の計算手段
として機能させ、
前記切出位置決定手段は、前記第４の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定し、
文字画像の切り出し位置の教師データを受け付ける受付手段と、
前記切出位置決定手段によって決定された切り出し位置と前記受付手段によって受け付けられた教師データを比較して、切り出し位置の正解個数又は誤り個数を算出する個数算出手段と、
前記個数算出手段によって算出された切り出し位置の正解個数又は誤り個数に基づいて、１文字分の文字切り出し位置における前記第１の計算手段、又は前記第３の計算手段で用いる重みを変更する重み変更手段
として機能させ、
前記重み変更手段は、現在の重みでの場合の正解個数又は誤り個数に基づいた値から変更後の重みでの正解個数又は誤り個数に基づいた値への変更量から次の重みを決定する
ことを特徴とする画像処理プログラム。
コンピュータを、
画像内に存在する１つの文字画像を切り出す位置の候補に関する複数の特徴量に対して、重み付き線形和を計算する第１の計算手段と、
前記第１の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記１つの文字画像を切り出す位置の候補の評価値を計算する第２の計算手段と、
前記第２の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定する切出位置決定手段と、
前記第１の計算手段と前記第２の計算手段による組を複数有し、
前記複数の第２の計算手段によって計算された評価値の和を計算する第５の計算手段
として機能させ、
前記切出位置決定手段は、前記第５の計算手段によって計算された評価値の和に基づいて、前記画像内に存在する文字画像を切り出す位置を決定し、
文字画像の切り出し位置の教師データを受け付ける受付手段と、
前記切出位置決定手段によって決定された切り出し位置と前記受付手段によって受け付けられた教師データを比較して、切り出し位置の正解個数又は誤り個数を算出する個数算出手段と、
前記個数算出手段によって算出された切り出し位置の正解個数又は誤り個数に基づいて、１文字分の文字切り出し位置における前記第１の計算手段で用いる重みを変更する重み変更手段
として機能させ、
前記重み変更手段は、現在の重みでの場合の正解個数又は誤り個数に基づいた値から変更後の重みでの正解個数又は誤り個数に基づいた値への変更量から次の重みを決定する
ことを特徴とする画像処理プログラム。
コンピュータを、
画像内に存在する１つの文字画像を切り出す位置の候補に関する複数の特徴量に対して、重み付き線形和を計算する第１の計算手段と、
前記第１の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記１つの文字画像を切り出す位置の候補の評価値を計算する第２の計算手段と、
前記第２の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定する切出位置決定手段と、
前記第１の計算手段と前記第２の計算手段による組を複数有し、
前記複数の第２の計算手段によって計算された評価値に対して、重み付き線形和を計算する第３の計算手段と、
前記第３の計算手段による計算結果を引数として、該引数が極限の値の場合に予め定められた値に収束するようになる、又は該引数と予め定められた値との距離が大きくなると出力の傾きの絶対値が小さくなるようになる非線形単調関数又は該非線形単調関数に近似する関数によって、前記１つの文字画像を切り出す位置の候補の評価値を計算する第４の計算手段
として機能させ、
前記切出位置決定手段は、前記第４の計算手段によって計算された評価値に基づいて、前記画像内に存在する文字画像を切り出す位置を決定し、
前記第１の計算手段と前記第２の計算手段による複数の組と、前記第３の計算手段と前記第４の計算手段による組を複数有し、
前記複数の第４の計算手段によって計算された評価値の和を計算する第６の計算手段
として機能させ、
前記切出位置決定手段は、前記第６の計算手段によって計算された評価値の和に基づいて、前記画像内に存在する文字画像を切り出す位置を決定し、
文字画像の切り出し位置の教師データを受け付ける受付手段と、
前記切出位置決定手段によって決定された切り出し位置と前記受付手段によって受け付けられた教師データを比較して、切り出し位置の正解個数又は誤り個数を算出する個数算出手段と、
前記個数算出手段によって算出された切り出し位置の正解個数又は誤り個数に基づいて、１文字分の文字切り出し位置における前記第１の計算手段、又は前記第３の計算手段で用いる重みを変更する重み変更手段
として機能させ、
前記重み変更手段は、現在の重みでの場合の正解個数又は誤り個数に基づいた値から変更後の重みでの正解個数又は誤り個数に基づいた値への変更量から次の重みを決定する
ことを特徴とする画像処理プログラム。