JP4284907B2 - Image processing apparatus, image processing method, image processing program, and computer-readable recording medium recording the same - Google Patents
Image processing apparatus, image processing method, image processing program, and computer-readable recording medium recording the same Download PDFInfo
- Publication number
- JP4284907B2 JP4284907B2 JP2001389827A JP2001389827A JP4284907B2 JP 4284907 B2 JP4284907 B2 JP 4284907B2 JP 2001389827 A JP2001389827 A JP 2001389827A JP 2001389827 A JP2001389827 A JP 2001389827A JP 4284907 B2 JP4284907 B2 JP 4284907B2
- Authority
- JP
- Japan
- Prior art keywords
- document file
- image data
- character
- character string
- image processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000003672 processing method Methods 0.000 title claims description 22
- 238000000034 method Methods 0.000 claims description 51
- 238000006243 chemical reaction Methods 0.000 claims description 10
- 230000005540 biological transmission Effects 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 6
- 239000002699 waste material Substances 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、Webページの印刷物を読み取ってURLを文字認識し、そのWebサーバに接続してWebページの画像データを生成して出力する画像処理装置に関する。
【0002】
【従来の技術】
近年、パソコンの普及に伴いインターネットの利用者が増大し、Webページを印刷する機会が増えるとともに、未だ紙媒体による情報伝播が相当量行われていることから、Webページの印刷物をコピーする機会も多くなっている。ところが、Webページはカラー画像が主流であるため、Webページの印刷物をコピーすると画像の劣化が目立ち易い。そこで、Webページの印刷物をコピーする際に、原稿のフッタ等に記録されているURLを文字認識しそのURLが示すWebサーバに接続してHTMLファイルを取得し、Webページの画像データを生成してこれを印刷することにより、画像劣化がなく最新の画像によるWebページの印刷物を取得し得る画像処理装置が多数提案されている(特開平10−283313号公報等)。
【0003】
しかし、上述した従来の画像処理装置では、ユーザの所望する情報がWebページの一部のみに記載されておりWebページの一部のみを印刷して得られた原稿であったとしても、当該原稿に記載されたURLから当該WebページのHTMLファイルの全文書がダウンロードされ印刷されてしまい、原稿以外の部分、すなわち、ユーザの必要としない部分のWebページ印刷物が出力されるので、時間的にも経済的にも無駄であった。
【0004】
【発明が解決しようとする課題】
本発明は、上記従来技術の有する問題点に鑑みなされたものであり、その目的とするところは、Webページの印刷物を読み取ってURLを文字認識し、そのWebサーバに接続してWebページの画像データを生成して出力する画像処理装置において、Webページの一部のみを印刷して得られた原稿であっても当該原稿にかかる部分のみのWebページの画像データを出力することができる画像処理装置を提供することにある。
【0005】
【課題を解決するための手段】
本発明の上記目的は、以下の各手段により達成される。
【0006】
(a) ネットワーク上でサーバコンピュータにより公開された文書ファイルの一部を印刷して得られた原稿を読み取って第1の画像データを得る原稿読取手段と、
前記第1の画像データから前記文書ファイルの所在を表す所在情報を認識する所在情報認識手段と、
前記第1の画像データに含まれる文字領域で特定の位置を占める一または複数の文字列を認識する文字列認識手段と、
前記所在情報に基づいて前記サーバコンピュータに前記文書ファイルの転送要求を送信する文書ファイル転送要求送信手段と、
前記サーバコンピュータから前記文書ファイルを受信する文書ファイル受信手段と、
前記文書ファイルから前記文字列を検索する文字列検索手段と、
前記文書ファイルのうち検索した前記文字列を含み、前記文字領域で前記文字列が占める前記位置の情報に基づいて画定された所定範囲の文書ファイルデータを第2の画像データに変換する画像データ変換手段と、
前記第2の画像データを他の機器に送信する画像データ送信手段と、
を有することを特徴とする画像処理装置。
【0007】
(b) ネットワーク上でサーバコンピュータにより公開された文書ファイルの一部を印刷して得られた原稿を読み取って第1の画像データを得る原稿読取手段と、
前記第1の画像データから前記文書ファイルの所在を表す所在情報を認識する所在情報認識手段と、
前記第1の画像データに含まれる文字領域で特定の位置を占める一または複数の文字列を認識する文字列認識手段と、
前記所在情報に基づいて前記サーバコンピュータに前記文書ファイルの転送要求を送信する文書ファイル転送要求送信手段と、
前記サーバコンピュータから前記文書ファイルを受信する文書ファイル受信手段と、
前記文書ファイルから前記文字列を検索する文字列検索手段と、
前記文書ファイルのうち検索した前記文字列を含み、前記文字領域で前記文字列が占める前記位置の情報に基づいて画定された所定範囲の文書ファイルデータを第2の画像データに変換する画像データ変換手段と、
前記第2の画像データを画像形成する画像形成手段と、
を有することを特徴とする画像処理装置。
【0009】
(c) 前記文字列認識手段は、前記第1の画像データに含まれる文字領域の先頭位置を占める所定文字数の先頭文字列と、前記第1の画像データに含まれる文字領域の最後尾位置を占める所定文字数の最後尾文字列と、を認識するものであり、
前記文字列検索手段は、前記文書ファイルから前記先頭文字列および前記最後尾文字列を検索するものであり、
前記画像データ変換手段は、前記文書ファイルのうち検索した前記先頭文字列から前記最後尾文字列までの範囲が変換対象の文字範囲として画定された前記所定範囲の文書ファイルデータを第2の画像データに変換するものである、(a)または(b)に記載の画像処理装置。
【0010】
(d) 前記第1の画像データの前記文字領域に含まれる総文字数を計測する文字数計測手段をさらに有し、
前記文字列認識手段は、前記第1の画像データに含まれる前記文字領域の先頭位置を占める所定文字数の先頭文字列を認識するものであり、
前記文字列検索手段は、前記文書ファイルから前記先頭文字列を検索するものであり、
前記画像データ変換手段は、前記文書ファイルのうち検索した前記先頭文字列から前記総文字数の範囲が変換対象の文字範囲として画定された前記所定範囲の文書ファイルデータを第2の画像データに変換するものである、(a)または(b)に記載の画像処理装置。
(e) 前記文字列認識手段は、前記第1の画像データに含まれる文字領域全体を占める全部の文字列を認識するものであり、
前記文字列検索手段は、前記文書ファイルから前記全部の文字列を検索するものであり、
前記画像データ変換手段は、前記文書ファイルのうち検索した前記全部の文字列の範囲が変換対象の文字範囲として画定された前記所定範囲の文書ファイルデータを第2の画像データに変換するものである、(a)または(b)に記載の画像処理装置。
(f) 前記第1画像データにおいて、前記先頭文字列より前方に含まれる画像領域の領域数を計数する計数手段をさらに有し、
前記画像データ変換手段は、前記文書ファイルから検索された前記先頭文字列の前方に含まれる前記領域数分の画像領域を、前記画定された変換対象の文字範囲に加えた所定範囲の文書ファイルを第2の画像データに変換するものである、(c)〜(e)のいずれか1つに記載の画像処理装置。
【0011】
(g) 前記転送要求は、前記文書ファイルを所定容量に分割した分割文書ファイルを転送するよう要求するものであり、
前記文書ファイル転送要求送信手段は、前記文書ファイル受信手段が前記所定範囲を含む前記分割文書ファイルを受信するまで前記転送要求を順次送信することを特徴とする、請求項(a)〜(f)のいずれか1つに記載の画像処理装置。
【0012】
(h) 画像処理装置が、ネットワーク上でサーバコンピュータにより公開された文書ファイルの一部を印刷して得られた原稿を読み取って第1の画像データを得る段階(1)と、
画像処理装置が、前記第1の画像データから前記文書ファイルの所在を表す所在情報を認識する段階(2)と、
画像処理装置が、前記第1の画像データに含まれる文字領域で特定の位置を占める一または複数の文字列を認識する段階(3)と、
画像処理装置が、前記所在情報に基づいて前記サーバコンピュータに前記文書ファイルの転送要求を送信する段階(4)と、
画像処理装置が、前記サーバコンピュータから前記文書ファイルを受信する段階(5)と、
画像処理装置が、前記文書ファイルから前記文字列を検索する段階(6)と、
画像処理装置が、前記文書ファイルのうち検索した前記文字列を含み、前記文字領域で前記文字列が占める前記位置の情報に基づいて画定された所定範囲の文書ファイルデータを第2の画像データに変換する段階(7)と、
画像処理装置が、前記第2の画像データを他の機器に送信する段階(8)と、
を有することを特徴とする画像処理方法。
【0013】
(i) 画像処理装置が、ネットワーク上でサーバコンピュータにより公開された文書ファイルの一部を印刷して得られた原稿を読み取って第1の画像データを得る段階(1)と、
画像処理装置が、前記第1の画像データから前記文書ファイルの所在を表す所在情報を認識する段階(2)と、
画像処理装置が、前記第1の画像データに含まれる文字領域で特定の位置を占める一または複数の文字列を認識する段階(3)と、
画像処理装置が、前記所在情報に基づいて前記サーバコンピュータに前記文書ファイルの転送要求を送信する段階(4)と、
画像処理装置が、前記サーバコンピュータから前記文書ファイルを受信する段階(5)と、
画像処理装置が、前記文書ファイルから前記文字列を検索する段階(6)と、
画像処理装置が、前記文書ファイルのうち検索した前記文字列を含み、前記文字領域で前記文字列が占める前記位置の情報に基づいて画定された所定範囲の文書ファイルデータを第2の画像データに変換する段階(7)と、
画像処理装置が、前記第2の画像データを画像形成する段階(9)と、
を有することを特徴とする画像処理方法。
(j) 段階(3)は、前記第1の画像データに含まれる文字領域の先頭位置を占める所定文字数の先頭文字列と、前記第1の画像データに含まれる文字領域の最後尾位置を占める所定文字数の最後尾文字列と、を認識するものであり、
段階(6)は、前記文書ファイルから前記先頭文字列および前記最後尾文字列を検索するものであり、
段階(7)は、前記文書ファイルのうち検索した前記先頭文字列から前記最後尾文字列までの範囲が変換対象の文字範囲として画定された前記所定範囲の文書ファイルデータを第2の画像データに変換するものである、(h)または(i)に記載の画像処理方法。
(k) 画像処理装置が、前記第1の画像データの前記文字領域に含まれる総文字数を計測する段階(10)をさらに有し、
段階(3)は、前記第1の画像データに含まれる前記文字領域の先頭位置を占める所定文字数の先頭文字列を認識するものであり、
段階(6)は、前記文書ファイルから前記先頭文字列を検索するものであり、
段階(7)は、前記文書ファイルのうち検索した前記先頭文字列から前記総文字数の範囲が変換対象の文字範囲として画定された前記所定範囲の文書ファイルデータを第2の画像データに変換するものである、(h)または(i)に記載の画像処理方法。
(l) 段階(3)は、前記第1の画像データに含まれる文字領域全体を占める全部の文字列を認識するものであり、
段階(6)は、前記文書ファイルから前記全部の文字列を検索するものであり、
段階(7)は、前記文書ファイルのうち検索した前記全部の文字列の範囲が変換対象の文字範囲として画定された前記所定範囲の文書ファイルデータを第2の画像データに変換するものである、(h)または(i)に記載の画像処理方法。
(m) 画像処理装置が、前記第1画像データにおいて、前記先頭文字列より前方に含まれる画像領域の領域数を計数する段階(11)をさらに有し、
段階(7)は、前記文書ファイルから検索された前記先頭文字列の前方に含まれる前記領域数分の画像領域を、前記画定された変換対象の文字範囲に加えた所定範囲の文書ファイルを第2の画像データに変換するものである、(j)〜(l)のいずれか1つに記載の画像処理方法。
(n) 前記転送要求は、前記文書ファイルを所定容量に分割した分割文書ファイルを転送するよう要求するものであり、
段階(4)は、前記文書ファイル受信手段が前記所定範囲を含む前記分割文書ファイルを受信するまで前記転送要求を順次送信することを特徴とする、(h)〜(m)のいずれか1つに記載の画像処理方法。
【0014】
(o) ネットワーク上でサーバコンピュータにより公開された文書ファイルの一部を印刷して得られた原稿を読み取って第1の画像データを得る手順(1)と、
前記第1の画像データから前記文書ファイルの所在を表す所在情報を認識する手順(2)と、
前記第1の画像データに含まれる文字領域で特定の位置を占める一または複数の文字列を認識する手順(3)と、
前記所在情報に基づいて前記サーバコンピュータに前記文書ファイルの転送要求を送信する手順(4)と、
前記サーバコンピュータから前記文書ファイルを受信する手順(5)と、
前記文書ファイルから前記文字列を検索する手順(6)と、
前記文書ファイルのうち検索した前記文字列を含み、前記文字領域で前記文字列が占める前記位置の情報に基づいて画定された所定範囲の文書ファイルデータを第2の画像データに変換する手順(7)と、
前記第2の画像データを他の機器に送信する手順(8)と、
を画像処理装置に実行させることを特徴とする画像処理プログラム。
【0015】
(p) ネットワーク上でサーバコンピュータにより公開された文書ファイルの一部を印刷して得られた原稿を読み取って第1の画像データを得る手順(1)と、
前記第1の画像データから前記文書ファイルの所在を表す所在情報を認識する手順(2)と、
前記第1の画像データに含まれる文字領域で特定の位置を占める一または複数の文字列を認識する手順(3)と、
前記所在情報に基づいて前記サーバコンピュータに前記文書ファイルの転送要求を送信する手順(4)と、
前記サーバコンピュータから前記文書ファイルを受信する手順(5)と、
前記文書ファイルから前記文字列を検索する手順(6)と、
前記文書ファイルのうち検索した前記文字列を含み、前記文字領域で前記文字列が占める前記位置の情報に基づいて画定された所定範囲の文書ファイルデータを第2の画像データに変換する手順(7)と、
前記第2の画像データを画像形成する手順(9)と、
を画像処理装置に実行させることを特徴とする画像処理プログラム。
(q) 手順(3)は、前記第1の画像データに含まれる文字領域の先頭位置を占める所定文字数の先頭文字列と、前記第1の画像データに含まれる文字領域の最後尾位置を占める所定文字数の最後尾文字列と、を認識するものであり、
手順(6)は、前記文書ファイルから前記先頭文字列および前記最後尾文字列を検索するものであり、
手順(7)は、前記文書ファイルのうち検索した前記先頭文字列から前記最後尾文字列までの範囲が変換対象の文字範囲として画定された前記所定範囲の文書ファイルデータを第2の画像データに変換するものである、(o)または(p)に記載の画像処理プログラム。
(r) 前記第1の画像データの前記文字領域に含まれる総文字数を計測する手順(10)をさらに画像処理装置に実行させるものであり、
手順(3)は、前記第1の画像データに含まれる前記文字領域の先頭位置を占める所定文字数の先頭文字列を認識するものであり、
手順(6)は、前記文書ファイルから前記先頭文字列を検索するものであり、
手順(7)は、前記文書ファイルのうち検索した前記先頭文字列から前記総文字数の範囲が変換対象の文字範囲として画定された前記所定範囲の文書ファイルデータを第2の画像データに変換するものである、(o)または(p)に記載の画像処理プログラム。
(s) 手順(3)は、前記第1の画像データに含まれる文字領域全体を占める全部の文字列を認識するものであり、
手順(6)は、前記文書ファイルから前記全部の文字列を検索するものであり、
手順(7)は、前記文書ファイルのうち検索した前記全部の文字列の範囲が変換対象の文字範囲として画定された前記所定範囲の文書ファイルデータを第2の画像データに変換するものである、(o)または(p)に記載の画像処理プログラム。
(t) 前記第1画像データにおいて、前記先頭文字列より前方に含まれる画像領域の領域数を計数する手順(11)をさらに画像処理装置に実行させるものであり、
手順(7)は、前記文書ファイルから検索された前記先頭文字列の前方に含まれる前記領域数分の画像領域を、前記画定された変換対象の文字範囲に加えた所定範囲の文書ファイルを第2の画像データに変換するものである、(q)〜(s)のいずれか1つに記載の画像処理プログラム。
(u) 前記転送要求は、前記文書ファイルを所定容量に分割した分割文書ファイルを転送するよう要求するものであり、
手順(4)は、前記文書ファイル受信手段が前記所定範囲を含む前記分割文書ファイルを受信するまで前記転送要求を順次送信することを特徴とする、(o)〜(t)のいずれか1つに記載の画像処理プログラム。
【0016】
(v) (o)〜(u)のいずれか1つに記載の画像処理プログラムを記録したコンピュータ読取可能な記録媒体。
【0017】
【発明の実施の形態】
以下、本発明の実施の形態を、図面を参照して詳細に説明する。
【0018】
図1は、本発明の第1の実施形態にかかる画像処理装置を含む画像処理システムの全体構成を示すブロック図である。本画像処理システムは、画像処理装置としてのスキャナ11とWebサーバ20とが通信ネットワーク30を介して、またスキャナ11とプリンタ40とがローカルインタフェースを介して、相互に通信可能に接続されてなるものである。
【0019】
図2は、本実施形態にかかるスキャナ11の構成を示すブロック図である。図2において、スキャナ11は、CPU111、ROM112、RAM113、ハードディスク114、操作パネル部115、原稿読取部116、ローカルインタフェース117、およびネットワークインタフェース118を備えており、これらは信号をやり取りするためのバス119を介して相互に接続されている。
【0020】
CPU111は、プログラムにしたがって上記各部の制御や各種の演算処理等を行う。ROM112は、各種プログラムやパラメータを格納する。RAM113は、作業領域として一時的にプログラムやデータを記憶する。ハードディスク114は、各種プログラムやパラメータを格納し、または画像処理により得られた画像データ等を一時的に保存するために使用される。本実施形態において、スキャナ11は後述する所定の動作を行うが、このためのスキャナ11の動作を制御するプログラムは、ROM112またはハードディスク114に格納されている。
【0021】
操作パネル部115は、各種情報が表示される液晶タッチパネル、動作の開始を指示するスタートキー、動作の停止を指示するストップキー、各種設定条件を初期化するリセットキー等を備えている。
【0022】
原稿読取部116は、所定の読み取り位置にセットされた原稿に蛍光ランプ等の光源で光を当て、その反射光をCCDやCIS等の受光素子で光電変換して、その電気信号から画像データ(ビットマップデータ)を生成する。原稿読取部116は、自動原稿搬送装置(ADF)を備えていてもよく、これにより複数枚の原稿をADFにより一枚ずつ所定の読み取り位置まで搬送して順次読み取ることができる。
【0023】
ローカルインタフェース117は、プリンタやパソコン等の他の装置とネットワークを介さないで通信するためのインタフェースであり、USB、IEEE1394等のシリアルインタフェース、SCSI等のパラレルインタフェース、Bluetooth(ブルートゥース)、IEEE802.11、HomeRF、IrDA等の無線通信インタフェース等を使用することができる。
【0024】
ネットワークインタフェース118は、ネットワークに接続しネットワーク上の他の機器と通信するためのインタフェースであり、イーサネット(登録商標)、トークンリング、FDDI等の規格が用いられる。
【0025】
Webサーバ20は、WWWサーバ機能を有するコンピュータである。Webサーバ20は、WWWデータベースとしてネットワーク上でHTML形式による文書ファイルを公開し、クライアントからの要求に応じてHTMLファイルを転送する機能を有する。
【0026】
通信ネットワーク30は、電話網、ISDN、パケット交換網等の公衆網、およびLAN、WAN、インターネット等のコンピュータネットワークを含むものである。
【0027】
プリンタ40は、印刷イメージ(ビットマップデータ)の印刷出力を行う。
【0028】
図3は、本実施形態におけるスキャナ11の画像処理の手順を示すフローチャートである。図3において、スキャナ11は、まずユーザから原稿読み取り命令があるまで待機する(S101のNO)。ユーザは、Webページの一部を印刷した原稿を原稿台の所定の位置にセットし、操作パネル115から必要な読み取り条件を設定して、操作パネル115のスタートキーを押すことにより原稿読み取り命令を入力する。スキャナ11は、ユーザから原稿読み取り命令の入力を受け付けると(S101のYES)、セットされた原稿を読み取って画像データを取得し(S102)、得られた画像データをハードディスク114に保存する。
【0029】
ついで、原稿画像データの所定領域にあるURLを文字認識する(S103)。図4(a)は、本実施形態におけるWebページの一部を印刷した原稿の一例を示す図である。このように、Webページの一部を印刷して得られた原稿51には、文字列511からなる文字領域および図形または写真からなる画像領域512等で構成される本文以外に、たとえばヘッダやフッタ等の所定の領域に、WebページのURL513が表示されている。URLは「http://」で始まる文字列であり、かつURLの表示される領域は決まっているため、文字認識の対象をかかる領域に限定することによりURLを容易にかつ効率よく認識することができる。文字認識の方法としては、たとえば各文字画像の特微量と予め記憶されている辞書パターンとの一致の度合いに基づいて判別する方法等を用いることができる。
【0030】
URLの文字認識処理の手順(S103)においてURLが認識されなかった場合は(S104のNO)、ハードディスク114に保存した原稿画像データをRAM113に読み出し、読み出した画像データをローカルインタフェース117を介して外部機器であるプリンタ40に送信する(S105)。一方、URL認識処理でURLが認識された場合は(S104のYES)、ハードディスク114に保存した原稿画像データをRAM113に読み出し、当該原稿画像データの文字領域の先頭から所定文字数の先頭文字列を文字認識する(S106)。先頭文字列の文字認識の具体的手順としては、読み出した原稿画像データを領域分離して文字領域を抽出し、さらに最初の文字領域から行、文字を順次切り出して先頭から所定文字数の文字画像データを得て、前述と同様の文字認識方法により文字認識を行う。
【0031】
ついで、URLの文字認識処理の手順(S103)において認識されたURLで示されるWebページにかかるWebサーバ20に、ネットワークインタフェース118および通信ネットワーク30を介して、HTMLファイルの転送要求を送信する(S107)。つぎに、Webサーバ20からHTMLファイルを受信するまで待機し(S108のNO)、Webサーバ20から通信ネットワーク30およびネットワークインタフェース118を介してHTMLファイルを受信すると(S108のYES)、受信したHTMLファイルのタグ構造を解析して(S109)、さらにWebサーバ20に画像ファイル等のリンクファイルの転送要求を送信してリンクファイルを受信する。そして、受信したHTMLファイルから、先頭文字列の文字認識処理の手順(S106)で取得した先頭文字列を検索し(S110)、検出した先頭文字列から所定範囲のHTMLファイルデータを用いてWebページ画像データを生成する(S111)。Webページ画像データを生成するためのHTMLファイルデータの出力範囲を定める基準は特に限定されるものではなく、例えば、HTMLファイルデータに含まれる文字数や行数、生成する画像データの大きさ(ピクセル数)に応じたデータ量、HTMLファイルのデータ容量等を基準に当該出力範囲を定めることができる。これらの出力範囲は予め定められていてもよいし、ユーザにより原稿読み取り開始前に設定する構成としてもよい。そして、生成したWeb画像データをローカルインタフェース117を介してプリンタ40に送信する(S112)。
【0032】
図4(b)は、図4(a)の原稿にかかるWebページのWebサーバ20から受信したHTMLファイルから生成されるWebページ画像データの全体を示す図である。図4(b)において、Web画像データ61は、文字列611と画像領域612等から構成されている。また、原稿51の文字列511は、先頭に文字列「AAAAA」を含んでいる。本実施形態において、スキャナ11は、Webサーバ20から受信したHTMLファイルから、原稿52の画像データを文字認識処理して得られた先頭文字列「AAAAA」を検索し、当該文字列「AAAAA」から所定範囲、例えば所定行数分のHTMLファイルデータのみを用いてWebページ画像データ(点線で囲まれた出力範囲)を生成するので、原稿51と概ね同じ内容のWebページ画像データを出力することができ、原稿52に含まれない不要なWebページ画像データを出力することがないので時間および経費の無駄を無くすことができる。
【0033】
上記第1の実施形態においては、Webページ画像データの送信先をプリンタとして説明したが、画像データの出力先はプリンタに限られるものではなく、例えばデジタル複写機、ファクシミリ装置等の画像形成機能を有する多機能周辺機器、ディスプレイ等の画像表示装置、パソコン等の画像処理装置であってもよい。
【0034】
図5は、本発明の第2の実施形態にかかる画像処理装置を含む画像処理システムの全体構成を示すブロック図である。本画像処理システムは、画像処理装置としてのデジタル複写機12とWebサーバ20とが通信ネットワーク30を介して相互に通信可能に接続されてなる。
【0035】
図6は、本実施形態にかかるデジタル複写機12の構成を示すブロック図である。図6において、デジタル複写機12は、CPU121、ROM122、RAM123、ハードディスク124、操作パネル部125、原稿読取部126、ネットワークインタフェース128、およびバス129を有し、これら各部は第1の実施形態にかかるスキャナ11におけるものと同様の機能を有する。さらに、本実施形態において、デジタル複写機12は印刷部127を備えており、印刷部127は、画像処理後の画像データを設定条件に従って印刷する。
【0036】
図7は、本実施形態におけるデジタル複写機12の画像処理の手順を示すフローチャートである。本実施形態におけるデジタル複写機12の画像処理の手順が前記第1の実施形態におけるスキャナ11の画像処理の手順と異なるのは、まず、URL認識処理でURLが認識された場合に(S204のYES)、原稿画像データの文字領域の先頭文字列だけでなく最後尾文字列をも文字認識し(S206)、Webサーバ20からHTMLファイルを受信すると(S208およびS209)、受信したHTMLファイルから先頭文字列および最後尾文字列を検索して(S210)、検出した先頭文字列から最後尾文字列までの範囲のHTMLファイルデータを用いてWebページ画像データを生成する点(S211)、および生成したWeb画像データを設定条件等に応じて必要な画像処理を施して印刷部127により印刷して出力する点(S212)にある。
【0037】
図8(a)は、本実施形態におけるWebページの一部を印刷した原稿の他の一例を示す図であり、図8(b)は、当該WebページにかかるWebサーバ20から受信したHTMLファイルから生成されるWebページ画像データの全体を示す図である。原稿52は、文字列521および画像領域522等を含む本文と、WebページのURL523を含むフッタとから構成されており、文字列521は、先頭に文字列「AAAAA」を、最後尾に文字列「BBBBB」を含んでいる。また、Web画像データ62は、文字列621と画像領域622等から構成されている。本実施形態において、デジタル複写機12は、Webサーバ20から受信したHTMLファイルから、原稿52の画像データを文字認識処理して得られた先頭文字列「AAAAA」および最後尾文字列「BBBBB」を検索し、当該文字列「AAAAA」から文字列「BBBBB」までの範囲のHTMLファイルデータのみを用いてWebページ画像データ(点線で囲まれた出力範囲)を生成するので、原稿52に完全に一致するWebページ画像データを出力することができ、原稿52に含まれない不要なWebページ画像データを出力することがないので時間および経費の無駄を無くすことができる。
【0038】
図9は、本発明の第3の実施形態にかかるデジタル複写機13の画像処理の手順を示すフローチャートである。本実施形態にかかるデジタル複写機13は前記第2の実施形態にかかるデジタル複写機12と同様の構成を有し、デジタル複写機12と同様に通信ネットワーク30を介してWebサーバ20と相互に通信可能に接続されている。
【0039】
本実施形態におけるデジタル複写機13の画像処理の手順が前記第2の実施形態におけるデジタル複写機12の画像処理の手順と異なるのは、URL認識処理でURLが認識された場合に(S304のYES)、原稿画像データの文字領域の先頭文字列を文字認識するとともに(S306)、原稿画像データのすべての文字領域に含まれる総文字数をカウントし(S307)、Webサーバ20からHTMLファイルを受信すると(S308およびS309)、受信したHTMLファイルから先頭文字列を検索して(S311)、検出した先頭文字列から前記総文字数分の範囲のHTMLファイルデータを用いてWebページ画像データを生成する点(S312)にある。具体的には、原稿画像データの総文字数のカウント処理(S307)は、原稿画像データに含まれるすべての文字領域に対して文字認識処理を行って得られた文字コードを計測することにより行う。また、Webページ画像データの生成処理(S312)では、受信したHTMLファイルのHTML文書からHTMLタグを除いたテキスト部分について文字数をカウントし、検出した先頭文字列からカウントして前記総文字数分含まれる範囲のHTMLファイルデータを用いてWebページ画像データを生成するものである。これにより、デジタル複写機13は、前記第2の実施形態におけるデジタル複写機12と同様に、原稿に完全に一致するWebページ画像データを出力することができ、原稿に含まれない不要なWebページ画像データを出力することがないので時間および経費の無駄を無くすことができるものである。
【0040】
図10は、本発明の第4の実施形態にかかるスキャナ14の画像処理の手順を示すフローチャートである。本実施形態にかかるスキャナ14は前記第1の実施形態にかかるスキャナ11と同様の構成を有し、スキャナ11と同様に通信ネットワーク30を介してWebサーバ20と、およびローカルインタフェースを介してプリンタ40と、それぞれ相互に通信可能に接続されている。
【0041】
本実施形態におけるスキャナ14の画像処理の手順が前記第1の実施形態におけるスキャナ11の画像処理の手順と異なるのは、URL認識処理でURLが認識された場合に(S404のYES)、Webサーバ20に、認識したURLにかかるHTMLファイルを所定容量に分割したHTMLファイルデータを転送するよう転送要求を送信する点にある(S407)。そして、Webサーバ20から分割HTMLファイルデータを受信すると(S408)、受信した分割HTMLファイルデータから先頭文字列を検索して(S410)、先頭文字列から所定範囲のHTMLファイルデータを受信するまでWebサーバ20に分割HTMLファイルの転送要求を繰り返し(S411のNO)、先頭文字列から所定範囲のHTMLファイルデータを受信すると(S411のYES)、受信した先頭文字列から所定範囲のHTMLファイルデータを用いてWebページ画像データを生成するものである(S412)。所定容量に分割したHTMLファイルデータの転送要求は、HTTPプロトコルにおいて、byte−ranges−specifierのパラメータとして取得するHTMLファイルデータの容量を指定することにより行う。これにより、スキャナ14は、前記第1の実施形態にかかるスキャナ11と同様に、原稿と概ね同じ内容のWebページ画像データを出力することができ、原稿に含まれない不要なWebページ画像データを出力することがないので、画像データ出力にかかる時間および経費の無駄を無くすことができるばかりでなく、原稿より後部の不要なHTMLファイルデータをダウンロードすることがないので、Webサーバとの通信にかかる時間および経費の浪費をも防止することができるものである。
【0042】
なお、本実施形態にかかるスキャナ14のWebサーバ20への上記転送要求の方法は、前記第2および第3の実施形態にかかるデジタル複写機12および13にも適用することが可能である。この場合、前者においては、先頭文字列から最後尾文字列までの範囲のHTMLファイルデータを受信するまで、後者においては、先頭文字列からカウントして前記総文字数分含まれる範囲のHTMLファイルデータを受信するまで、Webサーバ20に分割HTMLファイルの転送要求を繰り返すものである。
【0043】
上記各実施形態では、先頭部分が文字領域である原稿について説明したが、先頭部分が文字領域でない原稿についても本発明の画像処理装置を用いることにより、原稿と概ね同じ内容のWebページ画像データを出力することができる。また、例えば、先頭部分が画像領域である原稿の場合、原稿画像データを領域分離してその位置情報から先頭文字列より前方に含まれる画像領域の数をカウントし、Webページ画像データを生成するためのHTMLファイルデータの出力範囲に前記カウントした画像領域にかかる画像ファイルのリンクのためのHTMLタグまでを含めることにより、原稿と完全に一致するWebページ画像データを出力することが可能である。図11(a)は、前記第2の実施形態におけるWebページの一部を印刷した原稿のさらに他の一例を示す図であり、図11(b)は、Webサーバ20から受信したHTMLファイルのHTML文書の一部を示す図である。原稿53は、文字列531および画像領域532等を含む本文と、WebページのURL533を含むフッタとから構成されており、文字列533は、先頭に文字列「AAAAA」を、最後尾に文字列「BBBBB」を含んでいる。また、HTML文書63は、本文文字列631とHTMLタグ文字列632から構成されるテキスト文書である。本実施形態の画像処理装置は、前記第2の実施形態と同様にして、HTML文書63の本文文字列631から、原稿53の画像ファイルを文字認識処理して得られた先頭文字列「AAAAA」および最後尾文字列「BBBBB」を検索する。さらに、原稿53の画像データを領域分離して先頭文字列「AAAAA」より前に含まれる画像領域532が1つ存在することを検知する。そして、HTML文書63の本文文字列631中の文字列「AAAAA」から文字列「BBBBB」までの範囲に加え、文字列「AAAAA」の直前にある画像ファイルリンクのためのHTMLタグである<IMG SRC=>や、リンク画像ファイルを示す”.jpg”や”.gif”等のファイル識別子を検出して、これを含めた範囲のHTMLファイルデータ(点線で囲まれた出力範囲)を用いてWebページ画像データを生成する。これにより、先頭部分が画像領域である原稿53に完全に一致するWebページ画像データを出力することができるものである。
【0044】
また、上記各実施形態では、原稿画像データの文字領域の先頭文字列を文字認識して受信したHTMLファイルデータから検索することにより、原稿部分のWebページ画像データのみを出力するものであったが、文字認識する文字列は原稿画像データの文字領域のいずれの部分であってもよく、当該文字列の位置情報と照合することによりHTMLファイルから原稿部分のWebページ画像データのみを出力することが可能である。さらに、原稿画像データの文字領域の全ての文字列を文字認識することによっても同じ目的が達成されることはいうまでもない。
【0045】
また、上記各実施形態では、Webサーバから受信したHTMLファイルの一部のみを用いてWebページ画像データを出力するものであったが、ユーザの選択により受信したHTMLファイルの全部を用いてWebページ画像データを出力することが可能な構成としても構わない。
【0046】
上記各実施形態においては、本発明の画像処理装置をスキャナおよびデジタル複写機の例で説明したが、本発明の画像処理装置はこれらに限られるものではなく、例えばファクシミリ装置等の原稿読取機能を有する多機能周辺機器であってもよい。
【0047】
また、上記各実施形態では、通信ネットワーク30上に接続されたファイルサーバとしてWebサーバの例で説明したが、当該ファイルサーバはこれに限られるものではない。また、公開される文書ファイルもHTMLファイルに限られるものではなく、例えばXML等のWebサイト言語であってもよい。
【0048】
本発明による画像処理装置を構成する各手段、および画像処理方法は、専用のハードウエア回路によっても、プログラムされた画像処理装置によっても実現することができる。プログラムされた画像処理装置によって本発明を実現する場合、画像処理装置を動作させるプログラムは、フレキシブルディスクやCD−ROM等のコンピュータ読取可能な記録媒体によって提供されることができる。この場合、コンピュータ読取可能な記録媒体に記録されたプログラムは、通常、ROMやハードディスク等に転送され記憶される。また、このプログラムは、たとえば、単独のアプリケーションソフトとして提供されてもよいし、また、画像処理装置の一機能としてその装置のソフトウエアに組み込んでもよい。
【0049】
上述した本発明の実施形態には、特許請求の範囲の請求項1〜11に記載した発明以外にも、以下の付記1〜5に示すような発明が含まれる。
【0050】
[付記1] 段階(3)は、前記第1の画像データの先頭から所定文字数の先頭文字列を認識するものであり、
段階(6)は、前記文書ファイルから前記先頭文字列を検索するものであり、
段階(7)は、前記文書ファイルのうち検索した前記文字列から始まる所定範囲の文書ファイルデータを第2の画像データに変換するものである、
請求項7または8に記載の画像処理方法。
【0051】
[付記2] 段階(3)は、さらに前記第1の画像データの最後尾から所定数の最後尾文字列を認識するものであり、
段階(6)は、さらに前記文書ファイルから前記最後尾文字列を検索するものであり、
段階(7)は、前記文書ファイルのうち検索した前記先頭文字列から前記最後尾文字列までの範囲の文書ファイルデータを第2の画像データに変換するものである、
付記1に記載の画像処理方法。
【0052】
[付記3] 前記第1の画像データに含まれる総文字数を計測する段階(10)をさらに有し、
段階(7)は、前記文書ファイルのうち検索した前記先頭文字列から前記総文字数を含む範囲の文書ファイルデータを第2の画像データに変換するものである、
付記1に記載の画像処理方法。
【0053】
[付記4] 前記転送要求は、前記文書ファイルを所定容量に分割した分割文書ファイルを転送するよう要求するものであり、
段階(4)は、前記文書ファイル受信手段が前記所定範囲を含む前記分割文書ファイルを受信するまで前記転送要求を順次送信することを特徴とする、
請求項7もしくは8、または付記1〜3のいずれか1つに記載の画像処理方法。
【0054】
[付記5] 手順(3)は、前記第1の画像データの先頭から所定文字数の先頭文字列を認識するものであり、
手順(6)は、前記文書ファイルから前記先頭文字列を検索するものであり、
手順(7)は、前記文書ファイルのうち検索した前記文字列から始まる所定範囲の文書ファイルデータを第2の画像データに変換するものである、
請求項9または10に記載の画像処理プログラム。
【0055】
[付記6] 手順(3)は、さらに前記第1の画像データの最後尾から所定数の最後尾文字列を認識するものであり、
手順(6)は、さらに前記文書ファイルから前記最後尾文字列を検索するものであり、
手順(7)は、前記文書ファイルのうち検索した前記先頭文字列から前記最後尾文字列までの範囲の文書ファイルデータを第2の画像データに変換するものである、
付記5に記載の画像処理プログラム。
【0056】
[付記7] 前記第1の画像データに含まれる総文字数を計測する手順(10)をさらに画像処理装置に実行させるものであり、
手順(7)は、前記文書ファイルのうち検索した前記先頭文字列から前記総文字数を含む範囲の文書ファイルデータを第2の画像データに変換するものである、
付記5に記載の画像処理プログラム。
【0057】
[付記8] 前記転送要求は、前記文書ファイルを所定容量に分割した分割文書ファイルを転送するよう要求するものであり、
手順(4)は、前記文書ファイル受信手段が前記所定範囲を含む前記分割文書ファイルを受信するまで前記転送要求を順次送信することを特徴とする、
請求項9もしくは10、または付記5〜7のいずれか1つに記載の画像処理プログラム。
【0058】
[付記9] 付記5〜8のいずれか1つに記載の画像処理プログラムを記録したコンピュータ読取可能な記録媒体。
【0059】
【発明の効果】
上述のとおり、本発明の画像処理装置によれば、Webページの印刷物を読み取ってURLを文字認識し、そのWebサーバに接続してWebページの画像データを生成して出力する画像処理装置において、Webページの一部のみを印刷して得られた原稿であっても当該原稿にかかる部分のみのWebページの画像データを出力することができる。したがって、原稿に含まれない部分、すなわち、ユーザの必要としない部分のWebページ画像データを出力することがないので、時間的にも経済的にも無駄を無くすことができる。
【図面の簡単な説明】
【図1】 本発明の第1の実施形態にかかるスキャナ11を含む画像処理システムの全体構成を示すブロック図である。
【図2】 スキャナ11の構成を示すブロック図である。
【図3】 スキャナ11の画像処理の手順を示すフローチャートである。
【図4】 Webページの一部を印刷した原稿の一例、および当該WebページにかかるWebサーバ20から受信したHTMLファイルから生成されるWebページの画像データの全体を示す図である。
【図5】 本発明の第2の実施形態にかかるデジタル複写機12を含む画像処理システムの全体構成を示すブロック図である。
【図6】 デジタル複写機12の構成を示すブロック図である。
【図7】 デジタル複写機12の画像処理の手順を示すフローチャートである。
【図8】 Webページの一部を印刷した原稿の他の一例、および、当該WebページにかかるWebサーバ20から受信したHTMLファイルから生成されるWebページ画像データの全体を示す図である。
【図9】 本発明の第3の実施形態にかかるデジタル複写機13の画像処理の手順を示すフローチャートである。
【図10】 本発明の第4の実施形態にかかるスキャナ14の画像処理の手順を示すフローチャートである。
【図11】 Webページの一部を印刷した原稿のさらに他の一例、および、当該WebページにかかるWebサーバ20から受信したHTMLファイルのHTML文書の一部を示す図である。
【符号の説明】
11…スキャナ、
12…デジタル複写機、
20…Webサーバ、
30…通信ネットワーク、
40…プリンタ、
51,52,53…原稿、
61,62…Web画像データ、
63…HTML文書、
111,121…CPU、
112,122…ROM、
113,123…RAM、
114,124…ハードディスク、
115,125…操作パネル部、
116,126…原稿読取部、
117…ローカルインタフェース、
118,128…ネットワークインタフェース、
119,129…バス、
127…印刷部
511,521,531,611,621,631…文字列、
512,522,532,612,622…画像領域、
513,523…WebページのURL、
632…HTMLタグ文字列。[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an image processing apparatus that reads a printed matter of a web page, character-recognizes a URL, connects to the web server, generates image data of the web page, and outputs the image data.
[0002]
[Prior art]
In recent years, with the spread of personal computers, the number of users of the Internet has increased, the chances of printing web pages have increased, and a considerable amount of information has been propagated on paper media, so there is also an opportunity to copy printed matter of web pages. It is increasing. However, since color images are the mainstream of web pages, image degradation is easily noticeable when printed web pages are copied. Therefore, when copying a printed matter on a Web page, the URL recorded in the footer of the document is recognized, connected to the Web server indicated by the URL, an HTML file is acquired, and Web page image data is generated. A large number of image processing apparatuses have been proposed that can obtain a printed matter of a Web page with the latest image without image degradation by printing this (Japanese Patent Laid-Open No. 10-283313, etc.).
[0003]
However, in the above-described conventional image processing apparatus, even if the information desired by the user is described only in a part of the Web page and the original is obtained by printing only a part of the Web page, the original Since the entire document of the HTML file of the Web page is downloaded and printed from the URL described in the above, a printed portion of the Web page other than the original, that is, a portion not required by the user is output. It was useless economically.
[0004]
[Problems to be solved by the invention]
The present invention has been made in view of the above-described problems of the prior art, and an object of the present invention is to read a printed matter of a web page, recognize a URL as a character, connect to the web server, and connect to the web page image. Image processing capable of outputting image data of a web page only for a portion of a document obtained by printing only a part of a web page in an image processing apparatus that generates and outputs data To provide an apparatus.
[0005]
[Means for Solving the Problems]
The above object of the present invention is achieved by the following means.
[0006]
(A) a document reading unit that reads a document obtained by printing a part of a document file published by a server computer on a network and obtains first image data;
Location information recognition means for recognizing location information representing the location of the document file from the first image data;
Included in the first image dataOne or more occupying a specific position in the character areaA character string recognition means for recognizing a character string;
A document file transfer request transmission means for transmitting a transfer request for the document file to the server computer based on the location information;
Document file receiving means for receiving the document file from the server computer;
A character string search means for searching for the character string from the document file;
Contains the searched character string in the document file.Defined based on the position information occupied by the character string in the character area.Image data conversion means for converting a predetermined range of document file data into second image data;
Image data transmitting means for transmitting the second image data to another device;
An image processing apparatus comprising:
[0007]
(B) Document reading means for reading a document obtained by printing a part of a document file published by a server computer on a network and obtaining first image data;
Location information recognition means for recognizing location information representing the location of the document file from the first image data;
Included in the first image dataOne or more occupying a specific position in the character areaA character string recognition means for recognizing a character string;
A document file transfer request transmission means for transmitting a transfer request for the document file to the server computer based on the location information;
Document file receiving means for receiving the document file from the server computer;
A character string search means for searching for the character string from the document file;
Contains the searched character string in the document file.Defined based on the position information occupied by the character string in the character area.Image data conversion means for converting a predetermined range of document file data into second image data;
Image forming means for forming an image of the second image data;
An image processing apparatus comprising:
[0009]
(cThe character string recognition meansA first character string having a predetermined number of characters that occupies the first position of the character area included in the first image data; and a last character string having a predetermined number of characters that occupies the last position of the character area included in the first image data; That recognizes
The character string search means is for searching the first character string and the last character string from the document file,
The image data converting means converts the document file data in the predetermined range in which a range from the searched first character string to the last character string in the document file is defined as a character range to be converted as second image data. The image processing apparatus according to (a) or (b), wherein
[0010]
(D) the first image dataThe character area ofFurther comprising a character number measuring means for measuring the total number of characters included in
The character string recognition means includes the first image data.Occupies the first position of the character area included inIt recognizes the first character string of a predetermined number of characters,
The character string search means is for searching the first character string from the document file,
The image data converting means determines that the range of the total number of characters from the first character string searched in the document file isAs the character range to be convertedDefinedThe predetermined rangeThe document file data is converted into second image data.(A) or (b)An image processing apparatus according to 1.
(E) The character string recognizing means recognizes all character strings occupying the entire character area included in the first image data.
The character string search means is for searching all the character strings from the document file,
The image data conversion means converts the document file data in the predetermined range in which the range of all the character strings searched in the document file is defined as a character range to be converted into second image data. The image processing apparatus according to (a) or (b).
(F) The first image data further includes a counting unit that counts the number of image areas included in front of the first character string,
The image data conversion means adds a document file in a predetermined range by adding the image regions for the number of regions included in front of the first character string searched from the document file to the character range to be converted. The image processing apparatus according to any one of (c) to (e), wherein the image processing apparatus converts the second image data.
[0011]
(gThe transfer request is a request to transfer a divided document file obtained by dividing the document file into a predetermined capacity.
The document file transfer request transmitting unit sequentially transmits the transfer request until the document file receiving unit receives the divided document file including the predetermined range.(A) to (f)The image processing apparatus according to any one of the above.
[0012]
(H)The image processing device(1) obtaining a first image data by reading a document obtained by printing a part of a document file published by a server computer on a network;
The image processing deviceRecognizing location information representing the location of the document file from the first image data (2);
The image processing deviceRecognizing one or a plurality of character strings occupying a specific position in a character region included in the first image data;
The image processing device(4) transmitting a transfer request for the document file to the server computer based on the location information;
The image processing deviceReceiving the document file from the server computer (5);
The image processing deviceRetrieving the character string from the document file (6);
The image processing deviceConverting the document file data in a predetermined range including the searched character string in the document file and defined based on the position information occupied by the character string in the character area into second image data (7) )When,
The image processing deviceTransmitting the second image data to another device (8);
An image processing method comprising:
[0013]
(I)The image processing device(1) obtaining a first image data by reading a document obtained by printing a part of a document file published by a server computer on a network;
The image processing deviceRecognizing location information representing the location of the document file from the first image data (2);
The image processing deviceRecognizing one or a plurality of character strings occupying a specific position in a character region included in the first image data;
The image processing device(4) transmitting a transfer request for the document file to the server computer based on the location information;
The image processing deviceReceiving the document file from the server computer (5);
The image processing deviceRetrieving the character string from the document file (6);
The image processing deviceConverting the document file data in a predetermined range including the searched character string in the document file and defined based on the position information occupied by the character string in the character area into second image data (7) )When,
The image processing device(9) forming an image of the second image data;
An image processing method comprising:
(J) Step (3) occupies the first character string of a predetermined number of characters occupying the beginning position of the character area included in the first image data and the last position of the character area included in the first image data. Recognizes the end character string of a predetermined number of characters,
Step (6) is for retrieving the first character string and the last character string from the document file,
In the step (7), the document file data in the predetermined range in which a range from the searched first character string to the last character string in the document file is defined as a character range to be converted is defined as second image data. The image processing method according to (h) or (i), which is to be converted.
(K)The image processing deviceMeasuring the total number of characters included in the character region of the first image data (10),
In step (3), a first character string having a predetermined number of characters occupying the first position of the character area included in the first image data is recognized.
Step (6) is for retrieving the first character string from the document file,
In step (7), the document file data in the predetermined range in which the range of the total number of characters is defined as the character range to be converted from the searched first character string in the document file is converted into second image data. The image processing method according to (h) or (i).
(L) In step (3), all character strings occupying the entire character area included in the first image data are recognized.
In step (6), all the character strings are searched from the document file.
In step (7), the document file data in the predetermined range in which the range of all the character strings searched in the document file is defined as the character range to be converted is converted into second image data. The image processing method according to (h) or (i).
(M)The image processing deviceIn the first image data, the method further includes a step (11) of counting the number of image areas included ahead of the first character string,
In the step (7), a document file in a predetermined range is obtained by adding the image regions for the number of regions included in front of the first character string searched from the document file to the character range to be converted. The image processing method according to any one of (j) to (l), wherein the image processing method converts the image data into two image data.
(N) The transfer request is a request to transfer a divided document file obtained by dividing the document file into a predetermined capacity,
In step (4), any one of (h) to (m) is characterized in that the transfer request is sequentially transmitted until the document file receiving unit receives the divided document file including the predetermined range. An image processing method described in 1.
[0014]
(O) a procedure (1) for obtaining a first image data by reading a document obtained by printing a part of a document file published by a server computer on a network;
Recognizing location information indicating the location of the document file from the first image data (2);
Included in the first image dataOne or more occupying a specific position in the character areaProcedure (3) for recognizing the character string,
A step (4) of transmitting a transfer request for the document file to the server computer based on the location information;
Receiving the document file from the server computer (5);
Searching for the character string from the document file (6);
Including the searched character string in the document file,Defined based on the position information occupied by the character string in the character regionA procedure (7) for converting document file data in a predetermined range into second image data;
A procedure (8) of transmitting the second image data to another device;
An image processing program for causing an image processing apparatus to execute.
[0015]
(P) a procedure (1) for obtaining a first image data by reading a document obtained by printing a part of a document file published by a server computer on a network;
Recognizing location information indicating the location of the document file from the first image data (2);
Included in the first image dataOne or more occupying a specific position in the character areaProcedure (3) for recognizing the character string,
A step (4) of transmitting a transfer request for the document file to the server computer based on the location information;
Receiving the document file from the server computer (5);
Searching for the character string from the document file (6);
Including the searched character string in the document file, Defined based on the position information occupied by the character string in the character regionA procedure (7) for converting document file data in a predetermined range into second image data;
A procedure (9) of forming the second image data;
An image processing program for causing an image processing apparatus to execute.
(Q) Step (3) occupies the first character string of a predetermined number of characters that occupies the head position of the character area included in the first image data and the tail position of the character area included in the first image data. Recognizes the end character string of a predetermined number of characters,
Step (6) is for retrieving the first character string and the last character string from the document file.
In the step (7), the document file data in the predetermined range in which the range from the searched first character string to the last character string in the document file is defined as the character range to be converted is used as second image data. The image processing program according to (o) or (p), which is to be converted.
(R) causing the image processing apparatus to further execute a procedure (10) of measuring the total number of characters included in the character region of the first image data;
In step (3), a first character string having a predetermined number of characters occupying the first position of the character area included in the first image data is recognized.
Step (6) is for retrieving the first character string from the document file.
The step (7) converts the document file data in the predetermined range in which the range of the total number of characters is defined as the character range to be converted from the searched first character string in the document file into second image data. The image processing program according to (o) or (p).
(S) The procedure (3) is for recognizing all character strings occupying the entire character area included in the first image data.
Step (6) is for retrieving all the character strings from the document file.
The step (7) converts the document file data in the predetermined range in which the range of all the searched character strings in the document file is defined as the character range to be converted into second image data. The image processing program according to (o) or (p).
(T) causing the image processing apparatus to further execute a procedure (11) for counting the number of image areas included in front of the first character string in the first image data;
In the step (7), a document file in a predetermined range is obtained by adding the image areas for the number of areas included in front of the first character string searched from the document file to the character range to be converted. The image processing program according to any one of (q) to (s), wherein the image processing program converts the image data into two image data.
(U) The transfer request is a request to transfer a divided document file obtained by dividing the document file into a predetermined capacity,
In the step (4), any one of (o) to (t) is characterized in that the transfer request is sequentially transmitted until the document file receiving unit receives the divided document file including the predetermined range. The image processing program described in 1.
[0016]
(V) any one of (o) to (u)A computer-readable recording medium on which the image processing program described in 1 is recorded.
[0017]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
[0018]
FIG. 1 is a block diagram showing the overall configuration of an image processing system including an image processing apparatus according to the first embodiment of the present invention. In this image processing system, a
[0019]
FIG. 2 is a block diagram showing the configuration of the
[0020]
The
[0021]
The
[0022]
The
[0023]
The
[0024]
The
[0025]
The
[0026]
The
[0027]
The
[0028]
FIG. 3 is a flowchart showing a procedure of image processing of the
[0029]
Next, the URL in the predetermined area of the document image data is recognized (S103). FIG. 4A is a diagram illustrating an example of a document on which a part of a Web page is printed in the present embodiment. As described above, the original 51 obtained by printing a part of the Web page includes, for example, a header and a footer in addition to a text area composed of a
[0030]
If the URL is not recognized in the URL character recognition processing procedure (S103) (NO in S104), the original image data stored in the
[0031]
Next, an HTML file transfer request is transmitted to the
[0032]
FIG. 4B is a diagram illustrating the entire Web page image data generated from the HTML file received from the
[0033]
In the first embodiment, the transmission destination of the Web page image data has been described as a printer. However, the output destination of the image data is not limited to the printer. For example, an image forming function such as a digital copying machine or a facsimile apparatus is provided. It may be a multifunction peripheral device, an image display device such as a display, or an image processing device such as a personal computer.
[0034]
FIG. 5 is a block diagram showing an overall configuration of an image processing system including an image processing apparatus according to the second embodiment of the present invention. In the present image processing system, a digital copying
[0035]
FIG. 6 is a block diagram showing the configuration of the digital copying
[0036]
FIG. 7 is a flowchart showing a procedure of image processing of the digital copying
[0037]
FIG. 8A is a diagram showing another example of a document on which a part of a Web page is printed in the present embodiment, and FIG. 8B is an HTML file received from the
[0038]
FIG. 9 is a flowchart showing a procedure of image processing of the digital copying machine 13 according to the third embodiment of the present invention. The digital copying machine 13 according to the present embodiment has the same configuration as that of the digital copying
[0039]
The image processing procedure of the digital copying machine 13 in this embodiment is different from the image processing procedure of the digital copying
[0040]
FIG. 10 is a flowchart showing the image processing procedure of the scanner 14 according to the fourth embodiment of the present invention. The scanner 14 according to the present embodiment has the same configuration as that of the
[0041]
The image processing procedure of the scanner 14 in this embodiment is different from the image processing procedure of the
[0042]
Note that the method for requesting transfer of the scanner 14 to the
[0043]
In each of the above-described embodiments, a document having a character area at the beginning has been described. However, Web page image data having almost the same content as that of the document can be obtained by using the image processing apparatus of the present invention even for a document having the character portion not beginning. Can be output. Also, for example, in the case of a document whose head part is an image area, the document image data is separated into regions, and the number of image regions included ahead of the head character string is counted from the position information to generate Web page image data. By including an HTML tag for linking an image file related to the counted image area in the output range of the HTML file data for this purpose, it is possible to output Web page image data that completely matches the document. FIG. 11A is a view showing still another example of a document on which a part of a Web page is printed in the second embodiment, and FIG. 11B is an HTML file received from the
[0044]
In each of the above embodiments, only the Web page image data of the document portion is output by retrieving the first character string of the character area of the document image data from the received HTML file data. The character string for character recognition may be any part of the character area of the document image data, and only the web page image data of the document part may be output from the HTML file by collating with the position information of the character string. Is possible. Furthermore, it goes without saying that the same object can be achieved by character recognition of all character strings in the character area of the document image data.
[0045]
In each of the above embodiments, the Web page image data is output using only a part of the HTML file received from the Web server. However, the Web page using the entire HTML file received by the user's selection. A configuration capable of outputting image data may be used.
[0046]
In each of the above-described embodiments, the image processing apparatus of the present invention has been described by using an example of a scanner and a digital copying machine. However, the image processing apparatus of the present invention is not limited to these, and for example, a document reading function such as a facsimile machine is provided. It may be a multifunction peripheral device.
[0047]
In each of the above embodiments, a web server has been described as an example of a file server connected on the
[0048]
Each means and image processing method constituting the image processing apparatus according to the present invention can be realized by a dedicated hardware circuit or by a programmed image processing apparatus. When the present invention is realized by a programmed image processing apparatus, a program for operating the image processing apparatus can be provided by a computer-readable recording medium such as a flexible disk or a CD-ROM. In this case, the program recorded on the computer-readable recording medium is usually transferred and stored in a ROM, a hard disk or the like. Further, this program may be provided as, for example, a single application software, or may be incorporated into the software of the apparatus as one function of the image processing apparatus.
[0049]
The embodiments of the present invention described above include the inventions as shown in the following
[0050]
[Supplementary Note 1] In step (3), a first character string having a predetermined number of characters is recognized from the top of the first image data.
Step (6) is for retrieving the first character string from the document file,
Step (7) converts document file data in a predetermined range starting from the searched character string in the document file into second image data.
The image processing method according to claim 7 or 8.
[0051]
[Supplementary Note 2] In step (3), a predetermined number of tail character strings are recognized from the tail of the first image data.
In step (6), the last character string is further searched from the document file.
Step (7) converts document file data in a range from the searched first character string to the last character string in the document file into second image data.
The image processing method according to
[0052]
[Supplementary Note 3] The method further includes a step (10) of measuring the total number of characters included in the first image data,
In step (7), document file data in a range including the total number of characters from the searched first character string in the document file is converted into second image data.
The image processing method according to
[0053]
[Supplementary Note 4] The transfer request is a request to transfer a divided document file obtained by dividing the document file into a predetermined capacity.
In the step (4), the transfer request is sequentially transmitted until the document file receiving unit receives the divided document file including the predetermined range.
The image processing method according to claim 7 or 8, or any one of
[0054]
[Supplementary Note 5] In the step (3), a first character string having a predetermined number of characters is recognized from the top of the first image data.
Step (6) is for retrieving the first character string from the document file.
Step (7) converts document file data in a predetermined range starting from the searched character string in the document file into second image data.
The image processing program according to claim 9 or 10.
[0055]
[Appendix 6] In the step (3), a predetermined number of tail character strings are recognized from the tail of the first image data.
The step (6) further searches for the last character string from the document file.
Step (7) converts document file data in the range from the first character string searched to the last character string in the document file into second image data.
The image processing program according to attachment 5.
[0056]
[Supplementary Note 7] The image processing apparatus is further caused to execute a procedure (10) of measuring the total number of characters included in the first image data.
Step (7) is to convert document file data in a range including the total number of characters from the searched first character string in the document file into second image data.
The image processing program according to attachment 5.
[0057]
[Supplementary Note 8] The transfer request is a request to transfer a divided document file obtained by dividing the document file into a predetermined capacity.
In the step (4), the transfer request is sequentially transmitted until the document file receiving unit receives the divided document file including the predetermined range.
The image processing program according to claim 9 or 10, or any one of appendices 5 to 7.
[0058]
[Supplementary Note 9] A computer-readable recording medium on which the image processing program according to any one of Supplementary Notes 5 to 8 is recorded.
[0059]
【The invention's effect】
As described above, according to the image processing apparatus of the present invention, in the image processing apparatus that reads the printed matter of the Web page, recognizes the URL, and generates and outputs the image data of the Web page by connecting to the Web server. Even for a document obtained by printing only a part of a Web page, it is possible to output image data of the Web page for only the part of the document. Accordingly, since the web page image data of a portion not included in the document, that is, a portion not required by the user is not output, waste in terms of time and cost can be eliminated.
[Brief description of the drawings]
FIG. 1 is a block diagram showing an overall configuration of an image processing system including a
FIG. 2 is a block diagram illustrating a configuration of a scanner.
FIG. 3 is a flowchart showing a procedure of image processing of the
FIG. 4 is a diagram illustrating an example of a document on which a part of a Web page is printed, and the entire image data of the Web page generated from an HTML file received from the
FIG. 5 is a block diagram showing an overall configuration of an image processing system including a digital copying
6 is a block diagram showing a configuration of the digital copying
FIG. 7 is a flowchart showing an image processing procedure of the digital copying
FIG. 8 is a diagram illustrating another example of a document on which a part of a Web page is printed, and the entire Web page image data generated from an HTML file received from the
FIG. 9 is a flowchart showing image processing procedures of the digital copying machine 13 according to the third embodiment of the present invention.
FIG. 10 is a flowchart showing image processing procedures of a scanner according to a fourth embodiment of the present invention.
FIG. 11 is a diagram showing still another example of a document on which a part of a Web page is printed, and a part of an HTML document of an HTML file received from the
[Explanation of symbols]
11 ... Scanner,
12 ... Digital copier,
20 ... Web server,
30 ... communication network,
40 ... Printer,
51, 52, 53 ... manuscript,
61, 62 ... Web image data,
63 ... HTML document,
111, 121 ... CPU,
112, 122 ... ROM,
113, 123 ... RAM,
114, 124 ... hard disk,
115, 125 ... operation panel section,
116, 126 ... document reading unit,
117: Local interface,
118, 128 ... network interface,
119,129 ... bus,
127 ... printing section
511, 521, 531, 611, 621, 631 ... character string,
512, 522, 532, 612, 622 ... image area,
513, 523 ... URL of the web page,
632 ... HTML tag character string.
Claims (22)
前記第1の画像データから前記文書ファイルの所在を表す所在情報を認識する所在情報認識手段と、
前記第1の画像データに含まれる文字領域で特定の位置を占める一または複数の文字列を認識する文字列認識手段と、
前記所在情報に基づいて前記サーバコンピュータに前記文書ファイルの転送要求を送信する文書ファイル転送要求送信手段と、
前記サーバコンピュータから前記文書ファイルを受信する文書ファイル受信手段と、
前記文書ファイルから前記文字列を検索する文字列検索手段と、
前記文書ファイルのうち検索した前記文字列を含み、前記文字領域で前記文字列が占める前記位置の情報に基づいて画定された所定範囲の文書ファイルデータを第2の画像データに変換する画像データ変換手段と、
前記第2の画像データを他の機器に送信する画像データ送信手段と、
を有することを特徴とする画像処理装置。Document reading means for reading a document obtained by printing a part of a document file published by a server computer on a network and obtaining first image data;
Location information recognition means for recognizing location information representing the location of the document file from the first image data;
Character string recognition means for recognizing one or more character strings occupying a specific position in a character region included in the first image data;
A document file transfer request transmission means for transmitting a transfer request for the document file to the server computer based on the location information;
Document file receiving means for receiving the document file from the server computer;
A character string search means for searching for the character string from the document file;
Image data to convert the string seen contains document file data of a predetermined range defined on the basis of the information of the position in the character region occupied by the character string search of the document file to the second image data Conversion means;
Image data transmitting means for transmitting the second image data to another device;
An image processing apparatus comprising:
前記第1の画像データから前記文書ファイルの所在を表す所在情報を認識する所在情報認識手段と、
前記第1の画像データに含まれる文字領域で特定の位置を占める一または複数の文字列を認識する文字列認識手段と、
前記所在情報に基づいて前記サーバコンピュータに前記文書ファイルの転送要求を送信する文書ファイル転送要求送信手段と、
前記サーバコンピュータから前記文書ファイルを受信する文書ファイル受信手段と、
前記文書ファイルから前記文字列を検索する文字列検索手段と、
前記文書ファイルのうち検索した前記文字列を含み、前記文字領域で前記文字列が占める前記位置の情報に基づいて画定された所定範囲の文書ファイルデータを第2の画像データに変換する画像データ変換手段と、
前記第2の画像データを画像形成する画像形成手段と、
を有することを特徴とする画像処理装置。Document reading means for reading a document obtained by printing a part of a document file published by a server computer on a network and obtaining first image data;
Location information recognition means for recognizing location information representing the location of the document file from the first image data;
Character string recognition means for recognizing one or more character strings occupying a specific position in a character region included in the first image data;
A document file transfer request transmission means for transmitting a transfer request for the document file to the server computer based on the location information;
Document file receiving means for receiving the document file from the server computer;
A character string search means for searching for the character string from the document file;
Image data to convert the string seen contains document file data of a predetermined range defined on the basis of the information of the position in the character region occupied by the character string search of the document file to the second image data Conversion means;
Image forming means for forming an image of the second image data;
An image processing apparatus comprising:
前記文字列検索手段は、前記文書ファイルから前記先頭文字列および前記最後尾文字列を検索するものであり、
前記画像データ変換手段は、前記文書ファイルのうち検索した前記先頭文字列から前記最後尾文字列までの範囲が変換対象の文字範囲として画定された前記所定範囲の文書ファイルデータを第2の画像データに変換するものである、請求項1または2に記載の画像処理装置。The character string recognition means includes a first character string having a predetermined number of characters occupying the first position of the character area included in the first image data , and a predetermined character occupying the last position of the character area included in the first image data. Recognizes the last string of numbers,
The character string search means is for searching the first character string and the last character string from the document file,
The image data converting means converts the document file data in the predetermined range in which a range from the searched first character string to the last character string in the document file is defined as a character range to be converted as second image data. The image processing apparatus according to claim 1 , wherein the image processing apparatus converts the image data into an image data.
前記文字列認識手段は、前記第1の画像データに含まれる前記文字領域の先頭位置を占める所定文字数の先頭文字列を認識するものであり、
前記文字列検索手段は、前記文書ファイルから前記先頭文字列を検索するものであり、
前記画像データ変換手段は、前記文書ファイルのうち検索した前記先頭文字列から前記総文字数の範囲が変換対象の文字範囲として画定された前記所定範囲の文書ファイルデータを第2の画像データに変換するものである、請求項1または2に記載の画像処理装置。A character number measuring means for measuring the total number of characters included in the character region of the first image data;
The character string recognizing means recognizes a first character string of a predetermined number of characters occupying the first position of the character area included in the first image data;
The character string search means is for searching the first character string from the document file,
The image data conversion means converts the document file data in the predetermined range in which the range of the total number of characters is defined as a character range to be converted from the searched first character string in the document file to second image data. The image processing apparatus according to claim 1 , wherein the image processing apparatus is an image processing apparatus.
前記文字列検索手段は、前記文書ファイルから前記全部の文字列を検索するものであり、 The character string search means is for searching all the character strings from the document file,
前記画像データ変換手段は、前記文書ファイルのうち検索した前記全部の文字列の範囲が変換対象の文字範囲として画定された前記所定範囲の文書ファイルデータを第2の画像データに変換するものである、請求項1または2に記載の画像処理装置。 The image data conversion means converts the document file data in the predetermined range in which the range of all the character strings searched in the document file is defined as a character range to be converted into second image data. The image processing apparatus according to claim 1 or 2.
前記画像データ変換手段は、前記文書ファイルから検索された前記先頭文字列の前方に含まれる前記領域数分の画像領域を、前記画定された変換対象の文字範囲に加えた所定範囲の文書ファイルを第2の画像データに変換するものである、請求項3〜5のいずれか1項に記載の画像処理装置。 The image data conversion means adds a document file in a predetermined range by adding the image regions for the number of regions included in front of the first character string searched from the document file to the character range to be converted. The image processing apparatus according to claim 3, wherein the image processing apparatus converts the second image data.
前記文書ファイル転送要求送信手段は、前記文書ファイル受信手段が前記所定範囲を含む前記分割文書ファイルを受信するまで前記転送要求を順次送信することを特徴とする、請求項1〜6のいずれか1項に記載の画像処理装置。The transfer request is a request to transfer a divided document file obtained by dividing the document file into a predetermined capacity,
The document file transfer request transmitting means, characterized in that the document file receiving means for the transmission transfer request sequentially until receiving the divided document file including the predetermined range, one of the claims 1-6 1 The image processing apparatus according to item.
画像処理装置が、前記第1の画像データから前記文書ファイルの所在を表す所在情報を認識する段階(2)と、
画像処理装置が、前記第1の画像データに含まれる文字領域で特定の位置を占める一または複数の文字列を認識する段階(3)と、
画像処理装置が、前記所在情報に基づいて前記サーバコンピュータに前記文書ファイルの転送要求を送信する段階(4)と、
画像処理装置が、前記サーバコンピュータから前記文書ファイルを受信する段階(5)と、
画像処理装置が、前記文書ファイルから前記文字列を検索する段階(6)と、
画像処理装置が、前記文書ファイルのうち検索した前記文字列を含み、前記文字領域で前記文字列が占める前記位置の情報に基づいて画定された所定範囲の文書ファイルデータを第2の画像データに変換する段階(7)と、
画像処理装置が、前記第2の画像データを他の機器に送信する段階(8)と、
を有することを特徴とする画像処理方法。 A step (1) in which an image processing apparatus reads a document obtained by printing a part of a document file published by a server computer on a network and obtains first image data;
A step (2) in which the image processing device recognizes location information indicating the location of the document file from the first image data;
A step (3) in which the image processing apparatus recognizes one or a plurality of character strings occupying a specific position in the character region included in the first image data;
A step (4) in which the image processing apparatus transmits a transfer request for the document file to the server computer based on the location information;
The image processing apparatus receiving the document file from the server computer (5);
A step (6) in which the image processing device retrieves the character string from the document file;
The image processing apparatus includes the searched character string in the document file, and the document file data in a predetermined range defined based on the position information occupied by the character string in the character area is set as second image data. Converting (7);
A step (8) in which the image processing apparatus transmits the second image data to another device;
An image processing method comprising:
画像処理装置が、前記第1の画像データから前記文書ファイルの所在を表す所在情報を認識する段階(2)と、
画像処理装置が、前記第1の画像データに含まれる文字領域で特定の位置を占める一または複数の文字列を認識する段階(3)と、
画像処理装置が、前記所在情報に基づいて前記サーバコンピュータに前記文書ファイルの転送要求を送信する段階(4)と、
画像処理装置が、前記サーバコンピュータから前記文書ファイルを受信する段階(5)と、
画像処理装置が、前記文書ファイルから前記文字列を検索する段階(6)と、
画像処理装置が、前記文書ファイルのうち検索した前記文字列を含み、前記文字領域で前記文字列が占める前記位置の情報に基づいて画定された所定範囲の文書ファイルデータを第2の画像データに変換する段階(7)と、
画像処理装置が、前記第2の画像データを画像形成する段階(9)と、
を有することを特徴とする画像処理方法。 A step (1) in which an image processing apparatus reads a document obtained by printing a part of a document file published by a server computer on a network and obtains first image data;
A step (2) in which the image processing device recognizes location information indicating the location of the document file from the first image data;
A step (3) in which the image processing apparatus recognizes one or a plurality of character strings occupying a specific position in the character region included in the first image data;
A step (4) in which the image processing apparatus transmits a transfer request for the document file to the server computer based on the location information;
The image processing apparatus receiving the document file from the server computer (5);
A step (6) in which the image processing device retrieves the character string from the document file;
The image processing apparatus includes the searched character string in the document file, and the document file data in a predetermined range defined based on the position information occupied by the character string in the character area is set as second image data. Converting (7);
A step (9) of forming an image of the second image data by the image processing apparatus ;
An image processing method comprising:
段階(6)は、前記文書ファイルから前記先頭文字列および前記最後尾文字列を検索するものであり、
段階(7)は、前記文書ファイルのうち検索した前記先頭文字列から前記最後尾文字列までの範囲が変換対象の文字範囲として画定された前記所定範囲の文書ファイルデータを第2の画像データに変換するものである、請求項8または9に記載の画像処理方法。Step (3) a predetermined number of characters occupying the first character string having a predetermined number, the last position of the character area included in the first image data which occupies the top position of a character region included in the first image data And the last character string of
Step (6) is for retrieving the first character string and the last character string from the document file,
In the step (7), the document file data in the predetermined range in which a range from the searched first character string to the last character string in the document file is defined as a character range to be converted is defined as second image data. The image processing method according to claim 8 or 9 , wherein conversion is performed.
段階(3)は、前記第1の画像データに含まれる前記文字領域の先頭位置を占める所定文字数の先頭文字列を認識するものであり、
段階(6)は、前記文書ファイルから前記先頭文字列を検索するものであり、
段階(7)は、前記文書ファイルのうち検索した前記先頭文字列から前記総文字数の範囲が変換対象の文字範囲として画定された前記所定範囲の文書ファイルデータを第2の画像データに変換するものである、請求項8または9に記載の画像処理方法。 The image processing apparatus further includes a step (10) of measuring the total number of characters included in the character area of the first image data,
In step (3), a first character string having a predetermined number of characters occupying the first position of the character area included in the first image data is recognized.
Step (6) is for retrieving the first character string from the document file,
In step (7), the document file data in the predetermined range in which the range of the total number of characters is defined as the character range to be converted from the searched first character string in the document file is converted into second image data. The image processing method according to claim 8 or 9, wherein:
段階(6)は、前記文書ファイルから前記全部の文字列を検索するものであり、
段階(7)は、前記文書ファイルのうち検索した前記全部の文字列の範囲が変換対象の文字範囲として画定された前記所定範囲の文書ファイルデータを第2の画像データに変換するものである、請求項8または9に記載の画像処理方法。 Step (3) recognizes all character strings occupying the entire character area included in the first image data.
In step (6), all the character strings are searched from the document file.
In step (7), the document file data in the predetermined range in which the range of all the character strings searched in the document file is defined as the character range to be converted is converted into second image data. The image processing method according to claim 8 or 9.
段階(7)は、前記文書ファイルから検索された前記先頭文字列の前方に含まれる前記領域数分の画像領域を、前記画定された変換対象の文字範囲に加えた所定範囲の文書ファイルを第2の画像データに変換するものである、請求項10〜12のいずれか1項に記載の画像処理方法。 The image processing apparatus further includes a step (11) of counting the number of image areas included in front of the first character string in the first image data,
In the step (7), a document file in a predetermined range is obtained by adding the image regions for the number of regions included in front of the first character string searched from the document file to the character range to be converted. The image processing method according to claim 10, wherein the image processing method is to convert the image data into two image data.
段階(4)は、前記文書ファイル受信手段が前記所定範囲を含む前記分割文書ファイルを受信するまで前記転送要求を順次送信することを特徴とする、請求項8〜13のいずれか1項に記載の画像処理方法。The transfer request is a request to transfer a divided document file obtained by dividing the document file into a predetermined capacity,
Step (4) is characterized in that the document file receiving means sequentially transmits the transfer request until receiving the divided document file including the predetermined range, according to any one of claims 8 to 13 Image processing method.
前記第1の画像データから前記文書ファイルの所在を表す所在情報を認識する手順(2)と、
前記第1の画像データに含まれる文字領域で特定の位置を占める一または複数の文字列を認識する手順(3)と、
前記所在情報に基づいて前記サーバコンピュータに前記文書ファイルの転送要求を送信する手順(4)と、
前記サーバコンピュータから前記文書ファイルを受信する手順(5)と、
前記文書ファイルから前記文字列を検索する手順(6)と、
前記文書ファイルのうち検索した前記文字列を含み、前記文字領域で前記文字列が占める前記位置の情報に基づいて画定された所定範囲の文書ファイルデータを第2の画像データに変換する手順(7)と、
前記第2の画像データを他の機器に送信する手順(8)と、
を画像処理装置に実行させることを特徴とする画像処理プログラム。A procedure (1) of obtaining a first image data by reading a document obtained by printing a part of a document file published by a server computer on a network;
Recognizing location information indicating the location of the document file from the first image data (2);
A procedure (3) for recognizing one or more character strings occupying a specific position in a character region included in the first image data;
A step (4) of transmitting a transfer request for the document file to the server computer based on the location information;
Receiving the document file from the server computer (5);
Searching for the character string from the document file (6);
A procedure (7) for converting document file data in a predetermined range including the searched character string in the document file and defined based on the position information occupied by the character string in the character area into second image data. )When,
A procedure (8) of transmitting the second image data to another device;
An image processing program for causing an image processing apparatus to execute.
前記第1の画像データから前記文書ファイルの所在を表す所在情報を認識する手順(2)と、
前記第1の画像データに含まれる文字領域で特定の位置を占める一または複数の文字列を認識する手順(3)と、
前記所在情報に基づいて前記サーバコンピュータに前記文書ファイルの転送要求を送信する手順(4)と、
前記サーバコンピュータから前記文書ファイルを受信する手順(5)と、
前記文書ファイルから前記文字列を検索する手順(6)と、
前記文書ファイルのうち検索した前記文字列を含み、前記文字領域で前記文字列が占める前記位置の情報に基づいて画定された所定範囲の文書ファイルデータを第2の画像データに変換する手順(7)と、
前記第2の画像データを画像形成する手順(9)と、
を画像処理装置に実行させることを特徴とする画像処理プログラム。A procedure (1) of obtaining a first image data by reading a document obtained by printing a part of a document file published by a server computer on a network;
Recognizing location information indicating the location of the document file from the first image data (2);
A procedure (3) for recognizing one or more character strings occupying a specific position in a character region included in the first image data;
A step (4) of transmitting a transfer request for the document file to the server computer based on the location information;
Receiving the document file from the server computer (5);
Searching for the character string from the document file (6);
A procedure (7) for converting document file data in a predetermined range including the searched character string in the document file and defined based on the position information occupied by the character string in the character area into second image data. )When,
A procedure (9) of forming the second image data;
An image processing program for causing an image processing apparatus to execute.
手順(6)は、前記文書ファイルから前記先頭文字列および前記最後尾文字列を検索するものであり、
手順(7)は、前記文書ファイルのうち検索した前記先頭文字列から前記最後尾文字列までの範囲が変換対象の文字範囲として画定された前記所定範囲の文書ファイルデータを第2の画像データに変換するものである、請求項15または16に記載の画像処理プログラム。Step (3) a predetermined number of characters occupying the first character string having a predetermined number, the last position of the character area included in the first image data which occupies the top position of a character region included in the first image data And the last character string of
Step (6) is for retrieving the first character string and the last character string from the document file.
In the step (7), the document file data in the predetermined range in which the range from the searched first character string to the last character string in the document file is defined as the character range to be converted is used as second image data. The image processing program according to claim 15 or 16 , which is to be converted.
手順(3)は、前記第1の画像データに含まれる前記文字領域の先頭位置を占める所定文字数の先頭文字列を認識するものであり、
手順(6)は、前記文書ファイルから前記先頭文字列を検索するものであり、
手順(7)は、前記文書ファイルのうち検索した前記先頭文字列から前記総文字数の範囲が変換対象の文字範囲として画定された前記所定範囲の文書ファイルデータを第2の画像データに変換するものである、請求項15または16に記載の画像処理プログラム。A step (10) of measuring the total number of characters included in the character region of the first image data is further executed by the image processing apparatus;
In step (3), a first character string having a predetermined number of characters occupying the first position of the character area included in the first image data is recognized.
Step (6) is for retrieving the first character string from the document file.
The step (7) converts the document file data in the predetermined range in which the range of the total number of characters is defined as the character range to be converted from the searched first character string in the document file into second image data. The image processing program according to claim 15 or 16 .
手順(6)は、前記文書ファイルから前記全部の文字列を検索するものであり、
手順(7)は、前記文書ファイルのうち検索した前記全部の文字列の範囲が変換対象の文字範囲として画定された前記所定範囲の文書ファイルデータを第2の画像データに変換するものである、請求項15または16に記載の画像処理プログラム。 The step (3) is for recognizing all the character strings that occupy the entire character area included in the first image data.
Step (6) is for retrieving all the character strings from the document file.
The step (7) converts the document file data in the predetermined range in which the range of all the searched character strings in the document file is defined as the character range to be converted into second image data. The image processing program according to claim 15 or 16.
手順(7)は、前記文書ファイルから検索された前記先頭文字列の前方に含まれる前記領域数分の画像領域を、前記画定された変換対象の文字範囲に加えた所定範囲の文書ファイルを第2の画像データに変換するものである、請求項17〜19のいずれか1項に記載の画像処理プログラム。In the step (7), a document file in a predetermined range is obtained by adding the image areas for the number of areas included in front of the first character string searched from the document file to the character range to be converted. The image processing program according to any one of claims 17 to 19, wherein the image processing program converts the image data into two image data.
手順(4)は、前記文書ファイル受信手段が前記所定範囲を含む前記分割文書ファイルを受信するまで前記転送要求を順次送信することを特徴とする、請求項15〜20のいずれか1項に記載の画像処理プログラム。The transfer request is a request to transfer a divided document file obtained by dividing the document file into a predetermined capacity,
21. The procedure (4) according to claim 15 , wherein the transfer request is sequentially transmitted until the document file receiving unit receives the divided document file including the predetermined range. Image processing program.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2001389827A JP4284907B2 (en) | 2001-07-25 | 2001-12-21 | Image processing apparatus, image processing method, image processing program, and computer-readable recording medium recording the same |
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2001225155 | 2001-07-25 | ||
| JP2001-225155 | 2001-07-25 | ||
| JP2001389827A JP4284907B2 (en) | 2001-07-25 | 2001-12-21 | Image processing apparatus, image processing method, image processing program, and computer-readable recording medium recording the same |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JP2003108453A JP2003108453A (en) | 2003-04-11 |
| JP2003108453A5 JP2003108453A5 (en) | 2005-06-23 |
| JP4284907B2 true JP4284907B2 (en) | 2009-06-24 |
Family
ID=26619276
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2001389827A Expired - Fee Related JP4284907B2 (en) | 2001-07-25 | 2001-12-21 | Image processing apparatus, image processing method, image processing program, and computer-readable recording medium recording the same |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4284907B2 (en) |
Families Citing this family (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20060009677A (en) | 2004-07-26 | 2006-02-01 | 삼성전자주식회사 | How to provide uniform resource locator and network scanner |
| JP4966533B2 (en) * | 2005-09-30 | 2012-07-04 | セイコーエプソン株式会社 | Printing system, printing method, printing program, and recording medium |
| JP4918904B2 (en) | 2007-10-01 | 2012-04-18 | ブラザー工業株式会社 | Print data generation apparatus and computer program |
| JP5206859B2 (en) * | 2011-12-13 | 2013-06-12 | ブラザー工業株式会社 | Print data generation apparatus and computer program |
-
2001
- 2001-12-21 JP JP2001389827A patent/JP4284907B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2003108453A (en) | 2003-04-11 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7339695B2 (en) | Data processing device, data processing method, and data processing program for recognizing characters in a URL | |
| JP4311738B2 (en) | Image forming apparatus, control method therefor, and computer program | |
| US7414743B2 (en) | Print control apparatus, method and program using a tag of a document list for printing a plurality of documents in various formats | |
| US6515765B1 (en) | Image data management system and method thereof | |
| US7296059B2 (en) | Device, method, and program for transmitting reduced quality images linked to original quality images | |
| US8203724B2 (en) | Image forming apparatus and control method therefor, as well as program for implementing the control method | |
| JP6344325B2 (en) | SEARCH SYSTEM, SEARCH METHOD, AND COMPUTER PROGRAM | |
| JP4720884B2 (en) | Image processing apparatus, image forming apparatus, index generation method, and index generation program | |
| US20070242282A1 (en) | Image forming apparatus for detecting index data of document data, and control method and program product for the same | |
| JP4284907B2 (en) | Image processing apparatus, image processing method, image processing program, and computer-readable recording medium recording the same | |
| JP2006093917A (en) | Image reading apparatus and image processor, and image forming apparatus | |
| JP2004013210A (en) | Data processor | |
| JP3864883B2 (en) | Communication terminal and terminal control program | |
| JP4766089B2 (en) | Image processing program, image processing apparatus, and image processing system | |
| JP4168605B2 (en) | Image processing apparatus, image processing method, image processing program, and computer-readable recording medium recording the same | |
| US20060290993A1 (en) | Image reading apparatus and image processing method therefor, image formation apparatus, image processing system and image processing method therefor | |
| JP4722317B2 (en) | Image processing apparatus, image processing method, image processing program, and computer-readable recording medium recording the same | |
| JP2008242642A (en) | Image forming apparatus | |
| JP4505106B2 (en) | Accumulation printing method and image forming apparatus | |
| JP4646277B2 (en) | Printing system, information processing apparatus, and program | |
| JP4765593B2 (en) | Image forming apparatus, image forming processing program, and image forming processing method | |
| JP2010109653A (en) | Image reader, image forming apparatus, image reading method, and image reading program | |
| JP4089191B2 (en) | Image processing apparatus, image processing method, image processing program, and computer-readable recording medium recording the same | |
| JP2023141170A (en) | Image processing device, control method thereof, program and image processing system | |
| JP2006059130A (en) | Image forming system, image forming apparatus, document processing method, computer-readable storage medium storing program, and program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20040423 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041006 Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20041006 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041006 |
|
| RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20041006 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080122 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080324 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081224 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090130 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090303 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090316 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120403 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130403 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140403 Year of fee payment: 5 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| LAPS | Cancellation because of no payment of annual fees |